Spark:falla la lectura de una gran tabla MySQL en DataFrame

Spark JDBC API parece bifurcarse para cargar todos los datos de la tabla MySQL a la memoria sin ella. Entonces, cuando intente cargar una tabla grande, lo que debe hacer es usar primero los datos clonados de Spark API para HDFS (JSON debe usarse para mantener la estructura del esquema), así:

spark.read.jdbc(jdbcUrl, tableName, prop)
       .write()
       .json("/fileName.json");

Entonces puede trabajar en HDFS normalmente.

spark.read().json("/fileName.json")
       .createOrReplaceTempView(tableName);

Cree una consulta de inserción desde una matriz MySQL y PHP

Tabla MySQL con columna TEXTO

VLDBs en los 20-adolescentes:Vas a necesitar uno más grande...
Varias formas de usar la función de fecha SQL CONVERT
Primeros pasos con MariaDB usando Docker, Java Spring y JDBC
Creación de una base de datos de alta disponibilidad para Moodle mediante PostgreSQL