Exporte datos JSON y cárguelos en una base de datos relacional

tenemos nuestra mongo DB que almacena datos JSON. Queríamos migrar datos a Redshift para algunos fines de consulta.

Usamos mongoexport csv para crear csv desde la tabla mongo y lo subimos a S3. Creamos el esquema relacional correspondiente en Redshift y usamos comandos de copia para cargar estos datos csv de s3 a redshift.

Podemos usar java apis para consultar mongo y crear y cargar csv en s3. Lo mismo se puede cargar a corrimiento al rojo.

El verdadero problema es que, dado que usamos mongo (json) o NoSQL, es posible que tengamos un número diferente de columnas para un objeto dado que pertenece a la misma tabla (como nosotros JSON), pero en Redshift tenemos un número fijo de columnas por tabla. Entonces, en tales casos, usted necesita crear todas las columnas posibles y cargar datos. Para aquellos objetos que no tienen todas las columnas, podemos completar valores nulos para ellos.