tenemos nuestra mongo DB que almacena datos JSON. Queríamos migrar datos a Redshift para algunos fines de consulta.
Usamos mongoexport csv para crear csv desde la tabla mongo y lo subimos a S3. Creamos el esquema relacional correspondiente en Redshift y usamos comandos de copia para cargar estos datos csv de s3 a redshift.
Podemos usar java apis para consultar mongo y crear y cargar csv en s3. Lo mismo se puede cargar a corrimiento al rojo.
El verdadero problema es que, dado que usamos mongo (json) o NoSQL, es posible que tengamos un número diferente de columnas para un objeto dado que pertenece a la misma tabla (como nosotros JSON), pero en Redshift tenemos un número fijo de columnas por tabla. Entonces, en tales casos, usted necesita crear todas las columnas posibles y cargar datos. Para aquellos objetos que no tienen todas las columnas, podemos completar valores nulos para ellos.