sql >> Base de Datos >  >> RDS >> Mysql

La forma más rápida de subconjunto:data.table vs. MySQL

Si los datos caben en la RAM, data.table es más rápido. Si proporciona un ejemplo, probablemente se hará evidente, rápidamente, que está utilizando data.table mal. ¿Ha leído lo que se debe y no se debe hacer en el data.table wiki ? ?

SQL tiene un límite inferior porque es un almacén de filas. Si los datos caben en la RAM (y 64 bits es bastante), entonces la tabla de datos es más rápida no solo porque está en la RAM, sino porque las columnas son contiguas en la memoria (lo que minimiza las recuperaciones de página de la RAM a L2 para las operaciones de columna). Use data.table correctamente y debería ser más rápido que el límite inferior de SQL. Esto se explica en la pregunta frecuente 3.1. Si está viendo más lento con data.table, entonces es muy probable que esté usando data.table incorrectamente (o hay un error de rendimiento que debemos corregir). Por lo tanto, publique algunas pruebas, después de leer la wiki de data.table.