sql >> Base de Datos >  >> RDS >> PostgreSQL

Intel SSD, ahora fuera de la lista sh..err, vergüenza

Ya hice la entrada larga de la conferencia aquí, así que solo una actualización rápida:se publicaron las diapositivas de PGEast y la próxima semana estaré en la Conferencia MySQL cada vez más mal llamada en Santa Clara, California.

Una cosa por la que soy conocido ahora es despotricar sobre las unidades de estado sólido baratas y cómo apestan para el uso de la base de datos. La página wiki de Reliable Writes recopila la mayor parte de los antecedentes aquí. La situación en los últimos años ha sido que todas las unidades de bajo costo en el mercado no tienen un caché de escritura seguro para el uso de la base de datos. Todos mis clientes que compraron una de las unidades SSD de Intel, por ejemplo, ya sea la X25-M o la X25-E, que no es una empresa en absoluto, sufrió al menos una pérdida masiva por corrupción de datos.

Para que una unidad flash sea segura, debe tener una batería de respaldo en la unidad, por las mismas razones que se necesitan en los controladores RAID de alto rendimiento. Cuando la base de datos escribe datos y usa la llamada al sistema fsync para asegurarse de que se vacíe en el disco, no puede escribir físicamente esos datos lo suficientemente rápido para hacer felices a las personas, ya sea en un disco giratorio o en una memoria flash. La situación es algo peor incluso en flash, porque escribir pequeñas confirmaciones de datos sin caché también desgastará la unidad más rápido. Agregue una batería, haga que el controlador de la unidad elimine todos los datos pendientes cuando se corte la energía y podrá hacer que la SSD sea lo suficientemente confiable para las bases de datos.

Las unidades empresariales realmente caras han hecho esto bien desde hace un tiempo, pero el hardware adecuado para uso doméstico o para pequeñas empresas ha sido escaso. OCZ lanzó su unidad Vertex 2 Pro con un supercondensador y un lavado de escritura adecuado el año pasado. El capacitor es la parte "Pro", y no lo confundas con el Vertex 2 normal. Estos cuestan alrededor de $ 650 por 100 GB de SSD, y es realmente rápido. Pero no puede tener solo una unidad rápida:fallan, al igual que cualquier otro componente de su computadora. Y $ 1300 por un par de unidades las ha dejado fuera del alcance de las tiendas pequeñas, e incluso una sola ha excedido mi presupuesto personal para retoques de hardware doméstico.

Bueno, ahora hay otra opción. Intel finalmente ha limpiado su acto aquí. Los nuevos variadores de la serie 320 de ellos integran un conjunto de pequeños capacitores y una lógica de apagado adecuada en el variador. Incluso lo han convertido en parte del marketing ahora que lo están haciendo bien, incluido un informe elegante sobre cómo funciona. Ahí es donde está este tema ahora, por cierto:si el fabricante escribe el almacenamiento en caché correctamente, se jactará de ello. Si no escucha ningún alarde, eso significa que lo han arruinado y la unidad se comerá su base de datos.

Hay una línea completa de productos de estas nuevas unidades Intel disponibles, a partir de un modelo de 40 GB de menos de $ 100, todas con la misma confiabilidad de escritura. Sin embargo, los discos más grandes son más rápidos, y quería algo más rápido en todos los sentidos que el disco duro normal al que estaba reemplazando. Ese punto no llega hasta el modelo de 120 GB de $220, que tiene una velocidad de escritura secuencial más rápida que las unidades de terabyte que uso la mayor parte del tiempo. Una de las unidades Intel 320 de 120 GB llegó a mis emocionadas manos a principios de esta semana.

Puede encontrar los números completos de mi revisión inicial en pgsql-performance. Los parámetros básicos de rendimiento son los esperados:lecturas de 253 MB/s, escrituras de 147 MB/s y unas respetables 5000 confirmaciones por segundo, todas las especificaciones y expectativas coincidentes. Lo único de lo que puedo quejarme es de los resultados aleatorios de lectura/escritura. A pesar de las afirmaciones de números mucho más altos, solo obtengo alrededor de 3500 IOPS, lo que se traduce en 27 MB/s en una carga de trabajo mixta. Esto es aceptable, supera a cualquier disco normal, pero está en el lado bajo en lo que respecta a SSD. No me puedo quejar dado el precio, si quiero más rápido, siempre puedo gastar 3 veces más por el OCZ Vertex 2 Pro, pero es algo a tener en cuenta. Hay un montón de críticas desvergonzadas de Intel que se equivocan; la única revisión que he visto hasta ahora que captó el mismo problema y lo puso en la perspectiva adecuada es la de Anand. Muestra la unidad de la serie 320 de 300 GB (que es incluso más rápida que la que tengo) que ofrece velocidades medias a bajas en trabajos aleatorios, que es donde se encuentra de manera realista. Eso no es inaceptable, solo es importante comprender el conjunto de compensaciones que ofrecen estas unidades.

Si sus datos caben en 120 GB, esta unidad es una alternativa muy convincente a la configuración tradicional de base de datos de alto rendimiento. Obtener un controlador RAID con memoria caché de escritura respaldada por batería y un par de unidades normalmente suma alrededor de $ 600, y solo obtiene un rendimiento de E / S aleatorio justo del resultado. Compre un par de estas unidades por alrededor de $ 450, use software RAID para redundancia y estará muy por delante la mayor parte del tiempo. Solo asegúrese de seguir las buenas prácticas de monitoreo SMART para estas unidades. No duran para siempre, ya que el límite de escritura es un punto de falla conocido, incluso si nada se rompe antes de eso. Sin embargo, aquí también hay muchos consumibles con la tecnología más antigua, que incluyen unidades de repuesto, baterías de repuesto y, a veces, la necesidad de tener controladores adicionales como piezas de repuesto para sistemas críticos. Debería haber un ahorro de costos con SSD ahora, siempre que sus datos se ajusten al tamaño disponible. Y el rendimiento va a ser un gran paso adelante si está golpeando el disco en este momento. La mejor manera de aumentar el rendimiento es agregar más RAM, pero dado que eventualmente esos datos deben ir y venir del disco, es posible que no siempre sean lo suficientemente buenos.

Intel, obtenga mi aprobación oficial aquí:finalmente ha hecho lo correcto y estaré encantado de recomendarlo como proveedor ahora que lo ha hecho. Todavía estoy tratando de averiguar qué voy a hacer con mi servidor en casa, que ahora es más rápido que nunca, y ese es un buen problema.