sql >> Base de Datos >  >> RDS >> Oracle

Redundancia N+1 y consolidación de servidores

En una publicación de blog anterior, hablé sobre el diseño de sus implementaciones de RAC con redundancia N+1. Esto garantiza que la pérdida de un nodo no abrume a los nodos restantes en caso de que falle un nodo. Hoy hablaré sobre el impacto de la consolidación de servidores, específicamente los núcleos de CPU, y sus posibles impactos N+1.

Uno de los principales sistemas en los que trabajo actualmente es un clúster Oracle RAC de cuatro nodos. Cada nodo tiene 4 núcleos. Tengo licencia para los 16 núcleos (4 núcleos/nodo * 4 nodos =16 núcleos en total) en mi entorno. Diseñé este sistema con redundancia N+1. Si pierdo un nodo y pierdo 4 núcleos, sigo estando bien porque mis demandas de carga de trabajo solo requieren 12 núcleos para mantener niveles de rendimiento normales y aceptables.

Cuando este sistema se diseñó inicialmente, los servidores de 4 núcleos eran comunes. El entorno actual es diferente y cada vez es más difícil encontrar servidores de 4 núcleos. Todavía existen, pero los proveedores de hardware están impulsando sistemas con mayor número de núcleos.

En una conversación con mi SysAdmin recientemente, quería pedir sistemas de 6 núcleos para reemplazar nuestros servidores de 3 años. Bueno, no podemos simplemente hacer eso. Mi licencia de Oracle es para 16 núcleos. Podría implementar tres sistemas de 6 núcleos, pero luego tendría un total de 18 núcleos en el clúster y necesitaría 2 núcleos más de licencias de Oracle. Si implementara dos sistemas de 6 núcleos, tendría un total de 12 núcleos y 4 núcleos de licencias sin usar.

También informé al SysAdmin sobre nuestro diseño N+1. El impacto de cambiar a sistemas de 6 núcleos puede tener un gran impacto en el diseño de N+1. Recuerde que dije anteriormente que nuestras demandas de carga de trabajo requieren 12 núcleos para mantener los niveles operativos normales. Si implementamos máquinas de 6 núcleos, entonces dos de ellas cumplen con nuestros requisitos y se necesitaría otro nodo, el "+1", para garantizar que podamos perder un nodo sin impactos importantes en el rendimiento. Necesitaríamos implementar tres máquinas de 6 núcleos para mantener intacto nuestro objetivo de diseño N+1. Pero esto significa que debemos aumentar nuestro número de licencias, como dije anteriormente.

En este punto, mi SysAdmin pensó que tenía una buena idea... podríamos comprar dos servidores de 8 núcleos. Eso sigue siendo 16 núcleos en total y exactamente para lo que tenemos licencia hoy. No hay aumento en las tarifas de licencia. Pero si perdemos un nodo, bajamos a 8 núcleos totales en funcionamiento, que es menos de lo que necesito. Esto trae a colación un muy buen punto...

En este momento, no hay una respuesta fácil. Todavía podemos comprar servidores de 4 núcleos, por lo que reemplazaremos los actuales el próximo año. Pero llegará un día en que los servidores de 4 núcleos serán imposibles de encontrar. Tendremos que tener un plan listo para ese momento, teniendo en cuenta nuestros objetivos de diseño de N+1.

Si tan solo pudiera particionar nuestros servidores Linux y dejar que los núcleos permanezcan inactivos y seguir cumpliendo con nuestros acuerdos de licencia de Oracle.