sql >> Base de Datos >  >> RDS >> Sqlserver

¿Por qué necesitamos SSIS y el esquema en estrella de Data Warehouse?

Este podría ser un candidato para "Demasiado amplio", pero lo intentaré.

¿Por qué querría almacenar mis datos 3 veces?

Tengo mis datos en mi OLTP (sistema de procesamiento de transacciones en línea), ¿por qué querría mover esos datos a una estructura completamente nueva (almacén de datos) y luego moverlos nuevamente a un sistema OLAP?

Comencemos de forma sencilla. Solo tiene un sistema de registro y no está increíblemente ocupado. Tal vez pueda salirse con la suya con una capa de abstracción (vistas en la base de datos o consultas con nombre en SSAS) y omitir el almacén de datos.

Entonces, construyes tus cubos, dimensiones y la gente comienza a usarlo y les encanta.

"¿Sabes lo que sería genial? Si pudiéramos correlacionar nuestros Blats con los Foos and Bars que ya tenemos allí" Ahora necesita integrar su aplicación simple con datos de una aplicación completamente no relacionada. El ID de cliente 10 en su aplicación es el ID de cliente {ECA67697-1200-49E2-BF00-7A13A549F57D} en la aplicación de CRM. ¿Ahora que? Deberá presentar una vista única del Cliente a sus usuarios o no utilizarán la herramienta.

Tal vez gobierne con puño de hierro y diga No, no puede tener esos datos en el cubo y sus usuarios lo aceptarán.

"¿Cambian los hábitos de compra de las personas después de tener un hijo?" No podemos responder eso porque nuestra aplicación solo almacena la versión actual de un cliente. Una vez que tienen un hijo, siempre han tenido un hijo, por lo que no se pueden identificar claramente los patrones antes o después de un evento.

"¿Cómo fueron nuestras ventas el año pasado?" No podemos responder eso porque solo guardamos 12 semanas de datos en la aplicación para que sea manejable.

"Los datos en los cubos están obsoletos, ¿puedes actualizarlos?" Egads, es la mitad del día. El procesamiento de SSAS toma bloqueos de tablas y, básicamente, desactivaría nuestra aplicación hasta que termine de procesarse.

¿Necesito continuar con estos escenarios?

Resumen

El almacén de datos sirve como punto de integración para diversos sistemas. Tiene dimensiones conformadas (todos tienen una definición común de lo que es una cosa). Los datos en el almacén pueden exceder la vida útil de los datos en los sistemas de origen. Las necesidades comerciales pueden impulsar el seguimiento de datos que la aplicación de origen no admite. Los datos en el DW respaldan las actividades comerciales mientras que su sistema OLTP se respalda a sí mismo.

SSIS es solo una herramienta para mover datos. Hay muchos por ahí, algunos mejores, otros peores.

Entonces, no, en términos generales, no es mejor evitar crear un DW y construir sus cubos basados ​​en su base de datos OLTP.