Escolar Documentos
Profissional Documentos
Cultura Documentos
5/7/12
En este captulo
Estrategia general de ETL Modelos y tcnicas de extraccin Tcnicas para deteccin del delta Tcnicas para el manejo de grandes volmenes de datos Guas para el proceso de extraccin de datos Validacin de datos extrados
5/7/12
Modelo Push
El sistema de origen inicia el proceso de extraccin y empuja los datos de delta al servidor de staging. El sistema de origen es responsable por la extraccin, trazabilidad del proceso, reinicio en caso de fallas y mover los datos al rea de staging
Modelo Pull
La base de datos de staging inicia el proceso ejecutando sentencias SQL sobre los sistemas de origen Usado para minimizar el impacto en el servidor de origen El servidor de origen inicia la extraccin, Prepara las consultas, hacen la trazabilidad de las fallas y mantienen los metadatos necesarios Es el modelo ms usado 5/7/12
5/7/12
Usar un ODS como fuente de la bodega (tambin se conoce como Reporting Data Store) Uso de un servidor Stand-by Uso de un servidor Snapshot (Backup) Uso de herramientas nativas (BCP, Loader, etc.) Uso de herramientas de ETL Uso de Triggers en el origen Use la aplicacin de origen para escribir redundantemente en la base de datos de Staging
Enfoques bsicos
Log de transacciones: Es un log donde se registran los cambios en las tablas de origen. Usado comunmente para registros de transacciones y para cambios en tablas muy grandes Fotos del sistema de origen: Se detectan los cambios en el rea de staging. Debido a lo complejo de este proceso, solo debe usarse para tablas pequeas. Este esquema no captura los cambios 5/7/12 intermedios
Sincronizacin completa (Carga de historia) Deteccin de delta basado en Fotos del Sistema de origen Largos intervalos entre extracciones Recargas despus de cambios (reproceso) Cambios de esquema en el sistema OLTP 5/7/12
Deteccin apropiada del delta Agendas diferentes dependiendo de la disponibilidad de la fuente Extraccin de particiones Intervalos de sincronizacin pequeos Uso del modelo de extraccin adecuado
5/7/12
Verifique los conteos de los datos extrados Evite prdida de foreign keys (extraiga tablas con las definiciones de dichas claves) Identifique los registros duplicados
5/7/12