Você está na página 1de 3

Progress: Detalles generales de la ejecucin (entrega y adquisicin de datos) Detail: Mensajes con mayor detalle (Ver en properties las

3 cajas de texto) Input = Frecuencia de mensajes para la lectura de data Output = Frecuencia de mensajes para la escritura de data de dimensiones dentro de un fact build o para el progreso de un dimensional build Domain = Frecuencia de mensajes para el almacenamiento de filas en memoria (miem bros del lookup) o data de referencia Internal: Manejo de recursos (memoria, hash y break) break es el numero de cortes durante el procesamiento de dimensiones producidos por agregaciones que no se llevan a cabo hash arreglo en memoria que permite llevar a cabo transformaciones y agregacione s SQL: Sentencia SQL que se manda a ejecutar Executed SQL: Sentencia SQL Ejecutada User: Mensajes de log que el usuario crea dentro de los jobs Variable: Variables internas de DM ------------------------------------------------------------------------------Merge = Union de registros conflictivos utilizando alguna regla de sumarizacion por ejemplo: Registros que repiten llaves primarias Agregate = Union de registros utilizando reglas de agregacion por ejemplo: Solo se necesita los datos de stock por tipo y no por producto especifico -------------------------------------------------------------------------------Por defecto toda derivacion se calcula antes de la agregacion Donde hacer la derivacin? DataSource: Cuando el calculo sea especifico en funcin a la fuente de datos DataStream: Cuando el calculo sea el mismo para todas las fuentes de datos Transformation model: Cuando el calculo necesite que la data haya sido pivoteada y unida o cuando se requiera data referencial ------------------------------------------------------------------- Crear dimensiones conformadas -------------------------------------------------------------Si lo que se desea entregar es solo un datamart con algunas dimensiones se puede utilizar la entrega de dimensiones dentro del mismo fact build (private datamart) Se evita estar sobrescribiendo la data de dimensiones cada vez que se ejecuta un datamart Ventajas: - Reduce el tiempo de desarrollo debido a que cada dimension se analiza y disea u na sola vez independientemente de los datamarts que lo utilizan - Permite realizar mantenimientos una sola vez - Pemite ver el negocio desde distintos contextos

-----------------------------------------------------------------------Granularidad: Definicion del nivel de detalle con el que se puede consultar la i nformacion (Puede que la informacion solo encuentre disponible para la consulta diaria o me nsual) requerimientos de negocio --------------------------------------------------------Llaves Surrogadas - Permite reemplazar las llaves de negocio Ventajas? 1. Numericas (Autonumericas o serie de numeros con un diferencial entre terminos igual a 1) 2. Unico 3. No poseen ningun significado 4. Permite establecer un estandar de identificacion para cada registro (Puede que los datos de la dimension provengan de fuentes distintas y con lla ves de negocio distintas) -------------------------------------------------------------------------------------SCD - OLTP tiende a contener datos del estado actual del negocio - La data dimensional debe reflejar los cambios en el tiempo - El SCD se utiliza para manejar data historica (evita merge) El grafico muestra los cambios de una tabla a traves del tiempo En el que diversos atributos han ido variando haciendo inviable la identificacin unica de cada registro es posible unir atributos para conformar una nueva llave Metodos para el manejo de la SCD Tipo 1: Sobrescribe el valor antiguo (no hace seguimiento) Tipo 2: Agrega una nueva columna con un nuevo skey (si hace seguimiento) -----------------------------------------------------------------------------LOOKUPS: Se utilizan para realizar la verificacion de datos Substitucion de las business key por skeys ----------------------------------------------Fostering: registros huerfanos Multiple parents: Muchos padres Non-unique Ids: Se define una llave no unica Duplicate Rows: Filas duplicadas ---------------------------------------------------------------------------Es necesario mapear la data dimensional dentro de la tabla de hechos teniendo en cuenta la fecha en la que fue valida para ello es necesario establecer una fecha de transa ccion en la tabla de hechos y el intervalo de fechas de validez para las dimensiones

Late arriving fact: Se refiere a la data de hechos que utiliza datos dimensional es no actuales o que han sufrido cambios

Você também pode gostar