Escolar Documentos
Profissional Documentos
Cultura Documentos
HERRAMIENTAS ETCL
Presentado por:
Copia de seguridad para creacin de todos los usuarios, grupos, inicios de sesin
y permisos.
Creacin o actualizacin de cdigo para la implementacin de una base de datos.
Creacin de un entorno de pruebas.
Los procesos se orientan al uso de las sentencias DML, para realizar el paso de datos de
la base de datos de origen a la base de datos destino, a travs de los entornos
administrativos de los SMBD.
Perfilado de datos: Permite explorar los propios datos, agregando a los de origen
las reglas necesarias. Esta tcnica hace posible tambin el obtener resultados
acerca de duplicidades o errores en los datos.
Limpieza de datos: Puede llevarse a cabo empleando para ello una herramienta
de Data Quality que ayude a eliminar errores, incorrecciones o duplicidades, entre
otras inconsistencias; y que, al mismo tiempo, enriquezca y homologue los datos,
preparndolos para el sistema de destino.
Conexin a distintas fuentes de datos: Tcnica que precisa de una herramienta
ad hoc que garantice el hacerlo en condiciones de simultaneidad.
Las ventajas que proporciona el usar estas tecnologas se traducen en un aumento de la
precisin, reduccin del ndice de errores, mayor agilidad y optimizacin del tiempo; ya
que su automatizacin evita los procesos manuales, algo que supone su principal
beneficio.
QU SE DEBE TENER EN CUENTA PARA LA ELECCIN DEL SOFTWARE DE ETL
Existen muchas herramientas de ETL diferentes, como tambin hay infinidad de bases de
datos, sistemas y organizaciones distintas. En el momento de seleccionar la que liderar
la migracin e integracin de datos pueden tomarse en consideracin las
recomendaciones de Gartner en cuanto a las cualidades que la herramienta ha de
presentar:
Caracteristicas Benetl
Tecnologias:
Java 7 update 80
PostgreSQL 9.5.0 (con el apoyo plpgsql)
MySQL 5.6 con funcin de OLD_PASSWORD de inicio de sesin de
usuario (para controlador suministrado)
Con Windows (se utiliza "tareas programadas")
Benetl 4.7 funciona en Linux.
Requerimientos Tecnicos:
ejecucin de Java (JRE) 1.7
base de datos PostgreSQL 9.5 con soporte plpgsql
base de datos de MySQL 5.6 con OLD_PASSWORD la funcin de inicio de
sesin de usuario o el controlador oficial de MySQL (no incluido)
Probado en sistemas de 64 bits
Ejemplo: Nombre EtlTool Definir Nombre, Este nombre es tambin el nombre de
la tabla de PostgreSQL o tabla de MySQL donde se almacenan las lneas de
datos.
Un archivo llamado "EtlTool.bat" se crear en la carpeta de origen de datos.
Debe presionar enter para validar su nombre EtlTool, y luego se pueden guardar
los parmetros.
La opcin empresarial ETL (Enterprise ETL Option) para Warehouse Builder es una
opcin que puede ser adquirida con Oracle Warehouse Builder como parte de la edicin
empresarial del motor de base de datos (Oracle DB Enterprise Edition).
Figura 1 Opciones de Warehouse Builder.
Este resumen ejecutivo cubre nicamente la ETL Enterprise Option como se muestra en la figura 1.
Como parte de la Enterprise ETL Option, Warehouse Builder permite ejecutar cargas de
datos usando mtodos rpidos y eficientes tales como el Oracle Data Pump y
transportable tablespaces. Esta es una aproximacin completamente diferente al
movimiento de datos que se realiza por medio de conjuntos de datos controlados por el
motor de base de datos. Los incrementos en velocidad de carga se deben entonces a la
omisin de las capas SQL tradicionales.
Una vez, los usuarios de negocio han decidido que atributos son importantes, el
modelador de datos disea la dimensin. Con los pasos de ETL el desarrollador ve esta
dimensin como cualquier otra. El siguiente paso es definir cmo efectuar los cambios y
actualizaciones en la dimensin. Warehouse Builder automatiza esto basado en la
definicin de la dimensin. La combinacin entre estos pasos, el diseo y la
estandarizacin hacen que los procesos relacionados con dimensiones lentamente
cambiantes presente un alto desempeo en su ejecucin.
Traza Lineal de Principio a Fin
Tcnica Descripcin
Es una tcnica muy utilizada en procesos de migracin de datos, consiste en hacer que dos
bases de datos sean equivalentes en el mismo tiempo.
Se logra mediante la copia de datos y metadatos de una base de datos origen a una base
Sincronizacin de datos destino mediante una herramienta tecnolgica. Los asistentes de sincronizacin
de base de de los SMBD son configurados con las bases de datos origen y la base de datos destino,
datos parametrizando la ubicacin de particiones y mtodos de seguridad.
Ediciones
Precio de
de SQL Modelo de Disponibilidad de
Ideal para... Open NL
Server licencia canal
(USD)
2014
Enterprise Rendimiento confiable y completo Por ncleo** Licencias por volumen, $14,256***
para satisfacer los requisitos de hosting
base de datos y de Business
Intelligence ms exigentes. La
edicin Enterprise proporciona los
niveles de servicio y rendimiento
ms altos para las cargas de trabajo
de nivel 1.*
Business Una plataforma amplia que permite Servidor + Licencias por volumen, $8,908***
Intelligence a las organizaciones compilar e CAL**** hosting
implementar soluciones de BI
seguras, escalables y
administrables.
Standard Funcionalidad de Business Por ncleo** Licencias por volumen, $3,717***
Intelligence y administracin de hosting
datos bsica para cargas de trabajo
que no son crticas, con recursos de
TI mnimos.
Servidor + Licencias por volumen, $931***
CAL**** hosting, minorista (FPP)
Developer Versin completamente funcional de Por usuario Licencias por volumen, $38***
SQL Server que permite a los minorista (FPP)
desarrolladores compilar, probar y
demostrar aplicaciones con software
de SQL Server de una manera
rentable.
http://www.oracle.com/us/corporate/pricing/price-lists/business-intelligence-price-list-
071347.pdf
BIBLIOGRAFIA.
http://blog.powerdata.es/el-valor-de-la-gestion-de-datos/bid/353132/ETL-t-cnicas-de-
migraci-n-y-tipos-de-software
https://platzi.com/blog/que-es-postgresql/
http://www.oracle.com/technology/products/warehouse/11gr1/datasheets/warehouse-
builder-11g-etldatasheet.pdf