Você está na página 1de 17

SERVICIO NACIONAL DE APRENDIZAJE SENA

Especialización tecnológica en Gestión y Seguridad de Base de Datos

AA5-Ev1-Validación de técnicas de migración y herramientas ETCL

Presentado por

Carlos Torres Figueroa

Tutor: Fredy Méndez Ortiz

Cartagena de Indias Distrito Turístico y Cultural


30 –Agosto- 2019
Colombia

Objetivo
Efectuar la migración de datos de acuerdo con los requerimientos de la organización”
Conceptualización sobre Técnicas de migración y herramientas ETCL esto entra del proceso de
planeación, una buena planeación comienza con buscar evaluar las técnicas de migración de datos y
las herramientas que serán usadas
PROCEDIMIENTOS ETCL
(EXTRACCIÓN, TRANSFORMACIÓN, LIMPIEZA Y CARGA)

Esta técnica se basa en el diseño y construcción de procedimientos técnicos para realizar Extracción,
Transformación, Limpieza y Cargue de Datos (ETCL). Los procedimientos o pasos necesarios para el
desarrollo de un proyecto de migración de datos utilizando la metodología ETCL son

En todo proceso de migración, se ha de proceder a integrar dos o más sistemas por lo cual pueden
usarse diferentes técnicas, siendo las más comunes: Perfilado de datos: Permite explorar los propios
datos, agregando a los de origen las reglas necesarias. Esta técnica hace posible también el obtener
resultados acerca de duplicidades o errores en los datos. Limpieza de datos: Puede llevarse a cabo
empleando para ello una herramienta de Data Quality que ayude a eliminar errores, incorrecciones o
duplicidades, entre otras inconsistencias; y que, al mismo tiempo, enriquezca y homologue los datos,
preparándolos para el sistema de destino. Conexión a distintas fuentes de datos: Técnica que precisa
de una herramienta ad hoc que garantice el hacerlo en condiciones de simultaneidad. Las ventajas que
proporciona el usar estas tecnologías se traducen en un aumento de la precisión, reducción del índice
de errores, mayor agilidad y optimización del tiempo; ya que su automatización evita los procesos
manuales, algo que supone su principal beneficio.
QUÉ SE DEBE TENER EN CUENTA PARA LA ELECCIÓN DEL SOFTWARE DE ETL
Existen muchas herramientas de ETL diferentes, como también hay infinidad de bases de datos,
sistemas y organizaciones distintas. En el momento de seleccionar la que liderará la migración e
integración de datos pueden tomarse en consideración las recomendaciones de Gartner en
cuanto a las cualidades que la herramienta ha de presentar:

Adaptabilidad a distintos sistemas operativos y plataformas hardware.


Capacidades de gestión de datos: en cuanto a minería, perfilado y calidad.
Habilidades para monitorizar, gestionar y controlar los procesos de integración de datos:
en lo relativo a gestión de errores, recolección de estadísticas de ejecución, controles
de seguridad, etc.
Capacidades SOA.
Capacidades de diseño y entorno de desarrollo: como soporte para test,
representaciones gráficas, modelos y flujos de datos y flujos de datos, etc.
Cualidades de arquitectura e integración referidas al grado de interoperabilidad,
compactación y consistencia de los diferentes componentes que la formen.
Aunque la elección de un software de ETL no es sencilla, su repercusión en el curso del proyecto
es decisiva. Una decisión correcta pasa por la automatización y en base a ella quedan
garantizados:
Un aumento en la velocidad de desarrollo del proyecto.
La descentralización del control de la ejecución y de todos los procesos.
Una mayor agilidad en el negocio.
Mayor precisión.
Minimización de errores.

¿Para qué se utiliza un proceso de ETL?


En prácticamente cualquier operación empresarial los datos desempeñan un papel importante; para
que tengan valor, deben trasladarse y prepararse para su uso, y para ello se necesitan procesos de
ETL. Enumeramos algunos casos de aplicación de ETL:

 Migración de datos de una aplicación a otra


 Replicación de datos para copias de seguridad o análisis de redundancia
 Procesos operativos, como la migración de datos desde un CRM a un ODS (almacén de datos
operativos) para potenciar o enriquecer los datos y luego devolverlos al CRM
 Depositar los datos en un almacén de datos para ingerir, clasificar y transformarlos en
business intelligence
 Migración de aplicaciones de infraestructuras locales a cloud, cloud híbrida o multicloud
 Sincronización de sistemas clave
HERRAMIENTAS ETCL

APLICACIÓN DE USO LIBRE


Benetl: Es una herramienta ETL de uso libre, desarrollada entre los años 2007 – 2014, hecha en java
y trabaja con base a lenguajes de base de datos PostgreSQL o MySQL.
Esta herramienta se creó para facilitar el trabajo con archivos TXT, CSV o archivos de fuente de
datos XML. Para recuperar los datos que tendrán que definir un dato de tiempo y una entidad,
que está representado por datos a calcular o para mostrar. Todos los objetos útiles serán
creados por Benetl dentro de una base de datos MySQL o PostgreSQL. La aplicación también es
capaz de recuperar automáticamente los datos mediante el uso de diversas tareas planificadas
de su sistema.
Mediante el uso de Benetl podrá se ha podido recuperar fácilmente la información de los
archivos de datos planos, la organización y el filtrado de acuerdo con su dato de tiempo y
entidad.
1 Caracteristicas Benetl
https://www.benetl.net/spip.php?article17
Tecnologias:
o Java 7 update 80
o PostgreSQL 9.5.0 (con el apoyo plpgsql)
o MySQL 5.6 con función de OLD_PASSWORD de inicio de sesión de usuario (para
controlador suministrado)
o Con Windows (se utiliza "tareas programadas")
o Benetl 4.7 funciona en Linux.
Requerimientos Tecnicos:
o ejecución de Java (JRE) 1.7
o base de datos PostgreSQL 9.5 con soporte plpgsql
o base de datos de MySQL 5.6 con OLD_PASSWORD la función de inicio de sesión
de usuario o el controlador oficial de MySQL (no incluido)
o Probado en sistemas de 64 bits
Ejemplo: Nombre EtlTool… Definir Nombre, Este nombre es también el nombre de la
tabla de PostgreSQL o tabla de MySQL donde se almacenan las líneas de datos.
Un archivo llamado "EtlTool.bat" se creará en la carpeta de origen de datos.
Debe presionar enter para validar su nombre EtlTool, y luego se pueden guardar los
SQL Server Integration Services

Microsoft Integration Services es una plataforma para la creación de soluciones empresariales de


transformaciones de datos e integración de datos. Use Integration Services para resolver complejos
problemas empresariales mediante la copia o descarga de archivos, la carga de almacenamientos de
datos, la limpieza y minería de datos y la administración de datos y objetos de SQL Server.

Integration Services puede extraer y transformar datos de diversos orígenes como archivos de datos
XML, archivos planos y orígenes de datos relacionales y, después, cargar los datos en uno o varios
destinos.

Integration Services incluye un amplio conjunto de tareas y transformaciones integradas,


herramientas gráficas para crear paquetes y la base de datos del catálogoIntegration Services, donde
se almacenan, ejecutan y administran los paquetes.

Puede usar las herramientas gráficas Integration Services para crear soluciones sin escribir ni una
sola línea de código. También puede programar el amplio modelo de objeto Integration Servicespara
crear paquetes mediante programación y codificar tareas personalizadas y otros objetos de paquete.

SQL Server Integration Services


El SQL Server Integration Services (SSIS) es el brazo de almacenamiento de datos de SQL Server
R2 Suite 2008, equipado con funciones superiores de Extract, Transform y Load (ETL). Proporciona
el vehículo para transferir información desde diferentes fuentes de datos a otras y el cambio de los
datos, si es necesario. Los tres componentes de la plataforma de SSIS para iniciar el proceso de
integración de datos son el Asistente para importación y para exportación, SSIS Designer y SSIS API
Programming. El Asistente para importación y exportación simplemente transfiere los datos desde el
origen al destino, pero no incluye las capacidades de transformación de datos. El SSIS Designer es
un componente integral del Business Intelligence Development Studio utilizado para el desarrollo y el
mantenimiento de paquetes de servicios de integración. El módulo de SSIS API Programming permite
que codifiques los paquetes de SSIS utilizando cualquier número de lenguajes de programación.
SQL Server Reporting Services
El SQL Server Reporting Services (SSRS) es un marco de mecanismos de información, tales como el
Report Builder, Report Designer, Report Manager y Report Server que trabajan juntos a través de una
interfaz web para permitir el desarrollo de soluciones de informes concisos interactivos en formato
impreso o en web. Report Builder y Report Designer son dos componentes SSRS para la generación
de informes. El Report Builder es una solución simple para el trabajador de la información o usuario
de negocios para crear informes rápidamente sin la necesidad de comprender la estructura de la
base de datos. El Report Designer es una herramienta para los desarrolladores, ya que añade
complejidad al desarrollo de informes personalizados. Esta herramienta requiere una comprensión de
la cáscara de Business Intelligence Development Studio en Visual Studio y la estructura subyacente
de los datos. Según Microsoft, el Report Server es el motor de proceso central en SSRS que maneja
el procesamiento y la entrega de informes utilizando procesadores. El Report Manager es una
herramienta administrativa que controla los servicios de información a través de una interfaz web.
SQL Server Analysis Services
El SQL Server Analysis Services o SSAS, es una herramienta de análisis multidimensional que
cuenta con Online Analytical Processing, poderosas capacidades de minería de datos y las
dimensiones más profundas a la información empresarial dentro de una base de datos relacional. El
análisis multidimensional es una técnica OLAP que produce la capacidad de analizar grandes
cantidades de datos mediante el almacenamiento de datos en los ejes y las celdas en lugar de la
tradicional relacional bidimensional vista en filas y columnas. SSAS coloca capacidades analíticas
predictivas en manos de los trabajadores de la información mediante la creación de una conexión
instantánea a los datos de back-end utilizando aplicaciones conocidas como Microsoft Excel y
SharePoint para el análisis, la presentación visual y la colaboración.
Compatibilidad de tipos de datos con Microsoft Connector for Oracle

os componentes de SSIS para Oracle no admiten todos los tipos de datos de Oracle. Las columnas con
tipos de datos no compatibles tendrán una advertencia al diseñar paquetes en SSDT y se eliminarán
de las columnas de asignación. Los datos no se pueden cargar en una columna con un tipo de datos
no compatible.

Asignación de tipos de datos

En la tabla siguiente se muestran los tipos de datos de bases de datos de Oracle y su asignación
predeterminada a los tipos de datos de SSIS. También se muestran los tipos de datos de Oracle no
compatibles.

Tipo de datos de base


de datos de Oracle Tipo de datos de SSIS Comentarios

VARCHAR2 DT_STR

NVARCHAR2 DT_WSTR

CHAR DT_STR

NUMBER DT_R8 Se puede cambiar a DT_NUMERIC con precisión y


escala específicas. La precisión y escala las define el
usuario según las necesidades. La salida serán los
datos de la columna como un número con precisión
y escala fijas.

NUMBER(P, S) Si la escala es 0, de
acuerdo con la precisión
(P)

 DT_I1

 DT_I2

 DT_I4

 DT_NUMBERIC(P,0)

DT_NUMERIC(P,S)

DATE DT_DBTIMESTAMP
Tipo de datos de base
de datos de Oracle Tipo de datos de SSIS Comentarios

 timestamp DT_STR

 TIMESTAMP WITH
TIME ZONE

 INTERVAL YEAR TO
MONTH

 INTERVAL DAY TO
SECOND

 TIMESTAMP WITH
LOCAL TIME ZONE

RAW DT_BYTES

CLOB DT_TEXT Los tipos de datos CLOB, NCLOB y BLOB solo se


admiten en el modo de matriz y no en el modo de
carga rápida.

NCLOB DT_NTEXT

BLOB DT_IMAGE

UROWID No admitida

REF No admitida

BFILE No admitida

LONG No admitida

LONG RAW No admitida

ROWID No admitida

Tipo definido por el No admitida


usuario (tipo de
Tipo de datos de base
de datos de Oracle Tipo de datos de SSIS Comentarios

objeto, VARRAY, tabla


anidada)

Formato de paquetes SSIS

En la versión actual de Integration Services, se han realizado cambios significativos en el formato de


paquetes (archivo .dtsx) para que sea más fácil leer el formato y comparar paquetes. También puede
combinar de forma más confiable paquetes que no contienen los cambios en conflicto o cambios
almacenados en formato binario.

Para ver el formato de archivo de paquete actual DTSX, vea [MS-DTSX]: Especificación de formato
de archivo XML de paquete de servicios de transformación de datos.

En la lista siguiente se mencionan los cambios de formato de archivo. Para ver ejemplos de código de
estos cambios, vea Cambios de formato de paquetes en SQL Server 2012

 Las convenciones de formato se han aplicado para que sea más fácil leer y comprender el
archivo .dtsx.
 El formato es más conciso. Los elementos independientes de cada propiedad se han guardado
como atributos, excepto PackageFormatVersion. Los atributos se muestran en orden alfabético
y las propiedades que tienen valores predeterminados ya no se guardan.Finalmente, los
elementos que pueden aparecer varias veces, ahora se encuentran dentro de un elemento
primario.
 La mayoría de los objetos dentro de un paquete al que se puede hacer referencia mediante
otros objetos ahora tienen un atributo refId definido en el paquete XML. En lugar los
identificadores de linaje de almacenamiento, ahora se guarda refID. Los identificadores de linaje
todavía se utilizan en tiempo de ejecución y se vuelven a generar al cargar el paquete.

El valor de refId es una cadena única que es legible y de fácil comprensión, comparará con
GUID o los valores enteros. La cadena es similar a los valores de ruta de acceso que se usan
para las configuraciones de paquetes en versiones anteriores de Integration Services.

Si se mezclan los cambios entre dos versiones de un paquete, refId se puede utilizar en
operaciones de búsqueda y reemplazo para asegurarse de que todas las referencias al objeto
se han actualizado correctamente.

 La información de diseño se encuentra en una sección de CDATA.


 Las anotaciones se conservan en texto no cifrado. Esto hace más fácil extraer la información
para la generación automatizada de documentación.
Instalar Integration Services

SQL Server proporciona un único programa de instalación para instalar alguno de sus componentes o
todos, incluido Integration Services. Use el programa de instalación para instalar Integration
Services con o sin otros componentes de SQL Server en un único equipo.

En este artículo se destacan consideraciones importantes que se deberían conocer antes de


instalar Integration Services. La información de este artículo le ayudará a evaluar las opciones de
instalación para que pueda realizar selecciones que deriven en una instalación correcta.

Preparación de la instalación de Integration Services

Antes de instalar Microsoft SQL Server Integration Services, revise esta información:

 Requisitos de hardware y software para instalar SQL Server


 Consideraciones de seguridad para una instalación de SQL Server

Instalación independiente o en paralelo

Puede instalar SQL Server Integration Services en las configuraciones siguientes:

 Puede instalar SQL Server Integration Services en un equipo que no tenga ninguna instancia
anterior de SQL Server.
 Puede instalar SQL Server 2017 Integration Services (SSIS) en paralelo con una instancia
existente de Integration Services.

Al actualizar a la versión más reciente de Integration Services en un equipo que tiene instalada una
versión anterior de Integration Services, la versión actual se instala en paralelo con la versión
anterior.

Para más información sobre cómo actualizar Integration Services, vea Actualizar Integration Services.

Obtención de SQL Server con Integration Services

Si todavía no tiene Microsoft SQL Server, descargue una edición de evaluación gratuita o la
Developer Edition gratuita de las descargas de SQL Server. SSIS no se incluye en SQL Server
Express Edition.

Instalar Integration Services

Después de revisar los requisitos de instalación de SQL Server y asegurarse de que el equipo los
cumple, puede comenzar a instalar Integration Services.

Si está usando el Asistente para la instalación con el fin de instalar Integration Services, usará una
serie de páginas para especificar los componentes y las opciones.

 En la página Selección de características, en Características compartidas,


seleccione Integration Services.
 En Características de instancia, puede seleccionar Servicios de Motor de base de
datospara hospedar la base de datos del Catálogo de SSIS, SSISDB, para almacenar,
administrar, ejecutar y supervisar los paquetes SSIS.
 Para instalar ensamblados administrados para la programación de Integration Services, también
en Características compartidas, seleccione SDK de las herramientas de cliente.
Nota

Algunos componentes de SQL Server que puede seleccionar para instalarlos en la página Selección de
características del Asistente para la instalación instalan un subconjunto parcial de componentes
de Integration Services. Estos componentes resultan útiles para tareas específicas, pero las funciones
de Integration Services son limitadas. Por ejemplo, la opción Servicios de motor de base de
datos instala los componentes de Integration Servicesnecesarios para el Asistente para importación y
exportación de SQL Server . Para asegurarse de que la instalación de Integration Serviceses completa,
debe seleccionar Integration Services en la página Selección de características .

Instalación de un servidor dedicado para procesos de ETL

Para usar un servidor dedicado para los procesos de extracción, transformación y carga (ETL), instale
una instancia local de Motor de base de datos de SQL Server al instalar Integration Services.Integration
Services suele almacenar los paquetes en una instancia del Motor de base de datos y se basa en el
Agente SQL Server para programar estos paquetes. Si el servidor ETL no tiene ninguna instancia
de Motor de base de datos, tiene que programar o ejecutar los paquetes desde un servidor que sí
tenga una instancia de Motor de base de datos. El resultado es que los paquetes no se ejecutan en el
servidor ETL, sino en el servidor desde el que se inician. Como resultado, los recursos del servidor ETL
dedicado no se utilizan como se pretendía. Además, los procesos ETL en ejecución pueden agotar los
recursos de otros servidores.

Configuración del registro de eventos SSIS

De forma predeterminada, en una instalación nueva, Integration Services se configura para no registrar
en el registro de eventos de aplicación los eventos relacionados con la ejecución de paquetes. Esta
configuración impide la generación de demasiadas entradas en el registro de eventos al usar la
característica de recopilador de datos de SQL Server 2017. Los eventos que no se registran son
EventID 12288, "Se ha iniciado el paquete" y EventID 12289, "El paquete finalizó correctamente". Para
registrar estos eventos en el registro de eventos de aplicación, abra el Registro para editarlo. A
continuación, en el Registro, busque el nodo HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft
SQL Server\130\SSIS y cambie el valor DWORD de la opción LogPackageExecutionToEventLog de 0 a
1.

Instalación de componentes adicionales para Integration Services

Para una instalación completa de Integration Services, seleccione los componentes que necesita en
esta lista:

 Integration Services (SSIS) . Instale SSIS con el Asistente para la instalación de SQL Server.Al
seleccionar SSIS, se instala lo siguiente:
o Compatibilidad con el Catálogo de SSIS en el Motor de base de datos de SQL Server.
o Si lo prefiere, la característica Escalabilidad horizontal de SSIS, que consta de un patrón y los
trabajadores.
o Componentes SSIS de 32 bits y 64 bits.
o Al instalar SSIS no se instalan las herramientas necesarias para diseñar y desarrollar paquetes
SSIS.
 Motor de base de datos de SQL Server. Instale el motor de base de datos con el Asistente para
la instalación de SQL Server. Al seleccionar el motor de base de datos, puede crear y hospedar la
base de datos del Catálogo de SSIS, SSISDB, para almacenar, administrar, ejecutar y supervisar los
paquetes SSIS.
 SQL Server Data Tools (SSDT) . Para descargar e instalar SSDT, vea Descargar SQL Server Data
Tools (SSDT). Instalar SSDT le permite diseñar e implementar paquetes SSIS. SSDT instala lo
siguiente:
o Herramientas de diseño y desarrollo del paquete SSIS, incluido el Diseñador SSIS.
o Componentes SSIS de 32 bits solamente.
o Una versión limitada de Visual Studio (si no hay ya instalada una edición de Visual Studio).
o Visual Studio Tools for Applications (VSTA), el editor de scripts usado por la tarea de script y el
componente de script de SSIS.
o Asistentes de SSIS, incluido el Asistente para implementación y el Asistente para actualización
de paquetes.
o Asistente para importación y exportación de SQL Server.
 Feature Pack de Integration Services para Azure. Para descargar e instalar el Feature Pack,
vea Microsoft SQL Server 2017 Integration Services Feature Pack for Azure (Feature Pack de
Microsoft SQL Server 2017 Integration Services para Azure). Al instalar el Feature Pack, los
paquetes se conectan a los servicios de almacenamiento y análisis de la nube de Azure, incluidos
los servicios siguientes:
o Almacenamiento de blobs de Azure.
o HDInsight de Azure.
o Azure Data Lake Store.
o Azure SQL Data Warehouse.
 Componentes adicionales opcionales. Si lo prefiere, puede descargar otros componentes de
terceros desde el Feature Pack de SQL Server.
o Microsoft® Connector for SAP BW para Microsoft SQL Server®. Para obtener estos
componentes, visite Microsoft SQL Server 2017 Feature Pack.
o Microsoft Conector versión 5.0 para Oracle de Attunity y Microsoft Connector versión 5.0 para
Teradata de Attunity. Para obtener estos componentes, visite Microsoft Connectors v5.0 for
Oracle and Teradata (Microsoft Connectors v5.0 para Oracle y Teradata).
Oracle Warehouse Builder

En la implementación de un Data Warehouse (DW) es imprescindible disponer de una herramienta para


la extracción, transformación y carga de los datos. Este proceso se conoce por el acrónimo ETL (del
inglés Extraction-Transformation-Loading). Históricamente la herramienta ETL de Oracle ha
sido Oracle Warehouse Builder (OWB). Lanzado en el 2000, OWB es el producto tradicional para la
creación del esquema del DW, definición de dimensiones y medidas, mapeo de las fuentes de datos y
scheduling de los procesos de carga para bases de datos Oracle. Con la adquisición de la empresa
Sunopsis en octubre 2006, Oracle lanza en el mercado otra herramienta ELT, Oracle Data Integrator
(ODI). ODI introduce el concepto innovador de E-LT(Extract-Load-Transform). Las transformaciones
de los datos pueden ser realizadas directamente en el sistema destino, sin necesidad de un área
intermedia. Otro punto de fuerza de la nueva solución es la capacidad de conectar fuentes de datos
heterogéneas, superando la limitación de OWB de utilizar la base de datos Oracle como único sistema
target.

En el 2009 Oracle definió ODI y OWB como dos componentes de ODI-EE (Oracle Data Integrator
Enterprise Edition) y declaró que los dos productos iban a ser fusionados en la misma plataforma de
integración. La estrategia de Oracle a largo plazo es reemplazar por completo OWB con ODI. En el
momento actual, OWB y ODI siguen formando parte de la oferta de Oracle como dos productos
independientes. La última versión de ODI es la 11g y está totalmente integrada en la plataforma Fusion
Middleware.

PAQUETES Oracle Warehouse Builder es parte integral de Oracle 11g Database. El producto funciona
en todas las versiones (Standard Edition, Standard Edition One, Enterprise Edition) y generalmente en
todas las plataformas certificadas o modificadas que se utilizan con la base de datos Oracle 11g. Las
principales características del producto se presentan como opción sin costo en la licencia de base de
datos. El precio de las opciones se establece por separado y se encuentra disponible únicamente con
la versión Enterprise Edition de la base de datos.

Características Principales Las principales características del producto fueron previstas para permitir el
modelado y la integración de datos en la mayoría de los entornos. Es el paso necesario para
introducirse al mundo de Warehouse Builder ya que puede comenzar a utilizarlo sin ningún costo
adicional y no pretende, bajo ningún concepto, satisfacer pequeñas implementaciones. Opción ETL
para la Empresa Esta opción está especialmente dirigida a aumentar el desempeño (permitiendo
realizar extracciones de alto desempeño) y la productividad, permitiendo aplicar grandes capacidades
de reutilización. Algunas características avanzadas para la administración de metadatos también se
incorporan en esta opción. Opción de Calidad de Datos Como parte totalmente integrada del producto
–lo cual constituye una ventaja muy distintiva por sobre las demás herramientas del mercado-, la opción
de calidad de datos brinda soporte a las características de creación de perfiles de datos, reglas de
datos (esencialmente reglas de negocio) y cumplimiento de la información. Debido a la integración, la
información recogida durante la creación de perfiles de datos puede utilizarse para generar
correcciones de datos de manera automática.
Conectores Los conectores permiten un mejor acceso y una integración más estrecha con las
aplicaciones empaquetadas de ERP y CRM. Para Warehouse Builder 11g, el conector Siebel es una
nueva incorporación a la familia de conectores de Warehouse Builder. La Integración es Clave Para
obtener el máximo beneficio de su herramienta, asegúrese de que el componente ETL se integre con
los demás pilares de la administración de información.

El modelado de datos, el cumplimiento de datos y la calidad de datos son las principales características
que debe tener su herramienta para la administración de información. Más allá de los reclamos de los
proveedores, intente comprender desde el comienzo cómo interactúan las herramientas, cómo se
integran, si son vendidas en conjunto o se crean como un producto único. Estas preguntas le mostrarán
el nivel de integración del producto. Ahora bien, ¿por qué la integración es clave? Durante años hemos
abordado (y algunos proveedores aún lo hacen) los temas de la Figura 2 como herramientas
individuales. Luego, como cliente, usted intenta descubrir cómo introducir el modelo de datos en la
herramienta ETL y probablemente termina adquiriendo el software de integración de algún tercero para
alcanzar ese objetivo. Actualmente, este es el caso más común. Al mirar hacia un futuro inmediato,
sabemos que los resultados de las herramientas para los perfiles de datos deberán comunicarse a los
desarrolladores ETL. ¿Cómo va a funcionar? ¿Cómo se va a incorporar la información de los perfiles
de datos en las transformaciones directas de calidad de datos requeridas para abordar los datos
erróneos? Todas estas preguntas deberían contestarse con una sola palabra: Integración.
Por lo tanto, para poder realmente obtener beneficios de las técnicas y herramientas disponibles, usted
debe encontrar una herramienta integrada que le permita realizar las tareas que necesita de la mejor
manera posible, así como la más rápida.
WAREHOUSE BUILDER AUMENTA LA CALIDAD DE INFORMACIÓN Como se mencionó en la
primera tendencia, brindar datos únicamente no es demasiado bueno para el panorama actual ni para
el futuro. Como proveedor de información o integrador, usted necesitará un conjunto de herramientas
que lo ayuden a elaborar información de calidad. Warehouse Builder es parte esencial de ese conjunto
de herramientas. Calidad de Metadatos En este punto, ya todos deben haber escuchado hablar sobre
la calidad de datos, y nos podemos dar cuenta de que la calidad de datos es importante. Lo que resulta
interesante es que los metadatos parecen invadir cualquier debate sobre calidad, y ni hablar sobre los
productos que brindan características de calidad de metadatos. El nuevo Warehouse Builder cambia
drásticamente esto. Por primera vez1, una herramienta lo ayudará a resolver verdaderamente algunos
de los problemas que surgen por los cambios en su entorno. Los nuevos servicios de Warehouse
Builder Dependency Management le permiten detectar el efecto expansivo de los cambios que se
producen en los metadatos de su sistema antes de que estos cambios destruyan su sistema.
WAREHOUSE BUILDER INCREMENTA EL VALOR DE LA INFORMACIÓN La segunda tendencia
trata sobre cómo permitir el análisis avanzado de los datos en un lugar central. Con todas las fuentes
a las que puede llegar Warehouse Builder y las características avanzadas de calidad de datos, usted
ahora puede brindar más información a sus usuarios finales. No obstante, los usuarios finales ahora
quieren tener análisis sofisticados y fáciles de usar para realizar análisis de simulación, extraer sus
datos de esquemas anteriormente ocultos y aplicar este conocimiento a sus problemas de negocio. El
nuevo Warehouse Builder le brindará la tecnología más reciente para poder cumplir con este requisito
de análisis sofisticado. El diseño de OLAP directo, los cálculos avanzados (distribución, clasificación y
series de tiempo) y ETL directamente en la base de datos Oracle OLAP son los nuevos componentes
más importantes dentro de las capacidades de Warehouse Builder. Aparte de OLAP, Warehouse
Builder permite otras capacidades más avanzadas que se presentan con la plataforma Oracle, como
Oracle Spatial y Oracle Data Mining. Estas tecnologías le permiten responder a preguntas como dónde
puedo ganar dinero y por qué los clientes nos dejan por la competencia. En otras palabras, nos muestra
información basada en la ubicación e investiga la información con más profundidad para comprender
realmente por qué suceden las cosas o por qué podrían suceder.

Permitir Más Fuentes de Datos Como las empresas implementan cada vez más aplicaciones estándar,
la conectividad con estas aplicaciones empaquetadas se vuelve más importante. La nueva versión de
Warehouse Builder incorpora funcionalidades para abordar esta situación al mejorar el conector SAP
ya presente y al agregar una cantidad de conectores de aplicaciones empaquetadas al producto.
Captura de Cambios La clave para brindar información en el momento adecuado es poder capturar la
información relevante de la fuente y propagarla al objeto de entrega. Con el nuevo Warehouse Builder
usted puede utilizar Oracle Change Data Capture (CDC) utilizando las técnicas de base de datos más
recientes.
VENTAJAS, DESVENTAJAS, TIEMPOS Y COSTO DE LAS HERRAMIENTAS.

Técnica Descripción
Sincronización de Es una técnica muy utilizada en procesos de migración de datos, consiste en hacer que dos bases
base de datos de datos sean equivalentes en el mismo tiempo.
Se logra mediante la copia de datos y metadatos de una base de datos origen a una base de datos
destino mediante una herramienta tecnológica. Los asistentes de sincronización de los SMBD son
configurados con las bases de datos origen y la base de datos destino,
parametrizando la ubicación de particiones y métodos de seguridad.

Requerimientos Ventajas Desventajas Tiempo


Técnicos
SQL SERVER SQL server  Es un sistema de  Utiliza mucho la 3 semanas.
estándar gestión de base de memoria RAM para las Semana 1:
datos. instalaciones y Análisis de
 Es útil para manejar y utilización de datos
obtener datos de la red software. Semana 2:
de redes.  No se puede utilizar Migración y
 Nos permite olvidarnos como practicas validación de
de los ficheros que porque se prohíben información
forman la base de muchas cosas, tiene Semana 3:
datos. restricciones en lo Optimización de
 Si trabajamos en una particular. proceso
red social nos permite  La relación, calidad y el
agregar otros precio está muy
servidores de SQL debajo comparado con
Server. Por ejemplo, Oracle.
dos personas que  Tiene muchos
trabajan con SQL bloqueos a nivel de
Server, uno de ellos se página, un tamaño de
puede conectar al página fijo y
servidor de su otro demasiado pequeño,
compañero y así se una pésima
puede ver las bases de implementación de los
datos del otro tipos de datos
compañero con SQL variables.
Server.
 SQL permite
administrar permisos a
todo. También permite
que alguien conecte su
ORACLE Oracle Estándar  Oracle es el motor de  Las versiones más 3 semanas.
WAREHOUSE base de datos objeto recientes de Oracle Semana 1:
BUILDER relacional más usado a son la 11g, 10g, 9g, 8g, Análisis de datos
nivel mundial. desde el lanzamiento Semana 2:
 Puede ejecutarse en original de la 8 se Migración y
todas las plataformas, sucedieron varias validación de
desde una Pc hasta un versiones con información
supercomputador. correcciones, hasta Semana 3:
 Oracle soporta todas alcanzar la estabilidad Optimización de
las funciones que se en la 8.0.3. El motivo proceso
esperan de un servidor de tantos fallos fue, al
"serio": un lenguaje de parecer, la
diseño de bases de remodelación del
datos muy completo sistema de
(PL/SQL) que permite almacenamiento por
implementar diseños causa de la
"activos", con triggers y introducción de
procedimientos extensiones
almacenados, con una orientadas a objetos.
integridad referencial  El mayor
declarativa bastante inconveniente de
potente. Oracle es quizás su
 Permite el uso de precio. Incluso las
particiones para la licencias de Personal
mejora de la eficiencia, Oracle son
de replicación e incluso excesivamente caras,
ciertas versiones en mi opinión. Otro
admiten la problema es la
administración de necesidad de ajustes.
bases de datos Un error frecuente
distribuidas. consiste en pensar que
 El software del servidor basta instalar el Oracle
puede ejecutarse en en un servidor y
multitud de sistemas enchufar
operativos. directamente las
 Existe incluso una aplicaciones clientes.
versión personal para Un Oracle mal
Windows 9x, lo cual es configurado puede ser
un punto a favor para desesperantemente
los desarrolladores que lento.
se llevan trabajo a casa.  También es elevado el
 Oracle es la base de coste de la
datos con más información, y sólo
orientación hacía últimamente han
INTERNET. comenzado a aparecer
buenos libros sobre

Você também pode gostar