Você está na página 1de 9

METODOLOGIAS E ESTRATGIAS DE MIGRAO DE DADOS

Cleber Silva de Oliveira 1


Marcio Abud Marcelino 2
Este trabalho identifica metodologias de manipulao de dados, descritas por vrios
pesquisadores e profissionais em diversos pases, realizando um levantamento das metodologias
gerais para migrao, atualizao ou integrao de sistemas legados, especificamente, Sistemas
Integrados de Gesto, conhecidos ERPs (Enterprise Resource Planning). O trabalho apoia
uma direo em metodologias para construo de ferramentas que automatizem os processos
de migrao, atualizao ou integrao de dados, evitando falhas humanas na construo
dos cdigos e rotinas responsveis por essa operao. O objetivo deste trabalho manter a
integridade dos dados, minimizando custos e consequncias, uma vez que, geralmente, os
dados de um sistema legado o patrimnio mais importante de uma organizao, onde o fluxo
intenso de transaes controlado por meio digital. Por meio de levantamentos bibliogrficos,
so comparadas trs metodologias de migrao de dados e identificadas suas principais
caractersticas, apontando-se qual destas metodologias apresenta uma melhor abordagem
para uma migrao de dados mais segura.
Palavras-chave: Migrao de dados. Sistemas legados. ERP. ETL. Buttery Methodology.
Chicken Little.
This paper identifies data manipulation methodologies, described by many researchers and
practitioners in several countries, performing a survey of the general methodologies for migration,
upgrade or integration of legacy systems, specifically, Integrated Management Systems, known as ERP
(Enterprise Resource Planning). The work supports a direction on methodologies for building tools to
automate the processes of migration, upgrade or data integration, avoiding human errors in building
codes and routines responsible for this operation. The aim of this work is to maintain data integrity by
minimizing costs and consequences, since, generally, data from a legacy system are the most important
assets of an organization, where the heavy flow of transactions are controlled by digital means.
Through literature surveys, three methods of data migration are compared and its main
characteristics identified, indicating which of these methodologies provides a better approach to
a safer data migration.
Keywords: Data Migration. Legacy Systems. ERP. ETL. Butterfly Methodology. Chicken Little.
1 INTRODUO
Em muitas indstrias, comrcios,
instituies pblicas ou privadas existem
sistemas implantados e funcionais que trazem
consigo todos os dados histricos e atuais
daquela instituio, tornando-a altamente

dependente dos dados contidos em seus


sistemas, os quais so comumente chamados
de Sistemas Legados. Esses sistemas de
informao so normalmente responsveis
por controlar e integrar todos os processos
de uma instituio, conhecidos normalmente
como ERP (Enterprise Resource Planning)

1 Mestrando pela Faculdade de Engenharia Mecnica Universidade de Taubat - Professor da rea de Informtica do Instituto Federal de
Educao Cincia e Tecnologia de So Paulo Campus Guarulhos. E-mail: <cleber@ifsp.edu.br>.
2 Doutor em Engenharia Eletrnica e Computao pelo Instituto Tecnolgico de Aeronutica - Professor da Universidade de Taubat e da UNESP.
E-mail: <abud@feg.unesp.br>.
Data de entrega dos originais redao em 23/11/2011 e aceito para diagramao em 25/10/2012.
Sinergia, So Paulo, v. 13, n. 3, p. 183-191, set./dez. 2012

183

METODOLOGIAS E ESTRATGIAS DE MIGRAO DE DADOS

Cleber Silva de Oliveira/Marcio Abud Marcelino

ou Sistemas Integrados de Gesto. Passaram a


ser largamente utilizados no incio da
dcada de noventa e so cada vez mais
indispensveis dentro das instituies.
Tendo, como caracterstica fundamental, o
fato de serem constitudos por pacotes, com
mdulos integrados e interligados, em tempo
real, que utilizam um nico banco de dados,
os sistemas ERP objetivam dar suporte
maioria das operaes de uma empresa
(VALENTE, 2004).
Alguns dos princpios mais importantes
na qualidade de software, segundo a
NBR ISO/IEC9126-1 (ABNT, 2003), a
manuteno, que representa a capacidade de
um software ou sistema ser modificado para
adio de melhorias ou funcionalidades, para
correo de erros e para portabilidade, que
a capacidade do software ser transferido
de ambiente ou tecnologia; porm muitos
sistemas no foram desenvolvidos
observando esses critrios e, por falta de
documentao, por descontinuidade de suas
tecnologias ou por modificao de hardware,
estes sistemas precisam ser atualizados ou
reescritos. Nesse momento as instituies se
deparam com uma das tarefas mais crticas
da tecnologia da informao, que realizar
grandes alteraes e garantir a integridade
de informaes to vitais. Deve-se ento
realizar um planejamento adequado, mesmo
que no haja a troca de sistema, mas que
a mudana estrutural seja suficiente para
caracterizar uma nova verso, como um
sistema distinto do anterior, e assim construir
uma metodologia de atualizao da estrutura
e/ou migrao de dados.
Dentro desse contexto, identificam-se
metodologias por meio de uma reviso
da literatura, em que estas podero apoiar
novas metodologias. Infelizmente em geral
observa-se que a maioria dos sistemas
est h algum tempo em uso e no foi
influenciada pelo desenvolvimento gil de
software (agile software development) ou
simplesmente conhecida pelos profissionais
da tecnologia de informao como mtodo
gil, formalizado a partir de 2001, e que, pela
ausncia de padres, os sistemas apresentam
uma caracterstica de construo artesanal,
184

baseando-se nas experincias empricas


dos programadores, ou nas expectativas
autoritrias dos usurios, somando-se a
uma documentao deficitria que dificulta
ainda mais a continuidade e escalabilidade
do sistema. Assim, destaca-se a importncia
dos requisitos de sistema legado como ponto
de partida para a compreenso do sistema
atual e um devido levantamento de novos
requisitos. Entretanto, a impreciso ou
ausncia de documentao adequada, bem
como a indisponibilidade das pessoas que
desenvolveram o sistema, podem impedir
a recuperao dos requisitos originais do
sistema e dificultar a tarefa de elicitao dos
novos requisitos (ESPINDOLA et al. 2004).
Um processo fundamental durante
a implantao o reaproveitamento dos
dados de outros sistemas que normalmente
esto sendo substitudos pelo ERP. Para a
realizao desta tarefa, torna-se necessrio
desenvolver uma ferramenta especfica para
acesso ao sistema anterior, e isto envolve
analisar as estruturas deste sistema e criar
um novo projeto somente para esta migrao,
demandando tempo e todos os custos
relacionados ao desenvolvimento (RIBEIRO
& OLIVEIRA, 2010).
Para garantir a integridade de dados
no basta apenas destruir a estrutura anterior
e reconstruir a nova estrutura, mas devem-se
criar algoritmos de migrao de dados do
banco da verso anterior para a nova verso,
possibilitando um tratamento adequado dos
dados legados e, em consequncia, causando
o mnimo de impacto ou prejuzo ao
sistema atual.
A seguir apresenta-se a definio de
sistemas legados, sistemas de gerenciamento
de banco de dados, os tipos de dados e a
equivalncia que estes dados podem possuir
entre os sistemas gerenciadores de banco
de dados. Depois se definem as regras gerais
para padronizao de cdigo para gerar
um cdigo de portvel a qualquer SGBD.
Em seguida apresenta-se a descrio de trs
metodologias de migrao de dados: Extract,
Transform and Loader (ETL), Butterfly
e Cold-Turkey e a anlise da comparao
entre elas.
Sinergia, So Paulo, v. 13, n. 3, p. 183-191, set./dez. 2012

METODOLOGIAS E ESTRATGIAS DE MIGRAO DE DADOS

Cleber Silva de Oliveira/Marcio Abud Marcelino

2 SISTEMAS LEGADOS
Os sistemas legados so programas
computacionais que mantm dados vitais
sobre uma instituio. Quando a instituio
passa a depender destes dados para ao de
seu processo administrativo ou operacional,
passa a existir a necessidade da manuteno de
continuidade do sistema. Segundo ALLIEVI
(2007), qualquer sistema em produo
considerado legado.
Os sistemas legados so uma fonte
de preocupao para qualquer organizao.
Porm consenso, por parte das organizaes,
a importncia do conhecimento do modelo de
dados como fator de qualidade dos sistemas
de informao, ressaltando a sua contribuio
para a manuteno, o desenvolvimento
ou melhoria do software legado, e/ou a
migrao dos sistemas para outras plataformas
tecnolgicas (ALMEDA et al., 1998).
comum se encontrar sistemas que
esto em uso em instituies financeiras,
desde a dcada de 70 e, em indstrias, desde
a dcada de 90, que sofreram pequenas
adaptaes e ajustes peridicos que no so
suficientes para a evoluo da demanda,
exigindo a troca ou o desenvolvimento de
outro sistema.
2.1 Sistema de gerenciamento de banco
de dados
O Sistema de Gerenciamento de Banco
de Dados (SGBD) um programa responsvel
pelo gerenciamento de recursos de alocao,
controle e manipulao de objetos como
as entidades e seus atributos, contadores,
chamadas de eventos, vises definidas por
consultas e tipos de dados. O SGBD mantm
uma estrutura paralela aos objetos criados,
que guardam todas as informaes estruturais
deste objeto, e estas informaes estruturais
so chamadas de metadados. Eles so teis
no processo de migrao ou atualizao de
um modelo de dados por conterem os dados
sobre a preciso de um campo, o tipo de dado,
se ele pode ser nulo ou no, alm de muitas
outras (DATE, 1998).
Sinergia, So Paulo, v. 13, n. 3, p. 183-191, set./dez. 2012

Com o surgimento em 1974 na IBM


da SQL (Structured Query Language) ou
linguagem de consulta estruturada, os SGBDs
comearam a utiliz-la para tarefas de criao
de objetos e estrutura, manipulao de dados
e regras de acesso. A linguagem passou a ser
padronizada pela American National Standards
Institute (ANSI) no ano de 1986 e pela
International Organization for Standardization
(ISO) em 1987. Aps a padronizao
existiram cinco revises como padres
oficiais ANSI/ISO da SQL nos anos de 1989,
1992, 1999, 2003 e 2008. Atualmente todos
os SGBDs utilizam a linguagem SQL em suas
atividades. Porm cada um especializa estas
atividades com objetos prprios e linguagens
adicionais para gerenciamento dos dados.
Uma grande vantagem da Linguagem SQL
que toda a informao passada de forma
textual e cada SGBD ajusta os dados conforme
padres indicados pelos programadores,
o que simplificou o acesso a dados que
anteriormente deveria ser realizado pelo
aplicativo final de forma binria. Como o
mdulo de gerenciamento reside no prprio
SGBD, existe uma grande facilidade na
adequao do modelo para plataformas
diferentes. A similaridade da linguagem SQL
tambm facilita a implementao do modelo
nos diversos bancos de dados existentes
(HUTH, 2002).
Hoje os SGBDs mais difundidos no
mercado so os softwares proprietrios Oracle,
IBM DB2, Microsoft SQL-Server, e os livres
so o MySQL, o PostgreSQL e o SQL-Lite,
e este ltimo em crescente utilizao por ser
mais adequado a dispositivos mveis.
2.2 Tipos de dados dos SGBDs
Os dados de cada campo de uma
tabela podem variar em tamanho (preciso
binria) ou formato. Embora existam padres
de tipos de dados no SQL ANSI/ISO, os
desenvolvedores de cada SGBD criaram
diversos objetos de apoio ao gerenciamento de
estrutura e dados, o que inevitavelmente gera
novos formatos independentes em cada um,
como um campo com tipo numrico podendo
185

METODOLOGIAS E ESTRATGIAS DE MIGRAO DE DADOS

Cleber Silva de Oliveira/Marcio Abud Marcelino

ter a classificao NUMERIC, NUMBER,


FLOAT, INT, INTEGER, INT8, INT16 etc.
E o programador da estrutura ter que, por
meio do manual do fabricante, identificar
qual o tipo de dado mais adequado a sua
necessidade conforme a tecnologia utilizada.
Como resultado da anlise de todos os tipos
de dados dos SGBDs, a tabela 1 foi construda
objetivando a comparao entre eles.

um cdigo de SQL ANSI e converte


para o seu formato na preciso devida.
Foi verificado que alguns SGBDs no
possuem os mesmos tipos de dados que
outros, necessitando de adaptaes como
a do tipo DATE para VARCHAR(10), para
caber a mesma informao DD/MM/
YYYY, ou TIME para VARCHAR(5)
ou VARCHAR(7) como HH:MM:SS.

Tabela 1 Equivalncia de tipos de dados


TIPOS DE
DADOS

SQL ANSI

DB2

ORACLE

POSTGRESQL

MYSQL

SQLLITE

TINYINT,
SMALLINT,
MEDIUMINT,
INT,
BIGINT

INTEGER

INTEIRO

SMALLINT,
INTEGER

SMALLINT,
INTEGER

NUMBER

SMALLINT,
INTEGER,
BIGINT,

REAL

REAL, DOUBLE,
PRECISION,
FLOAT

DECIMAL

BINARY_FLOAT

REAL,
DOUBLE,
PRECISION

FLOAT,
DOUBLE,
REAL

REAL,
FLOAT,
DOUBLE

DECIMAL

DECIMAL

DECIMAL

BINARY_DOUBLE,
NUMBER

DECIMAL
NUMERIC

DECIMAL

REAL,
FLOAT,
DOUBLE

TEXTO

CHARACTER,
CHARACTER,
VARYING,
NATIONAL,
CHARACTER,
NATIONAL,
CHARACTER,
VARYING

VARCHAR,
CHARACTER

CHAR,
VARCHAR2,
CLOB,
NCLOB,
NVARCHAR2,
NCHAR

CHAR,
VARCHAR,
TEXT

CHAR,
BINARY,
VARCHAR,
VARBINARY,
TEXT,
TINYTEXT,
MEDIUMTEXT,
LONGTEXT

TEXT
CHAR,
CLOB

BINRIO

BIT,
BIT, VARYING

TIMESTAMP

BLOB,
RAW,
LONGRAW,
BFILE

BYTEA

TINYBLOB,
BLOB,
MEDIUMBLOB,
LONGBLOB

NO EXISTE

DATA/
TEMPO

DATE,
TIME,
TIMESTAMP

BLOB

DATE,
TIMESTAMP

DATE,
TIME,
TIMESTAMP

DATETIME,
DATE,
TIMESTAMP,
YEAR

NO EXISTE

LGICO

NO EXISTE

NO EXISTE

NO EXISTE

BOOLEAN

BOOLEAN,
BOOL

NO EXISTE

Cada SGBD possui caractersticas


quanto preciso, que est relacionada
ao nmero de bits utilizados para cada
tipo de dado, porm a maioria aceita
186

Tambm os dados do tipo BOOLEAN


poderiam ser exportados como CHAR(1),
com a informao F ou V.

Sinergia, So Paulo, v. 13, n. 3, p. 183-191, set./dez. 2012

METODOLOGIAS E ESTRATGIAS DE MIGRAO DE DADOS

Cleber Silva de Oliveira/Marcio Abud Marcelino

2.3 Padronizao de Cdigos


Como o foco de uma migrao
plenamente ligado portabilidade, torna-se
necessrio privilegiar padres e formatos
extremamente genricos, e o uso dos
mtodos e ferramentas padronizadas evitam
problemas externos aos recursos utilizados
na implementao da soluo, no s para
migrao de dados, mas tambm para
qualquer outra finalidade. Os SGBDs utilizam
internamente a linguagem SQL para definio
de objetos, manipulao de dados e controle
do acesso a dados, e apesar de no existir uma
padronizao de fato, o SQL-92 o padro
mais utilizado. As pequenas diferenas de
sintaxe no comprometem a portabilidade
de aplicaes desenvolvidas (HUTH, 2002).
Para que qualquer interpretador ou qualquer
compilador leia os arquivos de comandos
sem problemas, recomend-se salv-los
em um arquivo texto com formato UTF8
(8 bit Unicode Transformation Format).
Este formato tem caracter universal do
padro Unicode e compatvel com o ASCII.
Em qualquer projeto de portabilidade
altamente recomendvel no variar estes
formatos, utilizando-se esses recursos
universais nas tecnologias existentes,
pois so comuns e evitam que ocorram
erros de sintaxe por interpretao de
caracteres indevidos.
3 METODOLOGIAS DE MIGRAO
DE DADOS
As migraes de dados podem ter
dois perfis: a transposio de arquivos ou
objetos digitais para uma nova tecnologia
entre servidor, e a reutilizao dos dados
ou atualizao de uma estrutura de um
sistema legado em seu SGBD. A migrao
da informao, de uma parte essencial de
um sistema para outro, e de transferncia
de dados, de um ambiente para outro,
esto estreitamente inter-relacionadas com
os processos, podendo ser divididas em
migrao de dados e migrao de sistemas
(BROY, 2005).
Sinergia, So Paulo, v. 13, n. 3, p. 183-191, set./dez. 2012

A seguir so apresentadas as principais


tcnicas de migrao levantadas na
bibliografia, suas definies e comparaes
entre elas:
3.1 Processos de migrao de dados:
Extract, Transform e Loader
O ETL refere-se sigla de Extrao,
Transformao e Carga (Extract, Transform
and Loader), uma metodologia que se
divide em trs estgios: um para leitura e
identificao dos dados, um para manipulao,
converso ou ajuste, e outro para preparao
para insero na tecnologia de destino.
No processo de ETL torna-se necessria
a extrao e carga dos dados, caracterizando-se
como opcionais a transformao e o
tratamento de erros dos dados de origem.
Esta metodologia de no aplicar a validao
ou tratamento dos dados a serem carregados
deve ser adotada somente se os dados de
origem estiverem em conformidade com o
escopo do processo de carga (RIBEIRO &
OLIVEIRA, 2010).
Pode-se identificar que esta metodologia
adequada a um ambiente homogneo,
pois servir como um processo prtico de
transposio de dados, quando a estrutura
de destino for semelhante ou compatvel
com a de origem, criando-se somente uma
camada para tratamento simples dos dados
e j disponibilizando uma sada prpria para
carregamento direto dos dados no sistema
de destino.
3.1.1

Extrao

Cada sistema oferece uma origem de


dados, podendo ser: arquivos texto, como
padres de retorno e remessa, planilhas,
arquivos xml etc. Porm o mais importante
no o formato em que o dado ser
exportado, visto que isso pode ser ajustado
por qualquer profissional de programao,
o importante mesmo documentar
muito bem como estes dados esto
organizados no sistema de origem/legado.
187

METODOLOGIAS E ESTRATGIAS DE MIGRAO DE DADOS

Cleber Silva de Oliveira/Marcio Abud Marcelino

Para isso deve-se realizar um levantamento


minucioso sobre todo o modelo da
aplicao e a regra utilizada, para
que a implementao das operaes
de transformao explore todos os
recursos existentes.
3.1.2 Transformao
A qualidade da documentao
existente tanto do modelo de dados do
sistema de origem quanto de destino far
toda diferena na construo de uma
engrenagem de transformao dos dados,
tambm conhecidas como middleware ou
software intermedirio. Dentro da definio
da metodologia, no cabe detalhar regras,
tecnologias e funes necessrias para
esta transformao , e como um nmero
muito significativo de sistemas no possui
padres de desenvolvimento, cria-se uma
variao de possibilidades que necessitam
ser avaliadas caso a caso, quanto a sua
estrutura e regras para transformao.
Cabe engrenagem de transformao
dos dados possuir tabelas temporrias que
controlem um mapa de equivalncia de
quais colunas ou conjunto de colunas do
modelo de dados no sistema de origem
so respectivas s colunas ou conjunto de
colunas do modelo de dados no sistema
de destino, bem como as converses e
reindexaes dos relacionamentos que estas
tero que sofrer.

Para exemplificar, via cdigo SQL,


a criao do mdulo temporrio que vai
servir de engrenagem de migrao necessita
inicialmente de uma anlise dos dois modelos
de dados, e a exportao dos dados analisada
a seguir:
Origem: a tabela ORIGEM.tbl_pessoa
agrega tanto os dados de todos os telefones
quanto os de endereo.
Destino: a tabela DESTINO.tbl_pessoa
no precisa de todos os dados de endereo,
pois j possui uma tabela tbl_cep que se
relacionar com tbl_pessoa. J os dados
telefnicos teriam que possuir quatro
colunas e ser separados em quatro linhas
que referenciassem cada uma delas ao
identificador da pessoa.

3.1.3 Carga

Uma vez executas as rotinas de
transformao, se faz necessria a sada em
linguagem SQL, atravs de comandos de insero,
em que indicado o uso para SQL ANSI99
em UTF8. Quando o sistema de destino for um
nico SGBD, dever simplesmente executar um
arquivo texto contendo os comandos. Aps esta
tarefa sugere-se, mesmo que nenhum erro tenha
sido indicado durante as operaes de migrao,
uma validao por amostragem dos dados.
3.2 A metodologia Chicken Little

Esta estratgia de migrao consiste
de onze pequenos passos, que so realizadas

Figura 1 - Base de dados de origem, temporria e de destino

188

Sinergia, So Paulo, v. 13, n. 3, p. 183-191, set./dez. 2012

METODOLOGIAS E ESTRATGIAS DE MIGRAO DE DADOS

Cleber Silva de Oliveira/Marcio Abud Marcelino

de forma iterativa, em que a migrao se


torna realizvel, uma vez que a migrao real
dividida em partes menores (princpio da
Divide and Conquer). Chicken Little ainda
significa uma reformulao completa do
sistema. (BROY, 2005)
Essas onze partes citadas por Broy so:
1
2
3
4
5
6
7
8
9
10
11

Analisar o sistema legado;


Decompor a estrutura do sistema legado;
Projetar a interface destino;
Projetar a aplicao destino;
Projetar a base de dados destino;
Instalar o ambiente destino;
Criar e instalar os gateways necessrios;
Migrar as bases legadas;
Migrar as aplicaes legadas;
Migrar as interfaces legadas;
Mudar para o sistema destino.

Os gateways so programas
intermedirios responsveis pela
transformao da informao, porm,
diferentemente das engrenagens descritas no
ETL, eles trabalham de forma passiva quanto
s requisies e chamadas feitas pelo sistema
de origem ou destino, o que permite que o
administrador do projeto de migrao decida
por uma das estratgias a seguir:
Forward ou Database First: em que os
dados so direcionados do sistema legado
para uma nova estrutura de modelo de
dados. O forward, ou adiante, denota que
o sistema de origem envia os dados para
o destino.
Reverse ou Database Last: o reverso
realmente a forma contrria ao forward,
em que o sistema de destino busca a
informao intermediada pelo gateway
no sistema de origem.

3.3 Cold Turkey


Broy o nico autor que apresenta uma
metodologia classificada por ele como Cold
Turkey que , como a Chicken Little, uma
reescrita completa do sistema legado utilizando
Sinergia, So Paulo, v. 13, n. 3, p. 183-191, set./dez. 2012

mtodos de desenvolvimento moderno, em


que o sistema legado totalmente parado
para evitar riscos, e comea a implantar o
novo sistema utilizando uma estratgia Big
Bang, ou seja, tudo de uma vez. O maior
problema que este mtodo sugere parar o
sistema para comear a migrao e, conforme
os profissionais vo encontrando erros, sero
gerados os cdigos adaptativos no sistema de
destino, e isso cria um problema geral, uma
vez que estas alteraes so inseridas em
partes no sistema legado que j haviam sido
concludas. O autor destaca que este mtodo
est sujeito a erros e dispendioso.
identificado que normalmente isso
ocorre em sistemas que possuem um volume
muito grande de informaes, inviabilizando
um planejamento adequado ou suficiente pela
ausncia de documentao, e que no se pode
previamente criar nenhuma regra de migrao
e nem prever seus detalhes, tendo-se que
utilizar o cdigo fonte como documentao
dos processos e requisitos, o que aumenta de
forma imensurvel o tempo da migrao.
A Cold Turkey no parece ser uma
metodologia e sim uma atividade aventureira
de desbravamento de cdigos, e s seria
realizada quando nenhuma outra fosse
possvel, pela explorao linha a linha de
seu cdigo fonte para extrair as regras da
organizao de relacionamentos e tentar
salvar o que fosse possvel dos dados legados
da instituio.
3.4 Buttery
Esta uma metodologia em que,
diferentemente da Chicken Little ou Cold
Turkey, o sistema legado permanece em
operao, enquanto que, em um ambiente de
teste, o novo sistema pode ser desenvolvido
e testado previamente a uma migrao,
sem afetar o funcionamento ou mesmo
causar transtornos. Sua abordagem muito
semelhante ETL. Inclusive em literaturas
que abordam a ETL no se observa a
abordagem da Butterfly, ou vice-versa.
Para uso desta abordagem, necessita-se de um
bom conhecimento sobre o modelo de dados e
189

METODOLOGIAS E ESTRATGIAS DE MIGRAO DE DADOS

Cleber Silva de Oliveira/Marcio Abud Marcelino

suas regras, tanto no sistema de origem quanto


no sistema de destino dos dados, utilizando-se
uma engrenagem ou motor de migrao de
dados que na Butterfly os autores classificam
como Chrysaliser.

mdulo de migrao de dados entre modelos


de dados homogneos, para migrao
dos dados nas atualizaes de verso dos
mdulos de um mesmo sistema. Portanto,
a metodologia ETL pode ser especializada

Figura 2 - Butterfly

O Christalizer um sistema
intermedirio e tem a funo de converter o
modelo do banco transpondo a informao e
realizando os ajustes necessrios, para que os
dados presentes no SGBD LEGADO sejam
transferidos para o SGBD DESTINO com
a reduo de prejuzo. Como as inseres
no banco de destino necessitam de regras
customizadas, existe a necessidade de o
administrador de banco de dados incluir estas
regras manualmente no Christalizer, pois
necessrio completar os campos de destino,
que no podem ser nulos ou sero completados
por consultas de relacionamentos entre duas
ou mais tabelas com dados j existentes
no destino.
Dentre as descritas, pode-se observar
que as metodologias ETL e Butterfly possuem
os mesmos princpios e recomendaes.
A ETL possui uma abordagem mais moderna;
a Chicken Little mais burocrtica e divide
o processo de migrao em diversas partes,
o que pode at ser interessante quando se
tem uma equipe de trabalho em que existe
a possibilidade de distribuir melhor as
funcionalidades de controle de cada camada;
e que a Cold Turkey aplicada no por
recomendao, mas por necessidade quando
no possvel uma anlise detalhada antes
de comear a migrao. Como resultado
desta anlise, especificamente as diretrizes
apontadas pela metodologia ETL serviram
de base para o desenvolvimento de um
190

em contexto de migrao, integrao ou


atualizao de SGBDs, uma vez que suas
generalidades so abertas a qualquer contexto
de migrao de dados para qualquer objeto no
universo computacional.
5 CONCLUSO
Este trabalho realizou um levantamento
por meio de reviso da literatura, sobre
as metodologias utilizadas para migrao
de dados, e pode-se observar que essas
metodologias, embora genricas, servem
de referncia para outros trabalhos sobre
integrao de sistemas e atualizao de
estrutura e migrao de dados em sistemas
legados, e que cada sistema apresenta
particularidades em seu desenvolvimento, que
necessita de uma anlise caso a caso. Durante o
perodo de levantamento da bibliografia,
foram identificados detalhes especficos em
documentao de sistemas proprietrios, que
no se baseiam em nenhuma metodologia
especificada e no puderam ser citadas neste
trabalho, j que suas licenas s preveem que
devero ser utilizadas junto de processos de
migrao de suas ferramentas. Uma vez que
as especificaes dos sistemas geralmente no
utilizaram padres de desenvolvimento para
uma automao independente de migrao de
dados e a interao entre o administrador de
banco de dados e a ferramenta intermediria
Sinergia, So Paulo, v. 13, n. 3, p. 183-191, set./dez. 2012

METODOLOGIAS E ESTRATGIAS DE MIGRAO DE DADOS

Cleber Silva de Oliveira/Marcio Abud Marcelino

de controle desta migrao muito requerida,


o profissional praticamente indicar todas as
relaes entre as tabelas de origem e destino
e quais os comandos necessrios para incluir
dados de relacionamentos na base de destino.
Para melhorar o Christalizer como ferramenta
de apoio ao administrador de banco de dados,
deixa-se como proposta para trabalhos
futuros a realizao de estudos para aplicao
de conceitos de classificao automtica
de dados, de websemntica e arqutipos,
gerando uma comparao de dados para
uma descrio semntica processvel pelo
Christalizer, em que, por meio destas tcnicas,
possam diminuir o nmero de intervenes
na transposio dos dados dos modelos
estruturais de bancos diferentes.
REFERNCIAS
ABNT. NBR ISO/IEC9126-1: Engenharia
de software: qualidade de produto (Parte 1:
Modelo de qualidade). 2003.
ALLIEVI, O. Refl exes sobre manuteno de
sistemas legados, 2007. Acesso em: 27 out.
2011. Disponvel em: <http://imasters.com.
br/artigo/5919/desenvolvimento/reflexoes_
sobre_manutencao_de_sistemas_legados>.
ALMEIDA, A. B et al. Levantamento de
modelos de dados em sistemas legados.
Sistema de Informao n.9. 1998. Acesso em:
27 out. 2011. <http://193.137.8.31/index.php/
revista/index>.

Sinergia, So Paulo, v. 13, n. 3, p. 183-191, set./dez. 2012

BROY, M. Legacy Migrationsstrategien.


Hauptseminar Management von
Softwaresystemen. TU Mnchen. Fakultt
fr Informatik. Lehrstuhl IV: Software &
Systems Engineering. Mnchen, 2005.
DATE, C. J. Introduo a sistema de banco de
dados. Rio de Janeiro: Campus. 8. ed. 2004.
ESPINDOLA, R. et al. Uma anlise crtica
dos desafios para engenharia de requisitos em
manuteno de software. Proc. VII Workshop
on Requirements Engineering, 2004, Tandil,
Argentina, 2004.
HUTH, G. Um modelo para o gerenciamento
de bancos de dados SQL atravs de
Stored Procedures. Florianpolis, 2002.
Dissertao (Mestrado em Cincias da
Computao). Universidade Federal de
Santa Catarina, UFSC.
RIBEIRO, A. L.; OLIVEIRA, E. C. Processos
de implantao e migrao de dados com
utilizao de ETL para um ERP comercial.
Universidade Luterana do Brasil. Curso de
Sistemas de Informao. Campus Canoas.
Canoas, RS. 2010.
VALENTE, N. T. Z. Implementao de ERP
em pequenas e mdias empresas: estudo de
caso em empresa do setor da construo civil.
So Paulo, 2004. (Mestrado em Controladoria
e Contabilidade: Contabilidade), Faculdade
de Economia, Administrao e Contabilidade,
Universidade de So Paulo, USP.

191

Você também pode gostar