Você está na página 1de 2

Cap 5.

Fundamentos da Inteligência de negócios


Seção Interativa: A Receita Federal descobre fraudes nos impostos com data warehouse
A Receita Federal norte-americana é a agência responsável por coletar os impostos e definir as
leis a eles relacionadas. Desde sua criação, na década de 1860, a Receita cresceu em ordens de
magnitude equivalentes à da população dos Estados Unidos. Em 2008, a agência processou
aproximadamente 140 milhões de declarações de impostos individuais que totalizaram uma receita de
aproximadamente 2 trilhões de dólares. Não é surpresa alguma que uma falha em seus sistemas de
informação poderia resultar em volumosa perda ao governo federal norte-americano. Felizmente para
a Receita Federal – e, talvez, infelizmente para alguns inescrupulosos – a agência uniu-se à Sybase
para implementar um data warehouse, conhecido como data warehouse de compliance (CDW –
compliance data warehouse), que melhorou a eficiência e aumentou drasticamente o montante de
dinheiro coletado pela Receita de seus contribuintes delinquentes.
A Receita precisava de um data warehouse para organizar suas informações acumuladas, com
informações pessoais de contribuintes e suas declarações de rendimento. Os dados estavam
armazenados em sistemas legados projetados para o processamento eficiente de formulários de
declarações e organizados em muitos formatos diferentes, inclusive em banco de dados hierárquicos de
mainframes, bancos de dados relacionais em Oracle e arquivos sequenciais que não estavam em formato
de banco de dados. Era quase impossível consultar e analisar os dados armazenados em banco de dados
hierárquicos e nos arquivos unidimensionais e não podiam ser facilmente combinados com os dados
relacionais.
O CDW permite consultas altamente flexíveis em um dos maiores bancos de dados do mundo,
com sete anos de informações de declarações de impostos individuais e empresariais. A cada ano, quatro
terabytes de dados são inseridos no sistema. O banco de dados do data warehouse é relacional, com
bilhões de linhas e mais de 200 colunas, todas com complexas ligações a agendas importantes e outros
anexos. Quando chegam, os dados são reorganizados na estrutura relacional com base em definições e
formatos padrão. Os pesquisadores da Receita agora conseguem pesquisar e analisar centenas de
milhões, ou mesmo bilhões, de registros de uma vez utilizando fonte centralizada de dados precisos e
consistentes, em vez de terem de agrupar informações de fontes inconsistentes.

A implantação do CDW aprimorou muitíssimo a capacidade de a Receita gerenciar e utilizar os


dados coletados. Como resultado, o data warehouse permitiu que a agência recuperasse muitos bilhões
de dólares em declarações de rendimento que ficavam perdidas no antigo sistema. Em 2006, por
exemplo, a Receita coletou 59,2 bilhões de dólares em receita adicional através de 1,4 milhão de
auditorias de contribuintes investigados por declarações que não relatavam todos os rendimentos
recebidos.
A capacidade do CDW aumentou de três terabytes desde sua criação, no final da década de
1990, para 150 terabytes de dados atualmente. Ele permite que os usuários consultem os dados
através de uma série de ferramentas. Esperava-se que o recurso mais importante do data warehouse
fosse suficientemente grande para acomodar múltiplos terabytes de dados, mas também acessível de
modo a permitir consultas a seus dados a partir de diferentes ferramentas. Os componentes
selecionados pela Receita permitiram que o CDW funcionasse exatamente dessa forma.
A implantação do CDW não se deu sem desafios. Um dos maiores deles foi descobrir que a
conversão dos dados legados para o novo sistema não era um processo uniforme. Como as leis fiscais
mudaram muitas vezes ao longo dos anos, a estrutura dos dados da Receita não era consistente de ano
para ano; o que tornou a integração dos dados um processo complicado. Além disso, o montante de
dados que o CDW estava disposto a gerenciar era muito maior do que qualquer outro que a Receita já
houvesse gerenciado. Convencer a realizar uma atualização tão abrangente quanto a implantação de um
data warehouse também não era fácil, já que as agências governamentais costumam ser avessas aos
riscos e resistem a mudanças desse tipo. Os data warehouse também tendem a demandar esforço
extensivo e dinheiro para se manterem atualizados.
Apesar dos obstáculos, a implantação foi um grande sucesso. A receita relata que alcançou
retorno de 200 para 1 na taxa de investimento pouco depois da implantação do CDW, que custou
somente 2 milhões de dólares para ser concluído. A maior parte das economias do CDW veio da

Que o Senhor seja eternamente louvado 1


velocidade e da facilidade com as quais o sistema detectava erros nas declarações de rendimento.
Utilizando o data warehouse, os analistas conseguem determinar padrões em grupos de pessoas
propensas a mentir em suas declarações, tais como casais divorciados em que ambos declaram os filhos
em seus formulários do mesmo ano, pessoas que abusam das deduções ou dos paraísos fiscais para
pequenas empresas, ou recém-graduados sobrecarregados com empréstimos estudantis que podem
acabar pagando menos impostos. Houve redução de seis a oito meses para somente algumas horas do
tempo necessário à identificação de erros nas reclamações e para a análise de dados.
Mais recentemente, a Receita atualizou a maneira de transportar as informações para o data
warehouse central. Nos estágios iniciais, de desenvolvimento, a agência transportava os dados utilizando
fitas magnéticas que comportavam somente dois gigabytes cada. Além disso, os dispositivos de
armazenamento são criptografados, garantindo que os dados fiquem seguros durante o transporte;
anteriormente as fitas não RAM seguras e deixavam as informações dos contribuintes desprotegidas
durante o trânsito. Estima-se que essa modificação represente uma economia de milhões de dólares
para a agência ao longo do período de cinco anos.
O número de auditorias realizadas pela Receita sugere que o CDW está funcionando bem,
resultando em mais auditorias dos fraudadores e menos auditorias dos contribuintes honestos. As
chances de sofrer auditoria aumentaram em uma em 140 em 2006 para uma em 377 em 2009. Em 2006,
os contribuintes que receberam 1 milhão de dólares ou mais anualmente tiveram uma chance em 11
de ser auditados. Em 2003, as chances eram de uma em 20 para a mesma faixa de rendimentos.
Contudo, a Receita conseguiu reduzir o número de auditorias realizadas nos dados de contribuintes
inocentes e, portanto, o crescente número de auditorias afetou primeiramente aqueles que estão em
dívida.

Perguntas sobre o estudo de caso:


1. Por que era tão difícil para a Receita Federal analisar os dados coletados dos
contribuintes?
2. Quais desafios a Receita Federal encontrou durante a implementação de seu data warehouse de
compliance? Quais questões gerenciais, organizacionais e tecnológicas precisaram ser consideradas?
3. De que maneira o CDW aprimorou a tomada de decisão e as operações na Receita Federal?
Existem benefícios aos contribuintes?
4. Você acha que os data warehouse poderiam ser úteis em outras áreas do setor Federal? Quais?
Explique.
5. Faça uma analogia desse case com a empresa em que você trabalha. Essa tecnologia pode trazer
contribuições para ela? Quais?
6. Quais argumentos você usaria para justificar o uso (ou não) dessa tecnologia em sua
empresa?

Fonte: Laudon, Kenneth. Sistemas de Informação gerenciais /Kenneth Laudon, Jane Laudon; tradução
Luciana do Amaral Teixeira; revisão técnica João Belmiro Nascimento. – 9. ed. – São Paulo: Pearson
Prentice Hall, 2010.

Que o Senhor seja eternamente louvado 2

Você também pode gostar