Você está na página 1de 48

Fundamentos da inteligncia de negcios: Gesto da informao e de banco de dados.

Giovanna Bezerra
Joo Gabriel Calheiro
Lucas Lima da Costa
Slvia Lima Correia

Anlise de caso: The Globe


and Mail

Importncia da gesto de dados;


Como resultado: Aumento na eficcia
do processo;

Banco de dados para


gesto de dados.

Um banco de dados um conjunto de


arquivos relacionados entre si com
registros sobre pessoas, lugares ou
coisas;
Exemplo: Lista Telefnica;

Entidades e Atributos

Entidade: Categoria que representa


uma pessoas, lugar ou coisa sobre a
qual se mantm informaes;
Atributos: Caractersticas de cada
entidade;

Banco de Dados Relacional

o tipo de banco de dados mais


comum atualmente;
Organizam os dados em tabelas
bidimensionais (Relaes) com colunas
e linhas;
Cada tabela contm dados referentes a
uma entidade e seus atributos;

Banco de Dados Relacional

Banco de Dados Relacional

Diagrama
entidade/relacionamento. (DER)

Usado para esclarecer relaes entre


as tabelas de um banco de dados
relacional;
Diz de que duas maneiras se
relacionam;
As tabelas podem ter relacionamentos
de um para um, para muitos ou muitos
para muitos;

Diagrama
entidade/relacionamento. (DER)

Diagrama
entidade/relacionamento. (DER)

Sistemas de gesto de bancos


de dados
Um sistema de gesto de banco de
dados (Database Managent System
DBMS) um software especfico usado
para criar, armazenar, organizar, e
acessar dados a partir de um banco de
dados.

Exemplos de DBMSs

Viso lgica X Viso


fsica

Viso lgica: como os dados seriam


vistos por usurios ou especialistas da
empresa.

Viso fsica: como os dados esto


realmente organizados e estruturados
nos meios de armazenamento fsico,
como um disco rgido.

Diferentes vises lgicas

Operaes de um DBMS
relacional
No banco de dados relacional, trs
operaes bsicas so utilizadas para
desenvolver conjuntos de dados teis:
select, project e join.
Select cria um subconjunto formado de
todos os registros da tabela que
obedecem a critrios estabelecidos.

Join combina tabelas relacionais para


fornecer ao usurio mais informaes do
que aquelas disposio nas tabelas
individuais.
Project cria um subconjunto composto cria
um subconjunto composto por colunas de
uma tabela que permite ao usurio criar
novas tabelas contendo apenas informaes
requisitadas.

Recursos dos sistemas


gesto de banco de dados

de

Um
DBMS
possui
recursos
e
ferramentas para organizar, administrar e
acessar os dados do banco. Os mais
importantes
so
o
recurso
de
definio,
o dicionrio,
e a
linguagem de manipulao de dados.

Definio de dados especificar a


estrutura do contedo do banco de
dados. Esse recurso pode ser usado parar
criar tabelas de bancos de dados e para
definir as caractersticas dos campos em
cada tabela.
Dicionrio de dados um arquivo,
manual ou automatizado, que armazena
as definies dos elementos de dados e
suas caractersticas.

Aparncia do dicionrio de dados


do Access

Consultas e Relatrios
A linguagem de manipulao de
dados usada para acrescentar, alterar,
apagar e recuperar os dados do banco. A
linguagem de manipulao de dados
mais usada atualmente a linguagem
estrutural de dados ou SQL (Structured
Query Language).

Exemplo de uma consulta SQL

Uma consulta no Access

Bancos de dados no relacionais


e bancos de dados em nuvem
Os sistemas de banco de dados no
relacional (NoSQL):
So projetados para gerenciar grandes
conjuntos
de
dados
em
vrios
computadores distribudos.
So teis para acelerar consultas simples
a grandes volumes de dados estruturados,
no estruturados e semiestruturados
(imagens de registros de sade e
atestados de bito).

Banco de dados em nuvem


Vantagens:
Os servios de banco de dados em
nuvem tm um atrativo especial para
empresas iniciantes ou de pequeno ou
mdio porte que procuram recursos de
banco de dados com preos mais
acessveis.
A plataforma de hardware e software
compartilhada reduz o nmero de
servidores, DBMS e dispositivos de
armazenamentos necessrios.

O desafio do Big Data

O que ? Conjuntos de dados com volumes to


imensos a ponto de estarem alm da capacidade
que um DBMS tpico tem para capturar, armazenar
e analisar;
Qual o tamanho? No se refere a qualquer
quantidade especfica. Normalmente, se trata de
dados na faixa dos petabytes e exabytes;
Exemplos - Facebook tem mais de 250 bilhes de
fotos no site, e a cada dia adiciona 350 milhes de
novas fotos; o Twitter gera mais de 8 terabytes de
dados por dia;
A
informao
digital
est
crescendo
exponencialmente, de 1,8 zetabytes em 2011 para
um montante esperado de 35 zetabytes em 2020.

Por que as empresas esto


interessadas no big data?
Contm mais padres e
anomalias interessantes

Potencial de
fornecer novas
percepes

Comportamento
do cliente

Padres
climticos

Atividade do
mercado
financeiro

Data Warehouse
Banco de dados que armazena dados
correntes e histricos de potencial interesse;

Originam-se de vrios lugares como


sistemas de vendas, de contas de clientes e
de manufatura;

Oferece uma gama de ferramentas para


consulta, ferramentas analticas e recursos
para relatrios grifcos.

Data Mart

Subconjunto de um data warehouse, no qual uma


poro resumida ou altamente focalizada dos dados
colocada em um banco separado;

Exemplo: Livaria Barnes & Noble costumava manter


uma srie de data marts - um para os dados dos
caixas em loja de varejo, outro para vendas das
livrarias em faculdades e outro para as vendas online.

Hadoop

O que ? - Estrutura de software de cdigo


aberto que permite o processamento paralelo
distribudo de grandes quantidades de dados;

Como funciona? - Fragmenta um problema de


big data em subproblemas e os distribui entre
os milhares de ns de processamento
computacional e depois combina o resultado
em um conjunto de dados menor e mais fcil
de analisar.

Como composto? composto por vrios


servios bsicos: o Sistema de arquivo distribudo
Hadoop (Hadoop Distrubuted file System - HDFS)
para armazenamento de dados e o MapReduce
para processamento de alto desempenho de dados
em paralelo;

Com qual finalidade as empresas usam o Hadoop?


Analisar grandes volumes de dados e tambm
como rea de armazenamento intermedirio para
dados no estruturados e semiestruturados antes
deles serem armazenados em um data warehouse.

Exemplos

Facebook: armazena seus dados em seu


cluster slido Hadoop (aproximadamente
100 petabytes);
Yahooo! utiliza o Hadoop para monitorar o
comportamento
do
usurio
visando
modificar sua pgina inicial de acordo
com os interesses dele;
Empresas como IBM, Hewlett-Packard,
Oracle e Microsoft tm suas prprias
distribuies de software Hadoop.

Computao em memria

No que se baseia? Na memria


principal de um computador (RAM)
para o armazenamento de dados.
Como funciona? Os usurios acessam
dados armazenados na memria
principal do sitema.
Exemplo: McLaren Racing. Cada carro
gera cerca de um gigabyte de dados
brutos durante uma corrida.

Plataformas Analticas
Projetadas especificamente para processamento
de consulta e anlise;
Exemplos: IBM Netezza e Oracle Big Data
Appliance.

Ferramentas Analticas
Dados ficam disponveis para anlises posteriores
usando o software para consulta e relatrios de
bancos de dados;
Exemplos: Processamento analtico on-line (Olap)
e o data mining (minerao de dados)

Processamento analtico online (Olap)


Como funciona? Permite a anlise
multidimensional de dados, de forma que os
usurios vejam os mesmos dados de
diferentes maneiras.

Uma empresa pode usar um banco de


dados multidimensional especializado ou
uma
ferramenta
que
crie
vises
multidimensionais.

Data mining (minerao de


dados)

Fornece
percepes
dos
dados
corporativos que no podem ser obtidas
com o Olap;

Os tipos de informao obtidos com o


data
mining
incluem
associaes,
sequncias, classificaes, aglomeraes
e prognsticos.

Associaes so ocorrncias ligadas a


um nico evento;
Sequncia os eventos esto ligados ao
longo do tempo;
Classificao - reconhece modelos que
descrevem o grupo ao qual o item
pertence;
Aglomerao funciona de maneira
semelhante classificao quando ainda
no foram definidos grupos;
Prognsticos partem de uma srie de
valores existentes para prever quais sero
os outros valores.

Text mining (minerao de


texto)

Mensagens de e-mails, memorandos,


transcries de chamadas central de
clientes, respostas para pesquisas so
exemplos de arquivo de texto onde o text
mining pode ser usado;

So capazes de extrair elementos-chave


de conjuntos big data no estruturados,
descobrir padres e relacionamentos e
resumir informaes.

Web mining (minerao na


Web)

A Web outra fonte rica em big data no


estruturado
para
revelar
padres,
tendncias
e
percepes
sobre
o
comportamento do consumidor;
As empresas podem recorrer minerao
na Web para ajudar-lhes a compreender o
comportamento do consumidor, avaliar a
eficincia de um site em particular e etc;
Exemplos: Google Trends e Insight for
Search.

Gesto dos recursos de


dados

Para que os dados sejam precisos,


confiveis e disponveis quando
necessrio, preciso de polticas e
procedimentos especiais sobre gesto
de dados.

Estabelecendo uma poltica


de informao

necessrio estabelecer regras sobre


como os dados sero organizados e
armazenados, e quem ter permisso
para v-los e alter-los.
Uma poltica de informao especifica
as regras para compartilhar, adquirir,
padronizar e classificar a informao.

Assegurando a qualidade
de dados

Um banco de dados e uma poltica de


informao j so meio caminho
andado para que a empresa tenha a
informao que precisa.

Quais seriam as consequncias se um


produto estivesse com o preo errado
no banco de dados?

Qualidade de dados

Para no haver conflitos e


posteriormente, dores de cabea,
durante o projeto do banco de dados,
as informaes como cliente, produtos
ou pedidos devem ser nomeados e
definidos de maneira consistente para
todas as reas que usaro o banco de
dados.

Auditoria de qualidade de
dados

Consiste num levantamento da


preciso e do nvel de integridade dos
dados em um SI.
Data cleansing (limpeza e
padronizao) a correo de
informaes incorretas, incompletas ou
redundantes.

Por que importante garantir


a qualidade de dados?

Dados inexatos, incompletos ou


inconsistentes criam srios problemas
financeiros e operacionais para as
empresas pois pode conduzir a
decises erradas.
Padres vlidos para toda a empresa
Auditorias de qualidade
Sofware de limpeza e padronizao
Bancos que minimizam a
inconsistncia

Você também pode gostar