Escolar Documentos
Profissional Documentos
Cultura Documentos
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
Que Deus os abençoe, bom proveito e mãos à obra agora em nossa aula!
72
Profa Patrícia Lima Quintão
83
26
30
Dado x Informação x Conhecimento
s5
ria
Importante!!
Fa
O que é um Dado? É um registro de alguma entidade. Um nome é um
ta
dado, uma foto é um dado, 134 é um dado, 5 é um dado, etc.
os
C
Já a informação é um dado depois de processado, é uma contextualização de
da
dia 5 não haverá aula!!”. Nesse caso, o 5 passou a ter sentido (ou passou a ter
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
organização no ambiente global.
72
83
Vale destacar que informações rápidas e úteis exigem dados precisos. Esses
26
dados devem ser gerados de forma adequada e armazenados em um formato
30
de fácil acesso. E, como qualquer recurso básico, o ambiente de dados deve ser
s5
gerenciado com cuidado. O gerenciamento de dados é uma disciplina que
ria
foca na geração, no armazenamento e na recuperação adequada dos dados.
Fa
Diante do papel crucial executado pelos dados, você não deve estar surpreso
ta
que o gerenciamento de dados seja uma atividade central para qualquer negó-
os
cio, ou organização (Rob e Coronel, 2011). C
da
Em geral, o gerenciamento eficiente de dados exige a utilização de um banco de
n
dados computacional.
so
ob
R
53
significado implícito.
Fa
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
armário no hospital que tem as fichas de prontuários de todos os pacientes
72
pode ser considerado um banco de dados, mesmo estando os dados em papéis.
83
Ali você tem dados pessoais dos pacientes, dados de laudos de exames
26
realizados com esses pacientes e dados de acompanhamento dos pacientes
30
como temperatura e pressão medidas diariamente durante a internação. E um
s5
banco de dados pode atender a usuários diferentes com visões
ria
diferentes. Por exemplo, cada médico pode olhar os dados que o ajudem a
Fa
tomar uma decisão de tratamento para o problema referente à sua área de
ta
atuação.
os
Lembrete!
C
da
n
Dados
so
ob
São fatos em sua forma primária, os quais podem ser armazenados, como, por
R
exemplo: os dados das peças em estoque. Assim é possível obter uma lista de
83
peças em falta.
26
30
Banco de Dados
s5
Caiu em prova!
(ESAF/ATI/SUSEP/ 2010) Um Banco de Dados é um:
a) conjunto de objetos da realidade sobre os quais se deseja manter
informações.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Comentários
83
Se na letra a) no lugar de conjunto de objetos da realidade, nesta resposta
26
estivesse escrito conjunto ou coleção de dados que representam objetos ou
30
aspectos do mundo real ou do universo de discurso, essa letra estaria correta.
s5
ria
Na letra b) o erro está ao considerar que banco de dados é um conjunto de
Fa
operações sobre dados. Pois conjunto de operações tem o contexto de código
ta
que transforma os dados e isso não é considerado banco de dados.
os
C
As letras c) e d) cometem o erro de tratar banco de dados como um software.
da
Isso gera um pouco de confusão nos alunos que estão aprendendo essa
n
(e) Esta é uma definição de banco de dados dada por (HEUSER, 2001), que
72
tem por objetivo atender a uma proposta específica, geralmente, dada por um
26
Gabarito: letra E.
ria
Fa
ta
O SGBD pode dar suporte a muitos tipos de bancos de dados, que podem ser
classificados de acordo com o número de usuários, localização(ões), e o tipo e
a extensão do uso esperado.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
como banco de dados empresarial.
72
83
26
ii)Quanto à localização de dados (Centralizado/Distribuído)
30
A localização também pode ser utilizada para classificar o banco de
s5
ria
dados.
Fa
• Por exemplo, um banco que dê suporte a dados localizados em um único local
ta
é chamado de banco de dados centralizado.
os
• C
Já um que dê suporte a dados distribuídos por vários locais diferentes é
da
chamado de banco de dados distribuído.
n
so
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
• Dados não estruturados são aqueles que existem em seu estado original
(bruto), ou seja, no formato em que foram coletados. Portanto, estão em
um formato que não possibilita o processamento que produz informações.
• Dados estruturados são o resultado da obtenção de dados não estru-
turados e de sua formatação (estruturação) visando facilitar o
armazenamento, a utilização e a geração de informações. A estrutura
(formato) é aplicada com base no tipo de processamento que se deseja
executar nos dados. Alguns dados podem não estar prontos (não
estruturados) para determinados tipos de processamento, mas podem
estar prontos (estruturados) para outros tipos. Por exemplo, o valor de
53
dados 37890 pode se referir a um CEP, um valor de vendas ou um código
72
de produto. Se representar um CEP ou um código de produto e for
83
armazenado como texto, não será possível executar cálculos matemáticos
26
com ele. Por outro lado, se esse valor representar uma transação de
30
vendas, será necessário formatá-lo como numérico.
s5
ria
Para ilustrar o conceito de estrutura, imagine uma pilha de faturas
Fa
impressas em papel. Caso deseje simplesmente armazená-las como
ta
imagens para recuperação e exibição futura, é possível escaneá-las e salvá-
os
las em formato gráfico. Por outro lado, se desejar obter informações como
C
vendas mensais totais e médias, esse armazenamento gráfico não seria útil.
da
•
83
alguma informação.
s5
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Server
83
DB2 x** x x x x x x x
26
da
30
IBM
s5
MySQ X x x x x x x x*
ria
L
Fa
Oracle x** x x x x x x X
ta
(SGB
os
DR) C
da
*Dá suporte apenas a funções de XML. Os dados em XML são armazenados em
n
(SGBD).
ta
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
aplicações de uso não crítico);
72
• Base (Faz parte do pacote BrOffice.Org, também mais voltado para uso
83
doméstico);
26
30
• SGBDs comerciais e proprietários para uso corporativo, como o SQL
s5
Server e o Oracle, utilizados em projetos mais volumosos que
ria
envolvem bancos de dados corporativos (de grandes empresas). Outros
Fa
SGBDs podem ser destacados, como: SyBase, Adabas, DB2, etc.
ta
os
Muitas vezes, até mesmo profissionais de TI referem-se aos SGBDs como
C
banco de dados. Até certo ponto, o banco de dados se assemelha a um arquivo
da
Lembrete!
30
dados armazenados.
Fa
ta
os
C
da
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
dado em locais distintos. Temos a redundância controlada e a não
72
controlada. Como podemos evitar: centralizando os dados através do
83
banco. Pode ser utilizada em situações em que haja necessidade de
26
melhoria no desempenho e/ou economia de recursos da transmissão.
30
s5
• Manter a integridade. Garante que os dados armazenados no BD estão
ria
corretos. Para manter a integridade, lança-se mão da implementação de
Fa
regras de negócio através de restrições de integridade (automáticas ou
ta
implementadas através de triggers (gatilhos) ou stored procedures
os
(procedimentos armazenados no banco)). C
da
• Melhoria na INTEGRAÇÃO dos dados.
n
so
banco de dados.
30
s5
•
autorização e segurança, o qual é utilizado pelo DBA para criar contas e
on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
O termo “redundância de dados” que se está usando aqui consiste na gravação
83
de um mesmo dado em dois locais (ou mais) distintos. Isso, geralmente, não é
26
recomendando dentro do contexto de banco de dados, já que podemos
30
atualizar o dado em um local e não atualizar nos demais!! Por exemplo,
s5
poderia gravar o endereço de um cliente em dois locais distintos, mas só
ria
atualizo em um desses locais. Basta gravar uma vez, correto? Quando for feita
Fa
uma pesquisa para o endereço do cliente, não saberia qual o endereço correto.
ta
os
A inconsistência em Bancos de Dados significa ter dados incompletos, que não
C
refletem a realidade do minimundo. Por exemplo, se uma Nota Fiscal tem o
da
5.000,00, esse dado está inconsistente. Por fim, estruturas de dados são
so
ob
•
s
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
localizado, então todos os dados estarão em uma máquina (ou em um
72
único disco) ou distribuído, onde os dados estarão distribuídos por
83
diversas máquinas (ou diversos discos);
26
* ambiente: ambiente homogêneo é o ambiente composto por um único
30
SGBD e um ambiente heterogêneo é o ambiente composto por diferentes
s5
ria
SGBDs.
Fa
ta
os
Interação com o SGBD
C
Para um grande banco de dados, existe um variado número de pessoas
da
exclusivas e complementares.
ob
dentre outros.
os
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
n
so
ob
R
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
n
so
ob
R
53
72
83
26
30
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
acesso e monitorar suas operações.
72
83
Pessoas. Esse componente inclui todos os usuários do sistema de
26
banco de dados. Com base na função de trabalho principal, é possível
30
identificar cinco tipos de usuários em um sistema: administradores de
s5
sistemas, administradores de bancos de dados, projetistas de bancos de
ria
dados, analistas e programadores de sistemas, e usuários finais.
Fa
ta
Procedimentos. São as instruções e regras que orientam o projeto e a
os
utilização do sistema de banco de dados. Os procedimentos são um
componente fundamental, embora às vezes esquecido, do sistema.
C
da
relação aos clientes. Também são utilizados para garantir que haja um
R
padrões precisos.
Por exemplo, compare um sistema local de locação de filmes com um
sistema nacional de reclamações de seguros.
• O sistema de locação de filmes pode ser gerenciado por duas pessoas,
o hardware utilizado provavelmente é um único microcomputador, os
procedimentos são simples e o volume de dados tende a ser baixo.
• O sistema nacional de reclamações de seguros possui pelo menos um
administrador de sistemas, vários DBAs em tempo integral e muitos
projetistas e programadores; o hardware inclui diversos servidores em
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
Embora o sistema de banco de dados apresente vantagens
72
consideráveis em relação a abordagens de gerenciamento anteriores,
83
também trazem desvantagens significativas. Por exemplo (Rob e
26
Coronel, 2011):
30
s5
- Aumento de custos. Os sistemas de banco de dados exigem hardware e
ria
software sofisticados e pessoal altamente treinado. O custo de
Fa
manutenção do hardware, software e pessoal necessários para operar e
ta
gerenciar um sistema de banco de dados pode ser substancial. Os custos
os
de treinamento, licenciamento e atendimento às regulamentações C
da
costumam ser negligenciados quando da implementação desses sistemas.
n
significativos.
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
hardware. Não são apenas as atualizações que geram custo, mas também
o treinamento dos usuários e administradores para que utilizem e
gerenciem adequadamente os novos recursos.
Níveis de Abstração
Considerando que o nível de conhecimento dos usuários de bancos de dados é
muito variável, oscilando entre aqueles que conhecem muito e outros que são
leigos, os Sistemas de Bancos de Dados devem prover mecanismos que
administrem essa complexidade, simplificando as interações dos usuários com
53
o sistema.
72
O grande objetivo de um sistema de banco de dados é proporcionar aos
83
usuários uma visão abstrata dos dados. Isto é, o sistema omite certos
26
detalhes de como os dados são armazenados e mantidos. No entanto,
30
para que o sistema possa ser utilizado, os dados devem ser buscados de forma
s5
ria
eficiente. Este conceito tem direcionado o projeto de estrutura de dados
Fa
complexas para a representação de dados em um banco de dados. Uma vez
que muitos dos usuários de banco de dados são leigos ou não treinados para
ta
os
computação, a complexidade está escondida desses usuários através de
C
diversos níveis de abstração que simplificam a interação do usuário com o
da
sistema.
n
so
Podemos dizer que a visão lógica é a visão dos dados “como realmente são”
s
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
Figura. Níveis de abstração de dados
ria
Fa
Fonte: Silberschatz, Korth e Sudarshan, 2006. Adaptação
ta
os
Independência de Dados
C
da
n
lógica!
Fa
ta
os
C
de desempenho).
• Independência de dados LÓGICA: modifica o esquema lógico sem que,
com isso, qualquer programa aplicativo precise ser reescrito. As
modificações no nível conceitual são necessárias quando a estrutura lógica
do banco de dados é alterada (por exemplo, a adição de contas de bolsas
de mercado num sistema bancário).
Atenção!
Normalmente modificações no nível físico visam a melhoria de desempenho,
como a criação de índices!
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
n
so
Dicionário de Dados
Fa
para leitura ou consulta, ou seja, é uma base de dados, propriamente dita, que
on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Modelos de Bancos de Dados
83
Os modelos de bancos de dados definem a forma como os dados encontram-se
26
organizados internamente. A seguir, tem-se uma breve descrição sobre os
30
principais modelos.
s5
ria
1. Modelo Hierárquico ou de árvore
Fa
É aquele no qual os dados estão organizados de cima para baixo ou estrutura
ta
os
de árvore invertida. Por exemplo, os dados sobre um projeto para uma
empresa podem seguir este tipo de modelo. Este método de ligação é C
da
semelhante à relação entre pais e filhos: a criança não existirá sem os pais. É
n
o que mais bem se adapta a situações nas quais as relações lógicas entre os
so
2. Modelo em Rede
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Figura. Modelo em Rede
83
3. Modelo Relacional
26
30
Os modelos relacionais se tornaram os mais populares. A finalidade global
s5
deste modelo é descrever o dado usando um formato tabular padrão (todos os
ria
elementos são localizados em tabelas bidimensionais). As tabelas organizam os
Fa
dados em linhas e colunas, simplificando o acesso e a manipulação dos dados.
ta
Uma vez colocados os dados no Banco de Dados relacional, pode-se fazer
os
C
perguntas e manipular dados utilizando as operações da álgebra relacional. As
da
manipulações básicas de dados incluem a sua seleção, projeção e
n
agrupamento.
so
ob
R
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Modelagem de Dados
53
72
83
26
30
s5
ria
Fa
Figura. Etapas da Modelagem de Dados em linhas gerais
ta
Vamos estudar a seguir cada uma das fases relacionadas à modelagem de
os
dados: C
da
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
A figura seguinte faz uma descrição simplificada do processo de projeto de um
72
banco de dados.
83
26
30
s5
ria
Fa
ta
os
C
da
n
so
ob
R
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
R
Figura. Projeto de um BD
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Resumindo!!
Modelos Descrevem a estrutura de um Banco de Dados de uma forma
Conceituais mais próxima da percepção dos usuários. Independente de
aspectos de implementação. Conceitos: entidades, atributos,
relacionamentos. Exemplos:
• Modelo Entidade-relacionamento (ER).
• Modelo Funcional.
Modelo Modelo de dados que representa a estrutura de dados de um
Lógico banco de dados conforme vista pelo usuário do SGBD.
53
Dependente do tipo particular de SGBD que está se utilizando.
72
83
Exemplos:
26
30
• Modelo Relacional.
s5
• Modelo Hierárquico.
ria
Fa
Modelo É uma representação gráfica do detalhamento físico das
ta
Físico estruturas dos dados que o banco de dados irá armazenar.
os
Este modelo é dependente do SGBD em que será implementado.
C
da
** Modelo Funcional
83
26
(DER).
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
Entidades
72
O objeto básico tratado pelo modelo ER é a entidade, que pode ser definida
83
como um objeto do mundo real, concreto ou abstrato e que possui
26
existência independente.
30
s5
ria
Fa
ta
os
C
da
n
so
Exemplos:
26
30
s5
ria
Atributos
Os atributos são propriedades particulares que descrevem uma entidade, ou
mesmo características de um relacionamento.
Quanto transpostos para o modelo físico são chamados de colunas ou
campos.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
Figura. Atributos de Entidade
26
30
No exemplo aqui ilustrado, o domínio do atributo Título pode ser o conjunto de
s5
todos os textos string de um certo tamanho. O domínio do atributo tipoFilme
ria
pode ser o conjunto de strings {drama, comédia, romance...}.
Fa
O domínio determina que valores um atributo pode receber. Existe um valor
ta
os
especial em Bancos de Dados, conhecido como NULL (nulo), que é a ausência
de qualquer valor naquele atributo. Importante C
da
n
so
• Simples e Compostos
53
Atributos que não são divisíveis (não Podem ser divididos em partes
26
independentes.
Fa
ta
• Monovalorados e Multivalorados
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
• Armazenados e Derivados
26
Atributos Armazenados Atributos Derivados
30
s5
Atributos que realmente pretendemos Podem ser gerados ou calculados a
ria
guardar no Banco de Dados. partir de outros atributos.
Fa
Por exemplo, o atributo Data de Caso tivéssemos no nosso modelo um
ta
os
Nascimento de uma entidade atributo armazenado Data de
Funcionário é armazenado. C
Nascimento, na entidade Funcionário
da
nascimento.
R
53
72
Existem alguns atributos cujos valores são distintos para cada elemento do
26
univocamente um elemento.
Fa
Como exemplo, o atributo CPF pode ser uma chave para a entidade
ta
Relacionamentos
s
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Ex.:
53
entidades e se deseja representar apenas um.
72
Quando ocorrer mais de um relacionamento entre o par de entidades
83
•
26
• Para evitar ambiguidade.
30
Quando houver auto-relacionamento.
s5
•
ria
Fa
Várias são as possibilidades de relacionamentos. Uma entidade pode participar
ta
os
de relacionamentos com quaisquer outras entidades do modelo, inclusive com
ela mesma. Nesse caso, diz-se que há um auto-relacionamento do conjuntoC
da
de entidades, como ilustrado no relacionamento ”chefiam” da figura seguinte.
n
so
ob
R
53
72
83
26
30
s5
ria
Fa
cerveja.
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
descritivos.
83
26
30
s5
ria
Fa
ta
No exemplo dado, o atributo salário não pertence nem à entidade filme e nem
os
à entidade estrela isoladamente, mas pertence ao relacionamento entre aC
da
estrela e o filme. Uma estrela em um filme diferente pode ter outro salário e
uma outra estrela do mesmo filme pode ter salário diferente.
n
so
Cardimalidade
30
s5
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
Note que a cardinalidade vai anotada do outro lado do relacionamento a que se
26
refere!
30
s5
A cardinalidade, então, representa o número máximo de elementos de
ria
uma entidade que se relacionam com elementos da outra entidade.
Fa
Assim, é definida como:
ta
os
- 1:1 (Um para um)
- 1:N (Um para muitos)
C
da
n
que 1).
72
83
26
30
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Fa
ta
os
Obs.: Chave estrangeira na direção muitos.
C
da
n
entidades em A.
R
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
• Parcialidade mínima: para um departamento ser criado, devem existir
83
pelo menos 10 empregados alocados!!
26
30
A leitura é feita da seguinte forma: você pega a primeira entidade, esquece a
s5
cardinalidade que está do lado dela e segue pelo relacionamento, lê a outra
ria
cardinalidade e chega até a próxima entidade.
Fa
Ou seja, a leitura é assim: UM(A) + ENTIDADE ORIGEM + RELACIONAMENTO
ta
os
+ CARDINALIDADE + ENTIDADE DESTINO
C
da
Veja o exemplo acima de relacionamento de ALOCAÇÃO de EMPREGADO no
DEPARTAMENTO:
n
so
ob
máximo 1) DEPARTAMENTO.
ta
os
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
TIPO
ATRIBUTO
ENTIDADE
ATRIBUTO
TIPO ENTIDADE CHAVE
FRACA
ATRIBUTO
MULTI
TIPO VALORADO
RELACIONAMENTO
ATRIBUTO
COMPOSTO
53
TIPO
72
RELACIONAMENTO
83
IDENTIFICADOR ATRIBUTO
26
DERIVADO
30
s5
1 N
ria
E1 R E2 E1 R E2
Fa
Taxa de Cardinalidade 1:N Participação Parcial de E1 em R,
ta
para E1:E2 em R Participação Total de E2 em R
os
C
da
(min, max)
R E1
n
so
Participação de E1 em R
R
53
72
**Abordagem Relacional
s5
ria
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Fa
Tuplas
ta
os
Os atributos e seus valores descrevem as instâncias de uma entidade,
formando o que chamamos de tuplas ou registros. C
da
n
so
ob
R
53
72
83
26
30
s5
ria
Figura. Tuplas
Fa
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
diferença entre usar as CódigoEmp ou CIC como chave primária (listada a
72
seguir).
83
26
30
s5
ria
Fa
ta
os
C
da
n
so
ob
R
Dependência Funcional
53
72
uma chave primária, então todos os atributos são, por definição, dependentes
30
de X, pois não podem existir dois registros com o mesmo valor para X.
s5
ria
Fa
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Normalização
• O processo de normalização pode ser visto como o processo no qual são
53
eliminados esquemas de relações (tabelas) não satisfatórios,
72
decompondo-os, através da separação de seus atributos em
83
esquemas de relações menos complexas mas que satisfaçam as
26
propriedades desejadas.
30
s5
• O processo de normalização, proposto inicialmente por Codd, conduz um
ria
esquema de relação através de uma bateria de testes para certificar se o
Fa
mesmo está na 1a, 2a e 3a Formas Normais. Estas três Formas
ta
Normais são baseadas em dependências funcionais dos atributos do
os
esquema de relação. C
da
1ª Forma Normal
ob
R
2ª Forma Normal
83
26
chave primária.
ria
Fa
3ª Forma Normal
ta
da chave primária.
da
s on
ob
• 1a Forma Normal
R
A 1a Forma Normal prega que todos os atributos de uma tabela devem ser
atômicos (indivisíveis), ou seja, não são permitidos atributos
multivalorados, atributos compostos ou atributos multivalorados
compostos. Leve em consideração o esquema a seguir:
• CLIENTE
1. Código
2. { Telefone }
3. Endereço: ( Rua, Número, Cidade )
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Cliente_Telefone Código_Cliente Telefone_Cliente
83
26
30
2a Forma Normal
s5
•
ria
A 2a Forma Normal prega o conceito da dependência funcional total. Uma
Fa
dependência funcional X Y é total se removemos um atributo A qualquer do
ta
componente X e desta forma, a dependência funcional deixa de existir.
os
A dependência funcional X Y é uma dependência funcional parcial se C
da
existir um atributo A qualquer do componente X que pode ser removido e a
n
deixa de existir.
26
Se uma tabela não está na 2a Forma Normal a mesma pode ser normalizada
ta
gerando outras tabelas cujos atributos que não façam parte da chave primária
os
2a Forma Normal.
da
s on
ob
• 3a Forma Normal
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Aspecto de Integridade
Restrição de Chave
• Uma relação deve ter pelo menos uma chave.
• Definição de chave: uma chave é um atributo ou conjunto de atributos
cujo valor ou combinação de valores deve ser distinto em qualquer
instância da relação.
• A existência de pelo menos uma chave é uma condição obrigatória,
tendo em vista que uma relação é definida como um conjunto de tuplas
53
72
e, todas as tuplas devem ter um valor distinto.
83
26
30
Restrição de Entidade
s5
• Especifica que nenhum valor de chave primária pode ser nulo.
ria
Fa
• Uma tupla em uma tabela que se refere a uma outra relação deve
ta
referenciar uma tupla existente naquela relação.
os
C
da
•
53
(procedimentos armazenados).
83
• Ex: o salário de uma atriz não pode ser maior que 1/3 do orçamento
26
total do filme.
30
s5
ria
Fa
Observações:
ta
STORED PROCEDURES
os
TRIGGERS
(gatilhos).
Uma trigger é uma sub-rotina, parecida com uma stored
procedure, que tem como característica ser executada
automaticamente a partir de alguma ação realizada no banco de
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
um conjunto de regras de negócio, que regem a manipulação do BD, de
72
forma a não ferir nenhuma destas regras estabelecidas.
83
26
30
Integridade Física
s5
ria
• Conjunto de procedimentos operacionais que garantem a integridade do
Fa
BD, mesmo em situações de falha de algum componente do ambiente
ta
onde o BD é manipulado.
os
• Exemplo: C
da
- Restrições de integridade
da
on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
integridade referencial.
72
83
Isolamento A execução de uma transação não pode ser afetada por outras
26
sendo executadas concorrentemente, para isso suas
30
atualizações não devem ser efetivadas até que se tenha uma
s5
confirmação (COMMIT).
ria
Fa
Durabilidade Os efeitos de uma transação confirmada não podem ser
desfeitos, a menos que outra transação modifique tais dados,
ta
os
sendo que se deve prevenir falhas durante a efetivação da
transação. C
da
n
so
ob
Uma vez que o esquema esteja compilado e o banco de dados esteja populado
s5
Manipulação de Dados).
ta
os
manipulação de dados!
s on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
• Chave Primária (Primary Key): uma ou mais colunas com valores que
72
são únicos dentro da tabela e por isso podem ser usados para identificar as
83
linhas dessa tabela.
26
30
s5
Regras Básicas para Escrever Comandos SQL
ria
Fa
• Os comandos podem ser escritos em mais de uma linha;
ta
• Cláusulas diferentes são colocadas usualmente em linhas diferentes;
os
• Podem ser usadas tabulações; C
da
Alguns exemplos:
ob
R
* from cliente;
72
from cliente;
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
• Criação de Tabelas
A criação do banco de dados deve começar com a criação das tabelas nas
53
quais os dados serão introduzidos. Para criar uma tabela em SQL, usa-se o
72
comando CREATE TABLE. O comando DDL para criar uma tabela deve conter
83
26
os nomes das colunas, os tipos dos seus dados e os tamanhos dos dados a
30
serem introduzidos.
s5
É a seguinte a sintaxe desse comando:
ria
Fa
ta
CREATE TABLE nome_da_tabela
os
(Nome_da_coluna1 tipo_do_dado (tamanho_do_dado) C
da
...
ob
R
•
R
• Criação de um Índice
Para criar um índice em uma tabela, o comando SQL é:
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Você pode criar tantos índices quantos desejar em qualquer tabela. Você pode
ter um índice para cada coluna da tabela, assim como um índice para uma
combinação de colunas. Quantos índices e de que tipos você criará para uma
determinada tabela dependerá do tipo de consultas que você espera que sejam
dirigidas ao banco de dados e do tamanho deste. Excesso de índices pode ser
53
tão prejudicial quanto sua falta!
72
83
26
• Alteração de Tabelas
30
s5
Conforme ocorram novas situações ou novos dados sejam armazenados no
ria
banco de dados, a definição original de uma tabela pode tornar-se insuficiente.
Fa
A SQL permite-nos realizar diversas alterações em uma tabela, como:
ta
os
• incluir novas colunas em uma tabela; C
da
• excluir colunas existentes em uma tabela;
n
so
nova_largura;
Exemplos:
ALTER TABLE Telefone
DROP COLUMN Tipo;
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
Nota: para diminuir tamanho a coluna precisa estar vazia.
26
30
s5
ria
Fa
• Exclusão de Tabelas
ta
os
Para excluir uma tabela de um banco de dados, use o comando DROP TABLE
seguido do nome da tabela: C
da
n
so
Quando uma tabela é excluída por um comando SQL, como acima, todas as
83
Exemplo:
ria
• Exclusão de Índices
da
Para EXCLUIR um índice, use o comando SQL DROP INDEX seguido do nome
on
do índice:
s
ob
R
Se você tem índices definidos com o mesmo nome em tabelas diferentes, deve
usar a cláusula ON, como no exemplo acima, para indicar o índice que quer
eliminar.
Se há apenas um índice com este nome, então você não precisa especificar o
nome da tabela. O comando DROP abaixo será suficiente:
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
• Após a carga dos dados nas tabelas criadas pelos comandos DDL, os
72
comandos de manipulação de dados tornam possível sua manipulação,
83
incluindo inserções, atualizações, exclusões e consultas (com a utilização
26
do comando SELECT da SQL).
30
s5
• A DML visa à manipulação de dados (incluir, alterar, excluir e consultar)
ria
por meio do usuário.
Fa
• Principais comandos:
ta
os
o SELECT: seleção de registros;
C
o INSERT: inserção de registros;
da
n
• Inserção
83
26
dados já existente.
Fa
INSERT
on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Exemplos:
53
72
• Atualização
83
26
O comando UPDATE é usado para alterar valores em linhas já existentes. Sua
30
forma geral é:
s5
ria
Fa
UPDATE nome_da_tabela
ta
SET coluna1=novo_valor,
os
Coluna2=novo_valor, C
da
...
n
so
colunaN=novo_valor,
ob
R
WHERE condição;
53
72
83
Você pode atualizar várias colunas em cada linha com um único comando
os
C
UPDATE listando as várias colunas após a cláusula SET, conforme visto acima.
da
Exemplo:
UPDATE PESSOA
SET idade = 20
WHERE nome = ‘Maria’;
• Exclusão
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
O comando DELETE é usado para remover linhas de uma tabela. Sua forma
geral é:
DELETE
FROM nome_da_tabela
WHERE condição;
Você não pode excluir parcialmente uma linha, portanto não precisa especificar
os nomes das colunas no comando DELETE.
53
72
A cláusula WHERE determina que linhas serão eliminadas. Ela pode ser
83
complexa e incluir várias condições, conectores e/ou subconsultas.
26
Se você deseja excluir todas as linhas de uma tabela, omita a cláusula WHERE,
30
s5
como abaixo listado:
ria
Fa
DELETE
ta
os
FROM nome_da_tabela; C
da
n
FROM nome_da_tabela
s on
WHERE condição;
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Nota!
53
• SELECT e a cláusula FROM são necessárias em todas as consultas
72
SQL. Devem aparecer antes de qualquer outra cláusula na
83
consulta.
26
30
• O resultado de uma consulta SQL é SEMPRE uma tabela.
s5
ria
Fa
Estrutura de uma Consulta Simples
ta
SELECT coluna1, coluna2, ..., colunaN
os
FROM nome_da_tabela C
da
Expressões tabulares são cláusulas que são usadas para produzir tabelas. As
on
FROM
selecionada(s) as linhas.
WHERE Especifica a condição ou condições que as linhas selecionadas
devem satisfazer.
GROUP BY Separa as linhas selecionadas nos grupos especificados.
HAVING Estabelece as condições que cada grupo exibido deve
satisfazer.
ORDER BY Especifica a ordem em que as linhas selecionadas serão
exibidas (individualmente ou em grupo).
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Exemplos:
SELECT * From PESSOA;
53
72
WHERE sexo = ‘M’ or sexo = ‘F’;
83
26
30
s5
SELECT CPF, NOME, SEXO, IDADE
ria
Fa
FROM PESSOA
ta
WHERE IDADE > ANY (10,20,30);
os
ou C
da
FROM PESSOA
83
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Criação de Visões
Fa
Uma visão (view) pode ser considerada como uma maneira alternativa de
ta
observação de dados de uma ou mais entidades (tabelas). Pode ser
os
considerada também como uma tabela virtual ou uma consulta armazenada. C
da
•
53
Uma vez que a view é gerada, o seu conjunto de dados é armazenado em uma
ria
Deve-se ressaltar que uma view não existe fisicamente, é uma tabela virtual.
ta
normalmente.
da
Para criar uma visão, você seleciona apenas as colunas da tabela (ou tabelas)
on
Para definir uma visão, você deve dar um nome para a visão e então
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Exemplo:
CREATE VIEW Empregados_Sede
AS SELECT (Nome, Endereco, Sexo, Data-nasc)
FROM EMPREGADO
53
72
1.Construir o Modelo Conceitual.
83
26
Modelo de alto nível, independente da implementação.
30
Etapa de levantamento de dados.
s5
ria
Uso de uma técnica de modelagem de dados.
Fa
Abstração do ambiente de hardware/software.
ta
os
C
2.Construir o Modelo Lógico.
da
n
5.Implementar o BD.
Etapa de carga (load) dos dados.
Gerar as interfaces com outras aplicações.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Nesse caso, pode-se prestar atenção às observações que devem ser realizadas
83
durante a fase de projeto, como as que envolvem o volume esperado de dados
26
em cada relação do sistema e quais consultas serão realizadas com mais
30
frequência.
s5
ria
Segundo pesquisa realizada, a prática tem mostrado que na maioria dos
Fa
sistemas o seu real desempenho só pode ser conseguido após algum tempo de
uso, e muitas das considerações que os projetistas haviam feito podem
ta
os
mostrar-se incorretas. Após um banco de dados ter sido desenvolvido e estar
C
em operação, o uso real das aplicações, das transações, das consultas e das
da
visões revela fatores e áreas de problemas que podem não ter sido
n
so
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
como discos, memória e processos para uma utilização mais eficiente.
72
A maioria desses problemas mencionados pode ser resolvida por meio de
83
ajuste apropriado de parâmetros físicos do SGBD, da alteração das
26
configurações de dispositivos, da alteração de parâmetros do sistema
30
s5
operacional e de outras atividades similares.
ria
Fa
Conceitos de Soluções de Suporte à Decisão
ta
os
C
da
Mineração de Dados
n
so
aceleradamente.
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
em que é utilizado como forma de prever as alterações climáticas. Para tanto,
72
são analisados os registros climáticas dos últimos 10 a 20 anos e procura-se
83
identificar os padrões de alterações climáticas nesses períodos a fim de se
26
conseguir prever as próximas alterações. Assim, o Data Mining exerce a função
30
s5
de identificar padrões e tendências meteorológicas.
ria
Esse novo campo de estudos que é o Data Mining já é tido como crítico para os
Fa
negócios das grandes empresas e continua a crescer, já que o uso das
ta
informações obtidas através de mineração de dados tornou-se imprescindível
os
para a sustentação da competitividade no ambiente comercial dos dias deC
da
hoje. E também, alia-se a isso, o fato de que com o armazenamento de
grandes quantidades de dados num local comum e também o contínuo avanço
n
so
ferramentas.”
s on
de visualização de dados.
Fayyad et al. (1996) destaca o processo de descoberta de conhecimento de
forma mais simplificada, baseada em três etapas: Preparação, Data Mining e
Análise de Dados. Vejamos cada uma delas:
• Preparação: É a etapa que trata de preparar os dados antes de serem
submetidos às técnicas de Data Mining. Nessa etapa os dados são
selecionados (Quais dados são importantes?), purificados (Retirar as
inconsistências e incompletude de dados) e pré-processados
(Reapresentá-los de uma forma adequada para o processo de Data Mining).
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
produto
roduto X também compram um produto Y. Essa informação pode levar as
72
empresas a criarem novos planos de marketing em cima dos produtos X e
83
Y. Portanto, esses padrões e associações, vão compor o conhecimento da
26
empresa sobre o negócio em que atua, ajudando-a
ajudando a obter maiores lucros e
30
aumentar a satisfação de seus clientes.
s5
ria
O Data Mining é uma etapa do KDD em que são aplicadas técnicas
Fa
para identificação de padrões sobre os dados disponíveis. Tais dados
ta
estão disponíveis em meios digitais, e comumente são trabalhados
traba os dados
os
que estão em bases de dados. Mais adiante estudaremos as principais
técnicas que podem ser aplicadas nos processos de Data Mining.
C
da
tomadores de decisões.
s5
ria
Fa
ta
os
C
da
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
◦ Informação não é Conhecimento.
83
26
◦ Conhecimento não é Inteligência.
30
◦ Inteligência não é Sabedoria.
s5
ria
• Análise de Dados: Aqui o resultado do Data Mining é avaliado, com o
Fa
objetivo de determinar se algum conhecimento adicional foi descoberto,
ta
assim como definir a importância dos fatos gerados. Nessa etapa, várias
os
formas de análise podem ser utilizadas, por exemplo: o resultado do Data
C
Mining pode ser expresso em um gráfico, em que análise dos dados passa a
da
Mining Dados
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
R
Padrões e Entendimento de
Dados Tendências
Mercado e
Transformados Previsões
Dados Pré (Purificados)
Dados Processados
Selecionados
Dados
Originais
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
Figura. Processo de KDD. Adaptação da proposta realizada por Usama Fayyad,
30
s5
Gregory Piatetsky-Shapiro e Padhraic Smyth (1996)
ria
O processo de KDD é interativo (pois o usuário pode intervir e controlar o
Fa
curso das atividades) e iterativo (por ser uma sequência finita de operações
ta
em que o resultado de cada uma é dependente dos resultados das que a
os
precedem). C
da
processo de KDD.
R
53
72
O processo de seleção é bastante complexo, uma vez que os dados podem vir
da
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Dados que possuem valores extremos, atípicos ou com características bastante
83
distintas dos demais registros são chamados de discrepantes, ou outliers.
26
Normalmente, registros que contêm valores outliers são descartados da
30
amostra, porém isto só deve ocorrer quando o dado outlier representar um
s5
erro de observação, de medida ou algum outro problema similar.
ria
Fa
O dado deve ser cuidadosamente analisado antes da exclusão, pois embora
ta
atípico, o valor pode representar um dado verdadeiro. Outliers podem
os
representar, por exemplo, um comportamento não usual, uma tendência ou C
ainda transações fraudulentas.
da
n
-Dados derivados
so
ob
pode ser calculado a partir de outro é a idade de um indivíduo, que pode ser
26
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
**Interpretação e avaliação
Esta é mais uma fase que deve ser feita em conjunto com um ou mais
especialistas no assunto. O conhecimento adquirido através da técnica de data
mining deve ser interpretado e avaliado para que o objetivo final seja
alcançado.
Caso o resultado não seja satisfatório, o que não é raro, o processo pode
53
retornar a qualquer um dos estágios anteriores ou até mesmo ser recomeçado,
72
conforme pode ser observado na Figura.
83
26
Duas das ações mais comuns caso o resultado não seja satisfatório são:
30
modificar o conjunto de dados inicial e/ou trocar o algoritmo de data mining
s5
(ou ao menos alterar suas configurações de entrada).
ria
Fa
ta
**Agir a partir do conhecimento descoberto.
os
C
da
O processo de KDD segundo outros autores, como Terra (2000) pode ser visto
n
a seguir:
so
ob
R
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Figura. Metodologia CRISP-DM (CRoss Industry Standard Process for Data
83
26
Mining), obtido em www.crisp-dm.org
30
A seguir destacamos uma visão geral do ciclo de vida de um projeto de
s5
mineração de dados destacado na figura anterior.
ria
Fa
Entendimento do Foco no entendimento do negócio que visa obter
ta
Negócio conhecimento sobre os objetivos do negócio e seus
os
requisitos.
C
da
Seleção dos Dados Consiste no entendimento dos dados, que visa à
n
da etapa anterior.
26
30
Modelagem dos Fase que consiste na modelagem dos dados, a qual visa
s5
– Aprendizagem de máquina;
C
da
– Reconhecimento de padrões;
on
– Estatística.
s
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
Figura. Fonte: Cavalcanti (2012)
ria
Fa
ta
Mineração de Dados (Data Mining)x DataWarehouse
os
Nesse momento, cabe destacar a diferença entre o Data Mining e o Data C
da
Warehouse, cobrada pela ESAF.
n
so
administração.
72
83
consultas posteriores.
da
on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
importantes:
72
Preparação dos dados: como as organizações são forçadas a pensar
83
•
sobre uma visão lógica unificada da grande variedade de dados e bases de
26
dados que elas possuem, elas têm que lidar com as questões de
30
s5
mapeamento de dados para uma convenção única de nomes, representação
ria
uniforme e manipulação de dados faltosos, e manipulação de ruídos e erros
Fa
quando possível.
ta
Acesso aos dados: métodos uniformes e bem definidos devem ser criados
os
•
para acessar os dados e fornecer caminhos de acesso aos dados que eram
C
da
historicamente difíceis de obter.
n
fazer com todos estes dados?” Aqui é onde as oportunidades para o KDD
53
Nos seus primeiros anos o Data Mining foi popularmente tratado como
Fa
conhecimento.
s
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Fayyad (Fayyad et al. 1996) sintetiza Data Mining como “o processo não-
trivial de identificar, em dados, padrões válidos, novos,
potencialmente úteis e ultimamente compreensíveis”.
Importante
-Mineração de Dados (ou Data Mining)-
Etapa do processo de KDD. Corresponde à execução de um algoritmo
particular que, sob algumas limitações aceitáveis de eficiência computacional,
encontra padrões ou modelos nos dados.
É o processo de análise de conjuntos de dados que tem por objetivo a
53
descoberta de padrões interessantes e que possam representar
72
informações úteis.
83
26
Um conceito já cobrado pela banca foi proposto na edição antiga do livro “Data
30
Mining Techniques: For Marketing, Sales, and Customer Support” , listada a
s5
seguir:
ria
Fa
ta
Caiu em prova!
os
C
A mineração de dados é a exploração e análise, por meios automáticos ou
da
(2011).
26
30
s5
•
C
•
s
•
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
• possuem um ambiente em mudança constante;
72
83
• possuem dados acessíveis, suficientes, e relevantes;
26
• fornece um retorno significativo para decisões corretas.
30
s5
Business Intelligence (BI)
ria
Refere-se ao processo para tomada de decisões em uma empresa, sendo de
Fa
elevada importância a existência de um repositório próprio para os dados
ta
consolidados e já transformados em “informação real”, que pode ser um Data
os
Warehouse ou um Data Mart por exemplo. C
da
segunda, que analisa o negócio por meio de ferramentas OLAP (On Line
R
Analytical Processing).
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Finalizando, cabe destacar que os sistemas OLTP registram as transações,
83
enquanto que os sistemas OLAP realizam uma análise minuciosa dos dados
26
brutos, extraindo informações variadas para a tomada de decisões. Através
30
dos padrões desenhados pelas ferramentas de OLAP, é possível analisar
s5
ria
tendências de mercado, padrões de comportamento dos clientes, dentre
Fa
outros.
ta
os
Conceitos de GED, Workflow e Gestão de Conhecimento C
da
entre outros.
83
26
• criação: pode ser feita a partir de uma aplicação, como um editor de texto,
da
•
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Fa
Figura. Ciclo de Vida do Documento - Fonte: Baldam, Cavalcanti e Valle (2002)
ta
os
C
Quando uma empresa decide implementar uma solução de GED, ela precisa
da
verificar quais são suas necessidades. Tem que estipular quais tipos de
n
so
arquivos serão contemplados e o que será feito com eles (disponibilização via
ob
Web, acesso restrito à rede interna da empresa, etc.). Com estas informações,
R
Funcionalidades do GED
s5
- Captação
os
papel, passa para um repositório de conteúdo, para que possa ser utilizado
posteriormente (CENADEM, 2010). Quando o documento é de papel, este
on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
- Armazenamento
É o local em que os arquivos digitais serão guardados. O armazenamento
deve seguir regras previamente estabelecidas, para que as informações não
se percam. Isto inclui estabelecer o local em que as imagens serão
arquivadas (diretórios, pastas, mídias), a nomenclatura utilizada para
nomear os arquivos e o formato que estes deverão ter (.tif, .jpg, .pdf)
(KOCK, 1998).
É interessante separar os arquivos por tipos (memorandos, plantas de
engenharia, documentos fiscais, etc.) ou por datas, de maneira a facilitar
sua localização. Se possível, o nome dado ao arquivo deve ser algo
53
sugestivo, que lembre o conteúdo do mesmo.
72
83
No local de armazenamento devem ser criadas pastas de forma organizada,
26
nas quais os arquivos digitais serão alocados. Se não houver uma rigorosa
30
padronização com relação aos nomes dados aos arquivos e ao local de
s5
armazenamento dos mesmos, com o tempo e com o aumento do número de
ria
imagens, estas podem se perder.
Fa
-Gerenciamento
ta
os
São ferramentas utilizadas para disponibilizar, monitorar, incluir, excluir,
C
etc., os arquivos digitais (KOCK, 1998).
da
n
- Preservação
so
ob
encontra. Determinados papéis são mais frágeis e têm mais importância que
72
outros, dispensando assim, maior atenção e mais cuidado. Este é o caso dos
83
climatização adequadas.
30
s5
- Disponibilização
ria
principais:
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
Character Recognicion) e de ICR (Intelligent
72
Character Recognicion). Estes fazem o
83
reconhecimento automático dos caracteres
26
preenchidos em um formulário e os envia para o
30
banco de dados. Eles substituem a indexação,
s5
proporcionando um grande ganho de tempo.
ria
Fa
Computer Output to A tecnologia COLD, foi inicialmente introduzida no
ta
Laser Disc/Enterprise mercado para substituir a tecnologia COM,
os
Report Management Computer Output to Microfilm, devido à redução de
(COLD/ERM)
C
custos quando se armazenam as informações em
da
de Relatórios).
26
30
seguintes tipos:
s
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
execução pura e simples das regras
72
preestabelecidas e incorpora exceções a seus
83
procedimentos. Ele aprende com seus próprios
26
erros e acertos.
30
s5
ria
Fa
Gestão do Conhecimento
ta
Gestão do Conhecimento é o processo sistemático de identificação,
os
criação, renovação e aplicação dos conhecimentos que são C
da
estratégicos na vida de uma organização.
n
distribui-la.
30
classificar o conhecimento.
ta
os
conhecimento).
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
(D) informação são dados organizados de modo que tenham significado e
72
83
valor para quem os receber.
26
(E) conhecimento e informação são sinônimos, pois quem tem informação
30
tem conhecimento.
s5
ria
Fa
Comentários
ta
os
Dado Registro de alguma entidade.134 é um exemplo de dado.
C
da
Informação É um dado depois de processado, é uma contextualização de
um dado... Como assim? “5” é um dado, mas e se eu disser
n
so
Importante observar...
ta
os
Gabarito: letra E.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
c) II e III, apenas.
72
83
d) I, II e III.
26
30
s5
Comentários
ria
Fa
Item I. A “Normalização” é um método utilizado para analisar um Banco de
Dados e obter o mínimo de redundância e o máximo de integridade de dados.
ta
os
Principais objetivos: reduzir as redundâncias; reduzir a necessidade de
C
reestruturar as tabelas do banco de dados quando novos tipos de dados são
da
Entidade-Relacionamento.
30
s5
errado.
os
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
Fonte: http://homepages.dcc.ufmg.br/~mirella/DCC011/aula19.pdf
30
s5
Gabarito: letra A.
ria
Fa
3. (FUMARC/Prefeitura Municipal de Betim/Analista de Sistemas da
ta
os
Saúde/2007) Analise as seguintes afirmativas sobre o Diagrama
Entidade-Relacionamento: C
da
leigos, e pode ser mapeado para qualquer modelo lógico de banco de dados
30
relacional.
s5
ria
a) I, II e III.
ta
os
b) I e II apenas.
C
da
c) I e III, apenas.
on
d) II e III, apenas.
s
ob
R
Comentários
Item I. Item errado. O DER é pouco poderoso para expressar restrições de
integridade (regras de negócio).
Item II. Item correto. A cardinalidade de uma entidade em um
relacionamento expressa o número de instâncias da entidade que podem ser
associadas a uma determinada instância da entidade relacionada. Devem ser
consideradas duas cardinalidades:
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
• Cardinalidade mínima: é o número mínimo de instâncias da entidade
Fa
associada que devem se relacionar com uma instância da entidade em
questão. A cardinalidade mínima é usada para indicar o tipo de participação
ta
os
da entidade em um relacionamento.
C
da
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Item III. Item correto. O DER descreve a estrutura de um BD de uma forma
83
mais próxima da percepção dos usuários. Trata-se de um modelo conceitual,
26
independente de aspectos de implementação.
30
s5
Gabarito: letra D.
ria
Fa
ta
4. (FUMARC/Prefeitura Municipal de Betim/Analista de Sistemas da
os
Saúde/2007) Observe os modelos a seguir e identifique qual
relacionamento origina obrigatoriamente uma entidade associativa:
C
da
n
so
ob
R
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
R
Comentários
Vamos ao entendimento de entidade associativa!
Um relacionamento é uma associação entre entidades. Na modelagem ER não
foi prevista a possibilidade de associar uma entidade com um relacionamento
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
n
http://www.profs.iffca.edu.br/~cristhianobv/portal/disciplinas/banco_dados/Ap
so
resentacao_bd_5.pdf
ob
R
Gabarito: letra A.
30
s5
ria
Comentários
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
c) Define-se como Modelo Conceitual aquele em que os objetos, suas
72
características e relacionamentos têm a representação fiel ao ambiente
83
observado, independente de limitações quaisquer impostas por tecnologias,
26
técnicas de implementação ou dispositivos físicos. (COUGO, Paulo Sérgio.
30
s5
Modelagem conceitual e projeto de banco de dados, 1997, p. 28). Item
ria
errado.
Fa
d) Ainda sobre Modelo Conceitual, seguindo COUGO, 1997: no Modelo
ta
(Conceitual), devemos representar os conceitos e características observados
os
em um dado ambiente voltando-nos simplesmente ao aspecto conceitual. C
da
Item errado.
n
Gabarito: letra B.
so
ob
R
53
Comentários
Aproveite a questão para complementar o conceito sobre modelagem de
dados: “Modelagem de dados é um conjunto de conceitos que descrevem a
estrutura de um banco de dados como tipo de dados, relacionamentos e
restrições sobre esses dados.”
Observe que se estamos falando em alto nível, estamos buscando algo mais
abstrato, mais próximo da linguagem humana. Daí, as letras a, b e d já são
descartadas. Na letra c observamos itens da implementação e não de modelos.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
7. (ESAF/2008/AFC-STN/Infraestrutura de TI) Em relação ao nível lógico
72
de abstração de dados nos sistemas de bancos de dados, é correto afirmar
83
que
26
30
a) descreve estruturas de dados complexas de baixo nível.
s5
b) descreve quais dados estão armazenados no banco de dados e as
ria
relações existentes entre eles.
Fa
ta
c) simplifica a interação entre o sistema e os usuários.
os
d) disponibiliza um conjunto de programas de aplicação que ocultam
C
da
detalhes dos tipos de dados.
n
palavras ou bytes.
R
53
72
Comentários
83
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
mesmo banco de dados.
72
83
26
• NÍVEL LÓGICO (conceitual): nível médio de abstração; é o nível que
30
descreve QUAIS os dados são realmente armazenados no BD e quais os
s5
relacionamentos existentes entre eles; visão da comunidade de usuários.
ria
Fa
Aqui o banco de dados inteiro é descrito em termos de um pequeno número
de estruturas relativamente simples. Embora as implementações de
ta
os
estruturas simples no nível conceitual possam envolver complexas
C
estruturas de nível físico, o usuário do nível conceitual não precisa
da
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Gabarito: letra B.
Comentários
53
A duplicação de dados em bancos de dados gera redundância (e não
72
integridade!), o que não é recomendado, já que pode levar a vários problemas
83
como mencionado no item I.
26
30
Gabarito: item errado.
s5
ria
Fa
9. (ESAF/2008/Pref. de Natal/RN/Auditor do Tesouro Nacional) A
“Redundância de Dados” é a preservação da precisão, integridade e
ta
os
confiabilidade dos dados para seu uso intencionado.
C
da
n
Comentários
so
ob
que podemos atualizar o dado em um local e não atualizar nos demais!! Por
83
mas só atualizo em um desses locais. Quando for feita uma pesquisa para o
30
s5
Comentários
A normalização consiste em um processo formal de exame e agrupamento de
dados para: suportar melhor as mudanças futuras; minimizar o impacto destas
mudanças sobre a base de dados. Trata-se de um conjunto de regras que leva
à construção de modelos mais robustos, com menos dependências entre seus
elementos e menos redundância de informações. Normalização é, portanto,
uma atividade de verificação do modelo lógico. Principais objetivos:
reduzir as redundâncias; reduzir a necessidade de reestruturar as tabelas do
banco de dados quando novos tipos de dados são introduzidos.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
separadamente ou separados em uma outra relação. Por exemplo, um
72
atributo multivalorado Telefones poderia ser separado em Telefone
83
Residencial, Telefone Comercial e Telefone Celular ou, ainda, ser convertido
26
em outra relação que pudesse representar um número indeterminado de
30
telefones.
s5
ria
Fa
o 2ª Forma Normal (2FN): toda relação deve estar na 1FN e devem-se
ta
eliminar dependências funcionais parciais, ou seja, todo atributo
os
não chave deve ser totalmente dependente da chave primária. C
da
Como exemplo, uma relação que contenha os atributos Código da Obra,
n
do Fornecedor, não está na Segunda Forma Normal, uma vez que o Nome
R
53
chave estrangeira para a nova relação criada. Esta forma normal ajuda a
Fa
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Figura. Normalização
Fa
Gabarito: item correto.
ta
os
C
da
11. (ESAF/2008/Pref. de Natal/RN/Auditor do Tesouro Nacional)
Quando os dados são “Normalizados”, os atributos contidos na tabela
n
so
Comentários
72
afirmar que:
26
30
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
Se uma relação está na 2ª Forma Normal (2FN), todo atributo que não
72
seja chave deve ser totalmente dependente da chave primária.
83
26
Em outras palavras: uma relação encontra-se na 2FN se e somente se
30
estiver em 1FN e não contém dependências parciais.”
s5
Dependência Parcial: ocorre quando uma coluna depende apenas de uma
ria
Fa
parte de uma chave primária composta;
ta
Uma relação estará na 3ª Forma Normal (3FN), se e somente se,
os
estiver na 2ª Forma Normal e todos os seus atributos não chaves C
forem dependentes não transitivos da chave primária.
da
n
determinada relação. Em uma relação pode haver mais que uma coluna
ria
e) uma Chave Externa é formada por uma coluna de uma tabela que se
ob
destino, não aceitam valores nulos. Uma tabela destino pode ter apenas
uma Chave Externa.
Comentários
A letra A está errada pois na 1FN, todos devem conter valores atômicos.
A letra B está correta pois mais de uma chave pode ser candidata a chave
primária.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
A letra C está errada pois a chave primária deve conter valores que
identifiquem unicamente cada registro da tabela, não podendo ser nulos.
Na letra D, a chave primária deve ser única para a tabela. Já a letra E, está
incorreta pois uma tabela pode conter mais de uma chave externa.
Gabarito: letra B.
53
seu estado é visível ao usuário e ele pode ser consultado e modificado
72
83
exclusivamente por meio das operações a ele associadas.
26
II. A linguagem de manipulação de dados (DML) permite a uma aplicação
30
acessar ou manipular as informações contidas num banco de dados. A
s5
manipulação de dados engloba incluir, recuperar, excluir e modificar a
ria
informação armazenada.
Fa
ta
III. Os dados manipulados por um banco de dados orientado a objeto são
os
sempre transientes e são armazenados fora do contexto de um programa, e
assim podem ser usados em várias instâncias de programas.
C
da
n
IV. Todo dado de um Banco de Dados Relacional deve ter a garantia de ser
so
a) I e II
30
s5
b) II e III
ria
c) III e IV
Fa
d) I e III
ta
os
e) II e IV
C
da
on
Comentários
s
ob
relacional é feito por meio de uma DCL ( Data Control Language - Linguagem
de Controle de Dados).
Uma DML (Data Manipulation Language – Linguagem de Manipulação de
Dados) possibilita a manipulação dos dados de um SGBD, logo a afirmação II
está correta.
A afirmação III é falsa, pois os dados armazenados em um banco de dados
OO são persistentes.
A afirmativa IV é verdadeira!
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Gabarito: letra E.
Comentários
53
A opção está incorreta pois o backup não necessita de dois bancos de dados
72
83
trabalhando juntos.
26
Gabarito: item errado.
30
s5
ria
15. (ESAF/2010/MPOG-TI/ANALISTA DE PLANEJAMENTO E
Fa
ORÇAMENTO) São modelos de bancos de dados lógicos baseados em
ta
objetos:
os
a) entidade-relacionamento, unificador e infológico. C
da
Comentários
s5
explicitamente especificados.
da
on
Modelo entidade-relacionamento;
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
c) relacionamento.
72
d) diagrama.
83
26
e) agregação.
30
s5
ria
Comentários
Fa
O que é um relacionamento? Um relacionamento pode ser entendido como
ta
uma associação entre instâncias de Entidades devido a regras de negócio.
os
Normalmente ocorre entre instâncias de duas ou mais Entidades, podendo C
da
ocorrer entre instâncias da mesma Entidade (auto-relacionamento).
n
Gabarito: letra A.
72
83
26
expressa
Fa
a um outro relacionamento.
os
C
entidades.
R
Comentários
A cardinalidade de um relacionamento expressa a quantidade de registros de
uma tabela que estão relacionados com registros da tabela associada.
Gabarito: letra D.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
supervisionados. Os atributos identificadores de cada entidade estão
72
sublinhados.
83
26
30
s5
ria
Fa
ta
os
C
da
n
so
ob
R
53
72
83
26
30
empregados.
ta
qualquer.
on
D.
(E) saber que há apenas um empregado que supervisiona todos os demais.
Comentários
Para identificar a informação solicitada na letra E, será necessária uma
consulta que conte o número de registros.
Sendo assim, a análise do diagrama não poderia inferir se há apenas um
empregado que supervisiona os demais.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Gabarito: letra E.
53
níveis conceitual e externo.
72
83
(C) mudanças no nível externo, sem a necessidade de modificações nos
26
níveis interno e conceitual.
30
(D) consultas em SQL sobre um banco de dados relacional, independente da
s5
estruturação física dos dados armazenados.
ria
Fa
(E) consultas em SQL sobre um banco de dados relacional, independente da
ta
lógica de programação usada em programas aplicativos.
os
C
da
Comentários
n
so
recompilação da aplicação.
83
26
Gabarito: letra A.
30
s5
ria
teoria relacional não diz nada sobre o nível externo, preocupa-se somente
os
Comentários
s
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Comentários
A chave estrangeira permite a implementação de relacionamentos em um
banco de dados relacional.
53
Gabarito: item correto.
72
83
26
22. (ESAF/2008/STN/Desenvolvimento de Sistemas) SBGD (Sistema
30
Gerenciador de Bancos de Dados) possui um compilador para uma
s5
determinada linguagem, cuja função é o processamento de declarações, a
ria
Fa
fim de identificar as descrições dos componentes do esquema conceitual do
Banco de Dados. Tal linguagem é de
ta
os
a) consulta estrutura – SQL. C
da
b) definição de armazenamento – SDL.
n
so
Comentários
30
s5
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
•
72
• DROP INDEX
83
CREATE VIEW
26
•
30
• DROP VIEW
s5
ria
Gabarito: letra E.
Fa
ta
os
23. (ESAF/2008/STN/Desenv Sistemas) Se uma dada variável de
C
relação R possui seus atributos não-chaves mutuamente independentes e
da
irredutivelmente dependentes da chave primária, R está na
n
so
e) desnormalização.
30
s5
ria
Comentários
Fa
1ª Forma Normal (1FN): toda relação deve ter uma chave primária e
ta
os
deve-se garantir que todo atributo seja atômico. Atributos compostos devem
C
ser separados.
da
s on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Comentários
O nível conceitual realiza um mapeamento entre os níveis interno e externo. O
nível conceitual não leva em conta o banco de dados em si, mas a forma como
as estruturas serão criadas para armazenar os dados.
Nesta questão a banca tenta confundir o candidato empregando o termo
53
simulação. Lembre-se de que os diferentes níveis representam diversas visões
72
a respeito do banco de dados, não são formas de simular ou substituir uma
83
visão!
26
30
Gabarito: item errado.
s5
ria
Fa
25. (CESPE/2010/BANCO DA AMAZONIA/Área: Tecnologia da
ta
Informação — Administração de Dados) Se um sistema de banco de
os
dados provê independência física dos dados, é correto inferir que esse
sistema também permite independência lógica de dados.
C
da
n
so
ob
Comentários
R
independência Lógica.
ria
Comentários
Um roolback é um processo em banco de dados que desfaz mudanças em
dados que foram “alterados”, mas não “confirmados”.
Gabarito: item errado.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Comentários
53
A DML (Data Manipulation Language – Linguagem de Manipulação de
72
Dados) visa a manipulação de dados (incluir, alterar, excluir e consultar) por
83
meio do usuário. Principais comandos:
26
30
• SELECT: seleção de registros;
s5
ria
• INSERT: inserção de registros;
Fa
• UPDATE: atualização de registros;
ta
os
• DELETE: deleção de registros.
Para a definição dos dados é utilizada uma DDL (Data Definition
C
da
Transaction Control
s
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
I. O atributo Num_agencia do tipo de entidade AGENCIA é conhecido
26
como chave primária.
30
II. De acordo com as restrições de participação definidas, uma entidade
s5
de BANCO obrigatoriamente deve estar relacionada a pelo menos uma
ria
entidade de AGENCIA.
Fa
ta
III. AGENCIA é um tipo de entidade fraca e POSSUI é um
os
relacionamento identificador, cuja razão de cardinalidade é 1:N.
C
da
Marque a alternativa CORRETA:
n
so
Comentários
s5
ria
apresentado na questão.
da
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
n
so
ob
R
53
72
83
26
30
s5
ria
de atributos cujos valores distinguem uma linha das demais, dentro de uma
ta
tabela.
os
C
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
Item III. Item correto. A entidade AGENCIA é um tipo de entidade fraca e
72
POSSUI é um relacionamento identificador, cuja razão de cardinalidade é 1:N.
83
26
Gabarito: letra E.
30
s5
ria
INSTRUÇÃO: De acordo com o diagrama de Entidade e Relacionamento
Fa
abaixo, responda às próximas 2 questões.
ta
os
C
da
n
so
ob
R
53
72
83
26
30
s5
N:N.
da
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Comentários
Primeiro, alguns pontos para revisão.
Componentes do Diagrama E-R (Peter Chen):
• Retângulos: representam conjuntos-entidade.
• Elipses: representam atributos.
• Losangos: representam conjuntos-relacionamento.
• Linhas: ligam atributos a conjuntos-entidade e conjuntos-entidade a
conjuntos-relacionamento.
53
Entidades e Conjuntos-Entidade
72
83
Entidade: é uma representação abstrata de um objeto do mundo real. Ex.: O
26
fornecedor Ponto_dos_concursos, com código PONTO1.
30
Conjuntos-Entidade: grupo de entidades que possui características
s5
semelhantes. Ex.: Conjunto-entidade Fornecedor.
ria
Fa
ta
os
C
da
n
so
ob
R
53
72
83
26
30
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Agora vamos analisar cada item individualmente.
83
I – “Propriedade” é um tipo relacionamento que tem razão de cardinalidade
26
N:N. Item Correto. Observe as letras “N” de cada lado do relacionamento
30
s5
“Propriedade”.
ria
II – Uma entidade “Proprietário” existe apenas se participar de pelo menos
Fa
uma instância de relacionamento “Propriedade”. Item Correto. Existe uma
ta
“Dependência Existencial” caracterizada pela linha dupla ligando “Proprietário”
os
ao relacionamento. Isto ocorre quando a existência de uma determinada C
da
entidade está condicionada à existência de uma outra entidade a ela
n
relacionada. Ex.:
so
ob
R
53
72
83
26
30
s5
ria
Existem três tipos básicos de grau de relacionamento: binário (2), ternário (3)
os
Gabarito: letra A.
s
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Comentários
53
Bill Inmon destaca que o “Data Warehouse é uma coleção de dados
72
83
orientados por assuntos, integrados, variáveis com o tempo e não
26
voláteis, para dar suporte ao processo de tomada de decisão.“
30
O Data Warehouse é um banco de dados multidimensional grande, de escopo
s5
organizacional (ou seja, abrange toda a empresa) e reúne dados de todos os
ria
departamentos de forma a permitir a busca rápida de informações para auxiliar
Fa
a tomada de decisões estratégicas.
ta
os
A principal ideia do Data Warehouse é construir um depósito no qual será
C
mantida a memória histórica dos dados, possibilitando a utilização dos
da
•
departamental (ou seja, abrange apenas um determinado departamento).
R
53
•
procedimentos, técnicas e ferramentas para recuperar e analisar dados de
Fa
Gabarito: letra C.
da
s on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Comentários
O enunciado da questão dá fortes indicações de que a questão trata de Data
Mining. O texto diz: “descobrir relacionamentos significativos” e também
“concluir sobre padrões de comportamento de clientes de uma organização”,
tudo isso faz parte da descrição de Data Mining.
Contudo vamos comentar as demais opções:
A letra A cita o Data Warehouse. Uma das atividades de uma empresa que
53
pretende trabalhar com Data Mining é justamente coletar os registros das
72
83
bases de dados transacionais e organizá-los em bases de dados agrupadas por
26
assunto e destinadas a análises. Cada base de dados organizada por assunto
30
dá-se o nome de Data Mart, e ao conjunto de Data Marts dá-se o nome de
s5
Data Warehouse. Essa organização dos dados é importante e muito válida,
ria
pois tende a facilitar em muito o trabalho de mineração de dados.
Fa
A letra B cita o Metadados. Metadados são dados com a finalidade de
ta
os
descrever outros dados. É como se fosse um dicionário, trata-se de um grupo
C
específico de registros em banco de dados cuja finalidade é permitir melhor
da
entendimento dos dados a que se referem.
n
so
A letra C cita o Data Mart, que é uma base de dados em que os dados já estão
ob
organizados por assunto. Assim, numa grande empresa seria comum encontrar
R
modo geral. Pode ser tanto a loja virtual da empresa, como pode ser seu
30
Gabarito: letra D.
s on
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Comentários
Item A. Item correto. Um Data Warehouse (Armazém ou Depósito de
Dados) é um sistema utilizado para armazenar informações consolidadas de
um banco de dados, possibilitando a análise de grandes volumes de dados,
coletados a partir de sistemas transacionais (OLTP).
Item B. Item errado. Define-se Gestão do Conhecimento como a busca da
melhoria de desempenho das instituições por meio de processos de procura,
extração, compartilhamento e criação de conhecimento, aplicando diferentes
53
ferramentas e tecnologias de informação e de comunicação.
72
Item C. Item errado. Define-se Business Intelligence (Inteligência de negócios
83
– BI) como o processo de coleta, estruturação, avaliação, disponibilização e
26
monitoramento de informações para suporte ao gerenciamento de negócios.
30
s5
Item D. Item errado. Etapa do processo de Descoberta de Conhecimento em
ria
Bases de Dados (KDD – Knowledge Discovery in Databases) que corresponde à
Fa
execução de um algoritmo particular que, sob algumas limitações aceitáveis de
ta
eficiência computacional, encontra padrões ou modelos nos dados.
os
C
Item E. Item errado. OLAP (On-line Analytical Processing) é a processo de
da
manipulação e avaliação de um grande volume de dados sob múltiplas
n
aspectos.
so
ob
Gabarito: letra A.
R
53
72
Comentários
Conforme visto o Data Mining é um processo de procura de padrões e regras
de associações em conglomerados de dados. Esse processo pode é realizado
com o uso de softwares com algoritmos que implementam as técnicas de Data
Mining conhecidas e também com a supervisão de um especialista no domínio
de negócio em estudo. Por isso, podemos dizer que Data Mining é também
semi-automático. Portanto, somente a letra B está correta.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Gabarito: letra B.
53
(D) Permite-se distinguir várias entidades de um conjunto.
72
(E) Refere-se à busca de informações relevantes a partir de um grande
83
volume de dados.
26
30
s5
ria
Comentários
Fa
O processo de Data Mining tem o objetivo de buscar informações relevantes
ta
num conglomerado de dados. Essas informações relevantes são padrões,
os
tendências e associações que quando analisadas serão úteis para produção de
C
conhecimento sobre um dado domínio de negócio. Portanto, a opção correta é
da
a letra E.
n
so
Gabarito: letra E.
ob
R
53
72
Comentários
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
a função de coletar os dados originais das bases de dados e purificá-los,
72
removendo redundâncias (ou seja, duplicações de dados), a fim de tornar
83
estes dados adequados para o processo de Data Mining.
26
Gabarito: letra A.
30
s5
ria
Fa
36. (ESAF/MPOG/2010) Mineração de Dados
ta
(A) é uma forma de busca sequencial de dados em arquivos.
os
C
(B) é o processo de programação de todos os relacionamentos e algoritmos
da
existentes nas bases de dados.
n
so
(C) por ser feita com métodos compiladores, método das redes neurais e
ob
Comentários
s5
ria
partir disso, podemos afirmar que a opção E é a que melhor se encaixa com os
on
Gabarito: letra E.
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
Comentários
83
26
Conforme vimos anteriormente Data Mining é um processo “de identificar
30
informações relevantes, tais como padrões, associações, mudanças,
s5
anomalias e estruturas, em grandes conglomerados de dados que
ria
estejam em banco de dados ou outros repositórios de informações”.
Fa
Portanto não se trata apenas de “acessar um banco de dados para realizar
ta
consultas genéricas” como diz a letra B.
os
C
A letra C está incorreta, por citar que o Data Mining recupera “informações de
da
um banco de dados específico” quando na verdade o processo de Data Mining
n
A letra D está incorreta por afirmar que Data Mining é um banco de dados,
R
E por fim, a letra E descreve Data Mining como uma forma de representar
83
entre outros.
30
Gabarito: letra A.
s5
ria
Fa
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
em banco de dados, de forma consolidada. Ele possibilita a análise de grandes
72
volumes de dados, coletados dos sistemas transacionais. Por definição, os
83
dados em um Data Warehouse não são voláteis, ou seja, eles não mudam, são
26
somente para leitura e não podem ser alterados.
30
s5
Os Data Warehouses surgiram como conceito acadêmico na década de 80.
ria
Com o amadurecimento dos sistemas de informação empresariais, as
Fa
necessidades de análise dos dados cresceram paralelamente. Como os
ta
sistemas transacionais não conseguiam cumprir a tarefa de análise com a
os
simples geração de relatórios, os Data Warehouses são atualmente o núcleo
C
da
dos sistemas de informações gerenciais e apoio a decisão das principais
soluções de Business Intelligence do mercado, devido a sua capacidade de
n
so
A assertiva, portanto, é falsa, tendo-se em vista que a View não tem como
26
30
ofertada é maior do que em todo o banco de dados. Uma View não possui
os
C
quantidade de dados maior do que o próprio banco de dados em que ela está
da
inserida.
on
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Comentários
Alguns exemplos de tarefas:
Classificação Predizer a classe de um item.
Clusterização Encontrar grupos nos dados.
Associação Encontrar padrões de ocorrências de dados associados.
Sumarização Descrever uma base de dados.
Análise de Encontrar alterações nos dados.
53
Desvio
72
83
Regressão Prever um valor numérico contínuo.
26
30
s5
Com relação aos itens das assertivas temos:
ria
Fa
a) Classificação; Regressão; Clusterização.
ta
b) Classificação; Realimentação; Complementação.
os
c) Codificação; Normalização; Clusterização. C
da
Gabarito: letra A.
53
72
83
Considerações Finais
26
30
Por hoje ficamos por aqui. Passamos por diversos pontos que considerei
s5
para a memorização!!!).
Fa
Profa Patrícia.
s
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Referências Bibliográficas
QUINTÃO, Patrícia Lima. Notas de aula, 2011/2012.
BRAGA, Regina. Notas de aula, UFJF, 2006.
HEUSER, Carlos Alberto. Projeto de banco de dados. 4. ed. Porto Alegre:
Sagra, 2001. 204 p., il.
HERNANDEZ, Michael J. Aprenda a projetar seu próprio banco de dados.
Tradução Patrizia Tallia Parenti. São Paulo: Makron, 2000.
53
KORTH, Henry F.; SILBERSCHATZ, Abraham. Sistema de banco de dados.
72
Tradução Mauricio Heihachiro Galvan Abe. 2. ed. São Paulo: Makron, 1995.
83
26
MACHADO, Felipe Nery Rodrigues; ABREU, Maurício Pereira de. Projeto de
30
banco de dados: uma visão prática. 6. ed. São Paulo: Érica, 2000.
s5
ria
SETZER, Valdemar W. Banco de dados: conceitos, modelos,
Fa
gerenciadores, projeto lógico, projeto físico. 3. ed. rev. São Paulo: E.
Blücher, 2002. 289 p.
ta
os
Revistas SQL Magazine (ed. 31 e 32). C
da
Referências Bibliográficas
n
so
Sagra, 2001.
s5
ria
BERRY, M. J. A.; LONOFF, G.. Data Mining Techniques: for Marketing, Sales
Fa
and Customer Support. New York: John Wiley & Sons, Inc., 1997.
ta
2006.
FAYYAD, Usama; PIATETSKI-SHAPIRO, Gregory; SMYTH, Padhraic (1996) The
KDD Process for Extracting Useful Knowledge from Volumes of Data.
In: Communications of the ACM, pp.27-34, Nov.1996.
HAN, J.; KAMBER, M.. Data Mining: concepts and techniques. Morgan
Kaufmann, 2001.
HERNANDEZ, Michael J. Aprenda a projetar seu próprio banco de dados.
Tradução Patrizia Tallia Parenti. São Paulo: Makron, 2000.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
bancos de dados. Grupo de Interesse Em Engenharia de Software,
72
Florianópolis, v. 1, p. 10-14, 2004.
83
26
SETZER, Valdemar W. Banco de dados: conceitos, modelos,
30
gerenciadores, projeto lógico, projeto físico. 3. ed. rev. São Paulo: E.
s5
Blücher, 2002. 289 p.
ria
Revistas SQL Magazine (ed. 31 e 32).
Fa
ta
ROB, Peter; CORONEL, Carlos. Sistemas de Banco de Dados. Projeto,
os
Implementação e Administração. 2011.
C
da
TAN, Pang – Ning; STEINBACH, Michael; KUMAR, Vipin. Introdução ao
n
Ltda, 2009.
ob
R
2005.
83
26
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
(D) informação são dados organizados de modo que tenham significado e
72
83
valor para quem os receber.
26
(E) conhecimento e informação são sinônimos, pois quem tem informação
30
tem conhecimento.
s5
ria
Fa
2. (FUMARC/Prefeitura Municipal de Betim/Analista de Sistemas da
ta
Saúde/2007) Analise as seguintes afirmativas sobre modelagem de
os
dados: C
da
implementados.
30
a) I, apenas.
os
C
b) I e II, apenas.
da
c) II e III, apenas.
s on
d) I, II e III.
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
83
4. (FUMARC/Prefeitura Municipal de Betim/Analista de Sistemas da
26
Saúde/2007) Observe os modelos a seguir e identifique qual
30
s5
relacionamento origina obrigatoriamente uma entidade associativa:
ria
Fa
ta
os
C
da
n
so
ob
R
53
72
83
26
30
s5
ria
Fa
ta
os
C
da
s on
ob
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
a) Pastas, arquivos e permissões.
83
b) Esquema, instância e objeto.
26
30
c) Classe, objeto e herança.
s5
d) Formato de registro, ordem e caminho de acesso.
ria
Fa
e) Entidades, atributos e relacionamentos.
ta
os
7. (ESAF/2008/AFC-STN/Infraestrutura de TI) Em relação ao nível lógico C
da
que
so
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
candidata a chave primária.
72
83
c) as colunas que irão compor as Chaves Primárias devem ser inicializadas
26
com valores nulos.
30
d) em uma tabela existirão tantas Chaves Primárias quantas forem as
s5
colunas nela existentes.
ria
Fa
e) uma Chave Externa é formada por uma coluna de uma tabela que se
ta
referencia a uma Coluna qualquer de outra tabela. Essas colunas, na tabela
os
destino, não aceitam valores nulos. Uma tabela destino pode ter apenas
uma Chave Externa.
C
da
n
so
ob
informação armazenada.
ta
os
IV. Todo dado de um Banco de Dados Relacional deve ter a garantia de ser
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
e) II e IV
53
ORÇAMENTO) São modelos de bancos de dados lógicos baseados em
72
objetos:
83
26
a) entidade-relacionamento, unificador e infológico.
30
b) objetos-atributos, sequencial e infológico.
s5
ria
c) entidade-relacionamento, binário e de rede.
Fa
d) entidade-relacionamento, binário e infológico.
ta
os
e) entidade-relacionamento, binário e em frames.
C
da
n
exemplo: 1:1, 1:N, N:1 ou N:M. Esses mapeamentos, com base no número
26
a) cardinalidade.
ria
b) hierarquia.
Fa
c) relacionamento.
ta
os
d) diagrama.
C
da
e) agregação.
s on
ob
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
lotados em departamentos; o segundo DER apresenta também o
72
relacionamento Trabalha_em, que representa as associações dos
83
empregados aos projetos em que trabalham e o terceiro relacionamento é
26
Supervisão, que representa associação entre empregados e seus
30
supervisionados. Os atributos identificadores de cada entidade estão
s5
sublinhados.
ria
Fa
ta
os
C
da
n
so
ob
R
53
72
83
26
30
s5
ria
Fa
ta
empregados.
on
qualquer.
(D) saber quais os empregados de D que trabalham em P para um
determinado projeto P e um determinado departamento
D.
(E) saber que há apenas um empregado que supervisiona todos os demais.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
estruturação física dos dados armazenados.
72
83
(E) consultas em SQL sobre um banco de dados relacional, independente da
26
lógica de programação usada em programas aplicativos.
30
s5
ria
20. (ESAF/2005/AFRF) O modelo relacional refere-se à visualização física
Fa
e não lógica dos dados. Está relacionado ao nível conceitual interno. A
ta
teoria relacional não diz nada sobre o nível externo, preocupa-se somente
os
com o armazenamento e manipulação dos dados executados pelo SGBD.
C
da
n
as tabelas. Uma coluna definida como chave estrangeira deve ser chave
R
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
dados provê independência física dos dados, é correto inferir que esse
72
83
sistema também permite independência lógica de dados.
26
30
s5
26. (ESAF/2008/Pref. de Natal/RN/Auditor do Tesouro Nacional)
ria
Com relação a sistemas operacionais, é correto afirmar que um ROLLBACK
Fa
ocorre quando um grupo ou conjunto de processos compete entre si e,
ta
quando finalizado, desfaz ou mata o processo corrente.
os
C
da
esquema conceitual.
30
s5
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
72
d) todas as afirmativas são verdadeiras.
83
26
30
INSTRUÇÃO: De acordo com o diagrama de Entidade e Relacionamento
s5
abaixo, responda às próximas 2 questões.
ria
Fa
ta
os
C
da
n
so
ob
R
53
72
83
26
N:N.
os
C
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
(E) num DataWarehouse, os usuários finais necessitam conhecer linguagem
72
de programação para acessar dados.
83
26
30
31. (UFF/UFF/2009) O conjunto de técnicas que, envolvendo
s5
métodos matemáticos e estatísticos, algoritmos e princípios de
ria
inteligência artificial, tem o objetivo de descobrir relacionamentos
Fa
significativos entre dados armazenados em repositórios de grandes
ta
os
volumes e concluir sobre padrões de comportamento de clientes de
uma organização é conhecido como: C
da
(A) Datawarehouse;
n
so
(B) Metadados;
ob
R
denominado
os
C
a) datawarehouse.
da
b) gestão do conhecimento.
s on
c) business Intelligence.
ob
R
d) mineração de dados.
e) OLAP (OnLine Analytical Processing).
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
(A) Refere-se à implementação de banco de dados paralelos.
72
83
(B) Consiste em armazenar o banco de dados em diversos computadores.
26
(C) Relaciona-se à capacidade de processar grande volume de tarefas em
30
s5
um mesmo intervalo de tempo.
ria
(D) Permite-se distinguir várias entidades de um conjunto.
Fa
(E) Refere-se à busca de informações relevantes a partir de um grande
ta
os
volume de dados.
C
da
n
(C) por ser feita com métodos compiladores, método das redes neurais e
método dos algoritmos gerativos.
(D) engloba as tarefas de mapeamento, inicialização e clusterização.
(E) engloba as tarefas de classificação, regressão e clusterização.
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
53
(D) um banco de dados específico voltado à gestão de negócios usando
72
tecnologia de informação (TI) como, por exemplo, a área de BI (Business
83
Inteligence).
26
(E) representar informações de um banco de dados mediante vários
30
modelos hierárquicos como, por exemplo, o de entidade-relacionamento
s5
(ER).
ria
Fa
ta
os
38. (ESAF/MPOG/Adaptada/2008) Algumas pessoas têm considerado
que os Data Warehouses são uma extensão de visões de banco de dados.C
da
Porém, as visões fornecem apenas um subconjunto das funções e das
n
(TEORIA E EXERCÍCIOS)
PROFa. PATRÍCIA LIMA QUINTÃO
Gabarito
1. Letra E. 21. Item correto.
2. Letra A. 22. Letra E.
3. Letra D. 23. Letra C.
4. Letra A. 24. Item errado.
5. Letra B. 25. Item errado.
6. Letra E. 26. Item errado.
53
72
7. Letra B. 27. Letra D.
83
8. Item errado. 28. Letra E.
26
30
9. Item errado. 29. Letra A.
s5
10. Item correto. 30. Letra C.
ria
Fa
11. Item correto. 31. Letra D.
ta
os
12. Letra B. 32. Letra A.
13. Letra E. 33.
CLetra B.
da
n
O conteúdo deste curso é de uso exclusivo de Robson da Costa Farias53026837253, vedada, por quaisquer meios e a qualquer título, a sua
reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal.