Você está na página 1de 7

BANCO DE DADOS

Resumo

Bancos de Dados e SGBD 1. Banco de Dados: Conceito Conjunto de dados com estrutura regular que organizam informao. 2. Sistema de Gerenciamento de Banco de Dados (SGBD) uma coleo de dados relacionados e os programas que mantm e acessam esses dados. Permitem fazer consultas SQL sem precisar utilizar cdigo-fonte dos programas. 2.1.Caractersticas a) b) c) d) e) Independncia de dados (viso lgica independente da forma de armazenamento); Compartilhamento de dados (multi-usurios); Garantia de integridade de dados (atualizaes concorrentes); Relacionamento entre os dados (recuperar e atualizar os dados - diferentes formas de relacionamento); Controle de redundncia

3. Aplicativo de banco de dados Oferecem interface para o banco de dados. Ex.: Microsoft Visual FoxPro, Microsoft Access, dBase, FileMaker, HyperCard, MySQL, PostgreSQL, Microsoft SQL Server e Oracle. 4. Modelo Relacional uma teoria matemtica que descreve como os BDs devem funcionar. Muito poucos sistemas de gesto seguem o modelo de forma restrita. 4.1.Componentes de um BD relacional a) Relaes ou tabelas (no nvel conceitual); b) Operadores, lgebra e clculo relacionais (base da linguagem SQL); c) Restries de integridade (valores que podem ou no serem adicionados) 4.2.Caractersticas Os relacionamentos entre tabelas no so explcitos usam atributo chave. Atributo caracterstica da entidade. Domnio do atributo conjunto de valores vlidos para cada atributo. Cardinalidade nmero de relacionamentos que uma entidade pode participar. Entidade fraca sem atributo chave. 4.3.Modelagem de dados a criao de uma estrutura de dados eletrnica (BD) que representa um conjunto de informaes. 1- Entendimento do problema (modelo conceitual ou de domnio - UML); 2- Construo do modelo ER (DBDesigner); 3- Implementao (SGBD).

Pode usar o DIA (editor de diagrama Microsoft Visio p/ Linux).

Especializao x Generalizao Na especializao no obrigado a ser um dos subtipos, na generalizao .

Normalizao A Normalizao um processo formal passo a passo que examina os atributos de uma entidade, com o objetivo de evitar anomalias observadas na incluso, excluso e alterao de Tuplas especficas. Esse processo causa a simplificao dos atributos dentro da respectiva tupla, eliminando grupos repetitivos. Ex.: primeira forma nominal cria-se item para eliminar repetio de dados NotaFiscal e NotaFiscalItem (que no tem id, s chave estrangeira). Segunda forma nominal retira-se chaves compostas. Ex.: ao invs de colocar NotaFiscalItem com chave composta id e chaveproduto, cria entidade Produto e s relaciona. Terceira forma nominal: separar entidades com dados dependentes de ids. Ex.: NotaFiscal (que continha cdigo cliente e dados do cliente) em NotaFiscal e Cliente. Minerao de Dados 2

1. Data Warehouse Armazena dados que foram extrados dos vrios bancos de dados de uma organizao. uma fonte central de dados j trabalhados, transformados e catalogados. 2. Data Mart um subconjunto do data warehouse que est mais ajustado para fornecer dados detalhados de uma rea especfica. Os data marts so mais teis para grupos menores que precisam acessar dados detalhados, enquanto o data warehouse usado para consolidar os dados que sero acessado por toda a empresa. 3. Data Mining Analisar e descobrir padres importantes nos dados por meio de tcnicas automticas, descobrir padres e prever tendncias futuras e, por fim, propor estratgias de negcios. Faz parte do processo de KDD - Knowledge Discovery in Database (dados de baixo nvel em alto nvel).

KDD 4. Processos de verificao e descoberta 4.1. Processo de verificao: usurio sugere uma hiptese e tenta prov-la atravs desta anlise. 4.2. Processo de descoberta: no h nenhuma suposio antecipada. Usa tcnicas como regras de associao, rvores de deciso, algoritmos genticos e redes neurais. 5. Processo de descoberta de conhecimento 5.1. Definio de objetivos (de negcio); 5.2. Preparao de dados (pode precisar fazer junes de tabelas ou eliminao de linhas/colunas); 5.3. Definio de um estudo (apontar alvo campos de dados que sero usados no estudo); 5.4. Construo de um modelo (atravs da minerao de dados a partir dos dados transformados e alvo); 5.5. Entendimento do modelo (entender os dados atravs dos indicadores que os modelos acumulam); Indicadores: frequncia de certo dado, pesos ou impactos, conjunes (certas entradas tm mais peso juntas que separadas) e diferenciao (importncia de certa entrada com relao a uma sada do que pra outra). 5.6. Predio (escolher o melhor resultado).

6.

Caractersticas dos dados 3

a) Dimenso ou Dimensionalidade: Nmero de atributos que os objetos do conjunto de dados possuem. Dimenso muito grande gera dificuldade no processo de Data Mining. b) Disperso: Caractersticas assimtricas. Apenas valores diferentes de zero so armazenados e manipulados. c) Resoluo: imagem com resoluo pequena demais pode perder determinados padres e imagens com resoluo alta demais pode focar dados especficos e no permitir a visualizao do todo. 7. Tipos de Conjuntos de dados 7.1.Dados em registros Registros com conjunto fixo de campos (atributos). Normalmente armazenados em BDs relacionais. Tipos de dados em registros: a) Dados de transao: cada registro envolve um conjunto de itens. Ex.: conjunto de produtos comprados por cliente no supermercado:

b) Matriz de dados: cada objeto representado por uma das m linhas com n colunas de atributos. Matriz de dados dispersos: matriz de dados em que somente valores diferentes de zero so importantes. c) Dados de documentos: cada termo de um objeto (documento) indica o nmero de vezes que aquele componente ocorre no documento.

7.2.Dados baseados em grafos a) World Wide Web (links html) b) Estruturas moleculares

7.3.Dados Ordenados 4

a) b) c) d)

Dados espaciais Dados temporais Dados sequenciais Dados de sequencias genticas

Obs: Outliers so objetos de dados com caractersticas que so consideravelmente diferentes da maioria dos outros objetos de dados no conjunto de dados 8. Classificao uma tcnica de minerao de dados. Categorizar os dados em classes. Exemplos: classificar pedidos de crditos como de baixo, mdio e alto risco; esclarecer pedidos de seguros fraudulentos; identificar a forma de tratamento na qual um paciente est mais propcio a responder, baseando-se em classes de pacientes que respondem bem a determinado tipo de tratamento mdico. A tarefa de classificao pode ser considerada uma tarefa mal definida, indeterminstica, que inevitvel pelo fato de envolver predio. Linguagem SQL 1. Atomicidade Se algo der errado, tudo ser revertido. 2. Conceito Linguagem padro para operaes em BDs. Independente de software e hardware. Os comandos existentes nesta linguagem so subdivididos em dois grupos: Comandos DDL (Data Definition Language) - Conjunto de comandos responsveis pela criao, alterao e deleo da estrutura das tabelas e ndices de um sistema. Comandos DML (Data Manipulation Language) - Conjunto de comandos responsveis pela consulta e atualizao dos dados armazenados em um banco de dados.

3. Comandos DDL

CREATE TABLE <nome-tabela> (<nome-coluna> , <tipo-do-dado> [NOT NULL] [NOT NULL WITH DEFAULT] ) PRIMARY KEY (nome-coluna-chave) FOREIGN KEY (nome-coluna-chave-estrangeira) REFERENCES (nome-tabela-pai) ON DELETE [RESTRICT] [CASCADE] [SET NULL]

ALTER TABLE <nome-tabela> DROP <nome-coluna> ADD <nome-coluna> <tipo-do-dado> [NOT NULL]
5

[NOT NULL WITH DEFAULT] RENAME <nome-coluna> <novo-nome-coluna> RENAME TABLE <novo-nome-tabela> MODIFY <nome-coluna> <tipo-do-dado> [NULL] [NOT NULL] [NOT NULL WITH DEFAULT] ADD PRIMARY KEY <nome-coluna> DROP PRIMARY KEY <nome-coluna> ADD FOREIGN KEY (nome-coluna-chave-estrangeira) REFERENCES (nome-tabela-pai) ON DELETE [RESTRICT] [CASCADE] [SET NULL] DROP FOREIGN KEY (nome-coluna-chave-estrangeira) REFERENCES (nome-tabela-pai)

DROP TABLE <nome> CREATE [UNIQUE] INDEX <nome-ndice> ON <nome-tabela> (<nome-coluna> [ASC ], [<nome-coluna> [ASC ] ]) [DESC] [DESC]

DROP INDEX <nome-ndice>


4. Comandos DML

INSERT INTO <nome-tabela> [(<nome-coluna>, [<nome-coluna>])] VALUES (<relao dos valores a serem includos>)

UPDATE <nome-tabela> SET <nome-coluna> = <novo contedo para o campo> [<nome-coluna> = <novo contedo para o campo>] WHERE <condio>

DELETE FROM <nome-tabela> WHERE <condio>

SELECT [predicado] FROM <nome-tabela> [, <nome-tabela>] DISTINCT WHERE <condio> GROUP BY <nome-coluna> HAVING <condio>
6

ORDER BY <nome-campo> ASC DESC


Predicado: um dos seguintes: ALL, DISTINCT, DISTINCTROW ou TOP. Padro: ALL. Exemplo:
SELECT Pedidos.NmeroDoPedido, Pedidos.DataDoPedido, Pedidos.PasDeDestino, Pedidos.Frete FROM Pedidos WHERE ((Year([DataDoPedido])=1995)) AND Pedidos.PasDeDestino) In ("Brasil","Argentina","Alemanha","Canad"))) ORDER BY Pedidos.NmeroDoPedido;

Year: funo que extrai o ano da data dada.

Você também pode gostar