Você está na página 1de 54

Tópicos Avançados de Bancos de Dados

Prof. Antonio Carlos
Faculdade Sumaré - 2013

Apresentação




Ementa
Plano de Aula
Avaliação
Aula introdutória

Ementa

Ao Final do Semestre o Aluno terá conhecimento do
estado da Arte de Banco de Dados

Competências e Habilidades





Datawarehouse
DataMining
Mecanismo de Busca/Relevância - PageRANK
Descoberta de Conhecimento Automatizada/KDD
Bancos não Relacionais

Plano de Aula

. e o plano de aula será reajustado.Avaliação ➲ Duas avaliações da instituição valendo +-75% da nota ➲ Uma ou Duas atividades valendo +-15% da nota ➲ Frequencia podendo valer até 10% da nota ➲ As Datas das atividades e provas dependem do calendario academico.

Histórico ➲ ➲ Sistemas Computacionais Comerciais ➲ Arquivos Banco de Dados Hierárquico/Rede .

Histórico ➲ ➲ Sistemas Computacionais Comerciais ➲ Arquivos Analise de Resultados ➲ Consultas e Relatórios ➲ Independência Banco de Dados Hierárquico/Rede .

Grupos de Trabalho ➲ Pesquisa e Explanação .Histórico ➲ ➲ Sistemas Computacionais Comerciais ➲ Arquivos Analise de Resultados ➲ Consultas e Relatórios ➲ Independência Banco de Dados Hierárquico/Rede ➲ Definir .

Projetando ➲ Entender o domínio do problema .

Projetando ➲ Entender o domínio do problema ➲ Sistema Convencional ➲ Sistema de Apoio a Decisão (BI) .

Projetando ➲ Entender o domínio do problema ➲ Sistema Convencional ➲ ➲ Faturamento ➲ Vendas ➲ RH ➲ Outros Sistema de Apoio a Decisão (BI) .

Projetando ➲ Entender o domínio do problema ➲ Sistema Convencional ➲ ➲ Faturamento ➲ Vendas ➲ RH ➲ Outros Normalização Sistema de Apoio a Decisão (BI) .

Projetando ➲ Entender o domínio do problema ➲ Sistema Convencional ➲ ➲ Faturamento ➲ Vendas ➲ RH ➲ Outros Normalização (Não Redundância) (Confiabilidade) Sistema de Apoio a Decisão (BI) .

Projetando ➲ Entender o domínio do problema ➲ Sistema Convencional ➲ Sistema de Apoio a Decisão (BI) ➲ Procurar Comportamentos/Repetições/Sazonalidade .

Projetando ➲ Entender o domínio do problema ➲ Sistema Convencional ➲ Sistema de Apoio a Decisão (BI) ➲ Procurar Comportamentos/Repetições/Sazonalidade ➲ Comprar melhor Suficiente Necessário Quando .

Projetando ➲ Sistemas de Apoio a Decisão (BI) ➲ Normalização? .

Projetando ➲ Sistemas de Apoio a Decisão (BI) ➲ Normalização? ➲ Se Aplica? .

10 ag-cod pic 9(5) 10 filler pic x 10 ag-dv pic 9 05 age-nome pic x(30). 05 agencia.. 05 conta.. ➲ Dado o Layout abaixo.. 10 cta-cod pic 9(6) 10 filler pic x 10 cta-dv pic 9 05 id pic x(15) 05 nome pic x(40) 05 endereco pic x(40) 05 complemento pic x(20) 05 cep pic x(9) 05 uf pic x(2) 05 cidade pic x(30) 05 produtos occurs 10 times 10 prd-cod pic 9(2) 10 prd-dsc pic x(20) 10 prd-vlr pic s9(9)v99 ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ ➲ .Projetando ➲ Exercitando. em grupo defina os passos para usar esta informação 01 Record 05 diretoria pic 9(5) 05 dir-nome pic x(30).

aprender com o padrão e usá-lo como parte da estratégia de negócios. identificar. .Mineração de Dados ➲ Procurar padrões de comportamento.

Padrões ➲ Repetições seguindo algum critério ➲ Ex. aprender com o padrão e usá-lo como parte da estratégia de negócios. identificar.: Temporal Gênero .Mineração de Dados ➲ ➲ Procurar padrões de comportamento.

:) ➲ Champanhe ➲ Panetone ➲ Abada .Mineração de Dados ➲ Temporal (ex.

Mineração de Dados ➲ Gênero ➲ Produtos ligados ao gênero do comprador. . eventualmente o parceiro pode efetuar a compra no seu lugar.

mas com proposta diferente em função da posição social do comprador .Mineração de Dados ➲ Padrão Social ➲ Produtos “concorrentes”.

Comércio. ➲ “Concluindo-se que a mineração é modelada a responder as dúvidas existentes no modelo de negócio afim de obter vantagem competitiva” .Mineração de Dados ➲ Claramente o exemplo acima. foi pensado para um modelo de negócio.

já pensando em que respostas este modelo poderá responder através de simulação .Mineração de Dados ➲ Uma forma de se iniciar a mineração de dados é criar o modelo.

➲ Após a validação inicial deste modelo. os dados deverão ser importados. já pensando em que respostas este modelo poderá responder através de simulação. eventualmente transformados antes de serem utilizados. .Mineração de Dados ➲ Uma forma de se iniciar a mineração de dados é criar o modelo. ajustados.

Mineração de Dados .

Page-Rank ➲ Qual é o principal uso da Internet? .

etc.Page-Rank ➲ Qual é o principal uso da Internet? ➲ R. . subida e descida de arquivos. Pesquisa. embora possamos fazer outros usos como pagamentos.

e quando se iniciou o seu uso intensivo.Page-Rank ➲ Pela sua própria natureza o conteúdo da Internet não é padronizado. ➲ Qual o maior problema que podemos encontrar na internet? . percebeu-se um grande problema.

percebeu-se um grande problema. ➲ Qual o maior problema que podemos encontrar na internet? ➲ R. encontrar as respostas “exatas” .Page-Rank ➲ Pela sua própria natureza o conteúdo da Internet não é padronizado. e quando se iniciou o seu uso intensivo.

encontrar as respostas “exatas” ➲ E o que utilizamos para isto? . percebeu-se um grande problema. e quando se iniciou o seu uso intensivo.Page-Rank ➲ Pela sua própria natureza o conteúdo da Internet não é padronizado. ➲ Qual o maior problema que podemos encontrar na internet? ➲ R.

mas existem outros tais como “ask”.Page-Rank ➲ R. é a referência para os motores de pesquisa. sendo de longe o mais utilizado.”bing” e outros tantos. Google. .

Page-Rank ➲ R. sendo de longe o mais utilizado. ➲ Mas o que explica o seu sucesso? .”bing” e outros tantos. mas existem outros tais como “ask”. é a referência para os motores de pesquisa. Google.

é a referência para os motores de pesquisa. . esta tecnologia é chamada de Page-Rank.”bing” e outros tantos.Page-Rank ➲ R. Google. sendo de longe o mais utilizado. ➲ Mas o que explica o seu sucesso? ➲ Sua Tecnologia para calculo de relevância das páginas. mas existem outros tais como “ask”.

o Google tem os direitos de licença exclusivos sobre a patente.org/wiki/PageRank . ➲ “O Sistema PageRank é usado pelo motor de busca Google para ajudar a determinar a relevância ou importância de uma página.8 milhões de ações do Google. ao Google cabe a marca registrada. pagando através de 1.wikipedia. Larry Page e Sergey Brin enquanto cursavam a Universidade de Stanford em 1.Page-Rank ➲ “PageRank” foi proposto pela universidade de STANFORD e patenteado. ➲ As ações foram vendidas em 2005 por 336 milhões de dólares.988” http://pt. Foi desenvolvida pelos fundadores do Google.

8 milhões de ações do Google.Page-Rank ➲ “PageRank” foi proposto pela universidade de STANFORD e patenteado.wikipedia. o Google tem os direitos de licença exclusivos sobre a patente. ➲ “O Sistema PageRank é usado pelo motor de busca Google para ajudar a determinar a relevância ou importância de uma página. ao Google cabe a marca registrada.org/wiki/PageRank ➲ Mas como funciona? . ➲ As ações foram vendidas em 2005 por 336 milhões de dólares. Larry Page e Sergey Brin enquanto cursavam a Universidade de Stanford em 1. pagando através de 1.988” http://pt. Foi desenvolvida pelos fundadores do Google.

o peso desta outra página é proporcional a indicação. cada documento(página) ganha um peso proporcional ao numero de relações que este documento possui. maior será o seu peso e se esta página referenciar a outra.Page-Rank ➲ ➲ A Ideia proposta é simples. Portanto quanto mais referências esta página possui. .

e estes mesmos webbots também vão votando nestas páginas ajudando a dar “peso” a página visitada. . uma cópia é enviada ao servidores do Google e armazenada. o Google criou alguns webbots.Page-Rank ➲ Bom mas como isto é feito? ➲ R. são pequenos robôs que ficam “navegando” pela internet e a cada página visita.

o Google criou alguns webbots. .Page-Rank ➲ Bom mas como isto é feito? ➲ R. uma cópia é enviada ao servidores do Google e armazenada. para evitar que um robô fique preso. e estes mesmos webbots também vão votando nestas páginas ajudando a dar “peso” a página visitada. são pequenos robôs que ficam “navegando” pela internet e a cada página visita. ➲ Naturalmente quanto mais a página for visitada pelos links que a ela levaram terá um peso maior. também é desnecessário dizer que os links são visitados apenas uma vez.

➲ Mas é possível manipular o resultado do PageRank com links descontextualizados ocasionando resultados pouco relevantes ou tendenciosos a esta falha é atribuída o termo Googlebombing. para evitar que um robô fique preso. E o Google tem removido estes resultados frequentemente. uma cópia é enviada ao servidores do Google e armazenada. . e estes mesmos webbots também vão votando nestas páginas ajudando a dar “peso” a página visitada. também é desnecessário dizer que os links são visitados apenas uma vez. logicamente que quando são percebidos.Page-Rank ➲ Bom mas como isto é feito? ➲ R. ➲ Naturalmente quanto mais a página for visitada pelos links que a ela levaram terá um peso maior. são pequenos robôs que ficam “navegando” pela internet e a cada página visita. o Google criou alguns webbots.

Page-Rank ➲ .

➲ “Você receberá apenas os links das páginas que contém os argumentos usados na pesquisa” ➲ “Quanto mais próximos os argumentos estiverem maior será a importância” ➲ “Você recebe um resumo/parte da página original. evitando navegar desnecessariamente” . ➲ “Você pode receber a página mesmo que o site original esteja fora” ➲ Pode acontecer do resultado estar desatualizado.Page-Rank ➲ Alguns benefícios citados pelo site do Google.

SAPO ➲ Guias Locais GUIAMAIS. Yahoo ➲ Verticais CATHO. LISTÂO. apresentação 10 minutos próxima aula ➲ Motores de Busca ➲ ➲ Globais BING. ACHECERTO Motores de Busca Acadêmica . ACHANOTICIAS.Page-Rank ➲ Trabalho em Grupo. BUSCAPE. ZURA.

Motores de Busca ➲ Basicamente Existem três tipos de motores de Busca: ➲ Diretórios ➲ Indexadores ➲ Metapesquisadores .

➲ Acreditando-se que a pessoa responsável tenha sido bastante rigorosa quanto ao conteúdo e relevância .Motores de Busca ➲ Diretórios ➲ O seu conteúdo é organizado e mantido por pessoas gerando grandes catálogos Vantagens ➲ ➲ Pouco ruído. ➲ Conteúdo melhor classificado.

. ➲ Necessitam de outros passos afim de garantir a qualidade mínima aceitável.Motores de Busca ➲ Indexadores ➲ O seu conteúdo é organizado e mantido por robôs gerando grandes bases Vantagens ➲ ➲ Muito conteúdo.

Vantagens ➲ ➲ Tempo.Motores de Busca ➲ MetaPesquisadores ➲ São ferramentas. . que permitem que se dispare várias pesquisas simultâneas para vários catálogos e Indexadores.

por conta da própria natureza da WEB.Motores de Busca ➲ Percebemos facilmente que o volume de informação na WEB. . a cada dia aumenta e com isto a localização de conteúdo relevante continua interminável.

➲ Mas Existe Solução? . por conta da própria natureza da WEB.Motores de Busca ➲ Percebemos facilmente que o volume de informação na WEB. a cada dia aumenta e com isto a localização de conteúdo relevante continua interminável.

➲ Através de Sites de Categorias IEEE. por conta da própria natureza da WEB. e tentar organizar melhor este conteúdo. mas existem alguns esforços para se divulgar “endereços” específicos para um domínio de conhecimento.Motores de Busca ➲ Percebemos facilmente que o volume de informação na WEB. A curto prazo não. a cada dia aumenta e com isto a localização de conteúdo relevante continua interminável. ➲ Mas Existe Solução? ➲ R. ou por exemplo Acadêmicos .

Revisão ➲ ➲ ➲ ➲ ➲ ➲ ➲ Motivação Banco de Dados(Aplicação/BI) Modelos de Banco/Normalização/Fat-Table Orientação a Negocio/BI Exportação/Transformação + Agregação dados externos Mineração de Dados Google (PageRank) Motores de Busca ➲ Indexadores ➲ Globais ➲ Locais .

wikipedia.com/2010/09/23/introducao-a-mineracao-de-dados-parte-1/ http://pt.Bibliografia ➲ ➲ http://litolima.org/wiki/PageRank .