Você está na página 1de 10

• (“Data collect")

• AND ("Data Science")


• AND (“Big Data")
• AND (“Data mining")
• Reviews
Data Science

Big Data

Data mining

Web Mining
Mineração de Dados Mineração web
A mineração de dados envolve o uso de técnicas para A mineração na Web envolve a análise de registros
encontrar estrutura subjacente e relacionamentos em de servidores da Web de um site.
grandes quantidades de dados.
Aplicativos comuns de mineração de dados descobrem da mesma forma descobrir padrões em dados
padrões em dados estruturados como banco de dados. semiestruturados, como Internet
(WWW). Resumindo : Técnicas Mineração web é
Dados de mineração aplicadas ao WWW.
Ele pode lidar com grande quantidade de dados. Forma/coleta grande quantidade de dados

Ao fazer a mineração de dados de informações Para a mineração na web, os dados são públicos e
corporativas, os dados são privados e muitas vezes raramente exigem direitos de acesso.
requer direitos de acesso para ler.
Uma tarefa tradicional de mineração de dados obtém processar não estruturados ou semiestruturados
informações de um banco de dados, que fornece algum dados de páginas da Web. 
nível de estrutura explícita.
Kumar et al 2015
• (“Data collect")
• AND (“Web Mining") scholar

• Cerca 51 resultados

• (“collect")
• AND (“Web Mining")
Scopus

• Cerca 110 resultados


Web minings
Critérios
Adaptável temporal Adaptável regional Search and get it busca específica melhor robustez de busca
Info Track x x x
Topic Track x x x
Summarization x x x x
Categorization x x x x

m Clustering
Information vizualization
Web Crawler x
x x

x x
x
x
x
x
x
x

e Wrapper Generation
Page content mining
OEM x
x
x
x
x
x
x
x

t Top down Extraction


Web data Extration language
Skicat
x x
x
x x
x
x
x
x

s Color histogram Matching


Multimidia Miner
Shot bondary Detection
x
x
x
x
x
x
Semantic Web Mining
Mineração de texto Mineração web

Sub-domínio da Recuperação de Informações (IR) e Sub-domínio do IR e


Processamento de linguagem natural multimédia

Dados de texto: formulário livre, Dados semi estruturados: hiper-links e tags html
não estruturado e dados semiestruturado Tipo de dados multimídia: Texto, imagem, áudio, vídeo.

Gerenciamento de conteúdo e organização da informação. Gerenciamento/mineração de conteúdo, bem como


mineração de uso/tráfego.

Padrões são extraídos do texto da linguagem natural em vez Os padrões são extraídos da Web e não do banco de
de banco de dados estruturado. dados estruturado.
Exclui
Termos de busca Web of S Exclui
ndo todos
(Scholar) Science copus ndo
os repetidos
"Social Life Data mining 1 3
Cycle Web Scrapping 0 0
Assessment" Text mining 0 2
OR "SLCA" OR textual mining
"S-LCA" OR 0 0
"Social LCA“ content analysis 4 7
AND Data Science 0 0
Big Data 4 6
"inventory" 36 47
E Excluind
Termos de busca
Web of Science Scopus xcluind o todos os
Titulo e aBS e Key
o repetidos
“Data collect” OR Data mining 198 254
“Collecting Data” AND Big Data 165 293
Text mining 19 21
content analysis 4 164
Data Science 24 38
Web Scraping 2 10
Web Crawler 6 14
Web Mining 2 6

Você também pode gostar