Escolar Documentos
Profissional Documentos
Cultura Documentos
Seja bem-vindo!
Business Analytics
Business Analytics
KD Process
KD
Process
Business Analytics
Business Analytics
Processo de KDD
• Identificação do problema
• Pós-processamento
Business Analytics
Processo de KDD
Identificação do problema
Business Analytics
Processo de KDD
Pré-processamento
Business Analytics
Processo de KDD
Mineração de Dados
(Data Mining)
Business Analytics
Processo de KDD
Pós-processamento
Business Analytics
• Seleção de documentos
• Definição do tipo de abordagem dos dados (análise semântica ou estatística)
• Preparação dos dados
• Indexação e normalização
• Cálculo da relevância dos termos
• Seleção dos termos
• Pós-processamento (análise de resultados)
Business Analytics
Análise Semântica
Business Analytics
Análise Estatística
Business Analytics
Análise Estatística
• Modelo Booleano
• Modelo Espaço-Vetorial
• Modelo Probabilístico
• Modelo Difuso (Fuzzy)
• Modelo de Busca Direta
• Modelo de Clusters
• Modelo Lógico
• Modelo Contextual ou Conceitual
Business Analytics
Indexação e Normalização
Business Analytics
Indexação e Normalização
Business Analytics
Indexação e Normalização
• Identificação de Termos
▪ Identificação de Termos Simples
▪ Identificação de Termos Compostos
• Remoção de Stopwords
• Normalização Morfológica (Stemming)
▪ Método do Stemmer S
▪ Método de Porter
▪ Método de Lovins
Business Analytics
Portuguese Stemming
Business Analytics
Portuguese Stemming
1- Redução do Plural
2- Redução (ou Remoção) do Feminino
3- Remoção de Advérbio
4- Remoção de Aumentativo e Diminutivo
5- Remoção de Sufixos em Nomes
6- Remoção de Sufixos em Verbos
7- Remoção de Vogais
8- Remoção de Acentos
Business Analytics
Cálculo da Relevância
Business Analytics
Cálculo da Relevância
A este grau de relacionamento de uma palavra com um texto dá-se o nome de peso.
Frequência Absoluta
Frequência Inversa de
Documentos
Business Analytics
Seleção de Termos
Business Analytics
Seleção de Termos
Seleção por Análise de Co-ocorrência
RWeka
Business Analytics
RcmdrPlugin.temis
Graphical Integrated Text Mining Solution
Business Analytics
Pacote tm
Framework para Aplicações de Text Mining em R
Business Analytics
languageR
Analisando Dados Linguísticos
Business Analytics
koRpus:
Análise de Texto
Business Analytics
RKEA
Extração de Keywords em Textos
Business Analytics
lsa
Latent Semantic Analysis
Muito obrigado!