Escolar Documentos
Profissional Documentos
Cultura Documentos
Objetivos
Referencial Teórico
Metodologia dos Experimentos
Experimentos
Resultados
Conclusão
24 de junho de 2010
Motivação
Crescimento espantoso da audiência das Redes Sociais na Web;
Público passa a ganhar maior espaço de decisão e transformação de
conteúdo;
Interesse em captar a percepção de usuários sobre determinados
temas, marcas ou produtos.
Objetivos
Problema
Como captar de forma fácil e eficiente a percepção dos usuários e como
identificar o sentimento por trás das postagens?
Ideia
Aplicar algoritmos de classificação (previsão de classes) a fim de se obter
informação quantitativa e qualitativa dos posts.
Proposta
Estudar, aplicar e comparar algoritmos de classificação de texto buscando
a melhor técnica para detectar o sentimento presente em posts no Twitter.
Naive Bayes
Naive Bayes
P(tokeni |classe)P(classe)
P(classe|documento) = P(tokeni )
Metodologia
API Twitter
Interface de exibição e classificação do conteúdo
Acurácia
Matriz de Confusão
Experimentos
Velox
Caracterı́sticas
413 postagens
333 negativos, 36 neutros, 44 positivos
Velox
SVM
Cross-validation: (341/413) 82,6%
a b c
a - neg 330 0 3
b - neu 34 2 0
c - pos 35 0 9
Velox
Bayes
Cross-validation: (313/413) 75,8%
a b c
a - neg 294 20 19
b - neu 26 3 7
c - pos 25 3 16
Velox
Considerações:
SVM obteve melhores resultados com validação cruzada
Bayes apresentou resultados superiores ao SVM quando o arquivo de
treino era relativamente grande (40% da base) (Acurácia: 89.1% e
92.2% quando a distribuição no treino era equivalente)
Tanto o Bayes(=54%) quanto o SVM(=44%) obtiveram resultados
inferiores quando o treino foi balanceado.
Honda
Caracterı́sticas
188 postagens
16 negativos, 164 neutros, 8 positivos
Honda
SVM
Cross-validation: (163/188) 86,7%
a b c
a - neg 2 14 0
b - neu 2 161 1
c - pos 0 8 0
Honda
Bayes
Cross-validation: (154/188) 82,3%
a b c
a - neg 6 10 0
b - neu 5 151 5
c - pos 0 7 1
Honda
Considerações:
SVM obteve melhores resultados com a validação cruzada
Bayes apresentou resultados superiores ao SVM com arquivo de treino
maior (40% da base) (Acurácia: 95.6%)
O Bayes obteve acurácia de 55.1% contra 90.9% do SVM quando o
treino foi feito balanceado.
Conclusão