17 de abril de 2018
Introdução
Tipos de análise
Exemplo de análise
Fontes utilizadas
OBJETIVO
O QUE É
O IRAMUTEQ é um software LIVRE desenvolvido com base no software R
(www.r-project.org) e na linguagem Python (www.python.org)
LACUNA Permite fazer análises estatísticas sobre corpus textuais e sobre tabelas
indivíduos/palavras. Ou seja, ele da um viés quantitativo para dados
qualitativos.
Introdução
Tipos de análise
Exemplo de análise
Fontes utilizadas
Segmento
de Texto
São fragmentos de texto, na maior parte das vezes, de três linhas (ou
configurado pelo pesquisador), dimensionadas pelo próprio software
em função do tamanho do corpus.
[EXEMPLO]
_Tema_Analytics
Tema ou Questão
Introdução
Tipos de análise
Exemplo de análise
Fontes utilizadas
ANÁLISES COM O
IRAMUTEQ
Lexográfica (Estatísticas
Básicas)
Especificidades e AFC
Similitude
Nuvem de palavras
ANÁLISES COM O
IRAMUTEQ
Frequências e Frequências
Múltiplas
Classificação hierárquica
descendente (CHD)
Análise de matrizes
Similitude
Prototípica
Lexográfica (Estatísticas
Básicas)
Especificidades e AFC
Similitude
Nuvem de palavras
ANÁLISES COM O
IRAMUTEQ
Frequências e Frequências
Múltiplas
Classificação hierárquica
descendente (CHD)
Análise de matrizes
Similitude
Prototípica
• Identifica e reformata as
unidades de texto
• Identifica a quantidade de
palavras, frequência média e
hapax (palavras com
frequência um)
• Pesquisa o vocabulário e reduz
das palavras com base em suas
raízes (formas reduzidas)
• Cria do dicionário de formas
reduzidas
• Identifica formas
ativas e suplementares
• A analise de correspondência
é especialmente indicada para
descrever matrizes com
grande volume de dados
Ind_Mpmt discretos e sem uma estrutura
Ind_Tecn
claramente definida a priori*
Ind_Vare • É realizada uma análise fatorial
Ind_Cons retomando as frequências e os
valores de correlação Qui2 de
Ind_Agen cada palavra do Corpus.
• No exemplo são apresentadas
as palavras que se destacam
tendo em vista a variável
selecionada (no caso,
Indústria)
* CARVALHO, M. S. & STRUCHINER, C. J. Correspondence Analysis: An Application of the Method to the Evaluation of Vaccination Services. Cad. Saúde Públ, Rio de Janeiro, 8 (3): 287-301,
jul/set, 1992
Ramificação 1 Ramificação 2
• Umas das análises mais
importantes do Iramuteq
• Segmentos de texto e
vocabulário são
correlacionados formando um
esquema hierárquico de
classes
• Esta análise visa obter classes
de segmentos de texto que,
Number of texts: 9 ao mesmo tempo,
Number of text segments: 958 apresentam vocabulário
Number of forms: 4160 semelhante entre si, e
Number of occurrences: 33406
Número de lemas: 2681 vocabulário diferente dos
Number of active forms: 2394 Mínimo segmentos de texto das
Número de formas suplementares: 27 outras classes (Camargo,
Número de formas ativas com a frequência >= 3: 917
de 70%
Média das formas por segmento: 34.870564 2005)
Number of clusters: 4
901 segments classified on 958 (94.05%)
CLASSE 2
• Fornece uma outra forma de
CLASSE 3 apresentação dos resultados
por meio de uma análise
fatorial de correspondência
feita a partir da CHD
CLASSE 4
CLASSE 1
* A teoria dos grafos é um ramo da matemática que estuda as relações entre os objetos de um determinado conjunto.
* A teoria dos grafos é um ramo da matemática que estuda as relações entre os objetos de um determinado conjunto.
• Agrupa as palavras e as
organiza graficamente em
função da sua frequência.
• É uma análise lexical mais
simples, porém graficamente
interessante
Introdução
Tipos de análise
Exemplo de análise
Fontes utilizadas
• Número de textos: 1
• Número de segmentos de texto: 39
• Número de formas: 497
• Número de ocorrências: 1450
2,92x
• Número de formas ativas: 254
ACME
• Número de clusters: 3
• 34 segmentos classificados em 39
(87.18%) - Retenção mínima de 75% dos
segmentos de texto
ATENDIMENTO
ATENDIMENTO
“chat piorou mudam suas “não tem como falar por telefone ligando
formas de pagamento sem sua de um celular”
autorização péssimos”
“não mandam fatura por email...absurdo”
ATENDIMENTO
“me disse que chegaria um boleto para o “5 vezes sendo que 4 vezes eu fiquei escutando
pagamento e não chegou fui no site e não uma música que dava sono que deve ser proposital
consegui tirar a 2 via do boleto” para gente desistir mesmo e na 5 finalmente
“fiz cartão em uma loja dia 2 de setembro e não me consegui falar com uma atendente”
enviaram o cartão ou qualquer boleto de cobrança
“uma informação simples como extrato ou
até que hoje me ligaram cobrando o valor com juros
consulta de saldo eles não conseguem dar”
por atraso da cobrança”
Às vezes da PAU!
Introdução
Tipos de análise
Exemplo de análise
Fontes utilizadas
• Website - http://www.iramuteq.org
• Download e instalação - http://www.iramuteq.org/telechargement
• Manuais em português (Google “manual iramuteq”)
- http://www.iramuteq.org/documentation/fichiers/Tutorial%20IRaMuTeQ%20em%20portugue
s_17.03.2016.pdf
- http://www.iramuteq.org/documentation/fichiers/tutoriel-en-portugais
- https://l3p.fic.ufg.br/up/771/o/Tutorial_-_Revis%C3%A3o.pdf
A melhor!
• LEPP-Saúde LEPP-Saúde
- 1. Instalação - https://www.youtube.com/watch?v=SoOzkpSedgQ&t=246s
- 2 Preparando banco de dados textuais - https://www.youtube.com/watch?v=ygKct1ps_2Y&t=9s
- 3 Funcionamento - https://www.youtube.com/watch?v=B-k6AatfIyM&t=339s
- 4. Estatísticas textuais - https://www.youtube.com/watch?v=T6LMIYxNJlA
- 5. Classificação Hierárquica Descendente - https://www.youtube.com/watch?v=H9xliY7Zy40&t=476s
- 6. Análise Fatorial Confirmatória (AFC) - https://www.youtube.com/watch?v=bEihghhSK-8
- 7. Análise de similitude - https://www.youtube.com/watch?v=F47NgaAbipI
- 8. Nuvem de palavras - https://www.youtube.com/watch?v=04GMBuyi-G8
- 9. Análise de matriz - https://www.youtube.com/watch?v=tYCTiH2PEJI