Você está na página 1de 22

02/11/2021

Análise Qualitativa de Conteúdo: IRAMUTEQ

Apresentação cedida por Amélia Carvalho e Vítor Braga


CIICESI Workshop

Análise Qualitativa
According to Scapens (2006)

• No single clear definition


• No unified set of philosophies or According to Mason (2002) qualitative research
techniques should be:
• More than “not quantitative”
• Lots of different techniques and methods Systematically and rigorous conducted
Clear and deep
Flexible about the design
Self critical

O objetivo dos estudos qualitativos passa por ganhar um profundo conhecimento de um


fenómeno (Carson et al., 2001) que é conseguido pela imersão do investigador no contexto
do fenómeno a ser estudado (Patton, 1990).

1
02/11/2021

Análise Conteúdo
• Técnica de investigação utilizada para determinar a presença de certas
palavras, temas ou conceitos, no contexto da análise de dados
qualitativos.

• Permite quantificar e analisar a presença, relações e interação entre


certas palavras, temas ou conceitos

Análise Conteúdo – Fontes de dados


• Entrevistas
• Questões abertas
• Notas de investigação
• Conversações
• Feed de notícias e posts de social media
• Discursos
• Livros e/ou outros documentos escritos
• Documentos históricos
• Notícias e títulos de jornais e notícias
• Abstracts
• … qualquer outra ocorrência da linguagem e da comunicação

2
02/11/2021

IRAMUTEQ
Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires

Ferramenta de Processamento de Dados

Análise Qualitativa

INSTALAÇÃO


Abrir R
Instalação
Atualizar pacotes: Packages & data > package Installer

• Instalar Iramuteq <


https://sourceforge.net/projects/iramuteq/files/latest/download >

No Iramuteq:
Definições> Idioma da interface> Portuguese>Verificar>Ok

• Problemas específicos em instalar no MAC:

Escrever Terminal no find que aparece quando colocamos Command+espaço


Terminal >. (aparece uma janela preta de comandos)
• Depois colocar as seguintes linhas de comando e clicar em Enter:

3
02/11/2021

Tratamento do Texto
Tratamento no IRAMUTEQ pressupõe a existência de, pelo menos, 20 entrevistas ou textos
para uma maior otimização dos resultados.

Corpus ou Corpo – todas as entrevistas ou textos em análise


Texto – cada entrevista
Segmento – cada 3 linhas cada segmento de texto ( +/- 40 palavras)

Todas as entrevistas deverão constar num único documento.

Tratamento do Texto
Dever-se-á proceder à “limpeza” do texto:

ü O documento é um só para o Corpus.


ü Não colocar a pergunta só a resposta, apenas a resposta sem divisões.
ü Corrigir os erro de escrita e não deixar parágrafos.
ü Não usar o negrito (Bold); nem texto alinhado; nem itálico.
ü Para um nome que queremos ler sempre igual usamos o underline__ pois o programa entende as
palavras separadas e.g.: Politécnico_do_Porto ou EIPP. Caso contrário ele lê 3 palavras.
ü Retirar hífens e colocar underline, e.g. sexta_feira
ü Não utilizar os pronomes com o hífen, e.g. não escrever “faz-me” mas sim “me faz” usando na forma
próclise.
ü Utilizar números em algarismos (12) e não por extenso.
ü Não usar carateres ("; `; -; €; %; ...; *)

4
02/11/2021

Tratamento do Texto
Cada novo documento colocar no início uma linha de comando com (****)
Seguida outro * e colocar o nome das variáveis que queremos (características a estudar, pe. idade; género; profissão....)

Vamos querer analisar as que são importantes para o estudo e, posteriormente, poder fazer comparações entre grupos
comparando as variáveis em estudo.

As variáveis serão sempre separadas por * e por underline _ e devem conter carateres de letras de A-Z ou 1-9.

Ex: **** *Estu_07 *ida_18 *sex_01 *

Não posso colocar a pergunta só a resposta, apenas a resposta sem divisões.


Cada novo texto (entrevista) terá nova linha de comando. E poderá ter um novo conteúdo/tema/pergunta dentro da
própria entrevista.

_*Tema_profissão
_*Tema_avaliação
_*Pergunta_4

Importante:
Guardar como numa pasta e com texto sem formatação num (*.txt) (bloco de notas); outra codificação; Unicode (UTF-8).

Idade: 24
Sexo: feminino
Ciclo de estudo em 2019/2020: Licenciatura
Entrevista
Ensino a distância no período da pandemia
• Como descreve a experiência de ensino a distância que viveu durante o 2º semestre do ano letivo anterior?
(Entrevistador deve tentar perceber se, globalmente, a experiência foi mais positiva ou não que o tradicional ensino presencial)

“Foi um desafio, sem dúvida. Foi… foi um grande desafio, porque… acho que ninguém estava preparado para ter de experienciar
algo como uma pandemia. E… no início de uma licenciatura muito mais, porque ainda estamos a aprender e precisamos daquele
contacto com os professores. E ter de estar o dia inteiro em frente ao computador e depois tentar acompanhar com o estudo em
casa, mas com uma casa cheia de gente, no meu caso, foi… foi um grande desafio. Mas… foi concretizado. Consegui. Mas acho que
não gostava de repetir.
E… é assim, eu acho que nós compreendemos o esforço de toda a gente, principalmente dos professores… E sinto que conseguiram
acompanhar-nos. Por exemplo, eu contactava imenso com os professores por e-mail e estavam sempre disponíveis para tirar
dúvidas, uma vezes mais rápido, outras vezes não tao rápido. E… muitas vezes marcávamos reuniões por Zoom extra para tentar
contactar com eles, mas mesmo assim não é aquela proximidade das aulas, em que nós temos uma dúvida e eles estão lá e
explicam e se não percebemos voltam a explicar. Numa aula no Zoom… é… é um bocadinho mais difícil. E depois… a nível da
participação, nem toda a gente participava; havia câmaras que estavam desligadas, outras ligadas… E também sinto que os
professores também tinham aquele feedback negativo de: um aluno está com a câmara ligada, mas o resto está tudo com o ecrã
preto e sente que está a dar aula para ninguém e, se calhar, o empenho… ou a motivação… de estar ali, explicar uma e outra vez,
não é tanta como numa aula, em que uma pessoa levanta o braço e eles explicam.”

10

5
02/11/2021

TXT. IRaMuTeq
• **** *ESTUDANTE_ESCOLA_1_ENSDIS *ida_24 *sex_02 *ciclo_01 *ano_1

• Foi 1 grande desafio, porque ninguém estava preparado para ter de experienciar algo como 1 pandemia. E no início de 1 licenciatura muito mais, ainda
estamos a aprender e precisamos do contacto com os professores. estar o dia inteiro em frente ao computador e depois tentar acompanhar com o
estudo em casa, mas com 1 casa cheia de gente, no meu caso, foi 1 grande desafio. Mas foi concretizado. Consegui. Mas acho que não gostava de
repetir. E é assim, eu acho que nós compreendemos o esforço de toda a gente, principalmente dos professores e sinto que nos conseguiram
acompanhar. Por exemplo, eu contactava imenso com os professores por email e estavam sempre disponíveis para tirar dúvidas, 1 vezes mais rápido,
outras vezes não tao rápido. E muitas vezes marcávamos reuniões por Zoom extra para tentar contactar com eles, mas mesmo assim não é aquela
proximidade das aulas, em que nós temos 1 dúvida e eles estão lá e explicam e se não percebemos voltam a explicar. Numa aula no Zoom é 1
bocadinho mais difícil. E depois a nível da participação, nem toda a gente participava; havia câmaras que estavam desligadas, outras ligadas e também
sinto que os professores também tinham aquele feedback negativo de: 1 aluno está com a câmara ligada, mas o resto está tudo com o ecrã preto e
sente que está a dar aula para ninguém e, se calhar, o empenho ou a motivação de estar ali, explicar 1 e outra vez, não é tanta como numa aula, em
que 1 pessoa levanta o braço e eles explicam. O Moodle foi o que utilizamos. Foi o Moodle e até foi bastante acessível, porque os professores
colocavam lá os materiais e nós utilizávamos e tentávamos fazer por nós próprios, mas sinto que, a nível de trabalhos, tivemos muito mais trabalhos
este semestre, em regime de pandemia, do que tínhamos normalmente. Sinto que a carga de trabalho foi muito maior. O que para mim foi a
experiência mais negativa, deste período na pandemia, foi a carga de trabalhos que nós tínhamos, porque já tínhamos aqueles trabalhos_de_grupo
normais no primeiro_semestre, mas este semestre foi horrível, foi trabalhos_individuais, trabalhos_em_grupo. E, como ninguém sabia muito bem como
é que se ia desenrolar o semestre, deixámos tudo 1 bocadinho para o fim. Os professores também, no fim, tentaram nos ajudar: Ai, não vamos fazer
frequência, vamos fazer por trabalhos. Só que tínhamos aquele período curtinho para fazer o trabalho. E tentar reunir em grupo no Zoom, também é
aquela coisa. Toda a gente está à distância, cada 1 faz a sua parte, depois temos de juntar. A coisa não corre bem. Mas resultou e estou muito
agradecida também pelo facto de os professores tentarem nos ajudar ao máximo na questão das frequências. Muitos teve de ser frequência, não havia
opção. Mas, ao tentarem substituir frequências por trabalhos, também ajudou, porque eram muitas cadeiras e essa parte foi positiva. Agora tantos
trabalhos foi complicado. O contacto com os professores. Eu sinto que tive até 1 contacto maior neste semestre, assim online do que presencialmente,
porque é mais complicado quando estamos numa sala cheia de alunos e tecnicamente temos de esperar pela nossa vez. O professor às vezes não
consegue dar tanta atenção a 1 aluno, porque tem 1 turma inteira com questões e não pode ir a todos ao mesmo tempo. Aqui, acho que consegui,
porque quando tinha alguma dúvida, enviava 1 e_mail; muitas vezes os professores até diziam: Não, vamos marcar 1 reunião, e presencialmente, assim
a eu conseguir ver a cara. Eles tentavam explicar 1 e outra vez. Foram muito acessíveis nesse aspeto e nessa parte gostei. Sinto que até conseguimos
criar 1 maior relação com os professores este semestre do que no primeiro_semestre que só os víamos 2 vezes por semana e pronto. É assim, a
situação ideal era ter sido presencial.

11

Análise do IRaMuTeQ
O IRAMUTEQ realizada dois grupos de análise: Análise de Texto e Matriz de Dados.

Análise de Texto: corpo de texto teremos as entrevistas ou discursos ou questionários

A. Análise Estatística - Estatísticas de Texto (análise lexicográficas)

B. Especificidades e AFC (onde se vê as diferenças de discurso por grupo e características, analise fatorial (e o 𝒳2 ).

C. Analise de Similitude (raiz da árvore dando destaque às palavras que mais se repetem e aparecem nas
ramificações próxima dessas palavras).

D. Nuvem de Palavras (o tamanho na nuvem reflete a importância da palavra no texto).

E. Classificação Hierárquica Descendente (CHD – Método de Reinert) distribuição das palavras e falas em classes.
Pega nas palavras de acordo com o segmento do texto e coloca em cluster ou categoria, por cores e classes.
Sendo possível classificar e nomear a classe.

12

6
02/11/2021

Análise do IRaMuTeQ
O IRAMUTEQ realizada dois grupos de análise: Análise de Texto e Matriz de Dados.

Matriz de dados (utiliza evocações – quantas vezes aparecem as palavras, 𝒳2)

Matriz de dados
Frequências
Análise de Similitude
Análise prototípica

13

Abrir ficheiros

14

7
02/11/2021

Abrir ficheiros

Português

15

Estatística de Texto

Entrar em
Propriedades
Chaves

16

8
02/11/2021

Estatística de Texto

0 = ELIMINAR

1 = ATIVAS

2 = SUPLEMENTARES

17

Estatística de Texto
O Iramuteq utiliza a raiz das palavras e ignora o
tempo verbal, género ou plural.
P.e Trabalho; Trabalhando; Trabalhador;
trabalhoso ....o que é analisado é “Trabalh”

A partir daqui vê a frequência das palavras e cria


dicionários de formas .

Classificam-se como 1 - Ativas; 2 -


Suplementares; 0 - Eliminadas. Ou seja eu vou
dizer se os adjetivos, substantivos, verbos ou
advérbios, etc são palavras que devem ser ativas,
suplementares ou se devem ser eliminadas da
análise a realizar.
0 = ELIMINAR

1 = ATIVAS

2 = SUPLEMENTARES

18

9
02/11/2021

Estatística de Texto

19

Estatística de Texto

retirar alguma palavra que


não faça sentido na análise

20

10
02/11/2021

Estatística de Texto

Hapax = Palavras que


se encontram,
apenas, 1 vez no texto

21

Especificidades e AFC

• Análise de contrastes, em que o corpus do texto é comparado


em termos de uma determinada variável .
• É representado no plano factorial.
• As palavras são identificadas e quantificadas em termos de
frequência e até mesmo a posição dentro do texto.

22

11
02/11/2021

Especificidades e AFC

23

Especificidades e AFC

24

12
02/11/2021

Especificidades e AFC

25

Especificidades e AFC

26

13
02/11/2021

Especificidades e AFC

27

Análise de Similitude
• Baseada na teoria dos grafos (teoria que estuda as relações
entre quaisquer dois objetos discretos)
• Identifica co-ocorrências entre palavras e mostra a sua
associação
• Organizar a distribuição do vocabulário de forma facilmente
compreensível e visualmente clara

28

14
02/11/2021

Análise de Similitude

29

Análise de Similitude

30

15
02/11/2021

Análise de Similitude

31

Análise de Similitude

32

16
02/11/2021

Análise de Similitude

33

Análise de Similitude

34

17
02/11/2021

Nuvem de Palavras

• Agrupa as palavras e organiza-as de acordo com a sua frequência


• O tamanho das palavras varia em função da sua frequência no
corpus do texto
• A disposição das palavras também dá indicação da relação entre
elas
• Análise lexical mais simples, porém graficamente bastante
interessante, na medida em que possibilita uma rápida identificação
das palavras-chave de um corpus

35

Nuvem de Palavras

36

18
02/11/2021

Nuvem de Palavras

37

Nuvem de Palavras

38

19
02/11/2021

Classificação Hierarquica Descendente

• Text Analysis > Clustering > Reinert’s Method


• Correlaciona os segmentos de texto, agrupando-os num esquema
hierárquico de classes.
• Permite nomear as classes
• Coloca nas categorias as palavras que se repetem.
• Agrupar os segmentos dos textos e vocabulário corelacionando-os
por conteúdos, tema ou semelhanças e o investigador pode dar
nome às classes analisando o conteúdo.

39

Classificação Hierarquica Descendente

https://www.youtube.com /watch?v=H9xliY7Zy40&list=PLW kv7m RAPYY_u765r-KPEnKQ-CvURayNA&index=5

40

20
02/11/2021

Classificação Hierarquica Descendente


Exploração do texto com
operações de codificação
passando por cortar texto
em unidades ou segmentos
por forma a definir regras de
contagem, classificação e
agregação da informação em
categorias temáticas.

Teremos que fazer depois o


tratamento de interpretação
por inferência.

Simple on text segment


(porque pressupomos que as
entrevistas sejam longas)
mas podemos mexer nos
valores para reduzir.

41

Classificação Hierarquica Descendente

Codificação das unidades de


análise em categorias e
comparação das categorias
entre si para que se possa
agrupar em temas e procurar
possíveis associações.

42

21
02/11/2021

Classificação
Hierarquica
Descendente

Estudo sobre EaD


(Fonte: EIPP)

Dendrogram of the corpus of the students’


interviews (Clustering Analysis)

Exemplo de texto para o relatório final:

-O corpus geral é constituído por 4 textos, separados em 206 segmentos de texto (ST), o software retirou aproveitamento de 75.66% da informação ou seja 156 ST.
-Foram analisadas 8758 palavras das quais 1523 são palavras distintas, onde se destacam 923 formas ativas e 95 formas suplementares.
- Do corpus geral, surgem 2 subcorpus categorizado em 4 classes: classe 1 com 43 ST (27,56%); classe 2, com 40 ST (25,64%); classe 3, com 44 ST (28,21%); e classe 4,
com 29 ST (18,59%).

Todas as palavras detêm um p-value <0.05 para o teste do qui- quadrado. Aos subcorpos e às classes foi atribuído uma codificação de acordo com as palavras que
agregam nas suas classes. O teste do Qui-quadrado foi verificar as palavras com vocabulário similar e vocabulário distinto em cada classe.

43

Análise Estatística
• Links de interesse:
– Instalação: https://www.youtube.com/watch?v=SoOzkpSedgQ&list=PLWkv7mRAPYY_u765r-KPEnKQ-
CvURayNA&index=1
– Preparação dos textos https://www.youtube.com/watch?v=ygKct1ps_2Y&list=PLWkv7mRAPYY_u765r-KPEnKQ-
CvURayNA&index=2
– Funcionamento: https://www.youtube.com/watch?v=B-k6AatfIyM&list=PLWkv7mRAPYY_u765r-KPEnKQ-
CvURayNA&index=3
– Estatisticas Textuais: https://www.youtube.com/watch?v=T6LMIYxNJlA&list=PLWkv7mRAPYY_u765r-KPEnKQ-
CvURayNA&index=4
– AFC: https://www.youtube.com/watch?v=bEihghhSK-8&list=PLWkv7mRAPYY_u765r-KPEnKQ-CvURayNA&index=6
– Análise de Similitude: https://www.youtube.com/watch?v=F47NgaAbipI&list=PLWkv7mRAPYY_u765r-KPEnKQ-
CvURayNA&index=7
– Nuvens de palavras: https://www.youtube.com/watch?v=04GMBuyi-G8&list=PLWkv7mRAPYY_u765r-KPEnKQ-
CvURayNA&index=8

44

22

Você também pode gostar