Escolar Documentos
Profissional Documentos
Cultura Documentos
RESUMO
O trabalho discute a utilizao conjugada de um software desenvolvido para a anlise textual e de
um procedimento de anlise de contedo clssica. O software ALCESTE apia-se em clculos
efetuados sobre a co-ocorrncia de palavras em segmentos de texto, buscando distinguir classes
de palavras que representem formas distintas de discurso sobre o tpico de interesse da
investigao. A anlise de contedo tambm identifica a pluralidade temtica presente num
conjunto de textos, e pondera a freqncia desses temas no conjunto, permitindo, via
comparao entre os elementos do corpus (palavras ou sentenas), a constituio de
agrupamentos de elementos de significados mais prximos, viabilizando a formao de categorias
mais gerais de contedo. O trabalho se vale de exemplos em que ambos os procedimentos foram
efetuados a partir do um mesmo banco de dados textuais e discute possveis limitaes e
vantagens em relao utilizao em separado de cada um deles.
Palavras-chave: Metodologia, anlise lexical, Alceste, anlise de contedo.
ABSTRACT
This work discusses the conjugate use of a textual analysis software and a classical content
analysis procedure. The ALCESTE software is based on calculations performed on simultaneous
occurrence of words in text segments, aiming to distinguish classes of words that represent
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006
72
distinct forms of discourse on the topic in which the investigation is interested. The content
analysis also identifies the thematic plurality present in a set of texts, and weighs the frequency of
these themes in the set, allowing, by comparison between elements of the corpus (words or
sentences), the constitution of groupings of elements of closest signification, thereby making
possible the formation of more general content categories. This work uses examples in which both
procedures were carried out upon the same textual data base and discusses possible limitations
and advantages with respect to the separate use of each of them.
Keywords: Methodology, lexical analysis, Alceste, content analysis.
73
postulado como uma idia de um indivduo psquico, sendo que essa idia se refere a um objeto,
mas tambm, ao mesmo tempo, ao prprio sujeito. essa dupla referncia que permite a
formao da representao de um objeto. Por extenso, a regularidade de representaes entre
indivduos pode promover a existncia de um determinado contexto tpico de um grupo, uma
representao coletiva, um mundo. Segundo Reinert (1990, p.32):
As representaes locais, mltiplas, imediatas, associadas aos enunciados de um corpus se
organizam em funo de leis especficas identificando tipos de mundos. Seus traos na lngua s
podem ser revelados atravs de um grande nmero de enunciados semelhantes, de um
determinado ponto de vista. A representao que podemos ter desses mundos atravs do corpus
estudado pode ser freqentemente arcaica [rudimentar], pois que ela no est diretamente
anunciada no corpus e que ns a revelamos atravs de uma anlise estatstica bastante grosseira,
por uma classificao.
A regularidade de um vocabulrio especfico indica a existncia de certo campo contextual, um
espao semntico especfico. Reinert (2001) prope a extenso desse espao idia de fundo
associativo ou fundo tpico, revelado atravs da co-ocorrncia das chamadas palavras
plenas, que devem ser entendidas como algo que excede os significados anotados nos
dicionrios, uma vez que se inscrevem na histria dos falantes, pois so utilizadas como uma
atualizao do prprio sujeito e de seu campo de referncia aos objetos num aqui e agora do
discurso.
Observe-se, entretanto, que, em seu aspecto operacional, o objetivo do Alceste no o clculo do
sentido, mas a organizao tpica de um discurso ao colocar em evidncia os mundos lexicais.
No Alceste, o vocabulrio de um enunciado constitui um trao, uma referncia, um
funcionamento, enfim, uma inteno de sentido do sujeito-enunciador. Para esse mtodo, que
no esconde seu fundamento lexicomtrico, os traos mais fortemente caractersticos desse
funcionamento do lxico so os mundos lexicais (KALAMPALIKIS, 2003, p. 151).
Kalampalikis (2003) acrescenta que tais mundos lexicais s podem ser entendidos num
esquema maior de relaes: s h a possibilidade de significao de um mundo lexical, se h
um outro mundo lexical que o defina por contraste ou complementaridade. De forma mais
direta,
o pressuposto de Alceste que pontos diferentes de referncia produzem diferentes maneiras de
falar, isto , o uso de um vocabulrio especfico visto como uma fonte para detectar maneiras
de pensar sobre um objeto. O objetivo de uma anlise com Alceste, portanto, distinguir classes
de palavras que representam diferentes formas de discurso a respeito do tpico de interesse
(KRONBERGER; WAGNER, 2002, p. 427).
Esto descritas a seguir algumas das principais operaes realizadas nas quatro etapas do
procedimento Alceste. Inicialmente, a definio de alguns termos (REINERT, 1998):
UCI: Unidade de Contexto Inicial - Unidade a partir da qual o programa efetuar a fragmentao
inicial. Pode ser um captulo de livro, uma matria jornalstica, uma resposta de entrevista. Nos
exemplos utilizados no presente texto trata-se de uma letra de msica.
UCE: Unidade de Contexto Elementar - Definida segundo critrios de tamanho do texto (nmero
de palavras analisadas) e pontuao. a partir do pertencimento das palavras de um texto a
uma UCE, que o programa Alceste vai estabelecer as matrizes a partir das quais ser efetuado o
trabalho de classificao (REINERT, 1998, p. 17).
UC: Unidade de Contexto - Agrupamento de UCE sucessivas dentro de uma mesma UCI, at que o
nmero de palavras diferentes analisadas (contidas nessa unidade de contexto) seja superior ao
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006
74
limiar fixado na anlise. (...) Esse limiar fixado proporcionalmente ao nmero de palavras
analisadas. As UC devem ter uma homogeneidade semntica e devem ser de tamanho
comparvel. Ou seja, so unidades estatsticas de pesos idnticos. Elas esto na base de todas as
estatsticas efetuadas (REINERT, 1998, p. 18).
Classe: pode ser definida como um agrupamento constitudo por vrias UCE de vocabulrio
homogneo.
Lematizao: operao de substituio de certas palavras por uma forma reduzida, que permite
ao programa considerar equivalentes palavras com radical comum, que significam
aproximadamente a mesma coisa, mas que diferem quanto ao gnero, ao nmero ou ao fato de
serem substantivos, adjetivos ou advrbios. Por exemplo: AMOR, AMORES, AMOROSOS, so
substitudas no texto pela forma AMOR+.
AFC: Anlise Fatorial de Correspondncia. Cruzamento entre o vocabulrio (considerando a
freqncia de incidncia de palavras) e as classes, gerando uma representao grfica em plano
cartesiano, na qual so vistas as oposies entre classes ou formas.
Quatro etapas de procedimento compem o mtodo Alceste. A primeira (A) refere-se a uma
leitura do texto e aos clculos dos dicionrios. O programa gera inicialmente a listagem em
ordem alfabtica de todo o vocabulrio do corpus. Dessa lista deriva uma segunda, composta
pelas formas reduzidas e palavras representadas por essas formas reduzidas, ou seja, um
dicionrio de formas reduzidas. Uma outra lista produzida com as formas reduzidas mais
freqentes. Adjetivo, substantivo, pronomes, artigos so algumas das chaves categoriais
utilizadas pelo programa nessa etapa para a primeira classificao do vocabulrio. Deve-se
observar que o programa possui dicionrios acoplados (inclusive de portugus), o que permite
identificar diferentes conjugaes verbais, bem como diferenciar palavras com funo puramente
sinttica (pronomes, artigos, advrbios) daquelas com contedo (verbos, substantivos,
adjetivos). Tal procedimento relevante, pois com essa segunda classe de palavras, sobretudo,
que o programa vai trabalhar.
Na etapa B so selecionadas as formas reduzidas com freqncia maior ou igual a 04. Nessa
etapa, tambm, que so definidas as UCE, o que se d, como j foi visto, segundo o critrio de
tamanho do texto ou de pontuao (por exemplo, ponto final = fim de uma UCE). Nessa etapa o
Alceste realiza o clculo de trs cruzamentos (Classificao Hierrquica Descendente - CHD): a)
Todas as UCE x todas as formas reduzidas; b) UC tamanho 1 x formas reduzidas selecionadas; c)
UC tamanho 2 x formas reduzidas selecionadas. formada uma matriz para cada um desses
cruzamentos, na qual os valores 0 e 1 indicam, respectivamente, ausncia ou presena de
determinada palavra em uma UCE ou UC. A lgica do uso de dois tamanhos de UC esclarecida
adiante.
O conjunto total de unidades contextuais na matriz de indicadores inicial (unidades contextuais
por palavras) constitui a primeira classe. O objetivo do prximo passo conseguir uma diviso
dessa classe em duas, que separem, da maneira mais ntida possvel, as classes resultantes, de
tal modo que as duas classes contenham diferentes vocabulrios e, no caso ideal, no contenham
nenhuma palavra sobreposta (KRONBERGER; WAGNER, 2002, p. 429).
O procedimento continuamente efetuado at que no resulte em novas classes. Na anlise
standard, os tamanhos diferenciados de UC so definidos pelo programa (podendo tambm ser
alterados pelo pesquisador, assim como vrios outros parmetros do Alceste) e se referem ao
encadeamento de UCE sucessivas at que o nmero de palavras selecionadas seja maior ou igual
ao valor estipulado. O objetivo de clculos com dois valores de UC avaliar se o tamanho do
texto a ser considerado pode interferir na formao das classes.
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006
75
Na etapa C os valores obtidos nas duas ltimas CHD so comparados, e apenas a parte estvel
dos resultados considerada na determinao dos perfis de classe, definidos pelo Q de
associao das formas reduzidas s suas respectivas classes. Relacionada a essa etapa est a
Anlise Fatorial de Correspondncia que efetua o cruzamento entre as formas reduzidas com
freqncia maior do que 08 e as classes formadas.
A etapa D destina-se aos clculos complementares e nela so formadas as listas de formas
reduzidas associadas a contextos, que correspondem s classes anteriormente formadas e
possibilitam a identificao das UCE caractersticas de cada uma das classes. So identificados
ainda os segmentos repetidos, isto , os trechos de frases mais recorrentes em cada classe. Por
fim, realiza-se a Classificao Hierrquica Ascendente que consiste no cruzamento entre as UCE
das classes e as formas reduzidas caractersticas da mesma classe.
Para os resultados de algumas das operaes, informaes complementares: Segundo Reinert
(2001, p. 34),
as classes obtidas [na anlise] podem ser interpretadas de trs pontos de vista: a) Como
contedo, ou seja, observando-se a lista de palavras ou a lista de UCE que lhes so especficas;
b) Como funcionamento, porque, por suas oposies, exprimem um certo dinamismo do percurso
discursivo; c) Como representao, pois essas classes formam [um] sistema e refletem uma certa
estabilizao do funcionamento do autor.
Esses pontos de vista no se excluem. H em cada um deles elementos que permitem articular de
forma mais geral os resultados do programa, a fim de que forneam uma leitura mais abrangente
e integrada do corpus.
A figura 01 mostra as formas reduzidas distribudas por Classe. Nessa figura encontram-se: a) o
nmero total de UCE classificadas (131); b) o dendrograma mostrando as relaes entre as
Classes. No dendrograma constante da figura 1 se pode constatar que os 02 blocos formados,
respectivamente, pelas Classes 1 e 4 e pelas Classes 2 e 3 so independentes. Isso significa
tambm dizer que a Classe 1 possui maior relao, ou proximidade, com a Classe 4 e pouca ou
nenhuma com as Classes 2 e 3 ; c) a porcentagem de UCE em cada uma das Classes (observe-se
que a Classe que mais agrupou UCE foi a Classe 1 41%); d) as formas reduzidas mais
freqentes que formaram cada uma das classes, com o Q de associao sua respectiva Classe
(note-se que, como exemplo, pode-se afirmar que a forma reduzida ilus+ (Q = 52.99) est mais
fortemente ligada Classe 4 do que a forma reduzida bal+ (Q = 40.49) Classe 3); e) o
nome/tema das Classes (nomes dados pelo pesquisador, analisando as listagens de formas
reduzidas, as UCE caractersticas de cada Classe e a Anlise Fatorial de Correspondncia sero
descritas adiante tanto as UCE caractersticas quanto a AFC) e; f) os nomes/temas dos blocos
formados pelas Classes 1 e 4 e pelas Classes 2 e 3, respectivamente (dados tambm pelo
pesquisador).
76
O Quadro I mostra exemplos de UCE caractersticas. O programa gera uma listagem dessas UCE
para cada uma das Classes, o que permite ver em que contexto aparece cada uma das formas
reduzidas (em negrito) no interior dessas mesmas Classes. Tambm no Quadro I se pode ver o Q
de associao da UCE caracterstica sua respectiva Classe.
Quadro I: Exemplos de UCE caractersticas de cada classe.
77
A Classificao Hierrquica Ascendente (CHA) realizada pelo Alceste cruzando as UCE da classe
selecionada e as formas reduzidas especficas dessa mesma classe permite a visualizao de
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006
78
Anlise de Contedo
A Anlise de Contedo (BARDIN, 1977; BAUER, 2002; VALA, 2003) tambm pode ser
caracterizada como procedimento de fragmentao de textos com o objetivo de identificar
regularidades. Possibilita tratar todo o material textual, diferentemente do Alceste, que, no corte
inicial, s analisa formas reduzidas com freqncia maior ou igual a 04, o que pode representar
um problema por descartar sinnimos menos utilizados, identificando-os como palavras pouco
freqentes.
Buscando identificar a pluralidade temtica presente num conjunto de textos, ao mesmo tempo
em que pondera a freqncia desses temas dentro do mesmo conjunto, a Anlise de Contedo
pode proporcionar, numa comparao entre os elementos do corpus (palavras ou sentenas), a
constituio de agrupamentos de elementos de significados mais prximos, possibilitando a
formao de categorias mais gerais de contedo.
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006
79
80
81
82
Outra possibilidade utilizar os ns das Redes de Contedos como variveis na caracterizao das
UCI a serem consideradas pelo Alceste (Quadro IV). Deve-se, entretanto, observar que a
considerao de categorias da Anlise de Contedo como variveis para o programa no substitui
as Redes de Contedos na busca de co-ocorrncias: as redes tratam de significados, o Alceste de
vocabulrio.
Quadro IV: Letra com os ns da Rede de Contedo como variveis para o procedimento Alceste.
A AFC mostrada na Figura 05 possui as mesmas formas reduzidas e Classes j vistas na Figura 02
e apresenta as variveis (asteriscos) resultantes do agrupamento de categorias da Anlise de
Contedo para a formao dos ns das Redes de Contedos (como vimos no Quadro III). V-se
na figura a presena de Ns da Rede de Contedo relacionada s formas reduzidas e Classes
(presena indicada, por exemplo, por feli_1, e ausncia, nesse caso, indicada por feli_0). Uma
sobreposio das Figuras 02 e 05 mostraria que, por exemplo, no plo que denominamos
Descritiva-Visual-Sonora caracterstica a presena das variveis elna_1 (elementos naturais),
elmu_1 (elementos musicais) e fest_1 (festas), e no plo denominado Sentimento caracterstica
a ausncia de referncias a lugares como a rua, a praa ou o quintal (rua_0) ou a elementos de
sociabilidade (soci_0).
83
Figura 5: Agrupamento de categorias da Anlise de Contedo para a formao dos ns das Redes
de Contedos como variveis para o ALCESTE.
Questes Metodolgicas
No presente caso, que envolveu letras de msicas como fonte de informaes, avaliou-se como
muito interessante a possibilidade de conjugar uma anlise estatstica de vocabulrio, um mtodo
mais tradicional de anlise qualitativa, e um possvel desdobramento dessas nas Redes de
Contedos (NASCIMENTO, 2004). Objetivamente, a realizao de uma leitura inter-relacionada
dos resultados desses procedimentos possibilitou, na avaliao das informaes coerentes e
discrepantes entre eles, a viso mais abrangente dos elementos caracterizadores de uma
memria saudosa da infncia, bem como a prpria interao entre esses elementos, nas letras
analisadas. De outra forma, seria difcil apontar, por exemplo, que o vocbulo saudade encontrase recorrentemente relacionado a palavras que caracterizam atividades e no, como se podia
esperar, quelas que tratam do sentimento (o que foi indicado pelo Alceste Figuras 01 e 02).
Tambm no seria fcil apontar que a representao da infncia saudosa nas canes brasileiras
est fortemente calcada na lembrana de compositores migrantes (o que foi viabilizado pela alta
ocorrncia de referncias a elementos naturais, lugares e atividades caractersticas de contextos
no urbanos constatadas na Anlise de Contedo). Em complemento, a possibilidade de apontar
co-ocorrncias de contedo nas letras analisadas permitiu discutir de forma mais coerente a
probabilidade de serem as memrias de atividades infantis, em boa parte, articuladoras dos
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006
84
demais elementos recordados, fato que podia ser apenas vislumbrado considerando-se tanto os
resultados do Alceste como os da Anlise de Contedo.
Para quem se interessar por empreitada similar, algumas consideraes mais gerais sobre a
utilizao conjunta do Alceste, da Anlise de Contedo e das Redes de Contedo:
O Alceste
Pode servir para um mapeamento introdutrio mais geral do corpus (REINERT, 1990;
KRONBERGER; WAGNER, 2002).
Confirma ou infirma tendncias sugeridas pelos agrupamentos lexicais na Anlise de Contedo.
Como identifica relaes de elementos segundo um critrio estatstico, resulta de sua aplicao
uma classificao objetiva baseada nas co-ocorrncias, com o que diminui a probabilidade do
pesquisador encontrar coincidentemente as relaes que j havia suposto existirem no material
analisado.
um procedimento rpido: com o corpus devidamente preparado, o programa efetua as 04
etapas de procedimento em alguns minutos.
Na apresentao dos resultados, incorpora opes de grficos e figuras que possibilitam selecionar
os mais adequados s caractersticas do trabalho no qual utilizado.
No obstante o Alceste poder servir para um primeiro mapeamento do corpus a ser analisado,
recomenda-se que ele seja o ltimo procedimento realizado num estudo que queira conjug-lo
Anlise de Contedo. Algumas vantagens de assim proceder:
a) Quanto melhor preparado o banco de dados para o Alceste, mais confiveis so os resultados
do programa. A Anlise de Contedo pode permitir a identificao e o registro no banco de dados
de sinnimos e a correo de eventuais erros de digitao no texto.
b) No conhecer o relatrio do Alceste permite maior independncia do pesquisador na Anlise de
Contedo, evitando que os critrios de identificao, diferenciao e agrupamento dos elementos
nas categorias e subcategorias sejam influenciados pelos resultados do programa.
c) Maior familiaridade com o corpus importante para a anlise do relatrio do Alceste, e ela pode
ser alcanada com o desenvolvimento da Anlise de Contedo.
85
recuperar tais sinnimos, que podem informar que h mais de um discurso sobre o tema, ainda
que este discurso esteja menos presente no banco de dados.
Referncias Bibliogrficas
Alba, M. (2004). El mtodo ALCESTE y su aplicacin al estdio de lasrepresentaciones sociales del
espacio urbano: el caso de la Ciudad de Mxico. Papers on Social Representations, cidade em
que foi publicado o peridico?, v.13, 1.1-1.20?. Disponvel em <http://www.psr.jku.at>. Acesso
em: 15 jul. 2005.
Bardin, L. Anlise de Contedo. Lisboa: Edies 70, 1977.
Bauer, M.W. Anlise de contedo clssica: uma reviso. In: M. W. Bauer & G. Gaskell (Orgs.).
Pesquisa qualitativa com texto, imagem e som: um manual prtico (Traduo de Pedrinho A.
Guareschi). Petrpolis: Vozes, 2002. p. 189-217.
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006
86
Camargo, B.V. ALCESTE: Um programa informtico de anlise quantitativa de dados textuais. In:
A. S. P. Moreira (Org.). Perspectivas terico-metodolgicas em Representaes Sociais.
Joo Pessoa: UFPB/Editora Universitria, 2005. p. 511-539.
Kalampalikis, N. Lapport de la mthode Alceste dans lanalyse des reprsentations sociales. In : J.
C. Abric (Org.). Mthodes dtude des reprsentations sociales. Paris: rs, 2003. p. 147163.
Kronberger, N. E Wagner, W. (2002). Palavras-chave em contexto: anlise estatstica de textos.
In: M.W. Bauer & G. Gaskell (Orgs.). Pesquisa qualitativa com texto, imagem e som: um
manual prtico (Traduo de Pedrinho A. Guareschi). Petrpolis: Vozes, 2002.
Lorenzi-Cioldi, F. Questions de mthodologie en sciences sociales. Paris: Delachaux et
Niestl, 1997.
Nascimento, A.R.A. Memria dos Verdes Anos: saudade da infncia na msica popular
brasileira uma investigao e uma proposta de anlise de dados. 2004. 179 f. Tese
(Doutorado em Psicologia) - Programa de Ps-Graduao em Psicologia, Universidade Federal do
Esprito Santo, Vitria.
Oliveira, D.C.; Gomes, A.M.T.; Marques, S.C. Anlise estatstica de dados textuais na pesquisa
das Representaes Sociais: alguns princpios e uma aplicao ao campo da sade. In: M. S. S.
Menin; A. M. Shimizu (Orgs.). Experincia e Representao Social: questes tericas e
metodolgicas. So Paulo: Casa do Psiclogo, 2005. p. 157-200.
Reinert, M. Alceste, une mthodologie danalyse des donnes textuelles et une application: Aurelia
de Gerard de Nerval. Bulletin de Methodologie Sociologique, v.26, p.24-54, 1990.
Reinert, M. Alceste. Version 4.0 Windows (Manual). Toulouse: Societ IMAGE, 1998.
Reinert, M. Alceste, une mthode statistique et smiotique danalyse de discours; Application aux
Rveries du promeneur solitaire . La Revue Franaise de Psychiatrie et de Psychologie
Mdicale, v. 05(39), p. 32-36, 2001.
Vala, J. A Anlise de Contedo. In: A.S. Silva; J. M. Pinto (Orgs.). Metodologia das Cincias
Sociais. 12 ed. Porto: Edies Afrontamento, 2003. p. 101-128.
87
Notas
*
**
A possibilidade dessa conjugao, ainda que no explorada, tambm foi apontada por Alba
(2004).
Em portugus, mais informaes sobre o ALCESTE podem ser encontradas em Camargo (2005)
e Oliveira, Gomes; Marques (2005).
88