Você está na página 1de 17

ARTIGO

Anlise lexical e anlise de contedo: uma proposta de utilizao


conjugada

Lexical Analysis and Content Analysis: a Proposal for Conjugate


Utilization

Adriano Roberto Afonso do Nascimento*, I; Paulo Rogrio Meira Menandro**, II


I
II

Universidade Federal de Minas Gerais


Universidade Federal do Esprito Santo

Endereo para correspondncia

RESUMO
O trabalho discute a utilizao conjugada de um software desenvolvido para a anlise textual e de
um procedimento de anlise de contedo clssica. O software ALCESTE apia-se em clculos
efetuados sobre a co-ocorrncia de palavras em segmentos de texto, buscando distinguir classes
de palavras que representem formas distintas de discurso sobre o tpico de interesse da
investigao. A anlise de contedo tambm identifica a pluralidade temtica presente num
conjunto de textos, e pondera a freqncia desses temas no conjunto, permitindo, via
comparao entre os elementos do corpus (palavras ou sentenas), a constituio de
agrupamentos de elementos de significados mais prximos, viabilizando a formao de categorias
mais gerais de contedo. O trabalho se vale de exemplos em que ambos os procedimentos foram
efetuados a partir do um mesmo banco de dados textuais e discute possveis limitaes e
vantagens em relao utilizao em separado de cada um deles.
Palavras-chave: Metodologia, anlise lexical, Alceste, anlise de contedo.

ABSTRACT
This work discusses the conjugate use of a textual analysis software and a classical content
analysis procedure. The ALCESTE software is based on calculations performed on simultaneous
occurrence of words in text segments, aiming to distinguish classes of words that represent
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

72

distinct forms of discourse on the topic in which the investigation is interested. The content
analysis also identifies the thematic plurality present in a set of texts, and weighs the frequency of
these themes in the set, allowing, by comparison between elements of the corpus (words or
sentences), the constitution of groupings of elements of closest signification, thereby making
possible the formation of more general content categories. This work uses examples in which both
procedures were carried out upon the same textual data base and discusses possible limitations
and advantages with respect to the separate use of each of them.
Keywords: Methodology, lexical analysis, Alceste, content analysis.

Anlise Lexical e Anlise de Contedo: uma proposta de utilizao


conjugada1
O tratamento estatstico de dados provenientes de fontes tradicionalmente utilizadas em Cincias
Humanas e Sociais, como material textual publicado ou resultante de entrevista, efetuado com o
auxlio de softwares, tem se mostrado cada vez mais freqente nos trabalhos em que o corpus a
ser analisado volumoso. Um ganho evidente de tal procedimento a economia do tempo com
tabulao e efetuao dos clculos necessrios ao tratamento do conjunto de informaes
coletadas. Esse tempo poupado pode ser utilizado na anlise mais detida dos dados j
organizados pelo computador ou na tarefa de confrontar o procedimento com outros no
tratamento da mesma informao coletada, potencializando o entendimento do material de
interesse.
O presente texto discute a possibilidade de uso conjugado de um programa computacional
desenvolvido para a anlise lexical (ALCESTE), que se vale de clculos efetuados sobre coocorrncias de palavras em segmentos de texto, com um procedimento de anlise de contedo
clssica, ambos sobre o mesmo banco de dados, avaliando possveis avanos em relao
utilizao em separado dos mesmos1.
Antes de avaliao da possvel interlocuo de resultados provenientes desses dois
procedimentos, necessrio caracteriz-los, ainda que de forma geral. Para exemplificaes,
tanto em Alceste como em Anlise de Contedo, utilizamos resultados do trabalho de Nascimento
(2004), que identificou e analisou os principais elementos discursivos em letras de canes
populares disponveis a partir de 1927 sobre a saudade da infncia.

ALCESTE (Analyse Lexicale par Context dun Ensemble de Segments de


Texte)2
Desenvolvido por Max Reinert (1998), esse software conjuga uma srie de procedimentos
estatsticos aplicados a bancos de dados textuais, como entrevistas, obras literrias, artigos de
jornais e revistas, entre outros. Na base do funcionamento do programa encontra-se a idia de
relao entre contexto lingstico e representao coletiva ou entre unidade de contexto e
contexto tpico (REINERT, 1990). Unidade de contexto entendida como uma espcie de
representao elementar, um sentido ou um enunciado mnimo em um discurso. Tal enunciado
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

73

postulado como uma idia de um indivduo psquico, sendo que essa idia se refere a um objeto,
mas tambm, ao mesmo tempo, ao prprio sujeito. essa dupla referncia que permite a
formao da representao de um objeto. Por extenso, a regularidade de representaes entre
indivduos pode promover a existncia de um determinado contexto tpico de um grupo, uma
representao coletiva, um mundo. Segundo Reinert (1990, p.32):
As representaes locais, mltiplas, imediatas, associadas aos enunciados de um corpus se
organizam em funo de leis especficas identificando tipos de mundos. Seus traos na lngua s
podem ser revelados atravs de um grande nmero de enunciados semelhantes, de um
determinado ponto de vista. A representao que podemos ter desses mundos atravs do corpus
estudado pode ser freqentemente arcaica [rudimentar], pois que ela no est diretamente
anunciada no corpus e que ns a revelamos atravs de uma anlise estatstica bastante grosseira,
por uma classificao.
A regularidade de um vocabulrio especfico indica a existncia de certo campo contextual, um
espao semntico especfico. Reinert (2001) prope a extenso desse espao idia de fundo
associativo ou fundo tpico, revelado atravs da co-ocorrncia das chamadas palavras
plenas, que devem ser entendidas como algo que excede os significados anotados nos
dicionrios, uma vez que se inscrevem na histria dos falantes, pois so utilizadas como uma
atualizao do prprio sujeito e de seu campo de referncia aos objetos num aqui e agora do
discurso.
Observe-se, entretanto, que, em seu aspecto operacional, o objetivo do Alceste no o clculo do
sentido, mas a organizao tpica de um discurso ao colocar em evidncia os mundos lexicais.
No Alceste, o vocabulrio de um enunciado constitui um trao, uma referncia, um
funcionamento, enfim, uma inteno de sentido do sujeito-enunciador. Para esse mtodo, que
no esconde seu fundamento lexicomtrico, os traos mais fortemente caractersticos desse
funcionamento do lxico so os mundos lexicais (KALAMPALIKIS, 2003, p. 151).
Kalampalikis (2003) acrescenta que tais mundos lexicais s podem ser entendidos num
esquema maior de relaes: s h a possibilidade de significao de um mundo lexical, se h
um outro mundo lexical que o defina por contraste ou complementaridade. De forma mais
direta,
o pressuposto de Alceste que pontos diferentes de referncia produzem diferentes maneiras de
falar, isto , o uso de um vocabulrio especfico visto como uma fonte para detectar maneiras
de pensar sobre um objeto. O objetivo de uma anlise com Alceste, portanto, distinguir classes
de palavras que representam diferentes formas de discurso a respeito do tpico de interesse
(KRONBERGER; WAGNER, 2002, p. 427).
Esto descritas a seguir algumas das principais operaes realizadas nas quatro etapas do
procedimento Alceste. Inicialmente, a definio de alguns termos (REINERT, 1998):
UCI: Unidade de Contexto Inicial - Unidade a partir da qual o programa efetuar a fragmentao
inicial. Pode ser um captulo de livro, uma matria jornalstica, uma resposta de entrevista. Nos
exemplos utilizados no presente texto trata-se de uma letra de msica.
UCE: Unidade de Contexto Elementar - Definida segundo critrios de tamanho do texto (nmero
de palavras analisadas) e pontuao. a partir do pertencimento das palavras de um texto a
uma UCE, que o programa Alceste vai estabelecer as matrizes a partir das quais ser efetuado o
trabalho de classificao (REINERT, 1998, p. 17).
UC: Unidade de Contexto - Agrupamento de UCE sucessivas dentro de uma mesma UCI, at que o
nmero de palavras diferentes analisadas (contidas nessa unidade de contexto) seja superior ao
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

74

limiar fixado na anlise. (...) Esse limiar fixado proporcionalmente ao nmero de palavras
analisadas. As UC devem ter uma homogeneidade semntica e devem ser de tamanho
comparvel. Ou seja, so unidades estatsticas de pesos idnticos. Elas esto na base de todas as
estatsticas efetuadas (REINERT, 1998, p. 18).
Classe: pode ser definida como um agrupamento constitudo por vrias UCE de vocabulrio
homogneo.
Lematizao: operao de substituio de certas palavras por uma forma reduzida, que permite
ao programa considerar equivalentes palavras com radical comum, que significam
aproximadamente a mesma coisa, mas que diferem quanto ao gnero, ao nmero ou ao fato de
serem substantivos, adjetivos ou advrbios. Por exemplo: AMOR, AMORES, AMOROSOS, so
substitudas no texto pela forma AMOR+.
AFC: Anlise Fatorial de Correspondncia. Cruzamento entre o vocabulrio (considerando a
freqncia de incidncia de palavras) e as classes, gerando uma representao grfica em plano
cartesiano, na qual so vistas as oposies entre classes ou formas.
Quatro etapas de procedimento compem o mtodo Alceste. A primeira (A) refere-se a uma
leitura do texto e aos clculos dos dicionrios. O programa gera inicialmente a listagem em
ordem alfabtica de todo o vocabulrio do corpus. Dessa lista deriva uma segunda, composta
pelas formas reduzidas e palavras representadas por essas formas reduzidas, ou seja, um
dicionrio de formas reduzidas. Uma outra lista produzida com as formas reduzidas mais
freqentes. Adjetivo, substantivo, pronomes, artigos so algumas das chaves categoriais
utilizadas pelo programa nessa etapa para a primeira classificao do vocabulrio. Deve-se
observar que o programa possui dicionrios acoplados (inclusive de portugus), o que permite
identificar diferentes conjugaes verbais, bem como diferenciar palavras com funo puramente
sinttica (pronomes, artigos, advrbios) daquelas com contedo (verbos, substantivos,
adjetivos). Tal procedimento relevante, pois com essa segunda classe de palavras, sobretudo,
que o programa vai trabalhar.
Na etapa B so selecionadas as formas reduzidas com freqncia maior ou igual a 04. Nessa
etapa, tambm, que so definidas as UCE, o que se d, como j foi visto, segundo o critrio de
tamanho do texto ou de pontuao (por exemplo, ponto final = fim de uma UCE). Nessa etapa o
Alceste realiza o clculo de trs cruzamentos (Classificao Hierrquica Descendente - CHD): a)
Todas as UCE x todas as formas reduzidas; b) UC tamanho 1 x formas reduzidas selecionadas; c)
UC tamanho 2 x formas reduzidas selecionadas. formada uma matriz para cada um desses
cruzamentos, na qual os valores 0 e 1 indicam, respectivamente, ausncia ou presena de
determinada palavra em uma UCE ou UC. A lgica do uso de dois tamanhos de UC esclarecida
adiante.
O conjunto total de unidades contextuais na matriz de indicadores inicial (unidades contextuais
por palavras) constitui a primeira classe. O objetivo do prximo passo conseguir uma diviso
dessa classe em duas, que separem, da maneira mais ntida possvel, as classes resultantes, de
tal modo que as duas classes contenham diferentes vocabulrios e, no caso ideal, no contenham
nenhuma palavra sobreposta (KRONBERGER; WAGNER, 2002, p. 429).
O procedimento continuamente efetuado at que no resulte em novas classes. Na anlise
standard, os tamanhos diferenciados de UC so definidos pelo programa (podendo tambm ser
alterados pelo pesquisador, assim como vrios outros parmetros do Alceste) e se referem ao
encadeamento de UCE sucessivas at que o nmero de palavras selecionadas seja maior ou igual
ao valor estipulado. O objetivo de clculos com dois valores de UC avaliar se o tamanho do
texto a ser considerado pode interferir na formao das classes.
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

75

Na etapa C os valores obtidos nas duas ltimas CHD so comparados, e apenas a parte estvel
dos resultados considerada na determinao dos perfis de classe, definidos pelo Q de
associao das formas reduzidas s suas respectivas classes. Relacionada a essa etapa est a
Anlise Fatorial de Correspondncia que efetua o cruzamento entre as formas reduzidas com
freqncia maior do que 08 e as classes formadas.
A etapa D destina-se aos clculos complementares e nela so formadas as listas de formas
reduzidas associadas a contextos, que correspondem s classes anteriormente formadas e
possibilitam a identificao das UCE caractersticas de cada uma das classes. So identificados
ainda os segmentos repetidos, isto , os trechos de frases mais recorrentes em cada classe. Por
fim, realiza-se a Classificao Hierrquica Ascendente que consiste no cruzamento entre as UCE
das classes e as formas reduzidas caractersticas da mesma classe.
Para os resultados de algumas das operaes, informaes complementares: Segundo Reinert
(2001, p. 34),
as classes obtidas [na anlise] podem ser interpretadas de trs pontos de vista: a) Como
contedo, ou seja, observando-se a lista de palavras ou a lista de UCE que lhes so especficas;
b) Como funcionamento, porque, por suas oposies, exprimem um certo dinamismo do percurso
discursivo; c) Como representao, pois essas classes formam [um] sistema e refletem uma certa
estabilizao do funcionamento do autor.
Esses pontos de vista no se excluem. H em cada um deles elementos que permitem articular de
forma mais geral os resultados do programa, a fim de que forneam uma leitura mais abrangente
e integrada do corpus.
A figura 01 mostra as formas reduzidas distribudas por Classe. Nessa figura encontram-se: a) o
nmero total de UCE classificadas (131); b) o dendrograma mostrando as relaes entre as
Classes. No dendrograma constante da figura 1 se pode constatar que os 02 blocos formados,
respectivamente, pelas Classes 1 e 4 e pelas Classes 2 e 3 so independentes. Isso significa
tambm dizer que a Classe 1 possui maior relao, ou proximidade, com a Classe 4 e pouca ou
nenhuma com as Classes 2 e 3 ; c) a porcentagem de UCE em cada uma das Classes (observe-se
que a Classe que mais agrupou UCE foi a Classe 1 41%); d) as formas reduzidas mais
freqentes que formaram cada uma das classes, com o Q de associao sua respectiva Classe
(note-se que, como exemplo, pode-se afirmar que a forma reduzida ilus+ (Q = 52.99) est mais
fortemente ligada Classe 4 do que a forma reduzida bal+ (Q = 40.49) Classe 3); e) o
nome/tema das Classes (nomes dados pelo pesquisador, analisando as listagens de formas
reduzidas, as UCE caractersticas de cada Classe e a Anlise Fatorial de Correspondncia sero
descritas adiante tanto as UCE caractersticas quanto a AFC) e; f) os nomes/temas dos blocos
formados pelas Classes 1 e 4 e pelas Classes 2 e 3, respectivamente (dados tambm pelo
pesquisador).

ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

76

Figura 01: Formas reduzidas distribudas por Classe

O Quadro I mostra exemplos de UCE caractersticas. O programa gera uma listagem dessas UCE
para cada uma das Classes, o que permite ver em que contexto aparece cada uma das formas
reduzidas (em negrito) no interior dessas mesmas Classes. Tambm no Quadro I se pode ver o Q
de associao da UCE caracterstica sua respectiva Classe.
Quadro I: Exemplos de UCE caractersticas de cada classe.

ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

77

Como mencionado acima, a Anlise Fatorial de Correspondncia (AFC) permite verificar as


relaes entre as classes num plano grfico, apontando, segundo a localizao dessas classes, a
sua interao. Ainda que apresente limitaes, como a no contextualizao (o como e o
porqu) da fala e a no considerao de que a ordem das sentenas altera o resultado final do
sentido do discurso (LORENZI-CIOLDI, 1997), a AFC permite visualizao geral articulada dos
agrupamentos de vocbulos presentes no discurso.
Para a leitura da Figura 02 preciso lembrar que a lgica da Anlise Fatorial de Correspondncia
de que, quanto mais distantes os elementos dispostos no plano, menos eles falam das
mesmas coisas. importante observar que a disposio de agrupamentos em plos opostos no
plano dos eixos no necessariamente indica relao de oposio semntica desses mesmos
agrupamentos (como indicado acima, um mundo lexical s possvel a partir da existncia de
outros e essa relao entre os mundos tambm pode ser de complementaridade). Como
resultado, o Alceste oferece os eixos, a disposio das formas reduzidas e Classes no plano e a
informao sobre qual dos eixos compe mais fortemente a disposio dos elementos (no caso,
Eixo 1 40%). A partir desse resultado e da leitura dos resultados apresentados acima, possvel
para o pesquisador nomear os eixos e seus respectivos plos (no exemplo o Eixo 1 (x) formado
pelos plos Contexto e Atividade e o Eixo 2 (y) pelos plos Sentimento e Mundo). A partir da
informao da existncia de 02 blocos (Classes 1 e 4 e Classes 2 e 3) vistos na figura 01,
possvel propor a existncia na AFC de um terceiro eixo que apresente os plos InterpretativaImaginativa e Descritiva-Visual-Sonora.
Figura 02: Anlise Fatorial de Correspondncia (Classes, formas reduzidas e eixos).

A Classificao Hierrquica Ascendente (CHA) realizada pelo Alceste cruzando as UCE da classe
selecionada e as formas reduzidas especficas dessa mesma classe permite a visualizao de
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

78

laos de vizinhana ou sinnimos (REINERT, 1998, p. 33) indicativos de contextos ou ncleos


que devem ser considerados como tal e que podem auxiliar tanto na leitura da formao das
classes, quanto na avaliao da inter-relao entre elas.
Na Figura 03 pode-se ver o exemplo do Dendrograma da CHA da Classe 4. H dois subgrupos de
formas reduzidas que podem ser considerados centrais para a Classe 4: o primeiro constitudo
pelas formas tempo+, guard+ e crianc+; o segundo constitudo pelas formas ilus+ e alegr+.
Tambm podem ser vistos os Q de associao das formas reduzidas Classe 4 e a porcentagem
de UCE classificadas nessa mesma Classe (11%), conforme j visto na Figura 01. No trabalho
utilizado para a extrao dos exemplos (Nascimento, 2004), tal dendrograma sintetiza as idias
de infncia como um tempo guardado ou do qual se guarda algo (primeiro subgrupo) e de alegria,
ou como sinnimo, ou como indissocivel de iluso (segundo subgrupo). ainda possvel, na
Figura, identificar que as formas guard+ e crian+ guardam uma maior proximidade entre si do
que as formas ilus+ e alegr+, uma vez que quanto mais prximo do eixo das formas estiver o
trao de ligao entre duas formas, mais recorrentemente essas mesmas formas aparecem juntas
nas UCE classificadas (2).
Figura 03: Dendrograma CAH Classe 04

Anlise de Contedo
A Anlise de Contedo (BARDIN, 1977; BAUER, 2002; VALA, 2003) tambm pode ser
caracterizada como procedimento de fragmentao de textos com o objetivo de identificar
regularidades. Possibilita tratar todo o material textual, diferentemente do Alceste, que, no corte
inicial, s analisa formas reduzidas com freqncia maior ou igual a 04, o que pode representar
um problema por descartar sinnimos menos utilizados, identificando-os como palavras pouco
freqentes.
Buscando identificar a pluralidade temtica presente num conjunto de textos, ao mesmo tempo
em que pondera a freqncia desses temas dentro do mesmo conjunto, a Anlise de Contedo
pode proporcionar, numa comparao entre os elementos do corpus (palavras ou sentenas), a
constituio de agrupamentos de elementos de significados mais prximos, possibilitando a
formao de categorias mais gerais de contedo.
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

79

Esse processo pode ser efetuado da seguinte forma:


1- Primeira leitura do corpus. Anotao de impresses gerais sobre possveis elementos
recorrentes nas informaes coletadas; 2- Segunda leitura. Pr-categorizao. Contagem parcial
dos elementos identificados na primeira leitura, visando confirmao ou no de categorias gerais e
identificao de possveis novas categorias; 3- Terceira leitura. Construo de grades de
categorias contendo tema geral, palavras e frases relacionadas a esse tema; 4- Agrupamento de
elementos (palavras ou frases) da categoria geral em subcategorias; 5- Contagem da freqncia
final dos elementos nas subcategorias e nas categorias gerais.
A Anlise de Contedo pode ser descritiva, mostrando, por exemplo, a variedade de elementos
presente no conjunto de dados, ou analtica, procurando regularidades de avaliaes nesses
mesmos dados. Assim, uma categorizao menos rgida dos elementos nas subcategorias pode
estar diretamente relacionada s caractersticas especficas do corpus analisado, o que no
impede ver, no interior das categorias gerais, outros possveis agrupamentos de dados. Em
situaes nas quais algo est dito de duas ou mais maneiras em diferentes textos, deve-se
manter essas diferentes verses. Na fala, em geral, tambm importa, em algo que dito, o como
foi dito. Nessa linha tnue entre categorias mais abertas e rigor de classificao, deve-se
privilegiar, pelo menos num primeiro momento, o critrio de se considerar somente o que
explicitamente estiver representado nas respostas. Assim, nesse procedimento no h
subentendidos, no h a ausncia de determinada informao sobre um elemento considerada
como dado em si.
As categorias gerais resultantes do procedimento apontam linhas gerais de temas e avaliaes
recorrentes nos dados analisados, incluindo identificao de elementos e sua avaliao. Por fim,
chega-se a uma listagem de elementos significativos (Quadro II) que, entretanto, indica ainda de
forma pouco clara as ligaes entre as categorias formadas por esses mesmos elementos.

ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

80

Quadro II: Categorias iniciais da Anlise de Contedo

ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

81

Alceste & Anlise De Contedo


Segundo Bauer (2002, p.194),
a anlise de contedo pode reconstruir mapas de conhecimento medida que eles esto
corporificados em textos. As pessoas usam a linguagem para representar o mundo como
conhecimento e auto-conhecimento. Para reconstruir esse conhecimento, a AC pode necessitar ir
alm da classificao das unidades do texto, e orientar-se na construo de redes de unidades de
anlise para representar o conhecimento no apenas por elementos, mas tambm em suas
relaes.
Nessa direo, pode-se efetuar, na construo de uma estrutura inicial de rede, a juno de
algumas categorias gerais, levando-se em conta aspectos confluentes na categorizao dos dados
apontados tanto pela anlise do Alceste como pela Anlise de Contedo, ambas realizadas antes
dessa fase (Quadro III).
Quadro III: Agrupamento de categorias da Anlise de Contedo para a formao dos ns das
Redes de Contedos.

Utilizando as categorias mais freqentes, provenientes da Anlise de Contedo, possvel realizar


nova leitura dos dados, desta vez identificando em quais categorias um mesmo item, no caso
letra de msica, teve elementos (palavras e sentenas) classificados. O resultado desse processo
a representao grfica da rede de relaes entre os elementos (por exemplo, Atividades
infantis, brincadeiras, jogos) e a avaliao tanto do contexto relacionado interao desses
elementos (Um tempo feliz, sonhos, iluses), quanto da situao na qual se d a avaliao (Hoje
sofrido, triste). Tal procedimento aponta, no mnimo, para uma caracterizao geral do corpus
como formado por textos eminentemente multi-referenciais. A figura 04 exemplifica um dos ns
que compem o que est sendo chamado de Rede de Contedo.
Podem ser vistos na figura os 12 ns resultantes do Quadro III, bem como a freqncia de coocorrncia (nmero de letras de msicas para um n = 70) de cada um dos 11 ns relacionados ao
n que central - nessa figura o n Atividades infantis, brincadeiras, jogos. Observe-se que, por
se tratar de uma rede, o resultado grfico final deveria comportar, no caso, os 12 ns ao mesmo
tempo, assim como todos os seus valores de co-ocorrncia. Por motivos prticos selecionou-se
um n como central para a apresentao do exemplo. Assim, no caso de opo pela apresentao
de todos os ns, cada um deles faria a vez de n central em outras figuras.
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

82

Figura 04: N Atividades infantis, brincadeiras, jogos.

Outra possibilidade utilizar os ns das Redes de Contedos como variveis na caracterizao das
UCI a serem consideradas pelo Alceste (Quadro IV). Deve-se, entretanto, observar que a
considerao de categorias da Anlise de Contedo como variveis para o programa no substitui
as Redes de Contedos na busca de co-ocorrncias: as redes tratam de significados, o Alceste de
vocabulrio.
Quadro IV: Letra com os ns da Rede de Contedo como variveis para o procedimento Alceste.

A AFC mostrada na Figura 05 possui as mesmas formas reduzidas e Classes j vistas na Figura 02
e apresenta as variveis (asteriscos) resultantes do agrupamento de categorias da Anlise de
Contedo para a formao dos ns das Redes de Contedos (como vimos no Quadro III). V-se
na figura a presena de Ns da Rede de Contedo relacionada s formas reduzidas e Classes
(presena indicada, por exemplo, por feli_1, e ausncia, nesse caso, indicada por feli_0). Uma
sobreposio das Figuras 02 e 05 mostraria que, por exemplo, no plo que denominamos
Descritiva-Visual-Sonora caracterstica a presena das variveis elna_1 (elementos naturais),
elmu_1 (elementos musicais) e fest_1 (festas), e no plo denominado Sentimento caracterstica
a ausncia de referncias a lugares como a rua, a praa ou o quintal (rua_0) ou a elementos de
sociabilidade (soci_0).

ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

83

Figura 5: Agrupamento de categorias da Anlise de Contedo para a formao dos ns das Redes
de Contedos como variveis para o ALCESTE.

Questes Metodolgicas
No presente caso, que envolveu letras de msicas como fonte de informaes, avaliou-se como
muito interessante a possibilidade de conjugar uma anlise estatstica de vocabulrio, um mtodo
mais tradicional de anlise qualitativa, e um possvel desdobramento dessas nas Redes de
Contedos (NASCIMENTO, 2004). Objetivamente, a realizao de uma leitura inter-relacionada
dos resultados desses procedimentos possibilitou, na avaliao das informaes coerentes e
discrepantes entre eles, a viso mais abrangente dos elementos caracterizadores de uma
memria saudosa da infncia, bem como a prpria interao entre esses elementos, nas letras
analisadas. De outra forma, seria difcil apontar, por exemplo, que o vocbulo saudade encontrase recorrentemente relacionado a palavras que caracterizam atividades e no, como se podia
esperar, quelas que tratam do sentimento (o que foi indicado pelo Alceste Figuras 01 e 02).
Tambm no seria fcil apontar que a representao da infncia saudosa nas canes brasileiras
est fortemente calcada na lembrana de compositores migrantes (o que foi viabilizado pela alta
ocorrncia de referncias a elementos naturais, lugares e atividades caractersticas de contextos
no urbanos constatadas na Anlise de Contedo). Em complemento, a possibilidade de apontar
co-ocorrncias de contedo nas letras analisadas permitiu discutir de forma mais coerente a
probabilidade de serem as memrias de atividades infantis, em boa parte, articuladoras dos
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

84

demais elementos recordados, fato que podia ser apenas vislumbrado considerando-se tanto os
resultados do Alceste como os da Anlise de Contedo.
Para quem se interessar por empreitada similar, algumas consideraes mais gerais sobre a
utilizao conjunta do Alceste, da Anlise de Contedo e das Redes de Contedo:

O Alceste
Pode servir para um mapeamento introdutrio mais geral do corpus (REINERT, 1990;
KRONBERGER; WAGNER, 2002).
Confirma ou infirma tendncias sugeridas pelos agrupamentos lexicais na Anlise de Contedo.
Como identifica relaes de elementos segundo um critrio estatstico, resulta de sua aplicao
uma classificao objetiva baseada nas co-ocorrncias, com o que diminui a probabilidade do
pesquisador encontrar coincidentemente as relaes que j havia suposto existirem no material
analisado.
um procedimento rpido: com o corpus devidamente preparado, o programa efetua as 04
etapas de procedimento em alguns minutos.
Na apresentao dos resultados, incorpora opes de grficos e figuras que possibilitam selecionar
os mais adequados s caractersticas do trabalho no qual utilizado.
No obstante o Alceste poder servir para um primeiro mapeamento do corpus a ser analisado,
recomenda-se que ele seja o ltimo procedimento realizado num estudo que queira conjug-lo
Anlise de Contedo. Algumas vantagens de assim proceder:
a) Quanto melhor preparado o banco de dados para o Alceste, mais confiveis so os resultados
do programa. A Anlise de Contedo pode permitir a identificao e o registro no banco de dados
de sinnimos e a correo de eventuais erros de digitao no texto.
b) No conhecer o relatrio do Alceste permite maior independncia do pesquisador na Anlise de
Contedo, evitando que os critrios de identificao, diferenciao e agrupamento dos elementos
nas categorias e subcategorias sejam influenciados pelos resultados do programa.
c) Maior familiaridade com o corpus importante para a anlise do relatrio do Alceste, e ela pode
ser alcanada com o desenvolvimento da Anlise de Contedo.

Para Anlise de Contedo


O Alceste no possui dicionrio de sinnimos, o que implica o descarte de palavras pouco
freqentes, ainda que sinnimas de outras com freqncia maior. Entende-se que tal
caracterstica no uma limitao do programa porque, como se viu, a idia na base de sua
concepo a de que grupos diferentes se expressam, inclusive em termos de vocabulrio, de
formas distintas. Nesse sentido, o descarte de tais palavras indica que as mesmas no pertencem
aos mundos lexicais do(s) grupo(s) em questo. Por sua vez, a Anlise de Contedo pode, e deve,
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

85

recuperar tais sinnimos, que podem informar que h mais de um discurso sobre o tema, ainda
que este discurso esteja menos presente no banco de dados.

Para as Redes de Contedo


a) Altas freqncias de menes em categorias diferentes no indicam necessariamente que tais
categorias estejam relacionadas. Em informaes provenientes de grupos diversos sobre o mesmo
tema possvel haver interligaes entre categorias que possibilitem a formao de mais de um
agrupamento dessas mesmas categorias. No presente estudo, em que interessava
particularmente o discurso coletivo sobre a lembrana saudosa da infncia, a partir tambm da
variabilidade das falas sobre essa mesma lembrana, s a constituio de um procedimento que
possibilitasse a visualizao de inter-relaes entre os principais elementos presentes nesse
mesmo discurso permitiria tecer consideraes sobre o carter eminentemente relacional da
memria saudosa dos tempos de menino.
b) A formao dos ns das Redes de Contedos deve ser sustentada por lgica que seja
condizente tambm com o referencial terico do pesquisador. No caso presente, optou-se,
eventualmente, pelo agrupamento de itens que se encontravam separados nas Classes do
Alceste, como no caso do n que agrega os elementos de sociabilidade (notar que me e pai
encontram-se em duas Classes distintas). Similarmente, alguns elementos separados na Anlise
de Contedo foram unidos. Por exemplo: foi considerado como um grupo ldico formado por
atividades, jogos e brincadeira, um conjunto de itens que resultaram separados na anlise de
contedo, mas que foram apontados pelo Alceste como pertencendo a uma mesma classe (Figura
01 e Quadro III).
c) A construo das Redes de Contedos pode proporcionar ajustes na Anlise de Contedo, pois
no se trata apenas de contagem, mas sim de um processo de classificao. bvio que os
resultados da Anlise de Contedo e das Redes de Contedos devem ser coerentes, pois que
estas se originaram da primeira. Trabalhar com categorias pr-estabelecidas processo menos
sinuoso, pois se trata de decidir se determinada meno se refere a uma categoria ou a outra, e
no de agrupar elementos dispersos em vrios textos partindo da idia deles estarem ou no
explicitamente relacionados ao mesmo tema. Assim, discrepncias eventuais entre os dois
procedimentos, provavelmente pelo fato das anotaes terem sido feitas em momentos
diferentes, podem ser corrigidas por meio de um ajuste na Anlise de Contedo ou nas Redes
de Contedo, conforme parea mais apropriado ao pesquisador.

Referncias Bibliogrficas
Alba, M. (2004). El mtodo ALCESTE y su aplicacin al estdio de lasrepresentaciones sociales del
espacio urbano: el caso de la Ciudad de Mxico. Papers on Social Representations, cidade em
que foi publicado o peridico?, v.13, 1.1-1.20?. Disponvel em <http://www.psr.jku.at>. Acesso
em: 15 jul. 2005.
Bardin, L. Anlise de Contedo. Lisboa: Edies 70, 1977.
Bauer, M.W. Anlise de contedo clssica: uma reviso. In: M. W. Bauer & G. Gaskell (Orgs.).
Pesquisa qualitativa com texto, imagem e som: um manual prtico (Traduo de Pedrinho A.
Guareschi). Petrpolis: Vozes, 2002. p. 189-217.
ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

86

Camargo, B.V. ALCESTE: Um programa informtico de anlise quantitativa de dados textuais. In:
A. S. P. Moreira (Org.). Perspectivas terico-metodolgicas em Representaes Sociais.
Joo Pessoa: UFPB/Editora Universitria, 2005. p. 511-539.
Kalampalikis, N. Lapport de la mthode Alceste dans lanalyse des reprsentations sociales. In : J.
C. Abric (Org.). Mthodes dtude des reprsentations sociales. Paris: rs, 2003. p. 147163.
Kronberger, N. E Wagner, W. (2002). Palavras-chave em contexto: anlise estatstica de textos.
In: M.W. Bauer & G. Gaskell (Orgs.). Pesquisa qualitativa com texto, imagem e som: um
manual prtico (Traduo de Pedrinho A. Guareschi). Petrpolis: Vozes, 2002.
Lorenzi-Cioldi, F. Questions de mthodologie en sciences sociales. Paris: Delachaux et
Niestl, 1997.
Nascimento, A.R.A. Memria dos Verdes Anos: saudade da infncia na msica popular
brasileira uma investigao e uma proposta de anlise de dados. 2004. 179 f. Tese
(Doutorado em Psicologia) - Programa de Ps-Graduao em Psicologia, Universidade Federal do
Esprito Santo, Vitria.
Oliveira, D.C.; Gomes, A.M.T.; Marques, S.C. Anlise estatstica de dados textuais na pesquisa
das Representaes Sociais: alguns princpios e uma aplicao ao campo da sade. In: M. S. S.
Menin; A. M. Shimizu (Orgs.). Experincia e Representao Social: questes tericas e
metodolgicas. So Paulo: Casa do Psiclogo, 2005. p. 157-200.
Reinert, M. Alceste, une mthodologie danalyse des donnes textuelles et une application: Aurelia
de Gerard de Nerval. Bulletin de Methodologie Sociologique, v.26, p.24-54, 1990.
Reinert, M. Alceste. Version 4.0 Windows (Manual). Toulouse: Societ IMAGE, 1998.
Reinert, M. Alceste, une mthode statistique et smiotique danalyse de discours; Application aux
Rveries du promeneur solitaire . La Revue Franaise de Psychiatrie et de Psychologie
Mdicale, v. 05(39), p. 32-36, 2001.
Vala, J. A Anlise de Contedo. In: A.S. Silva; J. M. Pinto (Orgs.). Metodologia das Cincias
Sociais. 12 ed. Porto: Edies Afrontamento, 2003. p. 101-128.

Endereo para correspondncia


Endereo: fgian@uol.com.br; paulomenandro@uol.com.br.
Recebido em: 11/04/2006
Aceito para publicao em: 18/07/2006

ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

87

Notas
*

Doutor em Psicologia (UFES).

**

Doutor em Psicologia (USP).

A possibilidade dessa conjugao, ainda que no explorada, tambm foi apontada por Alba
(2004).

Em portugus, mais informaes sobre o ALCESTE podem ser encontradas em Camargo (2005)
e Oliveira, Gomes; Marques (2005).

ESTUDOS E PESQUISAS EM PSICOLOGIA, UERJ, RJ, ANO 6, N. 2, 2 SEMESTRE DE 2006

88

Você também pode gostar