Você está na página 1de 36

ANÁLISE LÉXICA E ANÁLISE DE CONTEÚDO: Técnicas complementares, sequenciais e recorrentes para exploração de dados qualitativos

Henrique Freitas & Raquel Janissek

Distribuição: Sphinx ®

Freitas & Janissek

Análise léxica e Análise de conteúdo

p.3

Supervisão gráfica: terceirizada Capa: Fernando K. Andriotti, Maurício G. Testa e André Panisson Edição: Fernando K. Andriotti Impressão: Gráfica La Salle.

Dados internacionais de Catalogação na Publicação (CIP) (Câmara Brasileira do Livro, SP, Brasil)
FREITAS, Henrique Mello Rodrigues de. Análise léxica e análise de conteúdo: técnicas complementares, sequenciais e recorrentes para exploração de dados qualitativos / Henrique Mello Rodrigues de Freitas e Raquel Janissek. Porto Alegre: Sphinx: Editora Sagra Luzzatto, 2000. 176 p.: il. Bibliografia: 85-241-0637-9 1. Metodologia da Pesquisa. 2. Técnicas de pesquisa. 3. Análise de Dados: pesquisa. I. Janissek, Raquel . II. Título

Índice para catálogo sistemático: 1. Pesquisa e métodos – 001.4 2. Ciências sociais – 306.3 3. Análise de dados – 001.642 © Henrique Freitas & Raquel Janissek Todos os direitos estão reservados à Sphinx ® Impresso em Junho 2000. Também disponível via Internet (http://www.sphinxbr.com.br e http://www.adm.ufrgs.br/professores/hfreitas).

Freitas & Janissek

Análise léxica e Análise de conteúdo

p.4

Sumário

Apresentação .............................................................................................................. 7 Prefácio dos Autores................................................................................................... 8 Dados dos Autores.................................................................................................... 10 Prefácio..................................................................................................................... 11 1. Explorando dados textuais para identificar oportunidades e antecipar problemas12 2. Dados qualitativos: problemas e questões inerentes à sua coleta e análise.......... 15 3. Análise quali ou quantitativa de dados textuais? .................................................. 21 3.1. A Análise Léxica .......................................................................................... 31 3.2. A Análise de Conteúdo ................................................................................. 37 4. Aplicações de análise qualitativa em gestão e em sistemas de informação .......... 63 5. Ferramentas para Análises Léxica e de Conteúdo ................................................ 69 6. Aplicação de análise de dados qualitativos: pesquisa sobre internet e negócios . 77 6.1. As questões abertas da pesquisa.................................................................... 79 6.2. Como analisar os dados qualitativos? ........................................................... 83 6.3. Análise léxica dos dados abertos da pesquisa: palavras e expressões.......... 87 6.4. Análise de Conteúdo das questões abertas.................................................. 108 6.5. Aprofundando a análise de dados através da Análise de Correspondência. 133 7. Considerações Finais .......................................................................................... 139 8. Referências bibliográficas .................................................................................. 143 Índice Remissivo .................................................................................................... 148 Índice de Autores.................................................................................................... 154 Apêndice - Sistema Sphinx® para pesquisas e análises de dados ........................... 156

Freitas & Janissek

Análise léxica e Análise de conteúdo

p.6

nelas. precisa e com um custo operacional bem menor. em especial as análises léxica e de conteúdo. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. com o auxílio de instrumental adequado. seja de que natureza for. retratam as diferenças das competências e das intenções em uma pesquisa. buscando repassar ao leitor condições para uma investigação prática e eficaz. Com o uso de dados qualitativos. Estas técnicas são apresentadas enfatizando o seu uso em conjunto. Mostra-se que é viável.7 . Este livro demonstra algumas técnicas para realizar análise de dados textuais. constituindo-se numa fonte diferenciada para a geração de novos. O pesquisador ou analista tem. esse tipo de dado pode ser explorado mais de uma vez. técnicas e métodos inerentes à necessidade por construção de conhecimento a partir de dados disponíveis de uma ou outra forma dentro do seu contexto de atuação. através de procedimentos sistematizados. explorar dados quanti-qualitativos e produzir informações consistentes que possam trazer respostas ágeis a muitos questionamentos que surgem no dia-a-dia de uma organização e mesmo no trabalho do profissional de pesquisa. Todo profissional deve desenvolver habilidades e dominar sistemas. diferentes e curiosos dados. Além disso. diferentes recursos que permitem a exploração adequada dos dados. bem como a isenção conferida pelo pesquisador que respeita estes métodos. Existem várias técnicas de coleta e de análise de dados que permitem capturar automática e quase gratuitamente dados qualitativos. pode-se ter a chance de identificar oportunidades ou antecipar problemas de forma bem mais pontual. os quais podem ser produzidos diretamente pelo pesquisador.Apresentação O diferencial proporcionado pelos métodos.

fala-se de formas gráficas ou simplesmente de formas breves em razão de uma certa ambigüidade da palavra. a lista de todas as formas gráficas utilizadas.144-145). p. caso uma dada palavra apareça n vezes após realizada uma contagem. mas também podem ser sinais de pontuação. uma indicação (FREITAS. Nesse tipo de técnica são feitas análises de palavras. tenham enfaticamente apontado para aquela idéia. Por exemplo. 2000). O léxico é então. isso não significa que aquela palavra. ou um pequeno grupo destes. por definição. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. ou ainda o conjunto das palavras diferentes usadas nesse texto. com a sua frequência de aparição (FREITAS. cada qual estando munida de um número de ordem ou frequência (LAGARDE. 2000). 2 ou mais vezes.3. independentemente deste ter citado a palavra 1. e não de respondentes. possa ser generalizada para grande parte dos respondentes ou representar uma idéia que tenha aparecido em várias opiniões: pode muito bem ocorrer que determinado respondente. repetidamente (por que não?). A organização consiste em isolar cada forma gráfica supostamente delimitada por dois caracteres separadores que na maioria das vezes são os próprios espaços.1. diferentemente de uma Análise de Conteúdo. Cada aparição de uma forma de dado é chamada ocorrência. A Análise Léxica Toda a análise de textos começa pela organização completa do vocabulário utilizado. 1995. Já a Análise Léxica consiste em averiguar ou medir a dimensão das respostas: as pessoas responderam de forma extensa ou concisa? Cria-se uma hipótese de que aqueles que deram respostas extensas têm um interesse maior do que os demais. ou aquela idéia. porém. Uma hipótese discutível que dará. onde são identificadas idéias por respondentes. Mais do que palavras.31 . as quais são evidentemente contabilizadas para formar o léxico.

agrupando palavras afins. A evolução se dá da visão geral do texto para os dados na sua essência. acesso a um processo de leitura mais rápido. o uso da Análise Léxica permite rapidamente interpretar e fazer uma leitura adequada e dinâmica das questões abertas das enquêtes. assim. avançando sistematicamente na direção de identificação da dimensão das respostas. p. automatizado e que. onde posteriormente serão novamente analisados com vistas ao universo total de informações. Esse procedimento não é mais rigoroso do que a Análise de Conteúdo clássica. mas a leitura subjetiva também é realizada: temse. o léxico. Uma Análise Léxica inicia sempre pela contagem das palavras. Ao fazer isso. sejam eles palavras ou expressões (LEBART e SALEM. normalmente são feitas aproximações ou agrupamentos que permitam apresentar critérios mais frequentemente citados. por outro lado. até resultar num conjunto tal de palavras Freitas & Janissek – Análise léxica e Análise de conteúdo – p. iniciando com as entrevistas que foram realizadas e elencando as palavras produzidas nas respostas (GRAWITZ. ou seja.32 . Um esquema geral (Figura 3) para Análise Léxica é proposto por FREITAS. Nos casos de respostas abertas.Então pode-se dizer que a análise léxica é o estudo científico do vocabulário. utilizando indicadores que relacionam aspectos relativos às citações e às palavras (BARDIN. 1996). 2000). com aplicações de métodos estatísticos para a descrição do vocabulário: ela permite identificar com maior detalhe as citações dos participantes. parte-se de um nível que se pode chamar de macroestatístico. através de processos automáticos que associam a matemática e a estatística. o conteúdo das respostas abertas. deletando palavras que não interessam. A partir do corpo do texto. encontra um certo número de justificativas (FREITAS.5869). 1994. 1993). Pode-se ainda colocar que. evolui-se para analisar palavras e expressões. MOSCAROLA e JENKINS (1998). Seu tratamento dos dados é objetivo.

até mesmo problemas de sinônimos.que representem na essência as principais descrições citadas nos textos. p.33 . Freitas & Janissek – Análise léxica e Análise de conteúdo – p.135-142). 1994. Nestes casos. de uma mesma idéia. Tudo depende do quão sutil é feita a análise pelo pesquisador e da qualidade dos dados (amostra). possibilitando uma análise de contexto onde as categorias identificadas representem a essência das idéias apresentadas (LEBART e SALEM. as frequências permitem consolidar a aplicação de um tema ou locução. Uma análise rápida em uma pequena amostra normalmente apresentará problemas de dispersão de um mesmo tema. O tratamento para tal seria o correto agrupamento de palavras em critérios semelhantes.

Corpo do Texto Lematizador Corpo do texto lematizado Variáveis De Contexto Dicionário Reduzindo e Estruturando o Léxico Medidas Lexicais: Intensidade banalidade Estrutura Estatística Navegação Léxica Verbatim Variáveis fechadas do léxico Figura 3 . MOSCAROLA e JENKINS (1998) Freitas & Janissek – Análise léxica e Análise de conteúdo – p.34 .Esquema para Análise Léxica Fonte: FREITAS.

e certos aspectos sintáticos. classificam-se tais unidades de vocabulário em palavras ricas com algum significado. for aplicável naquela situação.247). banalidade ou trivialidade e ainda originalidade) (SPHINX. além das comparações entre estas. a realização de uma análise léxica se dá da seguinte forma: faz-se inicialmente o tratamento deste do conteúdo de um texto ou respostas abertas. a partir daí. que reduz o texto ao seu léxico e controla. representada na Figura 3. preposições. 1994. número total de palavras. deve-se ir além da Análise Léxica. através da identificação de número total de ocorrências de cada palavra. 1996. além de palavras instrumentais como artigos. Para isso. a validade e o fundamento das interpretações elaboradas a partir do léxico. se isso. via navegação lexical. p. são suscetíveis de revelar certas características de um discurso ou apontar confirmações de certas hipóteses formuladas. Pode-se assim reduzir significativamente o léxico. substantivos e adjetivos).82-92).Como ilustra a Figura 3. é claro.35 . bem como gerar novos dados com medidas lexicais (intensidade lexical. É também possível identificar o tempo aplicado a cada resposta. Tal análise. Além disso. inicia pela aproximação lexical sumária. criar novos dados. Em seguida é realizada a aproximação lexical controlada. substantivos e adjetivos. 1997). objetivos (fechados sobre palavras do léxico). transformar as palavras que ainda constituirão o léxico na sua forma infinitiva ou na sua forma original (fala-se aqui no que diz respeito a verbos. ou seja. Após isso. iniciando a Análise de Conteúdo (BARDIN. número total de palavras diferentes ou vocábulos e a riqueza de vocabulário para produzir uma resposta (LEBART e SALEM. Há recursos e técnicas que podem ser aplicados para ter um corpo do texto lematizado. que consiste em reduzir o texto apresentando as palavras mais frequentes que permitem uma idéia do seu conteúdo. eliminando palavrasFreitas & Janissek – Análise léxica e Análise de conteúdo – p. e. A organização da frase. p. como verbos. é realizada a aproximação lexical seletiva. etc.

ferramentas e concentrando a atenção no exame de substantivos. é possível apresentar opções (palavras. seja qual for a intenção da pesquisa ali aplicada. verbos e adjetivos via utilização de dicionários e de um lematizador. não somente pode-se contar com uma leitura das respostas. o que se poderia dizer de uma leitura e categorização mais atenta no sentido de observar e descobrir conteúdos ali ditos de forma indireta ou até mesmo obscura. agrupamentos. 1997). e isso pode ser feito com o uso combinado das técnicas apresentadas neste livro. departamento). Freitas & Janissek – Análise léxica e Análise de conteúdo – p. Com a Análise Léxica.36 . O aprofundamento da análise pode se dar com a análise bi ou multivariada dos dados textuais em função de outros dados. identificar necessidades. De fato. permitindo descobrir significados e elementos suscetíveis não identificados a priori. CUNHA e MOSCAROLA. a aplicação sequencial e recorrente destas técnicas permite assim avançar. o que por si só já nos diz muita coisa. é realizada a pesquisa das especificidades lexicais. Descobrir as razões de tal objeto de estudo significa passar da indecisão para a riqueza da leitura. região. A descrição do texto através de variáveis nominais e o cálculo das intensidades lexicais permitem que cada resposta seja descrita pela intensidade segundo a qual se manifestam os diferentes campos estudados. mas também com a identificação das opiniões expressas nas entrelinhas destes mesmos textos. Se em uma leitura espontânea já se pode identificar idéias. integrando-a desta forma com a análise de dados clássica (FREITAS. Em seguida. obsessões. segundo uma variável externa não textual (por exemplo país. expressões) para desvendar caminhos e descobrir opiniões. que estabelece uma estatística das palavras do texto. Desta forma.

mas também àquelas que estão subentendidas no discurso. CHÉRON e ZINS. já que é a expressão verbal ou escrita do respondente que será observada.27). fala ou resposta de um respondente (PERRIEN. Permite também observar motivos de satisfação. p. 1995. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. É um método de observação indireto.9) apresenta alguns propósitos para uso de AC. estudando as várias formas de comunicação. natureza de problemas. Seu propósito é prover conhecimento.3.2. opinião ou idéias de pessoas se exprime sob a forma verbal ou escrita. A Análise de Conteúdo destas informações deve normalmente permitir a obtenção destas informações resumidas. Uma parte importante do comportamento. organizadas.143). insatisfação ou opiniões subentendidas. novos insights obtidos a partir destes dados (KRIPPENDORFF. 1984.37 . p. p. etc. A AC é uma técnica de pesquisa para tornar replicáveis e validar inferências de dados de um contexto que envolve procedimentos especializados para processamentos de dados de forma científica. não se restringindo unicamente às palavras expressas diretamente. Não existiria dentro desse método uma riqueza e uma diversidade de modos de expressão? A AC torna possível analisar as entrelinhas das opiniões das pessoas. A Análise de Conteúdo Quando os dados a analisar se apresentam sob a forma de um texto ou de um conjunto de textos ao invés de uma tabela com valores. WEBER (1990. A AC pode ser usada para analisar em profundidade cada expressão específica de uma pessoa ou grupo envolvido num debate. a análise correspondente assume o nome de Análise de Conteúdo – neste texto AC (LAGARDE. 1980).

traços estes que são a manifestação de estados. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. p.para análise qualitativa novamente.43). A AC é como um trabalho de um arqueólogo: ele trabalha sobre os traços dos documentos que ele pode encontrar ou suscitar. Existe alguma coisa a descobrir sobre eles. dados. 2 Inferência: operação lógica.38 . 1996. p. Ele trabalha explorando os dados. Parte-se de dados qualitativos . a descrição do conteúdo é a primeira etapa a ser cumprida. e o analista pode manipular esses dados por inferência de conhecimentos sobre o emissor da mensagem ou pelo conhecimento do assunto estudado de forma a obter resultados significativos a partir dos dados (Figura 4).43-44). como um detetive (BARDIN.169-177). p.fazendo um agrupamento quantitativo . Este tema é desenvolvido por BARDIN (1996. pela qual se aprova uma proposição em verdade de sua ligação com outras proposições já tênues por verdades (BARDIN. a qual passa pela já citada Análise Léxica pela possibilidade de leitura rápida do conteúdo das respostas através de resultados tabulados das frequências das mesmas. Nesse sentido. 1996. características ou fenômenos.O objetivo da AC é a inferência2 de conhecimentos relativos às condições de produção com a ajuda de indicadores.

46) Freitas & Janissek – Análise léxica e Análise de conteúdo – p.Leitura Normal Variáveis Inferidas / Análise de Conteúdo Figura 4 – Análise de Conteúdo BARDIN (1996. p.39 .

CHÉRON e ZINS (1984) e FREITAS. pela possibilidade de evidenciar os elementos significativos.que envolve perguntar porque alguém disse alguma coisa . Ser ainda quantitativo. pela dedução através da leitura e compreensão das mensagens. o meteorologista faz a previsão do tempo inferindo sobre estados ou posições da natureza. calcular a sua frequência. Segundo GRAWITZ (1993. permitem tirar conclusões. Os fatos. a inferência dos antecedentes da comunicação .. classificar a AC de acordo com o propósito de investigação. Pode-se. o que é reforçado por PERRIEN. p. etc. Ser também sistemático.ou ainda fazer inferências sobre os efeitos da comunicação . obedecendo a diretrizes suficientemente claras e precisas de forma a propiciar que diferentes analistas. pois todo o conteúdo deve ser ordenado e integrado nas categorias escolhidas. Ser objetivo. trabalhando sobre o mesmo conteúdo. esta condição não sendo indispensável visto que certas análises de cunho qualitativo buscam mais os temas do que a sua exata medida ou importância. Ocorre o mesmo dentro da Análise de Conteúdo. ainda. MOSCAROLA e JENKINS (1998). e elementos de informação associados ou relativos ao objetivo não devem ser deixados de lado.Fazer o processo dedutivo ou inferencial a partir de índices (palavras) ou indicadores não é raro dentro da prática científica. visto que a análise deve proceder segundo as regras préestabelecidas. como e de quem alguém disse tal coisa.40 .perguntando o quê. obtenham os mesmos resultados. tais características formam os atributos da Análise de Conteúdo. que pode ser a descrição de características de comunicação . O médico faz suas deduções sobre a saúde de seu paciente graças aos seus sintomas. obter novas informações ou completar conhecimentos através do exame detalhado dos dados.534).perguntando com que Freitas & Janissek – Análise léxica e Análise de conteúdo – p. em função do objetivo perseguido. deduzidos logicamente a partir de indicadores.

abordam-se alguns tópicos inerentes. o seu valor como instrumento ou técnica de pesquisa. p. relações ou transformações entre estes” (KRIPPENDORFF. p. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. AC é “um conjunto de técnicas de análise das comunicações que. 1969 e JANIS. 1965 apud KRIPPENDORFF.intenção alguém disse tal coisa (HOLSTI. p. como: os tipos de Análise de Conteúdo. bem como seu uso e aplicação. 1980. através de procedimentos sistemáticos e objetivos de descrição do conteúdo das mensagens. De fato. 1980. Para BARDIN (1996.34). a Análise de Conteúdo é “uma técnica de pesquisa utilizada para tornar replicáveis e validar inferências de dados para seu contexto.41 . visa obter indicadores (quantitativos ou não) que permitam a inferência de conhecimentos relativos às condições de produção e de recepção (variáveis inferidas) destas mensagens”. as suas etapas. segundo seus componentes. A seguir.35).47).

enquanto a novidade.328) Freitas & Janissek – Análise léxica e Análise de conteúdo – p. 1998): ♦ Verificação ou Exploração? Deve-se fazer distinção entre a análise de documentos tendo como objetivo a hipótese de verificação (sabendo-se o que se busca e podendo-se quantificar os resultados . 1996. e flexibilidade como oposto à rigidez. O que é importante deve estar claro em cada um dos tipos de análise. palavras ou símbolos. Tipos de Análise de Conteúdo Uma vez que diferentes fontes de dados estão normalmente disponíveis. Outra dicotomia quali-quanti é impressões versus sistematizações. visto que faz apelo à intuição e à experiência.1. BERELSON (1971. processar e analisar dados. MOSCAROLA e JENKINS. interesse. ♦ Análise quantitativa ou análise qualitativa? A análise quantitativa tenta acumular a frequência de temas. seguindo papéis e técnicas que não podem ser padronizadas. pode-se usar vários modelos para explorar. p. hipóteses ao invés de verificações. Sempre se tem um dilema: adotar categorias representativas.2. GRAWITZ (1993) desenvolve 3 diferentes enfoques (valorizados por FREITAS. onde a análise é menos rigorosa e sistemática. ou reagrupar deliberadamente os dados em um pequeno número de categorias. O número de vezes que um dado elemento ocorre é o que conta para a análise quantitativa. apud FRANKFORT-NACHMIAS e NACHMIAS. enquanto análise qualitativa é baseada na presença ou ausência de dadas características.neste caso o objeto é preciso).3.42 . e aquela análise cujo objetivo seja exploração ou definição de hipóteses. sacrificando informações. tema ou atributo subjetivo é o objeto da análise quali.

não é algo amparado apenas no qualitativo. além do que se tem como resultado claro e manifesto. até mesmo aquilo que o autor deixou subentendido. origem. obter por inferência. que vai além do que é dito.43 . a partir de uma análise quantitativa. ou o que é latente sob a linguagem explícita utilizada no texto. já a análise quantitativa indireta pode. buscar uma interpretação mais sutil. consiste em contabilizar as respostas tal qual elas aparecem. sentido. por vezes. etc) pode ser muito reveladora. ♦ Análise direta ou indireta? A análise quantitativa direta. FRANKFORT-NACHMIAS e NACHMIAS apontam. valores.define que “a Análise de Conteúdo se sustenta ou se destrói pelas suas categorias”. conflito. Este tipo de informação (escolha das palavras. método ou técnica utilizada. tempo. baseados na literatura. A interpretação indireta. métodos. ritmo do discurso. padrão. forma de definição). Freitas & Janissek – Análise léxica e Análise de conteúdo – p. Pode-se. do tipo “o que é dito” (tema. ela pode perfeitamente se apoiar num conteúdo quantificado (e que possa ser destacado como exemplo). então. características. uma série de categorias mais frequentemente empregadas. medida mais comumente utilizada. etc) e “como é dito” (forma ou tipo de comunicação.

2. Tais critérios muito provavelmente serão agrupados ou reagrupados. É o que ilustra a Figura 5 (PERRIEN. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. que se iniciam pela definição do universo estudado. 1990. A categorização é uma etapa delicada.44 . desta forma. Etapas da Análise de Conteúdo Toda a análise de conteúdo deve seguir uma série de etapas precisas. que significa determinar as dimensões que serão analisadas. as categorias serão formadas a posteriori. é importante utilizar-se dos critérios ou palavras identificadas na Análise Léxica. CHÉRON e ZINS. inicia-se sua categorização. a categorização (processo de redução do texto no qual as muitas palavras e expressões do texto são transformadas em poucas categorias) é o problema central da AC (WEBER. não sendo evidente determinar a priori suas principais categorias: na verdade.275-277). (1984. Estas categorias serão determinadas em função da necessidade de informação a testar: elas constituirão o coração da Análise de Conteúdo. sua origem será empírica: a partir de um estudo de um certo número de casos.3. o que estará e o que não estará envolvido. p.15).2. p. formando então as categorias. Em certos casos. dimensões estas que definem a teia da grade de análise. Uma vez estando o universo corretamente definido. Na definição das categorias. delimitando e definindo claramente.

Figura 5 – Análise de Conteúdo em etapas Freitas & Janissek – Análise léxica e Análise de conteúdo – p.45 .

As categorias são as rubricas significativas em função das quais o conteúdo será classificado e eventualmente quantificado. De fato. intenções. quando não se tem uma idéia precisa. as categorias constituem elas próprias o quadro. A escolha das categorias é o procedimento essencial da Análise de Conteúdo. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. Segundo WEBER (1990) e BARDIN (1996). objeto ou contexto de análise. As categorias devem se originar seja do documento objeto da análise. não sem considerar elementos ausentes que podem ser significativos.56-57) aborda a questão da contagem de categorias. pode-se ter categorias prédefinidas. por exemplo). A Análise de Conteúdo deve normalmente permitir o aparecimento de variáveis e fatores de influência que se ignorava no início dos trabalhos. caso se trate de uma entrevista. Na enquête de exploração. crenças do emissor. Das respostas. pode-se prever categorias já em forma de código. no caso de um texto. dos objetivos. WEBER (1990. visto que elas fazem a ligação entre os objetivos de pesquisa e seus resultados. No caso de uma enquête. as categorias devem ser exaustivas (percorrer todo o conjunto do texto). As categorias. p. É o objetivo perseguido que deve pautar a escolha ou definição do que deve ser quantificado. seja de um certo conhecimento geral da área ou atividade na qual ele se insere. exclusivas (os mesmos elementos não podem pertencem a diversas categorias). enquanto que. O valor da análise fica sujeito ao valor ou legitimidade das categorias de análise.46 . assim como se pode utilizar esse mesmo dado para julgar se a clientela está ou não satisfeita (classificação já pronta para se categorizar cada respondente em ‘satisfeito’ ou ‘insatisfeito’). devem surgir com base no próprio conteúdo. Pode-se explorar um dado para saber o que dele pode emergir como categorias (a lista de reclamações dos clientes. um mesmo dado aberto pode servir de base aos dois exercícios ou lógicas ou estratégias de análise recém evocados. na busca de verificação de uma hipótese.

Além de LEBART e SALEM (1994. A escolha das unidades de análise é a etapa seguinte: o conteúdo de um texto pode ser analisado de diferentes maneiras. medidas por estímulos situacionais. as unidades classificam-se em (1) palavras. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. as unidades de análise classificam-se em (1) unidades amostrais. que são aquelas partes da observação real.57).objetivas (características claras de modo a permitir seu uso por diferentes analistas em um mesmo texto) e pertinentes (em relação com os objetivos perseguidos e com o conteúdo tratado). CHÉRON e ZINS (1984). (2) unidades de registro. evidenciando o conjunto total das idéias apresentadas. que são as unidades de análise mais desagregadas. que representam um outro sujeito de interesse. apresentando-as com alguns enfoques ou rótulos diferentes. conforme as unidades de análise que serão definidas. p. que implicam em relacionar e medir um certo número de especificidades dos textos. p.46-50) e de WEBER (1990. uma vez que compreende proposições ou afirmações de um sujeito a presença ou ausência de um tema pode ser rica em informações. que pode ser definido como a unidade mais manipulável. que são segmentos específicos do conteúdo. registradas independentemente das outras que a acompanham. ♦ Segundo KRIPPENDORFF (1980. (3) em personagens.21-24). Vários autores tratam das unidades de análises. destacam-se: ♦ Para PERRIEN. (2) em tema.47 . p. sobre os quais pode-se manipular determinadas características e tomá-las como foco de análise e ainda (4) as características espaciais ou temporais. pois muitas vezes expressam situações momentâneas.

podendo então serem registradas como partes analisáveis separadamente das unidades amostrais. CHÉRON e ZINS. representa uma quantificação ao nível nominal (PERRIEN.caracterizados por situarem-se dentro de uma dada categoria e descritas separadamente. cujo objetivo é permitir o relacionamento das características dos textos combinadas ao universo estudado. A presença ou ausência de uma unidade igual ao nome das unidades. A quantificação é a última etapa da Análise de Conteúdo. 1984. que fixam limites de informações contextuais que podem apresentar a descrição de uma unidade de registro. e (3) unidades de contexto. p.48 . Freitas & Janissek – Análise léxica e Análise de conteúdo – p. Elas delineiam aquela parte do material necessário para ser examinado para que uma unidade de registro seja caracterizada.274-277).

Além disso.146). Segundo KRIPPENDORFF (1980. sendo conveniente minimizar as diferenças dos pontos de vista entre os analistas. são necessárias intuição. e requer muita dedicação. p. a verificação da confiabilidade visa prover uma base para inferências. Existem alguns aspectos que GRAWITZ (1993. onde é preciso identificar presença ou ausência de um elemento e não a sua frequência. recomendações.3. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. paciência e tempo para satisfazer a curiosidade do investigador. perseverança. O valor da Análise de Conteúdo A Análise de Conteúdo é uma técnica refinada.553-558) resgata com relação à AC. e ainda rigidez na decomposição do conteúdo ou na contagem dos resultados das análises. o analista deve ter disciplina. além de criatividade para escolha das categorias já citadas. MOSCAROLA e JENKINS (1998): ♦ Confiabilidade: A Análise de Conteúdo deve ser objetiva.49 . delicada. onde se procura identificar intenções ocultas. a confiabilidade não deve ser encarada da mesma forma quando se trata de análises quantitativas de um conteúdo claro e óbvio. Mas isso é um velho problema das ciências sociais. p. suporte à decisão ou mesmo a aceitação de um fato. como quando se trata de uma análise mais qualitativa. imaginação e observação do que é importante.3. os quais são abordados e reforçados por FREITAS.2. Ao mesmo tempo. e os resultados devem ser independentes do instrumento utilizado para medição.

Os assuntos guiados pelas categorias podem suscitar hipóteses interessantes (FREITAS. até mesmo interpretações positivas ou negativas. e da exatidão com a qual ele irá traduzi-la em variáveis. prudência e humildade são recomendadas ao traçar as conclusões. MOSCAROLA e JENKINS. esboço de pesquisa ou categorias. ♦ Validade empírica: a predição inerente é justa ou precisa? Uma difícil questão para responder. É claro. GRAWITZ (1993) acredita que a experiência e o treinamento do analista assinam a validade de sua análise. Qualquer esforço nessa direção Freitas & Janissek – Análise léxica e Análise de conteúdo – p.♦ Validade lógica: o instrumento realmente mede o que ele se propõe a medir? Uma análise é válida quando a descrição quantificada que ela oferece a respeito de conteúdo é significativa para o problema original e reproduz fielmente a realidade dos fatos que ele representa. Contudo. p. isso é condição essencial da representatividade da amostra e supõe que certas condições técnicas inerentes a cada estágio sejam observadas satisfatoriamente. O valor da Análise de Conteúdo depende da qualidade da elaboração conceitual feita a priori pelo pesquisador. 1998). Em lugar de convicções. ♦ A inferência: este ponto merece especial atenção porque algumas das expressões têm mais de uma interpretação.50 . uma variável baseada na classificação de um conteúdo é válida na medida em que de fato mede o construto que o pesquisador tenciona medir.15). Segundo WEBER (1990. dependendo do contexto.

21-24 e p.129). em relação à sua estrutura de codificação. que poderia ser vista por ela mesma como confiável se. 1980. os mesmos códigos fossem repetidos por um diferente codificador com uma margem aceitável de erro.176-178) evoca referencial sobre o grau aceitável de concordância.41-42). observando (p. ainda que não seja uma condição suficiente por si só para a validade. bem como os indivíduos envolvidos na sua análise e ainda o processo que vai gerar os resultados devem ser. instrumento ou pessoa (KRIPPENDORFF. A importância da confiabilidade está baseada na sua garantia de que os dados são obtidos independentemente do evento de medição. Ele observa ainda que o custo de não ser zeloso nesse sentido é o de se chegar a 3 OLIVEIRA (1999. Dados confiáveis. p. e não buscando influenciar um no protocolo do outro). A confiabilidade é vista como um problema no contexto de pesquisa qualitativa. p. A confiabilidade é necessária. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. 1986. confiáveis. todos eles. apud KRIPPENDORFF. em qualquer recodificação subsequente. Para os resultados de pesquisa serem válidos.51 .146-147) que adotou em sua equipe a diretriz de reter variáveis cuja concordância nesse sentido fosse de pelo menos 80% entre os dois codificadores (necessariamente independentes. como último recurso. inclusive identificando na literatura que as chances de concordância entre os classificadores é maior à medida que o número de opções ou categorias é menor. KRIPPENDORFF (1980.deve passar pela confiabilidade e validade dos resultados gerados (KIRK e MILLER. por definição. p. somente discutindo.130-154) aborda em detalhe esta questão da concordância. 1980). mas que seriam igualmente retidas ou consideradas variáveis cuja concordância fosse entre 67 e 80% (muito embora se deva ser sempre cauteloso ao concluir sobre estes resultados)3. são dados que permanecem constantes através das variações do processo de medida (KAPLAN e GOLDSEN. os dados nos quais eles serão baseados. sobre efetivas dúvidas. p.

O autor observa (p. onde o ambiente (categorias e propriedades) é desenvolvido e hipóteses são geradas. deve-se ser rigoroso na consideração de níveis de concordância. onde as hipóteses são refinadas com maior detalhe (KELLE. p.25). p. contudo. Numa abordagem hipotético-dedutiva para análise de textos. SILVERMAN (1993. porém. Não se deve confundir os requisitos que surgem na pesquisa hipotético-dedutiva com as demandas da pesquisa qualitativa exploratória. não tão baixo que não permita levar a sério as descobertas". como observação e entrevistas. quanti e qualitativos. Deve-se entender que cada abordagem requer um enfoque diferente de confiabilidade: um estágio dito exploratório. Para alcançar um bom nível de concordância. e um estágio de construção de teoria baseada em dados.149) discute validade como sendo ‘verdade’.52 . o nível da concordância "pode ser consideravelmente relaxado. ou seja. p. categorias (pré-definidas) serviriam para condensar informações relevantes contidas nos dados. contagem ou codificação representa efetivamente o fenômeno social ao qual se refere”. ele recorre a HAMMERSLEY.conclusões equivocadas nas pesquisas. 1995.156-157) descreve duas formas de validação na pesquisa qualitativa: a “triangulação” (comparar diferentes tipos de dados. SILVERMAN (1993. a codificação deve ser construída através do próprio processo de análise de dados. deve-se ter cuidado e construir categorias codificadas que sejam mutuamente exclusivas e não ambíguas. Já durante um estudo exploratório. as quais seriam representadas através de frequências. de forma a ver se um corrobora o outro) e a “validação pelo respondente” (agregando as descobertas de um aos temas sendo estudados pelos Freitas & Janissek – Análise léxica e Análise de conteúdo – p. em se tratando de estudos exploratórios sem sérias consequências. para quem validade é “interpretada como a extensão ou medida pela qual uma apuração.147) que se as implicações de uma AC forem consideradas drásticas. obtidos pelo uso de diferentes métodos.

imagine o mesmo codificador confrontando sua codificação de categorias com codificações feitas por outra pessoa. seja a partir da exigência de codificação por mais de um envolvido. concluir que tais dados são confiáveis. métodos de teste de hipóteses (indução analítica na busca de associações. por exemplo. pode ser interessante o fato de estes dados serem testados por duas pessoas e ainda serem confrontados com normas sistematizadas de verificação. e mesmo avaliando sua reação).53 . contudo esse mesmo grau terá embutido um viés da própria comunicação. e sim obtendo informações sobre aspectos relevantes da população de casos e comparando o caso em análise com esses dados. Um codificador ou analista. Ou ainda. mas maior ainda porque está livre de erros ou inconsistências de um único codificador. indiferentemente das circunstâncias de aplicação (KRIPPENDORFF. ele prefere outras técnicas a estas. seja do codificador por si mesmo. não encontrando maiores divergências entre as duas. a ausência de desvios é um indicativo de confiança dos dados. Toda comunicação entre codificadores tenderá a melhorar o grau de concordância. Portanto. Agora. pode duplicar o que ele tenha tido feito antes e. usando método survey numa amostra aleatória de casos. 1986). e mesmo que se use simples procedimentos de contagem (uso de alguma quantificação). com constante uso de métodos comparativos e a busca por casos de exceção). Um procedimento confiável deve render os mesmos resultados a partir de um mesmo conjunto de fenômenos. 1980. ou ainda realizando diversos estudos etnográficos).outros.160-166) que sejam utilizados métodos que permitam generalizar para uma população mais ampla (mas não numa lógica puramente estatística. em ambas situações confrontando os resultados. alguns esforços duplicados são essenciais. Neste caso. Contudo. Ele sugere (p. para testar a confiabilidade dos dados. KIRK e MILLER. Esta confiabilidade da Análise de Conteúdo pode ser Freitas & Janissek – Análise léxica e Análise de conteúdo – p.

17). Freitas & Janissek – Análise léxica e Análise de conteúdo – p. o menor e o maior grau de confiabilidade. p. a reprodutibilidade e a exatidão. nessa ordem. Estes aspectos são reforçados e revisados por WEBER (1990. p. segundo KRIPPENDORFF (1980.130-131).54 . que são a estabilidade. as quais exprimem.obtida. A Figura 6 apresenta características destes 3 tipos de confiabilidade. através de 3 maneiras.

55 . 1980.padrão É o grau ou intensidade no qual o processo é invariável ou imutável com o passar do tempo É o grau ou intensidade no qual o processo pode ser recriado em variadas circunstancias. características e técnicas (KRIPPENDORFF. em diferentes locais. DEFINIÇÃO 1) Intra-observador / Inconsistências 1) Intra-observador / Inconsistências 2) Inter-observador / Discordâncias RELAÇÕES 1) Intra-observador / Inconsistências 2) Inter-observador / Discordâncias 3) Divergências sistemáticas. É o grau ou intensidade no qual o processo funciona conforme um padrão conhecido. de acordo com as regras ou normas Figura 6 – A confiabilidade na Análise de Conteúdo: tipos.131) Freitas & Janissek – Análise léxica e Análise de conteúdo – p.Estabilidade TIPO ESFORÇOS Teste .reteste Reprodutibilidade Teste . p. usando diferentes codificadores.teste Exatidão Teste .

a forma mais convincente de expressar a confiabilidade dos dados pode ser obtida com base no máximo possível de concordância entre os dois avaliadores. por exemplo sendo mais ‘exploratória’. Estes resgatam uma definição de HAMMERSLEY para a confiabilidade: “refere-se ao grau de consistência com o qual as categorias são definidas por diferentes observadores ou pelo mesmo observador em diferentes ocasiões”. seria fundamental a verificação quanto à reprodutibilidade e à exatidão (KELLE. existem vários cálculos que podem ser aplicados para verificar o grau de concordância obtido entre os codificadores. contudo é fortemente baseado em KIRK e MILLER. ou então um mesmo em duas ocasiões com certa distância de tempo. bem como o perfil do analista. é claro. isto combinado com uma contagem de desacordos observados em função de desacordos esperados. 1995. portanto.133-154).56 . p.A verificação da estabilidade. p. A confiabilidade é expressa como uma função de concordância entre os codificadores (ou as duas codificações do mesmo analista no tempo 1 e no tempo 2) em razão de um mesmo conjunto de dados. p. que no mínimo dois codificadores independentes descrevam um mesmo conjunto de unidades. p. dependendo do tipo de análise. já pode ser uma razoável argumentação para legitimar o valor dos dados ou categorias apresentados.134).18-28). Uma vez de posse dos resultados de cada codificador (ou do teste e reteste de um mesmo codificador). No caso de pesquisas de ‘verificação de hipóteses’. A confiabilidade de dados requer.144-148) discute detalhadamente sobre a confiabilidade. Segundo KRIPPENDORFF (1980. Tais cálculos são apresentados por KRIPPENDORFF (1980. que ele define num cálculo chamado “chance de concordância”. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. SILVERMAN (1993.

o número de julgamentos sobre os quais os analistas estão de acordo e o número de julgamentos em acordo obtidos ao acaso.57 . isto qualquer que seja o conhecimento do analista.138-154). nossa idéia é de que . Numa posição contrária ao excesso de "formulismos". o que interessa é saber o real grau de concordância entre os dois codificadores em questão (normalmente o pesquisador em si e alguém que serve de referência).nas pesquisas em SI . p. onde as categorias de codificação dos analistas são relacionadas em uma tabela de duplas entradas. nem desviar sua atenção do objeto investigado em si com procedimentos de verificação e cálculos complicados e que exigem tempo nobre e muita paciência. O leitor é quem deve julgar o uso adequado e a efetiva cientificidade das verificações da confiabilidade. com as frequências das classificações que foram identificadas pelos dois analistas e a possibilidade de medir o percentual de acordo em relação ao percentual de desacordo. Destacam-se duas proposições: um é o índice de convergência . Não se deseja sobretudo induzir o pesquisador a realizar manipulações dos resultados observados (ele ficará tentado a tal para provar um – supostamente improvável . Outro é a medida de percentual de acordo (ou a definição de matrizes de contingência entre analistas).118-119) revisa diferentes autores a este propósito. numa formulação matemática que envolve o número total de julgamentos feitos por cada analista. mas também o referencial necessário e suficiente para adoção de outra solução. bem como KRIPPENDORFF (1980.alto grau de concordância). este texto mostra posição a respeito.estas verificações devem ser passíveis de serem realizadas de forma descomplicada e bastante honesta. que compara o percentual de acordo entre os analistas em função do que seria obtido ao acaso. p.o Kappa de Cohen. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. De fato.EVRARD (1997. além do envolvimento e doação de um terceiro.

Logo. seja de idéias que eles mutuamente compartilham. nas quais o pesquisador vai utilizar seu referencial e todo seu domínio por estar envolvido na pesquisa para criar categorias de forma gradativa à medida que avança de dado em dado. Neste caso. deve-se esperar. oriundo seja de literatura. pode-se esperar um certo grau de concordância. isto é muito difícil. entre as quais as seguintes.18) chama a atenção sobre quão “potencialmente confusa” pode ser a questão de verificação da validade.Assim sendo. quantas categorias foram comuns aos dois avaliadores. Ora. entrevistas ou fichas): • Concordância exata com base no total de itens avaliados – em relação ao total de categorias da questão sendo avaliada multiplicado pelo número de entrevistas ou pessoas ou fichas.135) observa que a AC pode conter métricas e escalas complexas e distintas. p. Nossa proposta é que o pesquisador realize contagens de acordos e desacordos e. a partir disso. o qual realiza a categorização de confrontação. seria partir do pressuposto que ele tem um entendimento da questão e mesmo do seu conteúdo muito próximo do pesquisador principal. Mesmo KRIPPENDORFF (1980. seja nas observações (pessoas. p.58 . baseadas seja nas categorias. Isto não é tão verdade para o caso das variáveis ditas inferidas. um não tão alto grau de concordância nas confrontações cujo objeto seja este tipo de variável. possa ter um alto grau de concordância. possa ter formas simplificadas que permitam dar uma noção do grau de concordância entre os dois avaliadores. independentemente de Freitas & Janissek – Análise léxica e Análise de conteúdo – p. aquelas cuja classificação ou categorização foi realizada por ambos com base em protocolo comum e bem entendido. note-se primeiro que os procedimentos matemáticos ou de confrontação com outro analista (indicados na literatura já referenciada) são mais pertinentes quando a variável envolvida é do tipo assumida ou definida a priori. Esperar que o segundo analista. WEBER (1990. nestes casos. ou seja.

também poderia ser indicada a quantidade de categorias que o segundo avaliador marcou e que não foram marcadas de forma correspondente pelo pesquisador (o que se obtém diretamente.59 . descontando do número total de categorias marcadas pelo pesquisador o número de categorias coincidentes marcadas pelos dois. este último tendo sido gerado a partir da comparação caso a caso ou categorização entre o pesquisador e o segundo avaliador). A sofisticação (ou ponderação ou mesmo relativização) deste indicador seria também verificada pela quantidade de categorias que o pesquisador marcou e não foram marcadas de forma correspondente pelo segundo avaliador (o que se obtém diretamente. desconsiderando as desigualdades. • Concordância parcial com base no total de itens efetivamente marcados pelo pesquisador (ou pelos avaliadores) – em relação ao total de categorias marcadas pelo pesquisador. Além disso. Este é 4 OLIVEIRA (1999. p.357) em sua pesquisa de doutorado. ou seja. aplicou um cálculo de confiabilidade da codificação de uma questão aberta texto da seguinte forma: o coeficiente de concordância foi calculado dividindo o número total de citações com codificação igual pelo número total de citações e multiplicado por 100. quantas destas foram também marcadas pelo segundo avaliador. Ou ainda.terem sido marcadas ou não (marcaram as mesmas e deixaram em branco as mesmas) 4. também a quantidade de categorias que o pesquisador deixou em branco e também foram deixadas em branco pelo segundo avaliador. o número de categorias que o segundo avaliador marcou e que coincidem com as categorizações de fato do pesquisador). descontando do número total de categorias efetivamente marcadas pelo segundo avaliador o número de categorias coincidentes marcadas pelos dois. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. Estes dois últimos valores serviriam para mostrar que o principal indicador (a quantidade de categorias de fato igualmente marcadas) tem sua força de argumento amenizada.

de acordo com o número de categorias envolvidas na questão)? No item 6. • Concordância exata com base no total de respondentes – forma mais rígida de avaliação da concordância – qual o número de entrevistas ou pessoas ou fichas nas quais a marcação ou categorização realizada pelos dois avaliadores é exatamente coincidente? • Concordância parcial com base no total de respondentes – flexibilização do critério de avaliação da concordância – com margem de mais ou menos um. ou mesmo uma quantidade razoável a ser definida pelo pesquisador. exceto um ou dois. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. qual o número de entrevistas ou pessoas ou fichas nas quais a marcação ou categorização realizada pelos dois avaliadores é quase coincidente (quase todos coincidem.4 deste livro. ou seja.um indicador simples que mostra honestamente o grau efetivo de concordância. e também numa outra cujas categorias foram definidas a priori pelo pesquisador com base na literatura e na prática gerencial. etc.60 . mais ou menos dois. são aplicadas estas idéias numa confrontação envolvendo uma variável cujas categorias foram inferidas a partir do conteúdo de cada entrevista.

Qualquer que seja a comunicação. em gravações de voz ou imagem (rádio. os dados a reunir para compreender. documentos pessoais). A novidade em procedimentos modernos de Análise de Conteúdo está em substituir as impressões por procedimentos padronizados. A ação. que será estudado como uma função das palavras que ele contém ou idéias que ele representa.61 . documentação em palavras. através da transformação de dados iniciais (provenientes de pesquisas qualitativas) em dados possíveis de serem analisados digamos mais cientificamente. falas. estes dados são quase sempre de origem verbal. Qualquer que seja o nível que se deseje atingir e o objeto de nossas pesquisas. Aplicação da Análise de Conteúdo Os recursos oferecidos pelas ciências sociais para nossa reflexão são essencialmente compostos de comunicações orais ou escritas. utiliza-se da decomposição do texto. 1998). ou seja. explicar opiniões. livros. televisão. É muito importante que pesquisadores sociais estejam aptos a analisar esse tipo de dados de uma forma científica.4. condutas. A Análise de Conteúdo pode ser uma boa técnica para ser usada em todos os tipos de pesquisa que possam ser documentadas em textos escritos (documentos oficiais. ou em outras atividades que possam ser decompostas como uma entrevista. está-se na presença de um emissor que lança uma mensagem possuindo conteúdo e forma. Para isso. e endereçada a um ou vários receptores. jornais. quando nós a apreendemos. ações. Freitas & Janissek – Análise léxica e Análise de conteúdo – p. não se contentando apenas com impressões casuais.3.2. apresenta-se em um contexto de palavras: sempre se encontram falas ou discursos e escritos ou textos. discursos e conversas. por exemplo. visando atingir um objetivo. este último sendo escolhido em função das relações com os objetivos da nossa pesquisa aqui descrita (FREITAS. que incluem textos de entrevistas. MOSCAROLA e JENKINS. quantitativos. etc). enfim.

1998). Freitas & Janissek – Análise léxica e Análise de conteúdo – p.62 . 1976. onde se aplica portanto a utilidade da Análise Léxica para basear toda uma evolução. As comparações e evoluções formam o principal campo da Análise de Conteúdo. detalhadas e analisadas em conjunto. MOSCAROLA e JENKINS. Pode-se aplicar este tipo de técnica de análise de dados de várias formas. 623). envolvendo diferentes fontes de dados. permitem-nos passar de uma simples descrição e alcançar o objetivo de toda pesquisa científica: a descoberta de explicações e relações causais (FREITAS.Quem fala? Para dizer o quê? A quem? Como? Com que resultado? De acordo com BERELSON (in GRAWITZ. a Análise Léxica e a Análise de Conteúdo podem ser aplicadas nos casos que requerem maior precisão ou objetividade. Quando suficientemente definidas. p.