Você está na página 1de 83

Subsdios Metodolgicos para o Professor Pesquisador em

Ensino de Cincias

cx|t x X|M
`w dt|t| x dt|t|

Marco A. Moreira
Paulo R. S. Rosa

Porto Alegre
2009

Y|v{t wx txxt

Tipo de publicao: Recopilao de trabalhos publicados ou


apresentados em congressos sobre o tema Mtodos Qualitativos e
Quantitativos a fim de subsidiar metodologicamente o professor
investigador, em particular da rea de ensino de cincias.
Autor: Marco A. Moreira Instituto de Fsica, UFRGS, Brasil
Data e local: 2009 Porto Alegre, Brasil.
1 edio

bt u|vtx wt xt |x

Subsdios Tericos:
Humanismo.

Subsdios Tericos: A Teoria da Aprendizagem Significativa.

Subsidios Epistemolgicos: Epistemologias do Sculo XX.

Subsdios Metodolgicos:
Metodolgicos.

Subsdios Didticos:
Organizadores Prvios.

Comportamentalismo,

Pesquisa

Mapas

em

conceituais,

Construtivismo

Ensino:

Aspectos

Diagramas

f|
Apresentao...........4

Captulo 1
Pesquisa em ensino: mtodos qualitativos .............5

Captulo 2
Pesquisa em ensino: mtodos quantitativos......32

Txxt
Este material de apoio est constitudo por dois textos sobre metodologias de pesquisa
em ensino, particularmente em ensino de cincias. Foram escritos para serem usados
independentemente um do outro.
O primeiro deles trata apenas de mtodos qualitativos enquanto que o segundo se ocupa
somente de mtodos quantitativos.
Cabe chamar ateno que no so mais do que textos de apoio, ou textos introdutrios,
que buscam oferecer subsdios metodolgicos para o professor que queira fazer pesquisa em
ensino a fim de melhorar sua prtica docente.

Porto Alegre, 2010

Marco Antonio Moreira

Vt D
cx|t x Xwvt x V|v|tM `w dt|t|D
Resumo

`A TA `x|t

Aps uma breve comparao entre os paradigmas quantitativo e qualitativo, o texto est
dedicado apenas ao enfoque qualitativo descrevendo, com mapas conceituais, a etnografia, o
estudo de casos e a investigao-ao. Ao final, abordada a questo da triangulao
metodolgica.

Introduo
Neste texto, a pesquisa em educao em cincias est entendida como a produo de
conhecimentos resultante da busca de respostas a perguntas sobre ensino, aprendizagem,
currculo e contexto educativo em cincias, assim como sobre o professorado de cincias e
sua formao permanente, dentro de um quadro epistemolgico, terico e metodolgico
consistente e coerente. Porm, o mesmo se ocupar s do domnio metodolgico dessa
pesquisa e, nesse domnio, o foco ser particularmente a metodologia qualitativa.
A metodologia da pesquisa em educao em cincias a mesma da pesquisa em
educao e esta foi dominada, ao longo do sculo XX, por dois paradigmas clssicos: um
inspirado na metodologia das cincias naturais, enfatizando observaes empricas
quantificveis e adequadas para tratamentos estatsticos; o outro derivado da rea humanstica
com nfase em informaes holsticas e qualitativas e em abordagens interpretativas.
O filsofo alemo Wilhelm Dilthey argumentava (apud Husn, 1988) j em 1890 que
as humanidades tinham sua prpria lgica de pesquisa e que a diferena entre as cincias
naturais e as humanidades era que estas buscavam compreender enquanto que as primeiras
procuravam explicar (op. cit., p. 17). Essa distino parece hoje muito simplificada, mas serve
para mostrar que o debate antigo.
A pesquisa em educao comea (segundo Landsheere, 1988), por volta de 1900, sob
o nome de "pedagogia experimental", com pesquisadores como Meumann na Alemanha,
Binet na Frana, Thorndike nos Estados Unidos e Claparde na Suia, pouco tempo depois da
"psicologia experimental" iniciada por Wundt em Leipzig, por volta de 1880, e fortemente
influenciada por ela. De acordo com esse mesmo autor (op. cit. p. 11), nas trs primeiras
dcadas do sculo passado, a pesquisa educativa teve uma acentuada nfase quantitativa,
dirigida ao estudo da eficcia no ensino, particularmente nos Estados Unidos.
1

Programa Internacional de Doctorado en Enseanza de las Ciencias. Universidad de Burgos, Espanha;


Universidade Federal do Rio Grande do Sul, Brasil. Texto de Apoio n 14. Publicado em Actas del PIDEC,
4:25-55, 2002.

6
Posteriormente, nos anos 30 a 50, a crise econmica e a guerra levaram a uma grande
reduo na atividade de pesquisa em educao, em especial na Europa. Porm, nessa mesma
poca aparecem como campo de interesse dos pesquisadores os estudos de natureza
sociolgica questionando a escola como mecanismo de reproduo de distines sociais e
prticas discriminatrias (ibid., p. 13). Nas dcadas de 60 e 70 outra vez houve um perodo de
muito apoio financeiro pesquisa educativa, particularmente aquela voltada ao
desenvolvimento curricular em cincias e matemtica. Foi tambm uma poca de predomnio
da abordagem quantitativa, porm a reao a essa "tradio positivista" comeava a ser cada
vez mais forte no contexto da pesquisa educativa em nvel internacional. A tal ponto que nos
anos 80 e 90 houve um claro predomnio da abordagem qualitativa na pesquisa em educao
em geral e em cincias em particular.
Esta pequena e pouco rigorosa resenha histrica foi feita somente para reforar a
assero de que os dois paradigmas clssicos o quantitativo e o qualitativo dominaram a
pesquisa educativa no sculo XX, com uma certa alternncia.
Desde o ponto de vista epistemolgico, em todo esse tempo surgiram teses de
incompatibilidade paradigmtica kuhneana (Smith, 1983; Smith e Heshusius, 1986; Marshal,
1986), de compatibilidade prtica, funcional, pragmtica (e.g., Shulman, 1981; Miles e
Huberman, 1984), de conciliao e triangulao metodolgicas (e.g., Eisner, 1981; Firestone,
1987) ou integradoras como a de Keeves (1988) e a de Bericat (1998). Essas colocaes esto
discutidas em outro texto anterior e complementar a este (Moreira, 2000).
Neste texto ficaremos na perspectiva integradora, mas este tema ser deixado para o
final. Por enquanto continuaremos na distino entre os dois paradigmas. Mesmo que esta
distino e inclusive a idia de paradigma possam ser objeto de crticas por parte de
pesquisadores (e.g., Walker e Evers, 1988) continuaremos nela, por algum tempo, por razes
didticas. Por essas razes, no item seguinte distinguiremos os dois paradigmas clssicos
como se constitussem uma dicotomia. Uma vez estabelecida essa distino, o texto abordar
sucessivamente metodologias qualitativas como a etnografia, o estudo de casos, a pesquisa
ao e outras. Na concluso abandonaremos a viso dicotmica e defenderemos uma postura
integradora.

Os dois paradigmas clssicos


Na tabela 1 se estabelece uma comparao dicotmica entre os paradigmas quantitativo
e qualitativo em termos de pressupostos, objetivos, mtodos, papel do pesquisador e retrica
de apresentao do conhecimento produzido. Por ser auto-explicativa tal tabela, no ser
comentada.
A pesquisa qualitativa (interpretativa)
Na figura se apresenta um mapa conceitual para a abordagem qualitativa na pesquisa
educativa. J que os mapas conceituais no so auto-explicativos, faremos um breve
comentrio. No topo aparece o conceito de pesquisa qualitativa ao qual esto associados
atributos como interpretativa, holstica, naturalista, participativa, interacionista simblica,
construtivista, etnogrfica, fenomenolgica e antropolgica.
O interesse central dessa pesquisa est em uma interpretao dos significados
atribudos pelos sujeitos a suas aes em uma realidade socialmente construda, atravs de

7
observao participativa, isto , o pesquisador fica imerso no fenmeno de interesse. Os
dados obtidos por meio dessa participao ativa so de natureza qualitativa e analisados
correspondentemente. As hipteses so geradas durante o processo investigativo. O
pesquisador busca universais concretos alcanados atravs do estudo profundo de casos
particulares e da comparao desse caso com outros estudados tambm com grande
profundidade. Atravs de uma narrativa detalhada, o pesquisador busca credibilidade para
seus modelos interpretativos.
Tabela 1. Um paralelo entre o paradigma quantitativo e qualitativo na pesquisa educativa
(M.A. Moreira, 2000)

Pressupostos

Objetivos

Mtodos

Papel do
pesquisador

Retrica

PARADIGMA
QUANTITATIVO
REALISTA/RACIONALISTA
Realidade objetiva, independente de
crenas, com existncia prpria. O
pesquisar no afeta ao que se est
pesquisando. Os instrumentos so uma
maneira de alcanar medies precisas de
objetos e eventos com existncia prpria;
instrumentos vlidos so os que produzem
representaes exatas da realidade. Se o
pesquisador deixa de estudar algo, esse algo
continuar existindo e permanecer ligado a
outras coisas da mesma maneira. Dualismo
sujeito-objeto. Verdade uma questo de
correspondncia com a realidade (Smith,
83).
Procuram explicar causas de mudanas em
fatos sociais, principalmente atravs de
medio objetiva e anlise quantitativa
(Firestone, 87). Focam comportamentos de
grupos ou indivduos (Eisner, 81). Buscam
a predio e controle de eventos,
algoritmos, verdades, universais abstratos
aos que se chega atravs de generalizaes
estatsticas de amostras para populaes
(Erickson, 86).
Tomam emprestado o modelo das cincias
fsicas para pesquisar o mundo social e
humano.
Ocupam-se
de
desenhos
experimentais,
quase-experimentais
e
correlacionais;
testes
de
hipteses;
instrumentos vlidos e fidedignos; testes de
significncia;
amostragem;
inferncia
estatstica; generalizao. Seguem um
modelo hipottico-dedutivo.
Distante para evitar vis (Firestone, 87);
objetivo. Limita-se ao que . Quantifica
registros de eventos. Faz uso de meios
cientficos. Busca fiabilidade e validade.
Padronizada, estatstica, objetiva. Extenso
uso de tabelas, grficos, coeficientes.
Procura neutralizar a personalidade do
pesquisador. Fria, cientfica, buscando
convencer o leitor de que a anlise feita
neutra impessoal (Firestone, 87).

PARADIGMA
QUALITATIVO
IDEALISTA/NATURALISTA
Realidade socialmente construda; no h realidade
independente dos esforos mentais de criar e moldar;
o que existe depende da mente humana. O que se
pesquisa no independente do processo de
pesquisa. Os instrumentos no tm lugar
independentemente de aquilo que tm que medir, so
extenses dos pesquisadores na sua tentativa de
construir ou de dar forma realidade. A realidade
no tem existncia prvia pesquisa e deixar de
existir se a pesquisa for abandonada. No h
dualismo sujeito-objeto. Verdade questo de
concordncia em um contexto (Smith, 83).

Procuram a compreenso do fenmeno social


segundo a perspectiva dos atores atravs de
participao em suas vidas (Firestone, 87). Focam
significados e experincias; aes em vez de
comportamentos (Eisner, 81). Procuram a explicao
interpretativa; heursticas em vez de algoritmos;
universais concretos alcanados atravs do estudo
detalhado de um caso e da comparao com outros
estudados com igual detalhe (Erickson, 86).
Usam tcnicas etnogrficas, estudos de caso,
antropologia educativa. Ocupam-se de observao
participativa; significados individuais e contextuais;
interpretao; desenvolvimento de hipteses;
indicadores de baixa inferncia; casos, grupos ou
indivduos especficos; particularizao. Podem
fazer uso de estatstica descritiva. So bem mais
indutivos.
Imerso no fenmeno de interesse (Firestone, 87);
participante. Faz anotaes, ouve, observa, registra,
documenta, busca significados, interpreta. Procura
credibilidade.
Persuasiva, descritiva, detalhada. Extenso uso de
transcries, vinhetas, documentos, exemplos,
comentrios interpretativos. Usa a linguagem
cotidiana com suficiente detalhe para evidenciar que
so vlidas as interpretaes dos significados tidos
pelos atores (Erickson, 86).

A pesquisa qualitativa chamada tambm naturalista porque no envolve


manipulao de variveis, nem tratamento experimental ( o estudo do fenmeno em seu
acontecer natural); fenomenolgica porque enfatiza os aspectos subjetivos do comportamento
humano, o mundo do sujeito, suas experincias cotidianas, suas interaes sociais e os
significados que d a essas experincias e interaes; interacionista simblica porque toma
como pressuposto que a experincia humana mediada pela interpretao, a qual no se d de
forma autnoma, mas na medida em que o indivduo interage com outro, por meio de
interaes sociais como vo sendo construdas as interpretaes, os significados, a viso de
realidade do sujeito (Andr, 1998, pp. 17-18).
Erickson (1986, p. 119), um pesquisador muito conhecido em educao, prefere o
termo pesquisa interpretativa para se referir a toda uma famlia de abordagens de pesquisa
participativa observacional, em lugar de pesquisa qualitativa, por ser mais abrangente, por
evitar a idia de que seja essencialmente no quantitativa e por apontar ao interesse central
dessa pesquisa que o significado humano em um contexto social e sua elucidao e
exposio pelo pesquisador. Para ele (op. cit., p. 121), a pesquisa interpretativa envolve: a)
intensa e ampla participao no contexto pesquisado, b) cuidadosos registros do que ocorre
nesse contexto juntamente com outras fontes de evidncia (e.g., anotaes, documentos,
exemplos de coisas feitas pelos sujeitos, gravaes em udio ou em vdeo) e c) anlise
reflexiva de todos esses registros e evidncias assim como descrio detalhada (i.e., utilizando
a narrativa e transcries literais de verbalizaes dos sujeitos).
Para Erickson (op. cit., p. 129), a tarefa da pesquisa interpretativa descobrir maneiras
especficas atravs das quais formas locais e no locais de organizao social e cultural se
relacionam com atividades de pessoas especficas em suas eleies e aes sociais conjuntas.
Para a pesquisa na sala de aula, isso significa descobrir como as escolhas e aes de todos os
atores constituem um currculo prescrito um ambiente de aprendizagem. Professores e
alunos juntos e interagindo adquirem, compartilham e criam significados no s atravs dos
sistemas lingstico e matemtico, mas tambm por meio de outros sistemas como a ideologia
poltica, os pressupostos das subculturas tnicas e sociais a respeito do papel de mulheres e
homens, das relaes adequadas entre adultos e crianas, etc., isto , por aculturao.

Uma vez apresentadas algumas caractersticas gerais da pesquisa qualitativa,


passaremos a focar, sucessivamente, trs metodologias principais dentro dessa abordagem: a
etnografia, o estudo de casos e a pesquisa-ao.

A etnografia
A etnografia uma metodologia, uma ferramenta para estudar e compreender uma
cultura, a maneira de vida de um grupo de pessoas, isto , suas idias, crenas, valores e
pressupostos, seus comportamentos e as coisas que fazem (Ogbu et al., 1988, p. 48). Em
outras palavras, a etnografia uma tentativa de descrever uma cultura (Andr, 1998, p. 19).
A pesquisa etnogrfica consta essencialmente de uma descrio de eventos que ocorrem no
cotidiano da vida de um grupo com especial ateno s estruturas sociais e condutas de
indivduos a respeito do seu status de pertena ou membresia ao grupo, e uma interpretao
do que significa todo isso para a cultura do grupo (Taft, 1988, p. 71).

Figura 1. Um mapa conceitual para a pesquisa educacional qualitativa (M.A. Moreira, 2000)
Na etnografia, o pesquisador participa, o quanto possvel, da vida normal do grupo
pesquisado, da cultura pesquisada. A pesquisa conduzida no cenrio natural dos eventos, no
contexto no qual ocorrem os acontecimentos, atravs de observao participativa. Para chegar
a uma compreenso descritiva contextualizada da cultura, o pesquisador tem que se meter em
tal cultura, aprender a linguagem nativa, como disse o clebre antroplogo Malinowski,
interagir com os membros dessa cultura, desenvolver uma compreenso emptica da vida das
pessoas tal como elas a percebem, assim como uma perspectiva holstica do grupo. Tudo isso,
lgico, implica um longo tempo de residncia nessa cultura. Isto , o pesquisador deve
permanecer imerso na cultura pesquisada durante um perodo de tempo suficientemente
grande para, de acordo com Malinowski, contextualizar os dados em um account holstico
e coerente e descrever a vida tal como vivida (Ogbu et al., 1988, p. 50).

10
O pesquisador etnogrfico tem, por conseguinte, um duplo papel: participante e
observador. Por um lado, ele tem que se envolver com o grupo, aculturar-se nele. Por outro
lado, deve ser capaz de observar, interpretar, discernir, desenvolver uma perspectiva holstica.
Sendo ao mesmo tempo observadores e participantes, os pesquisadores etnogrficos no so
desprendidos do fenmeno de interesse; eles influenciam seus dados e so influenciados por
estes em todas as etapas de observao, interpretao e descrio (Taft, 1988, p. 72). A grande
vantagem de ser observador participante parece ser ao mesmo tempo a principal dificuldade
que deve enfrentar o pesquisador participante. Ao mesmo tempo que tenta pertencer
cultura pesquisada, ele ou ela deve tambm ser capaz de mir-la desde fora, interpret-la,
descrev-la.
A observao participativa a principal tcnica de pesquisa etnogrfica. Porm, as
entrevistas so tambm muito utilizadas. Os dados gerados por essas duas tcnicas so
freqentemente complementados por outros como documentos, narrativas, histrias de vida,
artefatos, diagramas, produzidos no grupo pesquisado. No geral, o pesquisador etnogrfico
busca recolher toda a informao possvel, no s atravs de observao participativa e
entrevistas, para interpret-la indutivamente e construir uma realidade social que sua
compreenso descritiva contextualizada da cultura pesquisada.
A metodologia etnogrfica qualitativa e holstica, fazendo uso da intuio, empatia e
outras habilidades do pesquisador para interpretar descritivamente uma cultura. Seu interesse
est em descobrir (no sentido de construir uma descrio compreensiva contextualizada) e no
em verificar. Porm, isso no implica no ter nenhuma hiptese ou teoria inicial. O
pesquisador etnogrfico no comea um trabalho de campo sem ter nada na cabea. Isso
no existe. Ele ou ela sempre tero conhecimentos tericos prvios que de alguma maneira
vo orientar seus passos iniciais, mas no devem ter hipteses e teorias que sero verificadas
ou rejeitadas no estudo. Isto , o pesquisador etnogrfico no deve ter idias pr-concebidas,
tal como recomendou Malinowski (apud Taft, 1988, p. 74).
As hipteses so formuladas recursivamente durante o processo, durante o
desenvolvimento da pesquisa. Gradativamente pode emergir uma base terica para a
compreenso dos processos grupais. Essa base terica conhecida como teoria
fundamentada, isto , fundamentada no prprio processo de pesquisa (ibid.), ou fundamentada
nos dados. Tal teoria, que foi desenvolvida de maneira indutiva, provavelmente gerar
hipteses teis para guiar, inicialmente, novas observaes participativas. Porm, no se est
falando aqui do indutivismo cientfico ingnuo to criticado epistemologicamente, nem de
hipteses que sero comprovadas em estudos mais rigorosos. (O tema da credibilidade
dos resultados da pesquisa qualitativa ser discutido mais adiante em outro item).
A etnografia uma metodologia de pesquisa em antropologia que chegou pesquisa em
educao no faz muito, nos anos 60 do sculo passado. Uma grande diversidade de
etnografias educativas tem sido desenvolvida desde essa poca, porm o conceito de cultura
permaneceu como constructo unificador. Trs orientaes principais podem ser identificadas
(Ogbu et al., 1988, p. 50-51) a partir de distintos nveis de anlise e diferentes nfases em suas
definies de cultura: etnografia holstica (tambm conhecida como etnografia tradicional,
velha etnografia ou macro-etnografia), a etno-cincia (tambm chamada nova etnografia ou
antropologia cognitiva) e a micro-etnografia (etnografia da comunicao).
A etnografia holstica, da qual falamos at agora, tenta descrever a cultura, ou o grupo,
como um todo enquanto que a etno-cincia e a micro-etnografia focam unidades muito
menores como palavras, indivduos ou cenas (ibid).

11
A micro-etnografia uma etnografia focada, isto , uma etnografia que se ocupa de
olhar repetidas vezes e de analisar detalhadamente registros audiovisuais de interaes
humanas em cenas-chave, em situaes-chave de interao social, acompanhadas de
observao participativa do contexto mais amplo no qual ocorrem tais cenas (op. cit., p. 51).
uma etnografia da comunicao, focando sujeitos individuais e seu discurso em certos
cenrios.
A etno-cincia se afasta da etnografia holstica tradicional ao definir cultura
primariamente em termos de cognies das pessoas. Seus pressupostos bsicos so que o
contedo dos dados culturais consta de regras, cdigos e um ordenamento ideativo da
sociedade que est organizado em diversos domnios culturais de conhecimento.
As experincias so codificadas em lexemas ou palavras; portanto, a linguagem a
principal fonte de dados culturais e as tcnicas de estudo da linguagem podem ser aplicadas
ao estudo da cultura ideativa ou cognio. Por conseguinte, h menos nfase na observao
participativa e mais nfase na coleta de vocabulrios sobre eventos particulares, assim como
nos esquemas classificatrios (op.cit., p. 52).
Relacionada com a etno-cincia est a etno-metodologia que, segundo Andr (1998, p.
18), no exatamente uma metodologia, mas um campo de pesquisa: o estudo de como os
indivduos compreendem e estruturam seu cotidiano, isto , a tentativa de descobrir os
mtodos que as pessoas utilizam em seu dia-a-dia para entender e construir a realidade que
as envolve. Em conseqncia, seus principais focos de interesse so os conhecimentos tcitos,
as formas de compreenso do sentido comum, as prticas cotidianas e as atividades rotineiras
que moldam as condutas dos atores sociais (ibid.).
Independente desses aparentemente diferentes tipos de etnografia, podemos caracterizla de maneira geral como a tentativa de descrio de uma cultura. A principal preocupao na
etnografia se refere ao significado que tm as aes e eventos para as pessoas ou grupos
estudados (op. cit., p. 19). A etnografia um esquema de pesquisa desenvolvido pelos
antroplogos para estudar uma cultura e uma sociedade. Etimologicamente, etnografia
significa descrio cultural (ibid., p. 27).
Em educao, rigorosamente falando, o que se faz so estudos etnogrficos, isto ,
uma adaptao da etnografia educao, uma vez que o fenmeno de interesse da pesquisa
educativa , em ltima anlise, o processo educativo, no uma cultura ou um grupo social em
si mesmos. Tais estudos etnogrficos incluem, por exemplo, uma sala de aulas em particular,
um pequeno grupo em uma sala de aulas ou em uma escola, cenas ou dilogos na sala de
aulas, relaes escola-comunidade, etc.
A modo de concluso deste item a respeito da etnografia se apresenta na figura 2 um
mapa conceitual para a etnografia. No topo aparece como concepto mais abrangente o prprio
conceito de etnografia que pode ser holstica (a etnografia tradicional ou velha etnografia),
micro-etnografia (a etnografia da comunicao) ou etno-cincia (a antropologia cognitiva ou
a nova etnografia). Porm, a etnografia sempre uma tentativa de descrever uma cultura
(ou uma micro-cultura) que caracterizada principalmente por significados, construdos e
partilhados pelo grupo social, isto , pelo ponto de vista nativo (idias, crenas, valores,
pressupostos), segundo Ogbu et al. (1988, p. 50).

12

ETNOGRAFIA

cenrio ou grupo
como um todo

etnografia enfocada

Etnocincia
(antropologia
cognitiva:
"nova"etnografia)

Microetnografia
(etnografia da
comunicao)

Holstica ("velha"
etnografia)

tentativa de
descrio

Observao
participante

cultura
principalmente
como cognio das
pessoas

tentativa de
descrio

tentativa de
descrio

requer imerso na

CULTURA

implica
investigador
linguagem "nativa"
sujeitos
Interao
pessoal

investigador
sujeitos
investigador
sujeitos
Contexto
Natural

compartilhados

caracterizam
a

Trabalho de
campo

requer

Tempo
suficiente

tentativa
dados
qualitativos

constri
troca de

Descrio
Induo

inferncia

SIGNIFICADOS

mudana

recursividade
interpretao
interpretao
interpretao

construo

contextualizao

COMPREENSO
DESCRITIVA
CONTEXTUALIZADA

abstrao

Realidade
construda

Hipteses e
Teorias
fundamentadas
evoluo

Figura n 2. Um mapa conceitual para a etnografia (Moreira, 2002).

A descrio de uma cultura requer observao participante, trabalho de campo


(durante um tempo suficiente) e interao pessoal (inter-subjetividade, empatia) em um
contexto natural. A etnografia busca descrio e utiliza a induo para chegar a uma

13
realidade construda; as hipteses so desenvolvidas ao longo do processo e as teorias
emergem dos dados, isto , so teorias fundamentadas (nesse sentido, os mtodos qualitativos
so indutivos). O resultado de todo o processo uma compreenso descritiva contextualizada,
de um grupo social, de umas cenas, de um discurso, de umas cognies ou, em termos mais
abrangentes e originais, de uma cultura.

O estudo de casos
De acordo com Sturman (1988, p. 61), estudo de caso um termo genrico para a
pesquisa de um indivduo, um grupo ou um fenmeno. Enquanto que as tcnicas usadas nessa
pesquisa podem variar e incluir tanto enfoques qualitativos como quantitativos, a
caracterstica que mais distingue o estudo de caso a crena de que os sistemas humanos
desenvolvem uma completude e integrao, isto , no so simplesmente um conjunto de
partes ou de traos. Por conseguinte, o estudo de caso encaixa em uma tradio holstica de
pesquisa segundo a qual as caractersticas de uma parte so determinadas grandemente pelo
todo ao qual pertence. A compreenso das partes requer a compreenso de suas inter-relaes
no todo. uma viso sistmica que pressupe que os elementos de um evento educativo, por
exemplo, so interdependentes e inseparveis e uma mudana em um elemento implica uma
mudana no resto.
Portanto, fazer uma pesquisa do tipo estudo de caso, isto , para entender um caso, para
compreender e descobrir como as coisas ocorrem e por que ocorrem, para talvez predizer algo
a partir de um nico exemplo ou para obter indicadores que possam ser usados em outros
estudos (talvez quantitativos) necessrio uma profunda anlise das interdependncias das
partes e dos padres que emergem. O que se requer um estudo de padres, no de variveis
isoladas (ibid.). Para tudo isso, as tcnicas de pesquisa qualitativa so freqentemente as mais
adequadas.
O estudo de casos se utiliza h muito tempo em campos como o direito, a medicina, a
psicologia e a administrao. Porm, na pesquisa educativa, o uso dessa metodologia mais
recente e dentro de uma concepo bastante restrita, ou seja, o estudo descritivo de uma
unidade que pode ser uma escola, um professor, um aluno ou uma aula (Andr, 1998, p. 21).
Pode tambm, por exemplo, ser o estudo de um currculo ou de um sistema escolar.
Qual seria a diferena entre estudo de caso e etnografia? Segundo Andr (ibid.), se pode
fazer um estudo de caso etnogrfico, isto , aplicar a abordagem etnogrfica ao estudo de um
caso. Porm, nem todos os tipos de estudos de caso encaixam na perspectiva etnogrfica, nem
todos os estudos etnogrficos so estudos de caso.
Quais seriam ento os distintos tipos de estudos de caso?
Em primeiro lugar necessrio distinguir entre estudo de caso e conceitos afins. De
acordo com Serrano (1998, p. 85), o trabalho com casos denota os procedimentos corretivos,
remediais, de desenvolvimento ou ajuste que seguem ao diagnstico das causas de desajuste;
o mtodo de casos uma estratgia didtica na qual os elementos principais do estudo de
casos so apresentados aos estudantes com propsitos ilustrativos, sem necessidade de
oferecer uma viso completa dos fatos (o propsito mais o de estabelecer um marco de
discusso e debate); a histria de casos a busca do passado de uma pessoa, grupo ou
instituio; o estudo de casos, por sua vez, pode ser definido como uma descrio intensiva,
holstica e uma anlise profunda de uma entidade singular, um fenmeno ou unidade social.

14
Antes de falar de tipos de estudos de casos, interessante tambm destacar seus traos
essenciais. Segundo essa mesma autora (op. cit., p. 91), as propriedades essenciais de um
estudo de casos qualitativo so a particularizao (se centram em uma situao, evento,
programa ou fenmeno particular), a descrio (o produto final uma descrio rica e densa
do objeto de estudo), a heurstica (iluminam a compreenso do leitor respeito ao objeto de
estudo) e a induo (baseiam-se no raciocnio indutivo; as teorias, os conceitos ou as
hipteses surgem de um exame dos dados fundados no contexto mesmo).
Quanto aos tipos de estudos de caso, Serrano (ibid., p. 97) argumenta que podem
classificar-se pela natureza do informe final, independentemente de sua orientao disciplinar
ou rea de interesse, em descritivos, interpretativos e avaliativos.
Estudos de caso descritivos (ibid.) se caracterizam por um informe detalhado de um
fenmeno objeto de estudo sem fundamentao terica prvia; so inteiramente descritivos,
no se guiam por generalizaes estabelecidas ou hipotticas, nem desejam formular
hipteses ou teorias.
Estudos de caso interpretativos (op. cit., p. 98) contm descries ricas e densas;
porm, os dados descritos so utilizados para desenvolver categorias conceituais ou para
ilustrar, defender ou desafiar pressupostos tericos difundidos antes do estudo. O pesquisador
deve reunir tanta informao sobre o objeto de estudo quanto seja possvel, com a pretenso
de interpretar ou teorizar sobre o fenmeno.
Estudos de caso avaliativos (ibid.) implicam descrio, explicao e juzo; sobretudo,
este tipo de estudo de casos examina a informao para emitir um juzo; a emisso de juzos
o ato final e essencial da avaliao.
No obstante, a mesma autora coloca que mesmo que se possa estabelecer esta
classificao e mesmo que alguns estudos de casos possam ser puramente descritivos, em
educao a maioria dos estudos de casos uma combinao de descrio e avaliao ou de
descrio e interpretao.
O estudo de caso interpretativo nos remete outra vez ao tema da teoria fundamentada
referido na etnografia. Este tipo de estudo de casos parece ser uma metodologia ideal para
fundamentar uma teoria, isto , para induzir uma teoria a partir de dados descritivos muito
ricos. Porm, no se trata de uma teoria formal no sentido usado nas cincias naturais,
tambm no do "mtodo indutivista". So mais bem categorias, hipteses compreensivas.
Outra classificao de tipos de estudos de caso fornecida por Stenhouse (1985, apud
Sturman, 1988, p. 63):
Estudo de caso etnogrfico, do qual j falamos, que envolve o estudo profundo de uma
entidade singular geralmente atravs de observao participante e entrevistas.
Estudo de caso pesquisa-ao, no qual o foco est em gerar uma mudana no caso em
estudo.
Estudo de caso avaliativo que envolve avaliao de programas e no qual, muitas
vezes, um trabalho de campo mais condensado substitui a abordagem etnogrfica mais
demorada.

15
Estudo de caso educativo que est desenhado para melhorar a compreenso da ao
educativa.
Como se pode perceber nas classificaes de Serrano e Stenhouse, difcil separar o
estudo de casos de outros tipos de pesquisa qualitativa como a etnografia e a pesquisa-ao.
Podemos caracterizar bem o estudo de casos argumentando que sua preocupao central a
compreenso de uma instncia singular, o que significa que o objeto estudado caracterizado
como nico, como uma representao singular da realidade que multidimensional e
historicamente localizada (Andr, 1998, p. 21). Porm, como vimos, um estudo de caso pode
ser feito atravs de uma etnografia ou de uma pesquisa-ao, por exemplo.
As caractersticas essenciais dos estudos de casos, assim como seus distintos tipos
esto mapeadas conceitualmente na figura n 3. Os dois conceitos chaves so estudo de casos
e instncia singular. Na parte superior do mapa, acima do conceito de estudo de casos esto
suas propriedades essenciais (induo, particularizao, heurstica e descrio); na parte
inferior, embaixo do conceito de instncia singular aparecem instncias de tal conceito. No
eixo central do mapa esto os diferentes tipos de estudo de caso identificados por Serrano
(1998) e Stenhouse (1985). Os conectores tentam explicitar as relaes entre os conceitos e as
flechas sugerem certas convergncias.

Induo

a partir dos dados

ilumina a
compreenso

anlise profunda

Descrio

holstica, rica, densa

ESTUDOS
DE CASO

teorias
fundamentadas

observao
participante e
entrevistas

mudana
categorias
conceituais

Pesquisa-Ao

Heurstica

Particularizao

Interpretativo

de uma

compreenso da avaliao de
ao educativa programas

de uma

professor
aluno

Indivduo

preocupao
de uma
central;
representao
singular da realidade

INSTNCIA
SINGULAR

sem teorias ou
hipteses induzidas

Avaliativo

Educativo

Etnogrfico

de uma

relato detalhado

de uma

de uma

currculo
escola
aula

Grupo

Fenmeno

Figura 3. Um mapa conceitual para estudos de caso (Moreira, 2002).

Descritivo

16

A pesquisa-ao
O objetivo fundamental da pesquisa-ao consiste em melhorar a prtica em vez de
gerar conhecimentos. A produo e utilizao do conhecimento se subordinam a este objetivo
e esto condicionadas por ele (Eliott, 1993, p. 67). A melhora na prtica consiste em implantar
aqueles valores que constituem seus fins, por exemplo, a educao no ensino (ibid.). Porm, o
conceito de educao como fim do ensino transcende a conhecida distino entre processo e
produto. A melhora da prtica supe levar em conta ao mesmo tempo os resultados e os
processos.
Segundo Kemmis e McTaggart (1988; apud Kemmis, 1988, p. 174), a pesquisa-ao
definida como uma forma de pesquisa coletiva auto-reflexiva empreendida por participantes
de situaes sociais para melhorar a produtividade, racionalidade e justia de suas prprias
prticas sociais ou educativas, assim como sua compreenso em relao a tais prticas e s
situaes em que ocorrem. Os participantes podem ser professores, alunos, diretores, pais e
outros membros da comunidade, isto , qualquer grupo que partilha uma preocupao, um
objetivo. uma pesquisa colaborativa; porm, importante enfatizar que esta ao
colaborativa depende de que cada indivduo examine criticamente suas prprias aes (ibid.).
Na educao, quando se pretende melhorar a prtica, tm que se considerar
conjuntamente os processos e os produtos. Este tipo de reflexo simultnea sobre a relao
entre processos e produtos constitui, segundo Eliott (op. cit., p. 68), uma caracterstica
fundamental da pesquisa-ao. uma prtica reflexiva que aspira a melhorar a concreo dos
valores do processo, muito diferente do raciocnio tcnico que versa sobre os meios para
conseguir um fim. Para Elliot (op. cit., p. 69), ao mesmo tempo tico e filosfico. Na
medida em que a reflexo trata da escolha de um curso de ao em um determinado conjunto
de circunstancias para levar prtica os prprios valores, reveste-se de carter tico. Mas,
como a eleio tica supe a interpretao dos valores que ho de se traduzir prtica a
reflexo sobre os meios no se pode separar da reflexo sobre os fins a reflexo tica tem
uma dimenso filosfica (ibid.).
Na pesquisa-ao, os professores so incentivados a questionar suas prprias idias e
teorias educativas, suas prprias prticas e seus prprios contextos como objetos de anlise e
crtica (Kemmis, 1988, p. 174). A partir de uma reflexo cuidadosa, os professores podem
desvelar idias ou suposies tericas que resultam injustificadas e os deixam perdidos em
sua tarefa docente; por exemplo, tem-se suposies muito rgidas a respeito da natureza de
habilidades inatas dos estudantes (ibid.).
Analogamente, os docentes, atravs da reflexo crtica, podem concluir que prticas
antigas moldadas por hbito e tradio so inteis ou irrelevantes nos tempos atuais; por
exemplo, prticas disciplinares que funcionavam antes, hoje j no so aceitveis ou so
contraproducentes (ibid.). Quanto ao contexto, eles podem chegar concluso de que sua
estrutura inadequada e obstaculiza o alcance de metas educativas; por exemplo, a estrutura
fsica da aula pode dificultar o trabalho em grupos, a interao pessoal, o ensino centrado no
aluno.
No obstante, no se pode esquecer que a pesquisa-ao uma pesquisa coletiva,
colaborativa. A reflexo pessoal importante, mas a verdadeira mudana vem da autoreflexo coletiva. Que os participantes sintam a necessidade de iniciar mudanas, de inovar,
condio necessria antecedente da pesquisa-ao, mas no suficiente.

17
O processo de pesquisa-ao, segundo Kemmis e McTaggart (1988) e Elliot (1993, p.
88), se caracteriza por uma espiral de ciclos de reconhecimento (descoberta de fatos):
reconhecimento de uma situao que se quer mudar; planificao geral da ao objetivando a
mudana; desenvolvimento, implementao e avaliao dessa ao; reflexo luz da
evidncia recolhida na implementao; reviso do plano geral; planificao de nova ao;
implementao, avaliao, reflexo, reviso do plano; planificao e implementao de uma
terceira ao...
Naturalmente, este carter cclico no significa um processo linear, automtico,
mecnico. Tal como se disse no comeo deste item, a pesquisa-ao, atravs dessa espiral de
ciclos, tem por objetivo a melhoria das prticas e da compreenso de situaes, e o
envolvimento tanto quanto possvel de todos os afetados intimamente pelas aes em todas as
fases do processo investigativo. A pesquisa-ao um processo colaborativo, auto-reflexivo,
no qual o envolvimento direto dos professores e outros implicados, na coleta de dados, anlise
crtica, reflexo, cria imediatamente um sentido de responsabilidade quanto melhora da
prtica (Kemmis, 1988, p. 174).
A pesquisa-ao unifica processos considerados com freqncia independentes; por
exemplo: o ensino, o desenvolvimento do currculo, a avaliao, a pesquisa-educativa e o
desenvolvimento profissional (Eliott, 1993, p. 72). O ensino, por exemplo, no contexto da
pesquisa-ao se concebe como uma forma de pesquisa dirigida a compreender como traduzir
os valores educativos a formas concretas de prtica.
O desenvolvimento do currculo no um processo que antecede o ensino; o
desenvolvimento de programas curriculares se produz atravs da prtica reflexiva do ensino
(ibid.). A pesquisa-ao no refora a postura dos professores enquanto conjunto de
indivduos que operam de forma independente e autnoma, que no partilham suas reflexes
com os demais.
De maneira geral, pode-se dizer que a pesquisa-ao sempre implica um plano de ao
baseado em objetivos de mudana (melhora), a implementao e controle desse plano atravs
de fases de ao, assim como a descrio concomitante do processo cclico resultante. Porm,
Kemmis e McTaggart (1988, apud Kemmis, 1988) identificam vrias caracterstica bsicas da
pesquisa-ao que ajudam a distingui-la de outros tipos de pesquisa qualitativa. Segundo eles,
a pesquisa-ao:

uma abordagem para melhorar a educao atravs de mudanas e para aprender


desde as conseqncias das mudanas;
se desenvolve atravs de uma espiral auto-reflexiva de ciclos de planificao, ao,
observao sistemtica, reflexo, replanificao, nova ao, observao e reflexo;
participativa, as pessoas trabalham para melhorar suas prprias prticas;
colaborativa, cria grupos auto-crticos que participam e colaboram em todas as fases
do processo investigativo;
envolve os participantes em um processo de teorizao sobre suas prticas,
questionando circunstncias, aes e conseqncias dessas prticas;
requer que as pessoas ponham em xeque suas idias e suposies com relao s
instituies;
aberta com relao ao que conta como evidncia, ou dados, mas sempre implica
manter e analisar registros das conseqncias das aes implementadas;
permite que os participantes, ao mesmo tempo, mantenham registros de suas prprias
mudanas pessoais e analisem criticamente as conseqncias dessas mudanas;

18

comea pequena; normalmente com pequenas mudanas que um pequeno grupo, ou


talvez uma s pessoa, possa tentar, mas se desloca, gradativamente, rumo a mudanas
mais extensivas;
requer que os participantes analisem criticamente as situaes (salas de aulas escolas,
sistemas educativos) nos quais trabalham;
um processo poltico porque envolve mudanas nas aes e interaes que
constituem e estruturam prticas sociais; tais mudanas tipicamente afetam as
expectativas e interesses de outros alm dos participantes imediatos nessas aes e
interaes.

Tal como se fez nas sees anteriores; esta finaliza com um mapa conceitual com
relao ao tema abordado. A figura 4 apresenta um mapa conceitual para pesquisa-ao. O
conceito central mudana: a pesquisa-ao tem como meta melhorar a prtica atravs da
mudana. tambm central a trade (re) planificao ao (auto) reflexo que
caracteriza o processo cclico da pesquisa-ao. Por outro lado, a pesquisa-ao um
processo participativo, coletivo, colaborativo, poltico, auto-reflexivo, autocrtico, autoavaliativo que requer o envolvimento dos participantes em todas as fases e em todos os
aspectos caractersticos desse processo.
INVESTIGAOAO

processo autoavaliativo, auto


reflexivo

processo cclico
Participantes

processo
colaborativo

processo poltico

processo coletivo

implementar a

Ao

requer

Colaborao
necessria
para a

reconhecem a
necessidade de

para a
leva

leva
auto-crtica

elaboram a
MUDANA

para a

prticos
reflexivos
(RE)
PLANEJAMENTO

para a
leva ao

(AUTO)
REFLEXO

objetivo

(melhora da)
PRTICA
(educativa)

Figura 4. Um mapa conceitual para pesquisa-ao (Moreira, 2002).

requer

19

Outros tipos de pesquisa qualitativa


Comeamos este texto comparando as abordagens qualitativa e quantitativa em termos
bastante dicotmicos; depois focamos caractersticas gerais da pesquisa qualitativa e
passamos logo a descrever a etnografia, o estudo de casos e a pesquisa-ao que
consideramos as trs metodologias principais dessa abordagem. Porm, h outras, das quais
apresentaremos algumas, sucintamente, a seguir.
Uma vez concludas essas breves apresentaes voltaremos a temas gerais, no sentido
de que se aplicam a vrias metodologias qualitativas, focando tpicos como a apresentao e a
anlise de dados, a fiabilidade e validade dos estudos qualitativos, possibilidades de
generalizao, triangulao e outros. No final, retomaremos a questo dos paradigmas a partir
de um olhar integrador.

A fenomenografia
A fenomenografia o estudo emprico dos diferentes modos atravs dos quais as
pessoas vivenciam, percebem, apreendem, compreendem, ou conceituam vrios fenmenos
no, e aspectos do, mundo em seu entorno. As palavras vivncia, percepo, compreenso ou
conceituao so usadas de maneira intercambivel. Porm, isso no significa que no h
diferenas em seus significados, mas sim que o nmero limitado de maneiras, atravs das
quais certo fenmeno interpretado pelas pessoas pode ser identificado, por exemplo,
independente de se esto embebidas na experincia imediata do fenmeno ou em uma
reflexo sobre o mesmo fenmeno (Marton, 1988, p. 95-97).
As diferentes experincias, compreenses, percepes, etc., so caracterizadas em
termos de "categorias de descrio" logicamente relacionadas e hierarquizadas. Tais
categorias representam diferentes capacidades de lidar com (ou entender) um fenmeno.
Como algumas maneiras de experienciar um fenmeno so mais eficientes que outras com
relao a algum critrio, possvel estabelecer uma hierarquia de categorias de descrio
(ibid.). A fenomenografia se aplica, por exemplo, ao estudo da resoluo de problemas ou em
pesquisas que procuram diferenas crticas nos significados atribudos a certos fenmenos,
conceitos ou princpios-chave em certo campo de conhecimentos.
A hermenutica
A hermenutica foi originalmente definida como a arte, ou a cincia, da interpretao,
em particular da Bblia. Porm, contemporaneamente definida como a teoria e a prtica da
interpretao e compreenso em diferentes tipos de contextos humanos (religiosos, seculares e
cotidianos). Isto , a hermenutica no se refere s exegese e interpretao de textos, mas
considera a compreenso e a interpretao como uma marca definitiva da existncia humana e
da vida social (dman e Kerdeman, 1988, p. 185).
Assim como a hermenutica, a fenomenologia tambm se ocupa da estrutura da
compreenso; porm, a fenomenologia constri a compreenso primeiramente em termos de
construtos e funes cognitivos, enquanto que para a hermenutica a compreenso no
somente uma funo cognitiva, tambm a condio ontolgica da existncia humana (op.
cit., p. 186).

20

Assim como a teoria crtica, a hermenutica mantm que compreenso e significado


so constituintes da vida social; no obstante, a hermenutica mantm que uma vez que o
sujeito est sempre envolvido em algum processo de compreenso, impossvel captar em
qualquer forma final ou definitiva os significados embebidos em uma tradio. A
hermenutica, portanto, evita envolver-se na tentativa de fundamentar a compreenso em um
marco terico ou em um mtodo e se concentra em interpretar culturas desde dentro de certas
situaes e contextos (ibid.).
Na pesquisa educativa, a hermenutica pode aprofundar a compreenso do fenmeno
educativo focando os significados que subjazem a estratgias e prticas educativas
especficas. Por exemplo, como devem ser interpretadas certas prticas administrativas? Quais
so os significados subjacentes? Analogamente, a hermenutica pode aprofundar a
compreenso dos significados e propsitos subjacentes a um currculo.

A pesquisa participativa
A pesquisa participativa descrita por Hall (1988, p. 198), de uma maneira geral, como
um processo que combina trs atividades: pesquisa, educao e ao. uma ao social em
favor dos dominados, explorados, pobres, excludos. A preocupao por poder e democracia e
suas interaes central na pesquisa participativa. tambm crtica a ateno a gnero, raa,
etnia, orientao sexual, habilidades fsicas e mentais, e outros fatores sociais (ibid.). A
pesquisa participativa est desenhada para contribuir nos processos de mudana de poder ou
democratizao em uma variedade de contextos. Na pesquisa participativa no h receitas
nem ortodoxias metodolgicas: as questes e os mtodos de trabalho devem fluir dos sujeitos
envolvidos e de seu contexto.
(No se deve confundir pesquisa participativa com observao participante que uma
mistura de vrias tcnicas, um estilo ou estratgia de pesquisa, na qual, como j vimos, o
principal instrumento o prprio pesquisador que deve ficar imerso no cenrio para ouvir, ver
e comear a experienciar a vida como os sujeitos a vivem; Ball, 1988, p. 310).

Histria oral
Como uma tcnica de pesquisa, a histria oral vai alm do que o entrevistado responde
s perguntas do entrevistador. Todos os matizes de seu testemunho so significativos: a noresposta, o silncio, a vacilao, tudo conta como evidncia. As fontes de histria oral so,
portanto, mais que uma questo de evidncia falada e mais do que simplesmente registrar
fatos (Hyams, 1988, p. 91).
Como uma abordagem para a pesquisa, a histria oral permite dar voz aos "sem voz",
aos annimos. como construir a histria de baixo para cima. Mesmo que sofra restries
entre os historiadores (por exemplo, s os sobreviventes so entrevistados; no se pode
generalizar), esta abordagem usada em outros campos, como o da educao. Por exemplo,
as atitudes dos professores com relao ao sistema educativo ou s reformas educativas
podem ser obtidas de maneira mais expansiva, mais aberta. As reminiscncias dos professores
podem permitir uma melhor compreenso da implementao das polticas educativas. A
histria oral tem potencial para explicar interpretaes no-oficiais de problemas educativos.

21
O carter nico do testemunho individual considerado importante para construir uma
histria. Porm, como foi dito antes, preciso levar em conta muito mais que a informao
factual provida. Trata-se de procurar informao que no est nos registros escritos, nas
biografias.

Fidedignidade, generalizao e validade


A fidedignidade se refere ao grau em que se podem replicar as medidas e os estudos.
Em uma abordagem quantitativa, a fidedignidade das medies e dos instrumentos um
requisito bsico, porm, em uma abordagem qualitativa, tal conceito no tem sentido ou deve
ter outro significado, pois, em grande medida, o pesquisador o principal instrumento ou, em
outras palavras, o instrumento uma extenso do pesquisador.
Em relao aos estudos, a fidedignidade exige que um pesquisador que utilize os
mesmos mtodos que outro, chegue a idnticos resultados (Goetz e Lecompte, 1988, p. 214).
Isso coloca um enorme problema nas pesquisas sobre o comportamento natural ou dos
fenmenos nicos. O estabelecimento da fidedignidade de um delineamento interpretativo se
complica ainda mais pela natureza dos dados e do processo de pesquisa, pelos usos da
apresentao dos resultados e pela viso de mundo dos pesquisadores nesse campo (ibid.).
De acordo com esses autores (op. cit., p. 215), se comparados com os delineamentos
experimentais de laboratrios, estritamente controlados, ou com os experimentos de campo,
os delineamentos da pesquisa naturalstica parecem resistir-se a toda tentativa de rplica. Por
exemplo, os problemas de unicidade e idiossincrasia podem levar a afirmar que impossvel
replicar um estudo etnogrfico ou um estudo de caso. Alm disso, sendo que o
comportamento humano nunca esttico, nenhum estudo, independentemente de seus
mtodos e desenhos, pode ser replicado com exatido (ibid.).
Porm, se pode contra-argumentar que tais unicidades e idiossincrasias no so to
extremas que no tenham nenhum grau de representatividade, alguns traos semelhantes a
outras. Isto , os grupos ou fenmenos sociais ou indivduos pesquisados podem no ser to
nicos e idiossincrticos que no tenham nada a ver com outros grupos, fenmenos ou
indivduos. Ou se, de fato, o so, no so de interesse da pesquisa educativa. Para que serve
uma etnografia de uma aula de cincias que no tem absolutamente nada a ver com outras
aulas de cincias ou que no gere uma compreenso contextualizada com algum valor para
elas? Para que serve estudar um professor de cincias to nico, que no tem nada a ver com
outros professores de cincias?
Isso nos remete ao tema da generalizao: devem-se procurar generalizaes em
estudos qualitativos, atravs de, por exemplo, estudos de casos representativos?
Segundo Andr (1998, p. 58), a generalizao no sentido de leis que se aplicam
universalmente no um objetivo da pesquisa qualitativa. Porm, a idia de generalizao
bastante aceita nessa abordagem, no sentido de que os dados de um estudo podem ser teis
para compreender dados de outros estudos (ibid.). Por isso, a descrio densa considerada
vital quando se pretende fazer comparaes ou transferncias de uma situao a outra; a
anlise de similitudes e diferenas torna possvel julgar em que medida as compreenses
construdas em um estudo podem ser consideradas hipteses sobre o que pode ou no ocorrer
em outras situaes. Esta posio compartilhada por Ogbu et al. (1988, p. 53), que diz que a
generalizao se torna possvel porque o conhecimento construdo atravs da abordagem

22
qualitativa profundo e contextualizado; as descries detalhadas compreensivas permitem
aos leitores fazer comparaes e tomar decises bem fundamentadas a respeito da
generalizao.
Posio semelhante tomada por Taft (1988, p. 74), que argumenta que para generalizar
de um caso individual a outros necessrio alcanar uma compreenso suficientemente
detalhada sobre a significatividade dos eventos a respeito do contexto em que ocorrem para
poder estender interpretaes a outros contextos e grupos. Quando um pesquisador tenta
compreender um grupo, ele ou ela ajudado por conhecer outros grupos; as generalizaes
so feitas atravs da capacidade que tenha o pesquisador de mediar entre um grupo e outros.
Portanto, a descrio etnogrfica de uma escola, por exemplo, deriva seu valor em grande
parte do fato de que o pesquisador assim como os leitores tem familiaridade com outras
escolas, e com escolas em geral (ibid.).
A postura de Erickson (1986, p. 130), como vimos no comeo deste texto, que na
pesquisa interpretativa o que se busca no universais abstratos alcanados atravs de
inferncias estatsticas de amostras para populaes, mas universais concretos aos quais se
chega estudando um caso com muito detalhe e comparando-o com outros casos estudados
com igual detalhe.
No obstante, nenhuma generalizao dessa natureza deve ser considerada final, mas
apenas como hiptese de trabalho para outros estudos interpretativos ou como subsdio para
questionrios, entrevistas ou testes (Taft, 1988, p. 74).
O tema da generalizao tem a ver com o da validade externa dos estudos, isto , em
que medida os construtos e universais concretos criados pelos pesquisadores so aplicveis a
mais de um grupo? Por outro lado, necessrio considerar tambm a questo da validade
interna, ou seja, os pesquisadores esto interpretando o que acreditam interpretar? (Desde o
ponto de vista quantitativo, a pergunta seria se os pesquisadores esto medindo o que
acreditam medir).
A validade pode ser pensada como uma qualidade das concluses e dos processos
atravs dos quais so alcanadas, mas seu significado exato depende do critrio de verdade
que se est utilizando. Considerando que, na abordagem qualitativa, verdade uma questo de
concordncia em contexto, o melhor significado de validade nessa abordagem parece ser o de
credibilidade, como sugere Taft (op. cit., p. 73). A credibilidade depende do convencimento
da comunidade de pesquisadores e leitores com relao s evidncias apresentadas e aos
processos utilizados. Sturman (1988, p. 65) prope as seguintes estratgias para alcanar
credibilidade:

os procedimentos de coleta de dados devem ser explicados;


os dados recolhidos devem ser apresentados e estar prontos para reanlise;
instncias negativas devem ser relatadas;
vieses devem ser reconhecidos;
anlises de trabalhos de campo devem ser documentados;
a relao entre assero e evidncia deve ser esclarecida;
evidncias primrias devem ser distinguidas das secundrias, assim como as
descries das interpretaes;
dirios ou logs devem dar conta do que foi feito durante as distintas fases do estudo;
tcnicas devem ser desenhadas para "checar" a qualidade dos dados.

23
Erickson (1986, p. 140) se reporta ao mesmo tema, desde outra perspectiva, ao indicar
cinco tipos de inadequaes das evidncias apresentadas:
1. quantidade inadequada de evidncias; o pesquisador tem pouca evidncia para
garantir certas asseres-chave;
2. diversidade inadequada de tipos de evidncias; o pesquisador no tem diferentes
fontes de dados (por exemplo, observaes, entrevistas, documentos); no busca
triangulao de dados;
3. interpretaes incorretas das evidncias; o pesquisador no compreende bem certos
aspectos-chave da complexidade da ao ou dos significados atribudos pelos atores
no contexto;
4. inadequadas evidncias desconfirmadoras; o pesquisador no tem dados que possam
desconfirmar uma assero-chave; ou, mais importante, no apresenta evidncia de
que tenha sido conduzida uma busca deliberada de dados potencialmente
desconfirmadores;
5. anlise inadequada de casos discrepantes; o pesquisador no indaga as instncias
desconfirmadoras nem as compara com as confirmadoras para determinar quais
aspectos dos casos desconfirmadores eram iguais ou diferentes dos aspectos anlogos
dos casos confirmadores.
O mesmo autor (op. cit., p. 145) recomenda que o informe de estudos etnogrficos
contenha nove elementos principais:
1. asseres empricas (uma tarefa bsica da anlise de dados gerar tais afirmaes em
grande medida atravs de induo);
2. vinhetas narrativas analticas (uma vinheta narrativa uma representao vvida de
um evento no cotidiano do caso ou grupo pesquisado; a vinheta tenta persuadir o leitor
de que as coisas no contexto eram como o autor diz que eram);
3. citaes das notas de campo (podem-se citar diretamente as notas no informe,
indicando a data em que foram tomadas; uma srie de extratos de notas de campo
podem servir como evidncia de que o modo particular em que ocorreu um certo
evento foi tpico);
4. citaes de entrevistas (as palavras dos entrevistados so um meio de transmitir aos
leitores os pontos de vista dos sujeitos do estudo);
5. informes sinpticos dos dados (mapas, tabelas de freqncias, diagramas);
6. comentrios interpretativos enquadrando uma certa descrio;
7. comentrios interpretativos enquadrando a descrio geral (a descrio geral tem
como principal objetivo estabelecer a possibilidade de generalizar os padres que
foram ilustrados nas descries particulares);
8. discusso terica (comentrios interpretativos com relao ao significado mais amplo
dos padres que emergiram dos dados);
9. informe sobre a histria natural da indagao no estudo (isto , uma
discusso/descrio com relao a como certos conceitos-chave na anlise evoluram
ou como padres no esperados foram encontrados durante o trabalho de campo e na
reflexo subseqente).
Os comentrios interpretativos que enquadram as descries particular e geral podem
ser de trs tipos: os que precedem e seguem uma descrio particular no texto, a discusso
terica que aponta significatividade mais ampla dos padres identificados nos eventos
mencionados, e uma resenha das mudanas que ocorreram desde o ponto de vista do
pesquisador durante o transcurso da indagao (op. cit., p. 152).

24
Para Erickson (ibid, p. 145), cada um desses nove elementos, separadamente e em
conjunto, permitem ao leitor trs coisas: em primeiro lugar, possibilitam experimentar de
forma vicria o cenrio descrito e confrontar instncias de asseres-chave e construtos
analticos; em segundo, permitem examinar todo o espectro de evidncias no qual est
baseada a interpretao do pesquisador; e em terceiro, deixam que o leitor considere os
fundamentos tericos e pessoais da perspectiva do autor tal como mudou ao longo do estudo.
Esta seo deste texto foi dedicada ao tema da fidedignidade, generalizao e validade
dos estudos qualitativos. Mesmo que se pudesse argumentar que so conceitos tpicos de
estudos quantitativos, toda a seo foi desenvolvida com o objetivo de mostrar que tais
conceitos tm sentido no contexto de uma pesquisa interpretativa, desde que se d a eles o
significado apropriado. Tal significado, como vimos, parece ser o de credibilidade, o qual nos
remete a outro conceito importante na metodologia da pesquisa interpretativa: a triangulao,
uma estratgia central para alcanar credibilidade (Sturman, 1988, p. 65).

Triangulao
A triangulao pode envolver o uso de diferentes fontes de dados, diferentes
perspectivas ou teorias, diferentes pesquisadores ou diferentes mtodos; uma resposta
holstica questo da fidedignidade e da validade dos estudos interpretativos (ibid.). Para
Denzin (1988, p. 318), a triangulao o emprego e combinao de vrias metodologias de
pesquisa no estudo de um mesmo fenmeno.
No uma estratgia tpica da pesquisa qualitativa, tambm no uma estratgia
nova: o uso de mltiplas medies e mtodos, de modo que se superem as debilidades
inerentes ao uso de um nico mtodo ou um nico instrumento tem uma longa histria nas
cincias naturais e sociais; na pesquisa quantitativa, a triangulao usada, tradicionalmente,
como uma estratgia de validao de observaes (ibid.).
No obstante, segundo Denzin (op. cit.), a apropriao desse conceito pelos
pesquisadores interpretativos e sua aplicao a problemas tpicos da pesquisa qualitativa
mais recente e representa um compromisso com um sofisticado rigor metodolgico por parte
dos pesquisadores, no sentido de que esto comprometidos a tornar seus esquemas empricos
e interpretativos o mais pblicos possvel. De acordo com esse autor (p. 319), h cinco tipos
bsicos de triangulao:
1. triangulao de dados, envolvendo tempo, espao e pessoas;
2. triangulao de pesquisadores, que consiste no uso de mltiplos observadores, em
lugar de um s;
3. triangulao de teorias, que consiste em utilizar mais de um esquema terico na
interpretao do fenmeno pesquisado;
4. triangulao metodolgica, que envolve o uso de mais de um mtodo e pode consistir
em estratgias intra mtodos ou entre mtodos;
5. triangulao de verificao por sujeitos, na qual os pesquisados examinam e
confirmam ou desconfirmam o que se escreveu sobre eles.
Existe tambm a triangulao mltipla, na qual o pesquisador combina em uma
pesquisa mltiplos observadores, perspectivas tericas, fontes de dados e metodologias.

25
Por outro lado, mesmo que Denzin associe a triangulao com um compromisso com o
rigor metodolgico, o uso dessa estratgia na pesquisa qualitativa no est livre de crticas: os
argumentos so, por exemplo, que a triangulao de dados tem um vis positivista, que dois
pesquisadores nunca observam o mesmo fenmeno da mesma maneira, que diferentes
mtodos geram diferentes imagens e recortes da realidade e que a triangulao de teorias no
tem sentido epistemologicamente.
Porm, o prprio Denzin (op. cit., p. 321) contra-argumenta dizendo que a
triangulao nos estudos qualitativos no deve ser comparada com a anlise de correlao nas
pesquisas quantitativas e que nunca deve ser uma estratgia ecltica. Na triangulao de
pesquisadores no se espera que observem exatamente da mesma maneira e que um corrobore
o que o outro observa, mas que suas diferentes observaes expandam a base interpretativa do
estudo e que revelem aspectos do fenmeno pesquisado que no seriam necessariamente
observados por um nico pesquisador.
Com relao triangulao metodolgica, o importante justamente que possam
emergir diferentes imagens. Com relao triangulao de teorias, Denzin (ibid.) diz que ela,
em vez de requerer que as interpretaes sejam consistentes com dois ou mais tericos,
simplesmente requer que o pesquisador seja consciente das diferentes maneiras atravs das
quais pode ser interpretado o fenmeno.
O tema da triangulao, em particular as triangulaes tericas e metodolgicas, est
muito vinculado questo dos paradigmas, focada desde uma perspectiva dicotmica no
comeo deste texto. Nessa oportunidade dissemos que o olhar dicotmico estava sendo usado
por razes didticas e que no final retomaramos o assunto dos paradigmas sob uma viso
integradora. Ento, chegou o momento de voltar aos paradigmas.

Os paradigmas de pesquisa em educao: rumo acomodao


A dicotomia estabelecida anteriormente entre os dois paradigmas clssicos
simplificadora. A metodologia da pesquisa nas cincias sociais no pode ser pensada
simplesmente como no-positivista em contraposio a uma suposta tradio positivista da
pesquisa nas cincias naturais. Se assim fosse, no teria sentido falar de acomodao de
paradigmas. Porm, considerando paradigma como um conjunto bsico de crenas que
orienta a ao (Guba, 1990, apud Alves-Mazzotti, 1996, p. 17), quer dizer, uma concepo
de mundo que guia o pesquisador, no s na escolha de mtodo, mas tambm em suas
posies ontolgicas e epistemolgicas, podem-se distinguir pelo menos trs paradigmas
como sucessores do positivismo: o ps-positivismo, a teoria crtica e o
naturalismo/construtivismo (ibid).
O primeiro seria uma verso modificada do positivismo revisando pontos
insustentveis (e.g., agora se supe que a realidade existe, mas que nunca ser totalmente
apreendida pela pesquisa); a teoria crtica ideologicamente orientada uma vez que rejeita a
neutralidade: o processo de pesquisa mediado pelo pesquisador, e o termo crtica se refere
tanto crtica interna que resulta do questionamento analtico da argumentao e do mtodo
como anlise das condies de regulao social, desigualdade e poder; ao
naturalismo/construtivismo subjaz idia de que os resultados de qualquer pesquisa so
sempre influenciados pela interao pesquisador/pesquisado, de maneira que o conhecimento
sempre produto da atividade humana e, portanto, nunca pode ser visto como algo definitivo,
mas como algo que est sempre se modificando (Alves-Mazzotti, 1996, pp. 17-20).

26
O paradigma naturalista/construtivista o que enfatizamos neste texto: a realidade
socialmente construda (o que implica que sempre h mltiplas realidades; as idias, os
valores e a interao pesquisador/pesquisado influenciam na configurao dos fatos, que
implica que a teoria sub-determinada). Estas caractersticas, por sua vez, implicam um
relativismo que problemtico para os outros dois paradigmas: se algum se prope
compreender os significados atribudos pelos atores s situaes e eventos dos quais
participam, se tenta entender a cultura de um grupo ou organizao no qual coexistem
diferentes vises correspondentes aos subgrupos que os compem, ento o relativismo no
constitui um problema; mas se nos propomos construo de teorias (ps-positivismo) ou
transformao social (teoria crtica), o que exige acordo ao redor de decises ou princpios
que possibilitem a ao conjunta, o relativismo passa a ser um problema (op. cit., p. 21).
Com a identificao destes trs paradigmas "ps-clssicos", e possivelmente outros, j
se percebe que a questo dos paradigmas em cincias sociais no dicotmica, que as
cincias sociais so multi-paradigmticas e que a acomodao ou integrao de paradigmas
no deve ser considerada impossvel ou, pelo menos, uma questo em aberto, como disse
Alves-Mazzotti (op.cit., p. 22).
Um bom exemplo de argumento em favor da integrao paradigmtica dado por
Bericat (1998). Este autor considera que existem trs razes fundamentais que podem motivar
o desenho multimtodo em uma pesquisa social: complementao, combinao e
triangulao (p. 37).
A complementao existe quando, no marco de um mesmo estudo, se obtm duas
imagens, uma procedente de mtodos de orientao qualitativa e outra de mtodos de
orientao quantitativa (ibid.), resultando assim um duplo e diferenciado conjunto de
asseres de conhecimento sobre o fenmeno de interesse. O que se obtm so duas
perspectivas diferentes sem pretenso alguma de solapamento, ou convergncia. As asseres
de conhecimento so apresentadas com duas partes bem diferenciadas, cada uma das quais
expe resultados alcanados pela aplicao do respectivo mtodo. Segundo Bericat (ibid.), na
complementao, o grau de integrao metodolgica mnimo, e sua legitimidade se suporta
sobre a crena de que cada orientao capaz de revelar diferentes zonas da realidade
social, assim como que necessrio contar com essa dupla viso para um melhor
entendimento do fenmeno (ibid.).
Na combinao, a estratgia integrar subsidiariamente uma metodologia, seja a
qualitativa ou a quantitativa, na outra, com o objetivo de fortalecer a validade desta
compensando suas debilidades mediante a incorporao de informaes que procedem da
aplicao da outra metodologia. O que se busca no a convergncia de resultados, que
finalmente procedero de uma nica metodologia, mas bem mais uma adequada combinao
metodolgica (op. cit., p. 39).
Finalmente, na triangulao, o que se pretende um solapamento ou convergncia de
resultados. No se trata de complementar a viso de realidade com dois olhares, mas de
utilizar duas metodologias para o estudo de um mesmo e idntico aspecto de uma realidade
social. As metodologias, tal como na complementao, so implementadas de forma
independente, mas se focam em um mesmo objeto de estudo buscando resultados
convergentes. A legitimidade desta estratgia depende de se acreditamos que ambas as
metodologias realmente podem captar idntico aspecto da realidade, isto , se o solapamento
possvel. Na medida em que pensemos que conduzem a vises incomensurveis da
realidade, ento estaremos no caso da complementao (op. cit., p. 38).

27

Na figura 5 estas trs estratgias de integrao esto esquematizadas em um mapa


conceitual. Trata-se sempre de captar aspectos de uma realidade social. Porm, isso se pode
tentar com uma nica metodologia ou integrando-as de modo complementar, triangular ou
combinatrio. A triangulao e a combinao s so possveis na medida em que se aceita
pelo menos certo grau de comensurabilidade paradigmtica. Caso contrrio, a nica
alternativa a complementao.
distintos
paradigmas

Metodologia
Qualitativa
captar

Metodologia
Quantitativa
captar

Aspectos de
uma realidade
social

captar

ESTRATGIAS
INTEGRADORAS
busca integrao
subsidiria de
olhares

busca dois olhares


independentes

Complementao

incomensurabilidade
paradigmtica

implicam
independncia
metodolgica

busca convergncia
de olhares

Combinao

reforo ou
convergncia de
resultados

Triangulao

Figura 5: Um mapa conceitual para estratgias integradoras entre a metodologia qualitativa e


quantitativa (Moreira, 2002).

28

Concluso
Na figura 6 se apresenta, a modo de concluso deste texto, um diagrama V. Este tipo de
diagrama, tambm conhecido como Ve epistemolgico, foi desenhado por D.B. Gowin (1981)
para esquematizar a estrutura do processo de produo de conhecimento. Aqui usado para
refletir tal produo no contexto do paradigma qualitativo, particularmente na educao.
Este diagrama pretende ser uma espcie de resumo de todo o texto. Como tal,
preciso levar em conta que nenhum dos itens que aparecem no diagrama V est completo. So
dados s exemplos do que poderia integrar cada item. esta a razo dos trs pontos que
aparecem no final deles.

Referencias
Alves-Mazzotti, A.J. (1996). O debate atual sobre os paradigmas de pesquisa em educao.
Cadernos de Pesquisa, So Paulo, n. 96: 15-23.
Andr, M.E.D.A. (1998). Etnografia da prtica escolar. 2a ed. So Paulo, Papirus Editora.
Ball, S.J. (1988). Participant observation. In Keeves, J.P. (Ed). Educational research,
methodology, and measurement. An international handbook. Oxford, Pergamon Press. p.
310-314.
Bericat, E. (1988). La integracin de los mtodos cuantitativo y cualitativo en la
investigacin social. Barcelona, Editorial Ariel. 189 p.
Denzin, N.K. (1988). Triangulation in educational research. In Keeves, J.P. (Ed). Educational
research, methodology, and measurement. An international handbook. Oxford, Pergamon
Press. p. 318-322.
Eisner, E.W. (1981). On the differences between scientific and artistic approaches to
qualitative research. Educational Researcher, 10(4): 5-9.
Eliott, J. (1993). El cambio educativo desde la investigacin-accin. Madrid, Ediciones
Morata.
Erickson, F. (1986). Qualitative methods in research on teaching. In Wittrock, M.C. (Ed.).
Handbook of research on teaching. New York: Macmillan Publishing Co. p. 119-161.
Traduccin al espaol: Erickson, F. (1989) Mtodos cualitativos de investigacin sobre la
enseanza. In Wittrock, M.C. (Comp.). La investigacin en la enseanza, II. Barcelona,
Paids. p. 195-301.
Firestone, W.A. (1987). Meaning in method: the rethoric of quantitative and qualitative
research. Educational Researcher, 16(7): 16-21.
Goetz, J.P. y Lecompte, M.D. (1988). Etnografa y diseo cualitativo en investigacin
educativa. Madrid, Ediciones Morata.
Guba, E.G. (1990). The alternative paradigm dialog. In: Guba, E.G. (Ed.) The paradigm
dialog. London, Sage. Apud: Alves-Mazzotti (1996). O debate atual sobre os paradigmas
de pesquisa em educao. Cadernos de Pesquisa, So Paulo, n. 96: 15-23.
Hall, B.L. (1988). Participatory research. In Keeves, J.P. (Ed). Educational research,
methodology, and measurement. An international handbook. Oxford, Pergamon Press. p.
198-204.

29
Domnio Conceitual

Domnio Metodolgico
Tipos de perguntas, temas de interesse

Asseres de valor:
dado que o fenmeno
Significados atribudos pelos
educativo
atores s situaes e eventos nos
essencialmente social, a
quais participam. Interpretao
pesquisa qualitativa
em contexto; compreenso
potencialmente til para
contextualizada de significados:
estud-lo.
quais so as condies de
...
significados que criam juntas as
pessoas (e.g., professores e
Asseres de conhecimento:
alunos)? H diferenas nas
compreenses
perspectivas de significados das
contextualizadas; descries
pessoas (e.g., alunos e
de significados de realidades
professores
socialmente construdas
na aula)? Como so criados
...
e mantidos os sistemas de
significados nas
Teorias: esto fundamentadas
interaes cotidianas?
no prprio processo de
Procedimentos analticos:
Como a vida vivida?:
pesquisa; emergem dos dados;
induo, comparao,
compreenso de idias,
so geradas a partir da anlise
contraste, busca de
crenas, valores,
indutiva dos dados; so
categorias
(tipologias),
supostos
hiptese compreensivas.
enumerao, escolha de unidades
das pessoas. Busca
...
de padres de
de anlise e reanlise, teorizao
explicao, de
fundamentada, interpretao.
significados de
...
Princpios:
A
interao
aes
pesquisador/pesquisado influencia na (condutas mais
Tipos de pesquisa: etnografia,
configurao dos conhecimentos interpretaes
estudo de caso, pesquisa-ao.
produzidos e nas teorias emergentes. significativas)
...
O pesquisador o principal
instrumento de pesquisa. A realidade
socialmente
construda
implica
Metodologias/tcnicas: observao
mltiplas realidades.
participativa, entrevistas, anlise do
...
discurso, vdeo-gravaes, conversas.
...
Conceitos: universal concreto, realidade
construda,
ao,
significado,
compreenso
contextualizada,
Registro & dados: notas de campo
participao, interpretao subjetiva,
transcries de entrevistas, vdeos,
dado qualitativo, anlise qualitativa,
documentos, produes dos sujeitos.
tempo.
...
...
Filosofias:
Os humanos
criam
interpretaes
significativas dos eventos
e objetos do seu entorno
e tais interpretaes podem
ser estudadas atravs de
metodologias naturalistasconstrutivistas. A
realidade socialmente
construda. Verdade
questo de concordncia
em contexto.

Eventos/objetos de estudo:
Indivduos, grupos ou fenmenos em seu acontecer natural

Figura 6. Um diagrama V para a pesquisa qualitativa, particularmente em educao (M.A.


Moreira, 2002)

30
Husn, T. (1988). Research paradigms in education. In Keeves, J.P. (Ed). Educational
research, methodology, and measurement. An international handbook. Oxford, Pergamon
Press. p. 16-21.
Hyams, B.K. (1988). Oral history. In Keeves, J.P. (Ed). Educational research, methodology,
and measurement. An international handbook. Oxford, Pergamon Press.
Keeves, J.P. (1988). Towards a unified view of educational research. In Keeves, J.P. (Ed).
Educational research, methodology, and measurement. An international handbook.
Oxford, Pergamon Press. p. 1-7.
Kemmis, S. (1988). Action research. In Keeves, J.P. (Ed). Educational research,
methodology, and measurement. An international handbook. Oxford, Pergamon Press. p.
173-179.
Kemmis, S. and McTaggart, R. (Eds.). (1988). The action research reader. 3rd ed. Geelong,
Deakin University Press.
Landsheere, G. de (1988). History of educational research. In Keeves, J.P. (Ed). Educational
research, methodology, and measurement. An international handbook. Oxford, Pergamon
Press. p. 8-16.
Marshal, C. (1984). The wrong time for mechanistics in qualitative research. Educational
Researcher, 13(9): 26-28.
Marton, F. (1988). Phenomenography. In Keeves, J.P. (Ed). Educational research,
methodology, and measurement. An international handbook. Oxford, Pergamon Press. p.
95-101.
Miles, M.B. and Huberman, A.M. (1984) Drawing valid meaning from qualitative data:
toward a shared craft. Educational Researcher, 13(5): 20-30.
Moreira, M.A. (2000). Investigacin en enseanza: aspectos metodolgicos. In Actas de la I
Escuela de Verano sobre Investigacin en Enseanza de las Ciencias. Burgos, Servicio de
Publicaciones de la Universidad de Burgos. p. 13-51.
dman, P.J. & Kederman, D. (1988). Hermeneutics. In Keeves, J.P. (Ed). Educational
research, methodology, and measurement. An international handbook. Oxford, Pergamon
Press. p. 185-192.
Ogbu, J.U., Sato, N.E. and Kim, E.Y. (1988). Anthropological inquiry. In Keeves, J.P. (Ed).
Educational research, methodology, and measurement. An international handbook.
Oxford, Pergamon Press. p. 48-54.
Serrano, G.P. (1998). Investigacin cualitativa. Retos e interrogantes. I. Mtodos. Madrid, La
Muralla S.A. 230 p.
Shulman, L.S. (1981). Disciplines of inquiry in education: an overview. Educational
Researcher, 10(6): 5-12.
Smith, J.K. (1983). Quantitative versus qualitative research: na attempt to clarify the issue.
Educational Researcher, 12(3): 6-13.
Smith, J.K. and Heshusius, L. (1986). Closing down the conversation: the end of the
quantitative-qualitative debate among educational inquirers. Educational Researcher,
15(1): 4-13.
Stenhouse, L. (1985). Case study methods. In Husn, T. & Postlethwaite, T.N. (Eds.).
International Encyclopedia of Education. Oxford, Pergamon Press.

31
Sturman, A. (1988) Case study methods. In Keeves, J.P. (Ed). Educational research,
methodology, and measurement. An international handbook. Oxford, Pergamon Press. p.
61-66.
Taft, R. (1988). Ethnographic research methods. In Keeves, J.P. (Ed). Educational research,
methodology, and measurement. An international handbook. Oxford, Pergamon Press. p.
71-75.
Walker, J.C. & Evers, C.W. (1988). Research in education: epistemological issues. In Keeves,
J.P. (Ed). Educational research, methodology, and measurement. An international
handbook. Oxford, Pergamon Press. p. 22-31.

32

Vt E
cx|t x X|M `w dt|t|E
Resumo

`ATA `x|t
cAeAfA et

A finalidade deste texto a de resgatar a metodologia quantitativa aplicada pesquisa


em ensino. No h nele nada de novo. Todos os tpicos enfocados encontram-se muito mais
elaborados em livros de metodologia da pesquisa ou de Estatstica. Contudo, chamar ateno
para questes como tratamento de variveis, delineamentos de pesquisa, amostragem,
significncia estatstica, fidedignidade e validade, anlise de varincia, testes noparamtricos, pode ser uma contribuio para a atual pesquisa em ensino que, h muito
tempo, usa praticamente apenas mtodos qualitativos e, assim fazendo, acaba enviesada.

Introduo
D. B. Gowin (1981, 2005) props um dispositivo heurstico que hoje conhecido
como diagrama V (Moreira, 2006) para desvelar a estrutura do processo de produo do
conhecimento. A Figura 1 apresenta esse dispositivo aplicado pesquisa quantitativa em
educao. O centro desse diagrama o domnio de interesse da pesquisa (por exemplo, o
ensino e a aprendizagem) e as perguntas e hipteses que se faz dentro desse domnio. Para
respond-las, confirm-las ou refut-las preciso fazer registros de um evento que se faz
acontecer ou que acontece naturalmente. O lado esquerdo do diagrama o domnio conceitual
(ou terico) da pesquisa; nele esto conceitos, princpios, modelos, teorias e filosofias que
fundamentam terica e epistemologicamente a pesquisa e que interagem com os registros,
transformaes e asseres que constituem o domnio metodolgico que aparece no lado
direito do diagrama.
Neste texto o foco estar no domnio metodolgico. Como se v na Figura 1, o lado
metodolgico comea com os registros. Sem registros no se faz pesquisa emprica. A partir
da, um passo fundamental desse tipo de pesquisa a converso desses registros em ndices
numricos.
Por exemplo, no caso de que os registros sejam mapas conceituais preciso definir
critrios como, digamos, tantos pontos para a hierarquia, tantos para conectivos, etc., para
chegar a um escore para cada mapa. Ou, ento, definir categorias como, suponhamos, muito
bom, bom, regular, falho, e atribuir pontos a cada categoria.

Texto de Apoio N 29, Programa Internacional de Doctorado en Enseanza de las Ciencias da Universidade
de Burgos, Espanha, desenvolvido no marco de um convnio com a Universidade Federal do Rio Grande do Sul,
Porto Alegre, Brasil.

33
certo que tambm se pode trabalhar quantitativamente com ndices no numricos
como, por exemplo, variveis dicotmicas do tipo sim ou no, feminino ou masculino, mas na
pesquisa emprica predomina o uso de ndices numricos.
Domnio Conceitual

Filosofias (crenas profundas,


vises
de
mundo,
mais
abrangentes do que as teorias)

Domnio Metodolgico
Domnio de interesse
Pergunta(s) e hipteses
de pesquisa

Teorias e modelos (que dirigem a


pesquisa, que esto sendo testados,
que orientam a interpretao dos
resultados)

Princpios (proposies, assumidas


como vlidas, norteadoras da pesquisa)

Conceitos-chave (essenciais para a pesquisa)

Asseres de valor (qual o


valor do conhecimento
produzido?)
Asseres de conhecimento
(respostas s perguntas de
pesquisa, resultados,
conhecimento produzido)
Transformaes metodolgicas
(medidas da tendncia central,
correlaes, testes de significncia,
anlises de varincias, fatoriais,
multidimensionais, ...)

Dados (registros convertidos


ndices numricos)

em

Registros (do evento de pesquisa; dados


brutos)
Evento (que se faz acontecer, ou que acontece naturalmente, para
responder a/s questo/es de pesquisa)

Figura 1 O diagrama V aplicado pesquisa quantitativa em educao.


igualmente correto que o mais importante na pesquisa, seja ela de qualquer natureza,
a pergunta de pesquisa, aquela cuja busca de respostas gera conhecimentos. O conhecimento
humano construdo, reconstrudo, refutado, modificado, sempre pela busca, muitas vezes
obstinada, de respostas a perguntas sobre determinados fenmenos de interesse.
A identificao de uma questo de pesquisa que valha a pena investigar, que possa
gerar conhecimentos, a parte mais difcil da pesquisa. No entanto, tambm muito
importante um delineamento de pesquisa que permita fazer registros relevantes que, por sua
vez, originem dados (tipicamente ndices numricos, na pesquisa quantitativa) de mxima
relevncia pergunta de pesquisa.

Dados e tratamento estatstico


Tipicamente, na pesquisa educacional emprica, o pesquisador se questiona sobre qual
a evidncia que o apoiar em relao a certas hipteses de pesquisa. Faz, ento, registros,
converte-os em nmeros e trata-os estatisticamente para ver se servem como evidncia.
Costuma-se dizer que bons dados falam por si mesmos. Isso significa que se os dados
forem de boa qualidade os procedimentos estatsticos so imediatos. Por outro lado, se os
dados forem ruins no h tratamento estatstico que os transforme em bons.

34
O importante a qualidade dos dados no as manipulaes estatsticas. A relevncia
das concluses estatsticas nunca ser maior do que a adequao dos dados numricos
trabalhados estatisticamente. A interpretao dos resultados estatsticos depende do que est
por detrs dos dados. Os nmeros a serem analisados no so entidades sagradas
representando puras abstraes. Ao contrrio, sua utilidade na pesquisa emprica reside no
fato que tm referentes no contexto da pesquisa, que significam algo no mundo real (Millman,
1970).
Uma boa estratgia para melhor abordar a questo da anlise e qualidade dos dados
consider-la antes, ou seja, pensar na anlise dos dados antes de colet-los evitando-se, assim,
que os nmeros obtidos no tenham muito a ver com as questes investigadas.
Outro aspecto a ser considerado nessa questo o da fidedignidade e validade dos
instrumentos. Sem instrumentos fidedignos e vlidos os nmeros que deles resultarem no
sero confiveis e de nada servir trat-los estatisticamente.
No que se refere a instrumentos conveniente test-los previamente, perguntando a
alguns sujeitos como interpretam determinados itens, ou fazer uma anlise do tipo tem
sentido atribuir o mesmo nmero a uma no-resposta e a uma
resposta neutra?, quer dizer, um item deixado em branco pode ser considerado como
resposta neutra?, sem opinio o mesmo que opinio neutra?(op.cit.).

Significncia estatstica e significncia prtica


Na anlise dos dados importante levar em conta que o nvel de significncia
estatstica (p < 0,05, por exemplo) no uma medida da importncia ou da significncia
prtica de um resultado, pois esse nvel depende do nmero de casos e da eficincia do
delineamento de pesquisa.
Quando um resultado estatisticamente significativo o pesquisador deve analisar a
magnitude dos efeitos, ou seja, qual a importncia, no contexto da investigao, de uma
diferena de mdias, estatisticamente significativa, por exemplo, entre 7,5 e 7,2, ou qual a
relevncia de uma correlao, estatisticamente significativa ao nvel 0,05, de um coeficiente
de correlao de 0,23 entre duas variveis?

Outros aspectos a serem considerados na questo da significncia estatstica e


significncia prtica so o tamanho e a variabilidade da amostra. Mesmo que se obtenham
diferenas, correlaes ou fatores estatisticamente significativos para amostras de 12 ou 13
sujeitos, preciso perguntar-se qual a significncia prtica desses resultados. Por outro lado,
amostras pequenas e, inclusive, amostras maiores de 30 ou 40 sujeitos, por exemplo, podem
apresentar grande variabilidade. Em uma amostra de 10 sujeitos se dois tiverem o escore
mximo de dez pontos, dois obtiverem zero pontos e os demais alcanarem cinco ou seis
pontos, a mdia ser cinco ou mais pontos, mas o que significa essa mdia na prtica? claro
que nesse caso melhor trabalhar com a moda, mas mesmo assim preciso perguntar qual a
significncia prtica desse resultado. Analogamente, esse questionamento deve ser feito
quando grande a variabilidade dos escores em amostras maiores.

35

A estatstica apropriada
Na escolha da tcnica estatstica adequada para o tratamento dos ndices numricos
conveniente considerar primeiramente se o que se quer descrever caractersticas de um
conjunto de nmeros ou se o que se pretende estimar valores da populao. No primeiro
caso, a estatstica a ser usada a descritiva, no segundo a inferencial.
tambm conveniente voltar questo de pesquisa e, tendo em conta sua natureza,
considerar se medidas da tendncia central, correlaes, testes de significncia para diferenas
de mdias, anlises de varincia, anlises fatoriais ou multidimensionais so, de fato,
necessrias para respond-la.

O papel do computador
H algoritmos de computador para realizar quaisquer anlises estatsticas de dados
numricos. Basta injetar esses dados nesses algoritmos para que rapidamente saiam mdias,
desvios padro, coeficientes de correlao, varincias, fatores, etc., etc.. O computador atende
comandos e seus procedimentos atuam sobre os dados que lhe so fornecidos. E a voltamos
ao comeo desse assunto de anlise de dados: se os dados forem ruins, no h computador que
gere bons resultados. No adianta ficar dando comandos para que ele gere mais e mais
coeficientes, tabelas, fatores. Tudo lixo!
Por outro lado, se os dados forem bons preciso saber interpretar os produtos dos
procedimentos estatsticos aos quais eles so submetidos. No preciso usar lpis e papel, ou
calculadora, para, tediosamente, calcular estatsticas (valores da amostra), parmetros (valores
da populao), coeficientes, correlaes, fatores. O computador faz isso muito mais
rapidamente e sem erros. Mas fundamental saber interpretar os resultados (op.cit.).
A anlise dos dados , como foi dito no incio, uma etapa fundamental da pesquisa
emprica. Sem dvida. Mas mais importante do que ela a questo de pesquisa e os registros
que se faz dos eventos usados para responder essa questo. So esses registros que sero
convertidos em ndices numricos que, por sua vez, sero analisados estatisticamente. Os
procedimentos estatsticos esto disponveis em profuso e o computador os executa
rapidamente. Mas a anlise, em si, tem que ser feita pelo pesquisador.
Passemos agora a descrever e tratar de aspectos e tcnicas dos mtodos quantitativos de
pesquisa em educao.

Variveis
Condies que podem ser variadas ou selecionadas pelo investigador so chamadas de
variveis independentes. As medidas das respostas feitas durante o experimento constituem
as variveis dependentes.
Os nveis de uma varivel referem-se a categorias da varivel. Sexo, por exemplo, tem
dois nveis. O nmero de nveis de uma varivel como idade pode ser arbitrariamente
determinado e pode variar de dois (e.g., acima de 35 ou abaixo ou igual a 35 anos) ao infinito
(quando idade tratada como uma varivel contnua).

36
A palavra fator freqentemente usada como sinnimo da expresso varivel
independente. Uma varivel independente manipulada uma condio que est sob
controle direto do experimentador. Variveis de tratamento so, normalmente, variveis
independentes manipuladas pelo pesquisador, cujos efeitos ele est querendo observar. Uma
varivel independente normativa aquela na qual o pesquisador no est livre para produzir
a condio em si mesma, embora ele seja livre para decidir quais nveis da varivel sero
includos na investigao3. Sexo e idade so exemplos de variveis deste tipo.
Medidas iniciais, ou seja, obtidas antes do incio da investigao, que so usadas para
formar grupos homogneos (relativamente varivel dependente) so chamadas de variveis
de agrupamento. Observaes suplementares s observaes antes do tratamento
relativamente a possveis diferenas so chamadas de observaes concomitantes ou
covariveis. Uma observao concomitante pode ser usada como uma alternativa ao
agrupamento em delineamentos experimentais4 ou, em alguns delineamentos quaseexperimentais, ela pode ser usada como um esforo para superar as deficincias do
delineamento.
Outro tipo de caracterizao de variveis diz respeito natureza do processo de contagem
da varivel. Podemos definir quatro grupos de variveis, com respeito escala usada para
medir as variveis:
1. Variveis nominais - estamos lidando com esse tipo de varivel quando apenas
apontamos se a grandeza medida pela varivel est presente ou no. Assim, por
exemplo, uma pessoa pode ser professor ou no. Normalmente, atribui-se valor 1 se o
atributo medido pela varivel est presente e atribui-se o valor 0 se o atributo no est
presente. Ou seja, neste caso, professor (1) no professor (0).
2. Variveis ordinais - so aquelas onde os dados apresentam algum tipo de ordenao.
atribudo um grau, conforme alguma escala, a cada sujeito a medida em que ele
apresenta o atributo que est sendo medido. Por exemplo, um teste classificatrio de
proficincia em matemtica, onde os sujeitos so ordenados de acordo com as notas
obtidas no teste.
3. Variveis intervalares - este tipo de varivel se caracteriza por valores que esto
distribudos em uma escala com uma diferena constante entre dois valores
consecutivos. Idade pode ser um exemplo deste tipo de varivel, se contarmos apenas
os anos efetivamente completados.
4. Variveis racionais - so aquelas onde a escala de medida composta por nmeros
racionais e, alm disso, existe um zero que define a ausncia da propriedade medida
pela varivel. Por exemplo, notas em um teste so variveis desse tipo se atribuirmos
valores fracionrios s respostas5.

Controle de variveis
Variveis que no so de interesse direto do pesquisador podem ser removidas ou terem a
sua influncia minimizada por vrios mtodos:
3

Este tipo de varivel tambm chamado de parmetro.


Aqueles nos quais a amostragem aleatria; ver p. 15.
5
Se, por outro lado, apenas considerarmos cada questo como certa (1 ponto) ou errada (0 pontos) ento teremos
uma escala intervalar.
4

37

1. Remoo de variveis - algumas variveis podem ser eliminadas selecionando-se


casos com caractersticas uniformes (usando-se, por exemplo, apenas mulheres para
eliminar-se a influncia da varivel sexo).
2. Pareamento de casos - selecionando-se pares ou conjuntos de indivduos com
caractersticas idnticas (ou quase idnticas) e distribuindo-os aos grupos experimental
e de controle. Entretanto, o pareamento no considerado satisfatrio a menos que os
sujeitos dos pares ou conjuntos sejam distribudos aleatoriamente aos grupos
experimental ou de controle. Uma limitao desse mtodo ocorre pela dificuldade em
parear-se sujeitos usando-se duas ou mais variveis.
3. Balanceamento de casos - distribui-se os sujeitos aos grupos experimental e de
controle de tal modo que mdias e varincias dos grupos sejam semelhantes, tanto
quanto possvel. Este mtodo tambm apresenta uma dificuldade similar quela
observada no pareamento de casos: a dificuldade de equacionar grupos com base em
mais do que uma varivel.
4. Anlise de covarincia - este mtodo permite ao experimentador eliminar diferenas
iniciais em vrias variveis entre os grupos experimental e de controle por mtodos
estatsticos. Usando escores de pr-testes como co-variveis, este mtodo
considerado prefervel ao convencional pareamento de grupos.
5. Aleatoriedade - a aleatoriedade pode ser obtida atravs da seleo ao acaso dos
sujeitos, dentre aqueles da populao que se quer estudar, que vo participar dos
grupos de controle e experimental. A aleatoriedade nos d um mtodo efetivo de
eliminar erros sistemticos e de minimizar o efeito de variveis externas. O princpio
da aleatoriedade baseado na hiptese de que atravs da seleo aleatria quaisquer
diferenas entre os grupos seja simplesmente devido amostragem ou ao acaso. Essas
diferenas so conhecidas como erros de amostragem ou erros de varincia e suas
intensidades podem ser estimadas pelo pesquisador. Em um experimento, diferenas
na varivel dependente que podem ser atribudas ao efeito da varivel independente
so conhecidas como varincia experimental. A significncia de um experimento
pode ser testada comparando-se a varincia experimental com o erro de varincia. Se
ao trmino do experimento as diferenas entre os grupos experimental e de controle
forem muito grandes para serem atribudas ao erro de varincia pode-se presumir que
estas diferenas so atribuveis varincia experimental. A aleatoriedade o mtodo
mais efetivo de formar-se grupos e controlar-se variveis externas e deve ser usado
sempre que as circunstncias o permitirem. (Best, 1970).

Delineamentos de pesquisa
Entende-se por delineamento de uma pesquisa ao conjunto composto pelo plano de
trabalho do pesquisador, a maneira como este seleciona as suas amostras e analisa os seus
dados. Pode-se dizer que de nada valem a observao cuidadosa e a exaustiva e detalhada
anlise estatstica se isto for feito para um plano de pesquisa inadequado situao em estudo.
Convm lembrar o que j foi ressaltado neste texto: no uma boa estatstica que torna boa
uma pesquisa.
O assunto do delineamento experimental encontra-se muito bem desenvolvido e
apresentado na obra de Campbell e Stanley (1963, 1991), livro, alis, de leitura obrigatria

38
para o pesquisador interessado em mtodos quantitativos. Aqui ser feito apenas um resumo
da classificao de Campbell e Stanley.
Seguir-se- aqui a notao clssica de Campbell e Stanley no que se refere
designao de observaes e tratamentos. Designaremos pela letra O uma observao. Um
sub-ndice na letra O indica uma observao particular de uma srie, no necessariamente em
ordem cronolgica. O ndice funciona apenas como um rtulo para uma dada observao.
Designaremos pela letra X a um tratamento. Ento, como exemplo, a seqncia abaixo:
O1 X O2
indica que foi feita uma observao (denotada por O1) em seguida foi aplicado um tratamento
X e ento feita uma segunda observao (denotada por O2). Quando na frente de uma
seqncia de observaes e tratamentos estiver a letra A isto significa que as amostras foram
selecionadas aleatoriamente. Cada seqncia que se encontra em uma linha diz respeito a um
mesmo grupo de sujeitos (a amostra). Assim a seqncia abaixo:
A O1 X O2
O4
A O3
lida como: observa-se um grupo de sujeitos uma vez (O1 ) submete-se ento o grupo de
sujeitos a um determinado tratamento X e ento observa-se o mesmo grupo de sujeitos uma
segunda vez (O2 ). Este grupo de sujeitos chamado de grupo experimental. A segunda linha
do delineamento significa que observa-se um segundo grupo uma vez (O3 ), no se aplica o
tratamento4 e ento observa-se o grupo de sujeitos uma segunda vez (O4 ). A esse segundo
grupo dado o nome de grupo de controle. A letra A indica que os dois grupos, de controle e
experimental, foram escolhidos aleatoriamente. Outra conveno adotada a de que quando
duas letras se encontram na mesma coluna significa que os eventos aconteceram
simultaneamente no tempo. Assim, no exemplo, as observaes O1 e O3 aconteceram no
mesmo instante de tempo5.
Seguindo a classificao de Campbell e Stanley os delineamentos de pesquisa podem
ser divididos segundo trs classes:
Delineamentos no-experimentais.
Delineamentos experimentais.
Delineamentos quase-experimentais.
Por experimental, que o adjetivo comum a todas as classes colocadas acima,
entendemos condies controladas de pesquisa. Ou seja, o pesquisador deve ser capaz de
controlar ou de levar em conta de forma apropriada todas as variveis pertinentes a um
determinado estudo. Os fatores de validade de cada experimento podem ser classificados
como fatores de validade interna, os quais dizem respeito s variveis que se no controladas
tornam sem significncia quaisquer asseres de conhecimento sobre os resultados do
experimento, ou fatores de validade externa, os quais se no controlados invalidam a
4

De fato essa denominao arbitrria uma vez que um no-tratamento tambm um tratamento.
Claro que esta afirmao deve ser entendida como aproximadamente no mesmo instante de tempo, podendo
haver um certo intervalo de tempo entre as observaes.

39
generalizao dos resultados do experimento para uma determinada populao. Um
determinado experimento somente verdadeiramente experimental se controlar a totalidade
das variveis que influenciam os fatores de validade, interna e/ou externa. Obviamente,
quando se trata de pesquisa em Cincias Sociais, nem sempre possvel controlar-se
apropriadamente todas as variveis envolvidas em determinada situao. Portanto, o estudo
ser to mais prximo de um experimento verdadeiro quanto mais controle o experimentador
tiver sobre estas variveis. A linha bsica de raciocnio para classificar-se determinado
delineamento numa ou noutra categoria o quanto mais controle o delineamento oferece dos
fatores de validade interna e externa.
Delineamentos que oferecem pouco ou nenhum controle das variveis pertinentes so
chamados de delineamentos no-experimentais ou pr-experimentais. Por outro lado,
delineamentos que oferecem alto grau de controle so chamados de delineamentos
experimentais. Por fim, delineamentos que oferecem grau de controle em nvel mdio, porm
sem oferecer controle nos nveis da categoria anterior, so chamados de delineamentos quaseexperimentais.
Na ptica quantitativa, o pesquisador deve sempre procurar um delineamento
experimental para o seu trabalho. Na impossibilidade de um tratamento deste tipo aceitvel
um delineamento quase-experimental. Um tratamento no-experimental nunca aceitvel.

Delineamentos no-experimentais ou pr-experimentais


Dentro da classificao de Campbell e Stanley os delineamentos no experimentais ou
pr-experimentais so de trs tipos:
Delineamento de tipo 1 - Neste delineamento observado apenas um grupo sob a ao do
tratamento X. Esse delineamento esquematizado como:
X O1
ou seja, nesse delineamento o grupo que experimentou o tratamento X, e apenas ele,
observado uma nica vez.
As desvantagens desse delineamento so evidentes. Talvez a maior delas seja o fato de
que no se ter controle algum sobre as variveis externas que atuam concomitantemente com
X. Variveis tais como histria, maturao, interao do experimentador com o tratamento,
etc., no so de forma alguma controladas. No h razo plausvel para a utilizao desse
delineamento, devendo-se evit-lo a todo o custo. Um exemplo desse tipo de delineamento
aquela situao onde o professor aplica um novo mtodo de ensino e ento uma prova.
Nenhuma conseqncia que se tire do resultado da prova vlida devido s deficincias desse
delineamento.
Delineamento de tipo 2 - Um delineamento muito usado na pesquisa em ensino, mas que na
verdade um delineamento pr-experimental, o seguinte:
O1 X O2
Nesse delineamento, aplica-se um pr-teste O1 a um grupo, submete-se o grupo a um
tratamento X e aplica-se, ento, um ps-teste O2. O1 e O2 significam que o mesmo grupo

40
observado antes e depois do tratamento que pode ser, por exemplo, um novo mtodo de
ensino ou um recurso didtico alternativo. Diferenas entre O1 e O2 (que podem ser simples
testes de conhecimento) evidenciariam a eficcia ou ineficcia) do tratamento X. O problema
com esse delineamento que no controla outras variveis, alm de X, que poderiam explicar
as diferenas entre O1 e O2 . Por exemplo, os alunos poderiam ter melhores resultados no
ps-teste porque algum evento ocorreu entre a aplicao do pr-teste e do ps-teste (varivel
histria) e no porque o tratamento X tenha sido eficiente.
Delineamento de tipo 3 Deve-se ter cuidado em no confundir este delineamento com um
dos delineamentos experimentais que vo ser descritos mais adiante. Nesse delineamento,
temos dois grupos, experimental e de controle, mas a seleo dos sujeitos que pertencem aos
dois grupos no aleatria. Dessa forma esse delineamento no controla a varivel seleo.
Esse delineamento tem a forma:
X

O1
O2

onde a ausncia da letra A esquerda de X significa que no houve aleatoriedade no processo


de seleo. Nesse tipo de delineamento no h evidncia alguma da equivalncia entre os dois
grupos antes do incio do experimento. Um exemplo desse tipo de delineamento ocorre
quando seleciona-se dois grupos de sujeitos de determinada escola, para pertencerem aos
grupos experimental e de controle, pelo simples fato de pertencerem mesma turma. Se as
turmas forem formadas por alunos que no ano anterior foram bons alunos em Matemtica ou
maus alunos nesta disciplina ento a varivel seleo com certeza influenciar qualquer
tratamento alternativo sobre o ensino de Matemtica que for aplicado a um ou outro grupo.

Delineamentos experimentais
Os delineamentos experimentais so aqueles onde consegue-se controlar a maior parte,
seno todas, as fontes de invalidade interna e externa. Seguindo a tradio de Campbell e
Stanley, estes delineamentos podem ser classificados em trs categorias.
Delineamento de tipo 4 - Um delineamento experimental muito usado o seguinte:
A
A

O1
O3

O2
O4

Neste delineamento trabalha-se com dois grupos e os sujeitos da pesquisa so


designados aleatoriamente a um deles (este o significado de A). Observa-se ambos os
grupos antes da aplicao do tratamento X, por exemplo, aplicando-se um pr-teste a ambos
os grupos (O1 = O3 ). Um dos grupos (grupo experimental) ento submetido ao tratamento
X, enquanto o outro (grupo de controle) no recebe o tratamento. Aps, observa-se os grupos,
aplicando-se, por exemplo, um ps-teste (O2 = O4) a ambos os grupos. Na prtica, os pr e
ps-teste podem ser iguais.
Um erro comum no uso de delineamentos desse tipo analisar-se o resultado para
determinao da eficcia do tratamento do seguinte modo: tomam-se as diferenas entre os
resultados do pr e ps-teste em ambos os grupos (O2 - O1 e O4 - O3), aplicando-se a seguir
um teste estatstico. Se a diferena entre as mdias do grupo experimental antes e depois da
aplicao do tratamento X, for estatisticamente significativa e a diferena entre as mdias do

41
grupo de controle no for significativa, toma-se ento o tratamento como eficaz. Esta uma
forma errada de analisar-se a eficcia do tratamento e no fornece evidncia alguma sobre o
efeito do tratamento X. A forma correta de proceder-se comparar-se o resultado final (as
mdias finais em um teste de conhecimento por exemplo) entre os grupos experimental e de
controle entre si.
Este delineamento controla variveis na medida em que elas influenciaro igualmente
ambos os grupos, exceto X, obviamente, e, portanto, os efeitos dessas variveis no pesaro na
comparao das diferenas O2 - O1 e O4 - O3 .
Alm disso, a aleatoriedade da designao dos sujeitos a um dos grupos, embora no
garanta equivalncia entre os grupos em 100 %, reduz ao mnimo a probabilidade de que
sejam diferentes. Segundo Kerlinger (1980, p. 102):
Casualizao a designao de objetos (sujeitos, tratamentos,
grupos) de um universo a subconjuntos do universo de tal maneira
que, para qualquer designao dada a um subconjunto, todo membro
do universo tem igual probabilidade de ser escolhido para a
designao. No h total garantia de que a casualizao igualar
os grupos, mas a probabilidade de igualar relativamente alta. H
outra forma de expressar essa idia: [...] j que em procedimentos
aleatrios todo membro de uma populao tem igual probabilidade
de ser escolhido, membros com certas caractersticas distintas
homem ou mulher, alto ou baixo grau de inteligncia, dogmtico ou
no dogmtico, e assim por diante se selecionados, provavelmente
sero contrabalanados a longo prazo pela seleo de outros
membros da populao com a quantidade ou qualidade opostas da
caracterstica.
Delineamento tipo 56 - A aleatoriedade da designao de sujeitos aos grupos de controle e
experimental , portanto, a mais adequada segurana de que no existam diferenas ou vieses
iniciais entre os grupos. Nesse caso, o pr-teste no condio essencial para que um
delineamento seja verdadeiramente experimental. Assim, o delineamento anteriormente
apresentado poderia ser simplesmente:

A
A

O1
O2

De fato, esse delineamento no s pode ser usado ao invs do anterior como tambm
mais adequado pois elimina qualquer influncia do pr-teste no experimento. Entretanto,
talvez por razes psicolgicas, muitos pesquisadores no abrem mo de saber com certeza
se os grupos experimental e de controle eram iguais no incio do experimento, de modo que o
quarto exemplo de delineamento aqui apresentado provavelmente mais usado que o quinto,
embora menos apropriado logicamente.
Delineamento tipo 6 (Delineamento de quatro grupos de Solomon) - Este delineamento a
soma das vantagens dos delineamentos quatro e cinco. Seu esquema :

Aqui se est fazendo uma inverso entre a denominao dada por Campbell e Stanley aos delineamentos 5 e 6.
Para Campbell e Stanley, o que est sendo chamado de delineamento 5 o delineamento 6 e vice-versa.

42
A
A
A
A

O1
O3

X
X

O2
O4
O5
O6

Este tipo de delineamento controla variveis como interao do pr-teste com o tratamento,
maturao e histria. A desvantagem desse tipo de delineamento a dificuldade em obter-se
tantos grupos para participar da pesquisa.
Delineamentos quase-experimentais
Um terceiro grupo de delineamentos identificado por Campbell e Stanley o dos
delineamentos quase-experimentais, ou seja, aqueles em que falta ao pesquisador o pleno
controle da aplicao dos estmulos experimentais - quando e quem expor e a capacidade de
casualizar exposies (op. cit., p. 61). Todos os delineamentos pertencentes a esse grupo
carecem do rigor e controle existentes nos delineamentos pertencentes ao grupo dos
delineamentos experimentais, mas podem ser usados quando a situao no permitir o uso de
delineamentos verdadeiramente experimentais.
Delineamento tipo 7 (Srie temporal) - O delineamento srie temporal exemplifica essa
situao:
O1 O2 O3 O4 X O5 O6 O7 O8
Neste delineamento, os sujeitos so observados vrias vezes antes de se aplicar o
tratamento X e vrias vezes aps a aplicao. Supondo-se que antes do tratamento as
observaes fossem quase que homogneas, sem variaes, apresentando um padro bem
definido e que houvesse um salto nos escores das observaes feitas aps o tratamento e que,
a partir da, houvesse nova estabilizao nos escores das observaes, com a apresentao de
um outro padro, esse salto quantitativo na srie temporal seria tomado como evidncia do
efeito X.
Observe-se que esse delineamento semelhante ao primeiro apresentado como
exemplo, porm implica em muito mais observaes, o que minimiza, embora no exclua, as
deficincias do primeiro. Note-se tambm que implica na existncia de um s grupo, o que, na
prtica, uma vantagem pois muitas vezes difcil obter-se dois grupos de sujeitos.
Um exemplo simples de aplicao desse delineamento seria aquele em que o professor
observa cuidadosamente seus alunos durante algumas semanas do curso, fazendo vrias
medies (que podem ser testes de aproveitamento ou de atitude) antes de fazer uso de uma
nova estratgia de ensino. Da mesma forma, aps o uso da estratgia, volta a observar seus
alunos, durante algum tempo, fazendo novos registros. Diferenas, qualitativas ou
quantitativas, no desempenho dos alunos aps o uso da estratgia, e que se mantm ao longo
do tempo, podem ser tomadas como evidncia do efeito da estratgia sobre a aprendizagem
cognitiva ou afetiva dos alunos.
Delineamento de tipo 8 (Amostras temporais equivalentes) - Este delineamento , de fato,
uma variao do delineamento anterior. Neste delineamento introduz-se a varivel
experimental (o tratamento X) alternadamente e observa-se o grupo. O seu esquema o
seguinte:
O1 X O2 X0 O3 X O4 X0 O5 X O6 X0 O7 X O8

43
Como se pode ver nesse delineamento o mesmo grupo de sujeitos observado
alternadamente na presena do tratamento e sem a presena do tratamento (aqui simbolizada
pelo smbolo X0). A anlise feita a partir da comparao dos valores mdios do grupo com e
sem tratamento experimental. Nesse ponto esse delineamento se assemelha a um
delineamento com dois grupos.
Delineamento de tipo 9 (Grupo de controle no-equivalente) - Este delineamento
tem a seguinte estrutura:
O1
O3

O2
O4

Neste caso o grupo de controle e o grupo experimental no possuem equivalncia


amostral pois no foi usada a aleatoriedade na escolha das amostras. Neste tipo de
delineamento, os grupos constituem coletivos reunidos naturalmente, tais como classes
escolares j compostas previamente ao do pesquisador. O controle do pesquisador reside
unicamente na deciso sobre qual dos grupos vai receber o tratamento e quando.
Seguramente, neste tipo de delineamento haver problemas srios derivados do fator
seleo e de sua interao com outros fatores importantes tais como histria, maturao, etc..
Campbell e Stanley propem ainda cinco outros delineamentos quase- experimentais
que no sero aqui apresentados.
Nesta seo foi dada nfase bastante grande ao delineamento porque esta uma
questo crucial na realizao de uma pesquisa quantitativa em ensino. Assim como o
pesquisador deve formular uma questo de pesquisa clara, orientadora e relevante, ele deve
tambm investig-la usando um delineamento adequado.
Um mau delineamento pode invalidar as asseres de conhecimento (resultados) e de
valor de uma pesquisa, jogando por terra todo o trabalho realizado, seja por no controlar as
fontes de invalidade interna seja por no controlar as de invalidade externa.
Sempre que possvel um dos delineamentos experimentais deve ser utilizado. Quando
isso no possivel, a alternativa o uso de um dos delineamentos quase-experimentais aqui
expostos (e discutidos em muito maior extenso em Campbell e Stanley, 1963, 1991) tendo
em mente as deficincias que estes delineamentos oferecem. A pesquisa no deve deixar de
ser feita se a situao no permitir o uso de um delineamento puramente experimental, mas o
pesquisador deve deixar claro para si e para os demais pesquisadores a limitao de escopo,
no que tange validade, de seus resultados bem como quais so os pontos onde novos
trabalhos devem ser realizados de modo a estudar a interferncia de fatores os quais no
puderam ser controlados naquele experimento especfico. Cabe lembrar que no uma nica
pesquisa que constri o corpo de conhecimentos de uma rea mas, sim, um conjunto delas.

Um pouco de estatstica
O objetivo desta seo e das prximas o de discutir os principais tpicos
relacionados com a anlise de experimentos quantitativos em ensino. Como foi dito
anteriormente, a principal ferramenta para esse tipo de anlise a Estatstica. Justifica-se,
portanto, dedicar algum espao a ela.

44

Amostragem aleatria
O termo tcnico aleatrio indica que a amostra selecionada de tal modo que cada
elemento da populao tem uma chance igual de entrar na amostra. O pesquisador deve ter
uma lista completa de todos os elementos da populao e ento selecionar sua amostra de
modo tal que nenhum elemento da populao seja privilegiado pelo procedimento de escolha.
O propsito da aleatoriedade no garantir que os dois grupos se comportaro
igualmente bem na ausncia do tratamento. A aleatoriedade no garante igualdade. A
aleatoriedade permite evitar aquele tipo de resultado que poderia ser atribudo variabilidade
da amostra. Aleatoriedade um procedimento para selecionar amostras e no uma
caracterstica da amostra. Ela tambm no assegura representatividade e nem d indicativo de
como a amostra se comportar.
Define-se por erro de amostragem quele tipo de erro que se comete ao selecionar
amostras aleatrias para representar a populao. Em virtude deste tipo de erro, virtualmente
impossvel para um grupo pequeno ser exatamente representativo de outro muito maior. Esse
erro de amostragem est presente toda vez que se selecionar amostras, no importa o quo
cuidadosa seja feita a seleo aleatria. A seguir so definidos alguns tipos de procedimentos
de seleo de amostras:
Amostragem aleatria simples - o processo de selecionar observaes de um grupo
maior de tal modo que cada sujeito na populao de onde se est selecionando a
amostra tenha uma probabilidade igual e independente de ser selecionada.
Amostragem estratificada - , algumas vezes, um modo recomendado de proceder ao
escolher amostras. Divide-se a populao em grupos menores homogneos de modo a
obter-se uma melhor representao. Com cada subgrupo algum processo de seleo
aleatria pode ser usado. Este processo d ao pesquisador uma amostragem mais
significativa da que seria obtida diretamente da comunidade inteira. De modo a ter-se
uma representao mais fiel da populao como um todo pode-se, ainda, fornecer
pesos ao nmero de sujeitos pertencentes aos diferentes grupos de modo a ter-se uma
representao proporcional distribuio na populao.
Amostragem estratificada proporcional - este tipo de processo de amostragem
ocorre quando se toma uma percentagem de cada grupo no processo de composio da
amostra.
Amostragem sistemtica - tem-se esse tipo de amostragem caso uma populao tenha
sido listada e ento algum tipo de seleo seja feita segundo algum critrio tal como,
por exemplo, tomar-se o ensimo elemento da lista.
Amostragem por agrupamento - uma variao da amostragem aleatria simples,
particularmente apropriada quando a populao grande ou quando a distribuio
geogrfica da populao espalhada. A cada agrupamento dado um nmero e
selecionados grupos escolhidos aleatoriamente. O uso da amostragem por
agrupamento geralmente escolhido por razes econmicas e aspectos
administrativos.
Em qualquer tipo de amostragem, a caracterstica da amostra inevitavelmente diferir em
algum grau, pequeno no entanto, da caracterstica da populao. Mas, quando a amostragem

45
aleatria usada, as chances de que a ocorrncia do erro de amostragem influencie a varivel
dependente em uma direo particular so as mesmas que existem de influenciar a mesma
varivel em outra direo qualquer. Amostragem aleatria a nica forma de amostragem
pela qual alguma quantidade de erro especfica pode ser estimada. Pode-se dizer que a
amostragem aleatria o que diferencia as pesquisas experimentais das pesquisas noexperimentais.

Medidas de tendncia central


Entende-se por distribuio de freqncias a uma tabulao (listagem) dos escores
obtidos em uma certa amostra com o nmero de vezes em que esses escores aparecem na
amostra. Assim, uma listagem com as notas obtidas pelos alunos em determinada avaliao
com o nmero de vezes com que cada nota aparece uma distribuio de freqncias.
Quando o nmero de sujeitos pertencentes (s) amostra(s) pequeno pode-se ter uma
idia de como se comportam os escores. No entanto, se tivermos amostras muito grandes fica
difcil ter uma idia do comportamento da amostra e temos, ento, que recorrer a
transformaes sobre os escores. Uma das formas de fazer isto usando as chamadas
medidas de tendncia central.
Define-se uma medida de tendncia central como sendo um nmero em torno do qual
os valores da distribuio de freqncias se distribuem. Em Estatstica, usa-se basicamente
trs tipos de medidas de tendncia central: a mdia, a moda e a mediana.
A Moda de uma distribuio de freqncias definida como o escore que tem a mais
alta freqncia.
A Mediana definida como aquele escore que marca o ponto mdio do conjunto de
dados, ou seja, aquele escore para o qual tem-se 50 % dos escores com valores
superiores 50 % dos escores com valores inferiores.
A Mdia aritmtica simples de uma distribuio de freqncias definida como
aquele nmero obtido a partir da diviso da soma de todos os escores obtidos pelo
nmero de elementos na distribuio de freqncias. Matematicamente:
X =

X n
i

onde os Xi so os escores obtidos, ni o nmero de vezes em que cada escore aparece


e N o nmero de elementos na distribuio de freqncias. O smbolo significa que
se est somando.
Exemplo: seja a distribuio de freqncias constante Tabela 1.

Tabela 1 - Distribuio de freqncias


para uma prova de uma disciplina
hipottica.
9,8
Turma 1
7,4
Turma 2
6,2
Turma 3

46
6,0
5,9
4,5
3,4
3,4
3,4
1,0
0,5

Turma 4
Turma 5
Turma 6
Turma 7
Turma 8
Turma 9
Turma 10
Turma 11

A moda desta distribuio dada pelo valor 3,4 pois o escore que aparece o maior
nmero de vezes na distribuio (3 vezes). A mediana da distribuio o valor 4,5 pois, para
esse valor, 50 % (5 escores) so maiores que ele e 50 % so menores. Por fim, a mdia
aritmtica simples da distribuio dada por:
9,8 + 7,4 + 6,2 + 6,0 + 5,9 + 4,5 + 3 3,4 + 1,0 + 0,5 51,5
=
11
11
X = 4,7
X =

Outros tipos de mdia podem ser definidos como, por exemplo, a mdia aritmtica
ponderada e a mdia geomtrica.
A mdia aritmtica ponderada usada quando deseja-se ter uma medida de tendncia
central de certa distribuio de freqncias onde os escores contribuem com pesos diferentes.
Matematicamente ela definida por:
Xp =

pn X
p
i

onde X p o valor da mdia ponderada, pi o peso atribudo a cada escore Xi e ni o


nmero de vezes que o escore aparece na distribuio de freqncias.
A mdia geomtrica definida por:
Xg =

n X
i

onde X g a mdia geomtrica, o smbolo significa que devemos multiplicar os elementos


que vm a seguir e os Xi e ni foram definidos anteriormente. Esse tipo de mdia usado
quando os escores da nossa distribuio so obtidos uns dos outros a partir de um fator
multiplicativo.

Medidas de variabilidade
A mdia, seja ela de que tipo for, no diz tudo a respeito de uma distribuio de
freqncias. Aqui cabe um comentrio a respeito dos processos estatsticos e a perda de
informao que necessariamente ocorre quando usa-se nmeros, tais como a mdia, para
representarem distribuies de freqncias. No processo de mediao ocorre uma perda de
informao uma vez que substitu-se a informao total, ou seja, a distribuio, por algo que

47
pretende ser representativo dessa distribuio. Ao faz-lo, perde-se a estrutura fina de
informao providenciada pelo conjunto completo de escores. Assim, por exemplo,
consideremos as hipotticas Tabelas 2 e 3:
Tabela 2 - Notas na
Turma 1.
aluno 1
5,1
aluno 2
5,9
aluno 3
7,2
aluno 4
5,9
aluno 5
5,9

Tabela 3 - Notas na
Turma 2.
aluno 1
9,0
aluno 2
5,0
aluno 3
6,0
aluno 4
8,0
aluno 5
2,0

Se for calculada a mdia aritmtica simples para essas duas distribuies de


freqncia, obter-se- para ambas a mdia 6,0. Entretanto, se essas distribuies forem
representativas de notas de alunos em duas turmas diferentes, em uma disciplina cuja mdia
de aprovao seja 6,0, observa-se, ento, que na turma 1 h um sujeito aprovado enquanto que
na turma 2 h trs. Olhando somente para a mdia das duas turmas essa informao seria
perdida.
Uma forma de minimizar essa perda de informao, decorrente do uso de uma medida
de tendncia central, so as medidas de variabilidade. Uma medida de variabilidade indica o
quo espalhados esto os escores na distribuio. Ou seja, uma medida de variabilidade uma
forma de ter uma idia do quanto os escores se afastam da medida de tendncia central que se
est utilizando.
A mais simples das medidas de variabilidade o intervalo (I). O intervalo diz entre
quais valores se distribuem os escores da distribuio que est sendo analisada. Assim, no
exemplo, o intervalo para a distribuio 1 dado por [7,2;5,1] enquanto que na distribuio 2
o intervalo dado por [9,0;2,0].
Outra medida de variabilidade o desvio da mdia (dm). Essa quantidade diz o
quanto os escores se desviam da mdia. No exemplo dado, o escore 9,0 da Tabela 3 possui um
desvio da mdia de 3,0 (9-6=3).
Uma medida de variabilidade das mais utilizadas em anlises de distribuies de
freqncia o desvio padro (dp). O desvio padro indica o quo espalhada uma
distribuio. O desvio padro tem uma interpretao muito simples, originada da equao que
define a distribuio normal (que ser analisada na prxima seo). Tomando um intervalo
definido por [ X - dp; X +dp] tem-se dentro desse intervalo em torno de 68 % dos valores da
distribuio. Fazendo uma nova medida, ento, h uma probabilidade de 68 % de que essa
nova medida pertena a esse intervalo. Considerando intervalos definidos por mltiplos do
desvio padro se estar englobando um nmero cada vez maior de escores dentro do intervalo
em questo.
Matematicamente, o desvio padro dado por:

dp =

( X j X )2
N

48

onde N o nmero de escores, Xj significa o j-simo elemento da distribuio de escores e X


o valor mdio da distribuio.

Curva normal
Define-se como curva da distribuio a representao grfica de uma freqncia de
distribuio de escores onde os valores dos mesmos so indicados no eixo horizontal e os
valores das freqncias dos escores particulares no eixo vertical. Curvas de distribuio
podem vir em diferentes formas e tamanhos. No entanto, muitas freqncias de distribuio
tendem a seguir um certo padro chamado de distribuio normal, especialmente quando
existem muitos escores envolvidos. A forma da curva que pode ser traada destas
distribuies chamada curva normal (Figura 1). Uma das caractersticas da curva normal
a simetria; outra caracterstica importante que a mdia, a mediana e a moda so idnticas.

0.10

0.08

Linha
base

Y(X)

0.06

de

0.04

0.02

0.00
-50

-40

-30

-20

-10

10

20

30

40

50

Figura 1 - A curva normal


Na curva normal, a distncia da linha de base at a primeira linha pontilhada o
desvio padro da distribuio, por definio7.
A equao que define a curva normal dada por:
Y (X ) =

1 (X X )2
exp

2
dp 2
2 dp

onde aqui dp o desvio padro, X o valor mdio e X o valor para o qual se quer calcular
Y.

No presente exemplo, a curva foi gerada com um desvio padro assumido de 5.

49

Intervalos de confiana
Quando se diz que um escore aleatoriamente selecionado cair dentro de um intervalo
especfico dos valores dos escores obtidos, preciso faz-lo com algum grau de confiana, ou
seja, sabendo quo provvel que se esteja correto. O intervalo de 95 % chamado de
intervalo de confiana porque, se a distribuio for normal, pode-se estar certo de que 95 %
das vezes em que um valor da varivel em questo for escolhido aleatoriamente ele estar
dentro desse intervalo. Em termos de probabilidades, o intervalo de confiana de 95 %
designa os dois valores entre os quais existe a probabilidade p=0,95 de que um escore
selecionado aleatoriamente pertena a esse intervalo. O intervalo de confiana de 95 % dado
por:

I 95% = X 1,96dp; X + 1,96dp

onde dp so o desvio padro e a mdia calculados para a distribuio.


O intervalo de confiana de 99 % outro intervalo normalmente utilizado. Os limites
desse intervalo esto entre:

I 99% = X 2,58dp; X + 2,58dp

Distribuio de mdias amostrais


Suponha-se que so selecionadas de uma populao hipottica um grande nmero de
amostras, cada uma das quais, digamos, com 50 sujeitos, e seja calculado o escore mdio para
cada grupo em alguma varivel de interesse. Pode-se ento traar uma curva representando a
distribuio desses escores. Nessa distribuio de mdias amostrais, a mdia de todas as
mdias a mdia da populao e as mdias amostrais so distribudas em torno da mdia da
populao seguindo a distribuio normal.
Quando se lida com distribuies de mdias, o desvio padro chamado de desvio
padro da mdia (dpm). A interpretao dessa quantidade semelhante quela do desvio
padro de medida: tomando-se outra amostra da populao a probabilidade de que a mdia
obtida por essa nova amostra esteja dentro do intervalo de confiana de 95% dada por:

I 95% = X 1,96dpm; X + 1,96dpm

Inferncias a respeito do valor da mdia da populao


Quando se sabe a mdia de uma amostra e toma-se uma estimativa do desvio padro
da mdia no possvel inferir o valor da mdia da populao a partir da mdia que se tem
para aquela amostra, mas pode-se fazer hipteses sobre o valor para a mdia da populao e,
usando a estimativa do desvio padro da mdia, determinar a probabilidade de obter-se uma
mdia amostral que difira da mdia hipotetizada da populao tanto quanto se queira.
Suponhamos que uma mdia amostral seja 97 e que o desvio padro da mdia
estimado seja de dpm=2. Suponhamos tambm que a hiptese feita foi de que a mdia da

50
populao 100. Pode-se ento determinar a probabilidade de obter nossa mdia da amostra
de 97.

0.20

0.15

0.10

Y(X)
0.05

0.00

90

95

96,08

100

103,9

105

110

Figura 2 - Curva normal indicando intervalo de confiana de 95 %.


A Figura 2 indica que o intervalo de confiana de 95 % varia de 96,08 a 103,92. Isto
diz que se a mdia da populao for 100, ento, a probabilidade de selecionar-se uma amostra
cuja mdia esteja dentro do intervalo de confiana considerado p=0,95. Outra forma de
dizer isso que a probabilidade de obter-se uma mdia amostral menor que 96,08 ou maior
que 103,92 p=0,05. Portanto, pode-se aceitar a hiptese de que a amostra, cuja mdia 97,
vem de uma distribuio de mdias amostrais, retiradas de uma populao cuja mdia 100.

Comparaes entre mltiplas amostras


Em situaes de pesquisa, usualmente deseja-se comparar duas ou mais amostras. Por
exemplo, pode-se querer determinar se existe uma diferena em aquisio de conhecimentos
entre estudantes que so ensinados por um mtodo A e aqueles que so ensinados por um
mtodo B. A questo : qual a probabilidade de que diferenas entre as duas mdias das
amostras seja devido simplesmente a erro de amostragem? Em outras palavras, pode a
diferena de mdias entre as duas amostras ser atribuda ao erro aleatrio nas amostras, ou
os alunos ensinados por um mtodo realmente aprendem mais que aquelas ensinados pelo
outro mtodo? Temos de fato duas amostras pertencentes a populaes diferentes,
representadas por duas distribuies normais de escores?
Ao testar a hiptese nula se est assumindo que a diferena entre as duas amostras
devida simplesmente ao erro de amostragem.

51

Tipos de hipteses
Quando se quer decidir se determinado procedimento melhor que outro, formula-se a
hiptese de no existe diferena entre os procedimentos (i.e., qualquer diferena observada
meramente devida a flutuaes ao tomar duas amostras da mesma populao). Este tipo de
hiptese a chamada Hiptese Nula denotada por H0. A hiptese alternativa H0, ou seja, de
que a diferena observada no meramente devido a amostragem, denotada por H1.
Ao decidir se rejeita-se ou no a hiptese nula dois tipos de erros podem acontecer. O
primeiro tipo de erro acontece quando rejeita-se a hiptese nula com base em dados de
amostras que de fato vm da mesma populao, diz-se que se comete um erro Tipo I. Se por
outro lado, aceita-se a hiptese nula quando, de fato, as amostras vm de populaes
diferentes, diz-se que foi cometido um erro do Tipo II8.
Na prtica, conforme o caso, um tipo de erro pode ser mais srio do que o outro e,
assim, uma soluo de compromisso deve ser obtida em favor de uma limitao do erro que,
naquela situao, seja considerado mais srio. A nica forma de diminuir a influncia desses
dois tipos de erro aumentar o tamanho da amostra, o que nem sempre possvel.
Ao testar a hiptese nula, a probabilidade mxima com a qual o pesquisador aceita
correr o risco de cometer um erro de tipo I chamada de nvel de significncia estatstica da
pesquisa. Quando o pesquisador decide o nvel de probabilidade que usar ao rejeitar a
hiptese nula ele estar dando a probabilidade com a qual arriscar estar errado em sua
deciso. Se ele seleciona o nvel de significncia como 0,05, est dizendo que h uma
probabilidade de 0,05 de que ele esteja errado. Se no quiser correr um risco de erro to
significativo, ele pode ento escolher para nvel de significncia p=0,01. Neste nvel menos
provvel que esteja cometendo um erro do tipo I, entretanto, estar incrementando a
probabilidade de cometer um erro do tipo II.
Na prtica da pesquisa em educao os nveis de significncia de 0,05 e 0,01 so
usuais, embora outros nveis de significncia sejam tambm utilizados.
Uma hiptese que no indica a direo da diferena esperada, mas meramente
estabelece que existe uma diferena, chamada de uma hiptese bilateral (two-tailed). Esse
tipo de hiptese assim designada porque ela est preocupada com ambas as caudas da
distribuio normal das diferenas entre mdias amostrais.
Uma hiptese que afirma qual tratamento melhor que o outro chamada de hiptese
unilateral (one-tailed) porque ela est somente preocupada com um dos lados da distribuio
de diferenas entre mdias amostrais.
Distribuio de mdias de pequenas amostras
At aqui foram consideradas amostras que contm um grande nmero de sujeitos
(trinta ou mais). As propriedades da distribuio normal so vlidas para grandes amostras,
mas no quando h um nmero pequeno de sujeitos em cada amostra. A distribuio tende a
ficar achatada quando, em cada amostra, o nmero de sujeitos pequeno.
Para fins estatsticos isso significa que, para dados onde as amostras so pequenas, no
possvel usar-se as propriedades da curva normal para decidir a favor ou contra a aceitao
8

Tecnicamente, o pesquisador no deveria aceitar a hiptese nula mas, sim, falhar em rejeitar a hiptese nula.

52
da hiptese nula. Ao invs disso, deve-se usar valores que reflitam esse achatamento da curva
normal. Esses valores so chamados de valores t para os quais tambm foram calculados
valores para os nveis de significncia p=0,05 e p=0,01 para amostras de qualquer tamanho.
Existem tabelas estatsticas preparadas (uma das quais apresentada na Tabela 4) para estes
valores t para todos os tamanhos de amostras sendo comparadas, de modo que sabendo-se
quantos sujeitos esto em cada amostra que se est comparando poderemos facilmente
determinar o valor de t necessrio ao nvel de significncia escolhido (normalmente 0,05 ou
0,01).
Se um valor t indica diferenas dentro do intervalo de confiana de 95 %, seu valor
normalmente no comunicado. Ao invs, o pesquisador afirma que o valor t no
significativo. Neste caso, ele aceita a hiptese nula e atribui a diferena observada entre suas
amostras ao simples erro de amostragem.
Este tipo de teste estatstico chamado de teste t e utilizado para comparao entre
mdias de amostras pequenas quando, por hiptese, as amostras foram escolhidas
aleatoriamente e os escores vieram de populaes distribudas segundo a distribuio
normal. Outros testes estatsticos so disponveis se a hiptese de normalidade no puder ser
feita.
Amostras com nmero de sujeitos menor que 30 so chamadas pequenas amostras.
Um estudo estatstico de distribuies amostrais no qual as amostras so pequenas chamado
Teoria de Pequenas Amostras. Entretanto, um nome mais apropriado seria Teoria Exata da
Amostragem, uma vez que os resultados obtidos mantm-se tanto para pequenas como para
grandes amostras. Uma distribuio importante a distribuio t de Student9. Esta
distribuio dada, matematicamente, por:

Y=

Y=

Y0

t2
+
1

N 1

Y0

t2
1 +
gl

N /2

( gl +1) / 2

onde Y0 uma constante que depende em N de tal modo que a rea total sobre a curva 110. A
quantidade N-1 chamada de grau de liberdade (gl). Para grandes valores de gl ou N (N >30)
as curvas da figura se aproximam da curva normal padro. A Figura 3 mostra vrias curvas
desta distribuio para vrios valores de graus de liberdade gl.

gl=N-1

Mantm-se aqui o nome em ingls por ser consagrado na literatura e pelo uso na rea.
A isto chama-se de condio de normalizao.

10

53

Figura 3 - A distribuio t de Student para distintos graus de liberdade.

Para fins de clculo entre duas amostras, com N1 e N2 sujeitos, de mdias e desvios
padro dados por X 1 , dp1, X 2 e dp2 respectivamente, o valor de t dado por:

X1 X 2

t=

1
1
+
N1 N 2

onde a quantidade definida por:

N 1dp12 + N 2 dp22
N1 + N 2 2

Valores de t foram calculados, para nveis de significncia de 0,05 e 0,01, para


qualquer tamanho de amostra. Os estatsticos prepararam tabelas estatsticas destes valores t
para todos os tamanhos das amostras sendo comparadas, de modo que, se soubermos quantos
sujeitos existem em cada amostra podemos compar-las facilmente e determinar o valor t
necessrio para o nvel de significncia desejado (0,05 ou 0,01). Tabela desse tipo est
exemplificada na Tabela 4.

54

Tabela 4 - Tabela t para hipteses unilaterais e bilaterais.


gl

.10

Nvel de significncia para hiptese unilateral


.05
.025
.01
.005
.0025
Nvel de significncia para hiptese bilateral
.10
.05
.02
.005
.01
6.314
12.706
31.821
63.657
127.32
2.920
4.303
6.965
9.925
14.089
2.353
3.182
4.541
5.841
7.453
2.132
2.776
3.747
4.604
5.598

.40

.25

.80

.50

1
2
3
4

0.325
.289
.277
.271

1.000
0.816
.765
.741

3.078
1.886
1.638
1.533

5
6
7
8
9

0.267
.265
.263
.262
.261

0.727
.718
.711
.706
.703

1.476
1.440
1.415
1.397
1.383

2.015
1.943
1.895
1.860
1.833

2.571
2.447
2.365
2.306
2.262

3.365
3.143
2.998
2.896
2.821

4.032
3.707
3.499
3.355
3.250

10
11
12
13
14

0.260
.260
.259
.259
.258

0.700
.697
.695
.694
.692

1.372
1.363
1.356
1.350
1.345

1.812
1.796
1.782
1.771
1.761

2.228
2.201
2.179
2.160
2.145

2.764
2.718
2.681
2.650
2.624

15
16
17
18
19

0.258
.258
.257
.257
.257

0.691
.690
.689
.688
.688

1.341
1.337
1.333
1.330
1.328

1.753
1.746
1.740
1.734
1.729

2.133
2.120
2.110
2.101
2.093

20
21
22
23
24

0.257
.257
.256
.256
.256

0.687
.686
.686
.685
.685

1.325
1.323
1.321
1.319
1.318

1.725
1.721
1.717
1.714
1.711

25
26
27
28
29

0.256
.256
.256
.256
.256

0.684
.684
.684
.683
.683

1.316
1.315
1.314
1.313
1.311

30
40
60
120

0.256
.255
.254
.254
.253

0.683
.681
.679
.677
.674

1.310
1.303
1.296
1.289
1.282

.20

.001

.0005

.002

.001

318.31
22.326
10.213
7.173

636.62
31.598
12.924
8.610

4.773
4.317
4.029
3.833
3.690

5.893
5.208
4.785
4.501
4.297

6.869
5.959
5.408
5.041
4.781

3.169
3.106
3.055
3.012
2.977

3.581
3.497
3.428
3.372
3.326

4.144
4.025
3.930
3.852
3.787

4.587
4.437
4.318
4.221
4.140

2.602
2.583
2.567
2.552
2.539

2.947
2.921
2.898
2.878
2.861

3.286
3.252
3.222
3.197
3.174

3.733
3.686
3.646
3.610
3.579

4.073
4.015
3.965
3.922
3.883

2.086
2.080
2.074
2.069
2.064

2.528
2.518
2.508
2.500
2.492

2.845
2.831
2.819
2.807
2.797

3.153
3.135
3.119
3.104
3.091

3.552
3.527
3.505
3.485
3.467

3.850
3.819
3.792
3.767
3.745

1.708
1.706
1.703
1.701
1.699

2.060
2.056
2.052
2.048
2.045

2.485
2.479
2.473
2.467
2.462

2.787
2.779
2.771
2.763
2.756

3.078
3.067
3.057
3.047
3.038

3.450
3.435
3.421
3.408
3.396

3.725
3.707
3.690
3.674
3.659

1.697
1.684
1.671
1.658
1.645

2.042
2.021
2.000
1.980
1.960

2.457
2.423
2.390
2.358
2.326

2.750
2.704
2.660
2.617
2.576

3.030
2.971
2.915
2.860
2.807

3.385
3.307
3.232
3.160
3.090

3.646
3.551
3.460
3.373
3.291

Fidedignidade e validade
Antes que qualquer anlise dos dados possa ser feita necessrio que o pesquisador se
pergunte: a forma de obteno dos dados me d segurana sobre a sua validade?
Em sees anteriores foi discutida a estrutura de um experimento analisando os vrios
tipos de delineamentos possveis (destacando o que diferencia um delineamento do tipo
experimental dos que no possuem esta propriedade) bem como aspectos relacionados com as
caractersticas de um bom teste. No entanto, de nada adianta ser cuidadoso na escolha do

55

delineamento da pesquisa se os instrumentos de coleta de dados forem inadequados.


Inadequao significa dizer que o instrumento no mede corretamente o que se prope a
medir (questo relacionada com a fidedignidade do instrumento) ou mede outra coisa
diferente daquela que se prope a medir (questo relacionada com a validade do
instrumento). Para usar uma analogia comum quando se fala em fidedignidade e validade,
pode-se imaginar a seguinte situao: um atirador de dardos acerta repetidamente o mesmo
lugar do alvo. Neste caso, diz-se que h fidedignidade, pois em vrias repeties o atirador
acerta sempre no mesmo lugar ou, em outras palavras, consegue reproduzir o mesmo
resultado (posio) com o mesmo instrumento. Porm se a posio acertada no for o centro
do alvo, dizemos que no h validade, pois o objetivo do jogo acertar o centro. Se a posio
acertada for o centro, sempre, ento dizemos que h fidedignidade e validade.
A ferramenta bsica para a anlise de fidedignidade a correlao estatstica entre
variveis. Vejamos como se calcula esta quantidade e qual o seu significado.

O que a correlao entre duas variveis


Conceitualmente a correlao ou o coeficiente de correlao (r) indica como se
comportam duas ou mais variveis umas em relao s outras. Quando temos uma correlao
alta isto indica que o crescimento de uma varivel acompanhado pelo crescimento (no caso
de um coeficiente de correlao perto de +1) ou pelo decrscimo (no caso de um coeficiente
de correlao perto de 1) da outra varivel. Convm lembrar aqui que o fato de duas
variveis serem correlacionadas (tanto positiva quanto negativamente) no implica uma
relao causal entre as duas variveis. Para o estabelecimento de uma relao causal entre elas
deve-se recorrer a outras ferramentas de anlise, ou seja, devemos procurar na teoria as razes
dessa dependncia e os fatores de comprovao dessa dependncia.
O grau de correlao indicado pelo valor do coeficiente de correlao. Para uma
correlao perfeitamente positiva tal como mostrado na Figura 4.a o coeficiente de correlao
r tem valor +1. O coeficiente para uma correlao perfeitamente negativa mostrado na
Figura 4.b, o coeficiente de correlao r e tem valor de 1 . Estes dois valores so os valores
mximos para r. O coeficiente r=0 indica a inexistncia de correlao. Neste caso o
comportamento de uma varivel no relacionado de qualquer modo ao comportamento da
outra varivel. Isso mostrado na Figura 4.c
Y

.
.

..

. .
.
. . .
.

(a)

(b)

(c)

...
.
.
. .
.
...
.
X

(d)

Figura 4 - Representao grfica dos vrios tipos de correlao possveis entre variveis.
A Figura 4.d nos mostra um caso onde a correlao existe mas imperfeita. Pela
simples viso dessa figura, podemos ver que os pontos tendem a se alinhar ao longo de uma
direo especfica, embora no estejam todos sobre uma mesma reta. Isto nos indica que a
correlao positiva, embora no seja perfeita.

56

Tal como ocorre com os escores mdios de amostras, os coeficientes de correlao,


calculados a partir de dados amostrais, so afetados por erros de amostragem. Assim, a
exemplo do que foi feito com as mdias amostrais, uma pergunta se impe: quo provvel
que o coeficiente de correlao obtido a partir dos dados amostrais no seja fruto do erro de
amostragem e reflita um verdadeiro relacionamento existente na populao? razovel se
tomar por hiptese de que, como em toda inferncia feita a partir de um processo de
amostragem, exista um erro devido ao prprio processo de amostragem. Entretanto, a
exemplo do que acontece para outros tipos de testes estatsticos, existem tabelas para vrios
valores de tamanho de amostra, a qualquer nvel de significncia estatstica desejado11.

Clculo do coeficiente de correlao


A forma de clculo do coeficiente de correlao funo do tipo de varivel com a
qual estamos lidando. Como j foi discutido, estas podem ser divididas em quatro grupos:
nominais, ordinais, intervalares ou racionais. Para cada pareamento de variveis a forma de
clculo do coeficiente de correlao diferente, devendo-se levar em conta os tipos de
variveis envolvidos. A frmula de clculo do coeficiente de correlao, definida a seguir,
vlida somente quando as variveis envolvidas so ambas dos tipos intervalares ou racionais.
Para outros tipos de variveis sugere-se a consulta a Glass e Stanley, (1970).
O termo correlao tal como est sendo usado aqui significa correlao linear. Nesse
caso, o coeficiente de correlao entre duas variveis X e Y dado por:
rxy =

onde x = X X e y = Y Y

12

xy
( x )( y )
2

Esta equao chamada de frmula produto-momento13. Deve-se observar a simetria


entre as variveis que compe essa equao: se trocarmos x com y o resultado o mesmo.
Com isso rxy = ryx ou seja, tanto faz calcularmos o coeficiente de correlao chamando uma
das variveis de X e a outra de Y como calcularmos denominando inversamente as variveis.

Validade e fidedignidade de testes


Testes de conhecimento tentam medir o que um indivduo apreendeu em uma certa
rea, seu nvel atual de domnio de um certo contedo ou seu desempenho. Muitos testes
usados em escolas so testes de conhecimento. Freqentemente, escores em testes de
conhecimento so usados na avaliao de cursos, professores, mtodos de ensino e outros
fatores considerados significativos na prtica educacional. So usados na classificao,
promoo ou reteno de estudantes em nveis particulares de ensino. Eles so usados como
ferramentas para diagnosticar pontos fracos e fortes dos estudantes e como uma base para
prmios, recompensas, etc., dentro do ambiente escolar.

11

Usualmente os nveis 0,01 e 0,05.


Os valores com barra, seguindo a conveno anterior, so as mdias em X e Y.
13
Observe-se que essa equao fornece automaticamente o sinal correto para o coeficiente de correlao.
12

57

Testes de aptido tentam predizer o grau de conhecimento que pode ser esperado de
indivduos em uma atividade particular. Estes testes tentam prever a capacidade de um
indivduo em particular para adquirir um melhor desempenho a partir de treino adicional. De
fato, capacidade (ou aptido) no pode ser medida diretamente. Aptido somente pode ser
inferida com base no desempenho apresentado. Testes de aptido podem ser usados para
dividir os estudantes em grupos relativamente homogneos com fins instrucionais de modo a
identificar estudantes para bolsas escolares ou para elaborar guias individuais dentro de reas
onde elas mais provavelmente tero sucesso.
Na pesquisa, testes so instrumentos de medida usados pelos pesquisadores para, de
um modo geral, coletar dados. Deste modo, se a pesquisa for de qualidade de se supor que
os procedimentos usados para a coleta de dados (e sua anlise) devem ser bons. A qualidade
da pesquisa no pode ser melhor do que a qualidade dos procedimentos usados para coletar e
analisar os dados.
Como j foi dito, esses instrumentos devem ter, duas caractersticas so indispensveis:
1. Fidedignidade: um teste fidedigno se suas medidas so acuradas e consistentes
quando aplicado em tempos diferentes.
2. Validade: em geral, um teste possui validade se mede o que se prope a medir.
Um teste pode ser fidedigno, mesmo se no for vlido. Um teste vlido sempre
fidedigno. No existe uma nica forma de validade ou fidedignidade de um instrumento.
Existem muitos tipos de validade e fidedignidade. Em geral, fidedignidade est relacionada
com consistncia e validade est relacionada com a interpretao do teste. Um teste pode ser
vlido para um objetivo e no ser vlido para outro.

Fidedignidade14
Reiterando, por fidedignidade entendemos o quo acurados os dados so no sentido de
sua estabilidade, reproducibilidade ou preciso. Um instrumento de coleta de dados
fidedignamente perfeito um que se fosse aplicado duas vezes sob as mesmas circunstncias
nos forneceria os mesmos resultados. Como foi visto, a correlao a ferramenta estatstica
bsica na anlise de fidedignidade de testes. Uma correlao de 1,00 indicaria perfeita
fidedignidade enquanto que correlao 0,00 indicaria nenhuma fidedignidade. Correlaes
intermedirias indicariam diferentes nveis de fidedignidade.
So vrias as formas de medir-se a fidedignidade de um teste:
1. Teste-reteste - exatamente o que o nome implica; produzimos o primeiro conjunto de
dados atravs da aplicao do teste em um dado instante de tempo e, aps decorrido algum
intervalo de tempo longo o suficiente para esquecer o teste mas curto o suficiente para que
no sejam produzidas alteraes significativas nos respondentes, um segundo conjunto de
dados obtido pela aplicao do mesmo teste ao mesmo conjunto de respondentes (o reteste).
Aps a segunda aplicao os dois conjuntos de dados so correlacionados e a correlao
obtida estima a fidedignidade do teste.

14

Parte dessa seo baseada em The Research Process in Education, de D.J. Fox, 1969.

58

O maior problema nesta estratgia envolve o intervalo de tempo. Como definir o que se
entende por intervalo de tempo grande o suficiente para esquecer do teste mas curto o
suficiente de modo a que no se produzam alteraes nos respondentes? A resposta a esta
questo depende do tipo de pesquisa que est sendo feita.
O procedimento de teste-reteste mais aplicvel quelas situaes onde a aptido, habilidade
ou conhecimento que est sendo avaliado possui estabilidade, mudando em escalas de tempo
longas frente ao perodo entre o teste e o reteste. Esta, obviamente uma limitao de ordem
prtica sendo, sob o ponto de vista tcnico, muito difcil garantir a integridade dos
respondentes entre o teste e o reteste. Outro aspecto perigoso da estratgia do teste-reteste
que estamos calculando a correlao entre dados provenientes de duas exposies dos sujeitos
ao mesmo contedo. Desse modo, se existir um direcionamento do teste em alguma direo
ser, naturalmente, um direcionamento consistente em cada uma das exposies ao
instrumento.
2. Forma alternada: nesta forma de medio de fidedignidade o pesquisador deve
desenvolver duas formas paralelas ou equivalentes de seu instrumento, digamos formas A e B,
administrar ambas s mesmas pessoas e correlacionar os dois conjuntos de dados obtidos. A
administrao das duas formas pode ser com um intervalo de tempo entre as duas aplicaes
ou de uma nica vez, com as duas formas sendo aplicadas consecutivamente. Em ambos os
casos aconselhvel alternar-se a ordem de aplicao entre as duas formas do teste, isto ,
metade dos respondentes respondem forma A do teste e depois forma B e a outra metade
responde primeiro forma B e depois forma A do teste. Esta maneira de aplicar o teste
elimina efeitos que poderiam mascarar os resultados obtidos tais como cansao ou
aborrecimento durante a aplicao da segunda forma do teste.
Este tipo de procedimento possui as seguintes dificuldades:

Em muitos casos difcil desenvolver-se uma forma do instrumento, o que dir duas.
H situaes onde difcil, seno impossvel, perguntar-se a mesma coisa duas vezes, de
forma equivalente ou similar.
Se o procedimento envolver certo intervalo de tempo entre a aplicao do teste e de sua
forma alternada, da mesma forma que ocorreu para a forma teste-reteste, pode surgir o
problema de reagrupar o mesmo grupo de sujeitos para responder o teste pela segunda vez.
Administrar consecutivamente duas formas do mesmo teste exige duas vezes mais tempo e
exige a manuteno de um interesse suficiente por parte dos respondentes uma vez que eles
trabalharo, basicamente, sobre os mesmos contedos.
3. Mtodo da metade ou par-mpar: um terceiro procedimento chamado da metade ou parmpar soluciona cada um dos problemas apontados anteriormente, quando da discusso das
outras formas de clculo de fidedignidade. Ela envolve somente a administrao de um
instrumento em apenas uma nica forma. O instrumento aplicado uma nica vez a um grupo
de respondentes, entretanto, ele analisado de forma a separar os escores de cada respondente
em duas metades. Estes dois conjuntos de escores so ento correlacionados. Desse modo, se
um instrumento possui 100 itens, para obter-se a estimativa de fidedignidade na forma parmpar, obter-se-ia os escores de cada respondente nas questes mpares e ento um escore
separado para as outras 50 questes pares. possvel, mas no o mais aconselhvel, usar o
procedimento de separao em metades, isto , obter um escore para cada respondente
baseado na primeira metade do teste e outro baseado na segunda metade do teste.

59

A forma par-mpar a prefervel devido s seguintes vantagens:

Normalmente, um instrumento de medida cobre diferentes reas do conhecimento em


diferentes sees as quais geralmente so estanques e bem diferenciadas.
Fatores tais como fadiga ou perda de interesse poderiam causar omisso por parte do
respondente nas questes finais do teste.
No entanto, no importa qual seja o procedimento usado, estimativas de fidedignidade
obtidas a partir do uso de metades de um instrumento tambm apresentam seus problemas,
principalmente relacionados com o fato de que a fidedignidade relacionada com o nmero
de itens de um instrumento.
O seguinte procedimento foi desenvolvido de modo a calcular a fidedignidade de um
instrumento como um todo a partir do clculo da fidedignidade usando metades do teste. a
chamada frmula de Spearman-Brown, que recebe esse nome em homenagem aos
pesquisadores que, de forma independente, a desenvolveram:

SB =

2 | |
1+| |

onde SB a chamada estimativa de fidedignidade de Spearman-Brown, a correlao


entre as duas metades do teste. O que esta frmula nos d somente uma predio ou
estimativa da fidedignidade que o pesquisador poderia esperar para o instrumento como um
todo a partir dos valores de fidedignidade obtidos para cada metade do teste.
A maior vantagem de usar-se correlao entre metades como uma estimativa de
fidedignidade do teste total de natureza prtica: necessita-se de apenas um teste e uma
sesso de testagem por parte dos respondentes. Suas desvantagens so as mesmas.
Expectativas para a fidedignidade de um instrumento diferiro dependendo da
natureza da informao que est sendo procurada. Se o que se estiver procurando uma
informao tipo demogrfica, como, por exemplo, lugar de nascimento, escolaridade e
experincia profissional poderamos esperar uma alta fidedignidade de um instrumento. Em
termos de correlaes isto implica em coeficientes de correlao da ordem ou superiores a
0,90. Por outro lado, se a procura for sobre conhecimento e habilidades, as quais so
informaes de carter no to fixo quanto o exemplo anterior, a expectativa de fidedignidade
ser menor e um coeficiente de fidedignidade de 0,85 aceitvel. Por fim, se o tipo de
informao procurada for mais movedia, como por exemplo atitudes e interesses, um
coeficiente da ordem de 0,70 ser aceitvel.
Uma pergunta que surge naturalmente nesse ponto a seguinte: como melhorar a
fidedignidade de um teste? Como comentado anteriormente, a fidedignidade de um teste est
diretamente relacionada com a extenso do teste. Portanto, um procedimento bvio de modo a
melhorar a fidedignidade de um teste alterar a sua extenso. Mas de quanto a fidedignidade
poderia ser melhorada com o acrscimo de uma ou mais questes ao teste? A resposta a essa
pergunta encontra-se embutida na frmula de clculo do coeficiente de Spearman-Brown, a
qual fornece a fidedignidade mxima que poderia ser obtida pelo aumento no tamanho do
teste. Essa estimativa dada pela equao abaixo:
kr
rk =
1 + ( k 1)r

60

onde k o nmero de vezes que o novo teste maior que o anterior, r a fidedignidade
apresentada pela forma atual do teste e rk a estimativa de fidedignidade da nova forma do
teste.

Exemplo: suponhamos que a fidedignidade de um teste estimada em 0,50. Este teste


tem a sua extenso duplicada pelo acrscimo de itens. Qual ser a estimativa da nova
fidedignidade?
kr
rk =
1 + ( k 1)r
2 0,5
rk =
1 + (2 1) 0,5
rk = 0,67

Um algoritmo para o clculo do coeficiente de fidedignidade de testes - Anlise de


Consistncia Interna
Uma das aplicaes do coeficiente de correlao na Anlise da Consistncia
Interna de testes. muito comum na prtica docente que o professor some escores de itens
isolados de testes compondo, assim, um escore bruto o qual usado para anlises e
inferncias. No entanto, esse procedimento somente aceitvel quando todos os itens do teste
se referem a um mesmo conjunto de conceitos e/ou habilidades. A anlise de consistncia
interna de um teste tem por objetivo verificar o quanto de verdade existe nessa hiptese a
respeito de determinado teste. A idia geral comparar-se o desempenho em cada item dos
respondentes ao teste com o desempenho dos respondentes ao teste como um todo. Se o
desempenho dos respondentes a um item no se correlaciona com o desempenho dos
respondentes ao teste como um todo isto significa que aquele item em particular no est
avaliando as mesmas caractersticas das demais questes que compem o teste e, portanto,
deve ser descartado (ou modificado). A Anlise de Consistncia Interna parte indispensvel
do processo de pesquisa. O pesquisador no pode usar um teste sem verificar a sua
consistncia interna. Sem essa etapa, a soma de escores atribudos a itens particulares no
pode ser feita e toda inferncia obtida a partir desse escore total ser sem significado.
Apresenta-se a seguir um roteiro15 para a execuo de anlise de consistncia interna.
Os dados utilizados no exemplo so retirados da Tabela 5:
Tabela 5. - Dados para o exemplo de anlise de consistncia
interna.
1
2
3
4
5
6
7
8
Total
ITEM
INDIVDUO

1.
2.
3.
4.
5.
15

5
5
5
4
5

5
4
5
4
4

5
4
4
5
5

5
5
5
4
5

5
3
3
4
2

5
5
4
5
4

5
5
5
5
4

2
3
3
2
3

37
34
34
33
32

Este roteiro foi elaborado pelo professor Fernando Lang da Silveira do Instituto de Fsica da UFRGS.

61

6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
F(1)
F(2)
F(3)
F(5)
F(6)

4
4
4
3
4
5
4
4
4
3
3
4
4
3
4
4
3
3
3
2
3
1
4
2
3
1
2
2
9
13
5

5
4
5
4
3
5
4
4
4
4
4
3
4
3
4
3
4
4
3
3
2
2
3
2
3
1
1
3
8
14
5

4
5
5
5
4
5
3
4
4
4
5
3
4
4
3
3
3
3
3
3
3
3
3
2
1
2
1
2
11
9
8

4
5
4
4
5
4
4
3
4
4
3
5
3
4
3
3
3
3
4
3
3
2
3
1
2
1
2
2
10
10
7

3
5
4
3
2
1
5
3
2
3
2
4
3
4
2
4
4
1
3
5
4
5
4
4
3
3
2
5
10
9
5

5
5
4
5
5
4
4
3
4
4
4
3
5
4
3
3
4
3
4
4
3
3
1
3
2
1
2
1
8
12
8

5
3
5
5
5
3
4
4
3
4
5
2
4
3
4
4
4
4
3
3
4
3
1
3
2
2
1
3
8
10
9

2
1
1
2
3
4
3
4
3
2
2
4
1
2
4
3
2
5
3
1
2
5
4
4
2
4
4
10
8
7
2

32
32
32
31
31
31
31
29
28
28
28
28
28
27
27
27
27
26
26
24
24
24
23
21
18
15

1. Transformar a resposta de cada indivduo a cada item em um escore.


2. Calcular o escore total de cada indivduo somando os escores obtidos em cada item por
aquele indivduo.
3. Ordenar os indivduos, em ordem decrescente, pelo escore total.
4. Construir a matriz dos resultados (ver a tabela 5).
5. Determinar a freqncia (nmero de vezes em que o escore aparece) de cada escore em
cada item (ver as ltimas cinco linhas da tabela 5).
6. Calcular a mdia do escore total. Isto feito somando-se os escores totais de cada um dos
sujeitos e dividindo-se pelo nmero de sujeitos (N). Assim, no exemplo, torna-se a soma da
ltima coluna da tabela 5 e divide-se por 31 (nmero de sujeitos):

T=

37 + 34 +...+15 868
=
= 28,00
31
31

7. Calcular a varincia do escore total. No exemplo:

62

Vt =

(T ) 2

N
24986
Vt =
(28,00) 2
31
Vt = 22,00
8. Calcular a mdia e a varincia de cada item. Por exemplo, para o item 1 tem-se:

I=(1x2)+(2x2)+(3x9)+(4x13)+(5x5)=110 (soma dos escores)


I2 =(12x2)+(22 x2)+(32 x9)+(42 x13)+(52 x5)=424 (soma dos quadrados dos escores)
I =I/N=110/31=3,548 (mdia do escores atribudos ao item)
VI = 424/31 (3,548)2=1,089 (varincia no item).
A Tabela 6. traria os valores da mdia e da varincia para cada item do nosso
exemplo:
Tabela 6 - Clculos para o primeiro sujeito da tabela 5.
ITEM
1
2
3
4
5
6
7
MDIA
3,548
VARINCIA 1,089 0,946

8
1,273

9. Calcular o somatrio da varincia dos itens. Para os dados do exemplo (ver a tabela 5):
VI =1,089+0,946+...+1,273=9,144
10. Calcular o coeficiente de fidedignidade (coeficiente de Cronbach):

k VI

1
k 1
VT

8 9,144

7 22,00
= 0,668

= 1

onde k o nmero de itens do teste.


Como foi dito, o coeficiente de fidedignidade um nmero entre -1 e 1. Quanto mais prximo
de 1 (em mdulo) melhor o teste. No exemplo, o coeficiente de fidedignidade obtido est
bastante longe de um valor aceitvel. A fim de melhor-lo preciso descobrir quais os itens
do teste esto levando a esse valor baixo. Para isso, deve-se calcular o ndice de
discriminao de cada item, descartando-se aqueles itens que possurem baixo ndice de
discriminao. A lgica por trs desse procedimento a seguinte: se uma questo do teste
tem, aproximadamente, a mesma freqncia de escores em dois grupos com escores totais
diferentes (por exemplo os 25 % com escores superiores e os 25% com escores inferiores)
ento esse no um bom item do teste. Essa a prxima fase.
11. Dividir os sujeitos em trs grupos (superior, mdio e inferior) atravs do escore total. Os
grupos superior e inferior devem perfazer, aproximadamente, 25 % dos indivduos.

63

12. Calcular a mdia de cada item no grupo superior e no grupo inferior.

No exemplo, mdia do item 1 no grupo superior:


I s = (4x5+4x4)/8 = 4,5
Mdia do item 1 no grupo inferior:

I i = (2x3+4+2x2+2x1)/7 = 2,286
A Tabela 7 traria os valores calculados para cada um dos itens do exemplo.

Tabela 7 - Valores mdios para cada item relativos aos grupos superior Gs e inferior Gi
para os dados do exemplo.
1. ITEM
1
2
3
4
5
6
7
8
2. MDIA GS
4,5
3. MDIA GI
2,286
13. Calcular o ndice de discriminao de cada item. O ndice de discriminao definido
como a diferena entre os valores mdios dos escores do item nos grupos superior e inferior:
Di = I s I i
Di = 4,5 2,286 = 2,214

no exemplo, para o item 1.


A Tabela 8 apresentaria os valores do ndice de discriminao para todos os itens de nosso
exemplo.

Tabela 8 - Valores do ndice de discriminao para cada item do exemplo.


ITEM
1
2
3
4
5
6
7
8
Di
2,214
14. Calcular a seguir o coeficiente de correlao item-total. Esse coeficiente o que
indicar quais os itens que esto prejudicando a fidedignidade do teste e que devem ser
eliminados. O coeficiente de correlao item-total definido por:

rIT =

Di
K VI

A constante K que aparece nesta equao depende da extenso dos grupos extremos; para os
dados do exemplo seu valor de 2,57. Valores dessa constante para vrias combinaes de
grupos encontram-se tabelados em livros de Estatstica.
Para o item 1 do exemplo, o coeficiente de correlao item-total dado por:

rIT = 2,214 / 2,57

(1,089)] = 0,826

64

Para os demais itens organizar-se-ia uma tabela como a Tabela 9:

Tabela 9 - Valores do coeficiente de correlao item-total para os dados do exemplo.


ITEM
1
2
3
4
5
6
7
8
rIT
0,826
15. Verificar se existem itens com coeficiente de correlao item-total prximo de zero ou
negativo. Se existirem esses devem ser eliminados. No exemplo os itens 5 e 8 devem ser
eliminados.
16. Recalcular o escore total de cada indivduo eliminando os itens deficientes. Note-se que
agora os itens a serem levados em conta so seis e no mais oito. Assim, por exemplo, o
escore total do primeiro sujeito passar ser 30, do segundo 28 e assim por diante.
17. Repetir as etapas de 6 a 9 com o objetivo de encontrar o novo coeficiente de
fidedignidade. Para os dados do exemplo, aps a eliminao dos itens 5 e 8 e da realizao do
novo clculo, o coeficiente de fidedignidade passar a ser 0,904.

Na prtica esse procedimento feito, em segundos, por um programa de computador


apropriado. O exemplo detalhado, passo a passo, foi dado com a inteno de facilitar a
compreenso do que significa calcular o coeficiente de fidedgnidade.

Validade16
Enquanto a fidedignidade pr-requisito bsico para qualquer instrumento de
pesquisa, a validade a caracterstica mais importante que ele deve possuir. Isto porque a
validade lida com o relacionamento entre os dados obtidos e o propsito para o qual eles
foram coletados. Deste modo, validade definida como o grau com que o procedimento
realmente mede o que se prope a medir.
A fidedignidade uma etapa que precede a da validade, sendo essencial mesma, e
coloca um limite superior validade do instrumento. Assim, um instrumento com
fidedignidade 0,00 no pode ter qualquer validade; no outro extremo, um instrumento com
validade 1,00 pode possivelmente ser perfeitamente vlido. Para os graus intermedirios de
fidedignidade a validade mxima pode ser estimada a partir da raiz quadrada do coeficiente de
fidedignidade. Entretanto, enquanto a fidedignidade coloca limites na validade, ela no
garantia desta ltima. Por exemplo, pode acontecer que um instrumento com uma
fidedignidade de 0,60 tenha uma validade muito menor que 0,77 0,60 = 0,77 e, de fato,
pode ter nenhuma validade.

Portanto, fidedignidade pr-requisito para que um instrumento seja vlido,


garantindo que ele mede de forma correta, mas isto no garantia de que ele mea o que est
se propondo a medir. A validade deve ser estimada separadamente uma vez que a
fidedignidade do instrumento j tenha sido estabelecida e que os valores encontrados sejam
satisfatrios.
So vrios os tipos de anlise que podem ser feitas de modo a estabelecer a validade
do instrumento. Contudo, no h, como para a fidedignidade, uma forma matemtica de
estabelecer a validade de um instrumento. A seguir so apresentados os vrios tipos de
anlises possveis que levam ao estabelecimento da validade de um instrumento:
16

Adaptado de Fox, 1969.

65

1. Validade de face: este tipo de validade estabelecido a partir da anlise superficial da


natureza do instrumento, isto , pela apresentao do instrumento. Obviamente, este o tipo
de anlise de validade mais fraco.
2. Validade de contedo: mais apropriada que a anterior, esta tcnica de anlise de validade
, muitas vezes, a forma mais adequada disponvel ao pesquisador para analisar certos tipos
de instrumentos , tais como questionrios e entrevistas. Entretanto, uma tcnica que depende
do julgamento de quem faz a anlise de validade o que, sem dvida, seu ponto fraco. Esta
tcnica verifica se o instrumento est medindo o que se prope a medir atravs da anlise,
feita por especialistas no contedo do instrumento, da existncia de razes racionais para a
escolha dos itens do instrumento ou de uma base, lgica ou emprica, para esta escolha.
3. Validade de construo: esta tcnica definida como a habilidade do instrumento de
distinguir grupos para os quais se sabe previamente que se comportam de forma diferentes na
varivel ou construto sob estudo. Em nvel de procedimento, determinar a validade de
construo tem dois estgios. O primeiro consiste na definio de um critrio para identificar
os grupos que diferem no construto que o novo instrumento se prope a medir. O segundo
estgio consiste em administrar o instrumento a estes grupos e determinar se eles diferem
significativamente no novo instrumento tambm. Se assim for, ento tem-se argumento para
defender a validade do novo instrumento.
4. Validade congruente ou concorrente: o pesquisador que oferece validade concorrente ou
congruente apresenta dados de natureza correlacional mostrando que o desempenho no seu
novo instrumento correlaciona-se com o desempenho de algum instrumento de medir a
varivel j existente e aceito como vlido. Se o critrio que est sendo empregado pelo novo
instrumento da mesma famlia que o instrumento antigo se fala em validade congruente. Se,
por outro lado, o critrio empregado de natureza diferente entre os dois instrumentos fala-se
em validade concorrente.
O cerne das validades concorrente e congruente est na relevncia e validade do critrio.
5. Validade preditiva: existe validade preditiva quando o pesquisador pode prever
comportamentos dos respondentes, na rea de interesse da pesquisa, a partir dos dados obtidos
pelo instrumento. Este tipo de processo de validao implica que o pesquisador deva esperar
algum tempo para saber se as predies feitas se concretizaram ou no e em que extenso.
Estes dados podem ser apresentados de vrias formas, dentre elas a correlao entre os
escores preditos e o escore real, porcentagens de predies corretas, etc..

Anlise da Varincia
Como foi visto nas sees sobre Estatstica, a tendncia central (a mdia por exemplo)
no suficiente para distinguir distribuies de freqncia. A mdia aritmtica de duas
amostras, por exemplo, pode ser praticamente a mesma, mas a variabilidade dos escores pode
ser muito diferente.

O teste F - anlise da varincia (anova)


Quando se quer determinar se os escores em uma amostra so mais variveis que os
escores em outra amostra, pode-se usar a tcnica chamada de teste F. Usando o teste F
podemos determinar se a variabilidade em um conjunto de dados significativamente maior

66

que a variabilidade em outro conjunto de dados. Ao conduzir um teste F, usa-se uma medida
da variabilidade chamada de varincia, ao invs do desvio padro. A varincia, em termos
simples, o quadrado do desvio padro.
Para executar um teste F entre duas varincias, simplesmente divide-se a maior
varincia pela menor. Isto d o que chamado de razo F entre as duas varincias. A questo
a responder se a varincia obtida de uma amostra difere significativamente da varincia
obtida em outra amostra. Neste caso, a hiptese nula que no existe diferena entre a
variabilidade dos escores em uma amostra em relao a variabilidade dos escores da outra
amostra. Usa-se ento uma tabela de valores F, existente em livros de Estatstica, para
determinar se rejeita-se ou no a hiptese nula, no nvel de significncia escolhido.
O teste F pode tambm ser usado para analisar a variabilidade entre mdias de escores
de trs ou mais amostras quando se pode assumir que as amostras foram obtidas atravs de
seleo aleatria e a partir de uma populao distribuda normalmente17. O teste F usado para
comparao entre vrias mdias de escores chamado de Anlise da Varincia (ANOVA) e
envolve a comparao de duas varincias estimadas.
O que se pretende comparar uma estimativa da varincia da populao obtida a partir
dos escores dentro de cada amostra com uma estimativa da varincia obtida dos escores
mdios das vrias amostras. Uma das varincias estimadas obtida pela comparao da
varincia estimada para cada uma das amostras separadamente e ento combinando-as de
modo a obter uma estimativa nica chamada de estimativa de varincia dentro dos grupos.
A outra varincia estimada calculada a partir dos escores mdios para cada uma das
amostras e calculando-se a varincia estimada usando-se estes escores mdios e o tamanho da
amostra no clculo. Esta varincia chamada de estimativa de varincia entre os grupos.
O objetivo determinar se a estimativa de varincia entre grupos significativamente
maior que a estimativa de varincia dentro dos grupos. Se a estimativa de varincia entre os
grupos for significativamente maior que a estimativa de varincia dentro dos grupos
poderemos rejeitar a hiptese nula e dizer que as amostras no provm da mesma populao.
De modo a aplicar a anlise da varincia, uma razo F calculada entre as duas varincias
estimadas: usando a varincia entre grupos estimada como numerador e a varincia dentro dos
grupos como denominador. A partir da, usando-se uma tabela de valores F, podemos
determinar, para qualquer tamanho das amostras, a razo F necessria para rejeitar a hiptese
nula, no nvel de significncia especificado.

Exemplo: suponhamos que queiramos determinar se os nveis de iluminao afetam a


produtividade no trabalho em uma empresa de produtos eletrnicos. Para estudar isto
seleciona-se, aleatoriamente, quatro amostras de quarenta empregados cada e os distribu-se
em diferentes nveis de iluminao. Mede-se ento, a produtividade de cada grupo e obtem-se
os dados da Tabela 10.
evidente que a produtividade mdia das quatro amostras diferente. Mas, preciso
saber se a variabilidade entre as mdias amostrais (i.e., a diferena entre as mdias) ocorreu
como resultado de erro de amostragem ou se essa variabilidade pode ser atribuda
quantidade de iluminao.
17

De fato, poderamos usar o teste F para comparao entre duas amostras, mas nesse caso os resultados seriam
idnticos queles do teste t.

67

Tabela 10 - Dados para o


exemplo 1.
Nvel
Valor mdio
I
40
II
38
III
27
IV
26
Neste exemplo, a hiptese nula a ser testada a de que no h diferena na
produtividade dos empregados como resultado dos diferentes nveis de iluminao. Para
determinar isto, ou seja, se pode-se ou no desprezar a hiptese nula, examina-se este
conjunto de dados usando a anlise da varincia. A interpretao dos resultados da anlise da
varincia feita do mesmo modo que aquela do teste t. Suponhamos que a razo F no
exemplo dado seja significativa ao nvel 0,01. Poder-se-ia ento rejeitar a hiptese nula e
concluir que o nvel de iluminao relacionado produtividade.
A inspeo das mdias das amostras diz que a produtividade entre os nveis I e II
difere somente por dois pontos. Da mesma forma, a diferena entre os nveis III e IV
somente de um ponto. A diferena maior aparece entre os nveis II e III. A anlise da
varincia somente nos diz que existe uma diferena geral entre as quatro mdias, porm, no
informa qual dos grupos o responsvel pela diferena significativa. Como ser visto mais
adiante, a anlise de qual a causa da diferena observada feita atravs da Anlise Fatorial
da Varincia. A tcnica de anlise de varincias pode ser usada para a anlise de diferenas
entre qualquer nmero de amostras e tambm aplicvel para a anlise de diferenas entre
grupos dentro de amostras, tais como masculino - feminino ou agrupamentos por idade. No
exemplo, as amostras poderiam ter sido divididas em grupos de empregadas mulheres e
grupos de empregados homens e, alm disso, seria possvel ainda t-los agrupado por idade.
Naturalmente, neste caso seriam necessrios muito mais empregados na amostra. Usando a
anlise de varincias poderiam ter sido examinadas diferenas em produtividade entre sexos,
de acordo coma a idade dos empregados e entre diferentes nveis de iluminao. Isto poderia
ser chamado de anlise de varincias tri-lateral uma vez que poderia ter sido analisada a
produtividade como funo de idade, sexo e quantidade de iluminao.

O mtodo da anlise da varincia


De modo a descrever o mtodo de clculo da razo F ser utilizado outro exemplo.
Suponhamos que um investigador educacional esteja interessado na eficcia relativa de dois
mtodos de ensino, denotados por A1 e A2 Aps selecionar dez estudantes o pesquisador os
divide em dois grupos, aleatoriamente, um experimental e outro de controle. Aps algum
tempo, ele mede a aprendizagem dos sujeitos de ambos os grupos, usando algum tipo de teste.
Os resultados so mostrados na Tabela 11:

Tabela 11 - Dois conjuntos de dados experimentais para um exemplo


hipottico.
2
A1 x
x
A2
x
x2
4
0
0
3
0
0
5
1
1
1
-2
4
3
-1
1
5
2
4

68

X
x2
M

2
6
20

-2
2

4
4

2
4
15

-1
1

10

1
1

Xt=35
10

Mt=3,5

O trabalho a ser feito com os dados acima o de localizar e computar as diferentes


varincias que compem a varincia total. Para calcular a varincia total usa-se a frmula:

Vt =

N 1

onde x2 a soma de quadrados (sq), x=X- X o desvio dos escores mdios e N o nmero
de casos na amostra como um todo. Deste modo, reagrupando os dados da tabela 6.2, sem a
preocupao quanto ao grupo a que o sujeito pertence, obtm-se para a varincia total o valor
de Vt=2,5 (ver a Tabela 12).

Tabela 12 - Clculos de Vt para os dados do


exemplo.
X
x
x2
4
0,5
0,25
5
1,5
2,25
3
-0,5
0,25
2
-1,5
2,25
6
2,5
6,25
3
-0,5
0,25
1
-2,5
6,25
5
1,5
2,25
2
-1,5
2,25
4
0,5
0,25
35
X
M
3,5
2
22,5
x

Observe-se que existe tambm uma varincia entre os grupos, a qual ,


presumivelmente, devida s manipulaes experimentais. Isto , o experimentador fez algo
para um grupo e algo diferente para o outro. Estes tratamentos diferentes poderiam ocasionar
diferenas entre os grupos, expressas pelas mdias diferentes. Deste modo se os grupos forem
diferentes haver uma varincia entre os grupos:

Vb

x
=

2
b

k 1

onde k o nmero de grupos e xb a diferena entre a mdia do grupo e a mdia entre os


grupos. O clculo da varincia entre os grupos, Vb mostrado na Tabela 13.

69

Tabela 13 - Clculos de Vb para os dados do


exemplo 1.
X
x
x2
4
0,5
0,25
3
0,5
0,25
7
X
M
3,5
0,50
x2

Existe ainda uma fonte remanescente de varincia devida ao erro de amostragem.


Leva-se em conta esse tipo de erro quando calcula-se a varincia dentro de cada grupo
separadamente e ento toma-se a mdia desses valores de modo a obter Vw. Para o exemplo:

A1

n A! 1

A2

n A2 1

= 10 / 4 = 2,5
= 10 / 4 = 2,5

A mdia desses valores d Vw =2,5.


Foi dito antes que a varincia total composta de fontes separadas de varincia: a
varincia entre grupos (Vb) e a varincia dentro dos grupos (Vw). Logicamente, essas
varincias deveriam adicionar-se de modo a fornecer a varincia total (Vt). A equao terica
seria ento: Vt = Vb+Vw Como pode-se ver dos dados acima no isso que acontece. A razo
que os graus de liberdade que foram usados nos clculos feitos acima, como
denominadores, ao invs de N, n e k. O clculo das varincias usando-se N, n e k
matematicamente correto porm estatisticamente incorreto. Outro aspecto importante da
anlise a estimativa dos valores para a populao. Pode ser mostrado que usando-se os graus
de liberdade nos denominadores a frmula da varincia dar estimativas imparciais dos
valores da populao, um tpico de grande preocupao estatstica. Deve-se, portanto,
lembrar que varincias, como usadas na anlise de varincias no so aditivas. Somas de
quadrados por outro lado so sempre aditivas. As somas de quadrados tambm so,
naturalmente, uma medida da variabilidade. Exceto na fase final da anlise as somas de
quadrados (sq) so calculadas, estudadas e analisadas.
Comparando a anlise de varincia com o teste t, pode-se dizer que a forma de encarar
o problema conceitualmente similar, com diferenas na metodologia. O mtodo geral:
enquanto diferenas de mais que dois grupos podem ser testadas em termos de significncia
estatstica usando a anlise de varincia o teste t aplica-se somente a dois grupos. A anlise
de varincias para dois grupos fornece os mesmos resultados que o teste t.
A razo formada pela diviso da varincia entre grupos (Vb) pela varincia dentro dos
grupos (Vw) chamada de razo F:
V
F= b
Vw

70

Os valores F dos dados experimentais so calculados e comparados contra uma tabela


de valores F. Se os valores obtidos so maiores ou muito maiores que os valores tabelados,
naquele nvel de significncia estatstica e graus de liberdade, as diferenas expressas por Vb
refletem diferenas significativas. Neste caso, a hiptese nula, de que no h diferena alguma
entre as mdias rejeitada naquele nvel de significncia.
Na prtica podemos calcular a razo F a partir dos escores brutos. No exemplo
precedente, varincias padro foram usadas de modo a mostrar os aspectos fundamentais do
mtodo. Naturalmente, todo esse clculo pode ser feito rapidamente com um aplicativo
apropriado.

Anlise fatorial da varincia


Na anlise fatorial da varincia duas ou mais variveis variam independentemente ou
interagem uma com a outra para produzir variaes na varivel dependente. A anlise fatorial
da varincia o mtodo estatstico que analisa os efeitos independentes e interativos de duas
ou mais variveis independentes em uma varivel dependente.
No passado, muitos pesquisadores (e isto ainda vlido para muitos pesquisadores nos
dias de hoje) acreditavam que o mtodo de pesquisa mais efetivo era permitir que uma
varivel independente evolusse enquanto as demais variveis independentes eram
controladas, tanto quanto possvel. A anlise fatorial da varincia veio mudar esse quadro,
permitindo que se possa analisar o efeito de vrias variveis independentes ao mesmo tempo.
A anlise fatorial serve para vrios propsitos. Primeiro, o delineamento fatorial e a
anlise fatorial da varincia permitem ao pesquisador manipular e controlar duas ou mais
variveis simultaneamente18. Por exemplo, podemos no somente estudar os efeitos de
determinado mtodo de ensino sobre a aprendizagem mas tambm analisar os efeitos,
digamos, de tipos de reforo sobre as respostas. Alm disso podemos controlar as variveis
tais como sexo, inteligncia e classe social.
Variveis que no so manipuladas podem ser controladas. Ao invs do procedimento
disseminado de parear os sujeitos para testes sobre inteligncia ou atitudes, pode-se construir
estas variveis (e muitas outras) em delineamentos com um carter fatorial. No somente
controlar-se estas variveis como tambm obtm-se informao adicional de grande valor e
significncia.

Interao estatstica
Relativamente interao estatstica, a hiptese nula (H0) de que no h interao
entre as variveis independentes, ou seja, de que no existe influncia da combinao de
variveis. Esta hiptese poderia ser chamada de hiptese da diferena constante ou hiptese
dos escores relativos constantes. O que se quer dizer com isto que as diferenas entre
clulas de linhas diferentes permanecero constantes de coluna para coluna; equivalentemente

18

Embora seja possvel o controle de mais que trs variveis, estes delineamentos se tornam pouco prticos
devido dificuldade de obter-se um nmero suficiente de sujeitos de modo a ocupar todas as clulas. A forma
mais simples de uma anlise fatorial de varincia 2 2 2.

71

poder-se-ia dizer que as diferenas entre clulas de colunas diferentes permanecero


constantes de linha para linha.
Como um exemplo, considere-se a Tabela 14, uma hipottica tabela de mdias, de 12
clulas.

Tabela 14 - Dados de um exemplo


onde inexiste interao.
Colunas
L
1
2
3
4
i
3
6
5
7
1
n
2
5
4
6
2
h
5
8
7
9
3
a
s

Este um exemplo tpico de falta de interao. Observe-se que a diferena das mdias
em clulas na segunda linha em relao primeira linha constante e igual a 1 u enquanto
que a diferena entre os valores na primeira linha e os da terceira tambm constante e igual
a 2. As diferenas entre linhas sendo constantes, ento as diferenas entre colunas tambm o
sero. A Figura 5 mostra graficamente o que significa no haver interao entre as variveis.

Linha 1
Linha 2
Linha 3

9
8

Escores
nas clulas

7
6
5
4
3
2
0

Colunas

Figura 5 - Um exemplo onde no h interao.

Como j comentado anteriormente, graficamente a no-interao aparece como linhas


paralelas em um grfico onde representa-se os valores mdios das clulas em cada linha.
Marca-se no grfico, para cada linha da tabela, os valores mdios e ento so ligados por uma
linha. Se no houver interao (hiptese nula) ento as linhas obtidas para cada linha da
tabela no se cruzaro, ou mais precisamente, sero paralelas. No caso de haver algum tipo de
interao ento as linhas no mais sero paralelas, no havendo necessidade de que elas se
cruzem. Um exemplo de interao (fictcio) vai mostrado na Figura 6 a qual uma
representao grfica dos dados da Tabela 15:

72

Tabela 15 - Dados de um exemplo onde existe


interao.
Colunas
1
2
3
4
Linhas
4
5
7
5
1
3
1
4
4
2

Figura 6 - Um exemplo onde existe interao.


Como um ltimo comentrio desta seo, convm discutir o que se entende por anlise
de varincia unilateral e o que se entende por anlise de varincia bilateral. No o nmero
de variveis que se est utilizando que define o tipo de anlise de varincia, o nmero de
classes de variveis utilizadas. Assim, por exemplo, em um determinado experimento analisase a influncia de trs mtodos de ensino diferentes. Estamos, nesse caso faz-se uma anlise
de varincias unilateral, uma vez que as variveis analisadas (mtodos de ensino) pertencem
a uma nica classe (mtodos). Por outro lado, se alm de mtodos de ensino estiverem sendo
analisados diferentes tipos de motivao o caso ser de uma anlise de varincias bilateral,
pois, nesse caso, haver duas classes: mtodos de ensino e tipos de motivao. Esse
exemplo ser discutido na prxima seo de modo a discutir o mtodo propriamente dito.

O mtodo da anlise fatorial da varincia


De modo a estudar-se o mtodo usado na anlise fatorial da varincia apresenta-se a
seguir um exemplo hipottico19.
Um pesquisador est interessado no estudo da influncia de dois fatores na
aprendizagem. O primeiro desses fatores o mtodo de ensino, que pode ser um de dois
mtodos a serem estudados, e que sero denotados por A1 e A2 e o segundo fatores de
motivao, os quais podero ser um de dois possveis, e sero denotados por B1 e B2. Desse
19

Extrado de Kerlinger, 1964.

73

modo os sujeitos so distribudos em clulas para o estudo onde interagem um mtodo de


ensino e um fator de motivao como, por exemplo A1 B2 que nos indica que os sujeitos sero
submetidos ao mtodo de ensino A1 e ao fator de motivao B2 As possibilidades esto
dispostas na Tabela 16. A nossa amostra hipottica composta por oito sujeitos, distribudos
na forma de dois sujeitos por clula.

Tabela 16 - Delineamento fatorial para variveis


mtodo de ensino e motivao.
Mtodos
A1
A2
B1
A1 B1
A2 B1
Motivao
B2
A1 B2
A2 B2

Testes estatsticos paramtricos e no paramtricos


Um tpico central na moderna teoria estatstica a Estatstica Inferencial. A estatstica
inferencial est preocupada em resolver dois tipos de problemas: a estimativa dos parmetros
da populao e testes de hipteses. Na inferncia estatstica a preocupao como tirar
concluses sobre um grande nmero de eventos com base em observaes de uma poro
deles. A Estatstica d ferramentas com as quais formaliza-se e padroniza-se os procedimentos
para tomarmos decises.
Um problema comum em estatstica inferencial o de determinar, em termos de
probabilidades, se as diferenas observadas entre duas amostras significam que as populaes
a partir das quais as amostras so retiradas so realmente diferentes. As diferenas podem
ocorrer apenas devido ao acaso durante o processo de amostragem.
No desenvolvimento dos mtodos estatsticos, as primeiras tcnicas estatsticas de
inferncia que apareceram foram aquelas as quais faziam muitas hipteses sobre a natureza da
populao da qual os escores eram retirados. Uma vez que os valores da populao so
parmetros, estas tcnicas estatsticas foram chamadas de paramtricas20. Por exemplo, a
tcnica de inferncia pode ser baseada na hiptese de que os escores foram retirados de uma
populao cujos escores seguem a distribuio normal. Ou a tcnica pode ser baseada na
hiptese de que os conjuntos de escores foram retirados de populaes tendo a mesma
varincia ou o mesmo espalhamento dos escores.
Mais tarde surgiu um grande nmero de tcnicas estatsticas de inferncia que no
fazem hipteses por demais numerosas ou restritivas sobre os parmetros da populao. Essas
tcnicas, as quais so independentes de distribuio ou no-paramtricas, levam a concluses
que apresentam poucas limitaes. Algumas tcnicas no-paramtricas so chamadas de testes
de ordenamento. Este nome tem origem no fato de que enquanto as tcnicas paramtricas tm
o seu foco central nas diferenas de mdias e varincias, as tcnicas no-paramtricas tm seu
foco no ordenamento dos escores e no em seus valores numricos.

20

A mdia, o desvio padro e a varincia de uma populao, ou qualquer outra medida da populao, so
parmetros.

74

Enquanto um parmetro um valor de uma determinada populao, uma estatstica


por outro lado uma medida calculada de uma amostra. Um teste estatstico no-paramtrico
um teste cujo modelo no especifica condies sobre os parmetros da populao da qual
as amostras foram retiradas.
Quando faz-se alguma afirmativa a respeito da natureza da populao e sobre o
processo de amostragem se est estabelecendo um modelo estatstico. Associado com todo
teste estatstico existe um modelo e uma prescrio de medida; o teste estatstico em questo
vlido sobre certas condies, e o modelo e a prescrio de medida especificam estas
condies. Algumas vezes algumas vezes possvel testar se as condies de um modelo
estatstico particular se encontram presentes mas, muitas vezes, tem-se que tomar por hiptese
a presena dessas condies. Deste modo, as condies de validade de um teste, o modelo
estatstico (ou seja, as hipteses feitas quando da construo do teste), so muitas vezes
chamadas de hipteses do teste.
bvio que quanto menos ou mais fracas forem as hipteses por trs do modelo
subjacente a um teste estatstico menos restries preciso que fazer sobre as concluses
obtidas pelo teste estatstico associado com o modelo. Ou seja, quanto menor ou menos
restringentes forem as hipteses por trs do modelo mais gerais as concluses e/ou resultados
obtidos.
Entretanto, os testes mais poderosos so justamente aqueles que tm as hipteses mais
fortes ou condies mais restritivas. Os testes paramtricos, por exemplo, o teste t ou o teste
F, tm uma variedade de hipteses fortes embasando o seu uso. Quando aquelas hipteses so
vlidas estes testes so os que mais provavelmente rejeitaro a hiptese H0 quando esta
hiptese for falsa.
As condies as quais devem ser satisfeitas para fazer o teste t, o teste mais poderoso
e, de fato, necessrias para que se tenha confiana em qualquer inferncia feita a partir de
resultados obtidos com o teste so:
1. As observaes devem ser independentes com isto se quer dizer que a seleo de
qualquer caso da populao para incluso na amostra no deve influenciar a
probabilidade de incluso de qualquer outro caso. Da mesma forma, o escore atribudo
a um caso no deve influenciar o escore atribudo a outro caso.
2. As observaes devem ser retiradas de uma populao normal - Como visto
anteriormente, uma das hipteses por trs do teste t que a populao segue a
distribuio normal.
3. As varincias das populaes de onde as amostras so retiradas devem ser iguais.
4. As escalas devem ser intervalares ou racionais - isso necessrio para que se possa
executar operaes de carter aritmtico sobre os nmeros representativos dos escores.
5. Aditividade (condio para validade do teste F) as mdias das distribuies
normais devem ser combinaes lineares dos efeitos devidos a colunas e/ou linhas.
Isto , os efeitos devem ser aditivos.
Deste modo, um teste estatstico paramtrico um teste cujo modelo especifica certas
condies sobre os parmetros da populao da qual a amostra foi retirada. Uma vez que
essas condies normalmente no so testadas, elas so assumidas como verdadeiras. A

75

significncia e validade de um teste paramtrico depende do grau de acerto ao supor-se


corretas estas hipteses.
Um teste estatstico no-paramtrico um teste cujo modelo no especifica condies
sobre os parmetros da populao da qual as amostras foram retiradas.
Vrios critrios poderiam ser considerados na escolha de um teste estatstico para uso
quando um processo de tomada de deciso sobre a hiptese de pesquisa est em curso. Estes
critrios so:
1. O poder do teste:
Poder = 1 probabilidade de um erro tipo II.

Isto , a probabilidade de aceitar-se H0 quando de fato ela falsa.


2. A aplicabilidade do modelo estatstico no qual o teste baseado aos dados da
pesquisa.
3. Poder-eficincia - O conceito de poder - eficincia relativo quantidade de aumento
no tamanho da amostra a qual necessria para tornar um teste B to poderoso quanto
um teste A. O poder-eficincia do teste B em relao ao teste A definido por:

NA
NB
onde NA e NB so, respectivamente, os tamanhos das amostras submetidas aos testes A
e B.
PB = 100

4. O nvel da medida obtido na pesquisa.

Vantagens de testes estatsticos no-paramtricos


1. Afirmaes probabilsticas obtidas a partir de testes estatsticos no-paramtricos so
probabilidades exatas.
2. Se os tamanhos das amostras so pequenos (N6) no existe alternativa ao uso de
testes estatsticos no-paramtricos a menos que se conhea exatamente as
caractersticas da distribuio seguida pela populao.
3. Existem testes estatsticos apropriados para tratamento de amostras as quais provm de
vrias populaes diferentes. Nenhum dos testes paramtricos pode manipular dados
deste tipo sem exigir que se acredite em hipteses irrealsticas.
4. H testes estatsticos no-paramtricos para tratar dados os quais so inerentemente
ordinais, isto , o pesquisador apenas capaz de dizer que um sujeito apresenta mais
ou menos de determinada caracterstica, mas no sabe dizer o quanto a mais ou a
menos em relao a outro sujeito.
5. Os testes no-paramtricos so capazes de tratar dados os quais so simplesmente
classificatrios, seguindo uma escala tipo nominal. Nenhum dos testes paramtricos
capaz de lidar com dados com essas caractersticas.

76

6. Por fim, os testes no-paramtricos so mais fceis de aprender e aplicar que os testes
paramtricos.
Entretanto, se todas as hipteses do modelo estatstico paramtrico so de fato
encontradas nos dados e se as medidas so do tipo exigido pelo teste, ento testes estatsticos
no-paramtricos so desnecessrios. Uma medida da necessidade do uso de um teste noparamtrico em uma situao desse tipo dada pelo poder-eficincia do teste noparamtrico. Suponhamos que o poder-eficincia do teste no-paramtrico seja de 90%. Isto
significa que um teste no-paramtrico na mesma situao exigiria somente 10 % da amostra
para ser to efetivo quanto o teste no-paramtrico.

Testes no-paramtricos - o caso de uma amostra


Esta situao acontece quando, aleatoriamente, retira-se uma amostra de determinada
populao e testa-se a hiptese de que essa amostra vem de uma populao com uma
distribuio especificada.
Uma tcnica paramtrica comum no caso de uma amostra usar-se o teste t para a
diferena entre as mdias observada (a da amostra) e esperada (a da populao). Entretanto,
existem muitos tipos de dados para os quais o teste t inaplicvel. Esses fatores de
inaplicabilidade do teste t podem ter vrias fontes, dentre as quais cabe salientar:
1. As hipteses e exigncias para a aplicabilidade do teste no so satisfeitas para os
dados do experimento particular.
2. Pode ser prefervel frente a determinada situao evitar-se as hipteses sobre as quais
o teste t construdo e ganhar-se com isto em generalidade das afirmaes resultantes
da pesquisa.
3. Os dados da pesquisa so, inerentemente, dos tipos nominal ou ordinal e, portanto, no
so passveis de anlise pelo teste t.
4. O pesquisador no est de fato interessado somente em diferenas na localizao, mas
sim em qualquer tipo de diferena no importando a sua origem.
Neste caso o experimentador pode escolher usar um dos seguintes testes estatsticos noparamtricos:
1. O teste binomial: a distribuio binomial a distribuio de amostragem de
propores que podemos observar em amostras retiradas de uma populao composta
por duas classes. Isto , ela fornece os vrios valores os quais podem ocorrer sob H0..
Portanto, quando os escores da pesquisa esto em duas classes, a distribuio binomial
pode ser utilizada para testar H0.
2. O teste 2 para uma amostra: este teste utilizvel quando seeremos analisar dados
os quais caem em mais que duas categorias. Este teste til para decidir se a diferena
observada entre o nmero de objetos que recaem em cada categoria e o nmero
esperado com base na hiptese nula significativa.
3. O teste de Kolmogorov-Smirnov para uma amostra: este teste est preocupado com
o grau de concordncia entre a distribuio de um conjunto de escores observados e

77

alguma previso terica especfica. Ele determina se os escores na amostra podem


razoavelmente serem pensados como vindo de uma populao a qual obedece
distribuio predita teoricamente.
4. Teste do perodo para uma amostra: neste caso se est interessado em saber se os
dados sob anlise provm de uma distribuio aleatria. Ele baseado na seqncia
em que os escore aparecem originalmente, isto , o nmero de perodos que a amostra
apresenta.

Testes no-paramtricos - o caso de duas amostras relacionadas


Testes estatsticos de duas amostras so usados quando o pesquisador deseja
estabelecer se dois tratamentos so diferentes ou se um tratamento melhor do que outro.
Neste tipo de comparao, algumas vezes diferenas significativas so observadas as quais
no resultam do tratamento. Uma maneira de transpor-se a dificuldade imposta por diferenas
estranhas entre os grupos usar duas amostras relacionadas no experimento. Isto , podemos
parear ou relacionar de alguma outra maneira as duas amostras estudadas. Este pareamento
pode ser atingido usando cada sujeito como seu prprio controle, ou pelo pareamento de
sujeitos e ento distribuindo os membros do par aleatoriamente aos grupos de controle e
experimental. Quando o sujeito serve como seu prprio controle ele exposto a ambos os
tratamentos em tempos diferentes. Quando o mtodo do pareamento utilizado, o esforo
para selecionar para cada par de sujeitos indivduos que sejam to iguais quanto possvel na
(s) varivel (eis) estranha (s) a(s) qual (is) pode (m) influenciar o experimento.
Quando possvel, o mtodo de usar cada sujeito como seu prprio controle prefervel
ao mtodo do pareamento. A razo para isto que difcil parear pessoas por
desconhecimento de variveis relevantes as quais determinam o comportamento. O
delineamento de pareamento somente uma boa opo na medida em que o pesquisador seja
hbil em parear os sujeitos, sendo esta habilidade, freqentemente, bastante limitada.
A tcnica paramtrica mais usada para comparaes entre duas amostras
correlacionadas o teste t. Uma diferena de escores pode ser obtida de dois escores
provenientes de cada um dos membros dos sujeitos pareados ou dos escores de cada sujeito
sob as duas condies. O teste t assume que estas diferenas nos escores so normalmente
distribudas em uma populao da qual a populao foi retirada.
Em inmeros casos o teste t inaplicvel. Nestas situaes o pesquisador pode escolher
um dos seguintes testes estatsticos no-paramtricos:
1. O teste de McNemar para a significncia de variaes: este teste particularmente
aplicvel para aqueles delineamentos de antes e depois nos quais cada pessoa
usada como seu prprio controle e em medidas nas quais os escores so obtidos
usando-se variveis nominais ou ordinais. Deste modo, por exemplo, o teste pode ser
usado para testar a efetividade de um tratamento particular (encontro, editorial de um
jornal, propaganda via correio, visita pessoal, etc.) nas preferncias de votos entre
vrios candidatos. Ou ele pode ser usado para averiguar a influncia das migraes do
campo para a cidade na preferncia poltica, e assim por diante.
2. O teste do Sinal: o teste do sinal recebe o seu nome do fato que ele usa como dados os
sinais de mais e menos mais do que medidas quantitativas. Este teste particularmente

78

til para a pesquisa na qual medidas quantitativas so impossveis ou impraticveis,


mas na qual possvel ordenar com respeito um ao outro os membros de pares.
3. O teste de Walsh: se o experimentador puder assumir que a diferena nos escores que
ele observa, em duas amostras relacionadas, provm de populaes que obedecem a
distribuies simtricas, ele pode usar um teste bastante poderoso desenvolvido por
Walsh. Note-se que a hiptese no que as diferenas nos escores so de populaes
normais (para as quais pode-se usar o teste paramtrico t); note-se tambm que as
diferenas tambm no provm da mesma populao. O que o teste faz assumir que
as populaes so simtricas, de modo que a mdia uma adequada medida de
tendncia central e igual mediana.

Testes no-paramtricos - o caso de duas amostras no relacionadas


Quando o uso de duas amostras relacionadas impraticvel ou inapropriado, pode-se
fazer uso de duas amostras independentes. Neste delineamento, as duas amostras podem ser
obtidas por um dos dois mtodos:
1. as amostras podem ser retiradas aleatoriamente de duas populaes,
2. as amostras podem originar-se devido atribuio, aleatria, de dois tratamentos a
membros, cujas origens so arbitrrias, de uma mesma amostra.
Nos dois casos no necessrio que as duas amostras tenham o mesmo tamanho.
A tcnica paramtrica normal de averiguar-se a diferena entre duas amostras no
relacionadas tambm aplicar-se o teste t nas mdias das amostras. No caso da no
aplicabilidade do teste paramtrico (por exemplo, no ter certeza que as distribuies so
normais) o pesquisador pode escolher para analisar os seus dados um dentre vrios testes noparamtricos, os quais so apresentados a seguir.

Teste da probabilidade exata de Fisher


Esta uma tcnica extremamente til para analisar dados discretos quando as duas
amostras independentes tm tamanhos pequenos. Este teste usado quando os escores das
duas amostras independentes, escolhidas aleatoriamente, caem em uma de duas categorias
mutuamente exclusivas. Em outras palavras, todo sujeito em ambos os grupos obtm um de
dois escores possveis. Os escores so representados por freqncias em uma tabela de
contingncia 22, como a Tabela 17.

Tabela 17 - Tabela de contingncia para o teste de


Fischer.

+
Grupo I
A
B
A+B
Grupo II
C
D
C+D
Total
A+C
B+D
N

79

Para os dados nessa tabela (onde A, B, C e D so freqncias) poderia ser determinado


se o Grupo I e o Grupo II diferem significativamente na proporo de mais ou menos
atribudos a eles.
A probabilidade exata de observar-se um particular conjunto de freqncias em uma
tabela 22, quando os totais marginais so mantidos fixos, dada pela distribuio
hipergeomtrica:
A + C B + D

A B
p=
N

A + B
( A + C )! ( B + D)! ( A + B)!(C + D)!
p=

A! C !
B ! D!
N!

Deste modo:
p=

( A + B)!(C + D)!( A + C )!( B + D)!


N ! A! B ! C ! D!

Ou seja, a probabilidade exata da ocorrncia observada obtida tomando-se a razo


entre o produto de fatoriais de quatro totais marginais e o produto dos fatoriais dos escores
encontrados em cada clula por fatorial de N, o nmero total de observaes independentes21.
Exemplo: Considere-se os dados mostrados na Tabela 18:
Tabela 18 - Dados do Exemplo.
+
Grupo I
10
0
10
Grupo II
4
5
9
Total
14
5
19

Nesta tabela, A=10, B=0, C=4 e D=5. Os totais marginais so A+B=10, C+D=9,
A+C=14 e B+D=5. N, o nmero total de observaes independentes, 19. A probabilidade
exata de que estes 19 casos recassem nas clulas do modo como o que foi observado dada
por:

p=

10!9!14!5!
= 0,0108
19!10!0!4 !5!

Portanto determinamos que a probabilidade de obter-se essa distribuio dos escores,


sob H0 , p=0,0108.

21

O fatorial de um nmero a, denotado por a! (l-se a fatorial), obtido pelo produto dos inteiros, comeando
em 1, at o nmero a. Assim, por exemplo: 3!=1x2x3=6. O 0! igual a 1, por definio.

80

O teste 2 para duas amostras independentes


Quando os dados consistem de categorias discretas esse teste pode ser usado para
determinar a significncia estatstica de diferenas entre dois grupos independentes. As
medidas envolvidas podem ser inclusive as de uma escala nominal. Por exemplo, se deseja-se
saber se dois grupos de professores, de Fsica e de Qumica, diferem quanto a sua opinio em
relao a uma certa estratgia de ensino, pode-se medir essa opinio com um simples a
favor ou contra calcular as freqncias e aplicar o teste 2.

O teste da Mediana
Este um procedimento para testar se duas amostras independentes diferem em
tendncia central. Ele fornecer informao de quo provvel que as duas amostras
independentes (no necessariamente de mesmo tamanho) tenham sido retiradas de populaes
com a mesma mediana.

O teste U de Mann-Whitney
Quando dispe-se de pelo menos uma medio ordinal esse teste pode ser usado para
verificar se duas amostras independentes foram tiradas da mesma populao. um dos mais
potentes testes no-paramtricos e uma das melhores alternativas ao teste paramtrico t
quando o pesquisador quer evitar suposies subjacentes ao teste t ou quando a medio feita
mais fraca do que uma escala intervalar (Siegel, 1956, p. 116).

O teste de duas amostras de Kolmogorov-Smirnov


Este tambm um teste para verificar se duas amostras independentes foram retiradas
da mesma populao. A forma bilateral do teste sensvel somente a qualquer tipo de
diferena na distribuio da qual as duas amostras foram retiradas: diferenas em localizao
(tendncia central), em disperso, em simetria, etc.. O teste unilateral utilizado para testar se
os escores de um grupo experimental sero melhores que aqueles do grupo de controle.

O teste de Wald-Wolfowitz
Se quisermos testar a hiptese nula de que duas amostras independentes foram
selecionadas da mesma populao contra a hiptese alternativa de que os dois grupos diferem
completamente poderemos utilizar este teste. Isto , com amostras suficientemente grandes
este teste pode rejeitar H0 se as duas populaes diferirem em qualquer aspecto: tendncia
central, variabilidade, simetria ou algum outro fator. Deste modo, este teste pode ser usado em
uma larga classe de hipteses alternativas. Enquanto muitos testes so endereados a tipos
especficos de diferenas entre dois grupos o teste de Wald-Wolfowitz analisa qualquer tipo
de diferena.

81

O teste de Moses de reaes extremas


Em cincias do comportamento algumas vezes espera-se que uma condio
experimental cause em alguns sujeitos o aparecimento de comportamentos extremos em uma
determinada direo enquanto que em outros sujeitos o comportamento ser extremado na
direo oposta. Deste modo, pode-se pensar que depresso econmica e instabilidade poltica
provocaro em algumas pessoas reaes extremamente conservadoras enquanto que outras
reagiro de uma forma extremamente progressista, em temos de opinies polticas.
O teste de Moses especificamente projetado para uso com dados coletados para
testar esse tipo de hipteses. Ele poderia ser usado quando esperado que a condio
experimental afete alguns sujeitos de um modo e outros de maneira oposta.

O teste da aleatoriedade para duas amostras independentes


Esta uma tcnica no-paramtrica poderosa e til para a testagem da significncia da
diferena entre as mdias de duas amostras independentes quando N1 e N2 so pequenos. Com
o teste da aleatoriedade podemos determinar a probabilidade exata, sob H0, associada com
nossas observaes e podemos faz-lo sem assumir a distribuio normal ou homogeneidade
da varincia nas populaes envolvidas (as quais devem ser assumidas se o teste paramtrico
equivalente, o teste t, for usado).

Discusso
Todos os testes no-paramtricos para duas amostras independentes testam se
provvel que as duas venham da mesma populao. Entretanto, os vrios testes apresentados
so mais ou menos sensveis aos diferentes tipos de diferenas entre as duas amostras. Por
exemplo, quando se quer testar se duas amostras representam populaes que diferem em
localizao (tendncia central), existem testes os quais so mais sensveis a este tipo de
diferena e portanto poderiam ser escolhidos: o teste da mediana, o teste de Fisher (para N
pequeno), o teste U de Mann-Whitney, o teste de Kolmogorov-Smirnov (para duas amostras,
unilateral) e o teste da aleatoriedade. Por outro lado, se fosse desejo do pesquisador
determinar se suas duas amostras provm de populaes as quais diferem em qualquer aspecto
em geral, i.e., localizao ou disperso ou simetria, etc., ele poderia escolher um dos seguintes
testes: o 2, o teste de Kolmogorov-Smirnov (bilateral) ou o teste de Wald-Wolfowitz. A
tcnica restante, o teste de Moses, serve unicamente para testar se um grupo experimental est
exibindo reaes extremas, sejam extremistas ou defensivas, em comparao com as reaes
exibidas por um grupo de controle independente.
A escolha entre os testes que so sensveis a diferenas em localizao so
determinadas pelo tipo de medida obtida na pesquisa e pelo tamanho das amostras. O teste
mais poderoso em termos de localizao o teste da aleatoriedade. Entretanto, este teste pode
ser somente usado quando os tamanhos das amostras forem pequenos e quando tivermos
confiana na natureza numrica da medida obtida. Com grandes amostras ou medidas fracas
(medidas ordinais) a alternativa sugerida o teste U de Mann-Whitney o qual, quase sempre,
mais poderoso que o teste da aleatoriedade. Se as amostras so muito pequenas, o teste de
Kolmogorov-Smirnov levemente mais eficiente que o teste U. Se a medida for de um tipo
tal que significativo somente dicotomizar as observaes acima ou abaixo da mediana, ento
o teste da mediana aplicvel. Este teste no to poderoso quanto o teste U de Mann-

82

Whitney em termos de proteo contra diferenas de localizao mas mais apropriado que
aquele quando os dados das observaes no podem ser completamente hierarquizados. Se o
tamanho das amostras sob considerao for muito pequeno, quando aplicando o teste da
mediana, o pesquisador poderia fazer uso do teste de Fisher.
A escolha entre os testes que so sensveis a todas as diferenas decidida a partir da
intensidade das medidas obtidas, o tamanho das amostras e o poder relativo dos testes
disponveis. O teste 2 apropriado para dados os quais so medidos em escalas nominais ou
mais fortes. Quando N pequeno e os dados esto em uma tabela de contingncia 2x2
poderamos usar o teste de Fisher ao invs do teste 2. Em muitos casos o teste 2 pode no
fazer uso eficiente de toda a informao contida nos dados. Se os escores das populaes
forem continuamente distribudos, ns podemos escolher ou o teste de Kolmogorov-Smirnov
(bilateral) ou o teste de Wald-Wolfwitz ao invs do teste 2. De todos os testes para qualquer
tipo de diferena, o teste de Kolmogorov-Smirnov o mais poderoso. Se ele for usado com
dados os quais no assumem a hiptese de continuidade ele ainda aceitvel mas opera mais
conservadoramente, isto , os valores de p obtidos sero levemente maiores. Se a hiptese
nula for rejeitada a partir desses dados, pode-se seguramente ter confiana na deciso. O teste
de Wald-Wolfwitz tambm protege contra todos os tipos de diferenas mas no to
poderoso quanto o anterior.
Dois pontos devem ser enfatizados sobre o uso de testes do segundo grupo. Primeiro,
quando se est interessados em testar hipteses alternativas de que os grupos diferem em
tendncia central, isto , de que um grupo tem mdia maior que o outro, ento deve-se usar
um teste especificamente projetado para capturar diferenas em localizao, um dos testes do
primeiro grupo listado acima. Segundo, quando rejeita-se a hiptese nula com base em um
teste que capta qualquer tipo de diferena (um dos testes do segundo grupo) deve-se assegurar
de que os dois grupos provm de populaes diferentes, porm no pode-se dizer em que elas
diferem.

Bibliografia
BEST, J. W. (1970). Research in education. 2. ed. Englewood Cliffs: Prentice Hall.
CAMPBELL, D. R.; STANLEY, J. C. (1963). Experimental and quasi-experimental designs
for research on teaching. In Gage, N. L. Handbook of research on teaching, Chap. 5. Chicago:
Rand Mc Nally.
CAMPBELL, D. R.; STANLEY, J. C. (1991). Diseos experimentales y cuasiexperimentales
en la investigacin social. Buenos Aires: Amorrortu Editores.
DARLINGTON, R. B. (1975). Radicals and squares. Ithaca, N. Y.: Logan Hill Press.
ELSEY, F. F. (1967). A first reader in statistics. Belmont, CA: Brooks/Cole Publishing Co.
FOX, D. J. (1969). The research process in education. New York: Holt, Rinehart and
Winston.
GLASS, G. V.; STANLEY, J. C. (1970). Statistical methods in education. Englewood Cliffs,
N. J.: Prentice Hall.
GOWIN, D. B. (1981). Educating. Ithaca, N.Y.: Cornell University Press.
GOWIN, D. B.; ALVAREZ, M. (2005). The art of educating with V diagrams. New York:
Cambridge University Press.

83

KERLINGER, F. N. (1964). Foundations of behavioral research. New York: Holt, Rinehart


and Winston.
KERLINGER, F. N. (1980). Metodologia da pesquisa em cincias sociais. So Paulo: E.P.U.,
EDUSP, INEP.
MILLMAN, J. (1970). Data analysis. Conferncia convidada proferida no Simpsio Nacional
de Professores de Pesquisa Educacional, St. Louis, USA.
MOREIRA, M. A. (2006). Mapas conceituais e diagramas V. Porto Alegre: Editora do Autor.
RUNKEL, P. J.; MC GRATH, J. E. (1972). Research on human behavior. New York: Holt,
Rinehart and Winston.
SIEGEL, S. (1956). Nonparametric statistics for the behavioral sciences. New York:
McGraw-Hill Book Co.
SPIEGEL, M. R. (1973). Statistics. New York: Schaum Publishing Co.