Escolar Documentos
Profissional Documentos
Cultura Documentos
Prefcio
Que minhas primeiras palavras sejam para explicar por que este livro foi escrito, e por que o
escrevi da maneira como ele se apresenta. Ele no surgiu evidentemente de nenhuma
inspirao momentnea. Pelo contrrio, fruto de anos de meditao e a amparar-me tenho a
experincia de mais de vinte anos dedicados orientao e elaborao da anlise estatstica
de muitas centenas de trabalhos de pesquisa, tanto teses como artigos para publicao, e tanto
de minha prpria autoria como de outros pesquisadores, muitos destes bastante experientes
em pesquisa, mas comumente pouco versados em Estatstica. Nesses anos todos, eu era
freqentemente fustigado sempre pela mesma intrigante pergunta: por que teriam as pessoas
tanta dificuldade em entender e em aplicar os mtodos estatsticos, que a mim me pareciam
to lgicos e to simples? Cheguei concluso de que o problema da Estatstica deveria ser o
mesmo da Matemtica - que a grande maioria dos pesquisadores que a mim recorriam
(geralmente da rea biolgica) ia declarando logo de incio detestar cordialmente. Essa
averso generalizada Matemtica estendia-se pois Estatstica porque, por algum motivo, o
conceito de Estatstica parecia-lhes estar intimamente ligado ao de Matemtica. Isso talvez at
seja verdadeiro para quem se dedica a criar, desenvolver ou aperfeioar mtodos e testes
estatsticos, ou at mesmo para quem pretende programar esses testes em computador. Mas
no o para aqueles que so apenas usurios dos mtodos e testes estatsticos, e no os seus
idealizadores ou programadores. Nesse caso, por que a ojeriza generalizada Estatstica? E
por que a maioria das pessoas no conseguia entender os seus mtodos e a sua lgica, no
obstante todas j tivessem feito um ou outro curso de Estatstica em sua vida, s vezes at
mais de um? Por que seria a Estatstica considerada assim to dificil? Cheguei concluso de
que, se a Estatstica no era na verdade to difcil, ento era fatal concluir que, se os
estudantes no conseguiam entend-la, era porque deveria estar sendo ensinada de uma forma
incorreta. Mas, se estava sendo mal ensinada, qual seria a melhor maneira e o modo mais
correto de faz-lo? Muitas horas de meditao levaram-me por fim a desenvolver um mtodo
de ensino da Estatstica, com base nos procedimentos que vinha adotando ao longo dos muitos
anos em que atendi aos que me procuravam para ajud-los a resolver problemas de Estatstica
relacionados com a interpretao dos resultados de seus experimentos. Tratava-se de pessoas
provindas das mais diversas reas do conhecimento humano, de modo que me via forado a
fazer muitas perguntas, para tentar entender o que cada uma pretendia com sua pesquisa.
Assim, acabei descobrindo algo muitssimo importante: para poder ajudar algum de uma
forma eficaz, foroso conhecer o seu trabalho tanto quanto ele prprio, ou provavelmente
at mais do que ele. Desse modo, com base nas perguntas que fazia, e nas respostas que
costumava receber de meus consulentes, acabei aprendendo onde residiam as dvidas da
maioria das pessoas no afeitas aos mtodos estatsticos, e o que deveria ensinar-lhes, para
que futuramente fossem capazes de resolver elas prprias os seus problemas. Esse mtodo
muito simples: consiste apenas em ensinar alguns poucos conceitos fundamentais e, a partir
destes, traar um roteiro lgico que habilite as pessoas no propriamente a deduzir frmulas
ou a realizar clculos matemticos, mas sim a reconhecer o modelo matemtico em que se
enquadram os seus experimentos e, com base nessas premissas, a decidirem elas mesmas
sobre qual o teste estatstico mais adequado ao tratamento estatstico dos seus dados
experimentais, a fim de poderem interpretar corretamente os seus resultados, evidenciar o seu
verdadeiro valor e a sua real importncia e, finalmente, tirar deles concluses substanciais,
pertinentes e relevantes. Esse pois o objetivo deste livro.
2
1. A primeira pergunta
A primeira pergunta que um estaticista faz ao seu consulente e que este deveria estar apto a
responder esta: Qual (ou o qu) a sua varivel? Parece fcil, mas posso garantir, com
base em minha experincia pessoal de muitos anos, que poucos daro uma resposta correta a
essa indagao to simples. Alguns diro coisas como esta: "Usei trs marcas diferentes de
gessos, dois mtodos diferentes de manipulao e quatro propores diferentes de gua / p"
ou qualquer coisa semelhante, que varia conforme o campo de atividade do pesquisador.
Assim, na opinio do pesquisador do exemplo acima, estaramos diante de um experimento
com trs variveis: a marca do gesso, a tcnica de manipulao e a proporo gua / p.
Porm, na verdade, nada disso constitui a varivel do trabalho em questo. Mas bastante
comum que, quando o estaticista diz isso ao seu consulente, este arregale os olhos de espanto.
A identificao da varivel.
3
permite a comparao entre todas as combinaes possveis das marcas de gesso, tcnicas de
manipulao e propores de gua/p utilizadas na pesquisa.
E agora, entre as duas novas fraes abaixo, qual seria a de maior grandeza ?
Agora sim, tomou-se muito fcil garantir que a segunda frao maior do que a primeira,
mesmo que os nmeros envolvidos no segundo exemplo sejam muito maiores que os do
primeiro e isso sem precisar fazer mais do que um simples exame visual das duas fraes.
Mas... por que seria assim? Na verdade as duas fraes do primeiro conjunto so exatamente
iguais s duas fraes do segundo conjunto. A nica diferena que, neste ltimo, as fraes
foram reduzidas ao mesmo denominador, calculando-se o seu denominador comum, uma
tarefa matemtica elementar, que aprendemos no curso primrio, ao estudarmos fraes
ordinrias. A varivel de um experimento pois o denominador comum ou seja, o termo
de comparao que permite cotejar seja l o que for que queiramos comparar. Por isso tem
de ser nica ou ento cairamos no caso do primeiro conjunto de fraes ordinrias mostrado
em nosso exemplo matemtico, em que os denominadores so diferentes.
Fatores de variao.
Muito bem, mas se, na pesquisa sobre gessos que estamos adotando como exemplo no
presente captulo, a varivel a dureza dos corpos-de-prova, o que seriam afinal as marcas de
4
gesso, as tcnicas de manipulao e as propores gua / p? evidente que tudo isso
importante, ou no seria considerado na pesquisa. Na verdade, so exatamente esses fatores
que fazem com que a varivel dureza realmente varie. So portanto fatores de variao.Os
fatores de variao, ao contrrio da varivel, podem ser mltiplos, no havendo teoricamente
um limite para o seu nmero. A experincia, porm, bem como o bom-senso que costuma
dela advir, aconselha que esse nmero no deva ser superior a trs, e a razo disso ser
analisada quando se falar sobre algo muito importante em Estatstica, que so as interaes
entre os diversos fatores de variao.
Resumindo o que foi dito at agora, podemos finalmente indicar os dois primeiros passos a
serem dados na preparao da anlise estatstica dos dados experimentais de uma pesquisa,
seja esta qual for, esteja ela ainda na fase inicial de planejamento, ou j no seu final, com
todos os experimentos realizados e todos os dados experimentais obtidos e convenientemente
anotados nos protocolos elaborados para o registro das observaes. Esses dois passos iniciais
so:
2. Tipos de variveis
Variveis contnuas e discretas.
Variveis ordenadas.
Mas os tipos de variveis no se esgotam com esses dois, que na verdade so os mais
comuns porm no os nicos. De fato, pesquisas existem em que a nica caracterstica dos
dados experimentais que poderia ser usada para classific-los o fato de eles poderem ser
ordenados, de forma crescente ou decrescente. o caso, por exemplo, de um experimento em
que se queira avaliar a intensidade dolorosa, ou a positividade de um teste para sfilis ou
qualquer outra doena, usando grupos de sinais (+) para graduar a dor ou a positividade do
teste: (++++) maior que (+++) maior que (++) maior que (+), alm do caso negativo (-).
6
Os escores (variveis subjetivas).
Um recurso muito usado nesse caso para quantificar os dados substituir os sinais por
nmeros: 4, 3, 2, 1 e 0. Esse tipo de graduao (ou de notas, ou de escores) tambm bastante
usado, quando os dados experimentais traduzem apenas uma impresso subjetiva ou a opinio
pessoal visual, por exemplo de um grupo de observadores a respeito de um fenmeno
qualquer que esteja sendo estudado. Na opinio do autor destas linhas os escores, dada a sua
natureza subjetiva, no uma varivel muito forte, mas situaes e tipos de pesquisa h em
que no h alternativa seno us-los.
Variveis nominais.
Alm disso, as variveis podem ser tambm nominais, como em experimentos que
envolvem perguntas que s admitem duas respostas: sim ou no. Tambm neste caso, os
dados nominais acabam se tornando numricos quando se consideram o nmero de respostas
sim e o de respostas no. Isso significa que, mesmo quando a pesquisa envolve dados de
natureza apenas qualitativa, esses dados tero forosamente de ser transformados em dados
quantitativos, para poderem ser analisados estatisticamente.
Outra caracterstica importante dos dados experimentais, que deve ser levada em conta, se
eles so independentes ou vinculados (dependentes), que sero comentados mais adiante, com
maiores detalhes.
O terceiro passo.
necessrio, pois, saber tambm, desde o incio da pesquisa, quais as caractersticas e qual
o tipo de varivel utilizado, porque essas informaes iro sem dvida condicionar o uso de
um ou de outro grupo de testes estatsticos, por ocasio do tratamento dos dados
experimentais, com vistas interpretao correta dos resultados da pesquisa. Este seria
portanto o terceiro passo de nosso roteiro para o planejamento estatstico:
7
3. As repeties
Experimento com uma nica observao.
Imaginemos que, num experimento qualquer, se fizesse apenas uma nica observao. Esse
experimento, evidente, no teria um valor numrico mdio, ou uma mdia, porque no
haveria valores que se pudessem somar, nem um nmero pelo qual a soma desses valores
pudesse ser dividido para calcular essa mdia. Enfim, em ltima instncia, a soma dos dados
(digamos assim) seria igual ao prprio valor nico, e o nmero de dados seria 1, de forma que
o valor do dado dividido por 1 seria o seu prprio valor original. Levando esse raciocnio ad
absurdum, diramos ento que o valor do dado seria exatamente igual ao valor da mdia. Isso
seria timo, poderia pensar algum menos avisado. No, no seria. Na verdade, seria pssimo,
at mesmo desastroso. Isto porque, se o valor medido estivesse errado, tudo mais estaria
tambm errado, inclusive quaisquer eventuais concluses que se pudessem tirar desse
resultado falso.
Do que foi exposto no item anterior, depreende-se que a mdia tende a aproximar os
valores errados do valor real daquilo que se mede. Isto porque a mdia uma espcie de
8
limite central, para o qual tendem naturalmente a convergir os erros de medida, considerando
que estes podem ser para maior ou para menor, em relao ao valor real daquilo que
medido. Enfim, se no houvesse erro nenhum de medida, todas as medidas efetuadas seriam
iguais mdia, pois no haveria diferenas nem para maior, nem para menor, em relao ao
valor real. por esse motivo que os matemticos chamam a mdia de esperana matemtica,
porque a mdia o valor que se esperaria obter, caso no houvesse erros e todos os valores
medidos fossem iguais.
O nmero de dados.
De tudo o que se exps acima, pode-se concluir que, quanto maior o nmero de repeties,
tanto mais o valor mdio se aproximar do valor real, o que absolutamente verdadeiro.
Porm preciso considerar que o nmero de repeties pode teoricamente estender-se desde 2
at o infinito. Contudo, um nmero infinito de observaes, ou de medidas, absolutamente
impraticvel. Alis, mesmo considerando um nmero de medidas finito porm
demasiadamente grande, ainda que fosse praticvel, no seria todavia prtico.
Deve existir portanto um nmero de repeties que, mesmo sendo finito, e por isso mesmo
limitado, seja capaz de permitir que se possam tirar concluses vlidas a respeito de um
fenmeno qualquer que se queira estudar. A Estatstica procurou resolver esse problema pela
associao de duas coisas cujos nomes nos habituamos a ouvir a toda hora, quando lidamos
com testes estatsticos: a amostragem e a probabilidade. A significncia dos valores
calculados pelos diversos testes estatsticos que algo tambm comumente ouvido e
discutido em Estatstica em ltima anlise no mais do que a probabilidade de serem
corretas as concluses tiradas a partir de amostras de dimenses limitadas, reduzidas, retiradas
de conjuntos de dados s vezes infinitamente maiores do que a prpria amostra analisada
pelos testes.
O quarto passo.
9
4. As repeties e o experimento-piloto
Mas como fazer esse clculo? Que leis regem a escolha desse nmero? A isto, sim,
possvel responder: o que rege a escolha do nmero de repeties mais adequado a um
experimento qualquer a variabilidade dos seus dados experimentais. Mas poder objetar
algum se o experimento ainda no foi realizado, como se pode conhecer o seu grau de
variao, ou avaliar a sua variabilidade? precisamente a que entram dois novos elementos
igualmente muito importantes na execuo de qualquer experimento: o experimento piloto e a
verificao preliminar da variabilidade dos dados experimentais.
O experimento piloto.
10
bastante comum a escolha de 3 repeties, como um bom nmero para comear. Isto
porque o nmero 3 evita a invariabilidade do nmero 1, foge ao perigo da repetio
coincidente representado pelo nmero 2, e j apresenta alguma variao, a qual no mais das
vezes j suficiente para testar a variabilidade determinada pelos fatores de variao e pelas
prprias repeties.
Esse teste do tipo iterativo e requer um programa de computador, pois de outra forma ele
seria muito demorado e trabalhoso. O teste chamado iterativo porque, partindo do nmero
inicial de repeties do experimento-piloto, ele calcula um novo nmero de repeties, e volta
a introduzir no teste esse nmero calculado, guisa de novo valor inicial, recalculando tudo e
achando outro nmero de repeties. Assim, sucessivamente, vai recalculando at que o
nmero de entrada do teste seja igual ao nmero de sada. Quando essa igualdade ocorre, o
teste dado por terminado, e esse ltimo nmero de repeties constitui o nmero mais
adequado de repeties para aquele experimento. O teste sugere pois que, para aquela
variao detectada pelo experimento-piloto, necessrio aquele nmero mnimo de rplicas,
para que se possam perceber diferenas estatisticamente significantes entre os fatores de
variao estudados
11
5. O experimento fatorial
Uma vez definida a varivel, estabelecidos os fatores de variao, e fixado o nmero de
repeties necessrio para possibilitar a deteco de possveis diferenas significantes entre os
fatores de variao, tem-se perfeitamente delineado todo o plano da pesquisa. A partir dessas
informaes, torna-se possvel conhecer uma srie de detalhes importantes, tanto no que
respeita ao experimento em si como anlise estatstica posterior dos dados.
A essa altura da pesquisa, j possvel calcular o nmero total de dados (n) a ser obtido
aps realizados todos os experimentos. Esse nmero fornecido pela multiplicao do
nmero de colunas (c), pelo de linhas (l), pelo de blocos (b), e pelo de repeties (r).
Matematicamente, poderamos represent-lo pela seguinte igualdade:
A expresso matemtica acima transcrita vale sempre, mesmo que falte um ou mais dos
seus fatores. S que, quando falta qualquer dos fatores, este jamais ser igual a zero (0) mas
igual a um (1), uma vez que, se fosse igual a zero (0), o produto todo se anularia, e o nmero
total de dados seria igual a zero. Assim, quando um fator no existe, ele no existe apenas
aparentemente, porque na verdade existe sim, porm possui apenas um elemento, sendo
portanto realmente igual a um (1). Desse modo, se um experimento apresenta apenas um fator
de variao (colunas), alm das repeties (que devem existir sempre), a expresso do nmero
de dados ser fornecida pela igualdade:
que equivale a
12
uma vez que a multiplicao por um (1) no altera o produto. O mesmo ocorre, se houver
apenas dois fatores (colunas e linhas), caso em que o nmero de dados ser:
A nica alternativa que jamais poder ocorrer a existncia apenas de blocos como fator de
variao, porque, por definio, bloco um conjunto de colunas e linhas. Se estas forem
ambas iguais a um (1), a idia de bloco se confundiria com a de coluna, porque haveria ento
apenas um fator de variao. O mesmo pode-se dizer em relao a um experimento que
envolva apenas o fator de variao linhas, uma vez que neste caso seria indiferente colocar as
repeties em cada linha ou em cada coluna.
Por conveno, ou apenas por hbito, comum reunir os dados da seguinte maneira:
13
6. A tabela geral de dados
O prprio ttulo deste captulo j sugere claramente que a tabela com os dados
experimentais deva ser abrangente, nica e completa. Ou, em outras palavras, todos os dados
obtidos devem estar contidos numa tabela nica, na qual constem todos os elementos que
compem o fator de variao colocado nas colunas, todos os que compem as linhas, e todos
os que integram os blocos, alm, claro, de todas as repeties. A maneira como esses trs
fatores so distribudos (como colunas, linhas ou blocos) depende muito do espao fsico
disponvel, principalmente considerando que modernamente as tabelas so comumente
elaboradas em computador, nos quais o espao limitado, principalmente no sentido
horizontal da tela do monitor, ou seja em relao ao espao destinado s colunas. Quanto s
linhas e blocos, caso seja necessrio, podem alongar-se no sentido vertical, podendo passar
pgina seguinte, e portanto sem qualquer problema de limitao do espao. O ideal, contudo,
seria que a tabela geral de dados ocupasse apenas uma pgina, pois isso permitiria o exame
visual do conjunto de dados experimentais todos de uma s vez. Isso pode ser conseguido,
inclusive em computadores, pela reduo do tamanho dos caracteres, o que permite escrever
um nmero maior de caracteres por linha, na tela do monitor, e tambm no papel quando a
tabela impressa. Quando o nmero de colunas pequeno, os blocos podero ser colocados
lado a lado (no sentido horizontal, se o espao permitir, de modo que a tabela ter,
verticalmente, a extenso dada pelo nmero de linhas e de repeties. Se o nmero de colunas
da tabela for muito grande, ocupando uma grande extenso horizontal, inviabilizando a
colocao dos blocos lado a lado, estes podero ser colocados no sentido vertical, um
embaixo do outro. Neste caso, a extenso vertical ser dada pelo nmero de linhas
multiplicado pelo nmero de blocos e de repeties. Em suma, confeccionar tabelas , na
verdade, uma questo de prtica, uma vez que esta acaba habilitando o pesquisador a decidir
rapidamente sobre qual a melhor conformao fsica para qualquer tabela de dados que tenha
eventualmente de construir. O que foi dito acima apenas uma sugesto de como comear, a
fim de vir um dia a adquirir essa prtica. A seguir, esto transcritos alguns modelos de tabelas
de dados, identificadas estas por letras maisculas. Por exemplo, tecnicamente, no se pode
dizer que haja diferena entre as tabelas A, B, C e D.
14
A nica diferena entre as tabelas A e B reside no fato de as repeties, na tabela B, terem
sido divididas em dois grupos de cinco, dentro da mesma coluna, ao invs de um s grupo
com todas as dez repeties, como se v na tabela A. A diferena entre essas duas primeiras
tabelas (A e B) em relao s duas outras (C e D) est no fato de as repeties nestas ltimas
terem sido dispostas em linhas, e no em colunas, como nas duas primeiras. Por seu turno, a
15
diferena entre as tabelas C e D est tambm na sua disposio em dois grupos de cinco
repeties para cada linha, na tabela D, e em apenas um grupo com as dez repeties, na
tabela C. A opo por qualquer desses quatro tipos de tabelas apenas uma questo de
convenincia, tal como a disponibilidade de espao em funo do nmero de colunas ou de
linhas, ou a maior facilidade ou comodidade na introduo dos dados numricos no
computador, ou s vezes at mesmo por simples convenincia esttica. Porm, do ponto de
vista puramente tcnico, todos os quatro tipos de tabelas apresentados so aceitveis para esse
modelo matemtico de experimentos, que envolve apenas um fator de variao, esteja este
colocado em colunas ou em linhas. Todavia, por uma espcie de conveno, costume dispor
os dados em colunas, e no em linhas, quando h apenas um nico fator de variao, tal como
se fez nas tabelas A e B. Mas como ficaria uma tabela que envolvesse tanto colunas como
linhas? Imagine-se, por exemplo, um modelo experimental que envolvesse quatro
Tratamentos aplicados a dois grupos de pacientes (Controle e Tratado), com cinco repeties
(pacientes) em cada grupo. Como seria a tabela para esses dados experimentais? Poderia ser
assim:
16
nada probe que qualquer dos fatores de variao possa ser colocado indiferentemente nas
colunas ou nas linhas. uma simples questo de convenincia grfica. A nica exigncia
que as repeties fiquem reunidas na clula da tabela que corresponde ao cruzamento de uma
linha com uma coluna. Contudo, h ainda mais um elemento que pode complicar a elaborao
de uma tabela de dados: a existncia de blocos, ou seja, de um terceiro fator de variao.
Quando isso ocorre, cada bloco ser uma reedio do modelo para colunas e linhas
reproduzido acima, e envolver tantas novas tabelas (com colunas e linhas) quantos forem os
elementos que compem o fator de variao a que os blocos se referem. Por exemplo:
imagine-se que, alm dos Tratamentos (A, B, C e D) e dos Grupos experimentais (Controle e
Tratado), a pesquisa envolva tambm trs Tempos de observao (1, 3 e 7 dias). Como ficaria
a nova tabela de dados, nesse caso? Ainda nesse caso, o critrio que vigora apenas a
convenincia grfica, para decidir qual fator de variao ser colocado nas colunas, qual
estar nas linhas, e qual ficar nos blocos. , portanto, pura questo de bom-senso, associado
ao bom-gosto, ou ao senso esttico de cada um, os quais podem ser comentados e at
criticados, mas sem dvida jamais ensinados. Na pgina seguinte h uma sugesto para a
construo da tabela com os trs fatores de variao acima mencionados. Essa tabela
ilustrativa foi deixada deliberadamente vazia, sem nenhum dado numrico transcrito, com o
propsito nico de mostrar que uma tabela vazia de dados pode perfeitamente ser elaborada
antes mesmo que qualquer dado experimental tenha sido obtido. medida que a pesquisa vai
se desenvolvendo, os dados iro surgindo e sero anotados na tabela vazia, at preench-la
toda quando do final da pesquisa. Para elaborar a tabela vazia, basta saber e isso sempre
possvel quantos so os fatores de variao, quantos elementos integram cada um deles, e
qual o nmero de repeties estabelecido.
17
Como observao derradeira no que diz respeito s tabelas, e tomando como exemplo a
tabela transcrita acima, preciso esclarecer que se consideram como pertencentes mesma
linha todas as repeties que se referem mesmo Tratamento, incluindo-se a as repeties de
todas as colunas e de todos os blocos desse Tratamento. Da mesma forma, consideram-se
como pertencentes mesma coluna todas as repeties relativas a cada um dos Tempos,
independentemente das linhas e dos blocos a que estejam ligadas. E, por fim, pertencem
tambm ao mesmo bloco todas as repeties de cada um dos grupos (Controle e Tratado, no
caso da tabela que serve de exemplo), sem considerar as linhas e as colunas de cada grupo.
Em resumo: cada Tratamento (linha) teria, na verdade, 30 repeties; cada Tempo (coluna)
teria 40 repeties; e cada Grupo experimental (blocos Controle e Tratado) teria 60
repeties. O produto do nmero de elementos de cada fator de variao pelo nmero de
repeties correspondente d sempre o mesmo nmero, que o nmero total de dados
experimentais: 4 x 30 = 120, 3 x 40 = 120; e 2 x 60 = 120. Esse conceito de repeties em
relao aos fatores de variao importantssimo em Estatstica, pois ele que permite avaliar
o efeito exercido exclusivamente pelo fator de variao sobre o valor numrico da varivel
estudada, ou seja, sobre o valor do dado experimental, separando-o dos efeitos determinados
pelas chamadas interaes, efeitos esses que resultam da associao de cada um dos fatores de
18
variao com os demais, combinao essa que pode muitas vezes alterar o efeito produzido
por qualquer dos fatores de variao, quando considerado individualmente (ou separadamente
7. A fase ps-experimental
Ficou dito, em captulos anteriores, que o tratamento estatstico deve ser cogitado j nos
primrdios da pesquisa, quando ainda se est na elaborao do seu projeto inicial, ou mesmo
durante a fase de execuo do plano-piloto dos experimentos. De fato, h muita coisa que j
pode ser pensada e estudada nessas fases iniciais, em termos de tratamento estatstico dos
dados. Porm h tambm outros detalhes que somente podem ser considerados aps ter em
mos os dados numricos colhidos nos ensaios. Entre as coisas que podem ser verificadas
ainda na fase inicial da pesquisa est a vinculao, ou independncia, dos dados
experimentais, mas o conhecimento desse pormenor ainda no to relevante a essa altura do
desenvolvimento da pesquisa, ou de seu tratamento estatstico. Mas se-lo- mais adiante,
ocasio em que o assunto ser abordado novamente, tecendo-se ento sobre ele consideraes
mais elaboradas.
Muito mais importante, todavia, seria analisar agora a distribuio de freqncias dos dados
experimentais; ou, mais apropriadamente, estudar a maneira como os erros desses dados se
distribuem em torno da mdia. Enfim, preciso saber se a distribuio dos erros
experimentais em torno da mdia normal, ou seja, se o seu histograma de freqncias segue
a configurao geral da curva matemtica conhecida como curva normal.
Mas... podero perguntar os eventuais leitores deste texto, por que isso seria assim to
importante? A resposta : porque os primeiros testes estatsticos, talvez os mais importantes
de quantos foram desenvolvidos pelos estudiosos, tiveram por premissa que a distribuio dos
erros deveria ser normal, ou seja, que ela deveria ter uma distribuio de freqncias
semelhante da curva de Gauss, tambm chamada curva normal ou curva dos erros.
19
Figura 1. Histograma de freqncias de um conjunto de dados experimentais, sobreposto curva normal
matemtica com a mesma media e o mesmo desvio-padro.
A denominao curva de Gauss explica-se porque foi esse notvel matemtico alemo
quem encontrou a sua equao matemtica. Da mesma forma, a expresso curva dos erros
tambm se justifica, porque Gauss deduziu a sua equao matemtica precisamente a partir de
estudos realizados sobre a distribuio dos erros de medida em torno da mdia, ou seja, a lei
matemtica que regia a disperso e o afastamento dos valores de medida em relao ao seu
valor mdio; ou, mais exatamente, em relao ao valor real da grandeza medida. Sim, tudo
isso compreensvel. Mas por que essa curva seria chamada normal?
Na verdade, eu no sei nem nunca li qualquer explicao racional para isso. Acredito,
porm, que essa denominao tenha algo a ver com os fenmenos naturais, tal como ocorre
com outras curvas matemticas, que traduzem fenmenos normalmente encontrados na
natureza. o caso, por exemplo, da curva chamada catenria (do latim catena = cadeia,
corrente), cuja equao expressa matematicamente a curva natural descrita por uma corrente
metlica, quando presa pelas extremidades e submetida ao do prprio peso.
Agora, caros leitores, mentalizem, por exemplo, uma ampulheta e pensem: qual seria a
equao matemtica que descreve o perfil do montculo de areia que flui dentro dela e se
deposita no seu compartimento inferior? Ou qual seria a equao matemtica capaz de
descrever o perfil do montculo que se forma, quando se despeja sobre o solo um saco de
gros de um cereal qualquer? Eu pessoalmente estou convencido de que, muito
provavelmente, seria uma curva dessa famlia de curvas conhecidas como curvas normais.
Talvez derive da a denominao normal atribuda a esse tipo de curva
Quando a curva normal tem desvio-padro igual a 1, tal como ocorre na curva matemtica
terica, ela chamada de mesocrtica (do grego mesos = mdio) + crtica.
Todavia, quando o desvio-padro tem valores entre 0 e -1, ou entre 0 e +1, a curva torna-se
espigada, alta e estreita, porque os dados tendem a aglomerar-se junto mdia, sendo
exatamente esse pormenor que determina o pequeno valor do desvio-padro. Quando ocorre
esse alongamento vertical no centro da curva normal, e ao mesmo tempo o seu estreitamento
no sentido horizontal, a curva dita leptocrtica, do grego (lepts = delgado, fino) + crtica.
Por seu turno, se os dados apresentarem valores muito afastados do valor da mdia, esse
detalhe faz aumentar por sua vez o valor do desvio-padro, provocando ao mesmo tempo o
alongamento horizontal da curva normal e o seu achatamento no sentido vertical. A curva
normal ento dita platicrtica, palavra igualmente derivada do grego ( platys = largo, amplo)
+ crtica.
Essas deformaes tendem a dificultar, ou mesmo a impedir, comparaes entre os efeitos
dos fatores de variao sobre a varivel estudada, de tal forma que muito comumente
preciso realizar transformaes dos dados, para tornar factvel a sua anlise estatstica.
Em pginas anteriores, foram feitas duas assertivas, a respeito da curva normal, que so
muito importantes:
1. que a mdia o ponto onde a funo atinge o seu valor mximo, ou seja, onde a
freqncia da distribuio atinge o seu ponto mais elevado; e
2. que o desvio-padro marca o lugar onde a curva normal muda de cncava para
convexa, ou seja, onde sofre uma inflexo.
22
Em geral, os testes utilizados para a finalidade de verificar a normalidade (ou no-
normalidade) da distribuio dos dados experimentais apenas esclarecem qual a probabilidade
de a distribuio testada ser normal, mas quem decide se essa probabilidade aceitvel ou no
o prprio pesquisador. Comumente, adota-se o limite de 5 por cento para a aceitao da
normalidade, mas quanto maior for essa probabilidade, tanto melhor. O que no se pode fazer
de modo algum aceitar probabilidades menores que 5 por cento, pois isso indicaria que a
diferena entre a distribuio experimental significantemente diferente da distribuio
normal padro, ao nvel de 5 por cento de probabilidade.
Observem os meus leitores que o oposto de curva normal no curva anormal, mas sim
curva no-normal, e o mesmo se pode dizer em relao distribuio normal.
Essa expresso demonstra que a mdia geral est presente em todos os dados da amostra,
na qualidade de grandeza fixa, constante, ao passo que todos os demais smbolos representam
grandezas variveis. Isso quer dizer que, se no houvesse variao alguma, todas estas
grandezas variveis seriam iguais a zero e, em conseqncia, todos os dados seriam iguais
23
mdia. Desse modo, fica evidente que todas essas grandezas variveis, por representarem
diferenas em relao mdia, devem ser consideradas tambm erros experimentais.
Erros controlados.
O termo varincia j apareceu diversas vezes neste texto. O que seria varincia, afinal de
contas? Eu poderia dizer que varincia o quadrado do desvio-padro. Contudo ressalvaria
que essa afirmativa, ainda que matematicamente correta, todavia estatisticamente incorreta.
Isto porque, na verdade, o que se calcula primeiro a varincia da amostra. S depois que se
extrai a sua raiz quadrada, para conhecer o desvio-padro, o qual, por isso mesmo, tem duplo
sinal: + ou - (s).
24
Varincia e graus de liberdade.
Tecnicamente, a varincia vem a ser a soma de todos os desvios dos dados amostrais, em
relao mdia, elevados ao quadrado, soma essa que depois dividida por (n-1), ou seja,
pelo nmero de graus de liberdade da amostra. Graus de liberdade, por sua vez, no mais
que o nmero total de dados da amostra, menos 1. Por que esses desvios so elevados ao
quadrado? E por que se divide por (n-1), e no simplesmente por n? As respostas a essas duas
perguntas parecem-me simples:
Isso compreendido, percebe-se que dividir pelo nmero de graus de liberdade significa
dividir pelo nmero de espaos entre os dados, e no pelo nmero de dados. A razo de se
fazer isso em Estatstica que os estudiosos da Cincia Estatstica descobriram que essa
operao conduzia a resultados mais coerentes do que a diviso por n, pura e simplesmente.
Varincia e desvio-padro.
Como j foi dito em captulos anteriores, a aplicao dos testes paramtricos exige, alm da
normalidade da distribuio dos erros amostrais, que as varincias sejam homogneas e que
os efeitos dos fatores de variao sejam aditivos; ou, em outras palavras, que sejam passveis
de serem somados uns aos outros, tal como indicam os sinais (+), presentes na expresso
matemtica transcrita no captulo anterior. Esses efeitos no devem ser, por exemplo,
multiplicativos. Sim, mas quando esses efeitos poderiam ser multiplicativos?
A resposta tambm nesse caso simples, como ademais so simples todas as respostas,
uma vez que sejam conhecidas, o que nem sempre possvel e nem sempre acontece, um fato
25
igualmente simples, que alis constitui a prpria razo de existir da pesquisa cientfica.
Os efeitos de dois ou mais fatores de variao so ditos no-aditivos quando, na associao
de um ou mais desses fatores, em vez de se somarem, esses efeitos se multiplicam, de tal
forma que o efeito resultante pode ser ampliado (quando o fator multiplicativo maior que 1),
ou reduzido (quando esse fator menor que 1). o que comumente ocorre nas chamadas
interaes entre dois ou mais fatores de variao.
Importncia da aditividade.
A aditividade talvez seja a menos rigorosa das restries que se fazem, quando do emprego
da estatstica paramtrica, porque se referem s interaes entre os fatores de variao, e no
aos prprios fatores em si mesmos. Mas no pode ser negligenciada, uma vez que a no-
aditividade pode modificar o valor do erro no-controlado, inflando-o ou reduzindo-o,
dependendo essa alternativa de suas dimenses, ou de sua significncia. Esse inconveniente
deve ter ocorrido muitas vezes no passado, quando o efeito das interaes era
sistematicamente incorporado ao erro no-controlado do experimento.
A importncia de um erro inflado ou reduzido ser comentada mais adiante, quando se
abordar o tema da significncia estatstica. Por enquanto, basta saber que os efeitos das
interaes s podem ser incorporados ao chamado erro residual (ou no-controlado), quando a
interao for estatisticamente no-significante. Caso seja significante, a sua varincia deve ser
isolada, e tratada como se fosse um fator de variao, pois se torna to relevante na anlise
estatstica quanto qualquer dos fatores de variao principais.
O bom desempenho dos testes paramtricos exige que as varincias nele envolvidas sejam
homogneas. Isso no implica, porm, que elas devam ser idnticas, porque nada
exatamente igual em Estatstica, havendo sempre uma faixa de tolerncia em torno de
qualquer suposta igualdade. O que os testes exigem que elas no sejam discrepantes a ponto
de ultrapassarem determinados limites de tolerncia.
Para entender as razes dessa exigncia, basta imaginar o que aconteceria se algum
tentasse comparar a variao do crescimento de melancias com a variao do crescimento de
jabuticabas. As varincias nesse caso seriam heterogneas, ou seja, to diferentes que
tornariam impossvel qualquer comparao direta.
Todavia, mesmo nesse caso, aparentemente absurdo, a comparao estatstica no de todo
impossvel, bastando para isso que se encontre um denominador comum, capaz de permitir o
confronto entre esses dois tipos de crescimento to diferentes.
Por exemplo, a varivel adequada nesse caso poderia perfeitamente ser algo como a taxa de
crescimento de cada fruto em relao ao seu prprio peso, ou ao seu prprio volume, taxa essa
considerada a intervalos regulares, ao longo do perodo de tempo estabelecido para as
observaes.
Em resumo: embora as variaes (ou varincias), nos dois tipos de crescimento
considerados em nossa hiptese, pudessem ser heterogneas e desproporcionais, as variaes
das taxas de crescimento relativo poderiam ser homogneas, e portanto compatveis e
passveis de comparao.
Um teste muito simples e de fcil execuo, para verificar a homogeneidade das varincias,
o teste de Cochran que consiste em calcular todas as varincias envolvidas no
26
experimento e dividir a maior delas pela soma de todas. O valor resultante da diviso ento
comparado com os valores crticos de uma tabela estatstica apropriada, que leva em conta o
nmero de varincias envolvidas (k) e o nmero de graus de liberdade (*) utilizado nos
clculos, nmero esse que evidentemente deve ser o mesmo para todas, pois a tabela
construda dessa forma.
Talvez a nica dificuldade na execuo desse teste seja decidir quais varincias testar. A
experincia de muitos anos acabou me ensinando que as varincias que melhor se prestam a
essa finalidade so as que se referem interao maior envolvida no plano geral do
experimento (binrias ou ternrias, conforme o experimento fatorial tenha dois ou trs fatores
de variao). Em ltima anlise, essas varincias da interao maior que poderamos
chamar de interao de maior grau referem-se variao entre as repeties. Assim, se o
experimento tiver, digamos, 120 dados numricos, correspondentes ao produto fatorial de 4
colunas, 3 linhas, 2 blocos e 5 repeties, (4 x 3 x 2 x 5 = 120), o teste de Cochran ser
realizado com 24 varincias (k = 24), cada qual com 4 graus de liberdade (*=51, *=4). O *
a letra n, no alfabeto grego.
O teste de Cochran um teste curioso porque nele de interesse que o valor calculado seja
menor do que o valor crtico da tabela, e no maior como ocorre na maioria dos testes
estatsticos, pois exatamente isso que indica que as varincias so homogneas. De fato, se o
valor calculado fosse maior, o resultado seria significante, o que negaria a hiptese de
igualdade (ou de homogeneidade) das varincias envolvidas no experimento.
Dessa forma, a essa altura de nossas consideraes, j sabemos se a distribuio dos erros
de nosso experimento ou no normal e se as varincias so ou no homogneas. Se a
distribuio for normal e as varincias homogneas, estamos autorizados a usar os testes
paramtricos.
Mas... o que fazer, na hiptese de a distribuio no ser normal, ou as varincias no serem
homogneas...? Voltamos a insistir que s h duas alternativas: ou tentamos uma
transformao dos dados, ou usamos testes no-paramtricos.
Antes disso, porm, sobrou ainda um ltimo detalhe, que at agora no foi resolvido: o
problema da independncia dos erros...
9 passo - Verificar a existncia de vinculao entre dois ou mais dos fatores de variao
envolvidos na pesquisa.
Quanto aditividade, somente aps a realizao dos testes estatsticos indicados para o
modelo matemtico do experimento que se pode saber se ela de fato existe e sua utilidade
consiste apenas em ajudar o pesquisador a decidir se deve ou no isolar a varincia de alguma
das interaes envolvidas no experimento, ou se pode simplesmente junt-la ao erro residual,
com os respectivos graus de liberdade.
H sempre uma razo objetiva, em geral bem definida matematicamente, para se optar por
uma ou outra dessas transformaes, tudo dependendo de como ou por que a distribuio
amostral est se deformando e fugindo normalidade. S a prtica, entretanto, acaba
ensinando o pesquisador a entrever qual a transformao mais indicada. Todavia, com o
advento da informtica, essas transformaes se tornaram algo to corriqueiro e to rpido de
realizar, que o estaticista, ou o pesquisador, pode tentar todas elas em seqncia, para ver qual
a que produz o melhor resultado, gastando para isso no mais do que alguns poucos minutos
de seu precioso tempo.
Na verdade, a transformao mais indicada geralmente coincide com aquela que apresentar
a probabilidade mais elevada de a distribuio ser normal, de modo que se torna suprfluo
saber a sua justificativa matemtica. Se a transformao no for adequada, a probabilidade de
normalidade tende a piorar, em vez de melhorar.
Eu prprio elaborei um programa para computador (GMC-software, hoje em sua verso
7.3), que executa todos os testes at aqui mencionados neste texto, bem como os testes mais
importantes e mais comumente utilizados em Estatstica, e por isso posso assegurar aos meus
leitores que no estou argumentando em vo, e que sei perfeitamente do que que estou
afirmando.
O nico cuidado que se deve ter, aps transformar os dados experimentais, passar a
raciocinar em termos da natureza dos novos dados, por ocasio da discusso e da
interpretao dos resultados. Por exemplo: algumas transformaes invertem os valores dos
dados, como o caso da prpria transformao inversa (ou hiperblica de primeiro grau), na
qual Xi = 1/xi, e da hiperblica de segundo grau, em que Xi = 1 / xi2.
A transformao logartmica.
No se deve esquecer portanto que, uma vez transformados os dados em logaritmos, a soma
de dados logartmicos no tem o mesmo valor que a soma de seus antilogaritmos, mas
representa o produto destes, de modo que a mdia dos logaritmos no corresponde ao
logaritmo da mdia de seus antilogaritmos. Na verdade, o antilogaritmo da mdia dos
29
logaritmos corresponde mdia geomtrica dos nados originais, e no mdia aritmtica
destes.
Por isso, no clculo das mdias, aps a transformao logartmica, no se pode esquecer de
que os logaritmos passaram a ser tratados como simples dados numricos, e no mais como
logaritmos. Para fazer a converso para os valores originais, as mdias correspondentes s
mdias dos dados logartmicos tm de ser calculadas a partir dos dados originais. A nica
coisa que mantida nesses casos a hierarquia dos dados, pois quando um dado original
maior do que outro, os seus logaritmos mantm essa mesma ordenao hierrquica, ainda que
os prprios valores numricos passem a ser diferentes.
Uma vez normalizada e homogeneizada a distribuio dos dados amostrais, por intermdio
da transformao que se comprovar mais conveniente, o pesquisador estar autorizado a
utilizar os testes paramtricos. Contudo, se mesmo tendo tentado todos os recursos
disponveis ainda assim a distribuio continua se demonstrando no-normal, ou no-
homognea, ou at mesmo no-aditiva, no h outra alternativa seno utilizar a estatstica
no-paramtrica.
Os testes estatsticos podem ser divididos em dois grandes grupos, conforme fundamentem
ou no os seus clculos na premissa de que a distribuio de freqncias dos erros amostrais
normal, as varincias so homogneas, os efeitos dos fatores de variao so aditivos e os
erros independentes. Se tudo isso ocorrer, muito provvel que a amostra seja aceitavelmente
simtrica, ter com certeza apenas um ponto mximo, centrado no intervalo de classe onde
est a mdia da distribuio, e o seu histograma de freqncias ter um contorno que seguir
aproximadamente o desenho em forma de sino da curva normal. O cumprimento desses
requisitos condiciona pois a primeira escolha do pesquisador, uma vez que, se forem
preenchidos, ele poder utilizar a estatstica paramtrica, cujos testes so em geral mais
poderosos do que os da estatstica no-paramtrica, e conseqentemente devem ter a
preferncia do investigador, quando o seu emprego for permitido.
Ora, de qualquer conjunto de valores numricos pode-se calcular a mdia, porm, desvio-
padro, somente as curvas normais o possuem, uma vez que, por definio, "desvio-padro
o ponto de inflexo da curva normal" e de mais nenhuma outra. So eles em nmero de
dois e simtricos em relao mdia da distribuio. Portanto, curvas assimtricas jamais
podem ter desvio-padro porque, mesmo que tenham pontos de inflexo, como os possuem
muitas outras curvas matemticas, eles dificilmente seriam simtricos em relao mdia.
30
Enfim, mesmo que distribuies experimentais possam apresentar alguma assimetria, esta
deve manter-se dentro de certos limites, aceitveis em termos estatsticos e aceitveis
porque atribudos variao casual determinada pelos erros no-controlados de amostragem,
ou seja, variao do acaso, tpica das variveis e amostras chamadas aleatrias.
Qualquer que seja pois a opo do pesquisador, a essa altura de sua investigao cientfica
ele se acha diante de mais um dilema: qual, dentre os muitos testes estatsticos existentes em
ambas as categorias acima citadas, seria o mais apropriado, no caso especfico de seu
trabalho, ou do modelo matemtico de seus ensaios? Que elementos desse modelo matemtico
condicionariam a opo por um ou outro desses testes?
Em geral a resposta est contida no prprio modelo experimental de cada pesquisa. Os
detalhes adicionais que devem orientar a escolha do teste so:
31
Alguns desses testes usam nmeros como varivel, outros usam sinais + e , outros usam
valores fixos, como 1 e 0, e outros ainda utilizam freqncias. Esses testes evidentemente
esto todos includos no grupo dos testes no-paramtricos, simplesmente porque no usam os
parmetros mdia e desvio-padro em seus clculos.
Aps a concluso destes conceitos iniciais e dos conhecimentos bsicos que se deve ter
sobre os mtodos estatsticos, sero includos neste texto alguns breves comentrios sobre
cada um dos testes listados acima. So resumos sobre o que chamei de Filosofia do Teste, e
neles procurei dar uma idia geral sobre o que tinha em mente o criador de cada um deles, e a
quais modelos matemticos eles se adaptam, bem como em quais circunstncias cada qual
poderia ser utilizado.
Mas so apenas observaes condensadas, que evidentemente os interessados podero
ampliar, pela leitura e pelo estudo mais aprofundado em compndios mais elaborados do que
este, sobre a Cincia Estatstica, que os h em grande quantidade.
Uma vez realizados os testes adequados, estes do o seu parecer, sob a forma de um valor
numrico, apresentado (conforme o teste) como valor de F (anlise de varincia), de t (teste t,
de Student), U (Mann-Whitney), Q (teste de Cochran), (letra grega qui, testes diversos, que
usam o chamado qui-quadrado), z (McNemar e Wilcoxon), H (Kruskal-Wallis), ou (letra
grega rho, utilizada nos testes de correlao, que sero focalizados mais adiante, neste texto).
Porm, se o valor calculado for igual ou maior que o tabelado, aceita-se a chamada hiptese
alternativa (H1), ou seja, a hiptese de que as amostras comparadas no podem ser
consideradas iguais, pois o valor calculado supera aquele que se deveria esperar, caso fossem
iguais, lembrando sempre que a igualdade, em Estatstica, no indica uma identidade. Isso
quer dizer que pode eventualmente haver alguma diferena, mas esta no deve ultrapassar
determinados limites, dentro dos quais essa diferena decorre apenas da variao natural do
acaso, tpica da variao entre as repeties do ensaio.
No caso de o valor calculado ser maior do que o valor tabelado, diz-se que h significncia
estatstica, que pode ser ao nvel de 5 %, se o valor calculado for maior que o valor tabelado
para 5 %, porm menor que o tabelado para 1 %. Ou ao nvel de 1 %, caso o valor calculado
seja igual ou maior que o valor tabelado para 1 %.
possvel que alguma dvida ainda paire no esprito de muitos daqueles que ainda esto se
iniciando nos meandros desse mundo misterioso da Estatstica: o que significam exatamente
os valores calculados pelos diversos testes, e o que quer dizer esse misterioso valor critico das
tabelas estatsticas?
Isso, porm, no nem to complicado nem to difcil de entender, mesmo que para alguns
possa parecer assim. E passo a explicar por qu.
O valor calculado, bem como os valores tabelados, resultam sempre de uma diviso por
algum valor, que tomado como denominador comum, ou termo de comparao entre as
grandezas comparadas.
Esse denominador comum, conforme o teste considerado, pode ser tanto o desvio-padro
da amostra, como a varincia dos erros no-controlados, ou mesmo um valor terico
esperado. Neste caso, o esperado refere-se ao valor que seria teoricamente encontrado, caso a
distribuio amostral seguisse religiosamente uma determinada distribuio matemtica
terica previamente conhecida, ou pelo menos prevista por clculos matemticos tericos.
Significncia no teste t.
Por sua vez, nos testes que utilizam a distribuio conhecida como
distribuio do Qui-quadrado (2), o que se divide a diferena entre dois
valores o obtido (oi) e o esperado (ei), que comumente, porm no sempre, so freqncias
pelo valor teoricamente esperado para a variao casual, e portanto no-significante: 2 =
(oi - ei )2 / ei .
Seja qual for o teste, portanto, o resultado ser sempre o quociente de uma diviso, e o
quociente de qualquer diviso sempre traduz o quantas vezes o numerador maior (ou menor,
se for inferior a 1) do que o denominador, ou seja, quantas vezes este est contido naquele.
Assim, o resultado do teste, em ltima anlise, apenas indica a proporo entre os erros
controlado e no-controlado, embora estes erros possam receber outros nomes, dependendo
do tipo de teste estatstico considerado. Mas, no fundo, so apenas variaes do mesmo
conceito.
Mas disso tudo talvez ainda reste uma dvida: o que seria, afinal, nvel de significncia? O
que significaria exatamente significncia estatstica ao nvel de 5 % de probabilidade? A
expresso indica apenas que o valor calculado pelo teste (qualquer que seja este) s poderia
ser encontrado, por simples variao natural do acaso, no mximo 5 vezes em 100 amostras
aleatrias semelhantes. No caso da significncia ao nvel de 1 %, o valor encontrado pelo teste
seria ainda mais difcil de obter por mero acaso, pois seria da ordem de 1 caso em 100
amostras do mesmo tipo.
Como j foi observado pginas atrs, quando se falou do teste de Cochran para a
homogeneidade das varincias, nem sempre o mais interessante para uma determinada
pesquisa que os testes estatsticos dem resultados significantes.
No caso especfico da homogeneidade, somente um valor no-significante seria vantajoso,
pois s assim indicaria no haver diferenas estatisticamente relevantes entre as varincias,
sendo estas, pois, homogneas, ou seja, no-discrepantes.
Mas esse no seria um caso isolado, pois h muitos trabalhos de pesquisa em que uma no-
diferena estatstica seria desejvel, e eu prprio j me vi diante de inmeros casos assim. Por
exemplo, imaginem dois mtodos, um carssimo e outro muito mais barato, para realizar um
ensaio qualquer. Nesse caso, o mais conveniente para o pesquisador seria que o teste
comparativo entre os resultados fornecidos por ambos fossem no-significantes, pois nesse
caso o pesquisador estaria autorizado a usar indiferentemente um ou outro, e por certo daria
preferncia ao mais barato, uma vez que os resultados seriam equivalentes, a um preo menor,
o que em pases como o nosso, e em muitos outros, que carecem de recursos para a
investigao cientfica, importantssimo.
Outra observao importante a que se refere ao distanciamento que muitas vezes existe
entre a significncia puramente matemtica dos resultados estatsticos e a relevncia desses
mesmo resultados em termos de aplicao prtica, seja em clnica, seja na vida prtica em
qualquer campo da atividade cientfica, ou simplesmente no dia-a-dia da atividade humana
1) uma delas quase grfica, embora utilize clculos matemticos para realiz-la. a
operao chamada regresso, que pode ser linear (ou reta), ou curvilnea;
35
2) e a outra, calculada a partir da primeira, a correlao, que tem como unidade
convencional de medida uma grandeza chamada coeficiente de correlao, em geral indicada
pela letra grega , que se l "r" (ou rho).
O coeficiente de variao uma grandeza que varia de 1 a +1, valores estes que traduzem
a correlao perfeita entre a variao de uma varivel em relao variao da outra. Por seu
turno, a ausncia completa de correlao entre as variveis confrontadas indicada pelo valor
zero do coeficiente de correlao ( = 0). Os valores positivos do coeficente de correlao (0
+1), indicam a existncia de uma relao diretamente proporcional entre as variveis,
enquanto que os valores negativos (1 0) traduzem uma relao inversamente
proporcional entre as variveis em estudo. Por sua vez, o valor numrico de traduz o grau de
correlao entre elas, sendo tanto mais significante quanto mais prximo de +1 (correlao
direta), ou de 1 (correlao inversa). Hoje em dia, por uma questo de comodidade, costuma-
se usar a letra r (erre minsculo), em lugar de , para o coeficiente de correlao.
Basicamente no existe esse tipo de diferena, mas isso s pode ser percebido pela
comparao das equaes matemticas que definem essas duas grandezas. Por isso, embora
no seja objetivo deste texto falar nos fundamentos matemticos da Estatstica, essas duas
equaes sero transcritas a seguir, apenas para frisar suas diferenas e semelhanas. Mas,
naturalmente, apenas aqueles que tenham alguma noo de lgebra e de somatrios podero
entend-las.
A equao usada para calcular a varincia de uma amostra esta:
Essa expresso pode ser transformada em outra eqivalente, substituindo-se o seu x2 pelo
produto x . x, , assim como o seu (*x)2 por *x . *x , escrevendo-se ento:
s2x = x . x x . x / n (Equao 2)
A regresso linear consiste em determinar qual a linha reta que passa, ao mesmo tempo, o
mais perto possvel de todos os pontos determinados no sistema cartesiano pelos pares x-y
dispo
Consideremos a equao matemtica da linha reta: y = a + bx. Para traar o grfico dessa
reta, colocam-se os valores de x no eixo das abscissas e y no das ordenadas do sistema de
eixos cartesianos. Todavia, possvel traar outra reta com esses mesmos parmetros a e b,
agora em funo de y, e no de x. Para isso, basta isolar o valor de x na equao acima
transcrita, que ficar assim: x = (y - a) / b. O novo grfico mostrar uma reta que, no caso da
regresso ora focalizada, poder apresentar um ngulo de inclinao diferente do da primeira
reta, conforme se explicar mais adiante.
Todavia, a raiz quadrada acima indicada, embora fornea o valor numrico de r, no indica
se esse valor positivo ou negativo. A definio do sinal depende da expresso da covarincia
(Equao 3): se, nessa expresso, x.y for maior que x . y / n, o valor de r ser positivo; e,
se for menor, o r ser negativo.
Para se ter uma idia do que isso significa, imaginemos duas equaes: y = a + bx0 e
x = (y0+ a) / b. Como qualquer nmero elevado a zero igual a 1, as mesmas equaes se
reduziriam a y = a + b e x = a / b. Fazendo a = 10 e b = 2, elas ficariam assim: y = 12 e x = 5.
Isto quer dizer que, na primeira equao, y seria igual a 12, qualquer que fosse o valor de x.
Logo, o valor de y no depende do valor de x, uma vez que x0 ser sempre igual a 1, no
influindo no valor de y. O mesmo vale para a outra equao.
37
Se essas duas equaes fossem representadas graficamente no sistema de coordenadas
cartesianas, a primeira seria uma linha reta horizontal, paralela ao eixo das abscissas,
passando pelo ponto y = 12; e a segunda seria uma reta vertical, paralela ao eixo das
ordenadas, passando pelo ponto x = 5. Essas duas retas seriam perpendiculares entre si,
cruzando-se no ponto x = 5, y = 12. Mas no haveria qualquer correlao entre elas, uma vez
que os valores de x e y de uma no teria nada a ver com os valores x e y da outra, e vice-
versa. O nico ponto comum a ambas seria o ponto de cruzamento das duas linhas.
A tangente do ngulo de inclinao da reta horizontal teria um valor igual a 0 (zero),
tangente essa que corresponde ao ngulo de 0; e a do ngulo de inclinao da reta vertical
teria um valor igual ao (infinito), que corresponde ao ngulo de 90. Isso indica que as retas
se cruzam em ngulo reto, sendo portanto perpendiculares. por isso que as retas de
regresso perpendiculares entre si representam a ausncia completa de correlao entre as
variveis x e y, tal como ocorre no exemplo acima.
38
Figura 2. Linha de regresso hiperblica, na qual y=1/y. O valor de r igual a 1 porque os
pares foram deliberadamente escolhidos para fornecer uma correlao direta perfeita
Um desses artifcios j foi citado no captulo anterior, quando se comentou o emprego dos
parmetros da linha reta como variveis. J utilizei esse tipo de mudana de varivel, quando
fiz o tratamento estatstico de uma tese em que os dados experimentais eram medidas de
39
densidade ptica feitas em radiografias tomadas de um penetrmetro de alumnio apoiado
sobre o filme radiogrfico.
Esse dispositivo (penetrmetro) tem forma de escada, na qual os degraus tem espessuras
crescentes, aumentando dois milmetros em cada degrau ascendente. A imagem radiogrfica
dessa escada de alumnio uma srie de faixas com radiopacidade proporcional espessura
de cada degrau, cuja densidade ptica ento medida em aparelho adequado a essa finalidade.
A dificuldade, nesse tipo de trabalho, que uma radiografia no mostrava apenas um valor
numrico, mas vrios, cada qual correspondente densidade ptica de um degrau do
dispositivo. Parecia impossvel tratar estatisticamente os dados numricos obtidos.
O artifcio que tornou possvel a anlise estatstica envolveu algumas etapas, que passarei a
comentar, apenas para ilustrar a maneira como funcionou o raciocnio do estaticista num caso
como esse.
O primeiro passo foi realizar um teste de regresso para mltiplas curvas, a fim de
determinar qual a curva matemtica capaz de descrever a variao da densidade ptica nos
oito ou nove degraus do penetrmetro utilizado nos experimentos.
Ficou esclarecido assim que, naquele caso especfico, a curva era uma hiprbole de
primeiro ou segundo grau (j no me lembro), traduzida pela equao matemtica y = 1 / (a +
bx) (hiprbole de primeiro grau), ou ento y = 1 / (a + bx) (hiprbole de segundo grau). O
segundo passo foi realizar uma transformao hiperblica dos dados, que consistia em utilizar
o inverso do valor dos dados experimentais (1/y, no caso da hiprbole de primeiro grau, ou
ento 1/*y, no caso da hiprbole de segundo grau), e no o valor original (y).
Aps essa transformao, um novo teste de regresso mostrou que a relao entre x e y era
agora uma linha reta crescente da esquerda para a direita, o que j era matematicamente de se
esperar.
De fato, considerem a relao que traduz a transformao hiperblica de primeiro grau: y =
1/(a+bx).
Se invertermos a posio de y e (a+bx), o que resulta sem dvida uma linha reta: a+bx
(linha reta) = 1/y.
No caso da hiprbole de segundo grau, ocorre o mesmo: y = 1/(a+bx).
Invertendo-se as posies de y e (a+bx), tem-se: (a+bx) (parbola) = 1/y
Finalmente, extraindo-se a raiz quadrada de ambos os membros da equao, tem-se:
Essas operaes algbricas mostram claramente que, se for utilizado o inverso do valor do
dado, em lugar do dado original, a linha de regresso ser indubitavelmente uma reta, e no
mais uma hiprbole de primeiro grau. Da mesma forma, o uso do inverso da raiz quadrada do
dado original transforma uma hiprbole de segundo grau numa linha reta.
Mas qual seria a importncia disso no caso das radiografias? A importncia est em que se
pode mudar a varivel original (densidade ptica) e utilizar os dois parmetros (a e b) que
definem a reta de regresso de cada radiografia como duas novas variveis.
A primeira delas, o parmetro a da equao da reta, traduz a densidade ptica de fundo da
radiografia, ou seja a densidade ptica do filme na regio no interceptada pela presena do
penetrmetro. Graficamente, seria o ponto onde a reta corta o eixo das ordenadas das
coordenadas cartesianas, onde x (espessura do degrau da escada de alumnio) igual a zero. E
o parmetro b nada mais do que a tangente do ngulo de inclinao da reta, ngulo esse que
traduz radiograficamente o grau de contraste do filme exposto.
De fato, se fizermos a = 0, o grfico da reta passar pela origem das coordenadas
40
cartesianas, onde x e y so iguais a 0 (zero). Essa reta, inclinada, formar com o eixo
horizontal um ngulo , cuja tangente ser: tang = y / x. Chamando a tang de b, ter-se-ia:
b = y / x. Ou seja, a tangente do ngulo de inclinao da reta realmente o b da equao da
reta. Isolando-se o y, a equao ficaria assim: y = bx, sem o a, porque estamos considerando
que a reta passa por y = 0. Se y > 0, ento a equao ter de incluir o a, ficando assim: y = a +
bx.
Essas duas novas variveis, a e b permitiram, portanto, estudar os filmes sob dois aspectos
importantes em qualquer radiografia: a densidade ptica geral e o contraste radiogrfico dos
filmes (vencidos, no-vencidos, conservados ou no em geladeira, armazenados ou no em
estufas a 37/38 graus, para simular condies ambientais favorveis ou adversas sua
conservao.
Sem o artifcio da mudana de varivel, de densidade ptica para os parmetros a e b das
diversas retas de regresso, correspondentes a cada filme exposto, a anlise estatstica dos
resultados da pesquisa teria sido impraticvel.
Contudo, a mudana de varivel muitas vezes pode ser utilizada tambm para diminuir o
nmero de variveis de um trabalho de pesquisa, o que se consegue quando duas ou mais
dessas variveis podem ser combinadas para dar origem a uma outra varivel, nica,
resultante dessa associao entre duas ou mais delas.
Por exemplo, imagine-se um experimento em que se desejasse saber qual, dentre uma srie
de solues solventes, seria a mais eficaz para dissolver uma determinada massa de uma
substncia qualquer. O pesquisador poderia determinar a massa (m) de cada corpo-de-prova
(varivel 1), medir o tempo (t) gasto para a dissoluo completa da massa correspondente a
cada um deles (varivel 2), e calcular a velocidade de dissoluo (v), fornecida pela quociente
massa dividida pelo seu correspondente tempo de dissoluo
v = m / t (varivel 3).
No entanto, essas trs variveis, que exigiriam testes isolados para cada uma, poderiam ser
associadas, resultando numa varivel nica a ser analisada, que combinaria os efeitos de todas
as trs.
Realmente, h na Fsica uma grandeza que associa essas trs variveis: a chamada Fora
de Impulso, definida pela expresso:F = m . v / t.
Mas o raciocnio matemtico e fsico pode ir mais alm.
De fato, partindo de trs equaes da Fsica: uma que define a
Fora (F = m . a), outra que define a velocidade de um mvel (v = a . t), e finalmente a que
define o Trabalho (T = F . e), nas quais F = fora, a = acelerao, m = massa, t = tempo, v =
velocidade, T = trabalho (ou energia despendida) e e = espao percorrido.
Podem fazer-se diversas transformaes algbricas simples: Se v = a . t, ento a = v / t; e se
a = v / t e F = m . a, ento F = m . v / t.
Contudo, m / t = v, e a equao ficaria assim F = v . v, ou F = v.
Considerando, porm a equao do trabalho (T = F . e), e tendo em mente que, no caso da
dissoluo do tecido, o espao percorrido (e) corresponde massa dissolvida (m), pode-se
fazer a substituio do espao pela massa na equao do trabalho, uma vez que, nesse caso, e
= m. Conseqentemente, T = F . m.
Substituindo agora, na equao T=Fm, o valor de F, tem-se: T =m . v.
Como Trabalho e Energia so grandezas da mesma natureza, uma vez que so avaliadas
pela mesma unidade fsica (Joule, erg), pode-se dizer indiferentemente: T=m . v, ou
E = m . v.
Finalmente, se a velocidade v fosse a velocidade da luz (c), cairamos na velha equao da
41
liberao da energia, descoberta por Einstein: E = m . c!
Portanto, a nova varivel de trabalho, calculada a partir de variveis medidas nos
experimentos, seria agora a energia (E) consumida na dissoluo do tecido da polpa bovina,
energia essa que difere de uma para outra das solues utilizadas nos experimentos.
Exemplo: um massa de uma substncia qualquer com peso = 2,33g, dissolvida pela soluo
A em 53 segundos teria uma velocidade de dissoluo 2,33 / 53 = 0,044 g / seg. A energia
despendida, ou o trabalho realizado, nessa dissoluo seria
0,044 x 2,33 = 0,0045 ergs, ou, pelo SI (MKF) 45 x 10-7 Joules.
Em termos de Fora, teramos F = m . v, ou F = 0,044, igual a 0,0019 dinas no sistema
CGS, que corresponde a 19 x 10-5 Newtons, aproximadamente, no sistema SI (MKF). Ter-se-
ia de multiplicar o resultado da operao por 9,80665, mas a diferena irrelevante para a
anlise estatstica, porque todos os dados seriam ento multiplicados pelo mesmo valor
escalar.
Uma observao importante: aps a mudana das variveis, a discusso dos resultados da
anlise estatstica ter forosamente de ser feita em termos da nova varivel.
42
Exemplo no.4: varivel rea (mtodos estereolgicos).
Outro caso curioso envolvia o emprego do teste bacteolgico conhecido como BANA. A
ps-graduanda, autora do trabalho, dividia cada arcada dentria em trs regies, sendo duas
posteriores e uma anterior, o que resultava na diviso das duas arcadas em seis sextantes. De
um dente pertencente a cada um desses sextantes, colhia-se uma amostra do contedo de
bolsas periodontais ali existentes, e com esse material realizadvam-se os testes
bacteriolgicos, que poderiam dar resultados exclusivamente positivos (+) ou negativos (-).
O projeto inicial de trabalho previa a contagem e a comparao do nmero de resultados
positivos nos dois grupos estudados, que reuniam pacientes diabticos do tipo I (insulino-
dependentes) e do tipo II (no-insulino-dependentes). Tudo estaria bem, no fossem dois
detalhes, dos quais a autora do trabalho aparentemente no se dera conta ao planejar sua
pesquisa.
a) O primeiro desses detalhes dizia respeito ao fato de nem sempre os seis sextantes estarem
presentes, uma vez que muitos pacientes eram parcialmente desdentados, o que fazia variar o
nmero de sextantes, e conseqentemente o nmero de testes, por paciente. Essa
variabilidade do nmero total de testes por paciente desaconselhava a contagem pura e
simples do nmero de resultados positivos do teste BANA, uma vez que dois casos positivos
em trs testes realizados, por exemplo, no significam a mesma coisa que quatro, cinco ou
seis casos positivos obtidos em seis testes realizados.
Para resolver o problema, sugeri um artifcio estatstico que no me consta ter sido usado
jamais por algum anteriormente: adotar a probabilidade binomial de, em n testes realizados,
45
serem obtidas m respostas positivas (+); ou afirmativas, caso a varivel inicial consistisse em
respostas afirmativas (sim), ou negativas (no).
Com essa mudana de varivel, os dados numricos deixavam de ser valores discretos, que
podiam ser apenas contados, produzindo freqncias que variavam de 0 a 6, para se
transformarem em grandezas contnuas, que variavam de 0 a 1, que a variao da
probabilidade, ou de 0 a 100, se essas probabilidades fossem transformadas em probabilidades
percentuais, uma escolha que, em termos estatsticos, totalmente indiferente.
E assim foi feito, com o mais absoluto sucesso.
Para aqueles que possam algum dia ter diante de si o mesmo problema, transcrevemos
abaixo a equao utilizada para efetuar a transformao das freqncias de respostas + e - (ou
sim e no) em probabilidades de ocorrncia dessas freqncias em n nmero de casos:
b) O segundo detalhe acima mencionado, que entrevi logo de incio no plano de pesquisa ora
comentado, envolvia um problema talvez bastante comum entre os pesquisadores: a escolha
do grupo controle, principalmente quando, como no caso focalizado, duas condies
patolgicas esto simultaneamente presentes no mesmo paciente, e se deseja estudar uma
delas exatamente em funo da presena concomitante da outra.
Nesse caso, convm que o grupo controle no seja formado por indivduos sadios, mas sim
por pessoas portadoras de apenas uma das condies patolgicas estudadas, para que se
possam avaliar convenientemente os efeitos da outra sobre esta, que os pacientes controles
tambm apresentam. No caso da associao diabetes/doena periodontal, evidente que o
interesse maior concentra-se nesta ltima, e que aquilo que se quer verificar de que maneira
os dois tipos diferentes de diabetes poderiam influir no desenvolvimento, ou no agravamento,
da condio periodontal.
Assim, o ponto de referncia (grupo controle) seria representado por pacientes no-
diabticos, porm igualmente portadores de doena periodontal, mesmo porque j est
perfeitamente estabelecido que os pacientes diabticos tendem a desenvolver doena
periodontal, mais cedo ou mais tarde, de modo que sempre mais fcil encontrar pacientes
no-diabticos com doena periodontal, do que achar pacientes diabticos sem doena
periodontal.
Exemplo no.7: escores, uma varivel que se deve evitar (sempre que possvel).
Tenho tanta f nos escores, como varivel capaz de avaliar um fenmeno qualquer, como
tenho nas notas de avaliao como meio eficaz para julgar o desempenho de um aluno na
escola. Tanto aqueles como estas implicam um grau de subjetividade que sempre grande
demais para o gosto de um estaticista. Os estaticistas, de um modo geral, preferem tratar com
variveis que sejam mais objetivas do que uma simples opinio pessoal, a qual nunca possui a
imparcialidade fria de um instrumento de medida.
De fato, a opinio humana, por melhor que seja o avaliador, sempre mais sujeita a falhas
de interpretao do que um instrumento de medida, seja este qual for e seja qual for o seu grau
de preciso. Em termos puramente estatsticos, isso quer dizer que a variabilidade da opinio
humana tende a aumentar o valor do erro experimental, o que conduz fatalmente a uma
46
reduo na capacidade de julgamento de pequenas diferenas entre as grandezas comparadas.
Realmente, preciso ter sempre em mente que a significncia estatstica a conseqncia
direta de uma diviso de varincias; ou seja, uma frao ordinria na qual o numerador (ou o
dividendo) a varincia observada entre as grandezas comparadas, e o denominador (ou o
divisor) a varincia entre as repeties (ou seja, a varincia do erro experimental). Ora, se o
denominador da frao for demasiadamente grande, o quociente da diviso ser pequeno
demais: e se for pequeno demais, o quociente ser demasiadamente grande. Em qualquer das
alternativas, o resultado estar prejudicado, produzindo falsas no-significncias no primeiro
caso, e falsas significncias no segundo. Por isso, o erro tem de ser razovel, nem
exageradamente pequeno, nem desmesuradamente grande. Os escores tendem a produzir erros
experimentais grandes demais, no caso de avaliadores determinados aleatoriamente; e
pequenos demais, no caso dos avaliadores ditos calibrados.
Do ponto de vista estatstico, um resultado significante, no caso de erros experimentais
grandes demais, seria altamente confivel, uma vez que revelou significncia mesmo com o
tamanho do erro experimental trabalhando contra. Todavia, o mesmo no se poderia dizer
com relao aos resultados no-significantes, que poderiam caracterizar aquilo que se
convencionou chamar de falsos negativos. Neste caso, a diferena entre os grupos
comparados estaria sendo mascarada pelas diferenas muito grandes encontradas entre as
prprias repeties realizadas dentro de cada grupo. Tecnicamente, em jargo estatstico, se
diria que a variao entre grupos seria mais ou menos igual variao intra-grupo e
exatamente essa quase-igualdade que caracteriza a no-significncia estatstica.
O raciocnio expresso no pargrafo anterior vale tambm para o caso de resultados no-
significantes, em caso de erros experimentais demasiadamente pequenos. Neste caso, os
resultados seriam vlidos para a no-significncia, mas poderiam acarretar erros nos casos de
significncia (falsos positivos).
A razo basicamente a mesma j exposta no pargrafo referido: a significncia aparente
correria por conta apenas da diviso de uma varincia relativamente grande entre grupos por
uma varincia intra-grupo inadequada exatamente por ser pequena demais. Seria como querer
avaliar a variao do tamanho de melancias tomando como base a variao do tamanho de
jabuticabas. Haveria, nesse caso, incompatibilidade entre o objeto medido e a unidade de
medida utilizada por esse motivo, exatamente, que se mede tecido em metros, estrada em
quilmetros, e clula em micrometros.
Contudo, por uma questo de coerncia, devo observar que aquilo que foi dito acima traduz
tambm apenas uma opinio pessoal do autor destas linhas, com tudo que uma opinio
pessoal possa implicar, de acordo com o prprio texto em que essa opinio foi exposta. Alis,
o prprio Cristo j prevenia seus apstolos contra o perigo do julgamento humano, quando
sabiamente ensinou: "No julgueis, para no serdes julgados, pois com o julgamento com que
julgais sereis julgados, e com a medida com que medis sereis medidos" (Mateus, 7:1-2).
Apesar do risco, todavia, no posso deixar de expressar minha opinio, e estou disposto a
agentar o tranco que disso advier. Mesmo porque o ensinamento do Mestre apenas confirma
essa opinio: aquele que usa escores deve estar tambm preparado para enfentar as
conseqncias dos erros de julgamento de seus avaliadores.
O diabo (como provavelmente diria o prprio Criador) que s vezes no h como evitar
us-los, porque a natureza do experimento pode tornar incontornvel o seu emprego na
avaliao experimental... Mas, pelo amor de Deus!, se o uso de escores for inevitvel, jamais
calibrem os seus avaliadores, porque isso tornaria a coisa ainda pior!
Uma observao final sobre os escores: evitem o escore 0 (zero). Procurem comear com o
escore 1 para indicar a ausncia seja l do que for. Como a gradao uma classificao
meramente convencional, isso pode ser feito sem nenhum problema. O grau 0 no esclarece
coisa alguma, mas pode acarretar alguma dificuldade, em caso de diviso por 0, ou se houver
47
necessidade de transformao logartimica dos dados.
Aproveitando o ensejo, deve-se, tanto quanto possivel, evitar dados com valores negativos,
porque eles poderiam complicar as coisas em caso de ser necessrio extrair a raiz quadrada
desses valores negativos. Os zeros e os valores negaivos no so dificuldades incontornveis,
quando presentes, mas a sua inexistncia pode poupar tempo ao investigador, quando do
tratamento estatstico dos dados obtidos em sua pesquisa.
Da varivel porcentagem.
O principal, e provavelmente o mais comum dos abusos e das liberdades que se tomam
com a varivel porcentagem, talvez consista em us-la para nmeros de dados inferiores a
100. De fato, esse procedimento raia pelos domnios da profecia, ou da adivinhao, uma vez
que, a partir de um nmero reduzido de dados, pretende-se extrapolar freqncias e achados,
observados em amostras reduzidas, para amostras de tamanho igual ou maior que 100,
amostras estas no existentes, e que podem no vir a apresentar as mesmas caractersticas dos
dados que j foram obtidos at aquele momento, podendo na verdade fugir completamente a
essas caractersticas, uma vez que porcentagens atuais no garantem porcentagens iguais no
futuro.
Porcentagens so portanto dados que falam de fatos passados, e no de fatos que ainda no
aconteceram. Quando se diz tantos por cento, o que se quer dizer que para cada grupo de
cem dos dados (que j se tem em mos) uma certa parte tem uma determinada caracterstica,
dentre as que se esto estudando. Nada garante que o dobro do nmero desses dados vir a
apresentar o dobro dessa freqncia.
Em caso de amostras pequenas, prefervel falar em proporo, e no em porcentagem. Por
exemplo: 6 casos em 36 estudados (6 / 36 = 0,167). A porcentagem seria essa mesma
proporo multiplicada por 100 (16,67%), mas s teria sentido se se tratasse de 60 em 360
dados, ou, na pior das hipteses, de 17 em 100 para a mesma porcentagem.
Raciocnio idntico ao apresentado no Exemplo no4 pode ser feito em relao a variveis
tridimensionais, das quais o volume o exemplo representativo mais simples. A raiz cbica
dos dados transforma essa grandeza tridimensional e uma grandeza unidimensional, que seria
o comprimento da aresta de um cubo, mesmo que o volume inicial no seja exatamente um
cubo, mas uma esfera, um elipside, ou um slido sem forma definida, mas cujo volume pode
ser medido. Qualquer que seja o slido, o valor do seu volume pode ser transformado
numericamente em um valor equivalente ao de um cubo com uma aresta de comprimento x,
aresta essa que, elevada ao cubo, reproduz o volume tanto do prprio cubo como do volume
do slido inicialmente considerado. Nesse caso, o tratamento estatstico pode ser feito
considerando as arestas dos diversos cubos de volumes equivalentes aos dos slidos originais,
independentemente da forma real destes.
48
Exemplo no. 9: o denominador comum nas comparaes.
Uma populao definida por dois parmetros: a mdia e o desvio-padro, que so nicos
para essa populao como um todo. Entretanto, a Estatstica no lida com populaes inteiras,
mas utiliza subconjuntos dessas populaes, aos quais chama amostras.
Como as amostras envolvem um nmero reduzido de elementos representativos da
populao da qual fazem parte, natural que a sua mdia e o seu desvio-padro difiram
alguma coisa em relao aos parmetros da populao considerada em seu todo.
Os mtodos estatsticos visam a possibilitar que se possam tirar concluses sobre os
parmetros populacionais, partindo de informaes obtidas a partir de amostras dela retiradas.
Como a mdia e o desvio-padro das amostras, mesmo pertencendo estas mesma
populao, sempre divergem alguma coisa em relao aos parmetros reais da populao,
compreensvel que, se forem traados os grficos das distribuies amostrais e da populao
original, por certo haver alguma discrepncia entre todos eles.
Como as amostras pertencem todas mesma populao, e mesmo assim h diferenas,
natural que a variao decorrente da prpria variabilidade casual da amostragem deva ser
considerada, ao se avaliar a igualdade entre os parmetros da amostra e os da populao
original, ou mesmo entre os de duas amostras entre si.
Em resumo: preciso respeitar uma certa faixa de variao, dentro da qual as amostras so
consideradas como provindas de uma mesma populao, ou como iguais entre si.
Os testes estatsticos em geral, e entre eles o teste t, visam a estabelecer precisamente os
limites alm dos quais duas amostras j no devam ser consideradas como retiradas de uma
mesma populao, e sim como pertencentes a populaes diferentes.
Quando as amostras comparadas so independentes, o teste t destina-se a verificar se
mesmo assim pertencem mesma populao, apenas com variaes casuais de amostragem.
Quando so vinculadas, visam a verificar se algum tratamento realizado teve o dom de
modificar os parmetros amostrais, fazendo nascer assim uma nova populao, com
parmetros tpicos diferentes da inicial.
Imagine-se uma pesquisa feita para comparar a dureza da dentina em cortes transversais de
razes dentais, nos teros cervical, mdio e apical, nas regies junto ao canal radicular, perto
do cemento e a meia distncia entre elas, aps tratamento das seces com diversas solues
auxiliares da instrumentao dos canais radiculares, aplicadas durante tempos diferentes.
Esse um exemplo de um experimento em que os fatores de variao esto todos
vinculados, com exceo das repeties (que seriam as diversas razes usadas para repetir o
ensaio).
A experincia mostra que, quando existe vinculao, h tambm uma certa hierarquia na
dependncia entre os fatores vinculados. Por exemplo: no caso citado, os trs teros referem-
se mesma raiz dental, as trs regies da dentina ao mesmo tero da raz, e as solues
irrigantes atuam durante tempos diferentes, porm sobre as mesmas regies de cada corte
dental. Neste caso, comeando com o mais dependente, a hierarquia da vinculao seria:
50
tempos de ao, regies da dentina e teros da raiz.
O modelo matemtico-estatstico e a forma de programao no computador (GMC
Software) exigem que os dados sejam introduzidos obedecendo a essa hierarquia. Assim, o
fator mais dependente deve ser sempre colocado nos blocos da tabela de dados, seguindo-se
as linhas e as colunas (a organizao da tabela pode ser vista no progama estatstico GMC,
onde se explica como os dados devem ser introduzidos no computador, para que a
programao funcione corretamente).
O progama estatstico GMC abrange modelos estatsticos com dois ou com trs fatores de
variao, podendo o primeiro ter um ou dois fatores vinculados, e o segundo um, dois ou trs
fatores mutuamente vinculados. Quando todos os fatores so interdependentes, o nico fator
que sempre permanece independente so as repeties, cuja variao pode ser isolada e o seu
efeito avaliado.
Organize corretamente a sua tabela de dados, de modo a introduzir os valores numricos na
ordem adequada, caso contrrio o programa fornecer resultados incorretos, uma vez que os
dados estaro misturados.
Se duas amostras forem retiradas ao acaso de uma mesma populao, a ordenao crescente
e conjunta dos dados das duas amostras tende a mistur-los uniformemente. Isso faz com que
os dados se encaixem de maneira eqitativa, tal como se intercalam os nmeros pares e
mpares na seqncia natural dos nmeros reais.
medida em que os valores ordenados das duas amostras se separam e se afastam, a
probabilidade de elas pertencerem mesma populao vai se tornando cada vez mais remota.
Os valores de U calculados pelo teste avaliam o grau de entrelaamento dos dois conjuntos de
valores numricos confrontados.
O caso extremo ocorre quando as duas amostras j no se intercalam isto , so disjuntas
o que indica tratar-se de amostras provindas de populaes diferentes. A disjuno dos
dados traduz a significncia estatstica mxima do teste, e ocorre quando o U menor igual a
0 (zero).
51
6. Filosofia do teste da mediana (para 2 amostras).
O teste da mediana visa a verificar se duas amostras diferem em relao s suas tendncias
centrais, uma vez que a mediana e o valor que marca o centro da distribuio amostral.
Assim, o teste exige que as amostras possam ser pelo menos passveis de uma ordenao
por valores ascendentes dos dados, para que se possa calcular o valor que divide o conjunto de
dados das amostras reunidas exatamente ao meio, ou seja, com 50% dos dados acima e 50%
abaixo desse valor. Esse valor a mediana.
A filosofia do teste admite que, se duas amostras provm de uma mesma populao (isto ,
se so estatisticamente iguais), a mediana do conjunto de dados reunidos no difere
significantemente da mediana de cada uma delas considerada isoladamente.
O teste , no final, um teste de (qui-quadrado) em que as freqncias comparadas se
referem ao nmero de dados em cada uma das amostras comparadas que se encontram
acima ou abaixo da mediana comum, calculada para o conjunto das amostras reunidas.
52
Esse teste praticamente igual ao teste do (qui-quadrado), com a diferena de que as
freqncias so transformadas em propores, dividindo-se as freqncias obtidas em cada
uma de duas amostras pelo respectivo nmero total de dados dessa amostra.
A finalidade do teste verificar se duas propores podem ser consideradas iguais, quando
resultantes de amostragens com nmeros diferentes de dados. Por exemplo: ser que as
propores de 34 dados numa amostra com 147 dados, e de 167 dados em outra com 985
dados, seriam iguais? As duas propores so respectivamente 0,23129 e 0,16954. Seriam
elas estatisticamente eqivalentes?
Nesse caso, a resposta poderia ser dada tanto por este teste como por um simples teste de
. numa tabela 2 x 2.
Pode ocorrer, entretanto, que numa ou outra circunstncia no se possa usar o teste do .
Nesse caso, o teste da diferena entre duas propores poderia ser utilizado, como uma
alternativa para o teste do .
Este teste, todavia, tem tambm as suas restries, tal como as tem o prprio teste do .
Assim, como ocorre no , convm que as amostras sejam grandes, de tal modo que as
freqncias obtidas (Fn), ou os seus complementos (NFn), sejam todas maiores que 5.
O teste do tambm faz o mesmo tipo de exigncia. A nica diferena que o teste entre
propores no tem a correo de Yates.
Diante disso, toda vez em que for possvel, prefervel usar o teste do ou, se as
freqncias forem muito pequenas, o teste exato de Fisher.
Outra opo usar a distribuio de Poisson (para eventos raros). Um evento considerado
raro quando sua probabilidade de ocorrncia est prxima de 0 (zero). Praticamente,
considera-se raro o evento cuja ocorrncia de 5 vezes (ou menos) em 50 (ou mais) tentativas
(p 0,1). Isto , quando a probabilidade de 1 evento x o nmero de tentativas (n) igual a 5,
ou menor que 5 (p.n 5).
O teste exato de Fisher testa diferenas entre dois grupos independentes (G1 e G2), em
relao a uma varivel qualquer que s admita duas alternativas como resposta: Sim/No,
Positivo/Negativo, ou +/. Isso leva construo de uma tabela de contingncia 2 x 2.
O teste basicamente um (qui-quadrado), porm o teste de Fisher particularmente
adequado para pequenas amostras (com 20 dados ou menos), caso em que o teste do estaria
contra-indicado.
Em compensao quando o nmero de dados da amostra grande, o teste de Fisher que
no deve ser usado, porque envolve o clculo de fatoriais, o que pode conduzir a nmeros
excessivamente elevados. Nesses casos, a opo deve ser pelo teste do .
53
a) O efeito aumentou (+);
b) O efeito diminuiu (); e
c) O efeito permaneceu o mesmo (=).
At este ponto, o teste seria idntico ao chamado teste dos sinais. A diferena porm que,
no teste de Wilcoxon, leva-se em conta a magnitude do aumento ou da diminuio, e no
apenas a direo da variao para mais ou para menos.
Assim, para cada par vinculado A1/A2, calcula-se a diferena numrica T1 T2. Essa
diferena poder ser positiva, negativa, ou igual a zero (quando no houver variao, sendo
T1 = T2).
Uma vez calculadas todas as diferenas entre os valores obtidos para cada par de dados,
essas diferenas so ordenadas pelo seu valor absoluto (sem considerar o sinal), substituindo-
se ento os valores originais pelo posto que ocupam na escala ordenada.
Feito isso, atribui-se a cada um desses novos valores dos dados o mesmo sinal que eles
tinham antes da transformao em postos.
A filosofia do teste presume que, se os tratamentos forem idnticos, a soma dos postos com
sinais positivos ser equivalente soma dos postos com sinais negativos.
O teste de Wilcoxon calcula um valor z, ao qual est associada um valor de probabilidade.
Essa probabilidade traduz o grau de possibilidade de ocorrncia desse valor de z por mero
acaso, e no por efeito dos tratamentos efetuados (T1 = T2). No caso do GMC software, o
programa j faz automaticamente o clculo da probabilidade do z obtido pelo teste, no
havendo necessidade de consultar qualquer tabela.
Os dados sero codificados apenas como 1 ou 0, para os valores maior e menor de cada par.
O valor real do dado no afeta o teste.
Calculando-se a freqncia em cada uma das duas primeiras alternativas e desprezando-se a
terceira, em que no houve alterao, pode-se estimar se as freqncias dos sinais + e
devem ser consideradas estatisticamente diferentes ou no.
A deciso estatstica envolve o clculo binomial da probabilidade de os sinais + e terem
aquelas freqncias por mero acaso.
Quando os pares vinculados puderem ser medidos quantitativamen-te, de forma que seja
possvel estabelecer no s a hierarquia, mas tambm o quanto um membro do par maior ou
menor do que o outro, o teste mais preciso seria o de Wilcoxon, e no este.
O teste da mediana visa a verificar se duas ou mais (k) amostras diferem em relao s suas
tendncias centrais, uma vez que a mediana e o valor que marca o centro da distribuio
amostral.
Assim, o teste exige que as amostras possam ser pelo menos passveis de uma ordenao
por valores ascendentes dos dados, para que se possa calcular o valor que divide o conjunto de
dados das amostras reunidas exatamente ao meio, ou seja, com 50 % dos dados acima e 50 %
abaixo desse valor. Esse valor a mediana.
A filosofia do teste admite que, se duas ou mais amostras provm de uma mesma
populao (isto , se so estatisticamente iguais), a mediana do conjunto de dados reunidos
no difere significantemente da mediana de cada uma delas considerada isoladamente.
O teste , no final, um teste de (qui-quadrado) em que as freqncias comparadas se
referem ao nmero de dados em cada uma das amostras comparadas que se encontram
acima ou abaixo da mediana comum, calculada para o conjunto das amostras reunidas.
56
A. Para 1 grau de liberdade:
a) pode ser aplicado para n maior que 40 (n = nmero total de dados);
b) para n entre 20 e 40, o teste s pode ser aplicado se todas as freqncias esperadas forem
maiores ou iguais a 5;
c) se a menor freqncia for menor que 5, ou se n for menor que 20, ser prefervel usar o
teste exato de Fisher.
Os (n) elementos de uma mesma amostra (A) so julgados segundo (k) padres ou mtodos
diferentes de avaliao (P1,P2,P3,...Pk).
Os dados experimentais devem apresentar-se como respostas do tipo (+/), (Sim/No), ou
(Positivo/Negativo).
A aplicao do teste, porm, exige que essas respostas, seja como for que se apresentem,
sejam convertidas em valores numricos 1 (um) para os Sim, Positivo ou (+), e em 0 (zero)
para os No, Negativo, ou ().
O teste procura responder a perguntas do tipo: Os resultados dos diversos mtodos de
julgamento testados seriam equivalentes?
A filosofia do teste considera que, se os diversos mtodos produzem efeitos semelhantes
sobre os elementos que compem a amostra, a distribuio dos 1 e 0 nos vrios mtodos
comparados ser aproximadamente igual (a no ser, claro, pelas variaes casuais, presentes
em qualquer experimento).
Os dados amostrais (reduzidos a 0 e 1) devem ser reunidos em uma tabela com (n) linhas e
(k) colunas.
Torna-se possvel, assim, definir se a proporo (ou freqncia) de respostas a mesma em
cada uma das (k) colunas comparadas, ou se, pelo contrrio, houve influncia sobre ela dos
mtodos ou dos padres de julgamento utilizados para avali-las.
57
O teste aplica-se a uma grande variedade de situaes, bastando para isso que os dados
possam ser reduzidos a valores 0 e 1, e possam ser reunidos em tabelas desse tipo (n x k).
O teste , no fundo, um teste de (qui-quadrado), para (k-1) graus de liberdade.
O programa j calcula automaticamente qual a probabilidade de haver igualdade entre as
amostras comparadas. Indica tambm o nvel de significncia estatstica, quando forem
detectadas diferenas entre as amostras.
O teste de Friedman uma espcie de anlise de varincia a dois critrios de variao, para
dados amostrais vinculados.
Por exemplo: a superfcie de corpos-de-prova construdos com diversos tipos de materiais
poderia ser avaliada sucessivamente por dois ou mais mtodos diferentes.
Nesse caso, os dois critrios de variao seriam: 1) os mtodos de avaliao; e 2) os
materiais utilizados. As amostras so vinculadas porque as avaliaes se fazem na mesma
superfcie de cada corpo-de-prova.
O teste responde a este tipo de pergunta: seria idntica a avaliao da superfcie pelos
vrios mtodos, em relao aos diversos materiais? Ou ento: responderiam os materiais
igualmente aos diversos mtodos de avaliao? Ou ainda: haveria concordncia entre os
diversos mtodos em relao avaliao da superfcie dos corpos-de-prova?
A resposta do teste depende de qual dos fatores esteja colocado nas colunas de uma tabela
de dados com k colunas e n linhas.
Desse modo, a organizao da tabela de dados muito importante, uma vez que depende
dela a interpretao do resultado do teste. O fator comparado principal deve ser colocado nas
colunas, e os dados sero introduzidos no sentido das linhas da tabela.
O teste de Friedman no utiliza os dados numricos diretamente, mas sim os postos
ocupados por eles, aps a ordenao por valores ascendentes desses dados. A ordenao
numrica feita separadamente em cada uma das amostras, e no em conjunto.
A filosofia do teste considera que, se as diversas amostras provm de uma mesma
populao, isto , se elas so estatisticamente iguais (hiptese de nulidade, ou de (H0), a
distribuio dos postos nas diversas colunas ser mais ou menos eqivalente, de modo que a
soma dos postos em cada coluna ser aproximadamente igual.
A hiptese alternativa (H1) seria de que as amostras no pertenceriam mesma populao
isto , seriam diferentes e nesse caso haveria diferenas entre as somas das diversas
colunas.
59