Você está na página 1de 110

A Conduo da Anlise 2014/1

Thierry R. Gasnier/ Universidade Federal do Amazonas

A Conduo da Anlise

2014/1

em Cincias Biolgicas I - Base Conceitual

Thierry R. Gasnier
Universidade Federal do Amazonas

A Conduo da Anlise I- 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Sumrio
Introduo ............................................................................................ 3
1. Estatstica na perspectiva do usurio ........................................... 4
1.1 A necessidade de estatstica .................................................... 4
1.2 Complexidade estatstica ........................................................ 4
1.3 Questo, hiptese, previso e evidncia. ................................ 6
1.4 Tipos de evidncias .................................................................. 9
1.5 Validao de evidncias ........................................................ 12
1.6 Estatsticas intuitiva e frequentista ...................................... 16
1.7 Da amostra populao........................................................ 18
2. Do problema biolgico ao estatstico. ......................................... 20
2.1 Entidades ................................................................................ 20
2.2 Propriedades .......................................................................... 21
2.3 Tabelas e grficos EPR ......................................................... 22
2.4 Relaes entre variveis ........................................................ 22
2.5 A estatstica para estabelecer relaes. ................................ 23
3. Confiana na medida e independncia....................................... 27
3.1 Nveis e escalas de medida .................................................... 27
3.2 Atribuio de nveis nominais e ordinais............................. 29
3.3 Exatido, preciso e acurcia. .............................................. 30
3.4 Distribuies de frequncias ................................................. 34
3.5 Parmetros populacionais .................................................... 36
3.6 Intervalos de confiana de parmetros................................ 37
3.7 Independncia para parmetros univariados ..................... 41
3.8 Independncia em anlises de relaes ................................ 42
3.9 Consideraes complementares ........................................... 44
4. A lgica dos testes de hipteses ................................................... 50
4.1 O mtodo hipottico dedutivo............................................... 50
4.2 Estabelecendo hipteses de trabalho ................................... 52
4.3 Descartando hipteses com procedimentos ..................... 54
4.4 Descartando a hiptese do acaso ...................................... 56
4.5 Nvel de significncia e tipos de erros. ................................. 58
4.6 Consideraes complementares ........................................... 60

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

5. Diversidade de testes e suas premissas ....................................... 68


5.1 Ecologia e diversidade dos testes estatsticos. ................. 68
5.2 Testes com apenas uma varivel .......................................... 68
5.3 Testes com duas variveis ..................................................... 69
5.4 Premissas dos testes paramtricos ....................................... 70
5.5 Transformao de dados....................................................... 74
5.6 Outras premissas ................................................................... 74
5.7 Contrastes .............................................................................. 76
6. Planejamento Amostral ............................................................... 78
6.1 Independncia entre unidades amostrais ........................... 78
6.2 A coleta parecia apropriada, mas... ..................................... 78
6.3 Tipos de variveis dentro de mapas conceituais. ................ 81
6.4 Controle: tratamento, funo e estratgia ........................... 84
6.5 Escolha a sua abordagem...................................................... 89
6.6 O experimento como modelo na pesquisa de relaes........ 89
6.7 Abordagens quase experimentais. ........................................ 90
6.8 Abordagens no experimentais ............................................ 91
6.9 Independncia pela distncia ............................................... 94
7. Maximizando o poder do teste .................................................... 97
7.1 Testes unicaudais e testes bicaudais ..................................... 97
7.2 Testes pareados e testes em blocos ....................................... 98
7.3 Nveis fixos e nveis livres .................................................... 100
7.4 Relaes retilineares, curvilineares e monotonicidade. .... 101
7.5 O poder e os tipos de teste................................................... 101
7.6 O poder e os nveis das variveis em estudo ...................... 103
7.7 Perdas voluntrias de poder ............................................... 104
7.8 Testes mltiplos ................................................................... 104
8. Glossrio ..................................................................................... 107
9. Bibliografia citada e recomendada ........................................... 110
Anexo:

Chaves e Guias para uso de testes e grficos

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Introduo
No ttulo A Conduo da Anlise, o termo Conduo serve para reforar uma analogia entre anlise
na pesquisa e dirigir um veculo (carro, bicicleta,
etc.) que foi utilizada no texto. Talvez o principal
aspecto desta analogia seja que dirigir uma atividade quase assustadoramente complexa a princpio,
mas, depois de algum tempo de treinamento, vai
ficando cada vez mais fcil, mesmo sem deixar de
ser complexa, tendendo a tornar-se agradvel. O
mesmo pode ocorrer com o conhecimento sobre
medida, planejamento e anlise dos dados, ao passo que deixam de ser uma preocupao incmoda
para se tornar parte natural do cotidiano da pesquisa. O termo anlise deve ser compreendido em um
sentido bem amplo, pois a confiana em um resultado no depende apenas da anlise matemtica. Um
bom estatstico sempre pergunta como os dados
foram medidos e coletados antes de ajudar na anlise, de forma que no inapropriado utilizar este
sentido amplo para deixar o ttulo mais compacto.
Este livro no uma introduo estatstica, uma
introduo bioestatstica aplicada, isto , ao uso
de ferramentas estatsticas para a resoluo de
problemas biolgicos. importante separarmos dois
contextos da estatstica, o contexto da criao e
fundamentao matemtica e o contexto da aplicao. H profissionais que desenvolvem ferramentas
estatsticas e avaliam suas aplicaes e limitaes,
mas h tambm pessoas que sabem utilizar estas
ferramentas com competncia apenas com a base
necessria para o seu uso. O primeiro como um
engenheiro de carros ou um construtor de instrumentos musicais e o segundo como um piloto ou
um msico. Quando uma pessoa que conhece a
fundamentao e a aplicao vai ajudar outra pessoa com um problema estatstico, no se espera
que a primeira explique noes de clculo de probabilidade e faa demonstraes de frmulas (questes mecnicas), espera-se que ela v direto ao
assunto e explique qual a ferramenta apropriada,
quais suas premissas e limitaes, como se realiza
o teste em um programa estatstico e quais so os
grficos mais apropriados para comunicar os resultados (questes de conduo). Por isto, o contedo
de um livro de apoio na formao de estatsticos
(como para engenheiros ou construtores de instrumentos) deve ser diferente de um livro de apoio para
usurios (como para pilotos ou msicos). Ainda que
alguns livros de bioestatstica tenham esta proposta,

alguns autores (e. g. Motulsky 2010, Magnusson &


Mouro 2005) propem uma nfase ainda menor na
matemtica e ainda maior nos conceitos associados
ao uso da estatstica. Podemos ganhar muito se
terceirizamos a parte matemtica da estatstica
para os computadores e nos concentramos nas
questes conceituais sobre a forma correta de utiliz-la.
Para a parte prtica, apresentamos um texto anexo
com instrues para a escolha de muitos testes e
grficos; uma caixa de ferramentas bsica para
anlises e apresentao de resultados. Estas instrues servem para qualquer programa estatstico.
Adicionalmente, inclumos neste anexo as instrues especficas sobre como fazer esses teste e
grficos no programa MYSTAT12, que pode ser
baixado gratuitamente pela internet.
Este livro foi desenvolvido ao longo de mais de 15
anos ministrando aulas de bioestatstica em graduao e ps-graduao na Universidade Federal do
Amazonas (UFAM) e no Instituto Nacional de Pesquisas da Amaznia (INPA). Devo aos alunos pelo
estmulo e ajuda na busca de contedos mais apropriados para uma estatstica aplicada pesquisa. O
amadurecimento do texto foi um processo longo e
se deveu muito contribuio de vrias pessoas.
Pelas discuties de questes bsicas que nortearam a redao, agradeo a William Magnusson,
Donald Macnaughton, Cintia Cornlius, Jos Luiz
Camargo e Paulo Estefano. Agradeo pelas sugestes e crticas a verses anteriores do texto a Bruno
Spacek, Cecilia Roma, Erika Portela, Fabrcio Baccaro, Jos Cardoso Neto e Srgio Rodrigues da
Silva.
Este texto usado em disciplinas da UFAM continuar em processo de
aperfeioamento. Verses mais recentes podero ser obtidas no site
www.intertropi.ufam.edu.br/ docs.html. Neste site tambm esto as
ltimas verses das apostilas para escolha de grficos e testes e outros
anexos. Sugestes podero ser enviadas para o email tgasnier@ufam.edu.br. Os direitos autorais desta apostila pertencem ao autor
e Universidade Federal do Amazonas. permitida a cpia sem fins
lucrativos desde que a fonte seja citada.

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

cessrios, mas preciso ter claro que o problema que define esta necessidade. Uma pessoa que optou por no aprender estatstica est
limitando sua capacidade de analisar dados e
de resolver problemas.

1. Estatstica na perspectiva
do usurio
1.1 A necessidade de estatstica

A boa notcia, principalmente para quem no


gosta de fazer clculos, que dominar o uso da
estatstica hoje depende muito pouco de se
entender as suas bases matemticas, em funo do desenvolvimento dos programas aplicativos de estatstica, o que permite um melhor
aprofundamento nas questes conceituais essenciais de anlise.

Em um sentido amplo, a Estatstica uma rea


do conhecimento que lida com a medida, coleta,
organizao, apresentao e interpretao de
dados. O termo costuma ser utilizado em um
sentido mais estrito referindo-se prioritariamente
matemtica da anlise dos dados. A Estatstica Aplicada deve ter nfase didtica e priorizar
o uso correto das tcnicas estatsticas em situaes concretas e contextualizadas em uma
determinada rea do conhecimento. Adequadamente integrada aos conhecimentos da
rea, pode deixar de ser apenas uma tcnica
para tornar-se parte de uma filosofia de anlise
de dados.

1.2 Complexidade estatstica


Muitas pessoas consideram a estatstica como
uma especialidade da matemtica, mas podemos consider-la um ramo da lgica que faz
uso intensivo de matemtica. Vista em seu sentido amplo, a estatstica lida com pensamento
complexo. Isto no significa que seja uma forma
diferente de pensar, pois tambm complexo
nosso pensamento cotidiano.

A cincia avanou por muito tempo sem


estatstica, ento por que agora seu aprendizado considerado uma necessidade? H pessoas que se recusam a aprender a dirigir um
carro, mas sabem usar transporte pblico, imagine ento uma pessoa que se recusasse a
usar qualquer meio de transporte, at uma bicicleta ou um elevador. Esta pessoa poderia escolher um estilo de vida compatvel com um
deslocamento exclusivamente a p, no impossvel, mas certamente sua autonomia seria
muito limitada. A estatstica uma ferramenta
para ajudar na pesquisa, assim como um meio
de transporte ajuda no deslocamento. H situaes na pesquisa em que no precisamos de
estatstica, assim como h situaes no cotidiano em que s podemos nos deslocar a p, mas
isto no argumento para optarmos por evitar a
estatstica ou os meios de transporte.

Por exemplo, chegar a um lugar determinado


em uma cidade uma atividade complexa
(Fig. 1.1). Em primeiro lugar voc precisa conhecer a cidade, ou ter um mapa dela e saber
se orientar pelo mapa. Depois, voc precisa
saber o local exato onde voc est e aonde
quer chegar. Se for de carro, precisa saber dirigir o veculo, o que inclui aspectos de legislao (como saber que no se deve dirigir na
contramo), aspectos psicomotores (como
saber dominar o veculo em uma curva) e o uso
correto dos instrumentos (como o freio ou o
limpador de para-brisa). Estamos utilizando
pensamento complexo quando temos que
integrar conhecimentos de diversos aspectos da realidade para atingir um determinado
objetivo. Complexo no significa necessariamente difcil. Muita gente consegue chegar a
um endereo sem muita dificuldade, embora
seja um problema que envolve vrios tipos de
conhecimento. Lidamos com problemas complexos no dia a dia e precisamos aprender a
lidar com problemas complexos na pesquisa.

Tambm podemos comparar a estatstica com


um microscpio, outra ferramenta de pesquisa
do bilogo. O microscpio necessrio para
vermos organismos e estruturas muito pequenos e a estatstica necessria para vermos o
que h por trs dos dados. verdade que nem
sempre o microscpio ou a estatstica so ne-

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Hoje em dia no precisamos ter


muito conhecimento de mecnica
para dirigir um carro e chegar a
um endereo. Normalmente basta
saber que temos que colocar gasolina, trocar o leo e calibrar os
pneus ocasionalmente. Pessoas
com conhecimento de mecnica
de automveis fazem a manuteno de nossos carros. Engenheiros desenvolvem novas tecnologias com base em um conhecimento
de fsica e de qumica que os cientistas esto aprofundando nos
institutos de pesquisa e universidades. Estas pessoas, portanto,
nos ajudam a atingir nossos objetivos, pois nos entregam resolvidos os nveis mais moleculares
ligados ao funcionamento do veculo. A nossa responsabilidade na
conduo de um veculo, portanto,
deve se concentrar no domnio
dos nveis mais globais do problema de como chegar ao endereo.

Figura 1.1- A soluo de problemas complexos envolve


diferentes nveis de conhecimento, desde os mais "moleculares" at os mais "globais", como ocorre quando conduzimos um carro at um endereo ou quando conduzimos
uma pesquisa. A explicao sobre o que um problema
EPR ser apresentada no captulo 2.

Uma concepo equivocada da maioria dos


livros e cursos de Bioestatstica dos ltimos 40
anos que necessrio e suficiente dominar o
nvel molecular da matemtica, como o clculo
de probabilidades, para conduzir uma anlise
de dados. Nesta concepo, coloca-se um peso
desproporcional neste nvel de anlise em detrimento de nveis mais importantes para quem
conduz uma anlise de dados.

quisas pedem anlises estatsticas de dados,


mas quando isto ocorre, necessrio algum
preparo em organizao dos dados (cap. 2).
Precisamos entender bem as medidas e as
formas de coletar os dados apropriadas para
responder questes (Cap. 3 e 6). E finalmente,
precisamos saber realizar testes e preparar
grficos para uma anlise e comunicao apropriadas (cap. 5 e Guia de testes e grficos).
isto que um usurio de estatstica precisa saber
fazer bem. Para a maioria dos problemas, o
usurio no precisa lidar diretamente com frmulas ou com algoritmos complexos e menos
ainda com a compreenso de por que as frmulas so vlidas. Este conhecimento matemtico
e de programao pode ajudar, mas tambm
podem atrapalhar, por desviar a ateno do
principal. necessrio que se reconhea que
os conhecimentos fundamentais para o estatstico no coincidem com os conhecimentos fundamentais necessrios para o usurio de estatstica.

Para formar usurios, necessria uma abordagem que leve em conta que a pesquisa
semelhante forma cotidiana complexa de se
pensar. Quando fazemos pesquisa precisamos,
em primeiro lugar, ter conhecimento do referencial terico do assunto de pesquisa, pois sem
ele estamos perdidos. Nosso referencial terico
como um mapa necessrio a cada momento,
e dele que nascem as questes de pesquisa.
Cada pesquisa tem o seu referencial, por isto,
neste texto comearemos com o passo seguinte, discutindo algo sobre questes e hipteses
de pesquisas (cap. 1 e 4). Nem todas as pes-

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

voc precisa construir seu mapa mental conceitual sobre o assunto, isto , consolidar a base
conceitual consultando pessoas e com uma
pesquisa bibliogrfica sria. Levantamento bibliogrfico uma tarefa intil se voc no estudar o material. Estudar no apenas ler, dificilmente se consegue elaborar um projeto interessante sem um grau de envolvimento emocional
com o problema. A informao no vem apenas
de livros, necessrio desenvolver a capacidade de observar. Isto significa estar atento, procurar oportunidades de ver fenmenos de interesse e tentar aplicar a teoria aprendida na leitura para interpretar suas observaes. Este o
momento de gestao da pesquisa, quando ela
precisa tomar forma. Esta etapa demanda tempo e muita concentrao, esquea o estilo de
vida Fast Food quando estiver elaborando um
projeto.

1.3 Questo, hiptese, previso e


evidncia.
As contribuies para a cincia costumam comear com questes (ou com observaes de
padres incomuns que levam a questes). As
questes na pesquisa so perguntas temticas relevantes sobre a realidade, que geralmente comeam com como, por que, o
que, quando, onde ou qual, cuja resposta no bvia. Por exemplo, ao perceber
que a maioria das trepadeiras em uma floresta
sobe na hospedeira girando em sentido antihorrio, surge a questo por que a maioria das
trepadeiras sobe em sentido anti- horrio?. A
resposta para esta pergunta no bvia e a
questo relevante porque pode revelar algum
aspecto de fisiologia e ecologia vegetal de trepadeiras que so um componente importante
das florestas.

Na pesquisa h respostas de dois tipos: descritivas e hipotticas. As respostas descritivas no


envolvem hipteses, como na questo como
o tubo digestivo desta espcie de formiga?.
Basta desenhar ou fotografar e destacar o que
for considerado mais importante. Algumas destas descries diretas envolvem ferramentas
estatsticas, como veremos no captulo 3. A
descrio direta de objetos de interesse cientfico, mesmo considerando a complexidade tcnica, costuma ser simples, no sentido de no
envolver hipteses formais. Talvez por esta
simplicidade, as questes descritivas frequentemente so consideradas inferiores na pesquisa por algumas pessoas. Para derrubar esta
ideia, basta considerar o impacto que foi a inveno do microscpio para a biologia, quando
todo um novo mundo de microorganismos e
microestruturas foi descoberto, ou a atual revoluo resultante da descrio de genomas, inclusive o humano.

As questes podem ser simples, mas as respostas podem ser muito complexas. Exemplos
de questes de pesquisa: a) Como possvel a
coexistncia de duas espcies de aranhas armadeiras muito semelhantes em uma determinada floresta?; b) Por que os dinossauros se
extinguiram?; c) Quais os motivos das notas
baixas do Brasil no exame Pisa (Programme for
International Student Assessment)? Algumas
vezes as questes surgem inesperadamente,
como quando surgem pessoas com uma doena estranha desconhecida, mas o mais comum
na atividade cientfica irmos atrs das questes. Levantar boas questes envolve a capacidade de observao e o conhecimento do referencial terico, inclusive para perceber que a
questo relevante e merece ser estudada. A
boa questo no garante uma boa pesquisa,
mas difcil imaginar uma pesquisa boa e original sem uma questo bem definida boa e original.

Nossas descries da realidade param no momento que aparecem dvidas sobre o que estamos vendo. O que pensou o primeiro bilogo
que viu clulas em um microscpio? Provavelmente foi o que so estas caixinhas?. Quando
h questes sem resposta imediata pela simples observao, criamos alternativas de res-

Em funo disto, importante refletirmos um


pouco sobre como criamos questes. Saber
criar boas questes uma arte, mas h algumas diretrizes que ajudam a desenvolver esta
capacidade (ver texto paradidtico Writing good
questions). Durante a elaborao de um projeto

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

postas possveis e investigamos se esto corretas ou no. Estas respostas possveis so chamadas de Hipteses. Talvez a primeira hiptese
sobre as caixinhas tenha sido que eram meras
ornamentaes casuais do primeiro organismo
observado, mas esta hiptese teria cado com
as observaes posteriores de outros organismos. Em algum momento surgiu a hiptese que
as caixinhas eram uma espcie de diviso na
organizao de todos os organismos. Esta hiptese no se sustentou realmente para todos os
organismos, mas sustentou-se para os organismos pluricelulares. Hoje a teoria celular no
mais tratada como uma possvel resposta
para aquela questo, mas como um fato inquestionvel e um dos pilares da Biologia moderna.
Portanto, o que era hiptese tornou-se descrio, pois faz parte do que aceitamos como realidade.

evidncias que apoia fortemente a hiptese


como resposta correta a uma questo. Na
realidade, no testamos diretamente hipteses,
testamos as previses das hipteses.
Previses so consequncias empricas
esperadas de hipteses, e algumas delas
podem ser usadas nos testes das hipteses.
Uma coisa a previso, que o esperado pela
hiptese, e outra o observado. As evidncias
so os resultados observados em testes de
(previses de) hipteses. As comparaes
das Previses com as Evidncias so denominadas Contrastes PE e costumam seguir regras pr-estabelecidas de anlise que podem
terminar com um aumento ou reduo da credibilidade das hipteses. Se a credibilidade de
uma hiptese aumentou muito, podemos dizer
que respondemos questo. Usarmos o termo
Resposta para denominar o final do processo
de criao cientfica centrado em questes. No
estamos implicando com isto que a hiptese
transformou-se, de forma definitiva, na resposta
para uma questo, apenas que ela passou por
um teste de qualidade rigoroso e a evidncia
indicou que recomendvel a sua aceitao

Hipteses que no podem ser avaliadas atravs


da observao de fatos no entram na cincia
emprica, por isto, vamos nos referir a hiptese
como sinnimo de hiptese emprica. Hiptese (emprica) significa qualquer afirmao
simples ou complexa que tenha consequncias empricas constatveis (Diez & Molines,
2008). Neste contexto, tanto a teoria
da evoluo como a sugesto que
determinado comportamento de um
inseto indica territorialidade so
hipteses, pois ambas tm consequncias empricas constatveis.
Entretanto, mais comum se usar o
termo para ideias relativamente
simples (como o exemplo do inseto),
ficando o termo Teoria para uma
rede complexa de ideias. Pela definio acima, mesmo hipteses exaustivamente corroboradas so
tecnicamente hipteses, mas na
prtica, estas se tornam ideias aceitas com o acmulo de evidncias,
como vimos com a teoria celular.
No h verdades definitivas na cinFigura 1.2- Uma hiptese avaliada pelo contraste entre suas previses e
cia, mas podemos falar que uma
as observaes (evidncias). Neste exemplo, as evidncias no apoiam a
hiptese transforma-se em conhiptese que passar sob uma escada d azar. (No tente repetir este
ceito cientificamente estabeleciexperimento sem as condies de segurana apropriadas).
do, quando h um conjunto de

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

como Resposta, ainda que provisoriamente.

o resultado no permite uma escolha segura.


Um teste mais efetivo de mutualismo seria plantar as duas juntas em densidades variveis. A
previso pela hiptese de mutualismo que
haveria um maior crescimento de cada uma
delas em funo do aumento na abundncia da
outra. Se isto for observado, a nica hiptese
alternativa que resta para explicar a evidncia
que a diferena foi em direo ao esperado por
mero acaso. A estatstica til nesta situao,
como ferramenta para a excluso da possibilidade do resultado coincidir com a previso apenas por acaso.

Se as observaes correspondem ao previsto


por uma hiptese, ento elas apoiam a hiptese, mas isto no basta. Algumas vezes outra
hiptese concorrente compatvel com a mesma previso. Por isto, quando temos hipteses
concorrentes, temos de procurar previses
exclusivas. Esta comparao entre previses
de hipteses denominada Contraste de Hipteses. Por exemplo, ao observar que duas
espcies de plantas tendem a ocorrer juntas,
um pesquisador levanta a hiptese que elas tem
uma relao mutualista. Para testar a hiptese
ele faz a previso que quanto mais plantas de
uma espcie houver em um local, maior ser o
nmero das plantas da outra espcie. Ento, ele
recolhe dados de 100 locais distantes e encontro uma forte correlao positiva. O resultado
parece apoiar a hiptese de mutualistmo, mas
h um problema. Podemos sugerir outra hiptese, que as plantas no so mutualistas, so
indiferentes ou at competidoras, e que pode se
esperar uma correlao positiva entre as suas
abundncias porque as duas respondem da
mesma forma fertilidade do solo. Como a
evidncia compatvel com as duas hipteses,

Embora existam estudos puramente descritivos,


como a descrio de uma espcie nova para a
cincia, geralmente os estudos so parcialmente descritivos e parcialmente envolvem hipteses. Alguns estudos descritivos terminam com
uma proposta de explicao para o que foi encontrado. Por exemplo, um estudo com sntese
de dados sobre muitos aspectos do ensino que
poderiam explicar a posio do Brasil em um
ranking de educao dificilmente deixaria de
propor uma interpretao para estes dados.
Esta interpretao construda a partir de dados
descritivos no deixa de ser uma hiptese complexa. H divergncias sobre considerar
um estudo realizado assim como um
teste de hiptese, j que foi principalmente uma construo de hiptese. Entretanto, o que importa que um estudo
deste contribuiria para a compreenso
do fenmeno. A incluso de uma fase
descritiva, em uma fase preliminar ou
como parte programada do projeto de
pesquisa, algo muito importante. Dificilmente geramos hipteses interessantes antes de conhecer um pouco mais
sobre o sistema de estudo.

Figura 1.3- Uma hiptese uma possvel resposta para uma questo.
Para avaliar se efetivamente ela a resposta correta, precisamos
contrastar previses exclusivas dela com os dados (evidncias).
Frequentemente a estatstica uma til ferramenta para realizar este
contraste.

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

de convencimento muito forte, pois qualquer


hiptese alternativa seria extremamente improvvel.

1.4 Tipos de evidncias


A estatstica uma ferramenta poderosa para
realizar contrastes em muitas situaes de pesquisa. Entretanto, importante reconhecer que
nem sempre ela aplicvel. Sua utilidade depende do tipo de evidncia envolvida no contraste.

Evidncias factuais importantes so comuns na


histria. Quando cientistas observaram anomalias na rbita de Netuno ao redor do Sol levantaram a hiptese que poderia ser uma perturbao gravitacional causada por um planeta com
rbita mais externa, calcularam aonde o planeta
deveria estar e encontraram um novo planeta
que chamaram de Urano. A passagem do cometa Halley no ano previsto provou que cometas so corpos celestes com passagens peridicas; Pasteur derrubou a teoria da gerao espontnea com um simples experimento. A ideia
que a terra era redonda foi comprovada com a
circunavegao.

Evidncia Factual. Uma evidncia factual


quando uma ou poucas
observaes so suficientes
para convencer que uma
hiptese est correta.
Considere primeiro um exemplo cotidiano. Suponha que seu telefone tenha deixado de funcionar. Sua questo : o que causou a interrupo no funcionamento?. Ento, voc pensa
nas possibilidades (hipteses): mau contato na
tomada, aparelho quebrado, falta de servio no
bairro, conta no paga, banco no repassou
pagamento, etc. Vimos que uma hiptese uma
suposio de um cenrio possvel do qual se
tira uma ou mais consequncias. Ento, voc
testa cada hiptese, por suas previses, at
descobrir qual a correta. Para a hiptese de
mau contato, voc meche nos contatos e verifica se a linha volta. Para a hiptese de problema
na rede telefnica, voc vai ao vizinho ver se
ele tambm est com problema. E assim por
diante, at resolver o problema.

Algumas vezes, uma descoberta uma evidncia factual que gera uma hiptese que ela
mesma sustenta. o caso da descoberta do
peixe primitivo chamado Celacanto em 1938 A
ideia que este peixe no estava extinto nasceu
e se comprovou no mesmo momento em que o
peixe foi identificado como um verdadeiro Celacanto. Esta foi uma das maiores descobertas da
paleontologia, em funo da posio deste peixe na filogenia dos tetrpodes. Dificilmente esta
ideia gerada da prpria evidncia seria chamada de hiptese, mas a evidncia certamente
do tipo factual, pois bastou uma observao
para termos convico da afirmao.

Agora um exemplo biolgico. Algumas pessoas


levantaram a hiptese que pombos conseguiriam se orientar sem referenciais terrestres (possivelmente usando magnetismo). Sua previso
era que um pombo levado em uma caixa fechada de seu ninho na Frana encontraria o caminho de volta se levados Inglaterra, atravessando o mar sem referenciais terrestres. O
experimento foi feito e o pombo conseguiu retornar em uma semana. No seria impossvel
que uma tempestade o arrastasse exatamente
para o local do seu ninho, mas isto seria to
improvvel que a evidncia foi considerada
conclusiva. De fato, outros pombos cruzaram o
rio, eliminando at as dvidas menos razoveis.
Note que uma nica observao tem uma fora

Uma Evidncia Factual no significa uma evidncia definitiva e verdadeira, Colombo achava
que a terra era redonda e mostrou que o mundo
no terminava em um abismo no meio do Atlntico, mas errou ao achar que tinha chegado s
ndias. Evidncias factuais, como todas as outras, dependem de premissas vlidas, isto , de
condies explicitas ou no que justifiquem a
confiana na afirmao. Ainda que estejamos
sempre sujeitos a erros, no preciso muito
esforo para encontrar inmeros exemplos de
evidncias factuais que revolucionaram a cincia e que foram utilizadas para construir nossas
certezas de muitas questes do cotidiano.

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Evidncia Estatstica Simples. Uma evidncia estatstica simples


quando se baseia em
vrias unidades amostrais
consideradas independentes.

mos prever que os valores de chuva e de nvel


da gua de um ms tendem a ser similares aos
registrados no ms anterior. Entretanto, isto no
necessariamente uma desvantagem, pois
justamente pelo fato de um ms seguir o outro
que podemos perceber as dinmicas defasadas
das chuvas e do nvel de gua. A informao do
ms do registro necessria para avaliar a
influncia da precipitao sobre o nvel da gua.

Voc se questiona: o que a febre? Seria uma


resposta do corpo para ajudar na cura da doena? Ou seria uma reao induzida pelo agente
infeccioso que prolonga a doena? As duas
hipteses fazem sentido, mas como saber qual
a verdadeira? O fato de se observar uma cura
rpida em um paciente cuja febre no foi tratada
uma evidncia favorvel primeira hiptese,
mas muito fraca. Entretanto, um conjunto de
muitos pacientes escolhidos aleatoriamente
sem tratamento contra a febre com cura rpida
comparado com muitos pacientes escolhidos
aleatoriamente com tratamento e cura lenta
seria uma evidncia forte a favor da primeira
hiptese.

Assim como vimos para a evidncia factual, h


casos em que a evidncia gera a prpria hiptese que ela sustenta. o caso da hiptese que
houve uma extino abrupta da diversidade dos
dinossauros h cerca de 50 milhes de anos
depois de reinarem por mais de 100 milhes de
anos (apenas restaram as aves como descendentes). um caso de evidncia contextual
porque a reduo abrupta na abundncia de
dinossauros baseia-se em vrias medidas sucessivas de abundncia de dinossauros (unidades amostrais dependentes de momentos
seguidos no tempo) cuja magnitude de variao
pde ser considerada no aleatria. As quedas
de meteoros eram eventos comuns durante a
formao da terra, mas foram tornando-se raros
at serem muito raros. Esta tambm uma

A rigor, as evidncias estatsticas simples aplicam-se a estudos experimentais, nos quais a


independncia entre unidades amostrais garantida pela aleatorizao de qual unidade amostral receber qual tratamento (isto ser
explicado no Capitulo 3).
Evidncia Contextual. Uma evidncia contextual quando se baseia
em unidades amostrais
dependentes, de forma que necessrio
incorporar informaes
destas unidades amostrais na anlise ou redobrar cuidados na forma de coletar dados.
Existe uma relao entre a precipitao no estado do Amazonas e o nvel da gua no Rio
Negro ao longo do ano? A unidade amostral na
figura 1.4 registro por momento (uma observao de precipitao e de nvel de gua por
ms). O grfico no apenas mostra que existe
uma relao, mostra ainda que a defasagem
de cerca de trs a quatro meses. Ao contrrio
da evidncia estatstica simples, os registros
neste caso no so independentes, pois pode-

Figura 1.4- Variao da precipitao mdia e do nvel


mdio do Rio Negro ao longo dos meses do ano. Fonte:
Key Environments: Amazonia, 1985

10

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

interpretao contextual temporal. Portanto, o


fato de haver fortes indcios de uma grande
coliso de um meteoro com a terra nesta poca
d muita fora hiptese da grande extino
ser consequncia do impacto de um meteoro.

menopausa relacionada a caractersticas distintas de nossa espcie. Diamond destaca duas


caractersticas: a) um beb to grande que a
chance de morte da me e do beb no parto
sempre foi alta (s reduziu recentemente devido
evoluo da medicina); b) o cuidado parental
dura anos, incluindo a educao. Da conclui
que a interrupo da fertilidade aps certa idade
seria vantajosa pelo aumento da probabilidade
da me conseguir sobreviver para criar todos os
filhos, mesmo perdendo a chance de ter mais
alguns filhos. Em resumo, parar a reproduo
aumentaria o sucesso reprodutivo. O importante
a notar aqui que a concluso no depende de
um fato ou de unidades amostrais independentes ou dependentes, ela mais ou menos convincente pela articulao das ideias.

As evidncias so do tipo contextual principalmente nos fenmenos em que h uma dependncia espacial ou temporal importante. Nestes
exemplos utilizamos avaliaes contextuais
qualitativas, mas h casos em que so utilizadas tcnicas estatsticas mais precisas e complexas que so especficas para diferentes situaes (e. g. Geoestatstica, Anlises de sries
temporais). No abordaremos estas tcnicas,
mas dedicaremos o captulo 6 a estudos observacionais em que o cuidado redobrado com o
contexto pode permitir a utilizao de uma estatstica mais simples.

As anlises que envolvem evidncias sistmicas sempre foram importantes na cincia. Uma
dificuldade em trabalhar com evidncias sistmicas que nem sempre fcil convencer pessoas, mesmo com vrios bons argumentos. O
desenvolvimento da estatstica frequentista no
sculo XX possibilitou a criao de critrios
poderosos e objetivos de avaliao de uma
evidncia (quando a evidncia for um conjunto
de dados independentes), a ponto de influenciar o conceito do que cincia. Para muitos
iniciantes, a cincia verdadeira aquela que
envolve estudos experimentais, repeties e
testes estatsticos. O problema que nem sempre a realidade se apresenta como um conjunto
de dados independentes, como ocorre em um
laboratrio. Como usar estatstica para analisar
a revoluo francesa? A exigncia de testes
para considerarmos uma teoria como cientfica
vlida somente se utilizarmos o termo teste
com um significado mais amplo que o de teste
estatstico. Hipteses na Histria, Arqueologia,
Sociologia, Geografia Humana, Economia, Astronomia, Evoluo e outras reas predominantemente no experimentais podem ser testadas
por contraste com outras hipteses comparando
a coerncia do conjunto de cada uma delas, e
lembrando que cada conjunto deve possuir
elementos empricos envolvidos. (e. g. documentos e fatos histricos, objetos arqueolgicos, observaes de corpos celestes).

Evidncia Sistmica (ou Evidncia por Coerncia em Rede). .


Evidncias sistmicas
so aquelas que encontram suporte principalmente na fora da articulao de ideias e/ou fatos de natureza diferente.
O que determina a perda da fertilidade em mulheres na menopausa? A maioria das pessoas
acredita que apenas uma consequncia natural da idade, como se isto fosse evolutivamente
inevitvel. Diamond (2010) sugere uma hiptese
diferente, que a menopausa um fenmeno
adaptativo para a espcie humana. No h
como se testar esta hiptese experimentalmente, mas a anlise possvel e tambm se baseia em comparao de previses. Se a menopausa fosse mero resultado do envelhecimento,
o que poderamos prever? Por exemplo, poderamos prever que a interrupo da fertilidade
fosse comum em outras espcies. Entretanto,
no o que ocorre, na grande maioria das espcies, as fmeas no param a reproduo ou
s deixam de reproduzir ao quando esto muito
velhas, quase morrendo. E se a hiptese de
Diamond estiver certa, o que podemos prever?
Poderamos prever que haveria vantagem na

11

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Embora as evidncias possam ser divididas em


quatro tipos, as pesquisas geralmente so sistmicas, incluindo evidncias factuais, estatsticas ou contextuais, pois as questes normalmente envolvem diversas hipteses que devem
estar articuladas de forma coerente. Alm disto,
h situaes intermedirias (fig. 1.5). Por exemplo, trs evidncias factuais podem ser mais
fortes que uma evidncia factual; no chega a
ser uma evidncia estatstica, mas vai nesta
direo. A dependncia entre unidades amostrais pode ser considerada to fraca que um
problema contextual pode ser tratado como um
problema estatstico simples, mas na verdade
esta uma situao intermediria. Uma evidncia factual rica em detalhes pode ser vista como
uma evidncia sistmica. H sempre consideraes sistmicas em qualquer tipo de evidncia.
Por exemplo, voc confia que os dados de um
estudo so verdadeiros com base na reputao
do pesquisador. Portanto, todas as evidncias
so parcialmente sistmicas.

1.5 Validao de evidncias


Quando a polcia chega cena de um crime
imediatamente isola a rea. A entrada de alguma pessoa que mudasse a posio da arma do
crime poderia anular a validade de uma evidncia. Tambm na pesquisa necessrio se verificar a validade de evidncias. Aps a apresentao se seus resultados, as pessoas podem te
perguntar: voc tem certeza que os instrumentos estavam calibrados corretamente?; Como
voc coletou estas amostras?; Que teste estatstico voc usou na anlise?, etc. A validao
da evidncia uma argumentao defendendo
que podemos confiar nela a partir da forma
como procedemos para obt-la. H diferentes
tipos de validao:
1) Validao da medida. As medidas foram
realmente confiveis? Se h dvidas sobre a
calibragem de um instrumento, a medida ter
que ser descartada e o experimento repetido.
Na hora de entrar dados em um computador
necessrio redobrar a ateno e ainda assim
temos que verificar cuidadosamente que no
houve erros de digitao. Nem preciso se
explicar a importncia destes procedimentos em
uma pesquisa sria. Estes so os aspectos
mais bvios da validao da medida, o que no
significa que no sejam muito importantes.
O que abordaremos aqui um aspecto mais
sutil da validao da medida: a preocupao
com variveis operacionais tendenciosas em
relao s respectivas variveis tericas. As
variveis tericas so aquelas da hiptese e
que dizem respeito relao em estudo,
ainda que no possam ser diretamente medidas. As variveis operacionais so aquelas
efetivamente medidas (so as variveis da
previso e da evidncia). Quando uma varivel
da hiptese pode ser medida diretamente, no
existe a distino, mas comum que haja a
separao. Vejamos um exemplo. Sua hiptese
que a Taxa de Atividade (TA) de um lagarto
insetvoro muda em relao disponibilidade de
alimento (DA). Para isto, voc mede quanto
cada lagarto se deslocou em uma hora (D) e
pesa os insetos (PI) que capturou com armadi-

Figura 1.5- A diviso das evidncias em quatro tipos uma


simplificao didtica til. Entretanto, existem situaes
intermedirias entre estes quatro tipos. Em geral as pesquisas
so sistmicas, pois envolvem vrias hipteses relacionadas
entre si

12

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas
V. dep

lhas de cola no centro do seu territrio de forrageio. As medidas de D e PI parecem ser equivalentes a TA e DA, mas no so idnticas e as
diferenas podem comprometer a interpretao.
Por exemplo, voc no encontra relao e considera isto evidncia contrria sua hiptese.
Entretanto, isto poderia ser um erro de escolha
de varivel operacional. Imagine que a mudana de atividade ocorresse na durao da atividade diria e no em deslocamento por hora e
os insetos capturados nas armadilhas podem
no ser as mesmas espcies da dieta do lagarto. A m escolha de variveis operacionais pode
levar a erros de interpretao sobre relaes
previstas para variveis tericas.

Binrio
(Categ. de 2)

Categrico

Ordinal ou
Quantitativo
Condio NP

Quantitativo
Condio P

Tabela de
Contingncia (TC)
(b) Graf: Se
Seo III

Mann- Whitney;
Cochrans TT (c)
Graf: Seo IV

Teste t (de 2
grupos) (d)
Graf: Seo IV

Tabela de
Contingncia (b)
Graf: Seo III
Dicotomizar VI ou
ar teste
t
VD e usar
apropriado (Max.
Balano) (g)

Kruskal-Wallis
(e)
Graf: Seo IV

Anlise de
Varincia (f)
Graf: Seo IV

Correlao de
Postos/ RNL(h)
Graf: Seo V

Correlao de
Postos/ RNL(h)
Graf: Seo V

Correlao de
Postos/ RNL(h)
Graf: Seo V

Pearson/
Regresso
Linear/ RNL (j)
Graf: Seo V

V. ind.

Binrio
(cat. de 2)
Categrico

Teste de 2 prop.,
T. Exato de
Fisher ou T.C. (a)
Graf: Seo III
Tabela de
Contingncia (b)
II
Graf: Seo III

Ordinal

Mann- Whitney;
Cochrans TT (c)
Graf: Seo VI

Quantitativo

Regresso
Logstica (i)
Graf: Seo VI

Dicotomizar VI ou
VD (Max. Balano)
(g)

Figura 1.7- Esquema de uma tabela para escolha de testes


simbolizando a validao de anlise.

vel para uma planta? As espcies do estudo


foram identificadas corretamente? Se as incertezas sobre medidas so uma fonte de dvida
(e isto bastante comum), essencial explicar
bem como ela feita nos mtodos e por que
voc acredita que sua medida representa bem o
que ela deveria representar. Algumas vezes,
parte do estudo inclui uma verificao disto. No
exemplo do estudo comparando a capacidade
de nadar de meninos e meninas, voc poderia
pedir para uma parte dos estudantes nadar em
uma piscina rasa. Sua medida ser vlida se
meninos e meninas no diferirem na taxa de
respostas falsas nos questionrios. (Obs: A
validao da medida refere-se a medidas individuais; a validao de medidas coletivas Validao Externa, o que ser explicado adiante.)

A validao da medida no um problema apenas de variveis quantitativas. Imagine que


perguntamos para estudantes se eles sabem
nadar, juntamos os dados, analisamos com
testes estatsticos e conclumos que os meninos
sabem nadar com frequncia significativamente
maior que as meninas. Mas ser que o resultado indica uma maior habilidade em nadar ou
mais vergonha de admitir que no sabe?
Em muitos estudos, a medida a maior fonte de
incertezas. Quando ns utilizamos um coeficiente de inteligncia, estamos realmente medindo
inteligncia? O nmero de pegadas de predadores em uma praia pode ser considerado um
indicador de presso de predao sobre ovos
de tartaruga? A concentrao medida de fsforo
total no solo realmente reflete o fsforo dispon-

2) Validao de anlise. A abordagem matemtico-estatstica escolhida realmente apropriada para a interpretao dos resultados?
Podemos errar na escolha e na forma de aplicar
testes estatsticos, mas fcil aprender a evitar
isto para as anlises mais comuns na pesquisa.
Nos captulos 4 e 5 apresentaremos as bases
conceituais para a escolha e aplicao de testes. Exemplos de erro: utilizar um teste sem
considerar suas premissas ou basear-se apenas em grficos de barras ou em propores
para concluir algo que exige um teste ou intervalos de confiana. A utilizao de testes fracos
onde testes poderosos poderiam ser aplicados
tambm um erro, embora seja menos grave
(cap. 7). A figura 1.7, tirada da apostila de prtica, simboliza esta forma de validao pela escolha correta do tipo de teste em funo da
natureza dos dados.

Figura 1.6- Um paqumetro simbolizando a validao da


medida.

13

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

3) Validao Interna ou Independncia Interna. A forma como os dados foram coletados


previne explicaes alternativas concluso?
Se eu sempre pescar muitos peixes no lago A e
voc sempre pescar poucos peixes no lago B
podemos afirmar com segurana que no lago A
tem mais peixes? Quem garante que ns dois
temos a mesma habilidade de pescar? Dvidas
deste tipo podem anular a validade de uma
pesquisa cientfica. Note que estamos analisando a possibilidade de um problema interno
comprometer a validade de um estudo. Este
problema seria resolvido se nossos esforos
amostrais fossem iguais nos dois lagos, tornando o resultado independente de uma eventual
diferena de habilidade de pescar. Sem planejamento amostral, existe o risco de que todos os
dados de um estudo precisem ser coletados
novamente. A independncia interna geralmente simples em estudos experimentais e uma
das mais complexas em estudos observacionais. Ela ser discutida nos captulo 3 e 6.

uma amostra de intenes de voto para presidente de 1000 pessoas do Amazonas e uma
amostra de 1000 pessoas bem espalhadas por
todo o Brasil. Qual delas uma amostra mais
confivel para falarmos da inteno de votos
dos brasileiros? Voc se surpreenderia se os
resultados fossem muito diferentes? Os de dentro (a amostra) so igualmente representativos
dos externos (toda a populao) nas duas
situaes? H dois tipos de Validao Externa:
Validao Externa por Representatividade.
Medidas coletivas (ou parmetros populacionais) so aquelas obtidas com um conjunto de
dados de uma varivel, como o peso mdio de
crianas recm-nascidas ou a frequncia de
intenes de votos em determinado local, momento ou situao particular. Elas geralmente
so feitas com base em amostras. A validao
externa de medidas coletivas depende basicamente de tcnicas de se obter uma amostra
representativa da populao, como no exemplo
das intenes de votos. Fala-se em Independncia Externa quando se aplica estas tcnicas
porque a representatividade anula os efeitos
tendenciosos de agrupamentos espaciais, temporais e de situao. Voltaremos a discutir representatividade no captulo 3.

4) Validao Externa ou Independncia Externa. At que ponto as concluses com base


em uma amostra (dados efetivamente coletados) podem ser extrapoladas? Voc poderia ter

Validao Externa por Razoabilidade. Muitas vezes impraticvel ou at impossvel se


realizar uma amostra representativa, entretanto, pode ser razovel se generalizar a partir de
premissas tericas. Esta situao mais justificvel quando o estudo aborda relaes entre
variveis.
At onde podemos ir com as concluses de
um estudo? Se eu concluir que machos de
uma espcie de borboleta so mais ativos que
fmeas da mesma espcie em uma determinada rea de estudo baseado em coletas feitas em janeiro de 2006, o que razovel se
supor?: a) Os machos desta espcie so mais
ativos que as fmeas todos os anos?; b) Os
machos desta espcie so mais ativos que as
fmeas durante o ano todo?; C) Os machos
so mais ativos que as fmeas 1 km dali? (e
10? e 100? e 1000?); d) Outras espcies do

Figura 1.8- Esquema de coleta simbolizando o planejamento amostral que objeto de anlise da validao
interna.

14

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

mesmo gnero tm machos mais ativos em


janeiro?; e) Espcies desta famlia tm machos
mais ativos em janeiro? E se o estudo do comportamento da borboleta fosse feito em um laboratrio? As observaes ainda seriam representativas do comportamento na natureza?

temperaturas altas e apenas machos dos 20


ovos mantidos a temperaturas baixas e voc
conclui que nesta espcie o sexo determinado
pela temperatura no desenvolvimento. Se esta
for sua concluso, voc estar extrapolando
para a espcie com base em apenas uma fmea e a partir de um experimento em condies
artificiais de laboratrio. Se esta no for a sua
concluso, cuidado, voc est sofrendo de uma
doena comum chamada paranoia metodolgica disseminada at mesmo em alguns cursos
de metodologia e de estatstica superficiais.
Generalizar a partir de um indivduo algo inaceitvel em muitas situaes, mas no em todas, e no nesta em particular. Ao demonstrar
estatisticamente que isto ocorre em um indivduo, temos evidncia factual para a espcie,
pois sabemos que a determinao do sexo
uma caracterstica da espcie que no varia
entre indivduos. As condies artificiais de um
laboratrio precisam ser levadas em conta em
muitos casos, mas difcil imaginar como elas
poderiam influir na razo sexual se ela fosse
cromossmica do tipo 1:1. O contexto biolgico
nunca deve ser esquecido quando seguimos
diretrizes metodolgicas.

Obviamente, quanto mais distante da situao


estudada, maior o risco da extrapolao, mas
este risco pode ser avaliado, ainda que grosseiramente, com base no que voc j sabe sobre
borboletas. Se restringirmos nossas generalizaes ao universo amostrado, no h problema
de validao externa. Entretanto, qual o interesse do comportamento de borboletas da sua
rea de estudo em janeiro de 2006 se no podemos generalizar? Poderamos coletar em
outras pocas e outros locais, mas isto pode
no ser praticvel e permaneceria a limitao
de no poder generalizar alm das pocas e
locais dos estudos. Generalizar alm do razovel um erro, mas no generalizar tambm
um erro.
Tomemos um exemplo mais extremo, a generalizao a partir de uma observao. Imagine
que voc encontrou uma tartaruga de uma espcie rara colocando seus ovos em um ninho
em uma praia. Voc leva estes ovos para o
laboratrio para verificar se a determinao do
sexo influenciada pela temperatura durante o
desenvolvimento. Ao final do experimento, nasceram apenas fmeas dos 20 ovos mantidos a

A generalizao por razoabilidade parte intrnseca da pesquisa. Por exemplo, comum se


utilizar ratos para iniciar estudos sobre remdios
para humanos porque: a) a tica nos impede de
comear com humanos; b) o custo de manuteno de ratos em biotrios relativamente baixo;
c) os ratos tambm so mamferos, e devem ter
uma fisiologia semelhante em algum grau. Precisamos avaliar caso a caso at que ponto
razovel generalizar e ter conscincia que a
generalizao pode estar errada. A validao
externa por razoabilidade inclui argumentos,
citaes e dados adicionais que justifiquem a
generalizao.

Figura 1.9- Esquema representando a generalizao de um


estudo especfico para concluses mais gerais, simbolizando a validao externa.

15

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

1.6 Estatsticas intuitiva e


frequentista
Alguns textos sugerem que cursos de estatstica so necessrios devido dificuldade
dos crebros humanos em lidar com probabilidades. Ser que nossa estatstica intuitiva to ruim assim? Ao contrrio, somos
muito bons, pois a sobrevivncia de animais
em geral e dos animais com melhores capacidades cognitivas em particular depende
destes clculos intuitivos. Acontece que h
uma diferena entre a estatstica intuitiva e
a formal mais utilizada em pesquisas. Veremos nesta seo como esta estatstica
intuitiva est em nosso cotidiano e como a
estatstica formal mais comum difere dela.

Figura 1.10- Trs tipos intuitivos de deciso utilizados em problemas


do cotidiano que tambm so usados na pesquisa.

acha que valeu a pena porque ele est ficando


mais dourado que no seu preparo usual. Sua
me deveria ter chegado h meia hora, esta
observao te faz ligar para ela para saber se
houve algum problema. Cada uma destas atitudes simples est carregada de estatstica intuitiva.

Quando atravessamos uma rua, calculamos a


velocidade do carro que vem em nossa direo,
a sua distncia, o tamanho da rua e o tempo
que levaremos para chegar ao outro lado e
ento cruzamos a via, com a maior naturalidade. Imagine a complexidade e rapidez dos clculos que realizamos durante uma partida de
tnis ou para dirigir um automvel no meio de
outros carros e dos pedestres que atravessam a
rua. Esta matemtica instantnea e sem nmeros desenvolveu-se ao longo da evoluo, pois
quanto mais precisos os clculos intuitivos,
maior a chance de sobrevivncia, sucesso social e reprodutivo.

No nos damos conta da complexidade dos


clculos envolvidos nas decises do cotidiano.
Usamos nossa estatstica intuitiva para atribuir
valores, sintetizar as informaes, decidir se
existe uma relao entre determinadas variveis
e construir modelos de previso e de controle.
O termo estatstica intuitiva no implica que
nascemos com ela, da mesma forma que no
nascemos andando, na verdade nascemos com
o potencial, mas uma capacidade que vamos
desenvolvendo. Se pensarmos bem a estatstica intuitiva, algo to impressionante como a
nossa capacidade de andar sobre duas pernas
ou de nos comunicar com palavras.

Parte desta matemtica intuitiva transformada


em estatstica intuitiva, utilizada na tomada de
decises do cotidiano. Por exemplo, voc est
saindo de casa e percebe que h nuvens carregadas, volta e pega um guarda chuva. No mercado voc vai pagar as compras, escolhe a fila
com menos carrinhos, mas muda de fila porque
percebe que os carrinhos da frente esto muito
cheios. No caminho de volta, voc reconhece e
cumprimenta uma pessoa que no via h uns
10 anos; ela est um pouco diferente, mas quase no envelheceu. Preparando a janta, voc
avalia que o peixe no forno ainda no est pronto com base no cheiro e na consistncia. Conclui ainda que est demorando e que a demora
pode ter sido por no ter coberto o peixe, mas

Podemos dividir estas decises em trs tipos de


Valor, de relao e de ao (Fig. 1.10). H decises de valor, como nas expresses nuvens
muito carregadas, carrinhos muito cheios ou
no reconhecimento de uma pessoa (esta pessoa=Joo). Parece natural, mas pense na complexidade que reconhecer uma pessoa. O
atraso da me foi percebido em funo de uma
medida de tempo mdio e de atraso mdio que
permitiu medir o atraso como acima do nor-

16

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

mal. Outras decises so de relaes entre


variveis, que nos so ensinadas ou que aprendemos ou percebemos por conta prpria. Por
exemplo, a relao entre a quantidade de nuvens e a probabilidade de chover ou entre o
cheiro do peixe e ele estar pronto para ser consumido. Outras decises so de ao, como
pegar o guarda chuvas, mudar de fila ou telefonar para a sua me.

voc gostaria de casar, mas teme muito a possibilidade separao; qual a chance disto
ocorrer? Se voc quisesse uma avaliao do
tipo que se usa mais nas pesquisas cientficas,
voc teria que casar com ele (a) umas 30 vezes
em condies semelhantes atual e verificar a
taxa de sucesso para tomar uma deciso com o
tipo de estatstica que vamos trabalhar neste
curso. Naturalmente que isto impossvel neste
exemplo e em muitas situaes do cotidiano,
mas bem mais comum isto ser possvel na
pesquisa, especialmente em estudos experimentais.

Para entender como uma deciso envolve um


clculo, analise o exemplo do guarda chuva.
Depois da deciso de valor de considerar que o
que voc viu eram nuvens muito carregadas e
depois de ter estabelecido (ainda na sua infncia) a relao entre a quantidade de nuvens e a
probabilidade de chuvas, voc vai aplicar este
conhecimento a uma deciso de ao. A deciso de ao de pegar o guarda chuva depende
da avaliao do custo de pegar o guarda chuvas e no chover contra o custo de no pegar o
guarda chuva e chover. Comecemos pelos extremos: se pegar chuva fosse extremamente
perigoso e o guarda chuva fosse muito leve,
voc simplesmente o levaria sempre; se pegar
chuva no incomodasse em nada e carregar um
guarda chuvas fosse um estorvo, voc nunca o
levaria. Em casos intermedirios, precisamos de
um clculo, intuitivo ou formal. Ilustremos com
um clculo formal. Se voc acha que escapar
de uma chuva vale R$10,00 e que pagaria
R$2,00 para no ter que carregar o guarda chuvas por um dia, ento no levaria o guarda chuvas se a chance de chover fosse de 50% (pois
0,5 x R$10,00 > 0,5 x R$2,00), mas levaria se a
chance de chuva fosse de 90% (pois 0,1 x
R$10,00 < 0,9 x R$2,00). No d importncia
ao clculo exato, o objetivo aqui perceber que
a deciso depende de duas coisas: do custo
que representa cada alternativa de deciso e da
probabilidade de cada alternativa no momento
da deciso.

Na deciso sobre um casamento, s lhe resta


uma abordagem sistmica na qual voc recolhe
informaes relevantes e procura fazer um clculo aproximado de probabilidades. Voc poderia partir das estatsticas de uma taxa recente
de divrcios no Brasil de 20% nos 10 anos iniciais. Entretanto, considerando sua faixa etria e
classe social, voc verifica na pesquisa que a
taxa de 30%, portanto, esta uma estimativa
mais apropriada. Este um risco alto, o que te
coloca em dvida. Ento, voc conversa com
amigos que te tranquilizam lembrando que seu
(sua) pretendente teve relacionamentos anteriores estveis e que no terminaram devido a
alguma briga irracional. Portanto, voc considera que a probabilidade de divrcio com ele (a)
bem inferior aos 30% e aceita a proposta. Esta
probabilidade estimada considerando as informaes contextuais no utilizada apenas no
cotidiano, tambm bastante usada em problemas aplicados, como no clculo do valor de
aplices de seguros, utilizando uma verso
matemtica mais precisa de nossa estatstica
intuitiva chamada Estatstica Bayesiana. Sua
utilizao na pesquisa tem sido relativamente
restrita, mas tem crescido nos ltimos anos,
medida que os pesquisadores vo entendendo
a sua utilidade para uma diversidade de situaes de tomada de deciso.

importante iniciarmos valorizando nossa capacidade de tomar decises, para entendermos


que nossa lgica intuitiva no est errada, apenas difere na aplicao com o que mais feito
na cincia. Imagine que seu namorado ou namorada lhe pede em casamento. Digamos que

A estatstica intuitiva mais comum uma forma


complexa vlida de pensar, tanto que tem um
equivalente formal, que a estatstica Bayesiana. Entretanto, em condies especiais, quando
podemos obter informaes de dados com re-

17

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

peties de unidades amostrais independentes,


e dentro de premissas metodolgicas bem definidas, temos uma alternativa bem mais objetiva
e poderosa para estabelecer relaes que
chamada Estatstica Frequentista. Vamos
explicar o seu funcionamento a partir do captulo 3. Neste livro, como na grande maioria dos
cursos bsicos de estatstica, apenas trataremos de clculos de probabilidades frequentistas. Entretanto, a estatstica intuitiva tambm
usada quando utilizamos a frequentista. No
faremos clculos matemticos Bayesianos, mas
utilizaremos avaliaes de premissas qualitativas que chamaremos de Razoabilidade, como
fizemos na seo 1.5 na validao externa por
razoabilidade.

O ideal que a populao estatstica seja muito


bem delimitada, como no exemplo das intenes de voto, mas nem sempre isto possvel.
No exemplo de borboletas da seo anterior
dificilmente se conseguiria coletar em toda sua
rea de ocorrncia, e no seria possvel se
coletar borboletas no futuro ou no passado. Por
isto, a delimitao assumida como borboletas
pertencentes a determinada espcie tem a
premissa que as do presente e do local do estudo so representativas tambm de outros
lugares e tempos, premissa cuja validade depende de reflexo com base na razoabilidade
biolgica.
Os elementos da populao estatstica que
constituem a amostra so denominados Unidades Amostrais. A amostra com todos os elementos que entraram no estudo pode ser dividida em amostras menores com base em alguma
caracterstica das unidades amostrais. Por exemplo, podemos dividir a amostra borboletas
em funo do sexo e obtemos uma amostra de
machos e uma amostra de fmeas. Podemos
dividir a amostra de intenes de votos de uma
ampla pesquisa no Brasil em 27 amostras (uma
para cada estado). Ao fazermos isto, tambm
estamos dividindo a populao estatstica em
populaes estatsticas. No podemos dizer
que h uma populao biolgica de machos de
borboletas, mas podemos dizer que h uma
populao estatstica de machos de borboletas.

1.7 Da amostra populao.


O objetivo da anlise estatstica frequentista de
dados fazer as concluses mais fortes possveis com segurana sobre uma populao
estatstica com base nos dados disponveis
(amostra ou amostras) (Motulsky, 2010).
J falamos superficialmente em populaes e
amostras na seo anterior, vamos aprofundar
um pouco mais. Uma populao estatstica
um conjunto completo de entidades que se
pretende estar envolvendo em uma anlise.
Em contraste, a amostra o subconjunto da
populao estatstica efetivamente utilizado
na anlise.

Frequentemente, as concluses estatsticas


envolvem parmetros populacionais. Um Parmetro uma medida coletiva quantitativa de
alguma propriedade da populao, como a mdia do tamanho das borboletas macho. Outros
parmetros incluem nmero de indivduos da
populao, a razo sexual, o grau de dimorfismo sexual, a proporo de eleitores dispostos a
votar em certo candidato e coeficientes de modelos que descrevem relaes. Abordaremos
mais profundamente parmetros populacionais
no captulo 3.

importante no confundir o termo biolgico/


geogrfico de populao com o termo Populao Estatstica. Em um estudo sobre intenes
de votos para presidente do Brasil, a populao
estatstica o conjunto de intenes (imagine
uma caixa com papis com declaraes de
inteno de voto de cada eleitor em determinado momento). Se preferir imaginar como pessoas, ento imagine uma pessoa-momento. Note
que a populao estatstica no realmente a
populao brasileira, pois a populao que vai
votar praticamente no muda de um ms para
outro, mas as intenes podem mudar bastante
ao longo do tempo.

Esta seo apenas introduz um assunto que


ser tratado mais profundamente no captulo 3.
Em geral, trataremos de anlises de estudos

18

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

1.4- b. Ninhos de cupins. Voc percebe que algumas espcies de cupins fazem seus ninhos no alto
de rvores enquanto outras espcies fazem ninhos
no solo com uma parte do ninho acima do solo e um
terceiro grupo de espcies fazem ninhos completamente subterrneos.

com coletas dirigidas para testes de hipteses,


entretanto, conveniente destacar que nem
sempre assim. Muitas pesquisas esto centradas em uma coleta temtica, como o Censo
do Instituto Brasileiro de Geografia e Estatstica.
Trata-se de uma pesquisa planejada que aborda muitas perguntas ao mesmo tempo, que
sero avaliadas de uma forma integrada. H
ainda pesquisas em que os dados vm antes
das perguntas, como no caso de descobertas
acidentais ou no caso de uma coleta de reciclagem na qual estudamos uma base de dados
que no coletamos, como um estudo sobre a
evoluo da caa em uma determinada regio
cujos dados so provenientes dos registros de
comrcio de peles.

1.4- c. Lua: Voc sabe que a variao nas fases da


lua tem efeitos sobre muitos animais. Ento voc se
pergunta, ser que a lua tambm tem efeito sobre
plantas?
1.5- Explique o que uma previso exclusiva
1.6- Cite problemas originais que envolvam uma
evidncia: a) factual; b) estatstica simples; c) contextual d) sistmica.
1.7- Explique um exemplo original de pesquisa em
que as concluses so suspeitas devido a incertezas na validade das medidas.

Exerccios:

1.8- Qual a diferena entre um problema de validao interna e um problema de validao externa?

1.1- O uso da estatstica na pesquisa foi comparado


com o uso de meios de transporte e de um microscpio. Explique a analogia.

1.9- O que paranoia metodolgica?

1.2- O que um problema complexo e por que o


fato dele ser complexo no implica que seja de difcil
soluo.

1.10- Por que os problemas de validao da medida


e de validao interna normalmente so mais graves
do que problemas de validao analtica e de validao externa ao longo de uma pesquisa?

1.3- Algumas pessoas afirmam que os homens no


conseguem desenvolver atividades complexas como
as mulheres. Puro preconceito. Se for dado tempo
suficiente e assessoria adequada, os homens podem desenvolver atividades igualmente complexas.
Explique por que preparar uma festa de criana
um problema complexo e quais partes deste problema podemos terceirizar.

1.11- Por que evolumos com uma alta capacidade


de realizar clculos estatsticos intuitivos e falhamos
em algumas questes estatsticas cotidianas banais.
1.12- Cite exemplos originais de decises: a) de
valores; b) de relaes; c) de aes.
1.13- Explique a diferena entre a estatstica intuitiva
e a estatstica mais utilizada em pesquisas cientficas (frequentista).

1.4 Reflita sobre os temas abaixo e pense em um


estudo (para cada um) na forma de um problema
(um aspecto relevante do tema a ser desenvolvido).
Com base nisto: a) defina o problema que ser abordado; b) levante uma hiptese dentro deste problema; c) faa uma previso para testar esta hiptese.

1.14- Por que nem sempre possvel delimitar bem


uma populao estatstica? Em que sentido isto
atrapalha na obteno de uma amostra representativa e na determinao de um parmetro populacional?

1.4- a. Micorrizas: Suponha que voc descobriu as


Endomicorrizas*, mas ainda no sabe o que so. O
que voc percebeu foi a existncia de muitos esporos de fungos no solo que aparentemente esto
ligados s razes. (Se no sabe o que so endomicorrizas, comece com uma pesquisa na internet)

19

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

tos), como para uma entidade particular (gato


no23). Trata-se de um conceito to bsico, que
raramente discutido em metodologia e estatstica. Entretanto, como veremos, til deix-lo
explcito. As entidades tambm podem ser
chamadas de casos, membros de uma populao, indivduos, itens, espcimes, objetos, observaes, unidades amostrais, etc.

2. Do problema biolgico ao
estatstico.
Os livros de estatstica vm com exemplos
prontos para a anlise de dados. Entretanto,
uma das maiores dificuldades dos estudantes
a transformao de problemas biolgicos (ou de
outras cincias, ou cotidianos) em problemas
estatsticos. Neste captulo, descreveremos
sucintamente a Abordagem EPR (Entidade,
Propriedade e Relao) de Macnaugton (2002)
que ajuda a transformar problemas biolgicos (e
outros) em problemas estatsticos. Macnaughton mostrou que h alguns conceitos to bsicos que passam despercebidos, e que so chaves para se compreender como se monta um
problema antes de iniciar o planejamento de
coleta de dados e para determinar quais sero
os testes mais adequados anlise dos dados
obtidos. Vejamos estes conceitos.

Alguma confuso pode surgir quando h uma


derivao imprpria de um substantivo para um
adjetivo ou vice-versa. Por exemplo, a palavra
burro designa um animal, mas pode ser usada
como adjetivo, referindo-se a uma pessoa, e a
palavra azul normalmente um adjetivo, mas
na frase o azul lindo ela um substantivo.
Na frase o pssaro da cor azul a expresso
da cor azul tem a funo de adjetivo para pssaro. Na frase este pssaro da espcie Pitangus sulphuratus, estamos qualificando a
entidade pssaro com a expresso da espcie
P. sulphuratus, enquanto na frase P. sulphuratus uma espcie com distribuio ampla, P.
sulphuratus uma entidade. O que vale em
EPR a classe gramatical no contexto.

2.1 Entidades
Se voc prestar ateno aos seus pensamentos
cotidianos em um dado momento, provavelmente concordar que estamos pensando sobre
diversos tipos de coisas. Por exemplo, neste
minuto voc poderia estar pensando em um
amigo ou em um compromisso que tem marcado para a tarde. Estas coisas so exemplos de
entidades (Fig. 2.1).
Existem muitos tipos de entidades: Objetos
fsicos reais simples (montanhas, automveis,
lagos, pessoas, rvores) ou coletivos (cadeias
de montanhas, florestas, alcateias, turma de
alunos; populao; conjunto de elementos em
um grupo, espcie biolgica); Objetos imaginrios (fadas, universos paralelos, teorias, conceitos); Processos/aes (um experimento, uma
reao qumica, uma reunio, um beijo; uma
viagem, a fora necessria para levantar certo
objeto). Cada tipo de entidade uma categoria
que nomeia diversas entidades unitrias (montanha 1, montanha 2, etc.)

Figura 2.1- Entidades so "coisas" em que pensamos, como


rvores, beijos e unidades amostrais, s quais podemos atribuir propriedades

As entidades tm um papel fundamental no


pensamento. Na gramtica so sempre substantivos, tanto para os tipos de entidades (ga-

20

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Os valores das propriedades podem ou no


variar entre as entidades dentro de um estudo.
Por exemplo, em um estudo sobre pessoas,
todas as entidades necessariamente possuem
as propriedades comuns aos Homo sapiens,
como respirar com pulmes e ser incapaz de
voar batendo os braos. No seu estudo, todos
os indivduos poderiam compartilhar a mesma
nacionalidade e o fato de possurem sapatos,
seja pela contingncia da populao acessvel
ao estudo, seja por uma definio prvia estabelecida por voc acerca de que caractersticas
teriam os indivduos selecionados para fazer
parte da amostra.

2.2 Propriedades
Cada tipo de entidade tem associado a ela uma
gama de atributos ou propriedades (Fig. 2.2).
Carros tm peso, cor, marca e ano de fabricao. rvores tm altura, nome da espcie, posio em um mapa. Bandos de passarinhos tm
um nome da espcie, um nmero de indivduos,
uma razo sexual. Cada entidade tem um valor
para cada propriedade (no existe carro sem
peso, podemos at no saber o valor, mas ele
existe).
Propriedades tambm so chamadas de aspectos, atributos, caractersticas, fatores, qualidades ou tratamentos. Os nomes das propriedades geralmente so substantivos que nomeiam
qualificadores (localizao, cor, beleza, idade,
velocidade, quantidade, valor de pH). As propriedades tambm podem ser aes realizadas ou
sofridas (ou no) por uma entidade. Por exemplo, tomar chocolate (sim ou no) propriedade na frase fulano tomou chocolate. Os nomes
de propriedades tambm podem ser abreviaes de aes. Por exemplo, a propriedade
tomou chocolate (s/n) torna-se apenas Chocolate (s/n).
Os valores das propriedades so adjetivos
(vermelho, velho, rpido, grande, brasileiro,
estudioso), advrbios (aqui, agora, longe, mal,
sim, no, talvez, muito, pouco), numerais com
funes quantitativas, ordinais ou de rtuloplanta no 135 e datas), s vezes smbolos
(,, ou O+), e at substantivos. Quando os
valores so substantivos, eles tm funo qualificadora, isto , tem papel de adjetivo. As propriedades origem, local de formao e espcie
para a entidade pessoa tem os valores Brasil,
USP e Homo sapiens que substituem os adjetivos brasileiro, Uspiano e humano. Como vimos na seo anterior, a espcie Pitangus sulphuratus um substantivo, mas faz parte da
funo qualificadora na expresso aps o verbo
na frase este pssaro da espcie P. sulfuratus.

Outras propriedades variam entre entidades,


como a altura, o sexo e o meio de transporte
mais utilizado por pessoas. Estas propriedades
so chamadas Variveis. A variao nestas
propriedades tem causas e consequncias que
podem ser investigadas. As propriedades a
serem avaliadas precisam variar no banco de
dados do estudo. Voc no poderia estudar a
diferena na utilizao de transporte pblico
entre os sexos se apenas entrevistar pessoas
de um sexo, nem poderia estudar o efeito de um
tratamento se no tiver indivduos sem o tratamento (controle).

Figura 2.2- Propriedades so atributos das entidades.

21

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

2.3 Tabelas e grficos EPR

de resultados.

As tabelas ou planilhas EPR so as tabelas com


nossos dados organizados em entidades (linhas), propriedades (colunas) e valores (clulas
da tabela). Em uma tabela EPR cada entidade
aparece apenas uma vez e as propriedades
so variveis que sero relacionadas ou que
participaro da anlise de outra forma. A tabela
EPR mais que um
local para depositar
os dados, ela uma
Tamanho Sexo
tabela conceitual que
12
m
sumariza o planeja10
m
mento do nosso pro11
f
jeto, de forma que
11
f
deve ser planejada
preferencialmente
antes da coleta de Figura 2-3- Nas tabelas EPR, as
so entidades e as colunas
dados, tendo em linhas
so propriedades. A seta indica
vista as relaes uma relao.
que queremos verificar.

2.4 Relaes entre variveis


Hipteses so testadas a partir de suas previses, e as previses mais comuns na pesquisa
envolvem a relaes entre duas variveis, a
Varivel Preditora (ou Independente), cuja
variao influi sobre os valores de uma Varivel
Resposta (ou Dependente), se sua hiptese
estiver correta. Para determinar quais so estas
variveis em seu estudo, pergunte a si prprio:
pela minha hiptese o qu (qual fator ou varivel) influencia sobre o qu (qual varivel)? Por
exemplo, se estamos testando a capacidade de
borboletas distinguirem entre cores semelhantes pela previso que a cor da armadilha (vermelhas ou amarelas- varivel preditora) atrai
uma quantidade diferente de borboletas (varivel resposta).
Os termos varivel preditora e varivel resposta
se aplicam quando h uma Relao Consequente (ou causal fig. 2.5) entre elas, isto ,
quando a causa da variao da segunda ,
direta ou indiretamente, a primeira. Quando esta
as duas variveis tem uma relao prxima,
ela chamada Relao de Causa Proximal, e
quando distante, chamada Relao de
Causa Final. Por exemplo, em anos com pouca
chuva, alguns lagos secam causando a mortalidade generalizada dos peixes. A causa proximal
da morte dos peixes a falta de gua para os
peixes poderem respirar e no ressecar e a
causa final a variao climtica. Uma pessoa
pode perder seu emprego porque a sua produtividade foi abaixo da mdia (causa proximal),
mas isto s aconteceu em funo da necessidade do banco cortar custos devido crise bancria (causa final). Em estudos biolgicos, a
causa proximal costuma ser fisiolgica ou comportamental e a causa final costuma ser ecolgica ou evolutiva.

Tamanho

Os grficos EPR so grficos cartesianos cujos


eixos so propriedades (as variveis em estudo)
e as entidades so representadas, cada uma
delas, por um ponto situado no grfico em funo dos seus valores das propriedades (e. g.
diagrama de disperso e dot density). Alm
dos eixos, as propriedades tambm podem ser
representadas por diferentes cores ou smbolos
(e. g. e ).
Janeiro ( ) Julho ( )
So grficos
mais ricos em
informao que
muitos grficos
tradicionais
utilizados na
apresentao
Machos

Fmeas

Figura 2-4- Nos grficos EPR, as variveis (propriedades)


so os eixos dos grficos e as entidades so os pontos.
Variveis adicionais podem ser apresentadas na forma de
cores ou simbolos.

22

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Algumas previses envolvem duas variveis


(Covariveis) que tem uma Relao Inconsequente (ou correlao), isto , a variao em
uma no influi sobre o valor da outra, mas as
duas podem covariar (variar ao mesmo tempo)
em resposta a uma terceira varivel. Por exemplo, podemos verificar se existe uma relao
entre as cores das roupas que uma pessoa
prefere vestir e o seu sucesso em desempenhar
tarefas em grupo. A constatao que a relao
existe no implica que as cores causam o sucesso, mais provvel que uma terceira varivel, talvez o grau de otimismo da pessoa tenha
influncia sobre as cores que ela usa e sobre a
sua tendncia a ter sucesso em tarefas em
grupo. Estudos com previses conscientes sobre relaes inconsequentes so vlidos, como
no exemplo acima, entretanto, uma falha comum achar que a existncia de uma relao
implica uma causalidade, isto , mesmo encontrando a relao entre roupa e sucesso, no
podemos prever que mudando a cor da roupa
de uma pessoa haver mudana no sucesso
em atividades em grupo. Uma expresso importante em estatstica Correlao no implica
causalidade, isto , cuidado para no confundir
relaes inconsequentes com relaes consequentes.

a relao entre as variveis preditora e resposta


eliminando ou controlando o efeito das outras relaes. Em estudos experimentais, nos
quais manipulamos o valor da varivel preditora
(e. g. quantidade de certo elemento qumico em
vasos) e medimos a velocidade de crescimento
de uma planta, possvel ter segurana que a
relao encontrada, se houver, uma relao
consequente. Em estudos no experimentais,
isto , naqueles em que no manipulamos a
varivel preditora, normalmente no podemos
ter esta segurana. Por exemplo, se voc comparar a taxa de crescimento de plantas em funo da quantidade de certo elemento qumico
no solo na natureza, voc no pode ter certeza
que a relao encontrada, se houver, causal,
pois possvel que as duas variveis sejam
influenciadas por uma terceira varivel. Possivelmente a umidade no solo tenha um efeito
sobre o crescimento da planta e sobre a quantidade de algum elemento qumico, causando
uma relao inconsequente entre estas duas
variveis. Embora correlao no implique causalidade, ela pode ser uma evidncia importante
dentro de um estudo sobre relaes causais,
desde que tenhamos a conscincia que as concluses em estudos no experimentais dependem de cuidados redobrados (cap. 6).

A relao entre duas variveis pode ser obscurecida ou confundida pela existncia de outros
fatores (conhecidos ou no) influenciando nos
valores da varivel resposta, por isto, um dos
desafios em um estudo conseguir estabelecer

2.5 A estatstica para estabelecer


relaes.
Muitos estudos biolgicos envolvem previses
com uma varivel preditora e uma resposta ou
com duas covariveis. O conjunto de tcnicas
utilizadas nesta situao denominado Estatstica Bivariada (Fig. 2.6). Alguns problemas so
mais complexos, ou tratados de forma mais
complexa, incluindo na anlise mais de duas
variveis ao mesmo tempo para uma descrio
ou teste. O conjunto de ferramentas para estes
problemas denominado Estatstica Multivariada. A estatstica multivariada inclui anlises
com uma varivel resposta e mltiplas preditoras e anlises com mltiplas variveis preditoras
e respostas (muitas pessoas utilizam a expresso estatstica multivariada exclusivamente no
segundo caso). H ainda a Estatstica Univariada, que inclui as tcnicas para problemas que

Figura 2-5- Esquema representando diferentes tipos de


relaes (setas) entre variveis (letras A a F). As
relaes R1 a R5 so consequentes e as relaes r1 a r4
so inconsequentes. As relaes ligadas diretamente
por apenas uma seta so de causa proximal e as relaes entre A e D e entre A e F so de causa
final.

23

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

envolvem apenas uma varivel. Na estatstica


univariada, a relao avaliada no com outra
varivel, mas com um valor nico (ou uma distribuio de valores) de referncia ou esperado.
Por exemplo, quando queremos saber se o
nmero mdio de mosquitos da dengue por
armadilha em casas de um bairro est acima do
padro que indica risco de epidemia. Neste
livro, trabalharemos apenas com tcnicas de
estatstica univariada e bivariada (com nfase
na bivariada).

Tabela 2.1- Tabela EPR para avaliar a questo se a


ingesto de chocolate causa espinhas

O primeiro passo no estudo das relaes bivariadas (e multivariadas em geral) montar uma
tabela EPR. Comece com a hiptese (e. g. a
ingesto de chocolate causa espinhas), passe
para uma previso com uma varivel preditora
(tomou chocolate- sim/no) e uma varivel
resposta (nmero de espinhas). A entidade
inicialmente algum ou algo a quem estas
propriedades podem ser atribudas, no caso,
pessoa (pessoa 1, pessoa 2, etc.). Faa uma
coluna para numerar as entidades (opcional),

uma coluna para a varivel preditora e outra


para a varivel resposta e entre os valores para
cada entidade (Tab. 01). Outras colunas com
variveis adicionais (e. g. idade e sexo da pessoa) tambm podem ser includas, desde que
sejam apropriadas para a entidade em questo.
Uma nica planilha pode ser utilizada para testar todas as hipteses que tem a mesma entidade em um estudo, basta que as variveis
envolvidas estejam entre as colunas.
Na tabela EPR, uma entidade no pode
aparecer duas vezes. Se a mesma pessoa tomou chocolate mais de uma vez,
ento a entidade ingesto-pessoa-dia
(ingesto 1, ingesto 2, etc.), e pessoa
opcionalmente pode entrar na tabela
como mais uma propriedade (quem
ingeriu). (Considerando a importncia da
independncia entre unidades amostrais
(cap. 6), normalmente se evita incluir a
mesma pessoa em uma amostra de
vrias pessoas; a tabela pode ser montada, mas a anlise apropriada pode ser
complexa.) Outra possibilidade seria
realizar todo o estudo com uma nica
pessoa, utilizando como entidade dia
(dia 1, dia 2, etc.). Pode parecer estranho que tomou chocolate seja propriedade de dia, mas pense bem, no dia 3
algum tomou chocolate = sim e no dia
7 algum tomou chocolate = no. Esta abordagem de usar apenas uma pessoa tem vantagens e desvantagens que sero discutidas depois, o ponto a ressaltar aqui que diferentes

Figura 2-6- A estatstica bivariada a mais utilizada na


pesquisa, incluindo apenas uma varivel preditora e uma
resposta, entretanto, tambm h anlises que lidam com
mais variveis ou com apenas uma varivel.

24

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

planilhas EPR podem ser utilizadas para analisar a mesma previso (embora no seja exatamente a mesma quando as entidades so
diferentes).

plcita (tomou cerveja?- antes/ depois) e uma


varivel resposta implcita (velocidade).
Para MacNaughton (2002), o papel da pesquisa
emprica descrever relaes para predizer e
controlar valores de propriedades. A seu ver, as
hipteses so sobre relaes (entre variveis ou
em relao a um padro). O teste de sua hiptese feito com base em predies. Se as evidncias apoiam uma hiptese, ento ela pode
ser utilizada como base para outras hipteses e
em na aplicao em problemas prticos, pois
nos permite prever valores.

Nem sempre a determinao da entidade to


fcil como no exemplo do chocolate. Se sua
hiptese que o pH da gua onde as larvas de
mosquitos se desenvolve afeta a sua sobrevivncia, a varivel preditora o pH da gua e a
resposta a sobrevivncia do mosquito, mas
qual a entidade? Pode ser frasco, se voc tiver
vrios frascos diferindo no tipo de gua e com
larvas cuja sobrevivncia ser calculada ao final
do experimento. H outras possibilidades dependendo do que foi sua unidade amostral.
Cuidado com o que vai definir como unidade
amostral. Se voc quer saber se o investimento
em merenda escolar por escola influi no rendimento acadmico, sua unidade amostral escola, no aluno. Portanto, cada linha uma
escola e voc vai utilizar a mdia do rendimento
acadmico por escola.

Pense em problemas prticos. Neste lago pegaremos bastante peixe? Este paciente ser curado? A plantao produzir mais se plantarmos
em abril ou se esperarmos at setembro? Neste
local encontraremos cobras venenosas? Se no
sabemos as respostas (pois no temos uma
mquina de viajar no tempo ou um orculo) e
no podemos esperar o futuro para tomar decises, o que fazer? Se conseguirmos identificar
relaes entre variveis, podemos fazer previses. Se soubermos que lagos de gua branca
sempre tem muito peixe, e que um determinado
lago tem gua branca, ento podemos prever
que provavelmente haver muito peixe nele. Se
soubermos que pessoas que tm temperatura
alta geralmente esto com infeces, e que
uma determinada substncia controla infeces,
podemos predizer que ela provavelmente ter
diminuio na febre e se sentir melhor se tomar esta substncia. Esta ao aparentemente
banal de estabelecer relaes um dos pilares que sustenta a cincia. A explicao outro
objetivo da cincia, mas se pensarmos bem, ela
est intimamente ligada ao estabelecimento de
relaes.

Algumas hipteses envolvem apenas uma varivel, o que implica em uma coluna na planilha
EPR. Considere a hiptese a resistncia de
peixes ornamentais ao transporte influenciada
pelo sexo do peixe. Podemos testa-la com a
previso que partindo de uma populao de 50
machos e 50 fmeas, a proporo de fmeas ao
final ser maior. Sobrevivem 25 machos e 40
fmeas, que uma diferena estatisticamente
significativa. A forma de determinar isto ser
abordada no captulo 5, o que nos importa agora que a concluso baseia-se apenas na varivel sexo (a entidade peixe). H hipteses
com varivel preditora e varivel resposta que
utilizam testes univariados (testes pareados).
Considere a hiptese: a agilidade de adultos do
sexo masculino diminui aps a ingesto de apenas uma lata de cerveja. Sua previso que
a velocidade na execuo de certa tarefa complexa menor depois da ingesto de uma lata
de cerveja. Ento voc mede a diferena de
velocidade antes e depois da cerveja para vrias pessoas. Repare que sua anlise vai se
basear apenas em uma varivel, a diferena de
velocidade, mas h uma varivel preditora im-

25

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

b) A temperatura durante o desenvolvimento


embrionrio afeta a razo sexual em ninhos artificiais de P. expansa.

Exerccios:
2.1- Cite exemplos originais de entidades do tipo
objeto fsico, do tipo entidade coletiva e do tipo processo, com duas propriedades inerentes a cada tipo
de entidade.

c) Motoristas que utilizam insulfilme em seus


carros costumam realizar maior nmero
de contravenes em ambiente urbano.

2.2- Explique, com um exemplo original, por que


algumas palavras podem ter significados compatveis com entidades (substantivo) ou com valores de
propriedades (e. g. adjetivos) dependendo do contexto.

d) A taxa de decomposio da serrapilheira


varia em funo do ambiente (Campinarana, Baixio e Plat) na Amaznia Central.
e) A temperatura na sala de aula influi sobre o
desempenho de estudantes em provas.

2.3- Monte uma tabela EPR que contenha quatro


propriedades cujos valores das propriedades sejam
respectivamente adjetivos, advrbios, numerais e
smbolos. Duas destas propriedades devem ser
variveis e as outras duas no.

f) O pH de um local no qual h acmulo de


gua de chuva afeta a sobrevivncia de
mosquitos.

2.4- Defina uma hiptese, uma previso e faa um


esquema de uma tabela EPR com duas colunas, a
varivel preditora na coluna da esquerda e a varivel resposta na coluna da direita. Inclua valores para
cinco entidades.

g) H dimorfismo sexual de tamanho nas borboletas Capronnieria abretia.

2.5- Faa um grfico EPR para a tabela da questo


anterior com os 5 valores da tabela e outros 15
adicionais.

i) Cigarro causa cncer.

h) A sobrevivncia de gafanhotos verdes


maior do que de gafanhotos marrons na
poca chuvosa na caatinga.
j) Passar por baixo de uma escada d azar.
k) Olho gordo seca pimenteira.

2.6- Qual a diferena entre variveis tericas e


operacionais e entre hipteses de relaes e hipteses existenciais?

2.11) Construa uma tabela e um grfico EPR


para cada relao entre as variveis operacionais com dados imaginrios verossmeis.
(Quando necessrio, substitua variveis tericas por operacionais).

2.7- A frase correlao no implica causalidade


est relacionada com a diferena entre relaes
consequentes e inconsequentes? Explique a frase
com exemplos originais de relaes consequentes e
inconsequentes.

2.12) Escolha uma relao para explicar dificuldades com validao da medida, validao
interna e validao externa.

2.8- De um exemplo original de uma relao proximal e uma final para explicar o mesmo fenmeno.

2.13) Construa uma tabela EPR e dois grficos


EPR para avaliar relaes em seu campo de
pesquisa (preferencialmente um trabalho que
esteja desenvolvendo).

2.9- Qual a diferena entre as estatsticas bivariada, univariada e multivariada.


2.10) Elabore tabelas e grficos EPR para a lista
de hipteses/ previses a seguir:

a) O tamanho de indivduos da espcie de tartarugas Podocnemis expansa influi na


taxa reprodutiva.

26

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

so todos os 25 do eixo Y, pois a menor medida


foi 4 mm, a maior 22 mm, e a preciso da medida foi de 1mm (como pode se ver no grfico).
Se a preciso fosse de 0,5mm, teramos aproximadamente o dobro de nveis efetivos.

3. Confiana na medida e
independncia
Neste captulo abordaremos: a) a incerteza em
medidas de valores individuais em funo da
forma de atribuir uma categoria ou da falta de
preciso ou de acurcia em instrumentos ou
procedimentos de medida; b) a variao natural
em valores quantitativos na forma de distribuies de frequncias; c) a incerteza na estimativa de parmetros populacionais e d) a importncia da independncia entre unidades amostrais na estimativa de parmetros populacionais. Para discutir estes assuntos sero apresentados alguns termos.

Em funo do tipo de valor utilizado, as variveis dividem-se em escalas de medida da


seguinte forma:
Binrias: Possuem apenas dois nveis efetivos.
Por exemplo: sim ou no; presena ou ausncia; macho ou fmea; macrofauna ou mesofauna; controle ou tratamento. Tambm so
binrias as variveis quantitativas que assumem
apenas dois valores em uma analise (e. g. comparao entre tratamentos com 1 mg ou 2 mg
de um medicamento).

3.1 Nveis e escalas de medida

Nveis efetivos de medida so os


diferentes valores de uma varivel
efetivamente includos em uma
anlise. Para saber o nmero de
nveis efetivos (NE) em variveis
categricas ou ordinais (veremos
a diferena adiante), basta contarmos as categorias utilizadas.
Em variveis quantitativas ele
calculado com esta frmula simples: NE= (max-min+1)/preciso
(ou conta-se diretamente do grfico ou da base de dados). Por
exemplo, na figura 3.1, a varivel
Ms tem 6 nveis efetivos e a
varivel Tamanho da Aranha tem
19 nveis efetivos. Cuidado, no

Tamnho da aranha(mm)

Dizer que uma pessoa alta ou que mede


1,80m so duas formas vlidas de falar sobre
altura, mas com poder informativo diferente e
que recebem tratamentos estatsticos diferentes. Nas duas formas, estamos falando de variveis, pois so propriedades que variam entre
unidades amostrais. Se voc divide as pessoas
em dois grupos, altas e baixas, ter dois nveis
de medidas; se voc dividir em 3 grupos, altas,
mdias e baixas, ter trs nveis. Se medir com
uma fita mtrica, ter vrios nveis de medida
(e. g. 1,73 m, 1,82 m).

Categricas: Assumem valores qualitativos


(no quantitativos) sem uma ordem intrnseca
natural entre os nveis, ou possuem uma ordem,
mas esta pode ser ignorada na anlise. Por
exemplo: tipos sanguneos (A, B, AB e O), marcas de fertilizante, habitat e nome do coletor
(podem ser ordenadas alfabeticamente, por
exemplo, mas esta ordem irrelevante para a
anlise). Nmeros podem ser utilizados para
rotular entidades (e. g. 135= planta # 135), por
isto a propriedade nmero da planta categ-

Phoneutria reidyi

25
20

v
?

15
10
5
0

Jun Ago Out Jan

Abr

Ago

Ms da coleta 2001/2002
Figura 3.1- Neste grfico EPR h seis nveis na varivel Ms da coleta, 19
nveis na varivel Tamanho da aranha e trs nveis na varivel Sexo.

27

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

rica, j que no uma quantidade sujeita a


operaes matemticas (a planta #1 no igual
planta#136 menos a planta#135). Variveis
binrias sempre podem ser tratadas como categricas, mas diferem das categricas com mais
de dois nveis efetivos por possuir uma maior
flexibilidade em anlises estatsticas, o que
justifica uma escala separada. As escalas Binria e Categrica juntas so chamadas de Escala Nominal.

carros estatsticos. Por exemplo, o nmero de


ovos uma varivel quantitativa descontnua,
pois no existem 3,5 ovos, h um salto entre
os nveis 3 e 4. Segundo estes livros, o peso de
um ovo seria uma varivel quantitativa contnua,
pois h valores intermedirios entre 40 e 41 g
(como 40,555 g).
A descontinuidade efetivamente algo que
deve ser levado em conta em anlises estatsticas. Entretanto, o problema no se resolve com
esta diviso em dois tipos de nmeros. Esta
diviso inapropriada porque: a) na prtica, no
existe nenhuma medida continua, tudo contagem, pois todo equipamento ou procedimento
tem um limite de preciso. Por exemplo, no
caso de pesos ns contamos as microgramas
do ltimo dgito de uma balana, com saltos
de 40,555 para 40,556 mg; b) contagens com
muitos nveis (e. g. posturas de peixes com 623,
1.544, etc., em nmero de ovos) tm propriedades matemticas semelhantes em anlises
estatsticas s dos nmeros descontnuos
(equivalem a 0,623 e 1,544, etc., em milhares
de ovos); c) mesmo para uma varivel considerada contnua (nmeros Reais), pode haver
problema de descontinuidade at para instrumentos de preciso se o nmero de nveis efetivos for pequeno. Por exemplo, se voc obtiver
apenas os trs nveis efetivos 0,01; 0,02 e 0,03
g em todas as suas medidas (note que no so
nmeros Inteiros) haver descontinuidade. Ao
invs de separar as estradas em lisas (contnuas) e esburacadas (descontnuas), seria
melhor classificar as estradas em funo dos
tamanhos dos buracos, pois microburacos sempre existem sem ser necessariamente um problema. Veremos no captulo 5 que na prtica o
problema da descontinuidade na varivel resposta irrelevante acima de 20 nveis efetivos,
pequeno at 10 nveis e vai tornando-se gradualmente grave a muito grave medida que temos menos nveis efetivos, exigindo ajustes na
tcnica de anlise.

Ordinais: Existe uma sequncia ordenada relevante entre os nveis na anlise. A diferena
entre um nvel e o prximo de posio apenas, no h uma quantificao. Por exemplo,
no podemos saber se o segundo lugar em uma
corrida chegou mais prximo do primeiro ou do
terceiro apenas com a posio da chegada.
Outros exemplos: abundncia na escala nula,
rara, intermediria, comum ou muito comum;
vento na escala fraco, moderado, forte, violento
e furaco; notas na escala A, B, C, D ou reprovado; idade na escala filhote, jovem pr
reprodutivo, adulto novo, adulto velho; tipo de
solo na escala arenoso, intermedirio arenoso,
intermedirio argiloso ou argiloso. Voc pode
usar nmeros nestas escalas, mas preciso
lembrar que estes nmeros no so quantidades.
Quantitativas: Variveis quantitativas possuem
valores numricos que efetivamente representam quantidades. No so variveis quantitativas aquelas que possuem valores numricos
que representam apenas ordem ou rtulo de
uma categoria.
Muitos livros de estatstica dividem a escala
quantitativa em duas: Razo e Intervalar. Esta
separao envolve um detalhe matemtico que
raramente relevante para o uso das tcnicas
estatsticas que abordaremos, de forma que no
a utilizaremos. Outra separao comum na
escala quantitativa entre nmeros contnuos
(nmeros Reais) e descontnuos (nmeros
Inteiros). A questo da continuidade relevante
porque os saltos dos nmeros entre nveis
podem exigir ajustes nos clculos estatsticos.
como se fossem buracos na estrada de nossos

Outras escalas. H trs escalas de medida


especiais com as quais no trabalharemos, mas
que precisam ser conhecidas, uma vez que
requerem mtodos estatsticos prprios. Algu-

28

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

nesta escala. Entretanto, variveis como meses


e horas deixam de ser circulares se h uma
referncia sequencial adicionada informao
(e. g. fevereiro de 2008, 23 horas do terceiro
dia).
As escalas de medida normalmente so tratadas como se fossem excludentes entre si, isto
, que se um valor pertencesse a uma no pertenceria a outra, mas no assim (Fig. 3.2).
Uma escala quantitativa tambm ordinal, pois
os nmeros que representam quantidades esto
ordenados (mas nem toda sequncia ordinal
quantitativa). As escalas quantitativa e ordinal,
tambm so categricas, pois cada valor numrico ou de ordem, pode ser visto como uma
categoria. A binria est includa em todas, pois
dois valores podem ser obtidos em qualquer
escala. Muitos textos dividem os valores em
quantitativos e qualitativos, o que nos induz a
pensar que quantidades no so qualidades.
Entretanto, dizer que uma pessoa tem 1,80 m
s uma maneira mais precisa de dizer que ela
alta. Portanto, quantidades tambm so qualidades. A compreenso que algumas escalas de
medida esto dentro de outras e que qualquer
atribuio de valor uma atribuio de uma
qualidade ser importante quando abordarmos
lgica e a flexibilidade na escolha de testes
estatsticos (captulo 5).

Figura 3.2-. Do ponto de vista lgico, as escalas de medida


no so auto excludentes, algumas esto contidas em
outras, e a Binria (Bi) se encontra dentro de todas.

mas vezes estas escalas podem ser tratadas


como se fossem uma das escalas apresentadas
anteriormente, entretanto, no o ideal. A Escala Proporo para valores do tipo x de n
(e. g. 15/28 sementes sobreviveram no vaso 1)
ou do tipo que varia de 0 a 1 ou de 0 a 100%.
Muitas vezes estes valores so tratados como
quantitativos, mas h formas mais apropriadas
de lidar com eles (Warton & Hui, 2011). Na Escala Hierrquica a ordem entre os nveis
efetivos hierrquica (grupos dentro de grupos). O exemplo mais comum em biologia a
varivel espcies (pois as espcies se agrupam de forma hierrquica em gneros, famlias,
etc.). A varivel local, como em casas em um
estudo sobre dengue em vrios municpios
tambm hierrquica, pois as casas podem ser
agrupadas em vrios nveis espaciais (bairro,
municpio, estado). As tcnicas especficas so
diversas em funo do problema especfico (e.
g. Anova hierrquica; Regresso Filogentica,
Anlise de Correspondncia Cannica). Na
Escala Circular os nveis so cclicos, isto
seguem uma determinada ordem at chegar a
um ltimo nvel e retornar ao primeiro. Os exemplos mais comuns envolvem medidas de
tempo, como hora do dia, dia da semana,
ms. Direes angulares (como a direo do
voo indivduos em migrao) tambm esto em
escala circular. Mtodos de Estatstica Circular
(Zar, 1984) so necessrios para analisar dados

3.2 Atribuio de nveis nominais e


ordinais
Em escalas nominais (binrias ou categricas) e
ordinais no h uma quantificao; os nveis
so atribudos por um reconhecimento ou interpretao que determinada unidade amostral
pertence a uma categoria ou grupo definido ou
que est dentro de uma posio em uma escala
ordinal. Muitas vezes isto simples, como ao
registrar o local de uma coleta ou o se um peixe
morreu ou est vivo ao final de um experimento
de ecotoxicologia. Entretanto, frequentemente a
atribuio de nveis nominais ou ordinais uma
das partes mais sensveis de um estudo.

29

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Imagine que voc quer saber se a proporo de


meninos que sabe nadar diferente da proporo de meninas que sabem nadar. Voc realiza
entrevistas e pergunta a muitas crianas se elas
sabem nadar. Dos 300 meninos, 66% responderam sim (sabem nadar), muito mais que os
33% de 300 meninas que responderam sim.
Embora a diferena seja estatisticamente significativa, h uma dvida importante antes de se
concluir que mais meninos que meninas sabem
nadar. O significado de um sim de um menino
realmente comparvel ao significado de um
sim de uma menina? Possivelmente os meninos tenham mais vergonha em admitir que no
sabem nadar e respondam sim mesmo sem
saber, enquanto as meninas apenas respondem
sim se nadam bem. Este exemplo ilustra o tipo
de problema que pode acontecer em entrevistas, mas o problema no se restringe a entrevistas.

pessoas entrevistadas de outra cidade gostam


da qualidade de vida, no podemos saber se a
qualidade de vida melhor na primeira cidade
ou se as pessoas so mais exigentes na segunda. Uma pessoa pode achar que h poucas aves em um local quando estiver comeando a observar aves, e perceber que h muitas depois de adquirir mais experincia.
Abordamos aqui as incertezas na atribuio de
valores nominais e abordaremos na prxima
seo incertezas em preciso e acurcia de
valores quantitativos. Terminamos esta seo
destacando que tambm os valores quantitativos podem ter incertezas de atribuio, por
exemplo, o nmero de aes agressivas por dia
depender do que se considera um comportamento agressivo, como j foi discutido acima.
Portanto, sempre importante refletir bem sobre a possibilidade de erros de atribuio comprometendo a interpretao no seu estudo.

Por serem interpretaes, as atribuies nominais e ordinais sempre esto sujeitas a erros,
como na identificao de uma espcie, na determinao de qual doena um paciente teve,
ou no sentido de um sim no pargrafo anterior.
importante definir cuidadosamente os critrios
de atribuio, principalmente quando a subjetividade pode ter um papel importante na deciso
de valor. Em muitos estudos de comportamento,
importante se detalhar o significado de categorias de comportamento utilizadas para permitir comparaes (etograma). Se voc chamar de
comportamento agressivo apenas quando
animais efetivamente lutam, vai considerar o
comportamento mais raro do que outra pessoa
que considere qualquer demonstrao de agressividade.

3.3 Exatido, preciso e acurcia.


Uma medida um valor de uma propriedade de
uma entidade obtido com o uso de instrumentos, protocolos e procedimentos que podem ser
bons ou ruins em diferentes graus e aspectos
que sero tratados aqui.
A exatido de uma medida, na teoria, a proximidade entre o valor obtido e o valor real. Na
prtica, uma medida considerada mais ou
menos exata conforme o procedimento (instrumento, protocolo, etc.) para obt-la for considerado mais ou menos exato. Imagine que voc
comprou um medidor de presso arterial digital
baratinho na farmcia. Chegando em casa,
como qualquer consumidor vido, a primeira
coisa que voc faz medir a tua presso com o
novo brinquedo. O resultado te assusta: presso alta, de 140:90 (mmHg sistlica: diastlica),
acima do ideal de aproximadamente 120:80.
Ser que voc ter que ir ao mdico? ...ou ser
que a medida que est errada? Para saber se
a medida est errada, voc teria de saber a
medida real. Mas se voc soubesse a medida
real, no precisaria do aparelho. Se um especialista tiver te recomendado este aparelho por-

Quando trabalhamos com nveis ordinais os


resultados so muito mais confiveis se sempre
forem definidos pela mesma pessoa suficientemente treinada, ou se houver uma tabela de
referncia bem definida (como uma tabela de
cores de solo). Mais difcil interpretar nveis
ordinais que variam entre pessoas ou circunstncias envolvidas na coleta dos dados. Se 60%
das pessoas entrevistadas de uma cidade gostam da qualidade de vida e apenas 30% das

30

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

que alm de barato ele muito exato, ento


voc aceitaria a medida sem questionar. Do
contrrio, voc mesmo pode avaliar a exatido
instrumental nos seus dois aspectos: sua preciso e sua acurcia.

possvel que o aparelho est descalibrado. Neste caso, talvez seja bom ir ao hospital e obter
uma medida confivel. Se o hospital confirmar a
presso alta, pelo menos voc sabe que pode
confiar na acurcia do aparelho para as prximas medidas.

A PRECISO de um procedimento o grau em


que conseguimos com ele medidas quantitativamente prximas entre si em condies estveis e homogneas. A primeira coisa que faramos com nosso medidor de presso seria repetir a medida vrias vezes. improvvel que a
tua presso varie muito em poucos minutos, de
forma que podemos desprezar a variao natural, e o esperado seria vrias medidas iguais ou
muito prximas se o aparelho for muito bom.
Para simplificar, vamos considerara apenas os
valores da presso sistlica. Se voc obtivesse
os valores 140, 139, 140, 140, 141, 140, 140,
139, isto indicaria que o instrumento tem muita
preciso. Se os resultados fossem 140, 113,
125, 99, 137, 119, 121, 108, isto estaria mostrando que a preciso do instrumento baixa.

Uma forma didtica de representar a preciso e


a acurcia atravs de tiros a um alvo. Quanto
maior a preciso menor a disperso dos valores. A preciso nos tiros ao alvo com o instrumento espingarda costuma ser alta comparada com a baixa preciso com o instrumento
revolver para o mesmo atirador mesma distncia (Fig. 3.3). O resultado que os tiros da
espingarda ficam mais concentrados que os do
revolver (alvos superiores). Entretanto, a espingarda pode estar desajustada (alvo superior
direito), o que significa que a mira precisa ser
ajustada para obter maior acurcia. Note que
no podemos distinguir se o desvio de um tiro
foi por falta de preciso ou por falta de acurcia
se no tivermos um conjunto de tiros.

A ACURCIA de um procedimento o seu grau


de ajustamento mdio em relao ao valor real. Uma balana pode ter alta preciso, porque
sempre d o mesmo resultado, mas pode estar
descalibrada e dar um resultado 15 gramas
superior ao real em todas as medidas. Um relgio de alta preciso atrasado 10 minutos vai
apresentar este erro por anos se no for ajustado para o horrio correto. Alguns equipamentos
de medida, como uma trena, no precisam de
calibragem, outros, como balanas e pHmetros,
precisam de verificaes peridicas, por isto,
so vendidos juntos com padres para calibrao, como metais com pesos conhecidos. Mas
como faramos no caso do nosso aparelho de
medir presso? O ideal seria comparar uma
medida deste aparelho com a medida para a
mesma pessoa imediatamente depois com outro aparelho reconhecidamente preciso e calibrado. Se no houver outro aparelho deste tipo
disponvel, uma alternativa seria medir a presso de outras pessoas ao seu redor. Se todos
tiverem presso normal e voc for o nico com
presso alta, provvel que o aparelho esteja
correto. Se todos tiverem presso alta, bem

Preciso e a acurcia podem ser medidas. No


exemplo da espingarda e do revolver, considerando que o nmero de tiros semelhante, voc
pode dizer que a espingarda tem mais preciso
porque o tamanho do segmento entre os tiros
mais distantes menor na espingarda que no

Figura 3.3- Ilustrao sobre dois conceitos de incerteza


instrumental pela analogia com tiros de uma espingarda
(acima) e de um revolver (abaixo).

31

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Figura 3.4- Representao de medidas relacionadas exatido:


1) desvio de um tiro (ou inexatido pontual); 2) impreciso de
uma espingarda (disperso de valores ou impreciso instrumental); 3) descalibragem ou tendenciosidade instrumental (inacurcia instrumental). A impreciso e a inacurcia so os dois aspectos da inexatido instrumental.

revolver. Voc pode dizer que a acurcia da


espingarda maior quanto menor a distncia
entre o centro do alvo e o centro dos tiros (fig.
3.4).

dados ao redor do valor central. A medida mais


simples de disperso a amplitude total, isto
, a diferena entre o maior e o menor valor
(Fig. 3.5). Podemos comparar a preciso de um
aparelho de medir presso com outro pela amplitude das medidas tiradas da mesma pessoa
em poucos minutos. Um aparelho que apresentasse os valores {140, 139, 140, 140, 141, 140,
140, 139 em mmHg} teria uma amplitude total
de 2mmHg, enquanto um aparelho com os valores {140, 113, 125, 109, 137, 119, 121, 118
mmHg} teria uma amplitude total de 31 mmHg,
isto , o segundo teria uma preciso bem menor. Esta medida de disperso (e preciso) tem
alguma utilidade quando h muitos dados, mas
simplista demais e ruim para a maioria das
situaes, pois a amplitude total no varia apenas com a preciso do instrumento, ela tambm
varia (tende a aumentar) com o nmero de medidas.
Uma soluo para este problema utilizar uma
amplitude parcial central dos dados por excluso de uma porcentagem dos extremos. Neste
contexto descritivo de preciso, o mais comum
costuma ser a amplitude parcial central excluindo-se dos menores valores e dos maiores
valores, que chamada Amplitude do Intervalo Interquartil (fig. 3.5). Com a excluso de
uma proporo fixa de extremos, a amplitude
parcial dos dados no aumenta com o nmero
de dados, como costuma acontecer com a am-

A medida da acurcia til para corrigir distores pela calibragem. Em equipamentos, como
vimos acima, comum haver padres para a
calibragem, mas ocasionalmente precisamos
calibrar procedimentos de outras formas. Imagine que voc tivesse que estimar visualmente
tamanhos de jacars distncia. Neste caso,
voc pode calibrar esta capacidade estimando
tamanhos de objetos semelhantes a jacars
(como troncos) distncia e depois verificar
como est se saindo medindo os objetos com
uma trena. Se tiver tendncia a superestimar o
tamanho, reduza suas estimativas e se tiver
tendncia a superestimar, aumente as estimativas. Se puder capturar jacars, conveniente
repetir a avaliao para melhorar a sua capacidade de estimar. Ningum consegue acertar
precisamente todas as medidas, mas voc pode
se considerar calibrado quando a quantidade
de subestimativas semelhante quantidade
de superestimativas.

Figura 3.5- Medio da preciso de um aparelho de medir


presso arterial por mltiplas medidas de presso em condies estveis. A Amplitude do Intervalo Interquartil,
obtido pela excluso de 25% dos valores inferiores e 25%
dos valores superiores uma medida melhor que a Amplitude Total porque no tende a aumentar com o nmero de
medidas.

A preciso costuma ser medida pelo seu inverso, a disperso dos valores (Fig. 3.4-2). Quanto menor a preciso, mais dispersos sero os

32

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

plitude total. Isto , a amplitude Interquartil no


tende a ser maior ou menor se for determinado
com oito dados ou com 80; o maior nmero de
dados apenas aumenta a preciso desta medida de disperso. Portanto, a amplitude do intervalo interquartil uma forma apropriada de
medir a disperso dos dados. Apesar disto, esta
forma de medir a disperso dos dados pouco
utilizada.

mento sobre preciso seja importante, ainda


mais importante o conceito de disperso de
valores que serve como base para entendermos
o assunto da prxima seo: a variao natural
e as distribuies naturais de frequncias.

Quanto maior a disperso dos dados, maior a


distncia de cada ponto do centro. Com base
nisto, foi criado outro ndice de disperso chamado de Desvio Absoluto Mdio (DAM) (Quadro
3.1). Esta medida uma forma bastante intuitiva
de medir disperso, mas tambm pouco utilizada. A medida de disperso mais utilizada
semelhante na essncia: a raiz quadrada da
mdia dos desvios ao quadrado, que chamada de Desvio Padro. O desvio padro realmente uma excelente medida de disperso em
muitas situaes, inclusive na medida da preciso de instrumentos e procedimentos, mas
necessrio algum cuidado. Primeiro quanto ao
nmero de valores usados em seu clculo. Bastam dois valores para um clculo de desvio
padro, mas clculos com menos que cinco
dados so muito pouco confiveis como medida
de disperso. Alm disto, ele pode no ser uma
boa medida de disperso dependendo da distribuio de frequncias da varivel em questo,
como veremos na prxima seo.

Quadro 3.1- A mdia aritmtica (1) um parmetro populacional utilizado em clculos de muitas medidas paramtricas.
Quando estimada com base em uma amostra, ela geralmente
simbolizada com um X ou um Y com uma barra encima. O
Desvio Absoluto Mdio (2) uma medida simples e intuitiva
de disperso. O Desvio Padro (3) uma medida bem mais
utilizada, com a mesma essncia do DAM. A frmula de DP
apresentada utilizada quando o determinamos com base em
uma amostra, que a situao mais comum. N= Tamanho
amostral; xi= cada valor registrado na amostra; = smbolo
matemtico de somatrio que significa que deve se somar os
termos a seguir na frmula. Curiosidade matemtica: a estatstica paramtrica utiliza estimativas inicialmente tendenciosas
que necessitam ajustes. o caso do desvio padro da amostra
com seu denominador (N-1). Por que no calculamos a mdia
dos desvios elevados ao quadrado com o denominador N? De
fato, no clculo de um desvio padro de um conjunto completo
de dados o denominador N. O problema que para determinar o desvio padro populacional com base em uma amostra
estaremos subestimando a disperso com o denominador N,
porque nossa mdia no a mdia real, mas uma estimativa
que necessariamente mais central ao conjunto de dados em
questo. Ao dividir por (N-1) temos um valor mais aproximado do DP da populao.

Na prtica, precisamos estar atentos para a


acurcia de nossos procedimentos, mas no
to comum precisarmos avaliar a preciso das
medidas que utilizamos. Em algumas situaes,
como no exemplo das estimativas de tamanhos
dos jacars, a impreciso da medida pode ser
muito importante e merece ateno especial.
Entretanto, em muitos estudos, os procedimentos e instrumentos so plenamente satisfatrios,
isto , sua impreciso irrelevante em comparao variaes naturais em estudo. Se sua
planta cresce 10cm entre cada medida, a preciso de 1 mm mais que suficiente para as tuas
anlises. Em outros casos, a preciso no to
boa, mas ela pode ser compensada por um
tamanho amostral maior. Embora o conheci-

33

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

resultado da variao natural dos tamanhos das


sementes. Ocasionalmente esta variao combinada (erro de medida + variao natural)
chamada de erro. Este um termo infeliz, pois
nos induz a pensar que a variao natural
parte de um erro da mesma forma que os erros
de instrumentos ou de mtodos de medida. Se
a preciso de medida for muito baixa, o erro de
medida pode prevalecer e obscurecer a variao natural, mas se a preciso de medida for
boa, a variao encontrada no um erro, mas
uma caracterstica importante da populao em
estudo.

3.4 Distribuies de frequncias


A partir do momento em que temos procedimentos calibrados e com preciso conhecida, podemos nos despreocupar com as medidas individuais e voltar a nossa ateno para a Variao Natural.
No se deve confundir a variao de medidas
em funo da preciso de instrumentos com a
variao natural. Poucas pessoas tm uma
altura que coincide com a mdia da populao,
mas isto no significa que a altura da maioria
das pessoas esteja errada. No uma questo
de erro de medida, algo natural. No exemplo
das sementes do incio da seo 3.3, estvamos realmente nos referindo a uma variao de
preciso de medida, ou erro de medida, porque
eram medidas da mesma semente. Entretanto,
se os alunos estivessem medindo sementes
diferentes, a variao encontrada seria tambm

O grfico mais comum para mostrar a variao


nos valores de uma varivel quantitativa chamado Histograma. Trata-se de um grfico de
distribuio de frequncias. Vamos ilustrar com
um conjunto de valores de tamanhos de peixes
e de salrios de uma amostra representativa de
funcionrios em uma grande corporao (Fig.
3.6). Analise o grfico com ateno, veja que no
eixo X (horizontal) da figura temos valores
quantitativos divididos em intervalos iguais e no
eixo Y (vertical) temos frequncia, que pode ser
a contagem das entidades por intervalo (frequncia absoluta) ou uma percentagem por
intervalo do total de entidades (frequncia relativa). Na figura 3.5 temos outra forma de apresentar dados de uma varivel, mas em histogramas o eixo Y com a frequncia d melhor
visibilidade forma como os dados se distribuem, especialmente quando temos muitos dados
e intervalos de classes pequenos, geralmente
lembrando uma montanha (distribuio unimodal- como nos dois grficos da figura).
Os histogramas mostram bem os dados de
amostras, mas so limitados para fazermos
inferncias populacionais. Por isto, geralmente
se faz inferncias modelando a distribuio
com curvas matemticas tericas ajustadas aos
valores obtidos, ou por procedimentos de reamostragem (seo 3.6), ou simplesmente assumindo um modelo matemtico, como veremos adiante. Na figura 3.6 as linhas com uma
forma de montanha foram construdas a partir
de modelos matemticos ajustados aos valores.
Na figura 3.7 so apresentados grficos de

Figura 3.6- Duas distribuies de frequncia com formatos


diferentes. Na figura A, a distribuio tem o formato aproximado de um sino. Na figura B a distribuio fortemente
assimtrica. As amplitudes com 95% dos dados foram
determinadas com clculo paramtrico em (1) e por excluso de extremos em (2).

34

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

verificao de premissas para a utilizao de


determinadas ferramentas de anlise estatstica, como veremos a seguir.
comum que a montanha da distribuio de
frequncia tenha um formato bastante simtrico
que lembra um sino, como vemos na figura
3.6 A e na figura 3.7. O modelo matemtico que
descreve esta forma de curva chamado modelo de Distribuio Normal (ou Gaussiano).
Muitas ferramentas estatsticas foram desenvolvidas para serem utilizadas quando os dados
tem normalidade (isto , quando razovel
assumir que a populao tem distribuio normal). Na prtica, nunca obtemos uma distribuio perfeitamente normal com nossos dados,
pois um modelo sempre uma aproximao da
realidade. Por exemplo, na natureza h limites
para tamanhos, mas na distribuio normal no
h. Para uma distribuio de frequncia de dados ser considerada do tipo normal no necessrio uma forma perfeita de sino, basta o
jeito (como na figura 3.6 A). Quando os dados no so suficientes para definir o jeito,
ainda podemos assumir a normalidade com
base na razoabilidade, isto , em motivos tericos ou de experincia anterior com dados da
mesma natureza. Mesmo quando evidente
que a distribuio no tem normalidade, mas
ela no se afasta muito da distribuio normal,
ainda razovel se utilizar tcnicas estatsticas
que tem a premissa da distribuio normal. O
problema trabalhar com dados assumindo
uma distribuio normal sem verificar a compatibilidade dos dados com esta distribuio ou
sem uma base na razoabilidade.

Figura 3.7- Exemplos grficos que ilustram modelos de


distribuies de probabilidades tericas. Estes modelos
servem como bases para utilizao de ferramentas estatsticas se podemos assumir que eles realmente so compatveis com a distribuio na populao.

modelos matemticos que podem ser ajustados


aos dados quantitativos obtidos. Naturalmente,
o modelo se aplica bem apenas em uma situao estvel, isto , quando a amostra foi retirada em uma condio na qual qualquer outra
amostra deveria mostrar um resultado bastante
similar. Por exemplo, se o tamanho mdio dos
peixes varia entre anos, no podemos modelar
apropriadamente para um ano com base nos
dados de outro ano.

Quando temos uma distribuio normal, ou


aproximada, o desvio padro uma excelente
medida de disperso dos dados. Conhecendo a
mdia e o desvio padro de uma populao,
pode-se determinar a proporo aproximada da
populao a um, dois ou trs desvios padres
da mdia (Fig. 3.8). O desvio padro calculado a partir da mdia, que um parmetro populacional, por isto, uma medida chamada de
paramtrica.

As distribuies de frequncia tem importncia


direta e indireta em estudos biolgicos. A importncia direta est na interpretao de causas e
consequncias do formato da distribuio. Por
exemplo: a) uma distribuio bimodal (fig. 3.7)
pode indicar uma seleo natural disruptiva em
um carter biolgico; b) pirmides etrias so
uma forma especial de histograma que revelam
importantes caractersticas de populaes, como o grau de desenvolvimento social de um
pais. A importncia indireta est em permitir a

35

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

A vantagem do desvio padro (DP) que uma


excelente medida de disperso para variveis
que tem normalidade. A desvantagem que
simplesmente no uma medida apropriada
quando a distribuio no normal. Voc pode
determinar o intervalo que contm 95% dos
dados por excluso de extremos (seo 3.3) ou
de forma paramtrica com base no desvio padro (Amplitude 95%= mdia1,96 DP), com
resultados semelhantes se a distribuio for
normal (Fig. 3.6 A). Entretanto, ao utilizarmos o
Desvio Padro para descrever uma distribuio
que no normal podemos chegar a resultados
estranhos, como incluir salrios negativos nos
limites de uma amplitude parcial central
(Fig. 3.6 B), o que nunca acontece com intervalos determinados por excluso de extremos.
Quando no h normalidade, h algumas alternativas: a) utilizar a amplitude interquartil como
medida de disperso; b) realizar uma transformao dos dados de forma a obter normalidade
(Cap. 5); c) apresentar a distribuio de frequncia ao invs de uma sntese numrica.

Figura 3.8- Quando temos uma distribuio normal, podemos determinar com base na mdia e no desvio padro
(DP), como os dados se distribuem e a proporo a cada
intervalo entre um, dois e trs desvios padres acima e
abaixo da mdia.

duos da populao estatstica (no confunda o


nmero de indivduos da populao com tamanho de uma amostra desta populao).
Os parmetros de proporo so contagens de
unidades amostrais de uma categoria divididos
por um total de unidades amostrais, como a
razo sexual de adultos e a taxa de sucessos
em um estudo sobre aprendizado (sucessos/
tentativas). Em variveis binrias s se apresenta um parmetro de proporo relevante (e.
g. razo sexual= machos/ total), pois o parmetro da outra categoria (fmeas/ total) seria redundante, de forma que voc pode escolher
qualquer um. Quando h mais de duas categorias em uma varivel, pode haver mais de um
parmetro relevante (e. g. azul/total, verde/total, amarelo/total). Embora isto possa ser
aplicado para categorias ordinais, normalmente
prefervel se usar outro parmetro que ser
apresentado adiante para esta escala.

3.5 Parmetros populacionais


Na Biologia, geralmente estamos mais interessados em caractersticas de populaes ou de
conjuntos de observaes ou eventos do que
em indivduos ou em eventos singulares. Algumas destas caractersticas so valores quantitativos denominados parmetros.
Quando temos um conjunto de valores (populao estatstica) com distribuio de frequncia
estatisticamente estvel, podemos estimar apropriadamente alguns parmetros a partir de
subconjuntos representativos (amostras). Isto
muito til, j que raramente temos acesso a
toda a populao estatstica em que estamos
interessados em um estudo. Nesta seo sero
apresentados os parmetros populacionais mais
importantes. Os parmetros podem ser univariados (de contagem, de proporo, de variveis
ordinais, de variveis quantitativas) ou multivariados (de relao).

Os parmetros de variveis quantitativas envolvem contagens, como o nmero mdio de clulas brancas por campo em uma lmina de sangue, ou medidas contnuas, como o desvio
padro no tamanho (em m) de indivduos de
uma populao de Artemia salina. Note que as
contagens neste tipo de parmetro no so de
unidades amostrais, mas de algo que est em
cada unidade amostral. No exemplo da lmina

Os parmetros de contagem so totais para


toda a populao, como nmero total de indiv-

36

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

de sangue, a unidade amostral era campo e a


populao eram os campos daquela lmina.

chente de um rio para construirmos uma barragem segura.

Os parmetros de variveis ordinais e de variveis quantitativas mais importantes so de trs


tipos: de tendncia central, de disperso e extremos. As trs medidas de tendncia central
principais so a mdia, a mediana e a moda. A
mdia comum (tambm chamada de mdia
aritmtica) a soma dos valores divididos pelo
nmero de observaes (a princpio no deveria
ser aplicado para variveis ordinais). A mediana
divide os valores ordenados pela metade. Por
exemplo, se colocarmos 25 valores em ordem
crescente, a mediana ser o 13 valor. A moda
o valor mais frequente quando os dados quantitativos esto agrupados em intervalos. A mediana geralmente considerada uma medida
mais apropriada de centralidade quando no
temos uma distribuio normal ou aproximadamente normal, entretanto, a mdia sempre
uma medida significativa para medidas quantitativas, mesmo na ausncia de normalidade, pois
reflete um aspecto de centralidade que a mediana no reflete.

Parmetros multivariados envolvem mais de


uma varivel ao mesmo tempo. Por exemplo, a
diferena nos tamanhos mdios de machos e
fmeas de ratos silvestres em uma populao
(parmetro de grau de dimorfismo sexual em
tamanho) ou a inclinao (coeficiente angular)
da reta que descreve a relao entre o peso de
indivduos uma populao de ratos silvestres e
a quantidade de recursos alimentares em sua
rea de vida (parmetro em um modelo matemtico). So parmetros, pois so caractersticas quantitativas relacionadas a estas populaes, e so importantes nos estudos de relaes. H anlises em que diversos parmetros
so determinados ao mesmo tempo, como em
equaes que descrevem a relao entre uma
varivel resposta e diversas variveis preditoras
(regresso mltipla).

3.6 Intervalos de confiana de


parmetros.
Como j vimos, raramente trabalhamos com
parmetros, trabalhamos com estimativas de
parmetros e estas estimativas tem utilidade
limitada sem um intervalo de confiana.

Nas sees anteriores vimos medidas de disperso como o Desvio Padro e a Amplitude do
Intervalo Interquartil. Se a impreciso da medida
for pouco relevante em relao variao natural, estas medidas tambm so parmetros
populacionais (quando toda a populao foi
amostrada), ou estimativas de parmetros populacionais (quando o clculo foi feito por uma
amostra), pois a variao uma caracterstica
de uma populao.

Se voc est estudando um pequeno bando de


girafas de uma reserva, basta cont-las para
obter o valor do parmetro nmero de indivduos. Entretanto, se quiser estimar a populao de gafanhotos na mesma rea, a contagem
de todos provavelmente seria impraticvel. Voc poderia dividir a rea em muitas partes, sortear algumas, realizar contagens apenas nestas, tirar uma mdia e multiplicar pelo nmero
de partes. Neste caso, voc no teria o valor do
parmetro, mas uma estimativa. A chance de
voc acertar exatamente extremamente baixa,
por isto qualquer estimativa de parmetro
praticamente intil sem um intervalo de confiana.

Parmetros quantitativos extremos so o mximo e o mnimo populacional para uma varivel.


No nos referimos a mdias de mnimos ou de
mximos, mas a estimativas de mnimos e mximos absolutos a partir de amostras. Sua determinao bem mais incerta e complexa do
que para medidas de centralidade e de disperso. Por este motivo, raramente so tratados
em cursos bsicos, entretanto, so parmetros
extremamente importantes. Por exemplo, precisamos ter estimativas do valor mximo da en-

Um intervalo de confiana uma extenso da


nossa estimativa para uma amplitude ao invs
de um valor pontual, tendo um grau de rigor pr-

37

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

estabelecido para seu clculo. Os intervalor de


confiana mais utilizados so IC99%, IC95%,
IC90% e o erro padro (ou IC68,27%). Um
IC95% de um parmetro significa que o intervalo foi calculado de forma a ter 95% de chance
do intervalo de conter o parmetro. Por exemplo, uma estimativa de mdia de gafanhotos por
100 m2 de 12,3 com IC95% entre 8,5 e 20,3 nos
d uma ideia bastante precisa de at que ponto
nossa estimativa pontual confivel. A figura
3.9 ilustra uma utilizao de intervalos de confiana para mostrar mudanas temporais. Os
intervalos permitem avaliar as mudanas nas
mdias de volume de nctar por horrio de forma objetiva. O aumento entre 5:00 e 6:00 horas
incerto, mas podemos dizer com segurana
que houve reduo entre 6:00 e 7:00 horas.

do valor real da populao. No exemplo dos


gafanhotos, quanto mais reas de certo tamanho voc tiver, maior preciso ter. Neste exemplo, tambm teremos maior preciso quanto
maior for cada rea, pois isto tende a diminuir a
variao nos valores entre reas e a representatividade de cobertura da rea coletada. (A
representatividade em distribuio um conceito diferente relacionado com acurcia da estimativa que ser tratado na prxima seo.)
O conceito de intervalo de confiana essencial
ao usurio de estatstica, mas o seu clculo no
, por isto no entraremos em detalhes sobre a
forma de calcular intervalos de confiana de
parmetros de contagens e de parmetros de
propores. Estes intervalos podem ser facilmente
calculados
em
sites
como
www.graphpad.com/quickcalcs/confInterval1
(Motulsky, 2010). Entretanto, entraremos um
pouco nos detalhes de como obter intervalos de
confiana de parmetros de variveis ordinais e
quantitativas, pois h conceitos relevantes ao
usurio que precisam ser tratados.

38

10
:0
0

09
:0
0

08
:0
0

07
:0
0

06
:0
0

05
:0
0

Volume de Nectar (L)

Quanto menor o intervalo de confiana obtido


para um parmetro, melhor a estimativa, isto
maior a sua preciso. A preciso de um parmetro depende da preciso das medidas individuais, da variao natural entre unidades amostrais e da representatividade de cobertura.
Abordamos preciso das medidas individuais na
H diferentes formas de se determinar intervaseo 3.3. bom termos medidas individuais
precisas, mas a impreciso e a variao
12
natural no clculo de
parmetros podem
10
ser compensadas por
uma maior represen8
tatividade de cobertura. A representativi6
dade de cobertura.tem dois elemen4
tos principais, o ta2
manho da amostra
(nmero de unidades
0
amostrais) e o tamanho da unidade amostral (quando ela
Horrio da manh
varia em tamanho).
Basicamente, quanto
maior o tamanho da
Figura 3.9- Variao na quantidade de nctar (L) em flores de Ficus devendus entre as 5:00
e as 10:00 horas da manh. A barra horizontal representa a medida paramtrica do Intervalo
amostra, maior a
de Confiana de 95% da Mdia. O IC95% paramtrico simtrico, mas foram omitidos os
certeza de que a
valores negativos no grfico.
estimativa do parmetro est prxima

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

los de confiana. As mais utilizadas para o parmetro mdia tm sido o Erro Padro (Quadro
3.2) e uma estimativa paramtrica do Intervalo
de Confiana da Mdia (ICM) de 95% (ou
IC95% da mdia) calculada a partir do valor do
erro padro. importante no confundir o erro
padro com o desvio padro. O desvio padro
uma medida de disperso de valores da populao; uma caracterstica desta populao que
ganha preciso quanto maior a amostra usada
para estim-lo. O erro padro um intervalo de
confiana da mdia (equivale a um IC68%) que
diminui quanto maior for o tamanho da amostra
utilizada na estimativa. Sempre que usar um ou
outro obrigatrio explicitar de qual se trata.

permite obter uma estimativa no paramtrica


de intervalos de confiana assimtricos ajustados aos dados. A lgica do funcionamento do
Bootstrap bastante intuitiva e apresentada
na legenda do Quadro 3.3. Quando h normalidade, suas estimativas so to boas quanto as
obtidas por mtodos paramtricos e quando no
h normalidade suas medidas so sempre melhores. Outra vantagem do Bootstrap que esta
tcnica no se restringe a avaliaes da mdia,
permite a determinao de intervalos de confiana para qualquer parmetro das escalas
quantitativa e ordinal.
Embora seja uma tcnica antiga, raramente
apresentada em cursos introdutrios de estatstica, porque os contedos destes cursos foram
definidos h uns 30 anos, quando o acesso ao
poder de computao era mais restrito, e esta
tcnica exige este poder. Entretanto, j faz tempo que isto no um fator limitante e trata-se de
uma tcnica valiosa, de forma que lentamente
est vencendo o tradicionalismo e comeando a
ser incorporada aos cursos bsicos.

O erro padro e o intervalo de confiana paramtrico so simtricos acima e abaixo da media. Este um dos problemas desta forma de
calcular intervalos de confiana que fica claro
no exemplo da figura 3.8. Note que foi omitida a
parte negativa do intervalo de confiana no
horrio 10:00hs. Isto foi feito porque sabemos
que no existe quantidade negativa de nctar.
Quando a distribuio de frequncias muito
assimtrica, como ocorreu neste exemplo, medidas paramtricas de intervalos de confiana
devem ser evitadas.

Mesmo o intervalo determinado por Bootstrap


suspeito quando o tamanho amostral pequeno. De quantos dados precisamos para obter
um intervalo de confiana confivel? O ideal
mais de 30. Entretanto, assim como no exemplo
da figura 3.9, comum que tenhamos bem menos. Considerando que esta preciso varia com
o tipo de distribuio, podemos recomendar um
mnimo de 5 quando h forte expectativa de
distribuio de frequncias aproximadamente
normal, um mnimo de 10 quando h um desvio
bastante forte da normalidade (e. g. 2, 2, 3, 3, 3,
4, 4, 5, 5, 5, 5, 7, 8, 10, 14, 15) e um mnimo de
15 quando h um desvio maior (e. g. 0, 0, 0, 0,
0, 1, 1, 3, 5, 9, 20). Quando temos tamanhos
amostrais menores, o intervalo de confiana
pode ser utilizado, mas muito importante tambm apresentar os dados brutos, como foi feito
na figura 3.9, onde os pontos todos so mostrados. Tamanhos amostrais pequenos no so
um pecado acadmico, mas est errado esconder do leitor as incertezas nos dados.

A tcnica chamada Bootstrap (Quadro 3.3)

Quadro 3.2- Clculo paramtrico do Intervalo de Confiana IC95% da mdia. O clculo do Desvio Padro foi apresentado no Quadro 3.1.

39

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Quadro 3.3- Determinao de Intervalos de Confiana pela tcnica de Reamostragem chamada Bootstrap. Funciona
como se o computador clonasse os dados vrias vezes, recriando algo semelhante populao original (como os
nmeros na tabela acima). Tendo esta populao, o computador retira uma amostra do mesmo tamanho amostral da
amostra inicial (representada em destaque na tabela) e calcula o valor do parmetro (e. g. a mdia). Depois repete o
processo muitas vezes (e. g. 1000 vezes), obtendo repeties de estimativa do parmetro. Ento retira uma porcentagem
dos valores extremos (e. g.. 5% para obter um IC95%) e obtm os limites do Intervalo de Confiana.

40

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

3.7 Independncia para parmetros


univariados
Os valores de parmetros univariados e seus
Intervalos de Confiana apenas so vlidos se
as amostras utilizadas para as estimativas forem baseadas em amostras representativas
em distribuio na populao em questo.
Uma amostra com representatividade em distribuio aquela obtida de forma a se obter uma
estimativa no tendenciosa de um parmetro
univariado. A forma mais conhecida de se obter
uma amostra representativa em distribuio
pela aleatorizao (isto , pelo sorteio) de quais
unidades amostrais de toda a populao sero
includas na amostra. Esta no a nica forma
vlida de obter amostras representativas em
distribuio, uma coleta sistemtica apropriada
tambm permite isto (Fig. 3.11). Por que isto
importante? Suponha que voc quisesse estimar a produtividade vegetal mdia em uma
fazenda e realizasse todas as coletas na margem leste desta fazenda por uma questo de
convenincia (proximidade da estrada de acesso). O problema que esta produtividade poderia ser influenciada pela fertilidade do solo que
no necessariamente homognea e poderia
*variar em gradiente de uma margem a outra da
rea. Isto no uma questo de paranoia metodolgica (seo 1.5), uma possibilidade
concreta que no pode ser desprezada. A possibilidade da estimativa do parmetro ser desviada por qualquer varivel de confundimento que
possa ter algum padro espacial ou temporal
anulada se a coleta for feita de uma forma apropriada, como em uma coleta aleatria ou
sistemtica na rea de estudo. Algo semelhante
acontece com coletas realizadas ao longo do
tempo.

Figura 3.11- Trs formas de coletar dados. X= unidades


amostrais selecionadas para compor a amostra. Neste
caso, a amostra sistemtica no representativa da borda
da rea e a amostra de convenincia s representativa de
uma borda.

A qualidade de uma estimativa de parmetro


univariado depende, primariamente, das unidades amostrais terem sido obtidas de uma forma
bem distribuda no universo amostral (representatividade em distribuio) e, secundariamente,
da porcentagem da populao que foi amostrada (representatividade em cobertura). Por exemplo, se voc conseguir dados de altura de

41

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

0,01% da populao masculina adulta do Brasil


por sorteio de toda a populao ter uma amostra excelente para calcular a mdia de alturas.
Se voc utilizar os dados de toda a populao
masculina adulta de um nico estado, como
So Paulo, esta medida no ser representativa
da mdia nacional, mesmo contendo cerca de
20% da populao do Brasil. Quando h representatividade em distribuio as unidades amostrais, frequentemente se diz que so independentes. O que significa independentes?
Independentes umas das outras? No, nem
poderiam, j que estamos falando de uma populao e todas devem pertencer mesma populao. O termo Independncia significa fora da
influncia de um fator de confundimento.

combinaes de nveis das variveis preditoras,


se houver mais de uma) possuem representatividade em distribuio vlida em relao populao estatstica. Esta situao rara, como
veremos adiante, de forma que geralmente se
busca nesta situao uma representatividade
paralela parcial e generalizaes com base na
razoabilidade. Na representatividade paralela
parcial, os conjuntos de unidades amostrais de
cada nvel da varivel preditora possuem a
mesma representatividade em distribuio entre
si, ainda que nenhum destes nveis seja vlido
como representatividade em distribuio de
toda a populao estatstica. Esta situao ser
explicada com exemplos experimentais, pois
neles mais simples se obter esta condio.

3.8 Independncia em anlises de


relaes

Vamos comparar trs experimentos para testar


a hiptese que a Vermiculita (um mineral semelhante mica usado na agricultura) adicionada
ao solo influi sobre a produtividade de soja.
Para testar esta hiptese voc vai comparar o
crescimento de plantas em vasos sem vermiculita (controle) com o crescimento de plantas em
vasos com 50 g de Vermiculita adicionada ao
solo. No primeiro experimento voc utiliza apenas sementes saudveis de soja de um pacote
que comprou em um supermercado. Ao final, as
plantas nos vasos com o tratamento cresceram
significativamente mais e a resposta para sua
questo, dentro de critrios estatsticos, sim,
pelo menos para este pacote. Note que um
pacote no pode ser considerado representativo
das plantas de soja do mundo, entretanto o
resultado positivo pode ser considerado uma
evidncia relevante do efeito da vermiculita para
alm deste pacote. A lgica que, neste contexto, costuma ser mais razovel imaginar que a
diferena uma caracterstica genrica da soja
do que particular ao pacote. Voltaremos a isto
adiante.

As anlises mais comuns em estudos biolgicos


envolvem a avaliao de relaes que implicam
causalidade (relaes consequentes). Nestas
anlises so calculados parmetros multivariados (e seus intervalos de confiana), incluindo
diferenas de mdias entre grupos, coeficientes
de correlao ou coeficientes para cada varivel
de uma equao em modelos matemticos mais
complexos. Nesta situao, podemos falar em
independncia quando h representatividade
paralela (Fig. 3.12). Na representatividade
paralela ideal, os conjuntos de unidades amostrais de cada nvel da varivel preditora (ou

Agora imagine que voc tem dois pacotes de


sementes de soja, um de um lote brasileiro e
outro de um lote japons. Voc escolhe (ou
sorteia) qual deles vai ser utilizado no controle e
o outro vai para o tratamento. Ao final, as plantas nos vasos com o tratamento cresceram
significativamente mais. O problema que voc

Figura 3.12- A representatividade paralela ocorre quando


os conjuntos de unidades amostrais de cada nvel da
varivel preditora (linhas paralelas) possuem a mesma
representatividade de distribuio. Isto ocorre, por exemplo, quando selecionamos aleatoriamente as unidades
amostrais que sero utilizadas em cada tratamento em um
experimento.

42

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

no sabe se cresceram mais em funo do


tratamento ou em funo do lote. No h representatividade paralela porque os nveis da varivel preditora diferem em algo que relevante
alm da prpria varivel em estudo. O sorteio
foi uma aleatorizao irrelevante, pois no foi
para cada semente e sim para cada pacote, de
forma que no permitiu a homogenizao da
representatividade entre os nveis. A varivel
lote neste caso uma varivel de confundimento porque gera uma indefinio, j que
uma explicao alternativa ao tratamento com
Vermiculita para explicar a diferena entre tratamento e controle. Portanto, este segundo
experimento inconclusivo.

o nico fator que influi no sentido de causar


uma diferena entre o tratamento e o controle
o prprio efeito do tratamento em estudo.
No segundo experimento o potencial efeito do
lote tornou o resultado inconclusivo, mas no
terceiro experimento o efeito do lote foi anulado
porque o sorteio garantiu a representatividade
balanceada, isto , a distribuio do efeito do
lote igualmente entre tratamento e controle.
Tecnicamente dizemos que realizamos atribuio aleatria de qual semente vai para cada
nvel de tratamento. Em uma linguagem mais
simples, a gente simplesmente mistura bem as
sementes e distribui entre os tratamentos. Apenas em estudos experimentais temos este poder de atribuio aleatria de tratamentos. Em
estudos no experimentais precisamos encontrar outras formas de anular ou reduzir o efeito
de variveis de confundimento que trataremos
no captulo 6, mas a essncia de se buscar
representatividade paralela a mesma.

Em um terceiro experimento, voc sorteia de


qual dos dois lotes, do Brasil ou do Japo, sair
cada uma das sementes que ir para o tratamento e para o controle. Desta forma, ter uma
mistura dos dois lotes tanto no controle como no
tratamento. Ao final, as plantas nos vasos com
o tratamento cresceram significativamente mais
e a resposta para sua questo sim, pelo menos para esta mistura de dois pacotes. Assim
como o primeiro experimento, este tambm
vlido.

Alm de anular o efeito de potenciais variveis


de confundimento, h uma segunda preocupao que precisa ser levada em conta em estudos de relaes: a representatividade. Como j
comentamos acima, o experimento 1 com as
sementes foi considerado vlido, mas baseouse em apenas um lote de sementes de soja. O
ideal no seria que fosse utilizada uma amostra
aleatria de todas as sementes de soja do
mundo? Isto seria muito difcil, mas pelo menos
no deveramos tentar misturar vrios lotes
diferentes?

Note que em nenhum desses experimentos


temos garantia de representatividade em distribuio das amostras em relao a todas as
plantas de soja do mundo, mas isto no to
importante quanto a representatividade paralela.
Vejamos por qu.
Nos estudos de relaes entre uma varivel
preditora e uma varivel resposta no h apenas duas variveis em jogo, h muitas outras
variveis influindo sobre a varivel resposta,
que podem atrapalhar na avaliao sobre a
relao em estudo. O primeiro e o terceiro experimentos so considerados vlidos porque a
representatividade em distribuio entre os
nveis da varivel preditora idntica. Isto ,
ainda que no tenham representatividade em
distribuio da populao, no diferem de forma
potencialmente tendenciosa, pois no existe um
fator que afeta o grupo do tratamento de forma
diferente da que afeta o grupo controle. Assim,

Para responder estas perguntas, precisamos


levar em conta conhecimentos biolgicos e
razoabilidade. A rigor, a concluso a que chegamos com um lote aplica-se apenas ao lote de
sementes que estudamos. Entretanto, este nvel
de rigor exagerado. Podemos e devemos
utilizar a validao externa por razoabilidade
(seo 1.5). Com base em nossos conhecimentos biolgicos, devemos ser cautelosos em generalizar o resultado para toda a espcie em
qualquer clima e solo, mas muito razovel
generalizar para a variedade e para o mesmo
clima e solo. Poderamos ter feito uma mistura

43

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

de lotes diferentes, o que realmente aumenta o


poder de generalizao, entretanto, isto introduz
rudo na anlise. Rudo a variao ocasionada
por incluir o efeito de outras variveis, ainda que
de forma no tendenciosa, o que leva ao obscurecimento do efeito em estudo. A deciso de
misturar alguns lotes razovel e precisa ser
ponderada pelo pesquisador, levando em conta
se ir priorizar o poder do teste ou a generalizao. Entretanto, considerando que normalmente
queremos generalizar nossas concluses para o
futuro, e que no podemos viajar no tempo, a
representatividade paralela ideal raramente
possvel e geralmente teremos que julgar com
base na razoabilidade at onde podemos generalizar as concluses de um estudo.

das. Com esta definio, somos induzidos a


achar que no haveria problema de independncia no segundo experimento da seo anterior, pois no h nenhuma influncia de uma
semente sobre a outra, cada uma est em um
vaso separado. Entretanto, o problema das
sementes no estaria na influncia presente de
uma rplica sobre outra durante o experimento,
mas em potenciais diferenas nos passados
compartilhados que so fatores comuns a cada
lote de sementes (constituio gentica, riqueza
do solo onde foram geradas, tempo de armazenamento, qualidade obtida em funo da forma
de colheita e transporte, etc.).
Definio 2: Em probabilidade e estatstica,
independncia entre variveis aleatrias ou
eventos significa que a partir do resultado de
um deles no possvel inferir nenhuma concluso sobre o outro (Wikipdia). A Wikipdia
uma valiosa fonte para tirar dvidas de estatstica, mas no ajudou. O que significa a partir do
resultado de um deles? Com dependncia ou
sem, nunca podemos inferir um valor a partir de
outro. E se considerarmos vrios valores, o
conceito no se sustenta logicamente nem nos
exemplos de jogos de azar. O que significa no
possvel inferir nenhuma concluso sobre o
outro? Se eu jogar um dado muitas vezes (eventos independentes) posso verificar que h
seis nmeros diferentes com frequncias semelhantes de ocorrncia e posso concluir que a
chance de cair qualquer um deles na prxima
jogada de 1/6, ao contrrio do que prope a
definio.

Em resumo: em estudos de relaes, o aspecto


mais importante proceder de forma a anular
todas as potenciais variveis de confundimento
(aquelas que podem causar tendenciosidades).
Desta forma, teremos a segurana de que as
diferenas significativas nas variveis respostas
apenas possam ser atribudas s variveis preditoras estabelecidas no estudo. Adicionalmente, preciso refletir at que ponto as unidades
amostrais representam o universo amostral
inferido pelo estudo.

3.9 Consideraes complementares


3.9.1- Sobre o significado do termo Independncia.
Como vimos, o termo independncia tem significados diferentes, o que gera confuso. Nesta
seo analisaremos o uso do termo e sintetizaremos o que vimos nas duas sees anteriores.
Mesmo nos melhores textos de bioestatstica o
conceito de independncia apresentado de
forma pouco esclarecedora.

surpreendente que um termo to importante


na estatstica no seja definido de forma mais
apropriada. Estas definies provavelmente
refletem uma viso de estatstica predominantemente inspirada em jogos, mas que no se
encaixa bem em situaes de pesquisa.

Definio 1: Por independncia queremos dizer


que as observaes coletadas em uma rplica
no tem influncia sobre as observaes coletadas em outra (Gotelli e Elison 2010). Mesmo
neste excelente livro, a definio no clara.
difcil entender como observaes coletadas
podem influir sobre outras observaes coleta-

A dificuldade existe porque se utiliza um termo


para quatro conceitos diferentes: a independncia genrica, a independncia absoluta, a independncia induzida de amostragens e a independncia induzida de relaes.

44

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

A Independncia (genrica) um termo que se


aplica quando se obtm as condies necessrias para anlises estatsticas no tendenciosas.
Entretanto, o termo normalmente no utilizado
estritamente com este sentido. A expresso
independncia entre unidades amostrais
utilizada com frequncia, como se fosse uma
caracterstica intrnseca das unidades amostrais. Mas importante entendermos que duas
unidades amostrais nunca so independentes
sob todos os aspectos imaginveis. Voc poderia considerar independentes duas unidades
amostrais obtidas em lados opostos do mundo,
mas elas seriam dependentes em algum outro
aspecto, como, por exemplo, por terem sido
medidas no mesmo ano. Na realidade, entre as
unidades amostrais tem que haver uma dependncia fundamental: todas devem pertencer
mesma populao, que delimitada por muitas
caractersticas comuns. Na forma como o termo
costuma ser usado, no fica claro que estas
condies variam em funo do tipo de anlise
que estamos fazendo.

Existe independncia induzida de amostragem


quando as unidades amostrais includas na
amostra foram selecionadas de forma representativa do universo amostral (representatividade
em distribuio). O modelo ideal de independncia induzida de amostragem a amostra
aleatria na qual cada unidade amostral tem
igual chance de ser escolhida para fazer parte
da amostra. Entretanto, h outras formas de se
obter independncia induzida de amostragem.
Esta forma de independncia necessria para
estimativas de medidas coletivas (parmetros)
de uma populao.
Existe independncia induzida de relao por
representatividade balanceada em estudos com
variveis preditoras e varivel resposta quando
a relao entre cada varivel preditora e a varivel resposta no influenciada ou por uma
varivel de confundimento ou at mesmo pelo
efeito de uma varivel preditora sobre a outra. A
forma ideal de se obter isto pela aleatorizao
da atribuio de tratamentos descrita na seo
anterior que pode ser obtida em estudos experimentais, mas h outras abordagem que podem se aproximar deste ideal.

Dois eventos so absolutamente independentes se a ocorrncia de ambos aleatria dentro


do mesmo universo de possibilidades delimitado. Depois de tirar uma carta do baralho (e ver
o que ela era), o universo de possibilidades da
segunda retirada diferente (uma carta conhecida est fora), logo os dois eventos no so
absolutamente independentes, pois um influi
sobre o outro. Apenas com condies idnticas
temos independncia absoluta entre eventos.
Este conceito de independncia aplicvel em
jogos e em muitos experimentos em fsica e
qumica. Algo prximo a isto pode ocorrer em
laboratrios de biologia quando possvel considerar todas as condies biolgicas idnticas
(condies climticas estritamente controladas,
ao se utilizar clones, eficincia do manipulador
padronizada, etc.). Se houver qualquer dvida
sobre eventuais efeitos de mudanas temporais,
espaciais, genticas, de eficincia, etc., dentro
do laboratrio, que no seja o tratamento em
estudo, melhor realizar a pesquisa com o
conceito de representatividade balanceada.

45

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

3.9.2- O preo a pagar pela qualidade.

cada medida; b) quando h dificuldade em se


obter os objetos a serem medidos; c) quando o
estudo permite obter vrias medidas independentes.

Alta preciso e acurcia so caractersticas


desejveis em medidas, mas no existe medida
perfeita e qualidade tem seu preo, sejam elas
medidas de propriedades de unidades amostrais ou medidas de propriedades de populaes. Por exemplo, vale a pena gastar metade
do dinheiro de um projeto para trocar um instrumento de baixa preciso por outro de alta
preciso, comprometendo uma verba que permitiria mais idas ao campo? razovel delimitarmos o tamanho de um transecto de 200 m
usando passos, ou necessrio sempre utilizarmos da preciso de uma trena? Se uma
amostra aleatria invivel, podemos utilizar
uma amostra menos representativa ou melhor
desistir do estudo? Um experimento deve ser
cancelado se questes logsticas nos impedem
de realizar as medidas do tratamento e do controle na mesma semana?

Nas duas primeiras situaes, a prioridade na


preciso mais alta que na terceira. Por exemplo, se estivermos selecionando atletas para
uma olimpada, no aceitvel a excluso de
um atleta por erro de medida (cada medida leva
a uma deciso importante). Quando temos dificuldade em obter os objetos ou encontrar as
situaes de interesse da pesquisa, cada oportunidade deve ser aproveitada ao mximo. O
que se ressalta aqui que apenas nos casos
em que cada medida for muito importante ou
difcil de ser obtida, a alta preciso justifica alta
prioridade de investimento. Naturalmente, no
uma questo de investir ou no na qualidade,
mas de quanto investir.
Na terceira situao, temos que separar preciso de acurcia. Por causar desvios aleatrios
(i. e. no tendenciosos), a falta de preciso
normalmente no um problema to grave na
pesquisa. um problema indesejvel, mas frequentemente pode ser compensado por uma
amostragem maior (com a vantagem de melhor
representatividade). Isto ocorre porque nos
testes de hipteses estatsticas, as concluses
so tomadas quando uma tendncia (relao
em estudo) to forte que pode ser distinta de
variaes aleatrias, sejam elas naturais ou de
medida. A falta de preciso pode contribuir para
no termos sucesso em provar uma determinada relao, em funo de uma amostragem
insuficiente. Isto considerado um erro menos
srio do que provar equivocadamente uma
relao que no existe, como veremos no captulo 4. Em outras palavras, a falta de preciso
pode atrasar a obteno de resultados significativos, mas no aumenta a chance de um falso
positivo. Por outro lado, a falta de acurcia no
pode ser compensada por um aumento no nmero de unidades amostrais medidas. Portanto,
uma fonte de preocupaes nas trs situaes.

Administrar projetos de pesquisa uma atividade complexa, de forma que no podemos ignorar custos, tempo, praticidade e questes logsticas na determinao da preciso e acurcia
que ser utilizada. importante conhecer ideais
metodolgicos (e. g. medidas precisas e no
tendenciosas, tamanhos amostrais grandes,
amostragens aleatrias, etc.), mas estes ideais
no so leis metodolgicas absolutas, so apenas diretrizes que devem ser levadas muito a
srio. Acontece que h limites logsticos, fsicos
e morais que ocasionalmente nos impedem de
medir e coletar dados da forma ideal. essencial entender a diferena entre um comportamento cuidadoso para evitar interpretaes
equivocadas e uma paranoia metodolgica (seo 1.5). Um treinamento metodolgico no
pode te proibir de agir nestas condies, mas
ensinar como redobrar o cuidado quando for
necessrio. No existe uma nica metodologia
correta, existem metodologias apropriadas (ou
no) considerando o contexto e as alternativas
disponveis para resolver um problema.
Vamos abordar situaes concretas. necessrio diferenciar trs situaes nas medidas individuais: a) quando h uma deciso importante a

46

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

importante que o cuidado com a qualidade da


medida no se torne obsessivo, isto , prejudicial ao prprio estudo. Por exemplo, digamos
que voc esteja fazendo um trabalho de ecologia vegetal no Pico da Neblina e seu tempo
muito curto por questes logsticas. vlido
medir transectos com passos para economizar
o tempo de estender a trena em cada transecto? Vimos que a falta de preciso no um
problema srio, mas e se neste processo inconscientemente obtivermos uma medida tendenciosa que subestima o tamanho do transecto? Digamos que esta falta de acurcia resulte
em transectos com 190 m em mdia ao invs
de 200 m. Qual a gravidade disto? Depende da
questo em estudo. Se voc estiver querendo
comparar a densidade de plantas em diferentes
altitudes e cometer o mesmo erro, ento a falta
de acurcia seria irrelevante, pois todos os transectos sero do mesmo tamanho, que o que
importa para que sejam comparveis. Entretanto, se o objetivo for obter medidas precisas de
densidade para comparar com outros locais,
ento quanto maior for o desvio, maior ser o
problema com o resultado. Provavelmente, uma
sub-estimativa de 5% na rea de cada transecto
no tenha muita relevncia, neste exemplo em
particular.

ta forma, mesmo sem diferena na habilidade


de nadar, concluiramos que os meninos tm
mais habilidade. Este exemplo ilustra os riscos
da falta da acurcia em medidas em qualquer
escala.
Os conceitos de preciso e acurcia aplicam-se
melhor a valores quantitativos, mas podem ser
generalizados para outras escalas de medida.
Quando estamos com uma varivel ordinal,
podemos obter maior preciso quanto maior for
o nmero de categorias ordinais. Por exemplo,
se queremos avaliar a sensao trmica de
pessoas, teremos menos preciso com uma
escala de trs nveis efetivos (quente, agradvel, frio) do que uma de cinco nveis efetivos
(muito quente, quente, agradvel, frio e muito
frio). Entretanto, escalas ordinais exigem um
cuidado redobrado na anlise, pois muitas vezes difcil avaliar acurcia nestas condies
(e. g. qual o valor real de muito frio?). Quando
falamos em escala categrica, temos uma situao similar. Nem sempre os limites de uma
categoria so claros. Qual o limite onde o
vermelho deixa de ser vermelho para se tornar
laranja? O resultado de um exame de sangue
pode ser positivo ou negativo (logo binrio) para
malria, entretanto, h uma incerteza (pode ser
um falso positivo) que diminui em funo da
quantidade de amostras e da experincia de
quem analisa o exame. Por isto, os erros de
atribuio de categorias tambm podem ser
considerados erros de preciso (se no forem
tendenciosos) ou de acurcia (se forem tendenciosos).

Alguns dos problemas mais graves ligados


qualidade dos dados aparecem quando estamos tomando uma medida por outra. Um exemplo clssico a utilizao de provas para medir
coeficientes de inteligncia, como se uma prova
destas conseguisse captar conjuntamente a
complexidade dos diferentes tipos de inteligncia. O mximo que estes testes poderiam medir
a capacidade das pessoas de se sarem bem
neste tipo de teste. Podemos considerar problemas deste tipo como falta de acurcia por
indefinio de um padro de referncia para
calibrar as medidas. Na seo 1.5 vimos outros
problemas de validao da medida ligados a
esta falta de acurcia inclusive um com varivel
binria. Ao perguntarmos a meninos se eles
sabiam nadar, a resposta (sim ou no) era tendenciosa (muitos no sabiam, mas tinham vergonha de responder a verdade), a das meninas
tambm era, mas de forma menos intensa. Des-

Como vimos na seo 3.6, a acurcia na medida de um parmetro maximizada quanto melhor a representatividade amostral. Se a amostragem aleatria no possvel, o que muito
comum, procure o mtodo de coleta que mais
se aproxima daquilo que voc esperaria obter
em uma amostra que fosse aleatria. H muitas
formas sistemticas de coletar os dados que
permitem obter amostras representativas. Tambm h formas de analisar os dados para obter
resultados mais representativos (e. g. a mdia
ponderada). Se nada disto for possvel, procure
coletar amostras o mais distante possvel dentro

47

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

da rea de estudo. Tente evitar associar alguma


varivel que poderia dar um vis coleta. Por
exemplo, se quer investigar o interesse de uma
populao por futebol, o ltimo lugar onde vai
obter uma amostra representativa em um
estdio de futebol. Entrevistar pessoas na rua
em diferentes bairros no o ideal, pois exclui
grupos de pessoas que andam pouco na rua,
como idosos. Telefonar para pessoas tambm
pode excluir pessoas que no tem dinheiro ou
interesse em ter um telefone. Entretanto, se
voc fizer as duas coisas e os resultados forem
semelhantes, ento tem uma indicao que
estas formas de amostrar no foram to ruins.
Outra opo simplesmente reduzir o universo
de estudo ao grupo com o qual se pode trabalhar e tirar concluses apenas sobre este grupo.
Por exemplo, seu estudo pode ser sobre o interesse em futebol das pessoas que andam na
rua.
Como vimos na seo 3.8, a questo da independncia no estudo de relaes um problema fcil de resolver em abordagens experimentais normais, nas quais podemos escolher aleatoriamente quais entidades recebero quais
tratamentos. Entretanto, quando isto no possvel bem mais complicado analisar causalidade. Este assunto ser aprofundado no captulo 6.

48

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

normal. Coloque nomes nos eixos ilustrando um


exemplo de um estudo biolgico imaginrio.

Exerccios:
1) O que so escalas de medida? Apresente um
exemplo original de cada uma delas.

11) Cite usando exemplos de variveis originais


a) um parmetro populacional para uma varivel
binria; b) dois parmetros populacionais para
uma varivel ordinal; c) trs parmetros populacionais para uma varivel quantitativa; d) um
parmetro multivariado.

2) Faa um grfico EPR com trs nveis de medida ordinais no eixo x e com cinco nveis quantitativos no eixo Y. Represente 20 entidades
neste grfico.

12) Quando a mediana e a moda so medidas


mais teis?

3) Explique por que dividir a escala quantitativa


em nmeros contnuos e nmeros descontnuos no resolve o problema da descontinuidade.

13) Para que utilizamos intervalos de confiana


em estudos biolgicos?

4) O fato de um valor pertencer a uma escala


no implica que ele no possa pertencer a outra
escala ao mesmo tempo. Explique.

14) Qual a diferena na utilidade do desvio padro e do erro padro.


15) No Bootstrap, o computador cria pseudopopulaes pela clonagem dos dados. Explique como isto permite determinar intervalos de
confiana pela excluso de extremos.

5) Explique e exemplifique as incertezas na


atribuio de valores nominais e ordinais.
6) Faa uma ilustrao representando alvos
atingidos por uma espingarda com a) alta preciso e alta acurcia; b) alta preciso e baixa
acurcia; c) baixa preciso e alta acurcia;
d) baixa preciso e baixa acurcia.

16) Explique por que acurcia mais importante


que a preciso quando estamos estimando
parmetros populacionais?
17) Explique as diferenas de definio e uso
da representatividade em cobertura, da representatividade de distribuio e da representatividade paralela.

7) Explique porque o Intervalo Interquartil uma


medida de disperso (ou impreciso) melhor
que a amplitude total para comparar a disperso
de amostras com nmero de observaes diferentes.

18) Explique a dificuldade que existe na definio do termo independncia em contextos


estatsticos.

8) Em que o desvio padro mais conveniente


que intervalos interquartis como medida de
disperso e quando a utilizao de desvios
padres no apropriada.

19) O que paranoia metodolgica e porque


nem sempre podemos seguir ideais metodolgicos?

9) Alguns textos usam o termo erro para a


disperso de dados em funo da impreciso
da medida e para a variao natural. Explique
por que isto no apropriado.

20) Podemos falar em preciso e acurcia em


escalas de medidas ordinal, categricas e binrias?

10) Faa um histograma com 24 valores que


represente uma distribuio bastante prxima
do esperado para uma populao com distribuio normal e um segundo histograma com 24
valores com uma distribuio muito fora do esperado para uma populao com distribuio

49

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

4. A lgica dos testes de


hipteses
Uma das funes mais importantes da estatstica fornecer ferramentas que ajudem a testar
hipteses. O assunto to central em livros e
cursos de estatstica que algumas pessoas
acham que se trata de um assunto dentro da
estatstica (Fig. 4.1-A). Em funo disto, conveniente chamar a ateno para o fato que nem
todos os testes de hipteses envolvem estatstica. Testes de hipteses sem estatstica so
extremamente comuns, no apenas em filmes
de Sherlock Holmes, como no seu cotidiano e
em muitas pesquisas cientficas (seo 1.4).
Alm disto, mesmo quando se utiliza estatstica,
o teste de hiptese algo mais amplo que o
teste estatstico (Fig. 4.1-B). O assunto deste
captulo a lgica dos testes estatsticos dentro
do contexto mais amplo dos testes de hipteses.

Figura 4.1- O assunto teste de hipteses no algo que est


dentro da estatstica como simbolizado na figura A. O teste
de hipteses algo mais amplo que pode utilizar importantes ferramentas estatsticas (rea de sobreposio na figura
B).

4.1 O mtodo hipottico dedutivo

Mais um esclarecimento para evitar outro mal


entendido comum. Quando dizemos que provamos alguma coisa na pesquisa, estamos nos
referindo a provas empricas. Provas lgicas
puras existem em campos como a geometria e
o clculo, onde h raciocnios inteiramente dedutivos e inquestionveis. Uma prova emprica
diferente, ela usa lgica, mas ela no inteiramente dedutiva, mesmo no mtodo hipotticodedutivo, pois ela no logicamente necessria
(Diez e Moulines, 2007). A prova emprica
uma prova considerada satisfatria dentro de
critrios rgidos, e pode ser extremamente convincente, mas a cincia sempre questionvel,
pois no deduo pura. Se fosse deduo
pura, a observao no seria necessria.
comum lermos frases como impossvel voc
provar uma hiptese na cincia. A frase s est
correta se o termo provar estiver com o significado de prova lgica pura. Entretanto, no h
nada de errado em se dizer que se provou empiricamente uma hiptese se seguirmos os critrios de validao que a comunidade cientfica
da rea do assunto em questo tiver determinado.

Chamaremos a hiptese emprica que queremos testar de hiptese de trabalho. Como vimos
na seo 1.3, uma hiptese (de trabalho) emprica uma afirmao que tem consequncias
empricas constatveis. O teste de uma hiptese baseia-se justamente na deduo de previses desta hiptese e na verificao que as
previses realmente ocorrem. Parece fcil, mas
tem dois problemas.
O primeiro problema que observar qualquer
coisa que a hiptese prev no evidncia
suficiente para provar que a hiptese est correta. As previses para testes precisam definir
condies especiais para reduzir incertezas ao
mnimo. A fase dedutiva do mtodo hipottico
dedutivo termina na previso; mas o que vem
depois? A prova emprica baseia-se na coerncia entre previso e evidncia e na excluso por
julgamento de grau de razoabilidade (qualitativo-sistmico) e/ou clculo de razoabilidade
(probabilidade) de todas as outras possibilidades de se obter esta mesma evidncia. Este
ser o assunto na maior parte do captulo.

50

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

O segundo problema que no observar o que


a hiptese prev tambm no prova que a hiptese esteja errada. O que fazemos quando no
conseguimos provar a hiptese de trabalho?
Devemos abandona-la? A deciso ao final do
teste de hiptese nem sempre um sim ou um
no claros, e temos que refletir sobre o que
fazer com o talvez. Este assunto e outros ligados aos testes de hipteses sero tratados mais
para o final do captulo.

outra hiptese razovel para explicar a evidncia obtida.


Outro exemplo. Um bilogo estudava uma espcie de formiga que caa em grupos de cerca
de 20 indivduos, captura cupins a at 200 m de
distncia do ninho e depois retorna ao ninho.
Ele se perguntou: como elas acham o caminho
de volta? (Questo). Ele sabia que as formigas
utilizam pistas qumicas, mas h um risco alto
delas acidentalmente perderem a trilha, por isto
achou que elas poderiam estar utilizando outras
pistas para encontrar seus ninhos. Ento, ele
levantou a hiptese que elas usavam tambm
referenciais espaciais (rvores e arbustos ao
redor) para achar o caminho de volta. Para testar a hiptese, ele esperou as formigas se afastarem 100 m do ninho e prendeu-as sob um
balde, retirou toda a camada superficial de solo
da rea ao redor do ninho, marcou as formigas
com uma tinta no txica e soltou-as. No dia
seguinte, ele voltou ao formigueiro e encontrou
as formigas marcadas l. Desta forma, ele concluiu que as formigas so capazes de encontrar
o ninho mesmo sem as pistas qumicas e devem possuir uma capacidade de orientao com
base em referncias espaciais. Veja como este
procedimento envolve contrastes de previses.

Comecemos com o primeiro problema e vamos


ilustrar esta ideia com um exemplo cotidiano.
Voc sabe que estudar ajuda a tirar notas mais
altas, mas imagine que este fosse um fato desconhecido e vamos tratar esta afirmao como
uma hiptese de trabalho. Como mostrar que
ela verdadeira? Uma previso que algum
que estude muito ter uma nota mais alta que
algum que estude pouco. Ento imagine que
Joo estudou e tirou 9,0 e Jos estudou e tirou
4,0, como seria esperado pela hiptese de trabalho. Entretanto, podemos imaginar muitas
outras razes que poderiam explicar o sucesso
de Joo e o fracasso de Jos. Logo, no podemos afirmar com base nestes dados que estudar faz diferena. Por isto, a tua previso no
pode se restringir a duas pessoas, sua previso
tem que ser que vrias pessoas que estudarem
muito tero em mdia notas maiores que vrias
pessoas que estudarem pouco. Voc ainda
precisa eliminar outras possibilidades: desde
que as provas sejam controladas para prevenir
cola; desde que o grupo dos que estudaram
seja equivalente ao grupo dos que no estudaram (por exemplo, por escolha aleatria dos
membros de cada grupo); desde que a prova
seja sobre o assunto estudado, etc. Veja que
h uma srie de condicionais para a sua previso ser considerada uma previso vlida para
teste, isto , uma previso exclusiva da hiptese
de trabalho. Algum poderia invalidar a concluso do teu estudo se mostrasse que o grupo
que estudou mais fez a prova em uma sala ar
condicionado e o grupo que no estudou fez a
prova em uma sala quente. A diferena poderia
ter sido pelo desconforto do segundo grupo, e
voc no prova empiricamente uma hiptese
enquanto no mostrar que no h nenhuma

A previso da hiptese era que as formigas


conseguiriam retornar ao ninho (pois podem
utilizar referenciais espaciais). Entretanto, a
mera observao das formigas de volta no ninho no teria nenhum valor sem a eliminao
dos rastos com a remoo do solo, pois elas
poderiam ter retornado utilizando apenas as
pistas qumicas. O bilogo ainda marcou as
formigas para eliminar a possibilidade de estar
confundindo os indivduos do estudo com outras
formigas do ninho, ou at com formigas de outro
ninho que tivessem aproveitado a oportunidade
do ninho vazio. Algum poderia questionar a
validade de um experimento que prendeu formigas sob um balde, trocou o solo e as marcou
com tinta, o que certamente poderia ter afetado
o comportamento delas. Entretanto, estas criticas no comprometem a interpretao do resultado, pois o que poderamos prever desta perturbaes que elas apenas poderiam atrapa-

51

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

lhar as formigas, de nenhuma forma poderiam


ajud-las. O fato que mesmo com estas perturbaes, elas conseguiram chegar ao formigueiro. Outra pessoa poderia questionar a interpretao dizendo que as formigas poderiam ter
se orientado com base no eixo magntico da
terra, utilizando uma bssola interna. Ele poderia ter respondido que esta possibilidade no
pode ser excluda, mas que no parece razovel, pois j foi demonstrada a capacidade de
orientao por referenciais espaciais em outros
himenpteros, mas nunca foi demonstrada a
capacidade de orientao magntica em insetos. Algumas descobertas incrveis, como a
capacidade de ecolocao em morcegos demoraram a ser aceitas. Entretanto, geralmente
uma boa deciso no comear seriamente ideias muito radicais sem ter bons motivos para
isto, especialmente quando sua hiptese de
trabalho parece muito mais provvel.

sam ser consideradas no processo, por isto


utilizamos as aspas. Por outro lado, no est
errado cham-las de hipteses, j que so
afirmao que tem consequncias empricas
constatveis.
Na realidade, o processo completo de teste de
hipteses comea antes da hiptese de trabalho. A escolha de uma hiptese no algo aleatrio, e importante que no seja. A seleo
preliminar de hipteses relevantes e objetivas
parte essencial do processo de pesquisa.

4.2 Estabelecendo hipteses de


trabalho
A gerao de hipteses no tem regras, no
importa como voc chega a uma hiptese. Entretanto, h diretrizes que podem ajudar a criar
hipteses mais interessantes. Talvez a diretriz
mais importante seja: s teste hipteses que
meream ser testadas. Cada hiptese representa um risco de falso positivo. Ficar testando
hipteses indiscriminadamente, sem pensar na
sua razoabilidade como sair dando tiros para
todos os lados: voc pode atingir bandidos, mas
mais provvel que atinja um inocente.

Ainda h uma hiptese a considerar: as formigas poderiam ter conseguido retornar por sorte.
Poderiam ter andado a esmo pela rea e por
acaso encontrado a pequena abertura do formigueiro. Entretanto, procure imaginar a situao,
no eram 2m ou 10 m, eram 100 m. uma
distncia enorme para as formigas andarem ao
acaso e encontrarem o formigueiro apenas por
sorte. Seria muito mais provvel que elas
simplesmente se perdessem se no tivessem orientao. A hiptese de terem encontrado ao acaso to improvvel que
pode ser tranquilamente descartada.
Para aprofundar a ideia do mtodo hipottico dedutivo, vamos representa-la de
forma mais visual (fig. 4.2) e vamos ver as
partes envolvidas. A hiptese de trabalho
tem uma posio central no processo, o
que natural, porque ela que est sendo
testada e dela que partem as previses
que sero utilizadas. Vemos no esquema
que existem vrias hipteses que poderiam competir com ela como explicaes
alternativas para o que se encontrou como
evidncias. No so hipteses de interesse
prprio de pesquisa, por isto utilizamos as
aspas, so antes possibilidades que preci-

Figura 4.2- Uma prova emprica no mtodo hipottico dedutivo tem a


hiptese de trabalho como centro e outras hipteses que precisam ser
eliminadas por procedimentos, clculos e/ou razoabilidade. Na realidade,
o procedimento de escolher hipteses relevantes j faz parte do processo,
pois diminui a chance de falsos positivos.

52

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Pense no processo utilizado na soluo de crimes. A princpio, qualquer habitante da terra


poderia ser o culpado de um determinado assassinato (= bilhes de hipteses). No podemos julgar o mundo inteiro, por isto precisamos
de uma investigao para chegar a um suspeito
ou a um grupo de suspeitos que trabalhou junto
para realizar o crime (= 1 hiptese de trabalho).
Depois, h uma busca de evidncias que apoiem a hiptese e ento o caso levado a julgamento. No momento do julgamento ns nos
concentramos em uma nica pessoa ou grupo
de pessoas que poderia ter trabalhado junto
para realizar o crime. Reduzimos bilhes de
hipteses a apenas duas: os rus so culpados
ou os rus so inocentes.

de hipteses de trabalho se baseiam na probabilidade de hipteses concorrentes. Algo improvvel algo raro, mas no algo impossvel,
seno nem seria testado. O problema que a
observao ou um resultado raro no prova
nada se no soubermos quantas outras observaes ou testes foram feitos para se chegar a
este resultado raro. Vamos entender isto analisando dois exemplos.
Podemos analisar cientificamente se pessoas
com alegadas capacidades extrassensoriais
podem ajudar na soluo de crimes? Claro que
sim. Chame a pessoa que diz ter estes poderes,
escolha um crime no resolvido aleatoriamente
e pea para ela predizer com preciso onde
est um corpo desaparecido. Se ela conseguir
prever que o corpo est enterrado do lado do
terceiro pinheiro esquerda da caverna do urso, pode contrat-la. Algum dir: Por que
perder tempo com este teste se j h vrios
registros confiveis de pessoas que previram
coisas que resolveram crimes; estes registros
no bastam para provar a existncia da mediunidade? O problema que estes registros no
teriam se tornado registros se a adivinhao
no fosse correta, teriam cado no esquecimento, de forma que no sabemos a taxa de fracasso. Imagine que milhares de pessoas fazem
centenas de previses ousadas. Fatalmente
algumas destas previses sero corretas. Por
isto, no basta te mostrarem alguns registros
impressionantes, isto no prova nada. No d
para confiar porque sabemos que houve uma
inflao de testes. Nossa estatstica intuitiva
fraca para lidar com alguns tipos de clculos de
probabilidade e h coisas em que queremos
acreditar ignorando o razovel. Por que pessoas com alegadas capacidades extrassensoriais
nunca decidem quebrar a banca dos cassinos
ao invs de tentar nos convencer dos seus poderes? Tomamos decises com base em probabilidades isoladas, mas tudo muda quando
temos muitos testes. As observaes do passado so teis para levantar hipteses (e. g. de
possveis mdiuns), mas devem ser vistas com
muita desconfiana como provas se no tivermos informaes adicionais suficientes.

A fase da determinao de qual o principal


suspeito de cometer um crime pode ser to
simples que acontece inconscientemente ou to
complexa que nem conseguimos chegar a um
suspeito qualificado. Nossa mente possui mecanismos de escolha to rpidos que, em algumas situaes, voc nem percebe que fez uma
escolha. Certamente nossa primeira opo recair antes em uma pessoa agressiva do convvio da vtima que na possibilidade de ter sido
uma simptica velhinha. Nesta fase, difcil
colocar regras, pois at descobertas casuais
podem ser vitais. Entretanto, certamente h
diretrizes de aes, como entrevistar conhecidos da vtima, recolher materiais da cena do
crime, etc., juntando peas at comear a se
formar um quadro. Em situaes complexas,
importante comear com a mente aberta para
qualquer possibilidade razovel e submet-las a
o processo de competio de hipteses, como
em um campeonato para ver o melhor time,
frequentemente com diferentes etapas at chegar ao suspeito qualificado (ou grupo suspeito
que trabalhou junto).
Por que uma seleo preliminar de hipteses
relevantes e objetivas parte essencial do processo de pesquisa? Por que no sair por ai
coletando dados simplesmente e depois ver
aonde chegamos? Seria apenas uma questo
de custo do processo de testar muitas hipteses? Acontece que as argumentaes a favor

53

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Na bolsa de valores h corretores que so considerados geniais com base na proporo das
aes que eles recomendaram e que tiveram
lucros excepcionais, e eles so contratados com
salrios milionrios. Ser que eles valem estes
salrios ou so simplesmente os ganhadores na
loteria das bolsas? Estudos mostraram que,
depois dos sucessos excepcionais, estes corretores brilhantes no tinham mais sucesso que
corretores medianos. No percebemos isto
porque nossas convices que o sucesso est
ligado competncia so to fortes que nos
cegam para perceber que muitas vezes o sucesso fortemente influenciado pelo acaso.
Resultados extremamente positivos so evidncia de competncia, mas a evidncia torna-se
fraca se o nmero de tentativas for elevado.
Achamos que alguns corretores so brilhantes
com base em seus resultados extremamente
positivos porque esquecemos que h milhares
de corretores realizando milhes de operaes
durante anos.

4.3 Descartando hipteses


procedimentos

com

A primeira preocupao de um avaliador sobre


os resultados de um trabalho se os procedimentos foram vlidos. Se houver dvida sobre
algo importante nos procedimentos, o resultado
favorvel hiptese de trabalho perde seu valor. A diferena de nota entre dois grupos de
alunos deixa de ser uma boa evidncia do efeito
de uma tcnica de ensino sobre o aprendizado
se a correo de cada grupo for feita por um
avaliador diferente (considerando uma prova
com perguntas subjetivas). O avaliador pensa
assim: De fato houve uma diferena de nota, o
que apoia a hiptese. Entretanto, imaginando
que a hiptese fosse falsa, seria possvel chegar-se a este resultado por um erro de procedimento? Note que neste momento deixamos a
hiptese de trabalho de lado e dirigimos nossa
ateno para um teste de hiptese secundrio.
A hiptese secundria que houve um erro
procedimental que levou diferena entre os
grupos. Nem sempre um avaliador consegue
perceber um erro, mas lendo os mtodos, ele
pode imaginar onde um erro poderia estar escondido, como ao verificar que no se detalhou
como foi feita a correo da prova, e pedir para

A inflao de testes certamente principal causa de falsas evidncias no intencionais publicadas na cincia. Trata-se de um problema real
que no recebe a ateno devida em cursos de
metodologia. A principal forma de anulamos ou
minimizamos a hiptese da inflao evitar o
teste de hipteses irrelevantes e sem
uma justificativa. A hiptese da inflao de teses um complemento da
hiptese do acaso. Se voc ficar testando muitas possibilidades, voc vai
distorcer no conjunto o significado de
cada teste individual. Uma pesquisa
no precisa se restringir a uma hiptese de trabalho. Pode haver vrias
questes e hipteses envolvendo o
tema em estudo, mas importante
restringir os testes a hipteses relevantes para no escolher apenas os resultados significativos. Voltaremos a este
assunto quando abordarmos testes
mltiplos no captulo 7.
Figura 4.3- Evidncias favorveis hiptese de trabalho no tem validade
se no houve procedimentos apropriados.

54

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

o autor reescrever com mais detalhes para eliminar esta potencial varivel de confundimento.
Se o erro de fato ocorreu, o pesquisador provavelmente teria de refazer a coleta. O pesquisador competente descarta estas hipteses de
erro procedimental planejando bem seu estudo
e o conduzindo com seriedade e depois defende que fez isto explicando tudo que for relevante para o avaliador poder concluir que realmente
o procedimento foi vlido.

do). H situaes em que se pode descartar


esta hiptese por razoabilidade, mas, principalmente em estudos com hipteses univariadas,
necessrio levar esta hiptese muito a srio.
A hiptese do acaso ocasionalmente descartada por procedimentos, criando uma situao
que dificilmente poderia ocorrer por acaso, como no exemplo das formigas. Entretanto, sempre que for possvel se obter vrias observaes de um mesmo fenmeno, recomendvel
se utilizar uma abordagem estatstica para lidar
com ela. Na prxima seo veremos como a
hiptese do acaso pode ser descartada estatisticamente.

As validaes da medida, interna e externa so


as formas de se prevenir contra estas hipteses
de erros. Vamos record-las: A validao da
medida envolve problemas de atribuio de
nveis nominais e ordinais, calibragem de insAntes de entrarmos no principal assunto do
trumentos e procedimentos e variveis operacaptulo, que o descarte da hiptese do acacionais no apropriadas como medidas das
so, importante apontarmos outra possibilidavariveis tericas respectivas. A validao inde, a hiptese extra paradigmtica, para terterna o conjunto de procedimentos para evitar
minarmos nosso esquema. Esta uma possibiproblemas com a hiptese das outras causas
lidade muito rara em estudos, quando tudo pa(variveis de confundimento). Este tipo de prorece ficar sem sentido e de repente voc desblema pode ser facilmente eliminado em estucobre que algo extraordinrio pode estar ocordos experimentais, pela aleatorizao da atriburendo e que conceitos bsicos precisam ser
io de tratamentos por unidade amostral (serevistos. No caso das formigas, voc inicialmeno 3.8) e por cuidados posteriores aleatorite pode achar que a nica explicao para as
zao para manuteno da representatividade
formigas acharem o caminho de volta seria a
paralela. Em estudos amostrais o problema das
capacidade delas de reconhecer referenciais
potenciais variveis de confundimento bem
espaciais. Entretanto, novos experimentos pomais complexo e ser tratado no Captulo 6. No
deriam demonstrar que elas no tm realmente
que se refere a procedimentos, a validao
externa lida com a representatividade de
distribuio. A amostra obtida no estabelecimento de um parmetro precisa ser
bem distribuda (idealmente de forma aleatria) no Universo Amostral. Normalmente, isto se torna um problema com
amostras com unidades amostrais agrupadas em uma situao de variaes nos
valores da varivel em estudo no distribudas homogeneamente no espao e/ou
no tempo. A melhor forma de lidar com
isto a busca de unidades amostrais escolhidas aleatoriamente em toda a populao estatstica em considerao, mas
ainda h outras tcnicas vlidas conforme
a situao (seo 3.7). Frequentemente, Figura 4.4- Algumas vezes uma pesquisa leva a descobertas que extrapolam o paradigma (concepo do mundo) vigente. Trata-se de algo raro,
isto no possvel, e muitas vezes no mas
este esquema no estaria completo sem incluir esta possibilidade.
feito por razes tcnicas (reduo de ru-

55

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

esta capacidade. Surge um paradoxo. Ento


como elas acharam o caminho? E ento, voc
comea a considerar o inesperado, que as formigas possivelmente possam se orientar por
campos eletromagnticos da terra. Normalmente, nossas pesquisas so feitas dentro de um
paradigma, isto , dentro de uma concepo de
mundo. Entretanto, h momentos em que as
pesquisas mostram que o paradigma estava
errado e que ele precisa ser reformulado. Por
ser uma situao rara, no entraremos em mais
detalhes sobre esta possibilidade.
Figura 4.5- Depois de escolher bem a hiptese e de tomar
cuidados com procedimentos, o processo de teste costuma
terminar pela excluso da hiptese do acaso, mais conhecida
pelos estatsticos como Hiptese Nula.

4.4 Descartando a hiptese do acaso


Quando sua pesquisa permite a observao de
vrios casos (entidades, unidades amostrais) de
um mesmo tipo de fenmeno, a forma mais
tradicional de derrubar estatisticamente a hiptese do acaso chamada de Teste de Significncia de Hiptese Nula. (TSHN- Wood, 2012).
A abordagem parte do princpio que os problemas na obteno de dados discutidos anteriormente foram todos eliminados por procedimento
(a amostra representativa, a medida foi apropriada, no houve inflao de testes e o desenho amostral exclui a possibilidade de variveis
de confundimento). Portanto, se o observado
coincide com o previsto pela hiptese de trabalho, restam apenas duas opes: a hiptese de
trabalho est certa ou foi uma coincidncia (mero acaso). Neste ponto entra a caracterstica
marcante do TSHN: o clculo da probabilidade
do obtido ter ocorrido por acaso e a comparao desta probabilidade com um valor limite
pr-definido.

um pouco mais complexos. No d para provar


uma hiptese de trabalho de igualdade (e. g. o
efeito deste remdio exatamente igual ao
outro), o que pode ser feito nesta direo
provar uma hiptese de trabalho de semelhana, desde que uma diferena mxima seja estabelecida (e. g. o efeito deste remdio no
mais que 5% melhor do que o outro). Esta no
uma situao comum, de forma que no costuma estar em cursos mais bsicos de estatstica.
A hiptese nula uma ideia que se transforma
em um modelo matemtico de frequncias esperadas (probabilidades). Voc faz de conta
que ela verdadeira, considera as caractersticas dos dados da sua amostra e calcula a probabilidade associada quela situao. Podemos
calcular a probabilidade esperada de 8 de 10
plantas terem alto crescimento no tratamento
contra 2 de 10 no controle quando no h efeito
de tratamento (hiptese nula de propores
iguais; P<0.01- para diferenas iguais ou mais
extremas; teste de 2 propores de duas caudas). No se preocupe agora como se chega a
estas probabilidades, o que importa entender
que a previso da hiptese nula so valores de
frequncia esperados para cada resultado possvel. Uma probabilidade bastante baixa serve
como justificativa para voc rejeitar a hiptese
nula. Voc entende por qu? Se ainda no entendeu, no se preocupe, isto no to intuiti-

A Hiptese Nula, geralmente simbolizada como


Ho, a negao de uma hiptese de trabalho
afirmativa prevendo diferenas ou prevendo
resultados inferiores ou superiores a algum
valor ou entre grupos. Por exemplo, se sua
hiptese de trabalho que certo remdio tem
um efeito melhor do que outro em determinado
sintoma, e voc prev uma a cura mais frequente ou rpida com ele, ento a hiptese nula ser
que o remdio no melhor (ele igual ou pior). Problemas que envolvem hipteses de trabalho sobre semelhanas so menos comuns e

56

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

vo, procure entender acompanhando os prximos exemplos.

tativa. Se uma hiptese de trabalho estiver certa, quanto mais informao obtiver, maior ser o
acmulo de informao contrria hiptese do
acaso. importante entender este conceito, que
a base do processo de rejeio do TSHN.
(No se preocupe com as frmulas matemticas
que eventualmente apaream no texto, como na
Tab. 4.1 e no Quadro 4.1, mais importante
entender o processo.). Repare que no estamos calculando a probabilidade dela ter a
habilidade, mas dos dados apoiarem a hiptese que ela tem quando na realidade no
tem.

A abordagem TSHN poderosa a ponto de


provar o improvvel. Se uma pessoa disser
que desenvolveu a habilidade de controlar a
forma de jogar a moeda para cair cara, voc
desconfia. Qual a probabilidade dela realmente ter a habilidade? Posso achar improvvel
porque nunca ouvi falar que algum pudesse
fazer isto e porque imagino que a preciso necessria ao jogar uma moeda e obter uma face
escolhida esteja alm da capacidade humana.
Por outro lado, sei que a pessoa que disse isto
hbil. Ainda assim, acho extremamente improvvel e presto ateno na demonstrao.
Esta probabilidade intuitiva no deve ser subestimada, como discutimos na seo 1.6. Entretanto, a intuio pode ser muito subjetiva e incerta. H outra forma melhor de saber se
verdade: pedir para ela jogar a moeda. Tudo
bem, mas como avaliamos?

A situao foi colocada de forma muito rigorosa


na Tabela 4.1, a pessoa teria de acertar todas
as vezes. Mas e se ela errar de vez em quando? Digamos que acerte 19 de 20 jogadas.
Ainda convincente que ela tem a habilidade.
Mas e se ela acertar 70%? E se ela acertar
55%? Certamente seria algo bem menos convincente, mas pelo menos serve como evidncia de algum efeito de habilidade? Chega de
moedas, passemos para um exemplo biolgico.
No muito diferente, mas imagine agora que
sua hiptese que as formigas rainha jovens ao

A pessoa te mostra que a moeda tem cara e


coroa (descartando a hiptese de moeda com
duas caras). A moeda d vrias voltas no ar e
cai com a face cara para cima. Voc sorri, mas
no se convence. Voc sorri porque pensa que
deve ser uma coincidncia, mas no se convence porque no uma coincidncia to improvvel para te impressionar. Voc no acredita que uma pessoa possa ter tanta habilidade
para contar o nmero de voltas e parar a moeda
do lado escolhido. Trata-se de uma hiptese
que parece muito improvvel com base no seu
conhecimento cotidiano. Entretanto, ela lana a
moeda mais vezes e continua acertando. Voc
para de sorrir e comea a ficar cada vez mais
impressionado (a) a cada novo acerto. E depois
de 10 lances voc mudou de ideia, abandonou
a hiptese do acaso completamente e est inteiramente convencido que a pessoa possui a tal
habilidade. verdade que no se pode descartar totalmente a hiptese do acaso, mas a
chance de acertar 10 vezes seguidas por acaso
menor que uma em 1.000 (Tab. 4.1). Embora
a habilidade de controlar o lance de moeda seja
impressionante, menos impressionante do
que acertar um nmero em mil na primeira ten-

Nmero de acertos
seguidos
1
2
3
4
5
6
7
8
9
10

Probabilidade
0.5
0.25
0.125
0.0625
0.03125
0.015625
0.0078125
0.00390625
0.001953125
0.000976563

Tabela 4.1 Sabemos intuitivamente que a probabilidade


de acertar ao acaso vrios lances seguidos de moeda
diminui com o nmero de lances, mas normalmente
subestimamos o quanto um resultado improvvel. A
matemtica uma ferramenta essencial para avaliaes
precisas e objetivas. Neste caso, a probabilidade calculada pela frmula P= 1/(2)n..

57

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

fundar uma colnia preferem solo argiloso ao


solo arenoso. Para testar isto, voc pega rainhas recm fertilizadas e coloca-as em arenas
que possuem solo argiloso de um lado e solo
arenoso do outro, e ai voc registra qual solo
elas escavaram para iniciar seus ninhos. Vamos
imaginar possveis resultados.

4.5 Nvel de significncia e tipos de


erros.
Vimos que a hiptese nula rejeitada quando
obtemos um valor baixo de probabilidade com
base nos dados obtidos. Isto naturalmente nos
leva a uma questo prtica: qual o valor de
referncia abaixo do qual podemos rejeitar a
hiptese nula?

Suponha que tenhamos realizado o experimento com 8 rainhas jovens e tenhamos obtido 5
(62,5%) que escavaram em solo argiloso e 3
(37,5%) que escavaram em solo arenoso. O
esperado, supondo que no haja preferncia
por solos, seria que 50% das formigas escavariam em solo arenoso e a outra metade em solo
argiloso. O resultado obtido foi na direo da
previso da hiptese de trabalho. O problema
que esta diferena tambm compatvel com a
hiptese nula. No quadro 4.1 realizamos o clculo de probabilidade para a mesma diferena
percentual com tamanhos amostrais diferentes.
O que vemos que a probabilidade de se obter
a mesma proporo de formigas escavando em
solo argiloso sem ter escolhido este solo (isto ,
ao acaso) vai diminuindo at valores absurdamente improvveis. E quando a probabilidade
do resultado ocorrer ao acaso muito pequena,
ela descartada.

No existe um valor mgico universal que separe meros indcios de evidncia segura, a ideia
de definir um valor que regras objetivas precisam ser definidas antes do jogo (o termo tcnico a priori). O valor limite pr-determinado
de probabilidade abaixo do qual se rejeita a
hiptese nula chamado Nvel de Significncia, e representado pela letra grega (alfa).
Os valores mais utilizados so 0,05; 0,01 e (raramente) 0,001, dependendo do grau de rigor
que se quer assumir. Algo parecido acontece
quando determinamos a nota mnima abaixo da
qual reprovamos o aluno, que pode ser 5, 6 ou
7. Ao escolher um nvel de significncia voc
est definindo sua chance de errar, ou melhor,
voc est definindo qual tipo de erro voc est
mais disposto a aceitar. isto que ser explicado adiante.

Quadro 4.1 Probabilidade calculada pelo mtodo 2com base no obtido (O)
o esperado central (E). .

58

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Ao tomar uma deciso estatstica, os dois tipos


de erro que podemos cometer so o Falso Positivo, ou Erro Tipo I, que consiste em rejeitar
a hiptese nula quando ela verdadeira e o
Falso Negativo, ou Erro Tipo II, que consiste
em aceitar a hiptese nula quando ela falsa.
Nas situaes em que a prudncia exige no
aceitar uma mudana de posio sem forte
evidncia favorvel deciso, a prioridade
evitar o Erro Tipo I, como em tribunais e na
maioria das situaes de pesquisa. Nas situaes em que a prudncia exige uma ao preventiva, ainda que a evidncia favorvel seja
fraca, a prioridade evitar o Erro Tipo II, como
quando vigias ouvem um barulho estranho, ou
quando uma criana chega ao hospital com
suspeita de intoxicao. E h situaes em que
os dois tipos de erro seriam graves, como ao se
decidir sobre o resultado de um exame sobre
uma doena muito sria quando h indcios de
positividade. Podemos ver na tabela 4.2 como a
anlise e a ao de processos decisrios dependem da importncia de cada tipo de erro e
do tempo (etapas, oportunidades) que temos
para obter mais dados. As situaes mais comuns na pesquisa esto em destaque na tabela. Abordaremos unicamente estas situaes
neste livro, mas importante termos conscincia que estes mtodos no so os mais apropriados em outras situaes, inclusive de pesquisa. Vamos analisar mais profundamente os dois
tipos de erro com nfase na situao mais comum na pesquisa, mas ilustrando com o funcionamento do processo decisrio em um tribunal.

Um assassino solto algo ruim e deve ser evitado. Entretanto, um inocente preso por assassinato algo mais grave. Por que assumir que a
inocncia de uma pessoa tem prioridade sobre
o risco para resto da populao? Parece estranho, mas esta foi a concluso de um longo processo civilizatrio. Acontece que crimes costumam deixar pistas e bom lembrar que um dia
poderamos ser ns mesmos em um banco de
rus. Enfim, a regra que toda pessoa deve ser
considerada inocente at que haja uma evidncia realmente convincente de que ela culpada.
Entretanto, por melhor que seja a justia, ela
nunca ser perfeita e h quatro resultados possveis em um julgamento: 1) podemos mandar
prender uma pessoa inocente (injustia);
2) Podemos mandar prender um assassino;
3) Podemos libertar uma pessoa inocente e
4) podemos libertar um assassino (impunidade).
A tabela 4.3 resume estas possibilidades.
Basicamente, queremos evitar erros. Uma forma de evitar erros de deciso obter mais informao relevante. H tcnicas (subutilizadas)
de amostragem at atingir critrios de deciso
(e. g. amostragem sequencial). Entretanto, o
mais comum que a informao seja limitada
(por tempo, dinheiro ou porque todas as pistas
foram exaustivamente exploradas). A forma de
agir neste caso depende da prioridade que damos em evitar o Erro Tipo I e em evitar o Erro
Tipo II. Ao assumir como premissa a inocncia
do ru, estamos dando prioridade em evitar o
Erro Tipo I. A nica forma de evitar o Erro Tipo I
de forma absoluta seria decidir pela inocncia
sem julgamento e independente de provas, o

Inocente

Culpado

Realidade
Deciso

H0 Verdadeira

H0 Falsa

Culpado

Injustia

Deciso
Correta

Rejeita H0

Erro tipo I

Deciso
Correta

Inocente

Deciso
Correta

Impunidade

Aceita H0

Deciso
Correta

Erro tipo II

Realidade
Deciso

Tabela 4.4 Decises e tipos de erros na pesquisa..

Tabela 4.3 Decises e tipos de erros em um tribunal..

59

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

que no aceitvel. Existe sempre o risco de


inocentes serem presos, mas podemos e devemos reduzir esta probabilidade a uma possibilidade remota, e isto feito ao dar ampla chance de defesa e conservadorismo em aceitar
apenas provas muito fortes e claras. A chance
de Erro Tipo I limitada a priori pelo princpio
da inocncia, e quanto mais rigorosos formos
em evitar a chance de erro tipo I, maior a chance de um erro do tipo II. como se no jogo
entre defesa e promotoria a defesa tivesse a
vantagem do empate. Cabe ao promotor a responsabilidade de mostrar informao suficiente
para virar o jogo, de forma a evitar o Erro Tipo
II.

chance de mandar um inocente para cadeia


deveria ser inferior a 1:1000. No confunda, um
=0,01 no significa que vamos cometer um
erro a cada 100 julgamentos, pois em muitos
julgamentos o ru era realmente culpado. O fato
de muitos julgamentos terminarem em condenao reflete principalmente a obrigatoriedade
de indcios fortes de culpa antes de se levar um
ru a julgamento.

4.6 Consideraes complementares


Nas sees anteriores vimos o essencial sobre
testes de hipteses que precisa ser entendido
por todos os usurios de estatstica. Entretanto,
h vrios aspectos adicionais importantes para
uma compreenso mais profunda do tema que
sero tratados nesta seo.

Ao propor uma hiptese de trabalho, fazemos


previses que algo acontecer de certa forma.
Entretanto, o fato disto acontecer no significa
nada se o previsto puder acontecer por outras
razes ou ao acaso. Vimos nas primeiras sees do captulo que precisamos tomar algumas
atitudes preventivas para excluir hipteses concorrentes, mas ainda resta avaliar se as previses poderiam ser obtidas por mero acaso. Na
analogia com o tribunal, como se a hiptese
nula fosse o ru. A princpio, a hiptese nula
deve ser considerada verdadeira at a prova do
contrrio, de forma a evitar o Erro Tipo I. Cabe
ao pesquisador obter informaes suficientes
para derrubar a hiptese nula.

a) adequando alfa hiptese


Vimos na seo anterior e na tabela 4.2 que em
alguns contextos a prioridade no evitar os
falsos positivos, mas em tribunais e na maioria
das pesquisas . Por isto usamos valores bem
baixos de alfa (Nvel de Significncia) em nossos testes. O valor mais tradicional 0,05 (aqui
estamos falando de testes isolados, a questo
do nvel de significncia de testes mltiplos ser
discutida no captulo 7). Raramente se discute
em que situaes devem ser utilizados os nveis
mais baixos de 0,01 ou 0,001. Testes com hipteses de trabalho tidas como quase certas normalmente tem uma funo de apenas comprovar algo, podemos dizer que a hiptese nula
est em um grupo de alto risco de ser rejeitada. Uma hiptese de trabalho ousada bem
mais incerta, e est em um grupo de risco intermedirio e uma hiptese muito ousada tem
um risco muito baixo de ser rejeitada. Com
base nisto, deveramos utilizar respectivamente
0,05; 0,01 e 0,001 como Nveis de Significncia
para cada um destes casos. Para entender por
que, veja como devemos interpretar resultados
de exames considerando o grupo de risco (Mlodinov 2008).

Uma diferena entre o tribunal e a pesquisa


que nesta muitas vezes podemos definir a
chance de Erro Tipo I de forma quantitativa. O
Nvel de Significncia (ou alfa) a chance de
Erro Tipo I que estamos dispostos a aceitar, um
grau de rigor que se estabelece a priori. Na
pesquisa, o mais comum se utilizar um
=0,05, que significa que aceitamos cometer
um Erro do Tipo I para cada 20 testes em que a
hiptese nula era verdadeira. como aceitar
mandar uma pessoa inocente de cada 20 inocentes que a gente julgar. Se utilizarmos um
=0,01, como se estivssemos mandando um
inocente para cadeia de cada 100 inocentes
julgados. Este nvel aceitvel para a pesquisas, mas no aceitvel na justia. As provas
em um tribunal devem ser mais contundentes, a

Suponha que a probabilidade de um falso positivo em um exame de AIDS tenha sido estabe-

60

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

lecida em 0,7%. O que significa isto? Significa


que a chance dela ter Aids de 99.3%. Com
base no resultado do exame qualquer pessoa
tem a mesma chance de receber um falso positivo? As respostas so no e no. Muitos se
surpreendem ao saber que a chance de ser um
falso positivo depende de quem a pessoa que
fez o exame.

pessoas). Portanto, a chance deste positivo


ser realmente um positivo de 1/(1+70), isto
1,41%. Portanto, a probabilidade da primeira
pessoa ter AIDS quase 70 vezes maior!
O problema que confundimos o que chamamos de falso positivo para um teste isolado com
a chance de um positivo no meio a muitos testes ser realmente um positivo. Um positivo verdadeiro pode ser muito mais raro que o nmero
de negativos multiplicado pela chance de falsos
positivos isolados.

Acompanhe este raciocnio. Duas pessoas recebam um resultado positivo em um exame de


AIDS, a primeira pertence a um grupo de risco
(usurio de drogas que no pratica sexo seguro
em uma metrpole com alta incidncia de
AIDS), e a segunda no pertence ao grupo de
risco. Imagine que no grupo de risco a incidncia de AIDS seja de 1/10, enquanto no grupo de
baixo risco ela seja de 1/10.000.

Uma situao anloga pode ser considerada


para a pesquisa. Uma hiptese razovel, como
uma formiga preferir um tipo de solo (arenoso
ou argiloso) para fundar uma colnia cai no
grupo de risco das hipteses razoveis, das
quais boa parte deve ser realmente verdadeira,
digamos em uma proporo entre 1/2 a 1/10.
Entretanto, uma hiptese que testasse se o
comportamento da formiga influenciado por
pequenas diferenas nos teores de cobre ou por
um leve campo magntico prximo das arenas
experimentais no solo soa estranho com base
no que se sabe sobre formigas. Estas hipteses
parecem muito improvveis, talvez 1/50 a
1/1000 possam ser realmente ser corretas. Como as situaes so anlogas, a chance de um
falso positivo em hipteses ousadas ou bizarras
muitas vezes maior para o mesmo alfa.

Milhares de pessoas fazem exames de AIDS.


Quantos so os falsos positivos de cada grupo?
Considere 10.000 pessoas no caso do grupo
com incidncia 1/10 (Quadro 4.2), teremos 1000
positivos e 9000 negativos. Dos 9.000 negativos, 0.7% (63) tero falsos positivos. Portanto, a
chance deste positivo ser realmente um positivo de 1000/(1000+63) isto , 94%. Agora considere 10.000 pessoas no grupo com incidncia
1/10.000. Teremos um positivo e 9.999 negativos. Destes, 0,7% tero falsos negativos (70

Quadro 4.2 Clculos mostrando que a chance de um falso positivo


muito maior em um grupo de alto risco que em um grupo de baixo risco
para o mesmo teste. A chance de falso positivo neste exemplo foi quase
70 vezes maior no grupo de baixo risco. A mesma lgica pode ser aplicada para testes estatsticos.

61

No fcil medir o quanto nossas hipteses


so razoveis ou bizarras, entretanto, podemos chegar a uma diretriz aproximada. Se
sua hiptese de trabalho tratar de uma tendncia que voc considera intuitivamente
muito razovel, pode usar um alfa de 0,05.
Se for uma ideia um pouco mais ousada,
mas no extraordinria, use 0,01. Se for uma
hiptese extravagante que abala conceitos
estabelecidos dentro da sua rea de pesquisa, melhor utilizar 0,001. Hipteses ousadas
no devem ser evitadas, pois muitas vezes
marcam revolues na cincia, entretanto,
devem ser tratadas com maior rigor para no
criar falsos mitos. A estatstica no s um
jogo, nossas expectativas precisam ser leva-

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

das em conta.

(Fig. 4.3). Para entender esta relao, faremos


uma analogia com uma prova de alternativas.
Como nos testes de hipteses nulas, em uma
prova com alternativas sempre existe um componente de sorte (aleatoriedade). Uma pessoa
que acertou a metade das perguntas em uma
prova do tipo verdadeiro ou falso no demonstra nenhum conhecimento, pois este o esperado de acertos por mero acaso. Portanto, s
temos indcios de conhecimento acima de 50%
de acerto. Mesmo um acerto de 60 a 80% pode
acontecer s por acaso em uma prova com
poucas questes. Uma pessoa at poderia acertar 100% das questes por pura sorte em
uma prova com 5 questes, mas isto seria praticamente impossvel em uma prova com 50
questes.

b) O valor de P uma medida de certeza?


Ao definir um nvel de significncia qualquer,
digamos 0,05, existe uma diferena se nosso
teste apresentar uma probabilidade P=0,04 ou
uma probabilidade P=0,0004? A resposta no
em termos do teste, a hiptese nula foi reprovada em ambos, mas h uma diferena. Uma nota
4,5 significa reprovao, mas interessante
saber que o aluno no estava longe do limite.
Uma nota Dez significa aprovao, mas uma
aprovao bem mais segura do que um 5,0.
Em sntese, devemos utilizar critrios definidos
antecipadamente para decidir pelo sim ou pelo
no, mas no devemos ignorar o valor da probabilidade calculada no teste. Como interpretar
o valor da probabilidade calculada (P) em um
teste de significncia da hiptese nula? Vimos
que um valor baixo de P uma evidncia contrria hiptese nula. Podemos ir mais longe,
quanto mais prximo de zero for o valor de P,
mais forte a evidncia contra a hiptese nula

P uma medida de certeza, mas deve ser vista


com cuidado. P=0,04 no significa que a chance da hiptese de trabalho estar correta de
96%. bem mais complicado que isto. Entretanto, podemos dizer que a chance da hiptese
de trabalho estar correta maior em P=0,0004

Evidncia contra Ho

Muito Forte

Forte

Mdia

Nvel de aprendizado

a) Peso da evidncia
contra a Hiptese Nula

b) Analogia
(prova de 100 questes de
Verdadeiro ou Falso)

Muito Alto
Alto
Mdio

0
Negativo?

50%

100%

Erros

0
Negativa?

0.05
0.001 0.01

0.5

Probabilidade calculada (P)

Figura 4.3 A probabilidade calculada em um teste estatstico serve como medida do peso da evidncia contrria Hiptese Nula. Quanto menor o valor de P, maior a evidncia contrria Hiptese Nula. Valores intermedirios de P indicam situao indefinida e valores muito altos so estranhos. Ver a explicao no
texto com uma analogia com uma prova com alternativas do tipo verdadeiro ou falso.

62

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

que em P=0,04.

bm a forma mais natural para apresentar resultados que utilizam tcnicas de reamostragem,
como o Bootstrap (seo 3.6). A terceira vantagem que mais fcil se realizar um teste de
hipteses de trabalho de semelhana.

c) O que significam valores altos de P?


E quanto aos valores altos de P? Voltando
analogia, qual seria a interpretao para a prova
de uma pessoa que errou mais que 50% das
questes? A princpio, significa duas coisas: a
pessoa no tem nenhum conhecimento e ainda
teve algum azar. Considerando que qualquer
um pode ter azar, at quem tem algum conhecimento e acertou 50%, uma nota abaixo de
50% um indcio mais forte de ausncia de
conhecimento que exatamente 50% de acerto,
entretanto, no indcio de conhecimento negativo, pois isto no existe. Agora uma nota prxima de 100% de erro seria algo muito estranho. Se o nmero de questes for grande, podemos at suspeitar que a pessoa sabia tudo e
errou propositalmente. interessante verificar a
possibilidade de alguma anomalia deste tipo
quando temos valores muito altos de P (como
P>0,95). Entretanto, em geral, simplesmente
um acaso que acontece quando estamos fazendo muitos testes.

Outra abordagem alternativa em crescimento


a utilizao de Anlises Bayesianas (Gotelli &
Ellison, 2011), que uma forma bem diferente
de calcular probabilidade. No TSHN calculamos
a probabilidade de obter uma diferena observada se a hiptese nula for verdadeira, isto
simbolizado como P (dadoshiptese nula). Na
anlise Bayesiana, calculamos a probabilidade
da hiptese aplicando os dados fornecidos, o
que simbolizado P (hiptese de trabalhodados). uma estatstica mais semelhante
nossa forma intuitiva de pensar. Na seo 4.1
comentamos que a escolha da hiptese de trabalho baseia-se na nossa intuio. A escolha de
uma hiptese que formigas usam referenciais
espaciais baseou-se em um clculo. Parece
improvvel que formigas usem apenas pistas
qumicas, aqui chove muito, a chance de perderem a trilha grande, alm disto, podem passar
por um tronco e ele cair. J li que outros himenpteros (vespas) so capazes de usar referencias espaciais, etc. Por outro lado, a hiptese
que as formigas utilizam o magnetismo terrestre
lhe parece muito improvveis. Voc junta informaes e pode tomar decises sobre a probabilidade de uma hiptese estar correta. Esta
abordagem tambm mais apropriada quando
estamos comparando duas hipteses de trabalho concorrentes, para ver qual delas se ajusta
melhor aos dados.

d) abordagens alternativas ao Teste de Significncia de Hiptese Nula


O teste de significncia de hiptese nula uma
abordagem to preponderante na anlise estatstica de dados que muita gente acha que a
nica. por isto que tanto espao foi dedicado
a esta abordagem neste captulo. Entretanto h
outras duas abordagens que esto crescendo e
possivelmente vo super-la em importncia em
testes de hipteses do acaso.

e) entre o sim e o no existe um vo

A primeira alternativa a utilizao de intervalos


de confiana de parmetros ao invs de clculos de probabilidades associados a hipteses
nulas (van Belle, 2008; Wood 2012). Uma vantagem a riqueza da informao fornecida. Ao
invs de dizermos Houve um efeito significativo
do tratamento em relao ao controle
(F1,20=6,53; p<0.05), diramos Houve um efeito significativo do tratamento em relao ao
controle (Diferena= 1,25; IC95%= 0.90 a
1,60). A segunda vantagem que esta tam-

Quando tomamos decises, informaes complexas podem ser transformadas em Sim ou


No, que levaro a duas diferentes possibilidades de ao. Ocasionalmente, temos trs opes: Sim, Talvez ou No. Podemos ainda
decidir em mais categorias: o sim forte, o sim
fraco, o Talvez, o no fraco e o no forte.
Eventualmente, h decises em que se utiliza
uma escala quantitativa entre os extremos (e.g.
custo de aplices de seguro em funo do ris-

63

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

co). Nesta seo, vamos nos concentrar em


decises com trs possibilidades.

clnicas e tem em mos um resultado com nveis elevados de uma substncia que indica
uma doena muito grave, como Cncer ou
AIDS, mas os nveis no so to elevados a
ponto de ter certeza. Se voc apresentar o resultado como positivo e for um falso positivo, a
pessoa passar por uma angustia profunda
para depois descobrir que no tinha a doena.
Por outro lado, se apresentar o resultado como
negativo, pode estar adiando a chance da pessoa se tratar e ter uma sobrevida mais longa e
melhor ou at uma cura. O que fazer? Nesta
situao, a ao em caso de Sim (iniciar o
tratamento) diferente da ao no caso de
No (liberar o paciente), que tambm difere no
caso de Talvez (realizar mais exames).

No caso da pesquisa, vamos chamar de Sim a


rejeio da hiptese nula (Sim, a evidncia
suficiente para rejeitarmos a hiptese nula). No
tribunal, Sim significa Sim, temos evidncia
suficiente para declar-lo culpado. importante
ressaltar que o Sim no significa Definitivamente sim, significa Tenho convico que
sim, e os graus de convico dependem da
situao, como vimos na seo anterior. Note
que no sistema de deciso que descrevemos
para tribunais e para a maioria das pesquisas o
Talvez tratado como um No (em caso de
dvida prevalece a inocncia/ aceitamos a hiptese nula). Como nesta abordagem apenas
levamos em conta o Alfa (Nvel de Significncia), podemos denomin-la Abordagem Alfacntrica.

Tambm h situaes em que o Erro Tipo II


um risco de gravidade muito maior que do Erro
Tipo I. Imagine que tenha havido um caso de
Doena de Chagas aparentemente adquirida
pelo consumo de aa em um bairro de Manaus.
Em casos deste tipo, comum que a ao anteceda a coleta de dados, com a proibio imediata da venda de aai. Em uma anlise preliminar, o rgo responsvel pela vigilncia sanitria recolhe amostras de aa de 10 vendedores e no encontra nenhuma amostra infectada.
Portanto, no h evidncia que a doena tenha
sido transmitida desta forma. Entretanto, se este
resultado for um falso negativo (Erro Tipo II), h
risco de transmisso de uma doena grave para
outras pessoas, portanto, o consumo no
liberado at o trmino de uma investigao
exaustiva. Lidar com alto custo de Erro Tipo II
sempre muito complicado. difcil se definir
quanto esforo de investigao ser suficiente
para uma concluso segura, e temos que lembrar que a suspenso da venda tambm est
prejudicando pessoas.

A abordagem alfacntrica apropriada quando


temos prioridade em evitar o Erro Tipo I e vamos tomar uma deciso com a informao que
foi coletada em uma nica etapa anterior ao
Julgamento Centrado. Estas condies ocorrem
em tribunais e em projetos de pesquisa ou dissertaes ou teses em que temos um tempo
determinado para coletar os dados. A desvantagem da abordagem alfacntrica que aceitar
a hiptese nula um resultado de pouco valor,
pois no sabemos se temos um No ou Talvez, e um Talvez pode ser um Sim. Entretanto, vimos na Tabela 4.2 que h outras abordagens.
Vejamos agora uma situao em que precisamos separar o No do Talvez. Imagine que
voc trabalha em um laboratrio de anlises

Para separar o No do Talvez, normalmente precisamos de mltiplas etapas de


coleta de dados, como mais exames no
exemplo da suspeita de doena ou continuao exaustiva da coleta de dados no exemplo do aai. A nova coleta de dados
no precisa ser da mesma natureza dos
dados anteriores. No caso de exames sobre

64

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

doenas, muitas vezes se realiza repete exames de outra natureza para avaliar um sintoma
complementar da mesma doena. No caso do
aa, importante investigar outras possibilidades de contgio. Se a coleta de dados for da
mesma natureza, a hiptese nula pode acabar
sendo aceita aps uma coleta exaustiva, considerando que j deveria ter sido rejeitada se
fosse falsa.

questo. Alguns acreditam que o melhor teste


dentro de um estudo aquele que foi mais significativo.
Um aspecto psicologicamente forte no teste de
previso de hipteses que ele responde categoricamente (com sim ou no) se evidncias
para a existncia de uma relao so significativas. No temos um critrio semelhante para
atribuirmos o valor biolgico para um teste.
uma questo de bom senso. A relao entre
tamanho de qualquer espcie e seu peso
sempre fortemente significativa, mesmo com
poucos dados, de forma que no nada surpreendente obter-se um P<0,001 para esta
relao. Um efeito significativo obtido apenas
com um tamanho amostral imenso pode significar variveis de rudo interferindo muito ou simplesmente um efeito biologicamente irrelevante
de uma varivel sobre outra. O valor calculado
de P tem relao com a fora da evidncia,
no tem relao com a relevncia da questo.

S possvel se definir quantos dados precisamos coletar para considerar uma coleta suficientemente exaustiva para dar um veredito
No se tivermos um valor de efeito mnimo
de referncia. Por exemplo, digamos que voc
queira saber o efeito de uma substncia sobre a
presso sangunea de ratos. Se a substncia
aumentar a presso da grande maioria dos
ratos, ter rejeitado a hiptese nula. Se no
obtiver nenhuma diferena significativa (isto ,
alm do que esperamos ao acaso), aceitar a
hiptese nula. No entanto, no pode dizer que
no haja efeito, pois ele pode ser to sutil que
no pde ser detectado com o tamanho amostral do experimento. Por outro lado, se voc
perguntar se existe um efeito de aumentar pelo
menos 10% a presso sangunea, e tiver algumas informaes sobre os dados, ento poder
calcular o tamanho amostral necessrio a partir
de uma probabilidade de Erro Tipo II (ou Beta,
) pr definida por voc.

g) Efeitos colaterais
Em algumas situaes, particularmente no desenvolvimento de remdios, alimentos ou produtos que possam oferecer riscos ambientais ou
sade humana, temos de ir alm das consideraes sobre o erro tipo I e tipo II. Imagine uma
substncia com potencial para diminuir os enjos durante a gravidez. Podemos testar estatisticamente se o remdio efetivo fixando o erro
tipo I e at o erro tipo II, definindo um tamanho
amostral apropriado com base em coletas preliminares. Esta anlise permitir que se defina
dentro dos critrios discutidos neste captulo se
o remdio efetivo ou no para reduzir o enjo.
Entretanto, este teste s avalia o enjo, no
garante que este remdio no tenha contra
indicaes. Um remdio chamado Talidomida
foi usado na dcada de 1960 contra enjo na
gravidez e causou malformaes em muitos
bebs.

No entraremos nos detalhes de como se realizam as abordagens da Tabela 4.2. Entretanto,


bom ter conscincia que a abordagem alfacntrica no se aplica a todas as situaes, at
mesmo na pesquisa podemos ter que utilizar
outra abordagem.
f) Significativo sinnimo de relevante?
O uso da estatstica cresceu e as revistas cientficas e bancas de avaliao acadmica passaram a exigir que testes fossem utilizados para
mostrar que tendncias tinham relevncia estatstica. Esta presso pelo uso da estatstica
contribuiu para a qualidade da pesquisa, mas
tambm levou a alguns desvios, como a busca
pelo resultado significativo independente da

Ignorar efeitos colaterais no cometer um erro


tipo I ou tipo II, cometer um erro que extrapola
o teste. Pelo princpio da prudncia, temos at
que considerar provas circunstanciais, como

65

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

uma acusao improvvel de uma pessoa que


consumiu um remdio ou indcios de algum
impacto ambiental, como uma evidncia que a
ateno deve ser redobrada. A anlise de efeitos colaterais pode ser complexa. Embora haja
ferramentas estatsticas para ajudar nesta tarefa, cada potencial efeito (podemos mesmo listar
todos?) deveria ser analisado separadamente e,
como vimos anteriormente, difcil separar o
talvez do no. No possvel se obter uma
garantia que nenhum efeito colateral v ocorrer,
mas essencial que se considere qualquer
indcio de problema e se faa um levantamento
exaustivo de todas as possibilidades razoveis
de efeitos colaterais. Novas tecnologias, como a
transgenia, j provaram que funcionam, entretanto, um acompanhamento necessrio pois
ainda no sabemos quais so os riscos ambientais e para a sade. Os farmacuticos tm muito
mais trabalho com a anlise de cada possvel
efeito colateral do que da comprovao dos
efeitos positivos. importante no se confundir
o poder da estatstica em avaliar efeitos especficos com uma garantia sobre aspectos que
extrapolam cada teste particular.

4.6- Explique a relao entre o valor calculado


de probabilidade em um teste (P) e seu peso
como evidncia contra a hiptese nula.
4.7- Explique a diferena entre Erro Tipo I (falso
positivo) e Erro Tipo II (falso negativo) em processos decisrios em tribunais e na pesquisa
cientfica.
4.8- Como devemos ajustar o Nvel de Significncia em funo da ousadia de uma hiptese
de trabalho.
4.9- Como devemos proceder quando o custo
do Erro Tipo II elevado?
4.10- O que so efeitos colaterais e como devemos lidar com eles?

Exerccios
4.1- A lgica dos testes de hipteses um assunto mais amplo do que a utilizao de clculos estatsticos em testes de hipteses. Explique.
4.2- Qual o risco da inflao de testes e como
ele pode ser evitado?
4.3- Quais hipteses costumam ser descartadas por procedimentos preventivos durante um
planejamento experimental?
4.4- Como descartada a hiptese do acaso? Utilize na sua resposta os conceitos de
a) Hiptese Nula; b) Probabilidade calculada;
c) Nvel de significncia ().
4.5- Por que precisamos de um nvel de significncia em um processo de deciso.

66

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Tabela 4.2 Anlise e ao em diferentes situaes em funo do custo do Erro Tipo I (falso positivo) e do Erro Tipo II
(falso negativo) e do nmero de etapas de coleta de dados. As formas de analisar os dados mais comuns na pesquisa
esto em destaque.

Alto ou Mdio

Baixo

Baixo ou mdio

Muito Alto ou
Alto
Mdio

Mdio

Muito Alto ou Alto

Custo
Falso
Negativo

Baixo

Muito Alto ou Alto

Muito Alto

Custo
Falso
Positivo

Tempo

Exemplo

Anlise e Ao

nico

Tratamento de grave intoxicao sem


causa bem definida (usar remdio
forte que tem com contra
indicaes?)

Anlise de risco emergencial; Priorizar a velocidade


da concluso mas com o mximo de certeza possvel.
Sobre o diagnstico. Importante haver preparo
antecipado para decises rpidas e corretas.

Paciente com sintomas de possvel


doena grave de tratamento
agressivo;

Avaliao em etapas (poucas). Indcios fracos de


positivo justificam exames complementares.
Continuar os testes at ter segurana suficiente sobre
o diaqgnstico.
Avaliao em etapas (muitas); Descobrir um remdio
algo importante, mas a certeza da ausncia de
efeitos colaterais tem prioridade.
Assumir postura fortemente conservadora em
relao ao falso positivo (e.g. princpio da inocncia a
priori) ; Estatstica com Alfa rigoroso (0,01) ou muito
rigoroso (0,001). Tamanhos amostrais e testes
geralmente definidos a priori .
Avaliao em etapas (poucas). Indcios de positivo
justificam exames complementares. Continuar os
testes at ter segurana suficiente sobre o
diaqgnstico.
Avaliao em etapas. Amostragem sequencial e
Mtodos de controle de processos estatsticos
(deteco de anormalidades) podem ser teis
conforme o problema.
Conservadorismo para prevenir falsos positivos, mas
no to extremo a ponto de frear muito a pesquisa.
Estatstica com Alfa Rigoroso (0,01) ou comum (0,05).

Poucas Etapas

Pesquisa de um remdio promissor


Muitas Etapas com potenciais efeitos colaterais
graves.
Julgamento em tribunais criminais.
Estudos acadmicos com propostas
polmicas. O tempo nico refere-se
nico
anlise nica (no dividida em etapas
decisrias) e defesa nica.
Exames complexos para possveis
doenas de gravidade intermediria
Poucas Etapas
em estgios iniciais.

Pesquisa de mercado para lanar um


novo produto. Pesquisa sobre
Muitas Etapas
intenes de votos durante processo
eleitoral.
Maior parte dos trabalhos
acadmicos; Problemas cotidianos
nico
que exigem nvel mediano de certeza
antes de afirmar algo.
Problemas cotidianos que exigem
Avaliao em etapas. Coletas preliminares +
nvel mediano de certeza com
Estatstica alfacntrica (duas etapas); Amostragem
Em Etapas
evidncia acumulada gradualmente. sequencial (testando uma questo); Mtodos de
controle de processos estatsticos (deteco de
anormalidades); etc.
Relatrio de avaliao de impacto
Assumir postura mais conservadora contra falsos
ambiental e ecotoxicologica; Evento negativos. Anlise de Risco rigorosa; Valorizar toda
nico
suspeito durante vigilia policial
informao relevante disponvel. Considerar uso de
(bandido ou s gato?). Emitir alarme Estatstica Bayesiana; Medidas preventivas rigorosas;
contra catstrofes (e.g. terremoto).
Monitoramento ambiental e
Avaliao em etapas. Mtodos de Controle de
sanitrio. Monitoramento de
Processos Estatsticos; Anlise de Riscos; Medidas
Em Etapas
qualidade de processos de alto risco preventivas rigorosas para falsos negativos;
(e.g. funcionamento de usna
Considerar uso de Estatstica Bayesiana.
atmica)
Deciso de realizar um evento com
Anlise de riscos simples; Medidas preventivas para
nico
base em previso de tempo.
falsos negativos.
Monitoramentos cotidianos de
Avaliao em etapas. Testes mltiplos em etapas.
qualidade de processos de mdio ou Amostragem sequencial; Mtodos de Controle de
baixo risco (e.g. eficincia em linha Processos Estatsticos. Monitoramento simples.
Em Etapas
de produo e satisfao de
clientes).

67

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Compreendida a unidade, entramos em um


aspecto tcnico dos testes que entender as
situaes em que cada um utilizado, suas
premissas e alternativas quando eles no so
recomendveis. como se houvesse nichos
ecolgicos para cada espcie de teste dentro
de um ecossistema de situaes problema. O
estatstico precisa conhecer a fisiologia do teste,
mas o usurio de estatstica precisa entender
sua ecologia, isto , as condies para sua
aplicao.

5. Diversidade de testes e suas


premissas
5.1 Ecologia e diversidade dos testes
estatsticos.
No captulo anterior, vimos que o teste estatstico de hipteses envolve primeiro a escolha de
hipteses relevantes, pois ficar brincando de
testar hipteses uma boa forma de multiplicar
as chances de descobertas esprias. Escolhida
a hiptese, entramos na frase da verificao da
compatibilidade entre o previsto e o observado.
No basta que tenha acontecido como a hiptese de trabalho previa, necessrio que outras
explicaes alternativas para este sucesso da
hiptese tenham sido descartadas. Precisamos
verificar com cuidado que foram excludos possveis erros de procedimentos, desde a calibrao de instrumentos, o cuidado ao digitar os
dados, o planejamento amostral e a avaliao
da representatividade dos dados. Finalmente,
mesmo com todos os cuidados, ainda resta a
possibilidade do sucesso por mero acaso.
Esta possibilidade eliminada calculando a
frequncia esperada de um valor igual ao observado se a hiptese nula for/fosse verdadeira.
Esta probabilidade denominada probabilidade
frequentista. Se esta probabilidade for menor
que um nvel de significncia pr-determinado,
rejeitamos a hiptese nula e dizemos que a
evidncia favorvel hiptese de trabalho
estatisticamente significativa.

5.2 Testes com apenas uma varivel


Os testes de uma varivel geralmente comparam valores obtidos com valores esperados,
por isto so chamados de testes de aderncia
ou de ajustamento (ou goodness of fit em ingls). Por exemplo, podemos comparar a razo
sexual de 33 : 12 (obtido) com uma
razo esperada de 1:1. Valores, como esta
proporo de 50% por sexo so chamados de
esperados, mas seria mais apropriado dizer que
o esperado um intervalo ao redor deste valor,
pois este valor central exato costuma ser bastante improvvel, como seria obter exatamente
500 machos de 1000 adultos. Em outras palavras, o valor esperado, na realidade um
valor esperado central; pois algum desvio est
dentro do esperado.
Os testes estatsticos tradicionais utilizados
nestas condies esto listados na tabela 3 do
guia de grficos e testes: a) para variveis binrias so o Binomial Exato e o Teste Z (aproximado); para variveis categricas: o Teste 2
ou o Teste G; para variveis quantitativas, o
teste mais utilizado o Teste T de uma amostra para avaliar se a mdia desta amostra difere significativamente de um valor pr determinado. interessante conhecer estes testes e
suas aplicaes porque ainda so muito usados, entretanto, o mais recomendado substitu-los por determinaes de Intervalos de Confiana, porque: 1) Em alguns casos so mais
precisos e poderosos em rejeitar a Hiptese
Nula; 2) so mais intuitivos e informativos;
3) nas variveis quantitativas o IC por bootstrap tem menos premissas e maior flexibilidade

H diferentes formas de calcular a probabilidade


frequentista, em funo de particularidades dos
dados, e estes diferentes tipos de testes estatsticos recebem nomes, como o teste kolmogorov-smirnov, o teste t, a regresso logstica e
muitos outros. O importante, em primeiro lugar
entender a unidade na diversidade. Todos estes
testes fazem essencialmente a mesma coisa:
calcular a probabilidade frequentista. importante ressaltar isto, porque as divises de captulos em muitos livros estatsticos podem atrapalhar esta percepo.

68

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

de aplicaes (no s para mdias, serve


para qualquer parmetro). Ao invs de rejeitarmos a hiptese nula porque P foi menor que ,
rejeitamos porque o valor de referncia no est
contido no Intervalo de Confiana. Pela forma
anterior, o resultado era apresentado assim: A
razo sexual (33 : 12 ) foi significativamente diferente de 1: 1 (teste binomial exato P<0,001).Pela forma atual: O intervalo de
confiana da razo sexual ( 33 : 12 )
no incluiu 0,5 / total (RS=0,22;
IC95%=0,1280 a 0,3452).
H testes com uma varivel, como o Kolmogorov Smirnov e o Shapiro-Wilk, que servem
para verificar se a distribuio de frequncia
observada em uma amostra difere do esperado
com base em uma frequncia terica discreta
(e. g. binomial, uniforme discreta, poison) ou
terica contnua (e. g. normal, uniforme contnua). Uma das aplicaes mais comuns destes
testes a verificao da compatibilidade da
distribuio dos dados com uma curva normal
para testes paramtricos. Muitos testes tem a
premissa de normalidade, de forma que comum que os testes de normalidade sejam recomendados. Entretanto, necessrio explicar
uma limitao destes testes. A Hiptese Nula
dos testes de normalidade que a distribuio
dos dados normal, isto , ao rejeitarmos esta
hiptese nula (P<) temos elementos para uma
deciso: no utilizar o teste paramtrico. Entretanto, quando no rejeitamos a hiptese nula,
podemos afirmar que a distribuio normal?
No. Este detalhe frequentemente omitido
quando se recomenda a utilizao destes testes. Usurios mal esclarecidos utilizam este
teste com tamanhos amostrais insuficientes
para rejeitar a hiptese nula do teste de normalidade e sentem-se confiantes para utilizar testes paramtricos em situaes inapropriadas.
Qualquer tamanho amostral suficiente se o
resultado do teste for (P<), entretanto, apenas
deveramos ter confiana que uma distribuio
compatvel com a normalidade se o teste de
normalidade no rejeitou a hiptese nula com
N>30. Voltaremos a discutir isto adiante.

Nos testes de relaes geralmente temos uma


varivel resposta e uma ou mais variveis preditoras. Os testes com apenas uma varivel preditora predominam em estudos experimentais,
so mais simples e tm menos premissas, de
forma que sero analisados primeiro e em maior
profundidade. Neste captulo apenas trataremos
de estudos em que as unidades amostrais no
esto organizadas em blocos, assunto que ser
tratado no captulo 7.
A escolha dos testes com duas variveis depende das escalas da varivel preditora (independente) e da varivel resposta (dependente),
conforme a tabela a seguir. Quando h uma
varivel ordinal ou quantitativa, o nmero de
nveis efetivos tambm influi na escolha do teste. Estas diferenas so explicadas caso a caso
no Guia de Testes e Grficos. A parte da tabela
que discutiremos mais no caso da varivel
resposta ser quantitativa, o que abre duas possibilidades de anlise: a estatstica paramtrica
e a estatstica no paramtrica. A primeira tem
premissas mais exigentes, mas, quando pode
ser aplicada, d mais poder ao teste e permite
uma descrio muito mais completa da relao.
A segunda tem premissas menos exigentes, de
forma que pode ser aplicada em uma diversidade maior de situaes.

V. dep

Binrio
(Categ. de 2)

Categrico

Ordinal ou
Quantitativo
Condio NP*

Quantitativo
Condio P*

Tabela de
Contingncia (TC)
(b) Graf: Seo III

Mann- Whitney;
Cochrans TT (c)
Graf: Seo IV

Teste t (de 2
grupos) (d)
Graf: Seo IV

Tabela de
Contingncia (b)
Graf: Seo III
Dicotomizar VI ou
VD e usar teste
apropriado (Max.
Balano) (g)

Kruskal-Wallis
(e)
Graf: Seo IV

Anlise de
Varincia (f)
Graf: Seo IV

Correlao de
Postos/ RNL(h)
Graf: Seo V

Correlao de
Postos/ RNL(h)
Graf: Seo V

Correlao de
Postos/ RNL(h)
Graf: Seo V

Pearson/
Regresso
Linear/ RNL (j)
Graf: Seo V

V. ind.

Binrio
(cat. de 2)
Categrico

Teste de 2 prop.,
T. Exato de
Fisher ou T.C. (a)
Graf: Seo III
Tabela de
Contingncia (b)
Graf: Seo III

Ordinal

Mann- Whitney;
Cochrans TT (c)
Graf: Seo VI

Quantitativo

Regresso
Logstica (i)
Graf: Seo VI

Dicotomizar VI ou
VD (Max. Balano)
(g)

Figura 1 Tabela para escolha de testes com uma varivel


preditora e uma resposta. A maior dificuldade na determinao do teste est ligada avaliao das premissas
dos testes paramtricos.

5.3 Testes com duas variveis

69

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Normalidade. Vamos relembrar e aprofundar


conceitos que imos antes. Normalidade significa
adequao de um conjunto de valores quantitativos a uma distribuio de frequncia em forma
de sino denominada Normal. Uma distribuio
de frequncia uma descrio de quantos valores existem para cada intervalo de valor de uma
varivel quantitativa. A princpio, a distribuio
normal uma distribuio contnua (lisa, sem
degrausinhos), mas podemos ter uma aproximao de distribuio normal como na figura a
seguir. Ela representada por um grfico cujo
eixo x mostra a varivel em questo dividida em
intervalos de valores e o eixo y a frequncia
que pode ser em valores absolutos (contagens)
ou relativos (porcentagem do total de casos ou
proporo em relao ao valor mximo). Note
que um padro com distribuio com tendncia simtrica, com moda, mediana e mdia aproximadamente coincidentes e na forma de um
sino. A figura seguinte mostra um padro diferente, mais compatvel com uma distribuio
denominada Poisson, mais comum quando
temos contagens com poucos nveis efetivos.
Podemos tambm ter distribuies bimodais
(dois morrinhos), que no so raros quando
trabalhamos com uma varivel expressa em
porcentagens.

5.4 Premissas dos testes paramtricos


H duas premissas mais bsicas para os testes
paramtricos: normalidade e homocedasticidade. O nmero de nveis efetivos da varivel
resposta pode ser visto como um aspecto da
normalidade, mas vale a pena ser tratado
parte, pois de fcil verificao. Estas premissas sero explicadas adiante. Note que na realidade no h uma fronteira exata a partir da
qual as condies permitem ou no um teste
paramtrico. Para enfatizar isto, descrevemos 3
situaes:
Varivel resposta quantitativa em condies
paramtricas. Situao: a) nmero de nveis
efetivos superior a 10; e b) distribuio de valores da varivel resposta normal em cada nvel
da varivel preditora; e c) homogeneidade na
varincia da varivel resposta entre os nveis da
varivel preditora.
Varivel resposta quantitativa fora de condies paramtricas. Situao: a) nmero de
nveis efetivos igual ou menor que 5; ou b) distribuio dos valores da varivel dependente se
desviam fortemente da normalidade dentro de
cada nvel da varivel preditora; ou c) a varincia da varivel resposta diferir fortemente entre
os nveis da varivel preditora.

Freqncia relativa

1.0

Varivel resposta quantitativa em condies


intermedirias. A varivel est em condies
intermedirias se: a) o nmero de nveis efetivos est entre 6 e 9; ou b) a distribuio dos
valores em cada nvel da varivel resposta tem
um certo desvio da normalidade; ou c) A varincia da varivel resposta no similar, mas
no extremamente diferente entre os nveis da
varivel preditora.

Normal

0.8
0.6
0.4
0.2
0.0

Nmero de peixes por pescador

Freqncia relativa

1.0

H uma exceo quanto a estas exigncias.


Quando a varivel preditora for binria, podemos utilizar um teste t com varincias separadas, que um teste paramtrico com a premissa de normalidade, mas sem a premissa da
homogeneidade das varincias.

0.8

Poisson

0.6
0.4
0.2
0.0

Nmero de peixes por pescador

10

12

Figura 3 Duas distribuies de frequncia comuns, a


"Normal" e a Poison".

70

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

A distribuio normal especial porque muitas


variveis assumem distribuies com esta forma, e esta informao incorporada ao teste
permite maior poder de previso. Podemos
ainda utilizar os testes paramtricos para variveis com pequeno desvio da normalidade, pois
estes testes so robustos, entretanto, isto tem
um limite. No caso de grandes desvios, os resultados dos testes no so confiveis e podem
levar tanto ao erro tipo II como ao erro tipo I. Em
algumas circunstncias, podemos transformar
algebricamente variveis sem normalidade em
variveis modificadas com normalidade (seo
5.5). Quando a transformao for possvel, ela
recomendada, em funo das vantagens dos
testes paramtricos.

da normalidade. Este segundo procedimento


ainda um pouco arriscado, por ser um pouco
subjetivo, mas geralmente aceito, pois os
testes que exigem normalidade so considerados robustos, isto , eles aguentam desvios
razoveis da normalidade.
1c) Se voc tiver mais de 30 dados, voc pode
utilizar um teste de normalidade (e. g. Shapiro-Wikes), que determina se o desvio da normalidade grande demais para considerar a
curva normal. Se o teste mostrar um desvio
significativo da normalidade, ento voc ainda
poderia tentar uma transformao dos dados
(como veremos adiante).
Situao 2: uma varivel resposta quantitativa e
uma varivel preditora binria, categrica ou
ordinal.

Anlise de normalidade em testes.


Situao 1: uma nica varivel quantitativa.
Nesta situao vimos que a recomendao a
utilizao de Intervalos de Confiana ao invs
de testes de significncia comuns. Entretanto,
mostraremos a anlise, pois ela ajuda a entender como isto feito para duas variveis. No
caso, o teste paramtrico seria um Teste T de
uma amostra (e a melhor alternativa no paramtrica seria o prprio Bootstrap).

Vale o mesmo que apresentamos acima para


uma varivel, podemos assumir normalidade,
avaliar graficamente ou testar a normalidade.
Entretanto, neste caso, a anlise de normalidade feita dentro de cada um dos nveis da varivel preditora. Por exemplo, numa anlise de
alguma medida de resistncia de pessoas (y)
em funo do tipo sanguneo necessrio que
haja normalidade da distribuio dos valores de

A anlise depende do contexto:


1a) Algumas variveis simplesmente costumam
ter distribuio normal, e assumimos (por razoabilidade) que a distribuio normal sem
realizar uma anlise de normalidade. Por exemplo, tamanho costuma ter distribuio normal, e
poucas pessoas questionariam presumir normalidade na maioria das situaes. Entretanto, h
um risco nesta premissa, at para variveis que
tipicamente tm comportamento normal.

40

Resistncia

30

20

10

1b) Se voc no pode assumir tranquilamente


este risco, ento precisar colocar os dados em
um grfico e avaliar a distribuio para ver se
tm um jeito de curva normal, isto , deve ser
aproximadamente simtrica na forma de um
sino. Esta anlise depende de pelo menos uns
10 dados para caracterizar este jeito. No
precisa encontrar padres perfeitamente normais, mas j d para perceber grandes desvios

AB

Tipo Sangneo

Figura 3 Avaliao qualitativa de normalidade da varivel


resposta dentro de cada nvel da varivel preditora. Os
padres neste grfico so compatveis com distribuies
normais.

71

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

10

Var. Dep. Quant.

V. Dep. Quant

10
9
8
7
6
5

Var. Ind. Quantitativa

-1

10

Var. Ind. Quantitativa

0.5

1.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

1.5

2.0

2.5

3.0

3.5

Var. Ind. Quantitativa

-1

-2
0.0

Figura 5- Normalidade em relao linear (ver texto).


m X

-2

5
0.0

Resduos de Y em X

Resduos de Y em X

Tendncia retilinear

Var. Ind. Quantitativa

Figura 4- Normalidade e curvilinearidade (ver texto).

resistncia para cada tipo sanguneo (as curvas


normais ficam viradas em 90 no grfico sobre
cada nvel de x). Novamente, no espere que
os dados formem uma curva perfeitamente
normal se os tamanhos amostrais no forem
muito grandes, mas necessrio que a distribuio seja pelo menos aproximadamente simtrica e na forma de um sino para os testes paramtricos. No exemplo abaixo os quatro nveis
tm padro compatvel com uma distribuio
normal.

Repare que os resduos esto homogeneamente distribudos ao longo do eixo da varivel preditora. Um desvio de normalidade ocorre quando aplicamos um modelo retilinear a uma relao que na realidade curvilinear (figura 5.4).
Repare que os resduos no se distribuem homogeneamente ao longo do eixo da varivel
preditora, inicialmente eles so muito altos,
depois muito baixos e ao final muito autos novamente. (*usamos o termo retilinear porque o
termo linear no se restringe a modelos com
uma reta; vrios modelos curvilineares tambm
entram nesta categoria segundo Zuug et al
2009)

Situao 3: Uma varivel resposta quantitativa e


uma varivel preditora quantitativa. Neste caso,
a relao entre as variveis representada por
uma linha. O esperado que se encontre uma
curva normal em cada nvel da varivel preditora e esta curva normal deve estar com a mdia
sobre o valor esperado para aquele nvel da
varivel preditora. Na prtica, o problema de
normalidade mais comum nesta situao a
mdia desta curva normal no estar no local
esperado, porque o modelo usado no apropriado.

Caso a anlise de resduos indique uma relao


no retilinear, ento a forma de agir depender
do problema: a) se o objetivo for apenas saber
se h uma relao com previso de aumento ou
reduo monotnicos (sem reverso de tendncia), pode se utilizar o teste no paramtrico
correlao de Spearman; b) se o objetivo inclui
uma descrio da relao, ento voc ter que
comparar estatisticamente os modelos alternativos ou verificar a existncia de um modelo flexvel apropriado. Estes procedimentos esto descritos em Zar (1984).

Suponha que o seu modelo de regresso


retilinear, que um modelo representado por
uma linha reta. O esperado que a mdia em
cada nvel esteja aproximadamente sobre a
linha reta, e que os pontos tenham uma distribuio normal neste nvel, como na figura ao lado.

Nmero de nveis efetivos apropriados na


varivel resposta. A contagem do nmero de

72

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas
30

Var. Dependente

Resistncia

30

20

20

10

0
0

Var. Independente

10

Figura 5-5- Heterogeneidade de varincias da varivel


resposta entre nveis categricos da varivel independente.
0

AB

Tipo Sangneo

outra condio para podermos utilizar testes


paramtricos. Isto tambm pode ser investigado
graficamente. Em termos simples, as curvas
normais imaginrias sobre a distribuio dos
dados devem ser aproximadamente igualmente
gordas.A figura 5.5 mostra uma situao de
heterogeneidade de varincias com varivel
preditora categrica e a figura 5.6 com varivel
resposta quantitativa.

Figura 6Heterogeneidade de varincias da varivel resposta entre nveis quantitativos da varivel preditora.

nveis efetivos substitui a tradicional categorizao de variveis em discretas e contnuas. O


conceito de varivel contnua no se sustenta
porque todo instrumento de medida tem uma
preciso limitada. O problema da continuidade
existe, mas est ligado a um baixo nmero de
nveis efetivos, no natureza da medida.

Lidando com as situaes intermedirias


Se voc tem 6 a 9 nveis efetivos de medida na
varivel resposta ou se h um desvio da normalidade, mas este desvio no for muito grande ou
se h uma diferena entre as varincias entre
os nveis das variveis preditoras, mas esta
diferena no for muito grande, ento voc est
em uma situao intermediria entre a situao
em que recomendamos um teste paramtrico e
a situao em que recomendamos um teste no
paramtrico. No h uma fronteira definida.
Caber a voc escolher conforme a situao,
considerando: a) Se a situao exigir uma abordagem mais conservadora, ou se voc tem uma
personalidade mais conservadora, d preferncia aos testes no-paramtricos; b) se h um
conhecimento de que a varivel em estudo costuma ter um comportamento mais prximo s
premissas de testes paramtricos, ento d
preferncia a estes; c) Leve em conta na escolha que esta regio tem um forte gradiente, e. g.
uma varivel com 6 nveis efetivos est muito
mais prxima da necessidade de testes no
paramtricos do que uma varivel com 9 nveis

A condio de nmero de nveis efetivos suficiente uma extenso da premissa de normalidade. Se houver menos que cinco nveis efetivos na varivel resposta, ento o salto de um
nvel para o outro proporcionalmente grande,
igual ou maior que 20% da amplitude (diferena
entre o menor e o maior valor). Portanto, no se
pode falar em uma curva normal, o mximo
uma escada normal, e estamos forando o
nosso algoritmo paramtrico devido descontinuidade dos valores. Por isto, quando voc tiver
seis nveis efetivos ou menos na varivel resposta, deveria utilizar um teste no paramtrico.
Quando voc tiver 10 ou mais nveis efetivos,
ento, dependendo das outras premissas, poder utilizar um teste paramtrico.
Homogeneidade de varincias. Tambm
chamada de homocedasticidade, a homogeneidade (ou similaridade) de varincias da varivel
resposta entre nveis da varivel preditora

73

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

efetivos. d) Leve em conta os trs critrios ao


mesmo tempo, uma circunstncia com condio
intermediria em apenas um critrio tende a ser
menos crtica que uma circunstncia com condio intermediria nos trs critrios.

trapaa, porque voc realiza a transformao


durante a fase de avaliao das premissas,
antes de ver o resultado do teste. Seria trapaa
se o motivo da transformao fosse o resultado
do teste. Estas transformaes so realmente
um procedimento recomendado para variveis
quantitativas respostas antes da deciso de se
utilizar um teste no paramtrico.

5.5 Transformao de dados


Como dissemos antes, havendo normalidade e
homocedasticidade, a estatstica paramtrica
mais poderosa. Em muitos casos em que as
premissas no se aplicam, possvel utilizar
operaes matemticas para transformar os
dados e obter normalidade e homocedasticidade. Este procedimento de tentar uma transformao recomendado para se obter o poder do
teste paramtrico e quando se deseja obter
descries com equaes lineares.

5.6 Outras premissas


H outras premissas que envolvem testes de
relaes, algumas se aplicam a todos os testes
(e. g. balano) e outras a alguns testes em particular (e. g. ortogonalidade, empates em ranqueamento, tamanhos amostrais em testes de
propores).
Balano entre nveis da varivel preditora
Balano significa equilbrio no nmero de dados
entre os nveis da varivel preditora em testes
de relaes entre duas ou mais variveis. Se
quisermos comparar o tamanho de aranhas em
funo do sexo e vamos medir 20 aranhas,
melhor termos 10 machos e 10 fmeas do que
17 machos e trs fmeas.

A transformao utilizando logaritmo recomendada quando h uma relao positiva entre


a mdia e a varincia (quanto maior a mdia,
maior a varincia). Quando no h valores iguais a zero, a frmula utilizada y= LN(y);
quando h valores iguais a zero y= LN(y+1).
Em alguns casos, como na relao entre peso e
altura, costuma-se utilizar uma curva log-log,
onde so utilizados os logaritmos tanto da varivel preditora como da resposta. A transformao pela raiz quadrada recomendada quando
no h normalidade e a varivel resposta uma
contagem de casos, o que normalmente leva a
uma distribuio do tipo Poison, ou em outras
situaes em que seja observada esta forma de
distribuio. Quando no h valores iguais a
zero, a frmula utilizada y=SQR (y); e quando
h valores iguais a zero, a frmula y=
SQR(y+0,5) (SQR= Raiz Quadrada). Outras
transformaes so mais complexas, como a
Box-Cox so utilizadas quando no se aplicam
as duas transformaes anteriores, mas no
estamos lidando com propores, e a transformao de Arcoseno quando os dados so
propores (0 a 1) ou porcentagens (0 a 100%).
Nestes casos, deve se consultar um texto mais
aprofundado (e. g. Sokal & Rohlf, 1988).

O balano se aplica a variveis de qualquer


escala de medida da varivel preditora, binrias,
categricas, ordinais ou quantitativas. No caso
de variveis categricas, o nmero de casos
para cada categoria (cada nvel categrico) no
deveria ser muito diferente. No caso de variveis ordinais, cada categoria ordinal (cada nvel
ordinal) deve ter nmeros aproximadamente
semelhantes. No caso de variveis quantitati-

Tamanho

15

10

Sexo

Figura 7 Dados balanceados com 10 entidades por nvel.

Estas transformaes podem parecer que se


est trapaceando no jogo estatstico. No

74

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas
20

VARIVEL Y

vas, a distribuio dos dados deveria ser aproximadamente homognea ao longo do eixo x.
Se dividirmos os dados da varivel quantitativa
em 3 a 5 intervalos, a quantidade de dados em
cada um deles no deve ser muito diferente.
O balano algo que podemos controlar facilmente em situaes experimentais. Em situaes no experimentais em que temos possibilidade de coletar bastante, podemos estratificar
a amostra de forma a obter balano (e. g. coletar 10 indivduos de cada espcie, tanto das
comuns como das raras). Entretanto, quando h
poucos dados, podemos ter dificuldade para
obter balano. Imagine que as aranhas do exemplo acima fossem fsseis raros, como obter
mais fmeas se so to raras?

15

10

10

15

VARIVEL X

20

25

Figura 8- Dados desbalanceados ao longo de varivel


quantitativa.

varivel preditora na questo, necessrio se


ter mais ateno, pois desbalanos podem gerar relaes esprias.
Por exemplo, se estamos querendo avaliar o
efeito do nitrognio e do clcio sobre o crescimento de uma planta ao mesmo tempo (normalmente para verificar a existncia de uma
interao entre estes fatores), o ideal utilizarmos um nmero de vasos igual para cada combinao dos nveis de cada fator. Por exemplo,
se tivermos os nveis +0, +10 e +50mg de nitrognio e os nveis +0, +10 e +50g de clcio, teremos nove combinaes de concentraes.
Normalmente isto possvel em situaes experimentais. H alternativas para tratar dados
desbalanceados nesta situao, mas elas esto
fora do escopo deste texto.

No encontrei nenhum livro ou artigo na internet


que fornecesse critrios para sabermos quanto
de desbalano compromete uma anlise com
uma nica varivel preditora. H bons livros de
estatstica com exemplos de anlises com desbalano superior ao dobro de casos entre o
nvel com menos dados e o nvel com mais
dados, o que sugere que podemos assumir
robustez para desbalanos fortes, mas no
haveria um mnimo? O teste Qui quadrado o
nico teste que conheo que considera suspeitos resultados com menos que 5 valores em
alguma das combinaes de nveis, e podemos
sugerir que este critrio seja estendido a outros
testes da seguinte forma: no mnimo 5 unidades
amostrais em cada nvel da varivel preditora
categrica e pelo menos 5 unidades amostrais
em cada extremidade de regresses lineares,
para que no ocorra situaes como esta da
figura abaixo. Caso haja menos que 5 unidades,
ento a categoria deveria ser eliminada da anlise ou aglutinada com outra categoria. Outra
opo seria a utilizao de um teste no paramtrico de permuta. No caso das regresses, a
anlise deveria ser restrita regio do grfico
que possui dados suficientes.

Balano entre nveis da varivel resposta em


testes no paramtricos por ranqueamento.
Os testes no paramtricos que mostramos
neste curso so do tipo mais comum, chamado
testes de ranqueamento, no qual os valores
absolutos medidos so substitudos por valores
de posio. Este procedimento mais apropriado do que um teste paramtrico quando a distribuio est muito fora da normalidade e/ou da
homogeneidade de varincia. Entretanto, poucos textos de estatstica destacam que estes
testes tambm so influenciados pela distribuio dos valores ranqueados em casos extremos. Por exemplo, imagine que voc quer comparar o deslocamento de uma espcie de sapo
em dois ambientes. Voc tem vrias medidas
de distncia, mas cerca da metade dos sapos
no se moveu. Este padro com muitos zeros

Ortogonalidade. A falta de balano em testes


com uma nica varivel preditora s deve ser
uma preocupao em casos de desbalanos
extremos. Entretanto, quando h mais de uma

75

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

empatados (ties) no raro, e no deveria ser


analisado por um teste de ranqueamento comum. Alguns autores (e. g. Gotelli & Elisson,
2010) recomendam que estes testes sejam
abandonados e substitudos por procedimentos
de permuta do tipo Monte Carlo. uma posio
muito vlida, entretanto, considerando que ainda no h uma tradio consolidada do uso dos
testes de permuta, ainda razovel a manuteno do uso dos testes de ranqueamento em
situaes em que no h um excesso de empates em poucos nveis efetivos de testes no
paramtricos de ranqueamento.

Esta seo trata de um aspecto dos testes com


varivel resposta quantitativa e varivel preditora categrica. Nesta situao, o teste nos permite determinar se h uma diferena entre os
nveis da varivel preditora. Por exemplo, podemos comparar o crescimento de galinhas
com trs marcas de rao e descobrir que h
efetivamente uma diferena. Entretanto, isto
no costuma ser uma resposta satisfatria,
normalmente queremos saber quais diferenas
so significativas entre cada marca de rao.
Digamos que tenhamos os nveis A, B e C e
tenhamos obtido uma diferena estatisticamente
significativa. Isto significa que: A>B>C ou que
A>B=C ou que A=B>C? Para definir quais diferenas so estatisticamente significativas
necessrio um teste de contraste aps um teste
de ANOVA ou Kruskal-Wallis. O teste mais usado para ANOVA chama-se Tukey. No caso do
Kruskal-Wallis pode se utilizar um teste Mann
Whitney entre cada nvel. Existe a possibilidade
do teste no apontar diferenas significativas
entre os nveis (A=B e B=C). Isto parece um
contra senso, mas possvel porque no conjunto a diferena significativa, mas que pode no
haver dados suficientes para saber qual nvel
diferente de outro nvel.

Tamanhos amostrais mnimos em testes de


propores. Cuidado ao aplicar testes de propores, eles s so vlidos em certas condies. No caso do teste de uma proporo, a
condio [n .p0 > 10 e n (1 p0) > 10], sendo
n o tamanho amostral e p0 a proporo obtida.
Por exemplo, se voc quer saber se a proporo 3:5 significativamente diferente de 50%,
ter n=8 e p0=0,375. Como 8x0,375<10, este
teste no poderia ser aplicado. Entretanto, poderamos testar se 30:50 significativamente
diferente de 50% porque n=80 e 80x0,375>10.
No caso de testes de duas propores, a condio [(n1 p1) > 5 e n1(1 p1) > 5 e (n2 p2) > 5
e n2(1 p2) > 5], sendo n1 e n2 os tamanhos
amostrais e p1 e p2 as propores. Assim, se
queremos testar se as propores 1:5 e 40:50
so diferentes, teramos 6x0,2<5, o que tornaria
o teste suspeito. Tabelas de contingncia tambm tm restries para tamanhos amostrais
pequenos dentro de cada clula. No Mystat
quando h menos que 5 observaes em uma
clula, o resultado considerado suspeito pelo
programa.

Exerccios
5.1- Represente com um grfico EPR uma situao
com uma varivel preditora com 4 nveis efetivos
ordinais (no quantitativos) e uma varivel resposta
quantitativa com mais de 10 nveis efetivos e forte
diferena na varincia entre os nveis.
5.2- Represente com um grfico EPR uma situao
com varivel preditora binria em que um dos nveis
apresenta uma distribuio de dados claramente
discrepante de uma distribuio normal e o outro
nvel com uma distribuio claramente compatvel
com uma distribuio normal com 10 entidades em
cada nvel.

Se voc est com um problema de tamanho


amostral em um teste deste tipo, e no puder
coletar mais dados, provavelmente possa utilizar uma abordagem de permuta como o bootstrap, mas bom considerar uma consulta a um
estatstico.

5.3- Represente com um grfico EPR uma situao


com variveis respostas e preditoras quantitativas. A
varivel preditora deve ter quatro nveis e a relao
no deve ser compatvel com uma relao retilinear.

5.7 Contrastes

76

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

5.4- A transformao de dados um procedimento


recomendado em que situaes?*
5.5- Quais as diferenas entre as condies para
testes paramtricos e para testes no paramtricos.
5.6- Por que realizamos anlise de contrastes quando a varivel preditora categrica?

5.7- Represente com um grfico EPR uma situao com uma varivel preditora com 4 nveis
categricos (no quantitativos ou ordinais) e
uma varivel resposta quantitativa com mais de
10 nveis efetivos. Neste grfico deve haver um
forte desbalano (>50%) entre o nvel mais representado e o menos representado na varivel
preditora.
5.8- Quais as premissas dos testes paramtricos apresentadas neste captulo e qual teste
paramtrico pode ser realizado sem homogeneidade de varincias entre os nveis das variveis preditoras.

77

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

6. Planejamento Amostral

evitar alguma tendenciosidade e depois em


funo da convenincia logstica.

6.1 Independncia
amostrais

No caso de perguntas sobre relaes, que envolvem duas ou mais variveis (sendo pelo
menos uma preditora e pelo menos uma resposta), a independncia, significa que Os valores da(s) varivel (is) preditora(s) foram manipulados ou escolhidos de forma que as influncias
de relaes com potenciais variveis de confundimento sobre a relao em estudo foram
todas anuladas ou radicalmente reduzidas.
(cap.3).

entre

unidades

O planejamento amostral tem por objetivo determinar a melhor forma de coletar os dados
prevenindo relaes esprias (este captulo) e
obtendo o mximo de poder para a nossa anlise (prximo captulo) dentro das possibilidades
logsticas do estudo. A introduo sobre coleta
de dados do captulo 3 ser aprofundada nestes
dois captulos.

A situao ideal para se obter a independncia


em estudos de relaes o experimento controlado, no qual manipulamos o valor da varivel
preditora e medimos o efeito na varivel resposta. Entretanto, em muitos estudos no possvel se manipular a varivel preditora. Vejamos
alguns exemplos de problemas de confundimento.

Os cursos introdutrios de estatstica, como


este, lidam basicamente com hipteses estatsticas simples (seo 1.3), que tem como premissa a independncia entre unidades amostrais. As ferramentas para lidar com estas hipteses so diversificadas e se constituem nas
formas predominantes da anlise de dados em
biologia. A premissa que lhe d fora justamente seu Calcanhar de Aquiles: a independncia entre unidades amostrais. Se no houver
garantia desta independncia, o resultado da
anlise no ser confivel.

6.2 A coleta parecia apropriada, mas...


Estudo 1. Pergunta: h diferenas no tamanho
de machos e fmeas de borboletas da espcie
Capronnieria abretia (Satyrinae) ?

No caso de perguntas sobre uma nica varivel,


a independncia significa que a amostra representativa da populao. Por exemplo, se
quisermos saber se a proporo de plantas com
flores vermelhas ou brancas de uma espcie
em um campo compatvel com a 1 lei de
Mendel (3:1), o ideal que a escolha das plantas na amostra seja aleatria. Entretanto, pode
ser invivel marcar todas as plantas para um
sorteio, ento poderamos pensar em outra
forma de amostrar, desde que tenhamos confiana que o resultado no seria tendencioso. Por
exemplo, poderamos ter um mapa detalhado
da rea, criar um grid (gradeado) e escolher
as plantas mais centrais em cada clula do
grid (amostra sistemtica). H diversos tipos
possveis de amostras sistemticas, mas nem
todas garantem a representatividade, de forma
que devem ser pensadas primeiramente para

Procedimento: coleta de 20 borboletas em janeiro e 20 em julho.Na figura ao lado representamos uma parte da tabela EPR. As entidades
seriam borboletas e as propriedades seriam
tamanho e sexo. A relao est representada
pela seta.

Tamanho Sexo
12
m
10
m
11
f
11
f

78

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

H algo errado com este procedimento? O grfico abaixo mostra que o tamanho dos animais
em janeiro (verde) maior que em julho (branco) Tambm vemos que em janeiro encontramos mais machos e em julho mais fmeas.
Machos e fmeas de janeiro tm os mesmos
tamanhos; machos e fmeas de julho tm o
mesmo tamanho. Portanto, no h dimorfismo
sexual de tamanho. Entretanto, se no levamos
em conta as variaes temporais de tamanho e
de abundncia, aparece uma falsa evidncia de
dimorfismo.

Amostragem: 6 meses coletando ao longo do


Rio Amazonas em diversos lagos com mtodo
padronizado. Os lagos so escolhidos ao acaso
medida que o barco de coleta vai descendo o
rio.
H algo errado? A quantidade de peixes varia
muito ao longo do ano nos lagos prximos ao
Rio Amazonas. Digamos que a coleta seja iniciada quando h pouco peixe nos lagos e termine
quando h muitos peixes no lago. Se a coleta
feita medida que o barco desce o rio, haver
diminuio da pesca medida que o barco se
afasta do Per, no devido variao espacial
da pesca, mas devido variao temporal. A
varivel de confundimento foi a poca do ano
que estava relacionada com a posio do barco
e com a quantidade de peixes.

Tamanho

Janeiro ( ) Julho (

Estudo 2. Pergunta: A abundncia de peixes


em lagos de vrzea no amazonas varia entre a
fronteira com o Per e Belm?

Machos

Fmeas

Estudo 3. Pergunta: A temperatura do ar condicionado influi sobre a capacidade de concentrao durante uma avaliao?

Isto ocorre quando h uma varivel de confundimento. Uma varivel de confundimento


aquela que influi sobre a varivel resposta e a
varivel preditora ao mesmo tempo, criando
uma relao inconsequente espria entre elas.
Isto fica mais claro no esquema das flechas
nesta figura

Tamanho Sexo
12
m
10
m
11
f
11
f

Coleta de dados. 15 voluntrios so colocados


para resolver problemas que exigem concentrao em 3 momentos. Sem que eles soubessem,
a temperatura da sala foi ajustada em diferentes
nveis em cada momento e a posio deles na
sala foi determinada aleatoriamente. No primeiro dia, a temperatura estava em 20C, no segundo dia em 24C e no terceiro dia em 28C. A
maioria dos estudantes obteve os piores resultados no primeiro dia e o melhor no ltimo dia, o
resultado foi fortemente significativo (P< 0,001).
A interpretao do experimento que os estudantes concentram-se melhor em salas mais
quentes e recomendaram a excluso dos condicionadores de ar das salas de aula da universidade.

poca
1
1
1
1

Relao esprea

Problema. Na realidade, os estudantes tendem


a se concentrar melhor a 20C, entretanto, no
primeiro dia eles tinham pouca experincia com
o teste. No segundo dia, eles aprenderam ainda
mais e no terceiro fizeram a sua melhor prova,

Relaes causais

79

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

mesmo com o incmodo de uma temperatura


alta. A ordem dos exames foi a varivel de confundimento, pois ela determinou a temperatura
e a experincia. Seria melhor que a ordem das
temperaturas fosse aleatria, embora isto seja
um fator complicador na hora de realizar um
estudo destes, quando h uma varivel de confundimento ligada sequncia de tratamentos,
planejamentos experimentais como estes so
um convite para relaes inconsequentes esprias.

deve ser eliminado apenas porque secou h 4


anos, isto acontece em lagos, trocar de lago
no a soluo. O errado querer tirar mais de
uma medida por lago se a questo a diferena
entre lagos. Melhor seria ter uma coleta por lago
em 5 lagos de gua branca e em 5 lagos de
gua preta, preferencialmente de bacias hidrogrficas diferentes. Dos exemplos apresentados, este o caso mais claro de Pseudoreplicao.
A pseudo-replicao definida como o uso de
estatstica inferencial para testar efeitos de tratamentos com dados de experimentos que no
so replicados ou quando as replicatas no so
estatisticamente independentes (Hurlbert,
1984). Em abordagens experimentais e em
alguns estudos observacionais, como o citado
acima, mais fcil se perceber quando h
pseudo-replicao, mas nem sempre assim. O
termo pseudo-replicao tornou-se muito popular e tem sido muito importante para despertar
mais nas pessoas o cuidado com replicatas
indevidas. Entretanto, acredito que ele s possa
ser bem compreendido depois de se entender
melhor alguns os tipos de variveis (em termos
de sua influncia na relao em estudo) e tipos
de controle.

Estudo 4. Pergunta: Lagos de gua branca tm


mais peixes do que lagos de gua preta?
Coleta: Instalamos 50 redes de coleta de peixes
em um lago no centro de uma ilha em Anavilhanas (bem representativo de lagos de gua preta) e 50 redes de coleta em um lago semelhante
no centro da ilha da Marchantaria (bem representativo de lagos de gua branca) na mesma
poca do ano
e com tcnica
padronizada.
Os dois lagos
Taxa de
Tipo de
foram seleciocaptura
gua
nados aleatoriamente de
uma
lista
grande
de
23
branca
lagos repre29
branca
sentativos dos
3
preta
respectivos
5
preta
tipos de gua.
A princpio, a estrutura da planilha para este
estudo seria esta ao lado, mas ser que ela
vlida nesta situao?
O problema que todas as coletas de peixes de
gua branca foram feitos no lago 1, e todas as
de gua preta foram feitos no lago 2. A diferena de tipo de gua certamente no a nica
diferena entre estes dois lagos. Por exemplo, o
lago 1 secou h 4 anos, e a comunidade de
peixes e de plantas que so refgio para peixes
foram severamente afetadas. O resultado do
estudo simplesmente se h diferena na taxa
de captura entre estes dois lagos. O lago 1 no

80

Taxa de
captura

Tipo de
gua

local

23
29
3
5

branca
branca
preta
preta

Lago 1
Lago 1
Lago 2
Lago 2

Lago
secou
nos
ltimos 5
anos?
no
no
sim
sim

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

alternativas razoveis que poderiam levar ao


mesmo resultado, como a diferena na preferncia a algum fator ambiental (e. g. umidade)
ou densidade de um predador comum s duas
espcies que prefere alimenta-se mais da presa
onde o predador for menos abundante.

6.3 Tipos de variveis dentro de mapas


conceituais.
Como vimos anteriormente, algumas questes
podem ter apenas uma varivel em anlise.
Neste caso, temos de nos preocupar apenas
com a representatividade (seo 3.3), no h
variveis externas nem possibilidade de confundimento.

quando estamos realizando um estudo cuidadoso de relaes causais que precisamos avaliar variveis externas. Vejamos os tipos de variveis externas e como lidar com elas.

Algumas vezes investigamos a existncia de


relaes entre duas variveis sem relao causal entre si, mas que poderiam estar respondendo mesma varivel preditora ou realizamos uma investigao preliminar sobre causalidade sem a preocupao rigorosa com a possibilidade de variveis de confundimento. Neste
caso, dizemos que estamos estudando a existncia de uma correlao. Variveis que apresentam relaes causais costumam apresentar
correlao, desde que a varivel preditora varie
suficientemente, e desde que variveis de rudo
no obscuream muito a relao. Entretanto,
correlaes no implicam relaes causais devido possibilidade de confundimento. Por isto,
em uma anlise de correlao, no estamos
nos preocupando muito com variveis externas.

As variveis externas so divididas em:


b1) Variveis Neutras, no afetam nem a varivel resposta nem a preditora; b2) Variveis
Pr Explicativas, que afetam diretamente apenas a varivel preditora; b3) Variveis de Rudo (VR), so aquelas que afetam a varivel
resposta, mas no afetam a(s) varivel(is) preditora(s); b4) Variveis de Confundimento (VC).
So aquelas que afetam tanto a varivel preditora como a varivel resposta, criando uma
relao inconsequente espria entre as variveis em questo; b5) Variveis de Caminho,
so aquelas que explicam a relao consequente entre a varivel preditora e a varivel resposta.

Voc poderia comparar a correlao entre dados climticos efetivamente medidos (e. g. Choveu) e as previses feitas por dois modelos
climticos (um dizia que ia chover e o outro
no). Note que as previses de clima no causam o clima, entretanto, tanto o clima como as
previses so influenciadas pelas condies
atmosfricas anteriores. Aqui o estudo de correlao nos conduz a concluses concretas
A correlao frequentemente estudada como
uma forma de obter indcios de relaes causais, mas a concluso tende a ser menos concreta. Por exemplo, podemos verificar se a abundncia de uma espcie (e. g. uma presa)
est correlacionada com a abundncia de outra
espcie (e. g. seu predador). A existncia de
uma correlao negativa um indcio que o
predador influi sobre a densidade da presa, mas
um indcio fraco, pois h outras explicaes

Figura 9- Classificao dos tipos de variveis em funo


da sua participao em uma questo.

81

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Figura 6-2- Mapa conceitual mostrando duas Variveis em Questo (mais escuro) e diversas variveis externas.

gunta se isto poderia ter causado a diferena.


3) Dr. Livinstone pergunta se poderia haver
uma diferena entre as nascentes das fontes que alimentam o lago para causar as diferenas de cor da gua.
4) Dr. Glenn pergunta se poderia ter havido
algum efeito da fase da lua durante a coleta.
5) Dr. Trara sugere que a causa da maior
abundncia no seja a diferena de produo de frutos, mas uma diferena de transparncia da gua, o que dificulta a ao dos
predadores, pois so visualizados de longe
pelas presas. Outra possibilidade que os
jovens Tambaquis tenham mais alimentos
em uma fase em que so predadores. Portanto, o importante seria o alimento na fase
de jovens e no de adultos.

Vamos discutir esta classificao em um exemplo. A figura 6.2 representa um mapa conceitual
de uma questo sobre o efeito do tipo de gua
sobre a quantidade de tambaquis em lagos. A
ideia que gua branca tem mais nutrientes
que possibilitam uma maior produo de frutos
das rvores da borda que so o principal alimento para os peixes adultos.
Digamos que fizemos a coleta de dados em 15
lagos de gua branca e 15 de gua preta e
obtivemos uma relao significativa (P<0,05)
entre o tipo de gua e a abundncia de peixes.
Levamos o trabalho a um congresso e as pessoas questionam sua concluso.
1) Dra. Kaufman, economista da USP, observou que os lagos de gua preta esto mais
prximos da metrpole e levanta a possibilidade da diferena na quantidade de peixes
ser causada mais pela presso do consumo
do que por diferenas ambientais.
2) Dr. Fisher pergunta sobre a experincia dos
pescadores que ajudaram no estudo e per-

O tipo de gua e a abundncia de tambaqui


foram respectivamente a Variveis preditora e
a Varivel resposta, as duas nicas Variveis
em Questo; as outras so Variveis Externas.

82

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

A proximidade da metrpole poderia ser causadora de uma relao inconsequente espria


(como sugere a Dra. Kaufman). Foi a pergunta
mais perigosa das que foram feitas porque
uma potencial Varivel de Confundimento.

Varivel Neutra. Algumas vezes, simplesmente


tomamos como premissa que algumas variveis
so neutras, o que envolve um risco. Na dvida,
bom tentar neutralizar at os menores riscos
de confundimento, entretanto, o bom senso
precisa ser utilizado para no ficarmos paranicos quando uma varivel no puder ser controlada, mas puder ser considerada irrelevante.

A experincia dos pescadores realmente pode


afetar a eficincia da pesca e a quantidade de
peixes capturados. Explicamos que no houve
confundimento porque os pescadores foram
sempre os mesmos nos lagos de gua branca e
nos de gua preta, portanto, o efeito da diferena de habilidade distribudo igualmente, prevenindo uma relao inconsequente espria por
este fator. Se os pescadores diferirem muito na
sua habilidade, isto adiciona varincia aos dados, e pode obscurecer a relao, por isto esta
varivel chamada Varivel de Rudo. Entretanto, como a diferena foi significativa, o problema do rudo foi superado pelo tamanho
amostral. De qualquer forma, o rudo um problema menos srio que a tendenciosidade.

A sugesto do Dr. Trara vlida. Ns sugerimos um caminho de causalidade e mostramos


que nossos dados so coerentes com nossa
proposta de explicao do funcionamento do
sistema. Entretanto, h outros caminhos que
seriam coerentes com nossos resultados. Apenas estudos mais profundos podero nos permitir ter certeza do caminho real. Entretanto, isto
no invalida o trabalho, a relao encontrada foi
pelo menos um avano para se compreender o
funcionamento do sistema. As observaes do
Dr. Trara precisam ser anotadas para alternativas em estudos posteriores. Por isto, estas
variveis so chamadas Variveis de Caminho.

A pergunta sobre as nascentes aceitvel como curiosidade e pode at ser til para especulaes relacionadas questo. Entretanto,
uma pergunta inofensiva para a questo especfica. A questo do estudo no era o que determinava o tipo de gua entre os lagos. Partia-se
do fato de que elas so diferentes para se questionar as consequncias disto. Esta varivel
afeta a varivel resposta, mas justamente pelo
seu efeito na preditora, de forma que no cria
uma relao espria. Por isto chamada de
Varivel Pr-Explicativa

Em resumo, o nico questionamento realmente


crtico para o seu trabalho foi o da Varivel de
Confundimento. Note sua caracterstica no esquema de mapa conceitual: a nica que forma
uma ala externa entre as variveis preditora e
resposta. o seu calcanhar de Aquiles. Discutiremos o que pode ser feito sobre isto depois.
Pelo menos, nesta seo ns vimos que no
temos que ficar paranicos com quaisquer variveis, apenas as potenciais variveis de confundimento realmente colocam o estudo em
risco de ser considerado invlido.

Ns nem pensamos em verificar a lua. Entretanto, acreditvamos que ela realmente seria irrelevante. Nenhum estudo anterior chegou a sugerir este efeito, este peixe tem hbitos diurnos
e as coletas entre lagos foram intercaladas,
sendo improvvel que houvesse coincidido um
maior nmero de coletas em um tipo de gua
associado a um tipo de lua. Seja por questes
biolgicas ou por questes da forma como os
dados foram coletados, consideramos que esta
varivel no seria uma fonte de relaes esprias. Por isto esta varivel foi considerada uma

Nas prximas sees abordaremos conceitos


que sero teis para compreendermos como
lidar com as variveis de confundimento.

83

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

droga injetvel. No controle de tratamento


nulo processual, o controle significa um grupo
com um procedimento mais prximo ao tratamento alternativo, como quando aplicamos soro
fisiolgico em um grupo de ratos (controle)
comparado com outro grupo que recebeu a
droga diluda no mesmo soro. No controle de
tratamento nulo reverso, cada tratamento
funciona como um controle do outro, como
quando injetamos drogas diferentes em dois
grupos de ratos. Algumas pessoas acreditam
que sempre precisamos de tratamentos nulos
simples ou processuais, entretanto, para estabelecermos uma relao, s o que precisamos
uma comparao.

6.4 Controle: tratamento, funo e


estratgia
Quando nosso objetivo determinar se uma
relao existe e/ou descrever a relao, usamos
um princpio bsico (preliminar) de controle:
Precisamos variar a varivel preditora, manter fixas todas as demais variveis e ver como muda a varivel resposta. Veremos adiante que este princpio utpico, mas um
ideal que serve como referncia para entender
o objetivo do planejamento amostral no estabelecimento de relaes. Note que este objetivo
no compatvel com a amostra representativa
(aleatria) da populao descrita na seo anterior. No precisamos ter uma amostra representativa de todas as sementes de soja do mundo
para testar o efeito de um nutriente sobre o seu
desenvolvimento, basta um lote. verdade que
as concluses podem no valer para todos os
lotes, ou todas as variedades, mas isto uma
questo de validao externa que normalmente
tratada em um segundo momento. A essncia
do princpio que temos que ter o mximo de
controle sobre as variveis potenciais de confundimento.

6.5.2 Controle no sentido de funo.


No sentido de funo, h duas categorias de
controle, o controle de rudo e o controle de
tendenciosidade, que tem objetivos diferentes.
Quando estamos querendo estudar a relao
entre uma varivel resposta e uma varivel
preditora* (variveis em questo), temos tambm uma infinidade de variveis externas que
podem influir sobre a varivel preditora, sobre a
varivel resposta ou sobre ambas (Fig. 6.3).

H trs sentidos para a palavra controle, o sentido tratamento, o sentido de funo e o sentido
de estratgia.

Se a varivel externa influir apenas sobre a


varivel preditora, temos uma Varivel Pr Explicativa (seo 6.3), que no influi diretamente
sobre a relao R1. No exemplo daquela seo,
tnhamos uma questo sobre a relao entre o
tipo de gua (VI) e a abundncia de tambaquis
(VR), e vimos que o motivo das guas serem
diferentes era o tipo de solo nas nascentes
(VE), que era irrelevante para a questo. O solo
nas nascentes no tinha uma relao direta (i.
e. separada) com a abundncia dos peixes,
apenas tinha uma relao indireta atravs da
prpria varivel preditora.

6.5.1 Controle no sentido de tratamento nulo.


Para verificar o efeito de algum fator (uma varivel preditora) sobre alguma coisa mensurvel, temos que realizar uma comparao. O
termo tratamento utilizado para abordagens
experimentais nas quais manipulamos a varivel preditora e significa cada nvel da varivel
preditora. O controle no sentido de tratamento
divide-se em trs tipos, o controle de tratamento
nulo, o controle de tratamento processual nulo e
o controle nulo reverso. No controle de tratamento nulo simples, o controle significa grupo
sem interveno, como quando no aplicamos
nada em um grupo de ratos (chamado de controle) comparado com o grupo que recebeu uma

Se a varivel externa influir apenas sobre a


varivel resposta, no teremos uma Varivel de
Confundimento nem uma relao inconsequente espria. Entretanto, quanto mais a varivel
externa variar, maior ser a variao da varivel
resposta, a ponto de poder obscurecer a rela-

84

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

todos eles foram para todos os lagos, mas se


um fossem para os lagos de gua branca e
outro fosse para os lagos de gua preta, ento
teramos uma potencial varivel de confundimento. Este controle contra relaes inconsequente esprias, isto , contra o aumento da
chance de erro tipo I (para alm de ), denominado Controle Anti Tendenciosidade. As
estratgias para se obter os dois tipos de controles sero discutidas na prxima seo.
6.5.3 Estratgias de controle
Os controles no sentido de estratgias envolvem fixar, aleatorizar, sistematizar e/ou blocar
valores de variveis ou incluir mais variveis na
questo.
Figura 6 3. Efeitos de Variveis Externas sobre uma relao em
estudo (R1). As relaes entre estas variveis e a Varivel preditora (R2 a R5) so potenciais geradoras de confundimento. As relaes entre as Variveis Externas e a Varivel resposta em questo
R6 a R9 so causadoras de rudo. (*O mesmo se aplica com mais
variveis preditoras em estudo, mas mais complexo, pois as
relaes entre as variveis preditoras em estudo tambm precisam
ser consideradas.)

o R1. Este efeito denominado Rudo. O


rudo, por definio, no tendencioso, mas
prejudicial porque aumenta a chance de erro
tipo II. A manipulao de uma varivel externa
para reduzir o rudo denominada Controle
Anti Rudo, e consiste em fixar seu valor ou
pelo menos diminuir a varincia desta varivel.
No exemplo dos tambaquis, diferenas nas
habilidades dos pescadores poderiam obscurecer a relao em estudo, de forma que seria
mais indicado que apena um pescador realizasse o trabalho ou que todos fossem treinados em
tcnicas bem padronizadas.

Controle por identidade das condies iniciais.


Se todas as variveis com potencial de influir
sobre a varivel resposta tivessem valores absolutamente idnticos, ou tivessem um efeito
insignificante, muito menor que o efeito da varivel preditora, e fizssemos variar apenas a
varivel resposta, bastariam duas unidades
amostrais com dois nveis para a varivel preditora para mostrarmos a existncia de uma relao (ou mais nveis para descrevermos a relao).
a premissa mais forte que se pode imaginar
para um teste, a menos razovel, e a que d o
maior poder possvel a um teste. Apesar de
parecer absurda, a premissa de controle absoluto pode ser utilizada frequentemente em laboratrios de Fsica e de Qumica, com experimentos com objetos padronizados e em reaes com substncias puras. Na realidade,
controle absoluto no existe nem nestas cincias exatas, o que ocorre que em algumas
situaes j se conhece suficientemente um
fenmeno para se saber que variveis externas
teriam dimenses to irrelevantes que podem
ser simplesmente ignoradas. Em situaes to
controladas, normalmente nem se est testando
se uma relao existe, j se sabe que existe, o

Se a varivel externa influir sobre a varivel


resposta e sobre a varivel preditora ao mesmo
tempo, temos que eliminar uma das duas relaes. A relao entre a VE e a VR s pode ser
anulada fixando-se VE, o que tambm anula
sua relao com VI. Entretanto, quando isto no
possvel, ou em funo de uma preocupao
com a validao externa do estudo, a opo
anular a relao entre VE e VI. No exemplo dos
Tambaquis, a habilidade dos pescadores no
tinha relao com a varivel preditora porque

85

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

objetivo do estudo costuma ser descrever a


forma da relao.

forma de prevenir este tipo de tendenciosidade.


Entretanto, quando a aleatorizao complicada por questes logsticas, pode-se utilizar algum mtodo alternativo, se houver uma justificativa forte para se acreditar que ele no tendencioso.

Em biologia, raramente razovel se assumir


este controle absoluto. Na fsica voc pode
utilizar um mesmo objeto duas vezes em um
experimento, na biologia voc no pode fazer
uma semente germinar duas vezes e duas sementes nunca so absolutamente idnticas,
nem clones so absolutamente idnticos, no
mximo geneticamente idnticos, diferenas
podem surgir at durante o desenvolvimento
embrionrio.

Aps formarmos grupos iguais, aplicamos tratamentos diferentes em cada grupo. Portanto,
esta abordagem s est disponvel para estudos experimentais. Tecnicamente, o que fizemos chama-se atribuio aleatria dos nveis
da varivel preditora. Se a diferena entre os
grupos for maior do que a esperada ao acaso
comparado com uma probabilidade limite pr
estabelecida (), dizemos que rejeitamos a
hiptese nula e que temos uma prova estatstica
para nossa hiptese alternativa.

Controle por aleatorizao simples.


Como vimos acima, se pegssemos duas sementes absolutamente idnticas, poderamos
tirar concluses sem replicatas (repeties) de
tratamentos. O problema que no basta parecer igual, no temos condies de garantir que
duas sementes so absolutamente iguais. No
podemos ter certeza se uma diferena ao final
resultou do prprio tratamento ou se foi resultado de diferenas intrnsecas no visveis, isto ,
elas talvez se tornassem diferentes mesmo sem
receber os tratamentos diferentes.

Esta forma de controle previne contra tendenciosidade, isto , contra erro tipo I, mas no
contra rudo. Por isto, Geralmente este controle
feito junto com outras formas de controle,
como veremos na Abordagem Experimental
(seo 6.6)
Controle sistemtico simples.

Uma soluo para este problema trabalhar


com vrias sementes em um grupo tratamento e
vrias sementes em um grupo controle. Se consegussemos dois grupos iguais, as diferenas
entre as sementes se anulariam. No h como
se conseguir dois grupos idnticos, mas se as
sementes fossem escolhidas aleatoriamente,
estes grupos seriam cada vez mais semelhantes quanto mais sementes fossem utilizadas, e
seria possvel se decidir estatisticamente dentro
de critrios estabelecidos a priori se uma diferena obtida est alm do esperado por acaso.

Voltando ao exemplo das sementes de soja,


imagine que voc tem dois sacos de sementes
de lotes diferentes. Os lotes podem ser diferentes em idade, tratamento, origem, etc. Se montssemos os grupos aleatoriamente, poderamos obter dois grupos comparveis, como vimos acima. Entretanto, outra forma de se obter
isto, seria se pegssemos alternadamente uma
semente de cada saco at obtermos o nmero
necessrio para o tratamento e depois repetir a
operao para o controle. Os dois grupos foram
feitos equivalentes por intercalao. A intercalao, ou outra forma de proceder que garanta a
igualdade entre os grupos tratamento e controle
outra forma de se obter grupos semelhantes.

A abordagem com este aleatorizao contrasta


com uma formao de dois grupos em que o
pesquisador escolhe as sementes. Inconscientemente, ele poderia selecionar sementes melhores para um dos tratamentos. A estatstica
tem muito poder para detectar diferenas sutis,
mesmo que a causa seja uma varivel de confundimento, de forma que a aleatorizao uma

O controle aleatrio mais fiel s frmulas estatsticas do que o controle sistemtico, mas a
diferena pode ser considerada mnima, e a
amostragem sistemtica apresenta algumas
vantagens. Estatsticos divergem sobre qual dos

86

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

dois modelo mais apropriado. Acompanho o


ponto de vista de Hurlbert (1984), que defendeu
que as vantagens prticas da intercalao de
nveis em experimentos manipulativos superam
as desvantagens de sutilezas matemticas de
uma abordagem estritamente aleatria, principalmente para tamanhos amostrais pequenos.

Dentro da abordagem experimental, em que os


nveis da varivel preditora atribuda aleatoriamente entre as subunidades amostrais nos
blocos, o efeito dos blocos reduzir a chance
de erro tipo II, pois a aleatorizao j controlou
a chance de erro tipo I. A utilizao de blocos
recomendada quando h grande variao espacial ou temporal nas VEs mais relevantes, ou
uma varivel importante a ser controlada com
os blocos. Do contrrio, geralmente a abordagem sem blocos tem mais poder porque cada
subunidade amostral torna-se uma unidade
amostral.

Alm disto, em estudos no experimentais (seo 6.8) no podemos manipular a varivel


preditora, portanto, no podemos atribu-la aleatoriamente. Entretanto, podemos intercalar nveis no tempo e no espao. Por exemplo, no
exemplo da borboleta da seo 6.2 no poderamos marcar todas as borboletas da floresta e
sortear as que seriam coletadas, e, se fosse
possvel, isto s funcionaria para evitar uma
relao inconsequente espria se participassem
do sorteio as borboletas de todas as pocas.
Entretanto, este problema seria contornado
intercalando-se medidas de machos e fmeas,
isto , ignorando borboletas que tivessem o
mesmo sexo que a borboleta coletada anteriormente.

Os blocos permitem a realizao de aleatorizaes mltiplas, o que pode ser muito importante, pois nem sempre as aleatorizaes podem
ser feitas em um nico momento. Por exemplo,
podemos no ter espao suficiente em um nico
momento na casa da vegetao para todas as
replicatas necessrias para um experimento.
Os blocos so especialmente teis em abordagens no experimentais, pois podem controlar
todas as variveis externas ao bloco, o que no
pouco. Se todos os nveis da varivel preditora puderem ser encontrados em um bloco de
dimenses espaciais/ temporais muito menores
do que as dimenses da rea/ Perodo de estudo, os blocos reduzem drasticamente o efeito
de variveis externas e so fortemente recomendveis. Neste caso, eles servem para diminuir tanto a chance de erro tipo I como de erro
tipo II.

Assim como no controle aleatrio, esta forma de


controle previne contra tendenciosidade apenas
e pode ser feita em conjunto com outras formas
de controle que reduzem a chance de erro tipo
II.
Controle com blocos VP
Uma forma especial de controle sistemtico o
estabelecimento de blocos, dentro dos quais h
todos os nveis da Varivel preditora, que, idealmente so atribudos de forma aleatria para
subunidades amostrais (neste texto consideramos cada bloco como a unidade amostral). Os
blocos podem ser constitudos no espao (cada
um em um local), no tempo (cada um em um
momento, no espao-tempo (cada um em um
local e tempo determinado) ou numa posio na
escala de uma varivel externa (cada um em
um nvel de uma varivel categrica ou ordinal
ou em um segmento de reta de uma escala
quantitativa).

Caso haja Variveis Externas que sejam potenciais Variveis de confundimento dentro de
blocos, recomendvel a utilizao de algum
controle sobre estas variveis.
Controle por fixao de variveis externas.
Em estudos experimentais, a fixao de variveis externas uma forma de controle de rudo.
Quanto mais variveis externas puderem ser
fixas, maior o poder do experimento. Portanto,
uma forma de reduzir erros tipo II.
Em estudos quase experimentais e no experimentais, a fixao de variveis externas tam-

87

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

bm tende a reduzir a chance de erro tipo II,


mas mais importante como uma forma de
minimizar a chance de reduzir erro tipo I. Especialmente quando no h um controle por blocos, importante se levantar todas as potenciais variveis de confundimento e tentar fix-las
ou reduzir sua varincia ao mximo, ou inclulas no estudo (prximo item), pois estes tipos de
estudos esto mais sujeitos a relaes esprias
do que os estudos experimentais.

tamento) ou a incluso de uma varivel com


nveis livres.
Em estudos experimentais, a incluso de mais
uma varivel controlada normalmente leva a
desenhos experimentais fatoriais, nos quais
temos as combinaes dos nveis das variveis
preditoras com o mesmo nmero de unidades
amostrais e uma estatstica simples e segura
para analisar a interao entre variveis preditoras em seus efeitos sobre a resposta. Por exemplo, se queremos ver se um nutriente contribui para o crescimento de uma plante, podemos fixar a quantidade de outros nutriente, mas
pode ser que o efeito do nutriente mude em
funo da concentrao do outro nutriente. Para
investigar isto montamos um desenho amostral
com combinaes de concentraes dos dois
tipos de nutrientes.

Controle por incluso de varivel.A anlise


de Variveis preditoras Mltiplas um assunto
que est alm do escopo deste texto bsico,
apresentamos apenas uma introduo conceitual sobre esta forma de controle.
A incluso de uma varivel pode ser de dois
tipos: incluso de uma varivel controlada (tra-

Figura 10- Chave para a escolha de abordagens de pesquisa. VI= Varivel Independente; VR= Varivel resposta; VE=
Varivel Externa.

88

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

de cidra por dia; b) um tipo de elixir usado por


marinheiros c) um pouco de gua do mar; d)
uma mistura de alho e mostarda; e) duas colheres de vinagre; f) duas laranjas e um limo. Os
homens que tomaram frutas ctricas melhoraram radicalmente em 6 dias. Havia muitas ideias sobre formas de curar esta terrvel doena,
mas apenas com esta abordagem controlada foi
possvel separar especulaes de evidncia
objetiva. (*embora provavelmente no tenha
havido um processo de sorteio, isto no comprometeu o resultado. mais um exemplo histrico do que um exemplo ideal, pois a separao
de tratamentos j representou um grande avano metodolgico).

Em estudos experimentais ou no experimentais, a anlise com nveis livres mais complexa, de forma que recomendada a ajuda de
uma pessoa que entenda do assunto. De qualquer forma, a incluso normalmente tem um
papel principal de controle anti rudo no estudo
experimental e de controle anti tendenciosidade
no estudo no experimental. Um exemplo de
incluso de varivel em um estudo no experimental foi apresentado na seo 6.2, na anlise
do dimorfismo sexual de borboletas.

6.5 Escolha a sua abordagem


Como vimos no captulo 1, normalmente a prioridade da pesquisa evitar o erro tipo I, cuja
chance ampliada pela influncia de variveis
de confundimento. Portanto, a prioridade evitar que estas variveis possam influir na relao
em estudo. O ideal para isto a abordagem
experimental, mas nem sempre pode ser aplicada, pois as variveis preditoras no podem
ser sempre manipuladas (no experimentos), ou
podem ser manipuladas, mas a atribuio no
pode ser aleatria da forma necessria para um
experimento controlado estatisticamente (quase
experimento). Quando temos um no experimento, ainda temos a chance de atribuir valores para a varivel preditora escolhendo estes
valores (nveis fixos multivalor). Quando no
escolhemos os valores da varivel preditora,
podemos inferir independncia pela distncia,
ou pelo menos controlar parte das variveis
preditoras. A figura acima sintetiza estas opes
que sero explicadas nas prximas sees.

Vimos na seo anterior que um experimento


envolve a manipulao (aleatria ou sistemtica) nos valores de uma varivel preditora (tratamento) para se verificar o seu efeito em uma
varivel resposta. Vamos reforar a ideia de um
experimento com mais um exemplo. Para sabermos se caf aumenta a produtividade, temos
que dar caf para algumas pessoas e no dar
nada (ou s gua quente com acar) para
outras (manipulao da varivel preditora ingeriu caf?- (S/N)) e ver a produtividade. A escolha de quem vai tomar caf, a princpio, precisaria ser por sorteio; voc no pode deixar as
pessoas escolherem se vo tomar caf ou no.
So necessrias vrias pessoas, porque h
vrios fatores que influem sobre a produtividade, mas a aleatorizao distribui as diferenas
igualmente entre os dois grupos e tornam a
comparao confivel dentro de critrios estatsticos bem definidos.
Um sorteio pode controlar fatores do passado
como origem, lote e condies da planta antes
da aleatorizao. Entretanto, se as plantas do
tratamento crescerem mais prximas da fonte
de luz que as plantas do controle, o experimento fica comprometido por uma varivel de confundimento ps Aleatorizao. Por isto, recomendado que a posio de plantas em uma
casa de vegetao tambm seja determinada
aleatoriamente ou sistematicamente. Atitudes
similares precisam ser adotadas em outras situ-

6.6 O experimento como modelo na


pesquisa de relaes.
O primeiro registro de planejamento experimental de 1747, quando o mdico James Lind
verificou que a doena escorbuto, que era comum em marinheiros, poderia ser combatida
com uma dieta especial. Para isto, ele selecionou 12 homens doentes de uma tripulao e
dividiu-os em 6 grupos. Cada grupo recebeu
todo dia respectivamente: a) um quarto de copo

89

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

aes com potenciais variveis de confundimento ps aleatorizao.


A atribuio aleatria ou sistemtica dos nveis
da varivel preditora feita da forma apropriada e
associada a uma anlise estatstica uma forma muito efetiva de se controlar todas as Variveis de Confundimento de uma nica vez contra
qualquer tendenciosidade, portanto, protege
contra erro tipo I (que no ultrapassa o valor de
). A princpio, a nica varivel manipulada a
varivel preditora. Entretanto, esta abordagem
no reduz rudo. Por isto, quase sempre se fixa
outras variveis de forma a se reduzir a varincia do sistema. o que se faz em laboratrios
com clima e rao controlados para ratos que
possuem pouca variabilidade gentica ou ao
excluir todas as sementes de soja que boiam na
gua (potencialmente estragadas) antes da
aleatorizao, manter as plntulas crescendo
em casas de vegetao com clima controlado
etc. A padronizao um procedimento desejvel para aumento do poder, portanto, diminui a
chance de erro tipo II. importante destacar
que a padronizao no obrigatria para a
validao interna. Um resultado significativo
sem padronizao, mas com controle de atribuio aleatria dos nveis da varivel preditora
no pode ser questionado em sua validade
interna.

6.7 Abordagens quase experimentais.


Apenas quando h uma completa aleatorizao
da atribuio dos tratamentos temos uma abordagem dita Experimental, tambm denominada Experimento Aleatorizado de Medida Ps
Teste. Na notao de planejamentos experimentais (Trochim 2000), os mais simples so
simbolizados da seguinte forma:

A
A

X1
Xc

O
O

Onde cada A representa um grupo selecionado aleatriamente. X1 representa um tratamento e Xc outro tratamento ou o controle. O
representa uma observao. Se houvesse mais
tratamentos seriam X2, X3, etc. Portanto, em
cada linha temos um grupo escolhido aleatoriamente, tratado de forma diferente e observado
posteriormente.
H uma segunda categoria de experimentos
denominados quase experimentos, ou experimento de pr-teste e ps-teste de grupos no
aleatrios. H vrias abordagens escolhidas
em funo do tipo de limitao e de opes
para mitigar os efeitos da falta de aleatorizao.
A simples simples representada assim:

O experimento com controle estatstico considerado a abordagem ideal para se estabelecer


uma relao entre duas variveis devido a sua
imunidade tendenciosidade (mas no ao
acaso estatstico). A estatstica tradicional foi
construda tendo em considerao o experimento como modelo. Ento por que nem toda a
pesquisa experimental? Simplesmente porque
em muitos casos no possvel tecnicamente,
eticamente ou economicamente se manipular a
varivel preditora ou realizar aleatorizaes da
forma ideal. Entretanto, importante compreender que as outras abordagens que vamos apresentar so aproximaes da abordagem experimental. Quanto mais uma abordagem se assemelhar da abordagem experimental mais
confivel ela tende a ser.

N
N

O
O

X1
Xc

O
O

Onde N um grupo que no foi obtido de forma


aleatria. As letras O antes e depois dos X
indicam observaes antes e depois para verificar mudanas. Exemplo de grupos no aleatrios: a) alunos de duas classes, uma com um
novo mtodo didtico e a outra no mtodo tradicional; b) Coletas dirias padronizadas de peixes em dois lagos, um protegido contra pesca e
outro no, antes e depois da proteo; c) Coletas de invertebrados a montante e a jusante de
uma fbrica potencialmente poluidora antes e
depois de sua instalao. O ideal que os grupos das duas linhas sejam to semelhantes

90

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

quanto possvel, mas no absolutamente necessrio. Frequentemente desejvel o menor


tempo possvel entre o pr-teste e o ps-teste.
H uma srie de premissas para esta abordagem ser considerada vlida, e os esquemas so
escolhidos em funo das caractersticas de
cada problema especfico.

6.8 Abordagens no experimentais


Um estudo no experimental de relaes aquele em que no se manipula a varivel preditora, geralmente porque isto no possvel
devido a restries tcnicas, ticas ou econmicas.

O planejamento pode ser mais elaborado, por


exemplo:

Na seo 6.3, vimos que em situaes no


experimentais nossas concluses sobre a relao entre a Varivel preditora e a Varivel resposta esto vulnerveis ao efeito de Variveis
de Confundimento. A forma de agir para diminuir muito a chance de uma relao espria depende do tipo de amostragem que estamos
utilizando. As abordagens no experimentais
dividem-se em trs tipos: a) Amostragem Fixa
Multivalores da Varivel preditora simples;
b) Amostragem Fixa Multivalores da Varivel
preditora com Blocos; c) Amostragem de Nveis
Livres.

N O X1 O Xc O
N O Xc O X1 O
Neste caso h trocas de tratamentos entre os
grupos, o que considerado um planejamento
bastante forte, desde que no haja influncia da
ordem dos tratamentos.
Outra opo elaborada:

N1 O
N1 X1 O
N2 O
N2 Xc O

Nas amostragens fixas multivalores simples ou


em blocos, os valores da varivel preditora so
procurados na natureza e se observa qual o
valor da varivel resposta naquele lugar (h um
caso em que contrrio, como veremos posteriormente). No exemplo da seo 6.3, procuramos lagos de gua branca para verificar se
havia mais peixes de uma determinada espcie
do que lagos de gua preta. Note que no um
experimento, pois no manipulamos a varivel
preditora, nem uma coleta livre, pois escolhemos os lagos com base no valor da varivel
preditora.

Neste caso a metade do primeiro grupo observada no pr- teste e a outra metade passa
pelo tratamento e observada no ps-teste. O
segundo grupo tem metade medida no pr-teste
e a outra metade tem uma medida no ps-teste
como controle (Xc). Se sua observao inicial
pode influir sobre a observao final (e. g. realizar uma prova prepara as pessoas para a segunda prova), voc pode separar a classe 1 em
duas partes, uma que faz a prova antes do mtodo testado e outra que faz a prova depois. A
sala 2 um controle feito da mesma forma.
Comparando as diferenas entre a linha 1 e a
linha 2 com as diferenas entre a linha 3 e a
linha 4 teremos uma avaliao sem o efeito do
aprendizado da prova.

A primeira potencial varivel de confundimento


a ser considerada nas abordagens fixas o
conhecimento do valor da varivel resposta
antes da escolha. Se a pessoa que escolhe as
unidades amostrais conhecer os valores da
varivel resposta, sua escolha pode ser tendenciosa. Pensando no exemplo da seo 6.3, se
escolhemos um lago porque ele tem gua branca e porque ouvimos que l tem muito peixe, e
rejeitamos outro lago de gua branca porque
ouvimos que tem pouco peixe, ento estaremos

H outros esquemas de quase-experimentos


(ver Trochim, 2000). O importante aqui ver
que h alternativas de estudos manipulativos
em que no possvel se realizar a aleatorizao da atribuio de tratamentos.

91

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

sendo tendenciosos na escolha. necessrio


muito cuidado, pois at inconscientemente podemos ser tendenciosos nas escolhas. Quando
inevitvel a observao dos valores da varivel resposta, o que possibilita uma coleta tendenciosa, recomendvel que a escolha das
unidades amostrais seja feita por uma pessoa
que desconhea a relao esperada, o que
chamado de escolha cega. Este problema no
existe quando o valor da varivel resposta for
desconhecido no momento da escolha.

as medidas antes e depois de uma chuva ou


vrias medidas por fase da lua em um nico
ms) mas a chance de pseudo-replicao temporal ou espacial seria alta.
Amostragem com VI fixa multivalores por
escolha com blocos
As unidades amostrais so blocos divididos em
subunidades (medidas repetidas) selecionadas
a) em funo dos valores (nveis) pr-definidos
da Varivel preditora (implcita) ou b) em funo
de valores da varivel resposta.

Amostragem com VI fixa multivalores por


escolha sem blocos

Os blocos com nveis da VI pr definidos so


normalmente reas (espacial) ou momentos
(temporais) nos quais encontramos cada nvel
da varivel preditora implcita. Exemplos,
1) Bloco= montanha, VI implcita= altura (0, 300,
600), VR= produtividade de pinheiros, permitem que se verifique o efeito do tratamento
(varivel preditora implcita) isolando o efeito da
heterogeneidade entre blocos; 2) Bloco=rvore,
VI implcita= altura da flor (alta, mdia, baixa),
VR= produo de nctar; 3) bloco=dia, VI=horas
do dia (8, 10, 12, 14, 16, 18), VR= nmero de
bois forrageando.

A unidade amostral simples, selecionada em


funo de valores pr-definidos da varivel preditora. Trata-se de uma das abordagens mais
comuns em estudos de campo. O controle estatstico inexistente ou parcial por intercalao.
Sem intercalao, (exemplo da fig. 6.2) esta
amostragem tem os mesmos problemas (e solues) das amostragens de nveis livres ou ao
acaso (ver abaixo), menos um, podemos definir
balano no nmero de dados por nvel da varivel preditora. Neste caso, necessria alguma
justificativa para inferir que as unidades amostrais podem ser consideradas independentes
(seo 6.9). Com intercalao, a amostragem
com VI fixa multivalores uma forma sistemtica de coleta recomendvel contra tendenciosidade (Hulbert 1984), a menos que haja algum
fator que varia de forma peridica que coincida
com a periodicidade da varivel preditora, como
pode ocorrer com avaliaes temporais de fenmenos sujeitos sazonalidade. Em relao
abordagem em blocos, a amostragem fixa multivalores simples pode apresentar vantagens em
termos de poder do teste. Exemplo com intercalao: podemos ver a relao entre a ocorrncia
de chuvas noite e a atividade de cupins de dia
alternando contagens aps uma noite de chuva,
interrompendo as contagens nas noites seguintes com chuva, outra contagem aps uma noite
sem chuva e assim por diante. Tambm poderamos avaliar o efeito das quatro fases da lua
sobre a abundancia de mariposas. Teramos
uma medida para cada fase da lua por ms. O
mesmo poderia ser feito sem intercalao (vari-

Vamos entender por um exemplo: Voc quer


saber se h uma relao entre a quantidade de
baratas silvestres e a quantidade de serrapilheira no cho em uma floresta. Suponha que no
existe uma relao consequente entre estas
duas variveis. Entretanto, sua rea de estudo
ampla, e h reas muito midas onde h menos
serrapilheira (devido decomposio mais rpida) e em lugares mais midos as baratas sejam
mais abundantes, mas no em funo da serrapilheira. A umidade seria uma varivel de confundimento a causar uma relao espria. Numa abordagem em blocos, poderamos separar
blocos com duas subunidades amostrais, uma
com 1 a 5 litros de serrapilheira por m2 (pouca
serrapilheira) e outra com 10 a 20 litros por m2
(muita serrapilheira) dentro de uma mesma rea
de 10 x 10 m. Neste desenho, o efeito das diferenas de umidades seria praticamente eliminado (pelo menos extremamente reduzido), pois
teramos locais com pouca e muita serrapilheira

92

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

em locais secos e em locais midos. A abordagem em blocos no reduziria apenas o efeito da


umidade, mas de todas as variaes espaciais
e temporais entre blocos. Quanto menores forem os blocos (em termos espaciais ou temporais) em relao ao tamanho da rea/ tempo do
estudo, mais efetivo o controle dos blocos sobre
variveis de confundimento em geral.

das variveis em estudo, no a todas as variveis externas, pois algumas podem estar controladas.
Do ponto de vista estritamente lgico, a abordagem ao acaso no estudo de relaes seria perda de tempo, pois sempre poderia haver variveis de confundimento em que sequer pensamos. Entretanto, testar hiptese no s um
jogo matemtico, nosso conhecimento de biologia tambm conta. Normalmente conhecemos o
sistema que estudamos o suficiente para imaginar quais so as principais candidatas a variveis de confundimento. Em um estudo sobre o
efeito de um nutriente sobre o crescimento de
plantas precisamos suspeitar do efeito da sazonalidade climtica, no nos preocupamos muito
com um efeito da lua e consideramos irrelevantes eventuais alteraes no campo magntico
da terra. Se pudermos controlar as variveis
externas relevantes das formas descritas na
seo 6.4, podemos assumir que um resultado
significativo realmente corrobora a nossa hiptese alternativa.

A abordagem com blocos com nveis de VR


pr-definidos so menos comuns. Nenhuma
varivel manipulada, mas os valores das subunidades amostrais so escolhidos. A opo
por fixar a VR recomendada em estudos nos
quais a varivel preditora no pode ser manipulada (no experimental) e que tem valores da
varivel resposta que raramente so diferentes
de zero. Por exemplo, se queremos estudar
fatores de risco para Doena de Chagas associados a fazendas com extrao de aa, que
algo pouco frequente, mas grave, podemos
comparar blocos constitudos por fazendas onde houve registro de Doena de Chagas e uma
fazenda vizinha onde no houve. Comparando
estes pares quanto ao uso de tela na casa,
cuidados em lavar os frutos de aa, etc, podemos ter um levantamento bastante objetivo dos
fatores de risco. Sem uma abordagem pareada,
teramos diversos costumes regionais de uma
rea endmica que poderiam ser confundidas
com comportamentos de risco.
O problema de fixar a varivel resposta que
provavelmente no teremos balano para os
valores da maioria das variveis em risco selecionadas. Provavelmente seja mais apropriado
considerar esta abordagem como uma boa ferramenta de levantar fatores de risco do que
como um teste que comprova relaes consequentes.

H diferentes tipos de amostragens ao acaso.


Imagine um estudo sobre tamanho de bromlias
e a proporo de espcies predadoras na fauna
associada gua acumulada entre as suas
folhas. Voc pode escolher: a) as primeiras 20
bromlias que encontrar, todas prximas entre
si; b) numerar 1000 bromlias e sortear 20;
c) montar um grid na rea de estudo e pegar
as bromlias localizadas mais prximas s 20
esquinas deste grid. Cuidado, embora o grid
seja uma otimizao da distribuio de amostras em uma rea, no um controle sistemtico de nenhuma varivel no sentido da seo
6.4.

Amostragem de Nveis Livres

Depois de ter controlado as variveis de risco


mais importantes, a princpio desejvel se
posicionar as unidades amostrais o mais distante possvel umas das outras, mas considerando
restries inerentes ao estudo como o custo
associado distncia entre as coletas. Outro
critrio de distncia mnima biolgico, a distncia entre unidades amostrais em um estudo
de caros no precisa ser tanta como o que

Nas amostragens de nveis livres, ou amostragens ao acaso, tanto VI como VR possuem


nveis livres. Lembre que ao acaso no tem
um sentido de aleatria (por sorteio) e nem tem
o sentido de uma amostra representativa da
populao. O termo nveis livres refere-se
unicamente liberdade dos valores nos nveis

93

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

necessrio para um estudo de aves. A aleatorizao menos recomendvel do que uma amostragem sistemtica como um grid. Outro
critrio o da autocorrelao espacial ou temporal, em que se avalia se a varincia entre
valores vizinhos menor do que a varincia
geral, indicando que a distncia entre unidades
amostrais precisa ser aumentada. Avaliaes
grficas de ausncia de autocorrelao podem
ser importantes complementos aos testes.

apenas dois lagos para comparar o efeito do


tipo de gua sobre a abundncia de peixes, e
chamamos a isto de pseudo-replicao. A
pseudo-replicao um problema porque as
medidas obtidas em um mesmo lago tendem a
ser semelhantes por compartilharem valores de
vrias variveis externas, de forma que no so
representativas da variao que temos dentro
de cada nvel da varivel preditora. Por exemplo, por acaso, este lago de gua preta secou
h 3 anos, e a populao de peixes ainda no
voltou ao normal, de forma que teremos vrias
medidas de abundncia baixa para representar
os lagos de gua preta. Este um exemplo
extremo de problema de proximidade de unidades amostrais. Se tivssemos 5 lagos de cada
tipo, mas considerssemos cada dia de coleta
como uma amostra preditora, teramos tambm
uma pseudo-replicao (chamada de pseudoreplicao sacrificial). E se tirssemos medidas dirias de abundncia de mosquitos contra
medidas dirias de precipitao, teramos pseudo-replicao temporal, pois tanto a abundncia
de mosquitos como a chuva tendem a ser semelhantes de um dia para outro.

6.9 Independncia pela distncia


Vimos que independncia entre unidades amostrais significa que as medidas das variveis
respostas foram obtidas em um contexto de
coleta de dados em que o efeito de todas as
variveis externas foi: a) anulado pela atribuio
aleatria dos nveis da varivel preditora (abordagem experimental); ou b) suficientemente
(ser?) reduzido por um desenho quase experimental, ou em blocos ou com intercalao de
nveis da VI; ou c) reduzido pelo controle de
cada uma ou mais das variveis externas consideradas relevantes por estratgias de fixao
univalor, fixao balanceada multivalores ou
incluso da varivel na anlise.

O que fazer para lidar com esta questo da


distncia? Se temos um experimento de campo,
isto , a varivel preditora for manipulvel, en-

Entretanto, estas abordagens no resolvem


todos os problemas. H situaes em que no
podemos controlar devidamente variveis externas que variam no tempo e no espao.
Normalmente, quanto mais prximas estiverem
duas Unidades Amostrais (no tempo e no espao), maior a chance delas estarem sob os
mesmos valores de diversas variveis externas
de potencial confundimento. A composio da
fauna de solo a 1 m da lagoa tende a ter mais
semelhana com a fauna encontrada a 2m do
que com a fauna encontrada a 100m da lagoa.
No s porque a lagoa influi sobre as condies da sua vizinhana, h muitas razes Para
a semelhana, por exemplo, formigas do mesmo formigueiro sero capturadas em duas unidades amostrais to prximas.

Figura 11- Desenhos amostrais mostrando a disposio


dos nveis da varivel independente (e. g. preto=
tratamento e branco=controle). Considerando a
possibilidade de um efeito espacial em gradiente, algumas
opes so recomendveis e outras deveriam ser evitadas
(Hurlbert, 1984).

No estudo 5 da seo 6.2 apresentamos uma


situao extrema de vrias medidas feitas em

94

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

to temos as possibilidades da figura abaixo,


sendo a abordagem por blocos aleatrios a
mais recomendada, e a completamente aleatrioa e a sistemtica como boas. As outras abordagens so consideradas de forte risco de confundimento.

ente para determinar distncias suficientes para


definir unidades amostrais independentes. Entretanto, tambm comum os pesquisadores
subestimarem o poder da estatstica em detectar efeitos sutis de variveis externas de confundimento.

Se a varivel preditora no for manipulvel (estudo no experimental), podemos utilizar a estratgia de escolher os valores naturais dos
nveis por intercalao ou com os nveis da
Varivel preditora ou da Varivel resposta organizados em blocos.

Neste captulo apresentamos uma srie de tcnicas para reduzir a chance de variveis externas obscurecerem os efeitos da varivel preditora, ou pior, gerar relaes esprias. A diretriz
mais genrica que devemos planejar cuidadosamente e com bom senso. Como foi dito antes,
a validao interna uma fase crtica de um
trabalho. Vale a pena pensar bem antes de
comear para no ter que recomear.
.

Se houver limitaes em um estudo no experimental que impressa a organizao em blocos,


a opo se manipular as distncias. Mas a
que distncia podemos considerar que nossas
unidades amostrais so independentes? As
respostas para esta pergunta diferem muito em
funo dos contextos possveis para um estudo.

Exerccios:
6.1- A independncia entre unidades amostrais uma expresso infeliz para descrever
uma premissa de testes estatsticos. Explique
por que a expresso no apropriada e qual a
independncia que premissa para qualquer
teste estatstico.

a) Se voc no tem limitaes de custos de


deslocamento, mas tem limitao de tamanho
da rea de estudo e de custo por medida em
cada unidade amostral, simplesmente distribua
suas unidades da forma mais regular possvel
(normalmente um grid) para obter a maior distncia mnima possvel entre amostras.
b) Voc pode coletar os dados ao longo de um
transecto e depois fazer teses de autocorrelao espacial (run test) para verificar a que distncia entre unidades amostrais no h autocorrelao.

6.2- D um exemplo de problema com uma


varivel de confundimento diferente dos apresentados na seo 6.2.
6.3- Quais so os tipos de variveis em funo
das suas participaes em uma questo?
6.4- Qual a diferena entre uma amostragem ao acaso e uma amostragem aleatria e
por que apenas a segunda garantia de representatividade.

c) Voc pode coletar os dados ao longo de um


transecto e depois fazer uma anlise grfica
para verificar a que distncia entre unidades
amostrais no h autocorrelao. (Normalmente
a associao entre (b) e (c) mais poderosa.

6.5- Qual a diferena entre uma amostragem


aleatria para caracterizao de uma populao
e uma amostragem utiliza em estudos experimentais?

d) Voc pode partir de premissas biolgicas


para assumir que determinada distncia seguramente suficiente para considerar as unidades amostrais como independentes.

6.6- Explique as categorias de controle no sentido de tratamento

Na prtica, a opo d assumida na maioria


dos estudos no experimentais. Frequentemente, os pesquisadores tm conhecimento sufici-

6.7- Explique as categorias de controle no sentido de funo

95

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

6.8- Explique as categorias de controle no sentido de Estratgia


6.9- Qual a diferena entre uma abordagem
experimental e uma abordagem quase experimental.
6.10- Explique as diferentes categorias de estudos no experimentais com nveis fixos multivalores
6.11- Explique as diferentes categorias de estudos no experimentais com nveis livres
6.12- Faa um mapa conceitual de um problema
relacionado com uma pesquisa que voc realizou, est realizando ou pensa em realizar.
6.13- Analise no seu mapa da questo os tipos
de variveis conforme a seo 6.3.
6.14- Descreva trs formas diferentes de coletar
os dados eliminando o risco de confundimento
para o estudo 1 da seo 6.2
6.15- Considerando os custos e tempo de mobilidade, como proceder no estudo 2 da seo 6.2
para obter uma avaliao vlida da forma como
varia a abundncia de peixes entre Per e Belm?
6.16- Como poderamos coletar os dados no
problema 3 da seo 6.2 e efeito da ordem dos
exames sobre a relao entre temperatura e
aproveitamento da prova?
6.17- Considere para o estudo 5 que voc agora
vai trabalhar com 5 lagos de gua branca e 5
lagos de gua preta com 5 redes de pesca em
cada lago e duas ocasies de coleta. Monte
uma tabela EPR para avaliar a se o tipo de gua influi sobre a abundncia de peixes.

96

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

teste; f) Escolhas na definio dos nveis das


variveis em estudo. Evite perguntas desnecessariamente complexas a primeira diretriz para
se chegar a um resultado significativo. Algumas
limitaes de poder esto relacionadas a custos, como o tamanho amostral, a preciso da
medida e algumas das aes para reduzir rudos. Entretanto, pode se ganhar poder (a baixo
custo) com escolha de testes apropriados, escolhas certas nas definies de nveis das variveis (este captulo) e com um bom planejamento amostral..

7. Maximizando o poder do
teste
Segurana, custo e poder. Estas so as trs
preocupaes para se aperfeioar um carro de
corrida. As pessoas que apenas assistem s
corridas pensam que a nfase est em conseguir um carro mais potente (veloz). Entretanto,
no d para usar uma turbina se o carro nem
fosse conseguir fazer curvas; o piloto precisa
chegar vivo para ganhar o campeonato. A segurana a prioridade. O outro fator bvio o
custo. Por isto, o desafio ter criatividade para
superar limitaes tecnolgicas e aumentar o
poder sem comprometer a segurana e dentro
dos recursos que temos.

7.1 Testes unicaudais


bicaudais

testes

Quando uma questo tem duas possibilidades


opostas de resultado, e valores extremos em
qualquer das duas direes forem resultados
relevantes, ento necessitamos um teste bicaudal. Por exemplo, homens e mulheres usam a
droga crack com a mesma frequncia? Uma
frequncia significativamente maior de homens
um resultado to relevante como uma frequncia significativamente maior de mulheres.
No teste bicaudal, a hiptese nula sempre a
negao de uma diferena (e. g. Ho= no h
diferena entre sexos no consumo de crack).

Algo semelhante ocorre com nossos testes


estatsticos, queremos o mximo de segurana
(menor chance de erro tipo I) e o mximo de
poder (menor chance de erro tipo II) dentro das
nossas limitaes de custos (em dinheiro, tempo, pacincia) e dentro de limitaes relacionadas com aspectos intrnsecos do estudo (limites
fsicos ou tcnicos, questes ticas, etc). A
chance de erro tipo I definida a priori ao escolhermos um (nvel de significncia) e sua segurana est garantida se as premissas da
independncia das amostras (captulos 3 e 6) e
dos testes forem vlidas. Aps os cuidados com
o erro tipo I, nossas preocupaes devem recair
na reduo do erro tipo II. Evitar o erro tipo I
to importante como garantir a segurana do
piloto. Evitar o erro tipo II to importante como
tornar o carro competitivo. Esta analogia mostra
que o erro tipo II tambm uma preocupao
relevante, mesmo que no seja definido a priori,
o erro tipo II deve ser minimizado.

Por outro lado, quando uma questo tem duas


possibilidades opostas de resultado e apenas
em uma direo os valores extremos tm relevncia, ento necessitamos um teste unicaudal.
Por exemplo, esta substncia X reduz a febre
de pacientes? (i.e. tem potencial para ser utilizado como remdio anti-trmico?). A princpio,
haveria duas possibilidades de resultados significativos, uma reduo maior no grupo tratado
com a substncia e uma reduo maior no grupo controle. Entretanto, uma reduo maior no
grupo controle no um resultado relevante
para quem busca um anti-trmico, seja ele devido a um mecanismo real de aumento da febre
ou devido ao acaso estatstico de obter valores
maiores de reduo de temperatura no grupo
controle. Apenas a reduo significativa da febre no grupo tratado um resultado relevante
neste caso. No teste unicaudal, a hiptese nula

O poder de um teste sua capacidade de rejeitar uma hiptese nula, isto , quanto mais poderoso for um teste menor a chance de levar a um
erro tipo II. Contribuem para um maior poder:
a) Perguntas mais objetivas; b) Um maior tamanho amostral; c) Medidas mais precisas;
d) coletas feitas de forma a limitar o rudo (variao no tendenciosa de variveis que no so
o objeto do estudo); e) Maior poder no tipo do

97

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

sempre a negao de uma desigualdade


(maior ou menor- e. g. Ho= A reduo de temperatura no grupo tratado no maior do que a
reduo de temperatura do grupo controle).

mos VR e VI, temos Variveis de Medidas Repetidas (VRM1 e VRM2).


O teste pareado parece um teste de duas variveis, mas um teste com uma nica varivel, a
diferena (quantitativa, ordinal ou binria) entre
os valores das variveis de nveis. Em nosso
exemplo, a diferena de nota entre Gluglu e
Gostoso, que ser positiva se Gluglu tiver melhor nota e ser negativa se Gluglu tiver menor
nota. A hiptese nula que as notas no sero
significativamente diferentes, isto , que a diferena no ser significativamente diferente de
zero.

A opo por testes unicaudais ou bicaudais


ocorre em contextos que pedem determinados
testes. Por isto, os testes binomiais de uma e
duas propores, o Fisher exact test, o Teste
T simples, de duas amostras e pareado e testes Z tm as opes de uma ou duas caudas
enquanto tabelas de contingncia, ANOVA e
testes de Correlao no tm esta opo. Por
ser uma opo, podemos dizer teste unicaudal
ou teste na opo unicaudal. Quando a questo pede a opo unicaudal e utilizamos a
opo bicaudal, perdemos poder no teste desnecessariamente. Por outro lado, ao utilizarmos
a opo unicaudal, no teria sentido discutir um
resultado na direo oposta da hiptese alternativa.

Se a distribuio das diferenas for semelhante


a uma curva normal (ver seo 3.3- Anlise de
normalidade em testes), o teste utilizado o
teste T pareado (ou o teste T simples sobre as
diferenas). Se a distribuio das diferenas
no for semelhante a uma curva normal, a alternativa a utilizao do teste Wilkoxon Pareado. Se no houver diferenas quantificadas,
mas apenas uma diferena categrica (Gluglu
preferido ou Gostoso preferido ou empate),
elimina-se os dados do empate e aplica-se um
Sign test, que equivalente a um teste de
proporo com hiptese nula que nenhum deles
difere estatisticamente de 50% das preferncias.

7.2 Testes pareados e testes em


blocos
Qual o refrigerante preferido pelos estudantes,
Gluglu ou Gostoso? Vamos ver. Abordagem 1: Pegue 40 pessoas e oferea para cada
uma um copo de refrigerante de uma das marcas e pea para dar uma nota de zero a dez.
Abordagem 2: peque 20 pessoas e d a cada
uma delas um copo com Gluglu e um copo com
Gostoso (sem identificao) para elas darem
notas para cada um (a ordem sorteada e a
pessoa est vendada). O primeiro procedimento
ilustra um teste no pareado e o segundo ilustra
um teste pareado.

Qual abordagem mais poderosa, a pareada


ou a no pareada? Em primeiro lugar, nem todos os problemas podem ser abordados com
testes pareados. Voc no pode pegar um animal do sexo masculino, medir seu tamanho,
trocar o sexo dele e medir seu novo tamanho.
Para avaliar a existncia de dimorfismo sexual
em tamanho somos obrigados a utilizar uma
abordagem no pareada. Em situaes como o
exemplo do refrigerante acima, as duas abordagens so vlidas, entretanto, o teste pareado
normalmente mais poderoso porque as pessoas diferem muito em critrios, algumas pessoas so muito crticas, e daro notas baixas
para as duas, outras muito generosas e daro
notas altas para as duas. A abordagem pareada
ganha fora neste caso porque diminui a chance de se perder a sutileza em meio variao

Para a tabela EPR temos pessoa como entidade nos dois procedimentos, mas as propriedades do primeiro so a varivel preditora Refrigerante (Gluglu ou Gostoso) e a varivel resposta
Nota (0 a a 10), enquanto na segunda abordagem as propriedades so uma varivel para a
primeira coluna Nota do Gluglu (0 a 10) e uma
varivel para a segunda medida (nota do Gostoso (0 a 10). Na segunda abordagem no te-

98

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

entre pessoas. Se o crtico pegar um refrigerante e o generoso pegar o outro, esta diferena
no ser tendenciosa, mas adicionar varincia
anlise, reduzindo o poder do teste.

ro de baratas. Na abordagem pareada, a unidade amostral seria um par de quadrados de 1m2,


um medido de dia e outro medido de noite.
uma abordagem duas vezes mais cara em
termos de m2 por unidade amostral. Se as diferenas entre o nmero de dia e o nmero de
noite for sutil quando comparada diferenas
espaciais entre nmero de baratas, a abordagem pareada ser mais poderosa. Se as diferenas espaciais forem pequenas, ento a abordagem no pareada pode chegar a ser duas
vezes mais poderosa que a pareada. A amostragem pareada tambm mais vantajosa em
estudos observacionais em que h dvidas
sobre a independncia das unidades amostrais.
Retornaremos a isto no captulo 6.

Entretanto, suponha que o custo do estudo seja


nos copos de refrigerante e que as pessoas no
diferem muito em critrios. Neste caso, a abordagem pareada ter um custo duas vezes maior, ou, se fixarmos por custo, teremos que reduzir o nmero de pessoas, o que reduz o poder
do teste.
necessrio cuidado para no confundir a Unidade Amostral em estudos pareados e em estudos no pareados. Suponha que voc queira
saber se baratas so mais abundantes na serrapilheira da mata de noite ou de dia. Em uma
abordagem no pareada, cada unidade amostral seria um quadrado de 1m2, as propriedades
seriam perodo da coleta (dia ou noite) e nme-

Voltemos ao exemplo do refrigerante, o que


aconteceria se dssemos mais de dois tipos
para as pessoas experimentarem? O teste pareado um preparo conceitual para a aborda-

99

Figura 7.1- Esquema de desenho em bloco com 4 "subunidades" amostrais por bloco.

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

gem em blocos que


tem mais de dois nveis. Como dissemos
acima, nos testes
pareados temos dois
nveis da varivel
preditora
implcita.
Quando temos mais
nveis, ento temos
uma ANOVA de medidas repetidas e um
planejamento amostral em blocos. As
abordagens pareadas
e em blocos so abordagens fortes em termos
de evitar relaes inconsequentes esprias
(seo 2.4) que sero discutidas no captulo 6.
Entretanto, elas dependem de algumas condies que sero discutidas naquele captulo.

Figura 12- Classificao dos tipos de nveis de variveis.

momento, concentremo-nos na diferena entre


nveis fixos e livres atravs de exemplos.

7.3 Nveis fixos e nveis livres

Definies: Uma varivel preditora tem Nveis


Fixos se os valores dos nveis foram selecionados para o teste e Nveis Livres se os valores
no foram selecionados, isto , se foram determinados ao acaso ou livremente.

Uma classificao de nveis importante para


diferenciar diretrizes ligadas ao poder de testes,
para diferenciar clculos de probabilidade em
ANOVA, para determinar tipos de regresses e
para questes relacionadas ao planejamento
amostral (captulo 6).

Exemplo:
Problema 1- A pureza do caf difere entre as
marcas A, B, C. D e E?
Problema 2- A pureza do caf varia entre marcas? [Voc escolhe ao acaso (livremente) 5
marcas de caf (A, X, F, T e M) para representar todas as marcas.]
Problema 3- A produtividade do feijo muda ao
se adicionar 0 (controle), 2 e 4 mg de Nitrognio
ao solo?
Problema 4- A produtividade do feijo diferente em funo da concentrao de nitrognio no
solo (valores de campo variando ao acaso ou
livremente entre 0 e 4 mg de N).
Os problemas 1 e 2 e os problemas 3 e 4 parecem iguais, mas no so. Nos problemas 1 e 3
os valores dos nveis so definidos e fixos pelo
pesquisador e nos problemas 2 e 4 eles so
valores "ao acaso".

Antes um esclarecimento. Usamos o termo


Nveis livres ao invs do termo mais utilizado
Nveis ao Acaso ou Nveis Aleatrios pois o
primeiro mais claro porque: a) livre antnimo de fixo, o que facilita a compreenso do
conceito; b) nveis livres no so rigorosamente
aleatrios (no so obtidos por sorteio), embora
possam ser considerados ao acaso (ver diferena na seo 6.4); c) Porque este termo gera
menos confuso. O sentido de ao acaso em
nveis pode ser confundido com o sentido de
ao acaso na amostragem ao acaso e na
atribuio de nveis ao acaso. Por exemplo,
veremos na seo 6.1 que podemos atribuir
nveis fixos ao aaso para uma unidade amostral em um experimento, mas no possvel
atribuir nveis livres ao acaso para uma unidade
amostral (dizer nveis ao acaso atribudos ao
acaso seria algo confuso em um assunto que j
tem alguma complexidade intrnseca). Para o

Podemos ter nveis fixos em um nico valor,


como vimos no captulo anterior para o controle

100

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

de variveis externas, ou com diferentes valores


pr determinados da varivel preditora para
analisar o efeito na varivel resposta. Nveis
multivalores da varivel preditora podem ter os
valores atribudos aleatoriamente ou sistematicamente. Nveis livres so sempre multivalores
ao acaso. Os nveis fixos multivalores tambm
podem ser divididos na forma como feita a
atribuio do valor em Nveis Fixos por Manipulao, na abordagem Experimental (ex. duas
concentraes de uma droga que foram injetadas em ratos) e Nveis Fixos por Seleo, na
abordagem no experimental (e. g. a comparao de lagos com dois tipos de gua para ver
qual tipo tem maior abundncia de peixes.

7.4 Relaes retilineares, curvilineares


e monotonicidade.
Quando temos uma relao entre duas variveis que so ordinais ou quantitativas, esta
relao pode ser descrita por uma linha em um
grfico EPR, e esta relao denomina linear.
Se uma reta descreve esta relao apropriadamente, ela chamada retilinear, do contrario
teremos uma relao curvilinear. Se a relao
for sempre ascendente ou sempre descendente,
ela chamada de tendncia monotnica. Se ela
no tiver esta caracterstica, sendo ocasionalmente ascendente e ocasionalmente descendente (e. g. situaes com timos ou situaes
cclicas), ela chamada de tendncia varivel.

Varivel dependente

A distino em nveis fixos e livres no afeta o


clculo da probabilidade no caso de variveis
categricas em testes de ANOVA com uma
nica varivel preditora, ou no caso de testes de
7.5 O poder e os tipos de teste
ANOVA com mais variveis preditoras que possuam balano prefeito. Em uma ANOVA com
As diretrizes para maximizar o poder de um
mais de uma varivel preditora sem balano e
teste, incluindo as mostradas nas sees antecom alguma das variveis com nveis livres,
riores e outras que sero discutidas agora esto
necessria a utilizao de uma ANOVA Modelo
resumidas na figura 7.4.
II ou Modelo III. No vamos nos aprofundar
neste caso, pois no uma situao muito coa) Utilize os testes paramtricos (Teste
mum, entretanto, essencial
que o usurio de estatstica
20
Tendncia monotnical
reconhea quando a situao
Tendncia varivel
no permite uma ANOVA tradicional (Modelo I) e procure se
informar como agir (e. g.
www.matstat.com/ss/).
10
Esta distino tambm importante no caso de variveis preditoras quantitativas. O teste de
uma regresso retilinear no
afetado pelo tipo de nvel, mas
0
a reta que descreve a relao
0
10
20
30
40
s pode ser calculada por mnimos quadrados (Modelo I) se
Varivel Independente
a varivel for fixa. Se for uma
Figura 13- Quatro tipos de relaes monotnicas (azuis) e dois evarivel com nveis livres devexemplos de relaes com tendncias variveis.(vermelho).
se utilizar um mtodo diferente,
por exemplo, por iterao (Modelo II). O mesmo se aplica a
regresses curvilineares.

101

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

T,Anlise de Varincia, e Regresso Retilinear/


Correlao) quando as premissas destes testes
estiverem sendo atendidas. Se estas premissas
no forem satisfeitas considere a possibilidade
de transformar os dados. Se ainda assim no
atender as premissas, utilize os equivalentes
no paramtricos (Testes Mann-Whitney, Kruskal-Wallis e correlao de Spearman). No se
preocupe muito com as situaes intermedirias, os testes paramtricos so relativamente
robustos e que os testes no paramtricos normalmente no so muito menos poderosos, de
forma que os dois so aplicveis (sees 3.3 e
3.4).

rado com a variao entre unidades amostrais


que seriam utilizadas em um teste no pareado
(do contrrio prefira uma abordagem no pareada- seo 4.2);
d) Limite os testes mltiplos. Como foi dito no
captulo anterior, testes mltiplos requerem
correes no nvel de significncia, o que leva a
uma reduo brutal no poder de um conjunto de
testes A limitao do nmero de testes uma
forma recomendvel de se lidar com este problema. Ao invs de realizar um teste para 100
espcies, escolha apenas as 10 melhor amostradas ou 10 que apresentem um interesse especial. Outra abordagem seria repetir o estudo
apenas com as espcies nas quais o Ho foi
rejeitado e ver se acontecem os mesmos resultados. Se o mesmo resultado significativo
para uma espcie em dois testes independentes, ento ele provavelmente verdadeiro. (seo 4.3)

b) Use testes unicaudais em questes que pedem esta opo;


c) Use testes pareados ou em blocos quando a
questo permite sua utilizao e quando o fator
em estudo tenha um efeito sutil quando compa-

Figura 14 Resumo das diretrizes para maximizar testes estatsticos (ver texto).

102

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

mais poderosa do que atribuir s trs categorias


ordinais (arenoso, intermedirio e argiloso).

7.6 O poder e os nveis das variveis


em estudo

e) Restrinja os nveis categricos ao mnimo


necessrio, se possvel, utilize binrio. complicado trabalhar com variveis respostas categricas. De forma geral, se ganha poder ao se
transformar esta varivel em binria por aglutinao ou por excluso de nveis, mesmo com a
perda de informao, devido ao ganho em objetividade. Se tiver que trabalhar com categricas
com mais de dois nveis, quanto menor o nmero de nveis mais poderoso o teste. Isto ocorre
porque nas variveis o aumento do nmero de
nveis no implica em mais preciso, ao contrrio, implica em uma questo menos objetiva.

A influncia dos tipos e nmero de nveis das


variveis em estudo diverge para as variveis
respostas e as preditoras com nveis livres por
um lado e para as variveis preditoras com
nveis fixos por outro.
4.7.1- Variveis respostas e variveis preditoras
com nveis livres
a) D prioridade a medidas quantitativa com
relao s ordinais. Por exemplo, evite valores
como Arenoso se puder medir a porcentagem
de areia no solo.
b) D prioridade a medidas ordinais com relao s categricas. Isto , se sua varivel resposta possuir categorias com uma ordem relevante para a questo, evite trat-la como se
fosse categrica; na chave de testes, entre como ordinal. A perda de informao ao omitir a
ordem dos nveis resulta em perda de poder.

4.7.2- Variveis preditoras com nveis fixos


Quando a varivel preditora for fixa, ento ela
pode, e deve ser manipulada no nmero e nos
valores da escala de medida em funo dos
seus objetivos.
Se a varivel preditora tiver escala quantitativa
ou ordinal, temos a flexibilidade de determinar
quais sero os valores da escala de medida
(nveis fixos multivalores). Se o objetivo principal for determinar se existe uma relao, havendo a certeza que esta relao s poderia ser
monotnica, ento o mximo poder obtido
utilizando apenas dois valores extremos. Por
exemplo, se tivermos 20 vasos e quisermos
saber se a granumolometria do solo afeta o
crescimento de uma planta, e acreditssemos
que a relao seria monotnica, o melhor seria
plantar 10 plantas com 0% de areia e 10 plantas
em 100% de areia.

c) Quanto maior o nmero de nveis quantitativos (= preciso) maior o poder do teste. Evite
medidas grosseiras se puder ter medidas mais
exatas. Especialmente crticas so as medidas
com menos de 10 nveis na varivel resposta.
Entretanto, no precisa exagerar na preciso,
pois a relao custo da preciso e benefcio em
ganho de poder no retilinear. Se voc obtiver
mais de vinte nveis com seu velho pHmetro
com duas casas decimais, fique tranquilo, no
h necessidade de comprar um pHmetro dez
vezes mais caro para ganhar mais uma casa
decimal. E lembre-se, mais importante do que a
preciso de um aparelho que ele esteja adequadamente calibrado.

Se o objetivo principal for a descrio da forma


da relao, ento a melhor descrio obtida
com o maior nmero de nveis possvel, mas se
perde um pouco do poder. Se o objetivo for uma
descrio aproximada com um poder mdio,
pode-se utilizar um nmero de nveis mediano.
Neste caso, amostras preliminares seriam necessrias para se definir quais seriam estes
nveis, levando-se em conta a forma da curva
definida preliminarmente. Seguindo o exemplo

d) Quanto maior o nmero de nveis ordinais,


maior o poder do teste. Se no puder utilizar
nveis quantitativos, utilize o mximo de nveis
ordinais que puder. Por exemplo, se quiser ver
o efeito da frequncia de plantio sobre a granulomentria do solo (em ordinal), ordene as amostras em ordem da porcentagem de areia e numere as posies. Esta abordagem seria muito

103

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

do pargrafo anterior, Se quisssemos descrever a relao, utilizaramos 0, 5, 10, 15, ...95,


100% de areia. Uma abordagem intermediria
seria utilizar 0, 0, 0, 0, 25, 25, 25, 25, ... 100,
100, 100, 100.

de cabea+enjo-> mal estar). Um exemplo


extremo: duas variveis quantitativas como
tamanho de tartarugas e nmero de ovos podem ser transformadas em tamanhos grande
ou pequeno e em nmero de ovos muitos ou
poucos. A anlise ser mais grosseira, mas
no est errada. O contrrio no recomendado ou no possvel, por exemplo, errado se
utilizar testes paramtricos em situaes que
exigem testes no paramtricos e no se pode
transformar uma varivel categrica no ordinal
em uma ordinal.

Caso no haja certeza que a relao seria monotnica, ento a prioridade obrigatoriamente
a descrio da relao, mesmo que nosso interesse seja sobre a existncia da relao.
Quando a varivel for de natureza categrica
(no ordinal), ento, quanto menor o nmero de
nveis mais poderoso tende a ser o teste. Aqui,
naturalmente depender de quais nveis entraro na anlise. Por exemplo, se queremos comparar a eficincia de diferentes marcas de rao, um teste com muitas marcas ser pouco
poderoso, enquanto um teste comparando apenas duas marcas ser mais poderoso para um
mesmo nmero de amostras. Digamos que a
marca A seja a melhor e a marca B seja a pior.
A incluso de 10 marcas pode levar-nos a aceitar a hiptese nula que a ausncia de diferenas entre marcas. Comparaes aos pares tm
maior poder individualmente, mas a comparao conjunta de cada par possvel constitui
testes mltiplos. Da mesma forma que foi sugerido com os testes mltiplos, a abordagem mais
poderosa seria escolher poucas comparaes
com base em amostras preliminares ou algum
outro critrio relevante.

Redues de poder normalmente devem ser


evitadas, porque costumam ser desvantajosas.
Entretanto, h situaes em que podemos reduzir o poder em um aspecto da anlise para
melhor-la no seu conjunto, por exemplo: a) no
caso de testes mltiplos em que alguns dos
testes tm as premissas para estatstica paramtrica e outros no, melhor utilizar testes
no paramtricos em todos por uma questo de
padronizao; b) Quando h um forte desbalano no numero de medidas entre os nveis da
varivel preditora; c) Quando houver critrios
racionais para a fuso de categorias de uma
varivel categrica de forma a se aumentar o
poder do teste; d) no caso de uma transformao de uma varivel ordinal de poucos nveis (3
ou 4) em uma categrica com os mesmos nveis
porque a diversidade de ferramentas estatsticas para anlises categricas bem maior e a
perda de poder no muito grande neste caso;
e) nos casos em que a varivel resposta for
categrica (no binria) e a preditora for quantitativa ou ordinal, porque no h testes simples
diretos para estas situaes (ver tabela de testes); f) em testes no paramtricos de ranqueamento com muitos valores zero (>20% dos
valores) na varivel resposta mais apropriado
trabalhar com presena-ausncia (mas ainda
melhor seria usar um teste de permuta).

7.7 Perdas voluntrias de poder


sempre possvel se manipular os dados na
direo de uma reduo do poder da analise.
Testes no-paramtricos podem substituir testes paramtricos. Perguntas unicaudais podem
ser testadas com testes bicaudais. Variveis
quantitativas podem ser tratadas como ordinais
ou como categricas (perda de informao).
Variveis ordinais podem ser tratadas como
categricas. Medidas quantitativas com alta
preciso podem ser arredondadas, o que reduz
o nmero de nveis. Nveis ordinais seguidos
podem ser aglutinados (bom+muito bom-> satisfatrio); variveis categricas podem ser aglutinadas por algum critrio de semelhana (dor

7.8 Testes mltiplos


Quando realizamos testes mltiplos para a
mesma questo genrica, alguns autores defenderam que o nvel de significncia () deveria ser corrigido porque a chance de rejeio

104

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

inapropriada da hiptese nula (erro tipo I)


multiplicada pelo nmero de testes. Por exemplo, quando testamos se a espcie 1, a espcie
2, e a espcie 100 so sensveis uma determinada substncia baseado em 100 experimentos, se rejeitarmos Ho para 10 espcies utilizando um nvel de significncia de 5%, ento, teremos cerca de 5 falsos positivos e, portanto,
apenas cerca de 5 seriam positivos verdadeiros.
Cerca da metade das espcies consideradas
sensveis seriam falsos positivos ou relaes
esprias, no devido a uma relao inconsequente, mas devido ao aumento do risco resultante do excesso de testes.

teste, pois estaramos desconsiderando que


alguns testes levam a positivos verdadeiros) ,
que podemos estimar pelo Bonferroni sequencial) em =0,05. Entretanto, a maioria das pessoas tende a considerar cada teste como um teste
independente. Por isto, no caso de tabelas com
uma sequncia de testes relacionados, considero recomendvel se apresentar uma coluna com
P (probabilidade calculada) e outra com a confirmao da significncia do teste aps uma
correo semelhante de Rice (1989). Isto
ajuda a dar uma referncia de probabilidade
dentro de um determinado contexto.
Em segundo lugar, devemos pensar bem antes
de multiplicar desnecessariamente o nmero de
testes em um estudo. Os crticos das correes
esto certos ao dizer que no existem limites
lgicos para correes de testes mltiplos fora
de tabelas. Por outro lado, a credibilidade de um
positivo em cinco testes certamente menor
que a de um positivo em 50 testes. A valorizao da estatstica nos ltimos anos acentuou a
tendncia a se multiplicar exageradamente o
nmero de testes dentro de cada estudo, s
vezes para todas as perguntas logisticamente
testveis, sejam elas relevantes ou no. Os
cursos de metodologia precisam enfatizar que
isto um problema e incentivar a atitude de
restringir o nmero de testes aps consideraes tericas ou coletas preliminares. Esta a
atitude mais poderosa, pois reduz o nmero de
testes quando fazemos a correo ou suporta
um mnimo de credibilidade aceitvel se no a
fizermos.

A correo mais simples para testes mltiplos


chamada de Correo de Bonferroni (o nome do
matemtico que a criou) e a diviso do pelo
nmero de testes. Entretanto, se voc tiver 20
testes e um valor inicial de =0,05, o novo
ser 0,001, o que um nvel de significncia extremamente conservador. Rice (1989) recomenda a utilizao de um clculo menos conservador que ele descreve como um Bonferroni
Sequential com um diferente valor de para
cada teste. Ainda uma correo conservadora, mas bem menos, e, portanto, muito til.
Por outro lado, a utilizao de correes em
testes mltiplos foi desaconselhada por alguns
autores (e. g. Moran, 2003; Gotelli & Elison,
2010). Eles questionam a drstica reduo de
poder de testes com as correes e o limite
lgico para o nmero de testes considerados na
correo. Se aplicssemos a lgica da correo
rigorosamente, teramos de corrigir pelo nmero
de testes de todo um artigo? Teramos de corrigir por todos os testes feitos durante a vida de
um pesquisador? Claro que isto seria absurdo.
Eles esto certos. Ento, o que fazer, simplesmente esquecer a questo das correes? No,
a reflexo sobre este problema essencial.

Exerccios

7.1- O que poder de um teste e por que a


preocupao com o poder geralmente secundria na pesquisa, mas ainda assim muito
relevante?

Em primeiro lugar, temos que reconhecer que


h um problema cultural na forma como as pessoas interpretam qualquer conjunto de testes.
preciso aprender a ver conjuntos de testes sabendo que teremos cerca um falso positivo para
cada 20 vezes que rejeitamos Ho (no a cada

7.2- Cite seis aspectos em um estudo que contribuem para um maior poder.

105

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

7.3- Em que situao prefervel utilizar um


teste unicaudal e por que na dvida devemos
utilizar um teste bicaudal?

nveis e por qu? c) em que escala o poder


diminui e por qu?
7.12- Quando os nveis da varivel preditora
so fixos em relaes monotnicas, qual a forma de se obter o maior poder com a escolha
dos nveis?

7.3- D um exemplo de previso de hiptese


unicaudal pareada envolvendo diferenas de
dieta de gmeos e sucesso escolar. Faa uma
tabela EPR para este exemplo.

7.13- Qual o procedimento na escolha de


nveis quando no se sabe qual a forma da
relao

7.4- Faa uma tabela EPR para avaliar se o


nmero de baratas maior em coletas noturnas
comparada com coletas noturnas para um estudo com amostras no pareadas e outra tabela
EPR para realizar a mesma comparao em um
teste pareado. Explicite a entidade em cada
tabela. Quais as vantagens e desvantagens de
cada abordagem?

7.14- Em que situaes recomendvel tomar


atitudes que reduzem o poder de um teste?

7.5- Como decidir se aplicamos um teste paramtrico ou no paramtrico em uma abordagem


pareada?
7.6- O que so testes mltiplos e como realizada a correo no nvel de significncia se
quisermos evitar o aumento global na chance
de erro tipo I?
7.7- Por que estudos experimentais quase sempre tm nveis fixos e estudos observacionais
geralmente tm nveis livres. Cite um exemplo
de estudo observacional com nveis fixos.
7.8- Faa um grfico mostrando uma relao
retilinear, uma relao curvilinear monotnica e
uma relao curvilinear varivel.
7.9- Como varia o poder de um teste em funo
do tipo de teste (paramtrico x no paramtrico;
unicaudal x bicaudal) com uma hiptese nula
unicaudal com as premissas para testes paramtricos vlidas.
7.10- Quando um teste pareado mais poderoso que um no pareado e vice versa.
7.11- Quando os nveis so livres: a) quais as
escalas de medida mais poderosas; b) em que
escalas o poder aumenta com o nmero de

106

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

C. Estratgia Absoluto- Estudo em condies em que apenas a varivel preditora tem


efeito relevante sobre a varivel resposta.
C. E. Aleatorizao VI- Estudo em condies controladas estatisticamente pela atribuio aleatria dos nveis da varivel preditora.
C. E. Sistematizao VI- Estudo em condies controladas estatisticamente pela atribuio sistemtica dos nveis da varivel preditora.
C. E. Blocos VI- Estudo em condies controladas estatisticamente pela atribuio aleatria dos nveis da varivel preditora dentro de
blocos.
C. E. Fixao VE- Estudo em condies
parcialmente controladas estatisticamente pela
fixao dos nveis de uma varivel externa.
C. E. Incluso VE- Estudo em condies
parcialmente controladas estatisticamente pela
incluso de uma varivel externa.
C. Funo Anti-ruido Aes de controle
com a finalidade de aumentar o poder de um
teste pela reduo do efeito aleatrio de variveis externas.
C. F. Anti-tendenciosidade- Aes de controle com a finalidade de aumentar a confiabilidade de um teste pela reduo do efeito tendencioso de variveis externas.
C. de Tratamento Nulo Simples- Amostras
sem tratamento utilizadas para comparar com
amostras que sofreram um determinado tratamento.
C. T. Nulo Processual- Amostras com tratamento parcial utilizadas para comparar com
amostras que sofreram um determinado tratamento completo.
C. T. Nulo Reverso- Amostras com diferentes tratamentos para terem seus efeitos comparados.
Desenho Experimental/ Amostral- Descrio
de parte ou de todos os procedimentos considerados relevantes para garantir as validaes
interna, da medida e analtica em um estudo. O
primeiro termo mais apropriado para estudos
experimentais e o segundo para estudos no
experimentais (i.e. sem manipulao da varivel
preditora)
Entidade- Qualquer coisa que podemos imaginar e que possui propriedades.

8. Glossrio
Abordagem Experimental- Pesquisa na qual
os valores das variveis preditoras so manipulados para verificar seu efeito sobre a Varivel
resposta, em duas condies, com controle
absoluto de variveis externas ou com controle
estatstico por aleatorizao na atribuio dos
nveis da varivel preditora.
Abordagem Quase experimental- Pesquisa
com manipulao dos valores da Varivel preditora para verificar seu efeito sobre a varivel
resposta, mas sem controle absoluto ou estatstico com atribuio aleatria de nveis.
Abordagem No Experimental- Pesquisa sem
manipulao nos valores das variveis preditoras.
Acurcia- o grau de proximidade com a medida verdadeira.
Aleatrio- Por sorteio ou processo equivalente.
No sinnimo de ao acaso.
Alfa ()- Nvel de significncia adotado antes de
realizar um teste estatstico que indica a probabilidade de erro tipo I.
Ao acaso- Devido a um conjunto de pequenas causas preditoras entre si, que se prendem
a leis ignoradas e que determinam um acontecimento qualquer, no sinnimo de aleatrio.
Autocorrelao- Relao entre valores medidos em sequncia espacial ou temporal, por
exemplo, relao entre Xi e Xi+1, onde i a
isima medida.
Balano- Igualdade (balano perfeito) ou semelhana no nmero de entidades para cada nvel
da varivel preditora.
Bloco- Conjunto de unidades amostrais que
funcionam como entidade em uma tabela EPRBloco. Nesta tabela, as linhas so os blocos e
as colunas propriedades em cada unidade amostral.
Contraste- Avaliao a posteriori em uma Analise de Varincia paramtrica ou no paramtrica para determinar quais nveis so significativamente diferentes.
Controle- Diferentes tipos de aes planejadas
para aumentar a confiabilidade e poder de um
teste.

107

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

Escala de Medida- Categoria de tipo de medida


de uma varivel. As principais so binria, categrica, ordinal ou quantitativa.
Estatstica Descritiva- Procedimentos matemticos e grficos que permitem caracterizar
um conjunto de dados e/ou formas de relaes.
E. Inferencial- Procedimentos matemticos
que permitem a tomada de uma deciso sobre a
existncia de uma relao com base em critrios pr determinados.
E. Intuitiva- Processos intuitivos equivalentes estatstica formal utilizados para tomada
de decises cotidianas.
Grfico EPR- Grfico cartesiano com a Varivel
preditora na abscissa, a resposta na ordenada e
pontos representando entidades.
Hiptese- Uma possibilidade de resposta para
uma pergunta com duas ou mais alternativas.
Independncia- Premissa de testes estatsticos
garantida por um desenho experimental apropriado ou assumida por anlise ou por consideraes tericas. Se a premissa de independncia for falsa, o teste no ser confivel.
Independncia pela distncia- premissa que a
distncia entre unidades amostrais suficiente
para tratar as unidades amostrais como se fossem independentes.
Nvel de Medida- Um valor assumido por uma
varivel dentro de um banco de dados.
NM Fixo- Um ou mais valores pr determinados assumidos por uma varivel dentro de
um banco de dados.
NM Fixo Univalor Quando uma varivel tem
um nvel nico pr-determinado.
NM Fixos Univalores Quando uma varivel
tem mais de um nvel pr-determinado.
NM Livre- Quando os nveis de uma varivel
no so pr-determinados.
NM Multivalor- Quando uma varivel tem
mais de um nvel pr-determinado ou no.
NM Unilote- Quando as entidades provm
de um nico lote
NM Multilote Quando as entidades provm
de mais de um lote.
Nvel de Significncia- Ver Alfa.
Preciso- o grau em que conseguimos uma
medida quantitativamente prxima em condies estveis.

Probabilidade: Valor de uma expectativa de


chance de uma determinada ocorrncia.
Propriedades- Atributos que qualificam uma
entidade. Em um estudo, uma propriedade que
varia costuma ser chamada de varivel.
Pseudo-replicao- o uso de estatstica inferencial para testar efeitos de tratamentos com
dados de experimentos que no so replicados
ou quando as replicatas no so estatisticamente independentes
Planejamento Amostral- O mesmo que desenho experimental
Premissa- uma proposio que precisa ser
verdadeira para podermos chegar a uma dada
concluso.
Poder- Em estatstica significa a capacidade
que um teste ou um procedimento tem de rejeitar a hiptese nula quando ela falsa.
Relao: Qualquer tendncia significativa que
exista entre valores de propriedades de algum
tipo de entidade. Com base na existncia de
relaes que podemos fazer previses com
algum grau de certeza.
R. Consequente- A relao existente entre
Duas variveis que esto sobre a mesma linha
de causalidade. Pode ser direta ou indireta, mas
no apenas porque ambas so influenciadas
por uma terceira.
R. Curvilinear- Relao linear entre duas
variveis quantitativas (excepcionalmente ordinais) que significativamente no retilinear.
R. Espria- Uma relao encontrada entre
duas variveis interpretada como relao causal
sem que haja realmente uma relao causal
entre elas. impossvel garantir que no ocorram, mas elas podem ser reduzidas pelo nvel
de significncia assumido (um controle de risco
conhecido), com desenhos experimentais (um
controle contra riscos desconhecidos) e corrigindo os nveis de significncia pelo nmero de
testes (controle de inflao de risco).
R. Inconsequente- Uma relao entre duas
variveis em funo das duas serem influenciadas por uma terceira. Se houver concincia da
falta de causalidade entre as duas variveis, a
relao inconsequente no considerada espria, mas apenas uma correlao.
R. Linear- Relaes descritas por modelos
retilineares, quadrticos, exponenciais, logsti-

108

A Conduo da Anlise 2014/1


Thierry R. Gasnier/ Universidade Federal do Amazonas

cos e outros (GLM), em contraste com modelos


aditivos (GAM) que no abordamos.
R. Retilinear- Uma relao entre duas variveis quantitativas que compatvel com uma
reta.
Resposta Contextual- Resposta baseada em
unidades amostrais com influncia relevante de
fatores contextuais no espao, tempo, filogenia
ou outra condio anloga de posio.
R. Estatstica- Resposta baseada em unidades amostrais independentes sem influncia
relevante de fatores contextuais.
R. Fato- Resposta que encontra sua fora em
apenas uma ou poucas observaes.
R. Sistmica- Ver resposta por coerncia em
rede.
R. por Coerncia em Rede- Resposta cuja
fora ou fraqueza est no grau de coerncia
entre ideias relacionadas tomadas como um
conjunto. O mesmo que Resposta Sistmica.
Tabela EPR- Formato de entrada de dados em
planilhas no qual as entidades esto nas linhas
e as propriedades nas colunas. Cada entidade
aparece apenas uma vez na planilha.
Teste estatstico- Uma deciso sobre a validade de uma hiptese a partir de critrios prestabelecidos utilizando algorrtimos matemticos desenvolvidos para diferentes situaes.
T. Bicaudal- Teste estatstico com hiptese
nula assumindo uma igualdade entre os nveis
da varivel preditora.
T. No Paramtrico- Uma categoria de testes
com premissas menos exigentes, mas com
poder relativamente baixo.
T. Paramtrico- Uma categoria de testes com
premissas mais exigentes, mas poder relativamente alto e alta capacidade de descrio.
T. Unicaudal Teste estatstico com hiptese
nula assumindo uma desigualdade entre os
nveis da varivel preditora..
Transformao de dados- Operaes matemticas frequentemente utilizadas para transformar variveis de forma a se obter condies
dentro de premissas de testes paramtricos.
Varivel: Uma propriedade dentro de um estudo de relaes
V. de Caminho- Variveis que se encontram
entre duas variveis extremas dentro de uma

linha de causalidade e que contribuem para


detalhar o funcionamento de um sistema.
V. Condicionalmente CorrelacionadasDuas variveis que esto correlacionadas sob
ao de uma terceira varivel, no havendo
causalidade entre elas, de forma que fixando a
terceira varivel a relao deixa de existir.
V. de Confundimento- Varivel que influi
sobre a varivel resposta e preditora de forma a
criar uma relao espria entre elas.
V. de Rudo- Varivel obscurece a relao
enter duas variveis, mas que no tem influncia tendenciosa entre elas, isto , no uma
varivel de confundimento.
V. resposta Uma varivel tida hipoteticamente como influenciada pelos os valores da
varivel denominada varivel preditora (o que
ser estabelecido durante o estudo.)
V. Externa- Uma varivel que no est no
modelo em questo, mas que pode interferir
sobre o estudo, seja como varivel de confundimento ou como varivel de rudo.
V. em Estudo- As variveis diretamente envolvidas na questo e que esto no modelo
sendo testado.
V. Fixa- Uma varivel cujo valor ou valores
foram pr- determinados para o estudo.
V. Livre Uma varivel cujos valores no foram pr- determinados para o estudo.
V. preditora- Uma varivel tida hipoteticamente como um fator que influi sobre os valores
da varivel denominada varivel resposta (o
que ser estabelecido durante o estudo.)
V. Neutra- Uma varivel que no influi sobre
a varivel preditora nem sobre a varivel resposta.
V. Pr-Explicativa- Uma varivel que influi
sobre a varivel preditora, mas no tem um
efeito sobre a varivel resposta, exceto pela sua
influncia sobre a primeira.

109