Escolar Documentos
Profissional Documentos
Cultura Documentos
com/2012/05/17/qualteste/
Para você, que precisa aplicar a Estatística na sua pesquisa científica, escrevi este passo-
a-passo e adaptei um road map com os testes mais populares. Este material visa ajudar
você a escolher o melhor teste para o seu caso. O texto está estruturado na forma de
perguntas que você deve responder a si mesmo a cada passo do planejamento das suas
análises.
Aqui trato apenas dos casos mais comuns em Ecologia, usando uma abordagem clássica
baseada em Zar (2009), mas mesclada com uma visão integrada filosófica a
la Magnusson et al. (2015) e uma pitada de GLM a la Dobson & Barnett (2008) e
GLMM à moda de Zuur et al. (2009).
“To consult the statistician after an experiment is finished is often merely to ask him to
conduct a post mortem examination. He can perhaps say what the experiment died of.”
É bom lembrar que este guia não substitui um bom curso de Estatística aplicada à
Biologia, seja presencial ou online, e nem a leitura de livros especializados. Este guia
serve apenas para dar uma introdução aos novatos ou como material de apoio para quem
já tem uma noção.
Não é possível atingir esses objetivos, se você não planejar muito bem aonde quer
chegar. Não comece sem direção, apenas para ver no que vai dar. Em 99,73% dos casos,
isso leva à desistência no meio do caminho ou a resultados completamente irrelevantes.
Para criar uma hipótese original e interessante, você precisa estudar a fundo a literatura
relacionada, além de ter experiência com as entidades envolvidas no projeto. Estudando
o que já se sabe sobre o assunto de interesse é possível saber onde estão as fronteiras do
conhecimento e decidir em que direção você quer expandí-las.
Tomando como base a pergunta formulada anteriormente, uma possível hipótese seria:
Poderíamos imaginar que a justificativa para essa hipótese específica seria baseada nas
seguintes informações:
1. Morcegos maiores precisam beber mais néctar para suprirem suas necessidades
energéticas diárias;
2. Visitantes florais que precisam beber um volume grande de néctar tendem a visitar um
número maior de flores por noite;
3. Em muitas espécies de plantas, quanto mais flores e plantas individuais forem visitas
pelo mesmo animal na mesma noite, maiores as chances de ocorrer fecundação;
4. Conclusão: morcegos maiores têm maior probabilidade de fecundar flores.
Note que essa hipótese foi construída usando raciocínio abdutivo. Ou seja, a conclusão
não é necessariamente verdadeira com base nas premissas 1, 2 e 3, como seria em um
argumento dedutivo. Contudo, essa conclusão é bastante provável.
Quando a maioria das previsões derivadas de uma hipótese é confirmada, ela passa a ser
aceita como uma tese. Caso contrário, a hipótese é abandonada ou reformulada. Se você
não operacionalizar direito a sua hipótese, será impossível saber qual teste estatístico
precisará usar. Na verdade, será impossível até medir as variáveis operacionais.
Vamos pegar a hipótese proposta e dela derivar uma previsão testável. Em outras
palavras, vamos imaginar uma conseqüência dessa hipótese e definir que medidas
precisamos tomar.
Contudo, antes de prosseguirmos, note que, para ser eficiente, um polinizador precisa
primeiro ser legítimo. Ou seja, ele precisa ter um comportamento de visitação às flores
com potencial concreto de resultar em fecundação. Esta é uma premissa, ou seja, algo
que tem que ser verdade, para a sua hipótese fazer sentido. O conjunto de premissas de
uma hipótese acaba definindo suas condições de contorno, ou seja, seu domínio de
validade.
Se, dentro de uma mesma espécie, morcegos maiores são de fato polinizadores mais
eficientes, então eu espero observar que, quanto maior a massa corporal do indivíduo
(em g), maior deve ser o número de flores que ele visita de maneira legítima em uma
mesma noite.
Na maioria dos casos, primeiro você deve checar se a sua variável é qualitativa ou
quantitativa.
Isso porque só tem sentido supor que a massa causa o número de visitas legítimas e não
o contrário.
A maioria dos testes estatísticos supõe implicitamente uma relação de causa e efeito.
Mesmo os testes em que a variável independente é qualitativa (nominal ou ordinal),
como o teste t e a ANOVA. A exceção são testes como a correlação, sem premissa de
causalidade.
Este é o momento para fazer um mapa mental das relações entre as suas variáveis.
Continuando com o nosso exemplo, dentre todos os testes adequados, o mais simples
e bem sintonizado, neste caso, seria uma regressão linear simples, tomando a massa
corporal como X e o número de visitas legítimas de cada morcego individual como Y.
Anúncios
É bom ressaltar que, neste exemplo didático, considerando a forma como a nossa
previsão biológica foi formulada, apenas a hipótese alternativa 1 confirma nossas
expectativas. Relembrando, uma hipótese estatística, no fundo, é uma previsão
científica, do ponto de vista epistemológico.
Antes de rodar uma regressão linear simples, é preciso também testar a normalidade da
distribuição de erros. Em alguns tipos de teste estatístico, caso a distribuição dos dados,
erros ou diferenças não seja normal, é preciso fazer algum tipo de transformação ou
então usar uma versão não-paramétrica.
Note que, via de regra, testes não-paramétricos têm poder estatístico menor do que
testes paramétricos, então sempre que possível prefira os segundos aos primeiros.
Uma outra alternativa, quando a distribuição de erros não é normal, é usar um modelo
linear generalizado (GLM), usando no modelo uma distribuição mais adequada aos seus
dados, sem transformá-los.
Defina também o nível de significância do teste (α). Na Ecologia, costuma-se usar 5%,
mas isso varia muito entre áreas. Na verdade, o valor de P não é a “moral da história” de
um teste e nunca pode ser usado sozinho para tecer interpretações. Decisões binárias do
tipo “significativo vs. não-significativo” aos poucos vão caindo em desuso.
Veja se o teste escolhido tem mais algum outro pressuposto além da normalidade dos
erros (e.g., homocedasticidade) e cheque tudo mais que for necessário.
Anúncios
Este mapa não cobre todas as possibilidades existentes, que são várias, mas abrange a
esmagadora maioria dos testes rotineiramente usados por ecólogos.
Vale lembrar também que este mapa segue uma abordagem mais clássica, como a de
Zar (2009), além de um pouco de abordagens mais complexas. Recomendo fortemente a
leitura de Magnusson et al. (2015) para fortalecer a sua base conceitual.
Clique na imagem para aumentá-la.
Anúncios
Vale lembrar que a normalidade dos dados brutos ou dos erros não é um pressuposto tão
fundamental assim em todos os testes estatísticos. Portanto, muitas vezes, pode-se
aplicar um teste paramétrico mesmo em casos de não-normalidade, sem grandes
diferenças no resultado, especialmente quando o efeito é forte.
Na grande família dos modelos lineares, que incluem o teste t e a ANOVA, testes mais
complexos, como os modelos lineares generalizados simples ou mistos (GLM e
GLMM), permitem ainda escolher outros tipos de distribuição além da normal para
estimar a significância da estatística.
Primeiro, faça histogramas para examinar a distribuição dos dados e dos erros. Segundo,
faça gráficos para inspecionar as relações entre as variáveis de interesse (gráficos de
colunas, diagramas de dispersão, box-plots etc.). Só depois de ter um feeling melhor
sobre os seus dados, rode as análises numéricas.
Anúncios
Aviso:
Eu sou biólogo, não estatístico. Portanto, posso estar errado em um ou mais pontos
abordados neste texto. Minha intenção é apenas ajudar colegas menos experientes a
darem seus primeiros passos no tema. Nada substitui ler livros especializados e fazer
cursos com profissionais da área.
Anúncios
Compartilhe:
CATEGORIASPROJETOSTAGSANÁLISES, ARTIGOS, CIÊNCIA, ESTATÍS
TICA, FERRAMENTAS, MÉTODOS, MODELOS, PLANEJAMENTO, PROJ
ETOS, PUBLICAÇÕES, RSTATS, STATISTICS
1. Elias T. Krainski
11/04/2021 ÀS 10:21
A figura “Qual teste estatístico devo usar?” é tão útil quanto uma receita
de um chefe 3 estrelas Michelin.
Curtir
Responder
09/10/2019 ÀS 16:27
Curtir
Responder
Anúncios
8. Paulo Felipe
23/04/2019 ÀS 11:12
Curtir
Responder
1. Marco Mello
23/04/2019 ÀS 12:31
Curtir
Responder
2. Pavel Dodonov
23/04/2019 ÀS 13:16
Posso me intrometer?
Significância estatística é um conceito meio complicadinho e
cabeludo mesmo, rs. Mas a ideia geral é a seguinte:
Digamos que você quer saber se unicórnios macho são mais
pesados do que unicórnios fêmeas. (Se quiser, substitua os
unicórnios por qualquer espécie de seu interesse, rs). Mas isso é
algo muito vago – vai ter alguns unicórnios machos mais pesados
do que algumas fêmeas, e vice-versa, e não é isso que queremos
saber.
O que podemos querer saber é se, em média, unicórnios machos
são mais pesados. Ou seja, se o peso médio dos unicórnios
machos é maior do que o das fêmeas.
Como saber isso? Simples! Tudo que precisamos fazer é pesar
todos os unicórnios machos, pesar todas as unicórnios fêmeas
(unicórnias? o.O), e comparar as médias.
Só que no caso de animais que de fato existem*, via de regra nós
não conseguimos fazer isso. Afinal, como medir todos os ratos
que vivem em uma cidade? Não dá. Precisamos fazer uma
amostragem.
Então, se, por exemplo, temos uma população total de 2000
unicórnios macho e 1500 fêmeas, podemos, talvez, amostrar 100
machos e 100 fêmeas, e calcular o peso médio desses
indivíduos. Podemos, então, calcular a diferença entre as médias:
Diferença = Média_machos – Média_fêmeas.
A diferença seria então a nossa estatística de teste – ela que vai
nos dar a resposta se unicórnios macho são mais pesados que
unicórnias fêmeas.
O problema é que nós fizemos uma amostragem, ou seja, não
temos a população completa. E como fizemos uma amostragem
aleatória, é possível encontrarmos uma diferença entre machos e
fêmeas pelo acaso, sem que isso represente uma diferença real.
Por exemplo, vamos supôr que machos e fêmes de unicórnio têm
o mesmo peso, em média. Mas pode acontecer que, pelo acaso,
medimos unicórnios machos mais pesados e unicórnias fêmeas
mais leves. Isso sempre é possível. A questão é, qual a
probabilidade disso acontecer?
Então, digamos que encontramos que o peso médio de machos é
55 kg e de fêmeas é de 50 kg. Então:
Diferença = Média_machos – Média_fêmeas = 55 – 50 = 5 kg.
A pergunta é, essa diferença de 5 kg poderia ser observada se
não houver diferença real? Ou seja, se unicórnios machos e
unicórnias fêmeas tiverem o mesmo peso médio, o simples fato
de termos selecionado indivíduos aleatoriamente pode fazer com
que observemos uma diferença de 5 kg?
A resposta é: Sim, poderia!
E a pergunta seguinte é: Qual a probabilidade disso acontecer?
Qual a probabilidade da hipótese nula resultar em algo parecido
(ou mais extremo) com o que foi observado no nosso estudo?
Essa probabilidade, de que a diferença que nós observamos (ou
uma diferença maior) surja pelo acaso quando a hipótese nula for
verdadeira (ou seja, quando não houver diferenças reais), é a
significância.
Significância é basicamente a probabilidade de que dados como
os nossos sejam observados SE a hipótese nula for verdadeira.
Valores baixos de significância (sei lá, p=0.001) indicam que a
hipótese nula dificilmente iria gerar um resultado como o nosso,
então provavelmente ela é falsa. Valores altos de significância
(tipo p=0.42) indicam que um resultado como o nosso é
compatível com a hipótese nula, então não temos bons motivos
para rejeitar ela.
Em linhas gerais é isso. Qualquer teste de significância segue
este princípio; o que muda é como a estatística de teste é