Você está na página 1de 225

Estatística Aplicada

à Biologia
Prof.ª Leila Meyer

2016
Copyright © UNIASSELVI 2016

Elaboração:
Prof.ª Leila Meyer

Revisão, Diagramação e Produção:


Centro Universitário Leonardo da Vinci – UNIASSELVI

Ficha catalográfica elaborada na fonte pela Biblioteca Dante Alighieri


UNIASSELVI – Indaial.

M612e
Meyer; Leila
Estatística aplicada à biologia / Leila Meyer: UNIASSELVI, 2016.

215 p. : il

ISBN 978-85-515-0040-8

1.Biologia. I. Centro Universitário Leonardo Da Vinci.


COD 574

Impresso por:
Apresentação
Caro acadêmico! Chegou a hora de você conhecer melhor a estatística
e aprender um pouco mais sobre ela! Essa é uma disciplina de grande
importância, tanto para a sua vida acadêmica e profissional quanto para o
cotidiano.

Durante o período de formação acadêmica, os conhecimentos em


estatística poderão ser úteis de várias formas, como, por exemplo, ajudar
na interpretação de gráficos e tabelas, facilitar o entendimento de livros e
artigos científicos ou, ainda, auxiliar no planejamento e desenvolvimento de
projetos em outras áreas do conhecimento.

Em relação à vida profissional, os biólogos utilizam a estatística


para resolver problemas em diferentes situações. Por exemplo, biólogos
que seguiram a carreira acadêmica utilizam a estatística para orientar suas
pesquisas científicas ao definir desenhos amostrais e análise de dados.
Biólogos que trabalham em órgãos públicos, ONGs ou empresas privadas
muitas vezes precisam desenvolver projetos, coletar e analisar dados,
apresentar resultados em relatórios. A realização dessas atividades pode ser
orientada pelo conhecimento estatístico. Biólogos que optaram pela docência
em escolas também podem desenvolver projetos com seus acadêmicos e
aplicar a estatística de diferentes formas.

Já na vida cotidiana, saber ler gráficos e tabelas, entender um pouco


de estatística descritiva pode ser muito útil para interpretar corretamente
informações de noticiários. Conhecer os conceitos de distribuição normal e
teorema do limite central permite entender porque eventos extremos (muito
bons ou muito ruins) acontecem com menor frequência, ou porque, depois
de um evento muito ruim, algo melhor acontece.

Esse caderno de estudos fornece os conhecimentos básicos em


estatística. Ele se divide em três unidades. Na primeira unidade você
estudará conceitos básicos em estatística, incluindo os tipos de dados que a
estatística trabalha, formas de coletar dados adequadamente, como descrever
e apresentar dados por meio da estatística descritiva ou por tabelas e gráficos.
Você também estudará um pouco sobre probabilidade e sobre distribuição
de probabilidades. Para fechar esta primeira unidade, você aprenderá o que
é um teste de hipótese e quais são suas etapas.

Depois da primeira unidade você estará pronto para estudar e


realizar os primeiros testes estatísticos. Na segunda unidade você estudará
o teste t e a análise de variância. Também aprenderá um pouco mais sobre
delineamento experimental.

Na terceira unidade você aprenderá outros dois métodos estatísticos,


que são a correlação linear e a regressão linear. Por fim, o último tópico da
terceira unidade aborda os métodos não paramétricos equivalentes aos vistos
ao longo do caderno.
III
Desejo a você um ótimo aprendizado! Espero que ao terminar o
estudo deste caderno você tenha aprendido os conhecimentos básicos em
estatística, consiga compreender a importância desta disciplina e também
consiga aplicar esses conhecimentos na vida acadêmica, profissional e no
cotidiano.

Bons estudos!
Leila Meyer

NOTA

Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto para
você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há
novidades em nosso material.

Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é


o material base da disciplina. A partir de 2017, nossos livros estão de visual novo, com um
formato mais prático, que cabe na bolsa e facilita a leitura.

O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova
diagramação no texto, aproveitando ao máximo o espaço da página, o que também
contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo.

Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente,


apresenta também este livro no formato digital. Assim, você, acadêmico, tem a possibilidade
de estudá-lo com versatilidade nas telas do celular, tablet ou computador.
 
Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para
apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto
em questão.

Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas
institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa
continuar seus estudos com um material de qualidade.

Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de


Desempenho de Estudantes – ENADE.
 
Bons estudos!

IV
V
VI
Sumário
UNIDADE 1 - FUNDAMENTOS EM ESTATÍSTICA....................................................................1

TÓPICO 1 - INTRODUÇÃO À ESTATÍSTICA...............................................................................3


1 INTRODUÇÃO...................................................................................................................................3
2 CONCEITOS BÁSICOS EM ESTATÍSTICA.................................................................................4
2.1 POPULAÇÃO, AMOSTRA E UNIDADE AMOSTRAL...........................................................5
2.2 ESTIMATIVA E PARÂMETRO....................................................................................................6
2.3 INFERÊNCIA ESTATÍSTICA.......................................................................................................7
3 TIPOS DE DADOS.............................................................................................................................7
3.1 VARIÁVEIS QUANTITATIVAS...................................................................................................7
3.2 VARIÁVEIS QUALITATIVAS......................................................................................................8
3.3 VARIÁVEIS DERIVADAS............................................................................................................8
4 INTRODUÇÃO À AMOSTRAGEM...............................................................................................9
4.1 POR QUE AMOSTRAR?...............................................................................................................9
4.1.1 Amostragem aleatória simples...........................................................................................10
4.1.2 Amostragem sistemática......................................................................................................10
4.1.3 Amostragem estratificada....................................................................................................11
4.1.4 Amostragem de conveniência.............................................................................................13
4.2 TAMANHO AMOSTRAL E LEI DOS GRANDES NÚMEROS..............................................14
5 ESTATÍSTICA DESCRITIVA...........................................................................................................15
5.1 MEDIDAS DE TENDÊNCIA CENTRAL...................................................................................16
5.1.1 Média......................................................................................................................................16
5.1.2 Mediana..................................................................................................................................18
5.1.3. Moda......................................................................................................................................19
5.2 MEDIDAS DE DISPERSÃO.........................................................................................................20
5.2.1 Amplitude..............................................................................................................................20
5.2.2 Intervalo interquartil............................................................................................................20
5.2.3 Variância.................................................................................................................................21
5.2.4 Desvio padrão.......................................................................................................................23
5.2.5 Coeficiente de variação........................................................................................................24
6 USO DE TABELAS E GRÁFICOS...................................................................................................26
6.1 TABELAS.........................................................................................................................................26
6.1.1 Tabelas de distribuição de frequências..............................................................................26
6.1.2 Tabelas de contingência.......................................................................................................29
6.2 GRÁFICOS......................................................................................................................................29
6.2.1 Gráfico de barras...................................................................................................................30
6.2.2 Histograma............................................................................................................................31
6.2.3 Box plot....................................................................................................................................32
6.2.4 Gráfico de dispersão bidimensional..................................................................................33
RESUMO DO TÓPICO 1.....................................................................................................................35
AUTOATIVIDADE...............................................................................................................................37

TÓPICO 2 - DISTRIBUIÇÃO DE PROBABILIDADES.................................................................39


1 INTRODUÇÃO...................................................................................................................................39
2 DISTRIBUIÇÃO DE PROBABILIDADES.....................................................................................42

VII
2.1 DISTRIBUIÇÃO BINOMIAL.......................................................................................................43
2.2 DISTRIBUIÇÃO NORMAL..........................................................................................................46
2.2.1 Características da distribuição normal..............................................................................47
2.2.2 Distribuição normal padronizada......................................................................................50
3 DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS.............................................................................53
RESUMO DO TÓPICO 2.....................................................................................................................57
AUTOATIVIDADE...............................................................................................................................59

TÓPICO 3 - TESTE DE HIPÓTESES..................................................................................................61


1 INTRODUÇÃO...................................................................................................................................61
2 TESTE DE HIPÓTESES.....................................................................................................................61
2.1 HIPÓTESE NULA..........................................................................................................................61
2.2 HIPÓTESE ALTERNATIVA.........................................................................................................62
2.3 P-VALOR.........................................................................................................................................63
2.4 NÍVEL CRÍTICO DE SIGNIFICÂNCIA.....................................................................................64
2.5 ETAPAS DE UM TESTE DE HIPÓTESES...................................................................................65
3 TIPOS DE ERROS..............................................................................................................................66
3.1 ERRO TIPO I...................................................................................................................................66
3.2 ERRO TIPO II.................................................................................................................................66
3.3 PODER DO TESTE........................................................................................................................67
LEITURA COMPLEMENTAR.............................................................................................................68
RESUMO DO TÓPICO 3.....................................................................................................................70
AUTOATIVIDADE...............................................................................................................................71

UNIDADE 2 - TESTES ESTATÍSTICOS I.........................................................................................73

TÓPICO 1 - TESTE Z E TESTE T........................................................................................................75


1 INTRODUÇÃO...................................................................................................................................75
2 TESTE Z................................................................................................................................................75
3 TESTE T................................................................................................................................................79
3.1 DISTRIBUIÇÃO T..........................................................................................................................79
3.2 COMPARAÇÃO ENTRE DUAS MÉDIAS.................................................................................82
3.2.1 Comparação entre duas médias de amostras pareadas..................................................82
3.2.1.1 Pressupostos do teste T pareado............................................................................85
3.2.1.2 Vamos praticar..........................................................................................................85
3.2.2 Comparação entre duas médias de amostras independentes........................................88
3.2.2.1 Pressupostos do teste T para amostras independentes......................................90
3.2.2.2 Vamos praticar..........................................................................................................92
3.2.3 Comparação entre duas médias de amostras independentes
e com variâncias heterogêneas............................................................................................94
3.2.3.1 Pressupostos do teste T para variâncias heterogêneas........................................95
3.2.3.2 Vamos praticar..........................................................................................................96
4 MÉTODO ALTERNATIVO – INTERVALOS DE CONFIANÇA..............................................98
RESUMO DO TÓPICO 1.....................................................................................................................103
AUTOATIVIDADE...............................................................................................................................106

TÓPICO 2 - DELINEAMENTO EXPERIMENTAL..........................................................................109


1 INTRODUÇÃO...................................................................................................................................109
2 EXPERIMENTO..................................................................................................................................109
2.1 EXPERIMENTO MANIPULATIVO............................................................................................110
2.2 EXPERIMENTO NATURAL........................................................................................................111
2.3 REPLICAÇÃO................................................................................................................................112

VIII
2.4 TRATAMENTO, FATOR E NÍVEL..............................................................................................113
2.5 GRUPO TRATADO E GRUPO CONTROLE.............................................................................113
2.6 CASUALIZAÇÃO.........................................................................................................................114
2.7 INDEPENDÊNCIA NAS OBSERVAÇÕES.................................................................................114
3 TIPOS DE DELINEAMENTO..........................................................................................................115
3.1 DELINEAMENTO INTEIRAMENTE CASUALIZADO..........................................................115
3.2 DELINEAMENTO EM BLOCOS CASUALIZADOS................................................................116
3.3 DELINEAMENTO FATORIAL....................................................................................................119
RESUMO DO TÓPICO 2.....................................................................................................................121
AUTOATIVIDADE...............................................................................................................................123

TÓPICO 3 - ANÁLISE DE VARIÂNCIA...........................................................................................125


1 INTRODUÇÃO...................................................................................................................................125
2 MÚLTIPLAS COMPARAÇÕES ENTRE MÉDIAS USANDO TESTE T.................................125
2.1 COMO A ANÁLISE DE VARIÂNCIA FUNCIONA................................................................126
2.2 TESTE A POSTERIORI DE TUKEY.............................................................................................132
2.3 PRESSUPOSTOS DA ANÁLISE DE VARIÂNCIA...................................................................134
2.4 VAMOS PRATICAR......................................................................................................................134
LEITURA COMPLEMENTAR.............................................................................................................141
RESUMO DO TÓPICO 3.....................................................................................................................143
AUTOATIVIDADE...............................................................................................................................145

UNIDADE 3 - TESTES ESTATÍSTICOS II.......................................................................................147

TÓPICO 1 - CORRELAÇÃO................................................................................................................149
1 INTRODUÇÃO...................................................................................................................................149
2 COEFICIENTE DE CORRELAÇÃO DE PEARSON....................................................................151
2.1 TESTE DE HIPÓTESES PARA O COEFICIENTE DE
CORRELAÇÃO DE PEARSON...................................................................................................154
2.2 PRESSUPOSTOS PARA CALCULAR O COEFICIENTE DE
CORRELAÇÃO DE PEARSON...................................................................................................155
3 VAMOS PRATICAR...........................................................................................................................156
3.1 CUIDADOS NA INTERPRETAÇÃO DO COEFICIENTE DE
CORRELAÇÃO DE PEARSON...................................................................................................160
RESUMO DO TÓPICO 1.....................................................................................................................163
AUTOATIVIDADE...............................................................................................................................165

TÓPICO 2 - REGRESSÃO LINEAR SIMPLES................................................................................169


1 INTRODUÇÃO...................................................................................................................................169
2 REGRESSÃO LINEAR SIMPLES....................................................................................................169
2.1 RETA DE REGRESSÃO LINEAR SIMPLES...............................................................................170
2.2 AJUSTE DA RETA DE REGRESSÃO LINEAR SIMPLES........................................................174
2.3 PRESSUPOSTOS DA REGRESSÃO LINEAR SIMPLES..........................................................177
3 VAMOS PRATICAR...........................................................................................................................180
RESUMO DO TÓPICO 2.....................................................................................................................187
AUTOATIVIDADE...............................................................................................................................189

TÓPICO 3 - QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS.......................191


1 INTRODUÇÃO...................................................................................................................................191
2 TESTES PARAMÉTRICOS X TESTES NÃO PARAMÉTRICOS..............................................191
2.1 VANTAGENS E DESVANTAGENS DOS TESTES NÃO PARAMÉTRICOS........................193
2.2 ALGUNS TESTES NÃO PARAMÉTRICOS...............................................................................194

IX
2.2.1 Teste T de Wilcoxon..............................................................................................................194
2.2.2 Teste U de Wilcoxon-Mann-Whitney.................................................................................194
2.2.3 Teste de Kruskal-Wallis........................................................................................................195
2.2.4 Coeficiente de correlação de Spearman.............................................................................195
3 TESTE QUI-QUADRADO................................................................................................................196
3.1 PRESSUPOSTOS DO TESTE QUI-QUADRADO......................................................................199
4 VAMOS PRATICAR...........................................................................................................................199
5 TESTE QUI-QUADRADO PARA TABELAS DE CONTINGÊNCIAS l x c.............................201
LEITURA COMPLEMENTAR.............................................................................................................202
RESUMO DO TÓPICO 3.....................................................................................................................205
AUTOATIVIDADE...............................................................................................................................207
REFERÊNCIAS.......................................................................................................................................209
APÊNDICES............................................................................................................................................211

X
UNIDADE 1

FUNDAMENTOS EM
ESTATÍSTICA

OBJETIVOS DE APRENDIZAGEM
Caro acadêmico, o objetivo desta unidade é:

• compreender fundamentos básicos em estatística e sua importância nas


ciências biológicas;

• compreender e usar o teste de hipóteses na resolução de questões bioló-


gicas;

• planejar delineamentos amostrais que forneçam dados adequados para


resolução de questões biológicas;

• fazer uso da estatística descritiva, gráficos e tabelas para resumir e apre-


sentar dados adequadamente.

PLANO DE ESTUDOS
Esta unidade está dividida em três tópicos. Em cada um deles você
encontrará atividades visando à compreensão dos conteúdos apresentados.

TÓPICO 1 – INTRODUÇÃO À ESTATÍSTICA

TÓPICO 2 – DISTRIBUIÇÃO DE PROBABILIDADES

TÓPICO 3 – TESTE DE HIPÓTESES

1
2
UNIDADE 1
TÓPICO 1

INTRODUÇÃO À ESTATÍSTICA

1 INTRODUÇÃO
Assim como toda ciência, as ciências biológicas são movidas por perguntas.
Podemos nos perguntar, por exemplo: que fatores influenciam na diferença do
número de espécies de mamíferos entre duas regiões? O barramento de um rio
para construção de uma hidrelétrica altera a densidade populacional dos peixes
desse rio? Quais serão os efeitos das alterações na temperatura e precipitação
decorrentes das mudanças climáticas sobre a vegetação? A infecção de mulheres
gestantes pelo vírus Zika está associada à prevalência de microcefalia em seus
bebês? Qual a didática mais eficiente para o ensino de doenças sexualmente
transmissíveis aos educandos do Ensino Fundamental?

Para responder perguntas como as citadas acima, a estatística é essencial.


Com o auxílio do conhecimento estatístico podemos planejar corretamente a coleta
de dados, bem como analisar e apresentar os dados coletados adequadamente, e
assim, obter evidências sólidas para responder nossas perguntas (CALLEGARI-
JACQUES, 2003). Na elaboração de conclusões, a estatística permite fazer
generalização a partir de um conjunto limitado de dados. Apesar de não existir
certeza sobre determinada conclusão, por meio da estatística é possível estabelecer
um erro associado à conclusão, a partir do conhecimento da variabilidade
observada nos dados (CALLEGARI-JACQUES, 2003).

Assim, a estatística é definida como a ciência que tem por objetivo orientar
a coleta, a organização, a análise e a interpretação de dados (CALLEGARI-
JACQUES, 2003; PAGANO; GAUVREAU, 2013). Essa ciência pode ser dividida
em duas grandes áreas: i) a estatística descritiva, que se preocupa com o resumo
e a apresentação de dados; ii) a estatística inferencial, que é usada para obter
conclusões sobre um conjunto amplo de dados a partir do estudo de apenas parte
desses dados (CALLEGARI-JACQUES, 2003). Quando a estatística é usada nas
ciências biológicas e na saúde, ela também pode ser chamada de Bioestatística.

Breve histórico: O início da estatística remonta ao surgimento das primeiras


cidades e a necessidade de realizar censos por interesse do Estado, principalmente
para fins militares e tributários (CALLEGARI-JACQUES, 2003). Um exemplo
foi o censo dos judeus, ordenado pelo imperador romano Cesar Augusto, que
aconteceu por volta do ano zero da era cristã (CALLEGARI-JACQUES, 2003).

3
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Por um longo período o foco da estatística foi somente descritivo. Mas,


a partir do século XVII, com as primeiras interpretações de dados, a estatística
começou a mudar (CALLEGARI-JACQUES, 2003). Em 1662, quando os primeiros
registros de séries temporais de nascimentos e mortes estavam disponíveis, John
Graunt (1620-1674) publicou um livro descrevendo proporções de nascimentos
e mortes por idade e sexo de Londres (MEMÓRIA, 2004). Em 1693, Edmond
Halley (1656-1742), um astrônomo, construiu a primeira tábua de sobrevivência
(MEMÓRIA, 2004). Ainda no mesmo século, dois matemáticos, Blaise Pascal
(1623-1662) e Pierre de Fermat (1601-1665), iniciaram o estudo formal da teoria
de probabilidades, o que foi um grande marco no desenvolvimento da estatística
(CALLEGARI-JACQUES, 2003).

Já nos séculos XIX e XX, a estatística passou por grandes avanços graças
a Karl Pearson (1857-1936), William Sealy Gosset (1876-1937) e, em especial, a
Ronald Aylmer Fisher (1890-1962) (CALLEGARI-JACQUES, 2003; MEMÓRIA,
2004). Pearson se interessou pela aplicação dos métodos estatísticos na biologia,
principalmente em estudos de seleção natural. Ele também foi muito importante
no desenvolvimento teórico do coeficiente de correlação e do teste qui-quadrado
(CALLEGARI-JACQUES, 2003). Gosset, que foi acadêmico de Pearson, se
dedicou a solucionar problemas práticos com amostras pequenas e, com seus
estudos, desenvolveu o teste t (CALLEGARI-JACQUES, 2003). Fisher, além de
ter revolucionado a estatística, também foi essencial para o desenvolvimento da
genética. Ele apresentou as bases do planejamento de experimentos, desenvolveu
a análise da variância e introduziu o conceito de aleatorização. O trabalho de
Fisher influenciou o uso da estatística em inúmeras áreas do conhecimento,
sobretudo na agronomia, biologia e genética (CALLEGARI-JACQUES, 2003).

2 CONCEITOS BÁSICOS EM ESTATÍSTICA


Agora que você sabe o que é a estatística e conheceu um pouco da sua
história, é importante entender alguns conceitos básicos dessa ciência, que serão
essenciais ao longo do desenvolvimento da disciplina.

4
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

2.1 POPULAÇÃO, AMOSTRA E UNIDADE AMOSTRAL


População, também denominada universo, é o conjunto de todas as
unidades em estudo (VIEIRA, 2011). A Figura 1 representa, hipoteticamente, um
reflorestamento de araucárias (Araucaria angustifolia (Bertol.) Kuntze). Vamos
imaginar que queremos descobrir quantas pinhas são produzidas em média
por cada araucária. Nesse caso, nossa população são todas as araucárias do
reflorestamento.

Amostra é um subconjunto de unidades da população, que de fato


são observadas ou manipuladas (CALLEGARI-JACQUES, 2003). Geralmente
é impossível observar ou manipular todas as unidades da população, por
isso selecionamos algumas unidades que representem a população, as quais
compõem a amostra. A estratégia de selecionar unidades da população para
compor a amostra é chamada de amostragem. No exemplo do reflorestamento de
araucárias (Figura 1), considerando que é impossível contar o número de pinhas
de cada araucária do reflorestamento, podemos selecionar um determinado
número de araucárias para contar as pinhas. Essas araucárias selecionadas serão
nossa amostra.

Unidade amostral é uma unidade, que pertence à população, sob a qual


são feitas as observações ou manipulações para obtenção dos dados. No exemplo
do reflorestamento de araucárias (Figura 1), cada araucária, que terá suas pinhas
contadas, representa uma unidade amostral.

Em raríssimos casos, quando todas as unidades da população são


observadas ou manipuladas, obtemos um censo.

NOTA

Caro acadêmico, você sabia que o censo demográfico realizado pelo IBGE,
em que uma porção representativa da população brasileira é entrevistada, é apenas uma
amostra? O “Censo do IBGE” não é de fato um censo, pois nem todos os indivíduos que
compõem a população brasileira são entrevistados.

5
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Na figura a seguir temos a representação de um reflorestamento de


araucárias (Araucaria angustifolia (Bertol.) Kuntze) para ilustrar o que é população,
amostra e unidade amostral. Nesse exemplo, gostaríamos de saber qual é o número
médio de pinhas produzidas por cada araucária. Lembrando que a araucária
é uma espécie dioica, hipoteticamente todo o reflorestamento é composto por
plantas pistiladas (“femininas”) e que produzem pinhas.

FIGURA 1 – REFLORESTAMENTO DE ARAUCÁRIAS

FONTE: A autora

2.2 ESTIMATIVA E PARÂMETRO


A estimativa é um valor que resume uma característica da amostra
(CALLEGARI-JACQUES, 2003). No exemplo do reflorestamento de araucárias
(Figura 1), ao amostrarmos dez araucárias, o número médio de pinhas produzidas
pelas dez araucárias é uma estimativa.

6
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

Já o parâmetro é um valor que resume uma característica da população


(CALLEGARI-JACQUES, 2003). Conseguimos alcançar o parâmetro apenas
quando realizamos um censo, ou seja, observamos todas as unidades da população.
No exemplo do reflorestamento de araucárias (Figura 1), se contamos as pinhas
de todas as araucárias, chegamos ao número médio de pinhas por araucária. Esse
número é o parâmetro.

2.3 INFERÊNCIA ESTATÍSTICA


A inferência estatística é a obtenção de conclusões a respeito da população
(do todo) com base na amostra (um subconjunto do todo). No exemplo do
reflorestamento de araucárias (Figura 1), queremos estimar o número médio de
pinhas por araucária no reflorestamento (a população), a partir da observação do
número de pinhas de apenas algumas araucárias (a amostra).

3 TIPOS DE DADOS
O dado é a menor unidade de informação obtida de cada unidade
amostral (CALLEGARI-JACQUES, 2003). Os dados podem ser valores numéricos
(por exemplo, alguma característica medida em metros ou tempo), ou categorias
(por exemplo, grande, médio ou pequeno). No exemplo do reflorestamento de
araucárias (Figura 1), em que queremos descobrir o número médio de pinhas
produzidas por araucária, o dado é o valor numérico que representa a quantidade
de pinhas produzida por cada araucária amostrada.

Os dados fazem referência a variáveis. Variável é qualquer característica


observada na unidade amostral e que pode variar entre as unidades amostrais
(CALLEGARI-JACQUES, 2003). No exemplo do reflorestamento de araucárias
(Figura 1), a variável é “número de pinhas por araucária”.

As variáveis podem ser classificadas de acordo com suas características. A


seguir estudaremos os principais tipos de variáveis.

3.1 VARIÁVEIS QUANTITATIVAS


Os dados de variáveis quantitativas são valores numéricos e expressam
quantidades. As variáveis quantitativas podem ser divididas em duas categorias:

i) Variáveis quantitativas contínuas: os dados podem apresentar infinitos


valores dentro de um intervalo determinado (VIEIRA, 2011). Um exemplo é
a altura das araucárias adultas do reflorestamento, que hipoteticamente pode
variar entre 10 e 25 metros. A observação de uma araucária com 15,5 metros
de altura é possível, assim como uma araucária com 15,6 metros. Medições
geralmente são variáveis quantitativas contínuas, como é o caso da altura, peso,
comprimento e tempo.

7
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

ii) Variáveis quantitativas discretas: os dados podem apresentar somente


determinados valores numéricos, geralmente são números inteiros (VIEIRA, 2011).
Contagens são exemplos desse tipo de variável. Uma araucária pode produzir de
uma a 60 pinhas, mas nunca poderá produzir 5,5 pinhas. Isso também se aplica,
por exemplo, ao número de filhotes por ninhada de uma espécie de roedor, ou o
número de espécies de anfíbios em determinada área.

3.2 VARIÁVEIS QUALITATIVAS


Variáveis qualitativas, também denominadas categóricas, fornecem dados
de natureza não numérica. Elas também se dividem em duas categorias:

i) Variáveis qualitativas nominais: os dados são classificados em


categorias não ordenadas (VIEIRA, 2011). Quando os dados são organizados em
apenas duas categorias, dizemos que a variável qualitativa nominal é binária ou
dicotômica. Um exemplo é o gênero de determinada espécie de primata, que pode
ser masculino ou feminino. Quando existem mais de duas categorias, as variáveis
são chamadas de polinomiais ou politômicas. Isso acontece com a síndrome
de dispersão de plantas, por exemplo, que pode ser zoocórica, hidrocórica,
anemocórica ou autocórica; ou os grupos sanguíneos do sistema ABO, que podem
ser A, B, AB ou O.

ii) Variáveis qualitativas ordinais: além de classificar os dados em


categorias, também é possível identificar níveis de intensidade entre as categorias,
o que permite ordená-las (CALLEGARI-JACQUES, 2003). Por exemplo, o estágio
ontogenético de uma espécie de borboleta, que pode ser ovo, larva, pupa ou
adulto; ou lesões, que podem ser classificadas em pequena, moderada, severa ou
fatal, conforme sua gravidade.

3.3 VARIÁVEIS DERIVADAS


As variáveis derivadas são variáveis criadas a partir de operações lógicas
ou matemáticas de outras variáveis. Alguns casos de variáveis derivadas são:

i) Razão é uma variável que expressa relação entre duas variáveis a partir
de um único valor. Um exemplo é a razão entre comprimento e largura da asa de
aves, que é usada para relacionar características da asa ao voo das aves.

ii) Taxa é uma variável que expressa determinado valor, geralmente


uma contagem, dentro de um intervalo de tempo ou espaço. Um exemplo é a
densidade de palmiteiros (Euterpe edulis Mart.) em um fragmento florestal, que é
expressa pelo número de palmiteiros por quilômetro quadrado.

8
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

iii) Índice é uma variável obtida a partir da aplicação de fórmulas


matemáticas definidas. Um exemplo é o índice de massa corporal (IMC), calculado
a partir da divisão da massa do indivíduo (em quilogramas) pelo quadrado de
sua altura (em metros).

4 INTRODUÇÃO À AMOSTRAGEM
Você já estudou que um dos objetivos da estatística é fazer inferências
a respeito da população com base em um conjunto reduzido de informações,
a amostra. Para que as conclusões sobre a população sejam válidas, é preciso
garantir que a amostra represente a população. Neste tópico você estudará
por que precisamos amostrar e quais são os principais tipos de amostragem.
Esses conhecimentos são fundamentais para definir qual é a melhor estratégia
de amostragem.

4.1 POR QUE AMOSTRAR?


Geralmente estamos interessados em responder uma pergunta científica
cuja população é muito grande e é composta de muitas unidades amostrais
(CALLEGARI-JACQUES, 2003; VIEIRA, 2011). A amostragem de todas as
unidades da população é inviável. Desta forma, precisamos selecionar parte
das unidades amostrais – uma amostra – que represente a população. Imagine
que um pesquisador quer saber qual é a riqueza de espécies herbáceas da Mata
Atlântica. Nesse estudo, a população compreende todas as espécies herbáceas
da Mata Atlântica. Considerando a extensão do bioma e a alta diversidade
de espécies, é inviável amostrar todas as espécies herbáceas. Assim, esse
pesquisador terá que obter uma amostra que represente a riqueza de espécies
herbáceas da Mata Atlântica.

Em alguns casos, a população não é tão grande quanto o exemplo das


espécies herbáceas da Mata Atlântica. No entanto, um censo – a amostragem de
todas as unidades da população – continua inviável, pois os gastos com mão
de obra e tempo seriam muito altos (PAGANO; GAUVREAU, 2013; VIEIRA,
2011). No exemplo hipotético do reflorestamento de araucárias, em que estamos
interessados em descobrir qual o número médio de pinhas por árvore, a
amostragem de todas as pinhas de todas as araucárias exigiria muito tempo
e mão de obra. Assim, a contagem de pinhas em parte das araucárias – uma
amostra – é suficiente para responder à pergunta.

Uma amostragem bem delineada é essencial para obtermos dados de


qualidade, que forneçam boas estimativas dos parâmetros populacionais e
inferências confiáveis. A seguir são apresentados quatro tipos de amostragem e
suas aplicações.

9
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

4.1.1 Amostragem aleatória simples


Em uma amostra aleatória simples, todas as unidades amostrais que
compõem a população têm igual chance de serem amostradas. As unidades
amostrais são selecionadas independentemente, por meio de sorteio, até que o
tamanho desejado da amostra seja alcançado (PAGANO; GAUVREAU, 2013).
É necessário que as unidades amostrais estejam enumeradas para que se possa
realizar o sorteio. Vamos imaginar que o reflorestamento de araucárias seja
composto por 50 árvores. Nosso objetivo é quantificar o número médio de
pinhas produzidas por árvore com base em uma amostra de 10 araucárias. Para
isso, podemos atribuir um número para cada araucária, e dentre as 50 árvores,
sorteamos 10 para contar o número de pinhas (Figura 2A).

A amostragem aleatória simples representa a estratégia de seleção das


unidades amostrais mais simples e mais eficientes para garantir que todas as
unidades amostrais tenham igual chance de serem amostradas. Nesse tipo de
amostragem não é necessário ter conhecimento prévio sobre possíveis variações
ao longo das unidades amostrais, pois todas as unidades amostrais e suas
respectivas proporções de variação serão representadas em uma amostragem
aleatória simples. Por exemplo, vamos imaginar que as araucárias localizadas
nas bordas do reflorestamento recebem mais sol que as araucárias do interior
do reflorestamento, e a quantidade de luz solar influencia o número de pinhas
produzidas. A amostragem aleatória simples permite que araucárias tanto
da borda, quanto do interior do reflorestamento possam ser amostradas, se
o tamanho amostral for grande o suficiente. Assim, a variação no número
de pinhas associada à quantidade de luz solar que ocorre na população será
representada na amostra.

TURO S
ESTUDOS FU

Caro acadêmico, você verá adiante que garantir uma amostra aleatória, ou
seja, assegurar que todas as unidades amostrais tiveram a mesma chance de terem sido
amostradas é um dos pressupostos para todos os testes estatísticos que vamos aprender.

4.1.2 Amostragem sistemática


Na amostragem sistemática, as unidades amostrais não são escolhidas ao
acaso, mas por um sistema predefinido (Figura 2B) (VIEIRA, 2011). É necessário
que as unidades amostrais da população estejam ordenadas de alguma forma,
como, por exemplo, em listas ou em filas. Também é necessário estabelecer um
critério de intervalo em que as unidades amostrais serão selecionadas para compor

10
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

a amostra. A primeira unidade amostral, a partir da qual o critério de seleção das


unidades será aplicado, pode ser sorteada. No exemplo do reflorestamento de
araucária, imagine que é necessário amostrar 10 árvores dentre as 50 araucárias
que compõem o reflorestamento. Para isso, podemos amostrar sempre a quinta
araucária a partir da última araucária amostrada, até que se completem 10 árvores.
A primeira araucária a ser incluída na amostra pode ser sorteada entre as cinco
primeiras araucárias.

Na amostragem sistemática é importante que as unidades amostrais


sejam homogêneas entre si (PAGANO; GAUVREAU, 2013). Caso as unidades
amostrais não sejam homogêneas e apenas parte da variação seja contemplada
pela amostragem sistemática, teremos uma amostra que não representa
adequadamente a população. Por exemplo, se as araucárias da borda do
reflorestamento recebem mais luz e isso influencia a produção de pinhas,
enquanto as araucárias do interior do reflorestamento recebem menos luz, as
unidades amostrais não são homogêneas entre si e a amostragem sistemática não
seria a melhor estratégia.

4.1.3 Amostragem estratificada


Uma amostragem estratificada pode ser utilizada quando se sabe,
previamente, que a população é composta por subpopulações ou estratos
e se presume que esses estratos influenciam a variável em estudo (Figura 2C)
(CALLEGARI-JACQUES, 2003). Nesses casos, primeiramente se verifica quais
são os estratos que compõem a população e que proporções eles representam da
população. Na sequência, são selecionadas as unidades amostrais dentro de cada
estrato, respeitando as proporções dos estratos em relação à população. A seleção
das unidades amostrais dentro de cada estrato pode ser por sorteio, como no caso
de uma amostragem aleatória simples, ou por algum critério preestabelecido,
como na amostragem sistemática.

Imagine que no exemplo do reflorestamento de araucária existem dois


tipos de solos (Figura 2C). Metade do reflorestamento apresenta um tipo de solo e
a outra metade, outro tipo de solo. O tipo de solo pode influenciar a produtividade
das araucárias, portanto, é importante considerar essa variação do ambiente no
momento do delineamento amostral. Podemos separar o reflorestamento em
dois estratos de acordo com o tipo de solo. Em cada estrato podemos sortear
cinco árvores, de modo que sejam amostradas 10 árvores das 50 araucárias que
compõem o reflorestamento.

Na figura a seguir temos a representação da amostragem aleatória


simples (A), sistemática (B) e estratificada (C). Nos três casos foram selecionadas
10 araucárias (plantas destacadas com um círculo) para compor a amostra dentre
as 50 araucárias do reflorestamento.

11
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

FIGURA 2 – REPRESENTAÇÃO DAS AMOSTRAGENS

A) Amostragem aleatória simples: as 10 araucárias destacadas


compõem a amostra e foram selecionadas por meio de om
sorteio. Todas as araucárias tiveram a mesma chance de
terem sido amostradas.

B) Amostragem sistemática: dentre as cinco primeiras


araucárias, foi sorteada a primeira araucária para compor
a amostra (araucária nº 5). As araucárias seguintes foram
incluídas na amostra respeitando o critério de incluir a
quinta araucária a partir da última araucária amostrada.
Após a araucária nº 5, foram amostradas as araucárias nº 10,
nº 15, nº 20 e assim até a amostra atingir 10 araucárias.

12
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

C) Amostragem estratificada: cada retângulo pode representar,


por exemplo, um tipo de solo. A população (reflorestamento
de araucárias) foi estratificada em dois estratos, conforme os
retângulos. Para compor a amostra foram selecionadas, por
sorteio, cinco araucárias em cada estrato.

FONTE: A autora

4.1.4 Amostragem de conveniência


Na amostragem de conveniência o pesquisador reúne unidades amostrais
simplesmente porque dispõe delas ou porque são unidades de fácil acesso (VIEIRA,
2011). Esse tipo de amostragem tem maior propensão de ser tendenciosa, já que
nem todas as unidades amostrais tiveram a mesma chance de serem amostradas
(PAGANO; GAUVREAU, 2013). No entanto, a amostragem de conveniência é
muito utilizada na área da saúde, em que geralmente o pesquisador trabalha
com as unidades amostrais a que tem acesso, como, por exemplo, determinada
linhagem de ratos de laboratório, ou pacientes do ambulatório da universidade
sob um tratamento específico (VIEIRA, 2011). As conclusões a partir de amostras
provenientes de amostragem de conveniência devem ser feitas com cuidado,
geralmente são válidas apenas para as unidades amostrais avaliadas, e não
permitem generalizações para a população como um todo.

13
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

4.2 TAMANHO AMOSTRAL E LEI DOS


GRANDES NÚMEROS
Outra questão importante no planejamento da amostragem é o
tamanho amostral, ou seja, o número de unidades amostrais que irá compor
a amostra. No entanto, não existe um número fixo para definir o tamanho
amostral do estudo (CALLEGARI-JACQUES, 2003). Esse número pode variar
de acordo com diferentes fatores, como: i) o tipo de pergunta que se quer
responder; ii) o tipo de variável (quantitativa, qualitativa ou derivada); iii) a
incerteza em relação à inferência estatística que o pesquisador está disposto a
assumir, uma vez que a incerteza sempre diminui com o aumento do tamanho
amostral; iv) e a disponibilidade de recursos financeiros e tempo para coleta
de dados (CALLEGARI-JACQUES, 2003). No entanto, existe um teorema da
probabilidade, chamado de Lei dos Grandes Números, que estabelece que quanto
maior o tamanho amostral, mais próxima uma estimativa estará do parâmetro
populacional (GOTELLI; ELLISON, 2011). Esse teorema foi demonstrado pelo
matemático russo Andrei Kolmogorov (1903-1987).

Vamos pensar em um exemplo hipotético. Voltando ao reflorestamento


de araucárias, vamos imaginar que a quantidade de luz influencia a produção
de pinhas. As araucárias localizadas na borda do reflorestamento, que recebem
mais luz, apresentam um número maior de pinhas por árvore, em comparação
às árvores do interior do reflorestamento. Para responder à pergunta de
quantas pinhas cada araucária produz em média, um pesquisador decidiu
amostrar apenas duas árvores dentre as 50 araucárias do reflorestamento. Esse
pesquisador não sabia da relação entre a produção de pinhas e a quantidade de
luz solar.

Em um sorteio, as duas araucárias selecionadas localizaram-se na borda


do reflorestamento. Neste caso, a amostra é representativa da população? Não,
pois a amostra não incluiu árvores do interior do reflorestamento, que em
média produzem menos pinhas. Com essa amostragem, o pesquisador deve
concluir que as araucárias produzem um número de pinhas maior que o valor
real. À medida que o tamanho amostral aumenta, a chance de amostrar apenas
araucárias localizadas na borda ou no interior do reflorestamento diminui.
Amostrando mais araucárias, a estimativa da média de pinhas produzidas por
araucária fica mais próxima do parâmetro populacional, que é o valor real.

14
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

5 ESTATÍSTICA DESCRITIVA
Você acabou de aprender que um estudo científico sempre busca obter
conclusão a respeito da população, no entanto, na maioria dos trabalhos não
é possível amostrar todas as unidades amostrais da população para suportar
as conclusões. Assim, é necessário trabalhar com uma amostra, ou seja, parte
das unidades amostrais que compõem a população. A partir da amostra se
estima os parâmetros populacionais e, com base nessas informações, inferências
em relação à população são feitas. Você também estudou quais são os tipos
de variáveis que podem ser coletadas nas unidades amostrais (variáveis
quantitativas, qualitativas ou derivadas). Por fim, você estudou os principais
métodos de amostragem das unidades amostrais. Portanto, até agora, você deve
ter uma ideia por que coletamos dados de apenas algumas unidades amostrais
da população; de que tipos podem ser os dados coletados; e como esses dados
podem ser coletados por meio de um delineamento amostral. Um exemplo de
conjunto de dados é apresentado na Tabela 1.

Na Tabela 1 estão representadas as notas da primeira e segunda


avaliação da disciplina de estatística de 10 acadêmicos de Ciências Biológicas da
UNIASSELVI. Uma amostragem aleatória simples foi utilizada para selecionar
10 acadêmicos dentre todos os acadêmicos da turma de Ciências Biológicas.
As variáveis amostradas foram as notas que cada acadêmico obteve nas duas
avaliações da disciplina e, portanto, são variáveis quantitativas contínuas. A
Tabela 1 é importante porque mostra os dados que foram coletados. No entanto,
não é fácil tirar conclusões a partir dos números observados nessa tabela. Por
exemplo, você diria que os acadêmicos tiveram um desempenho melhor na
primeira ou na segunda avaliação? Não é muito fácil responder isso, certo?

TABELA 1 - NOTAS DAS AVALIAÇÕES DE ESTATÍSTICA DE 10 ALUNOS DE CIÊNCIAS


BIOLÓGICAS DA UNIASSELVI

Unidade amostral 1° Avaliação de Estatística 2° Avaliação de Estatística


(Acadêmico) (Notas) (Notas)
1 2 4
2 6 7
3 7 7
4 5 6
5 8 5
6 4 6
7 6 8
8 7 5
9 3 6
10 9 10
FONTE: A autora

15
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Para facilitar a interpretação e apresentação de dados, podemos resumi-


los em alguns números que descrevem todo o conjunto. Isso pode ser feito por
meio da Estatística Descritiva. A partir de agora estudaremos como representar
dados por meio de medidas de tendência central e medidas de dispersão, que são
as duas formas de resumir dados pela Estatística Descritiva.

5.1 MEDIDAS DE TENDÊNCIA CENTRAL


Uma medida de tendência central, também chamada de medida de
posição, representa um valor central dentre a variabilidade de valores que uma
variável pode apresentar na população. A seguir estudaremos três diferentes
medidas de tendência central: média, mediana e moda.

5.1.1 Média
A média é a medida de tendência central mais utilizada, pois é facilmente
calculada e interpretada (CALLEGARI-JACQUES, 2003). Você mesmo já deve ter
calculado alguma média antes! Além disso, a média tem propriedades estatísticas
que permitem que ela seja usada em vários testes estatísticos e na inferência
estatística (CALLEGARI-JACQUES, 2003), conforme veremos nas próximas
unidades desse caderno.

A média de uma amostra é representada pela mesma letra que identifica


a variável, a partir da qual a média foi calculada, acrescida de um traço na parte
superior. Se a variável é identificada pela letra x, a média é representada por x
(lê-se “x barra”). Já a média de uma população é representada por m (letra “m” do
alfabeto grego). A média de uma amostra representa uma estimativa, enquanto a
média de uma população é um parâmetro.

Para calcular uma média basta somar o valor de todas as unidades


amostrais e dividir pelo número total de unidades amostrais da amostra. A
1 n
equação matemática da média é: x = ∑xi
n i =1
Essa é a primeira equação matemática apresentada neste caderno de
estatística! Você ficou assustado? Calma, vamos por partes para entender o que
esta equação quer dizer. O termo xi representa uma unidade amostral da amostra,
e o subscrito i indica qual das unidades amostrais estamos falando. Assim, x1
representa a primeira unidade amostral da amostra, x2 é a segunda unidade
da amostra e assim por diante até a última unidade amostral da amostra, que
é representada por xn. O n representa o número total de unidades amostrais da
amostra. O símbolo ∑ é a letra grega maiúscula sigma e indica que devemos
somar tudo o que está à direita dele. O intervalo de valores que devemos somar
é indicado pelos termos que se encontram subscrito e sobrescrito no ∑, ou seja, o

16
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

subscrito do ∑, i = 1, indica que o somatório deve iniciar na unidade amostral x1.


O sobrescrito do ∑, n, indica que o somatório deve terminar na última unidade

n
amostral da amostra, que é xn. Portanto, x diz que devemos somar da
i =1 i
primeira unidade amostral (x1) até a última unidade amostral (xn) da amostra,
1
ou seja, devemos somar todas as unidades amostrais da amostra. Finalmente, n
indica que o resultado do somatório deve ser dividido pelo número de unidades
amostrais da amostra (n).

Agora que você já sabe o que cada termo da equação significa, vamos
calcular a média das notas da primeira avaliação de estatística da turma de
Ciências Biológicas da UNIASSELVI. Os dados estão na Tabela 1. Essa amostra
é composta de 10 unidades amostrais (n = 10). Cada acadêmico representa uma
unidade amostral (xi). Precisamos somar a nota de todos os acadêmicos, ou seja,
a nota do primeiro acadêmico que é x1 = 2, a nota do segundo acadêmico que é x2
= 6 , a nota do terceiro acadêmico que é x3 = 7 e assim até o último acadêmico x10 =
9. O somatório das notas de todos os acadêmicos deve ser dividido pelo número
total de acadêmicos da amostra, ou seja, n = 10.

1 n 1
=x ∑
n i =1
xi ≡   × ( 2 + 6 + 7 + 5 + 8 + 4 + 6 + 7 + 3 + 9 )
 10 
57
x = 5, 7
=
10

A média de notas da primeira avaliação de estatística foi de 5,7.

Foi difícil fazer esse cálculo? Vamos praticar um pouco mais? Tente
calcular a média para as notas da segunda avaliação de estatística. Os dados estão
na Tabela 1. No final dos cálculos você deve chegar ao resultado x = 6,4.

A média pode ser calculada apenas para variáveis quantitativas, como


variáveis discretas e contínuas. A média não pode ser aplicada para variáveis
categóricas, como as nominais ou ordinais (PAGANO; GAUVREAU, 2013). Além
disso, a média é sensível a valores extremos. Por exemplo, a média dos números
3, 4 e 5 é x = 4. Caso o número 5 seja substituído por 55, a média passa a ser 20,7.

17
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

TURO S
ESTUDOS FU

Caro acadêmico, você entendeu como calcular uma média? Se não, leia
novamente para tentar entender. É muito importante que você tenha entendido isso, pois
utilizaremos a média em outros momentos ao longo do caderno.

5.1.2 Mediana
Para achar o valor que representa a mediana, primeiramente precisamos
fazer uma ordenação crescente de todos os valores das unidades amostrais da
amostra (VIEIRA, 2011). A mediana é o valor que ocupa a posição central na
ordenação. Assim, metade dos valores da amostra é igual ou menor que a
mediana, enquanto metade dos valores é igual ou maior que a mediana.

Quando o número de unidades da amostra é ímpar, existe um único


valor que ocupa a posição central, e esse valor é a mediana. Por exemplo,
para a sequência de três números (1, 5 e 7), a mediana é o valor que ocupa a
2ª posição, ou seja, a mediana é igual a 5. Já quando o número de unidades
da amostra é par, dois números ocupam a posição central e é preciso fazer
uma média dos dois valores para encontrar a mediana. Por exemplo, para a
sequência de quatro números (1, 5, 6 e 7), precisamos calcular a média dos
valores que estão nas posições 2 e 3, ou seja, a média de 5 e 6, o que resulta em
uma mediana de 5,5.

Vamos encontrar a mediana para as notas da primeira avaliação de


estatística. Primeiro precisamos fazer uma ordenação crescente de todos
os valores das notas, conforme está apresentado na Tabela 2. Como são 10
unidades amostrais, um número par, a mediana está entre as posições 5 e 6. A
5ª posição é ocupada pela nota 6 e a 6ª posição também é ocupada pela nota
6. Calculando a média entre 6 e 6, temos que a mediana das notas da primeira
avaliação de bioestatística é igual a 6.

TABELA 2 - ORDENAÇÃO CRESCENTE DAS NOTAS DA PRIMEIRA AVALIAÇÃO DE ESTATÍSTICA


DE 10 ALUNOS DE CIÊNCIAS BIOLÓGICAS DA UNIASSELVI

Posição (Ordenação Unidade amostral 1° Avaliação de


crescente das notas) (Acadêmico) Estatística (Notas)
1° 1 2
2° 9 3

18
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

3° 6 4
4° 4 5
5° 2 6
6° 7 6
7° 3 7
8° 8 7
9° 5 8
10° 10 9
FONTE: A autora

É fácil encontrar uma mediana, certo? Agora tente encontrar qual é a


mediana para as notas da segunda avaliação de estatística. Os dados estão na
Tabela 1. Você deve chegar ao resultado de que a mediana das notas da segunda
avaliação também é igual a 6.

A mediana não é sensível a valores extremos, pois a única informação


utilizada é o valor que ocupa a posição central na ordenação de todas as unidades
da amostra (PAGANO; GAUVREAU, 2013). A mediana pode ser usada tanto
para variáveis discretas e contínuas, quanto para variáveis nominais ou ordinais
(PAGANO; GAUVREAU, 2013).

5.1.3. Moda
A moda é o valor observado com maior frequência. Na sequência de
números 1, 7, 9, 3, 4, 3 e 5, a moda é igual a 3, pois é o valor observado mais vezes.
No entanto, algumas amostras podem não apresentar uma moda. Por exemplo,
na sequência 1, 6, 3, 1, 9, 3, 6 e 9 não existe uma moda, pois todos os valores foram
observados duas vezes.

Vamos encontrar a moda para as notas da primeira avaliação de estatística.


Os dados estão na Tabela 1. Nesse exemplo, as notas 6 e 7 são observadas duas
vezes, portanto, as notas da primeira avaliação de estatística apresentam duas
modas, que são 6 e 7. Nesses casos dizemos que a amostra é bimodal, ou seja,
apresenta dois valores mais frequentes.

Encontrar a moda também é simples, certo? Tente encontrar a moda para


as notas da segunda avaliação de estatística. Os dados estão na Tabela 1. Você deve
chegar ao resultado de que a moda para as notas da segunda avalição é igual a 6.

19
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

A moda pode ser usada tanto para variáveis discretas ou contínuas,


quanto para variáveis nominais ou ordinais.

5.2 MEDIDAS DE DISPERSÃO


As medidas de tendência central, como média, mediana e moda são
muito importantes, pois descrevem o valor central dentre a variação de valores
que as unidades amostrais podem apresentar. No entanto, também é necessário
ter uma ideia de quanto os valores das unidades amostrais podem variar além
da medida de tendência central. Será que todos os valores são parecidos, e
assim, concentram-se próximos do centro? Ou será que os valores são muito
diferentes e estão dispersos em um amplo intervalo? Para responder essas
perguntas, utilizamos as medidas de dispersão, também chamadas de medidas
de variabilidade, como a amplitude, intervalo interquartil, variância, desvio
padrão e coeficiente de variação.

5.2.1 Amplitude
A amplitude é o valor obtido pela diferença entre o menor e o maior
valor observado na amostra. Apesar de ser facilmente calculada e interpretada,
a amplitude não reflete bem a variabilidade da amostra, pois é obtida utilizando
apenas dois valores da amostra (VIEIRA, 2011). Assim, dois conjuntos de dados
podem apresentar a mesma amplitude, mas terem variabilidades muito diferentes
(VIEIRA, 2011). Além disso, a amplitude é afetada pelos valores extremos e só
pode ser utilizada para variáveis discretas ou contínuas.

Vamos calcular a amplitude para as notas da primeira avaliação de


estatística. Os dados estão na Tabela 1. A nota mais baixa foi 2 e a nota mais alta
foi 9, o que resulta em uma amplitude de 7. Simples, você não achou? Agora tente
calcular a amplitude para as notas da segunda avaliação de estatística (Tabela 1).
Você deve encontrar como resultado uma amplitude igual a 6.

5.2.2 Intervalo interquartil


A partir da ordenação crescente das unidades amostrais de uma amostra,
como fizemos para encontrar a mediana (Tabela 2), é possível dividir as unidades
em quatro grupos, que são chamados de quartis (CALLEGARI-JACQUES, 2003).
Cada quartil corresponde a 25% das unidades amostrais da amostra. O primeiro
quartil (Q1) engloba 25% das unidades amostrais com os menores valores, o
segundo quartil (Q2) é igual à mediana, e o terceiro quartil (Q3) agrupa 75% das
unidades amostrais.

20
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

Antes de calcular o intervalo interquartil é necessário descobrir qual


posição na ordenação de valores é equivalente a cada quartil. Para isso podemos
usar a equação Qi = i(n + 1)/4, em que i representa cada um dos quartis (1, 2, 3 ou
4), e n representa o número de unidades amostrais da amostra. Após encontrar
as posições que equivalem ao primeiro e ao terceiro quartil, é possível calcular
o intervalo interquartil pela subtração do valor que ocupa o terceiro quartil do
valor que ocupa o primeiro quartil (Q3 - Q1).

Vamos calcular o intervalo interquartil para as notas da primeira avaliação


de estatística. Para facilitar, podemos observar os dados da Tabela 2, pois já
estão ordenados. A posição que corresponde ao primeiro quartil é Q1 = 1 x (10
+ 1)/4 = 2,75. Podemos arredondar o valor 2,75 para 3, e assim, Q1 é a nota da
3ª posição, que corresponde à nota 4. Já o terceiro quartil é Q3 = 3 x (10 + 1)/4 =
8,25. Arredondando para 8, Q3 equivale à nota na 8ª posição, ou seja, nota 7. O
intervalo interquartil é resultante de Q3 - Q1, ou seja, 4 - 7 = |-3|.

Agora calcule o intervalo interquartil para as notas da segunda avaliação


de estatística. Os dados estão na Tabela 1. Você deve encontrar que o intervalo
interquartil para as notas da segunda avaliação é igual a 2.

O intervalo interquartil, que também pode ser chamado de intervalo


interquartílico ou distância interquartílica, é uma medida de dispersão
interessante, pois sofre menor influência de valores extremos, em comparação à
amplitude (VIEIRA, 2011).

5.2.3 Variância
Uma medida de dispersão muito usada é a variância, e como veremos nas
próximas unidades desse caderno, ela é utilizada em vários testes estatísticos.
A variância mede como os dados variam em torno da média (PAGANO;
GAUVREAU, 2013). Se a variância é pequena, quer dizer que os dados estão
agrupados em torno da média, enquanto uma variância grande significa que os
dados estão dispersos em relação à média (VIEIRA, 2011).

A variância de uma amostra, que é uma estimativa, é representada por s2.


Já a variância de uma população, que é o parâmetro, é representada por s2 (sigma
minúsculo do alfabeto grego).

Considerando que a variância mede a variabilidade das unidades


amostrais em relação à média, uma maneira de quantificá-la é fazer uma média
da distância das unidades amostrais em relação à média amostral, conforme a
1 n
=
equação: s2 ∑ ( xi - x )
n i =1

21
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Os termos que compõem essa equação são os mesmos que você


aprendeu quando calculou a média. Caso você não lembre o que cada termo
significa, consulte a Tabela 4 (adiante). A equação diz que devemos pegar
cada uma das unidades amostrais e subtrair da média amostral (xi - x ), depois
somar o resultado de cada uma das subtrações e, por fim, dividir o somatório
pelo número total de unidades amostrais (n), ou seja, a equação da variância
é uma média da soma das diferenças de cada unidade amostral em relação à
média. No entanto, o somatório de (xi - x ) sempre resulta em zero. Isso acontece
porque a soma das diferenças das unidades amostrais com valores menores
que x é igual à soma das diferenças das unidades com valores maiores que x ,
ou seja, as duas somas se cancelam. Uma opção para resolver esse problema é
1 n

∑ ( xi - x )
2 2
=
elevar (xi - x ) ao quadrado, conforme a equação: s
( n - 1) i =1

Sempre que você for calcular uma variância, utilize essa última
equação. A equação nos diz que devemos fazer o somatório do quadrado da
diferença de cada unidade amostral em relação à média e depois dividir esse
somatório por n - 1. Na equação anterior dividimos o somatório apenas por
n, mas o correto é dividir por n - 1, pois a equação da variância apresenta
uma estimativa, que é x . Sempre que existirem estimativas em uma equação,
o número equivalente às estimativas deve ser descontado do tamanho
amostral (n).

Agora vamos calcular a variância para as notas da primeira avaliação


de estatística. Para começar, precisamos calcular a diferença de cada unidade
amostral em relação à média (xi - x ), cujo somatório deve ser igual a zero
(terceira coluna da Tabela 3). Depois precisamos fazer o somatório de (xi - x
)2, que nesse caso é igual a 44,2 (quarta coluna da Tabela 3). Substituindo os
dados na equação, temos:

1 n
1 44, 2
∑ ( xi - x ) =
2
s2 = × 44, 2 = = 4,9
( n - 1) i =1 10 - 1 9

A variância para as notas da primeira avaliação de estatística é igual a 4,9.


Agora tente calcular a variância para as notas da segunda avaliação de estatística.
Os dados estão na Tabela 1. Você deve chegar ao resultado de que a variância das
notas da segunda avaliação é igual a 2,9.

22
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

A tabela a seguir demonstra que (xi - x ) é a diferença de cada unidade


amostral em relação à média; (xi - x )2 é o quadrado da diferença de cada unidade
amostral em relação à média. Dados referentes às notas da primeira avaliação
de estatística dos acadêmicos de Ciências Biológicas da UNIASSELVI, que
apresenta x = 5,7.

TABELA 3 - CÁLCULOS UTILIZADOS PARA SE OBTER A VARIÂNCIA DE UMA AMOSTRA

FONTE: A autora

5.2.4 Desvio padrão


O desvio padrão é obtido pela raiz quadrada positiva da variância
(PAGANO; GAUVREAU, 2013). O desvio padrão é mais usado que a variância,
pois está na mesma unidade de medida da variável investigada.

O desvio padrão de uma amostra, que é uma estimativa, é representado


por s. Já o desvio padrão de uma população, que é o parâmetro, é representado
por s (sigma minúsculo do alfabeto grego). A equação do desvio padrão é:

∑(x - x )
2
2
=s s
=
n -1

23
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Vamos calcular o desvio padrão para as notas da primeira avaliação


de estatística (Tabela 1). Para isso precisamos da variância, que já foi calculada
anteriormente e é igual a 4,9. Basta extrair a raiz quadrada de 4,9 para obter o
desvio padrão, que é igual a 2,2.

Tente calcular o desvio padrão para as notas da segunda avaliação de


estatística. Os dados estão na Tabela 1. Você deve chegar ao resultado de que o
desvio padrão das notas da segunda avalição é igual a 1,7.

ATENCAO

Caro acadêmico, você entendeu como calcular a variância e o desvio padrão?


Se não, leia novamente para compreender melhor. É muito importante que você tenha
entendido isso, pois utilizaremos a variância e o desvio padrão em outros momentos ao
longo do caderno.

5.2.5 Coeficiente de variação


O coeficiente de variação (CV) é utilizado quando queremos comparar
a variabilidade de dois conjuntos de dados que estão em unidades de medida
diferentes (PAGANO; GAUVREAU, 2013). Por exemplo, podemos comparar a
variabilidade na circunferência (medida em centímetros) e na altura (medida em
metros) das araucárias do reflorestamento por meio do coeficiente de variação.
s
O coeficiente de variação é obtido pela equação: CV= ×100 , ou seja, o
x
coeficiente de variação é a razão entre o desvio padrão (s) e a média ( x ) amostral,
multiplicado por 100. O coeficiente de variação é adimensional, pois a razão entre
s e x faz com que as unidades de medidas se cancelem. O coeficiente de variação
é expresso em porcentagem, em decorrência da multiplicação por 100.

Vamos calcular o coeficiente de variação para as notas da primeira

avaliação de estatística (Tabela 1). Para isso precisamos do desvio padrão (s = 2,2)
e da média ( x = 5,7). Substituindo os valores na equação, temos:

s 2, 2
CV = ×100 = ×100 =38, 6%
x 5, 7

24
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

Para as notas da primeira avaliação de estatística, o coeficiente de variação


é igual a 38,6%. Não é possível dizer se esse coeficiente de variação é alto ou
baixo, é preciso compará-lo em relação a outro valor.

Agora tente calcular o coeficiente de variação para as notas da segunda


avaliação de estatística. Os dados estão na Tabela 1. Você deve chegar ao resultado
de que o coeficiente de variação das notas da segunda avaliação é igual a 26,6%,
ou seja, um valor menor que o coeficiente de variação das notas da primeira
avaliação de estatística.

TABELA 4 - NOTAÇÕES MATEMÁTICAS E SEUS SIGNIFICADOS

FONTE: Adaptado de Vieira (2011)

25
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

6 USO DE TABELAS E GRÁFICOS


Na estatística descritiva você aprendeu como descrever um conjunto de
dados com apenas dois valores: uma medida de tendência central e uma medida
de dispersão. Além da estatística descritiva, também podemos resumir dados
utilizando tabelas e gráficos. A partir de agora, você aprenderá um pouco sobre
tabelas e gráficos, que são úteis para apresentar e sintetizar conjuntos de dados.

6.1 TABELAS
Toda tabela é composta por quatro elementos: o título, que explica o
conteúdo da tabela; o cabeçalho, que indica qual é o conteúdo de cada coluna;
a coluna indicadora, que especifica o conteúdo de cada linha; e o corpo, que é
preenchido pelos dados dispostos em linhas e colunas (VIEIRA, 2011).

6.1.1 Tabelas de distribuição de frequências


Uma tabela de distribuição de frequência é constituída por um conjunto
de classes ou categorias e o número de unidades amostrais que pertence a cada
uma das classes ou categorias (PAGANO; GAUVREAU, 2013). Tanto variáveis
nominais ou ordinais quanto variáveis discretas ou contínuas podem ser
apresentadas em tabelas de distribuição de frequências.

Variáveis nominais ou ordinais: Para resumir um conjunto de dados


composto por variáveis nominais ou ordinais em uma tabela de distribuição de
frequências, podemos simplesmente contar quantas unidades amostrais foram
classificadas em cada categoria preestabelecida (Tabela 5) (VIEIRA, 2011). Dessa
forma, chegamos à frequência absoluta em que cada categoria foi observada. Além
disso, pode ser interessante expressar quanto o número de unidades amostrais em
cada categoria representa do total de unidades da amostra (VIEIRA, 2011). Para
isso, dividimos o número de unidades amostrais em cada categoria pelo total
de unidades amostrais estudadas, depois multiplicamos por 100. Desta forma
teremos a frequência relativa em que cada categoria foi observada, expressa
em porcentagem. Com a frequência relativa podemos construir uma tabela de
distribuição de frequências relativas.

Para exemplificar como variáveis qualitativas podem ser resumidas em


tabelas de distribuição de frequências, utilizaremos os dados do Inventário
Florístico Florestal de Santa Catarina, que avaliou 723 espécies de plantas
da Floresta Ombrófila Densa e classificou cada espécie quanto à síndrome de
dispersão. Síndrome de dispersão é uma variável qualitativa nominal. A Tabela
5 apresenta o número de espécies de plantas que têm síndrome de dispersão
zoocórica, anemocórica e autocórica, ou seja, a frequência absoluta de cada

26
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

síndrome. A mesma tabela também apresenta a porcentagem de espécies em


cada categoria, ou seja, a frequência relativa de cada categoria, por exemplo, para
calcular a frequência relativa da síndrome de dispersão zoocoria, basta fazer o
seguinte cálculo: (564/723) x 100 = 78%, em que 564 é a frequência absoluta da
síndrome de dispersão zoocoria e 723 é o número total de espécies estudadas.

TABELA 5 - NÚMERO DE ESPÉCIES DE PLANTAS E PORCENTAGEM DE ESPÉCIES DE PLANTAS


POR SÍNDROME DE DISPERSÃO NA FLORESTA OMBRÓFILA DENSA DE SANTA CATARINA

Síndrome de dispersão Número de espécies Porcentagem de


espécies (%)
Zoocoria 564 78,0
Anemocoria 107 14,8
Autocoria 49 6,8
Espécies não 3 0,4
classificadas
Total 723 100,0
FONTE: Adaptado de Gasper et al. (2014)

Variáveis discretas ou contínuas: Para organizar dados de variáveis


discretas ou contínuas em tabelas de distribuição de frequências, primeiramente
é necessário dividir o intervalo de valores que a variável apresenta em classes,
depois encaixar cada unidade amostral dentro de alguma classe criada e, no
final, contar o número de unidades amostrais por classe (Tabela 6) (PAGANO;
GAUVREAU, 2013).

É interessante que as classes tenham intervalos com tamanhos iguais, o


que facilita futuras comparações entre classes (PAGANO; GAUVREAU, 2013).
Para definir os intervalos de classes é preciso ordenar as unidades amostrais em
sequência crescente. Depois de ordenar todos os valores, é necessário identificar
os valores máximo e mínimo para calcular a amplitude dos valores. A amplitude
é dada pela diferença entre o máximo valor e o mínimo valor. Na sequência, é
preciso dividir a amplitude pelo número de classes em que se deseja organizar os
dados. A escolha do número de classes é arbitrária e fica a critério do pesquisador.
O resultado da divisão da amplitude pelo número de classes corresponde ao
intervalo de classes. Os limites da primeira classe serão: limite inferior, o valor
mínimo observado na amostra; limite superior, o limite inferior da primeira
classe somado ao intervalo de classes. Limites da segunda classe serão: limite
inferior, o limite superior da primeira classe; limite superior, o limite inferior da
segunda classe somado ao intervalo de classes. Assim sucessivamente até que
toda variação de valores que a amostra apresenta seja incluída em classes.

27
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Como exemplo didático, vamos organizar as notas da primeira avaliação


de estatística de 50 acadêmicos de Ciências Biológicas da UNIASSELVI (Quadro
1) em uma tabela de distribuição de frequências com três classes. Como as notas
dos 50 acadêmicos já estão ordenadas no quadro, podemos calcular a amplitude
de valores pela diferença da maior nota observada (nota 10) pela menor nota
(nota 1). A amplitude é igual a 9. Para obter o intervalo de classes, é só dividir
a amplitude (9) pelo número de classes (três classes), que já foi preestabelecido.
Intervalo de classes é (9/3 = 3). Os limites da primeira classe são: limite inferior = 1,
a menor nota observada na amostra; limite superior = 4, que corresponde à soma
do limite inferior da primeira classe ao intervalo de classes. Os limites da segunda
classe são 4 e 7 e da terceira classe, 7 e 10. Depois de estabelecer os limites das
classes, contamos quantas notas se encaixam em cada classe. O resultado pode
ser observado na Tabela 6.

QUADRO 1 - NOTAS DA PRIMEIRA AVALIAÇÃO DE ESTATÍSTICA DOS 50 ALUNOS DE CIÊNCIAS


BIOLÓGICAS DA UNIASSELVI

1,0 1,5 2,0 2,2 2,3 2,8 3,0 3,3 3,7 3,9
4,0 4,2 4,4 4,9 5,0 5,0 5,0 5,3 5,5 5,7
5,7 5,9 6,0 6,0 6,0 6,0 6,0 6,1 6,4 6,5
6,5 6,5 6,9 7,0 7,0 7,0 7,2 7,3 7,5 7,5
7,6 7,9 8,0 8,3 8,4 8,5 9,0 9,5 10,0 10,0
FONTE: A autora

Além disso, a frequência absoluta de cada classe também pode ser expressa
em frequência relativa (veja a Tabela 6). Para isso, é necessário dividir o número
de acadêmicos de cada classe pelo número total de acadêmicos estudados (n = 50)
e multiplicar por 100. Por exemplo, a frequência relativa da primeira classe é (11
x 50)/100 = 22% (Tabela 6).

TABELA 6 - TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS ABSOLUTAS E RELATIVAS DAS NOTAS


DA PRIMEIRA AVALIAÇÃO DE ESTATÍSTICA DOS 50 ACADÊMICOS DA TURMA DE CIÊNCIAS
BIOLÓGICAS DA UNIASSELVI

Classes de Número de acadêmicos por Porcentagem de


notas classe acadêmicos por classe (%)
1a4 11 22
4a7 25 50
7 a 10 14 28
FONTE: A autora

28
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

6.1.2 Tabelas de contingência


Quando as unidades amostrais são classificadas de acordo com duas
variáveis qualitativas, os dados podem ser organizados em uma tabela de
contingência (Tabela 7) (VIEIRA, 2011). Tabelas de contingência são tabelas
com duplas entradas, cada uma representando uma das variáveis qualitativas
(VIEIRA, 2011). Também podemos construir tabelas de contingência para
variáveis quantitativas discretas ou contínuas, desde que os valores das variáveis
quantitativas sejam separados em classes e, assim, cada classe é equivalente a
uma categoria de uma variável qualitativa.

Para construir uma tabela de contingência, utilizaremos novamente


os dados do Inventário Florístico Florestal de Santa Catarina, que avaliou 723
espécies de plantas da Floresta Ombrófila Densa e classificou cada espécie quanto
à síndrome de dispersão e o estágio sucessional. A Tabela 7, que é uma tabela
de contingência desses dados, expressa o número de espécies em cada uma das
categorias de síndrome de dispersão e estágio sucessional. Por exemplo, dentre
as 564 espécies zoocóricas, 106 delas são espécies pioneiras.

TABELA 7 - SÍNDROME DE DISPERSÃO E ESTÁGIO SUCESSIONAL DAS ESPÉCIES DE PLANTAS


DA FLORESTA OMBRÓFILA DENSA DE SANTA CATARINA

Estágio sucessional
Síndrome de
Não Total
dispersão Pioneira Secundária Climácica
classificada
Zoocoria 106 264 137 57 564
Anemocoria 32 64 5 6 107
Autocoria 16 20 6 7 49
Não
0 0 0 3 3
classificada
Total 154 348 148 73 723
FONTE: Adaptado de Gasper et al. (2014)

6.2 GRÁFICOS
Além da estatística descritiva e de tabelas, também podemos utilizar
gráficos para organizar e resumir dados. A partir de agora você conhecerá os
principais tipos de gráficos que podem ser usados para apresentar dados.

29
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

6.2.1 Gráfico de barras


O gráfico de barras é utilizado para representar a distribuição de
frequência de variáveis nominais ou ordinais (PAGANO; GAUVREAU, 2013).
Em um plano cartesiano, no eixo horizontal (eixo x) são apresentadas as
categorias em que as unidades amostrais foram classificadas. O eixo vertical
(eixo y) representa a frequência absoluta ou relativa das observações dentro de
cada categoria e obedece a uma escala. Sobre cada categoria no eixo horizontal
são desenhadas barras. A altura de cada barra corresponde à frequência
absoluta ou relativa em que cada categoria foi observada. As barras devem ter a
mesma largura e devem ser separadas uma das outras, pois se estiverem juntas
representam uma variável contínua.

No gráfico a seguir você pode observar dois exemplos de gráficos


de barras para as 723 espécies de plantas da Floresta Ombrófila Densa que
foram classificadas quanto à síndrome de dispersão. O Gráfico 1A apresenta a
frequência absoluta em que cada síndrome de dispersão foi observada, enquanto
O Gráfico 1B mostra a frequência relativa de cada síndrome de dispersão. No
eixo horizontal são apresentadas as três síndromes de dispersão e no eixo
vertical a frequência de observações seguindo uma escala. Note também que
cada eixo possui sua respectiva legenda.

GRÁFICO 1 - NÚMERO DE ESPÉCIES (A) E PORCENTAGEM DE ESPÉCIES (B) DE PLANTAS POR


SÍNDROME DE DISPERSÃO NA FLORESTA OMBRÓFILA DENSA DE SANTA CATARINA

FONTE: Adaptado de Gasper et al. (2014)

30
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

6.2.2 Histograma
O histograma é um tipo de gráfico usado para representar distribuições
de frequências de variáveis discretas ou contínuas (PAGANO; GAUVREAU,
2013). É composto por um eixo horizontal (eixo x) que representa as classes em
que a amplitude de valores da variável foi separada; e um eixo vertical (eixo y),
que compreende a frequência de observações dentro de cada classe. A frequência
de observações de cada classe é representada pela área de barras verticais. O
conjunto da área de todas as barras deve somar 100% (PAGANO; GAUVREAU,
2013). Dessa forma, a proporção da área de uma classe é equivalente à sua
frequência relativa e, assim, um histograma de frequências relativas tem o mesmo
formato que um histograma de frequências absolutas. Note que as barras devem
ser justapostas, o que indica que a variável representada é contínua.

O Gráfico 2 apresenta o histograma para os dados do Quadro 1. As notas


da primeira avaliação de 50 acadêmicos de Ciências Biológicas foram separadas
em 10 classes, e os intervalos das classes podem ser observados no eixo x. No eixo
y está a frequência de observações de cada classe.

GRÁFICO 2 - NOTAS DA PRIMEIRA AVALIAÇÃO DE ESTATÍSTICA DOS 50 ACADÊMICOS DA


TURMA DE CIÊNCIAS BIOLÓGICAS DA UNIASSELVI

FONTE: A autora

31
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

6.2.3 Box plot


Box plot, também chamado de diagrama de caixa, é utilizado para
apresentar um resumo dos dados (PAGANO; GAUVREAU, 2013). Nele estão
representados o primeiro e terceiro quartis, a mediana e os valores mais extremos
observados na amostra.

Um box plot é composto por uma caixa central, que se estende verticalmente,
que corresponde ao intervalo interquartil e representa 50% dos dados. O limite
inferior da caixa corresponde ao valor do primeiro quartil, o limite superior da
caixa representa o valor do terceiro quartil, e o pequeno quadrado no centro
indica a mediana (PAGANO; GAUVREAU, 2013). Caso a mediana esteja situada
próxima ao meio da caixa, os dados são ligeiramente simétricos.

As barras que se estendem para fora da caixa correspondem aos valores


mais extremos observados na amostra, mas que estão a menos de 1,5 vezes a
altura da caixa além dos quartis (PAGANO; GAUVREAU, 2013). Existindo
alguma unidade amostral com valor mais extremo que 1,5 vezes a altura da caixa,
esta unidade é representada por um círculo ou um asterisco e corresponde a um
valor atípico (PAGANO; GAUVREAU, 2013).

Na Figura 3 é apresentado um box plot das notas da primeira


avaliação de 10 acadêmicos de Ciências Biológicas da UNIASSELVI,
que são os mesmos dados da Tabela 1. Você lembra que já calculamos
a mediana (Q2 = 6), o primeiro quartil (Q1 = 4) e o terceiro quartil
(Q3 = 7) para as notas dos 10 acadêmicos. Também já identificamos as notas
mais extremas para calcular a amplitude, que foram as notas 2 e 9. Agora
todos esses valores estão representados no box plot.

32
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA

FIGURA 3 - BOX PLOT PARA AS NOTAS DA PRIMEIRA AVALIAÇÃO DA DISCIPLINA DE


ESTATÍSTICA DE 10 ACADÊMICOS DE CIÊNCIAS BIOLÓGICAS DA UNIASSELVI

FONTE: A autora

6.2.4 Gráfico de dispersão bidimensional


Um gráfico de dispersão bidimensional deve ser usado para representar
a relação entre duas variáveis contínuas (PAGANO; GAUVREAU, 2013). Cada
ponto no gráfico corresponde a uma unidade amostral e suas medidas para
duas variáveis estudadas. O eixo horizontal (eixo x) representa uma variável e
o eixo vertical (eixo y) a outra variável, cada variável em sua respectiva escala
(PAGANO; GAUVREAU, 2013).

O Gráfico 3 traz a dispersão bidimensional para as notas da primeira e


segunda avaliação da disciplina de estatística de 10 acadêmicos de Biologia da
UNIASSELVI (dados da Tabela 1). Note que cada círculo representa um acadêmico
e sua posição no gráfico corresponde às notas obtidas na primeira e na segunda
avaliação. Por exemplo, o círculo mais à esquerda corresponde a um acadêmico
que tirou nota 2 na primeira avaliação e nota 4 na segunda avaliação.

33
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

GRÁFICO 3 - RELAÇÃO ENTRE A PRIMEIRA E A SEGUNDA NOTA DA AVALIAÇÃO DA DISCIPLINA


DE ESTATÍSTICA DE 10 ACADÊMICOS DE CIÊNCIAS BIOLÓGICAS DA UNIASSELVI

FONTE: A autora

34
RESUMO DO TÓPICO 1
Neste tópico, você aprendeu que:

• Estatística é a ciência que orienta a coleta, organização, análise e interpretação


de dados.

• Uma população é o conjunto de todas as unidades amostrais em estudo,


enquanto uma amostra é um subconjunto de unidades amostrais da população.
Unidade amostral é uma unidade da população sobre a qual é feita a coleta de
dados.

• A estimativa é um valor que resume uma característica da amostra, enquanto


o parâmetro é um valor que resume uma característica da população.

• Variável é qualquer característica observada na unidade amostral e que pode


variar entre as unidades amostrais. Podem ser classificadas, quanto à natureza
que possuem, em: i) variáveis quantitativas discretas ou contínuas, que são
valores numéricos e expressam quantidades; ii) variáveis qualitativas nominais
ou ordinais, que fornecem dados de natureza não numérica; iii) variáveis
derivadas, que são geradas a partir de operações lógicas ou matemáticas de
outras variáveis.

• Geralmente é inviável fazer um censo, pois a população é muito grande e


essa tarefa demandaria muito tempo e recurso financeiro. Por isso precisamos
amostrar, ou seja, selecionar parte das unidades amostrais de maneira que
representem a população.

• Existem diferentes estratégias de amostragem: i) amostragem aleatória simples,


em que todas as unidades amostrais da população têm igual chance de serem
amostradas; ii) amostragem sistemática, em que as unidades amostrais são
escolhidas por um sistema predefinido; iii) amostragem estratificada, que
pode ser aplicada quando se sabe que a população é composta por estratos;
iv) amostragem de conveniência, em que o pesquisador avalia as unidades
amostrais porque dispõe delas ou porque são unidades de fácil acesso.

• Um dos principais objetivos em ciência é obter conclusões confiáveis a respeito


da população (o parâmetro) tendo como base apenas informações da amostra
(a estimativa), ou seja, fazer inferências estatísticas sólidas.

• A Lei dos Grandes Números estabelece que quanto maior o tamanho amostral,
mais próxima uma estimativa estará do parâmetro populacional.

35
• A Estatística Descritiva é utilizada para descrever resumidamente um
conjunto de dados por meio das: i) medidas de tendência central (média,
mediana e moda), que descrevem o valor central dentre a variação de valores
que as unidades amostrais podem apresentar; ii) medidas de dispersão
(amplitude, intervalo interquartil, variância, desvio padrão e coeficiente de
variação), que avaliam quanto os valores das unidades amostrais podem
variar além da medida de tendência central.

• A principal medida de tendência central é a média, que compreende em somar


o valor de todas as unidades amostrais e dividir pelo tamanho amostral.

• As principais medidas de dispersão são a variância e o desvio padrão. A


variância é a razão do somatório do quadrado da diferença de cada unidade
amostral em relação à média pelo tamanho amostral. O desvio padrão é obtido
pela raiz quadrada da variância.

• Podemos resumir e apresentar dados por meio de tabelas, como as tabelas de


distribuição de frequências e tabelas de contingência, ou por meio de gráficos,
como o gráfico de barras, o histograma, o box plot e o gráfico de dispersão
bidimensional.

36
AUTOATIVIDADE

Caro acadêmico! Para fixar melhor o conteúdo estudado, vamos


exercitar um pouco. Leia as questões a seguir e responda-as em seu caderno
de estudos. Bom trabalho!

1 Uma pesquisadora especialista em pequenos mamíferos acabou de


conseguir financiamento para seu projeto, que tem por objetivo investigar
se a qualidade dos fragmentos florestais influencia a riqueza de espécies de
pequenos mamíferos na Floresta de Araucárias. Para isso, a pesquisadora
propôs amostrar a riqueza de espécies em 50 fragmentos florestais
distribuídos aleatoriamente pela extensão da Floresta de Araucárias no
Sul e Sudeste do Brasil. Ela pretende criar uma grid (uma rede de células
com comprimento e largura definidos) com células de 10 km por 10 km
de extensão que cubra toda a Floresta de Araucárias. Dentre as células
da grid a pesquisadora irá sortear 50 células. Como uma célula pode ter
mais de um fragmento florestal, a pesquisadora também vai sortear um
fragmento dentre todos os fragmentos florestais encontrados na célula. Nos
50 fragmentos florestais que serão selecionados, a pesquisadora irá registrar
a riqueza de espécies de pequenos mamíferos. A qualidade dos fragmentos
florestais será compilada a partir de um índice composto pelo tamanho do
fragmento florestal, distância para um fragmento florestal mais próximo e
altura das árvores do fragmento. A partir dessas informações sobre o projeto
da pesquisadora, identifique qual é a população, a amostra e a unidade
amostral do estudo. Que tipos de variáveis serão coletadas e qual a estratégia
de amostragem será empregada na pesquisa?

2 Os dados a seguir mostram a área foliar e área foliar específica (a razão da


área foliar pelo peso seco foliar) de 10 espécies de árvores da Mata Atlântica
que foram amostradas no Parque Estadual do Palmito, litoral do Paraná
(dados provenientes do estudo de BOEGER; WISNIEWSKI, 2003).

Sp1 Sp2 Sp3 Sp4 Sp5 Sp6 Sp7 Sp8 Sp9 Sp10 Sp11
Área foliar (cm )
2
47,1 42,5 32,0 27,9 22,6 20,5 5,0 16,0 35,6 23,1 15,9
Área foliar específica
108,6 83,9 75,8 76,3 138,6 82,4 91,5 76,1 89,3 82,5 87,7
(cm2.g-1)

Para cada variável apresentada acima (área foliar e área foliar específica),
calcule:

a) As medidas de tendência central: média, mediana e moda.


b) As medidas de dispersão: amplitude, intervalo interquartil, variância,
desvio padrão e coeficiente de variação.

Qual variável possui menor variabilidade?


37
38
UNIDADE 1
TÓPICO 2

DISTRIBUIÇÃO DE PROBABILIDADES

1 INTRODUÇÃO
Você acabou de aprender que a maioria dos estudos científicos precisa
trabalhar com amostras, pois é impossível coletar dados de toda a população.
Você também estudou como resumir e apresentar dados de uma amostra por
meio da estatística descritiva, tabelas e gráficos. No entanto, os pesquisadores
geralmente querem ir além de apenas apresentar dados. O objetivo maior é usar
informações contidas na amostra para fazer inferências a respeito da população.
A base teórica que permite dar esse passo é a probabilidade. Portanto, agora é
importante fazer uma revisão dos conceitos relacionados à probabilidade, bem
como estudar os principais tipos de distribuição de probabilidades.

Uma série de fenômenos probabilísticos acontece diariamente, como, por


exemplo, estar com pressa e ver que o ônibus acabou de passar pelo ponto ou
esquecer a janela do quarto aberta no dia de uma tempestade. Esses fenômenos
são probabilísticos porque eles podem ou não acontecer e é possível calcular a
probabilidade em que aconteçam. Assim, todos os fenômenos probabilísticos têm
duas características em comum. Primeiro, não é possível antecipar o resultado
de um fenômeno probabilístico (CALLEGARI-JACQUES, 2003; VIEIRA, 2011).
Apesar de não saber o que vai acontecer com certeza, é possível estabelecer
um padrão de comportamento em longo prazo (CALLEGARI-JACQUES, 2003;
VIEIRA, 2011).

O resultado de um fenômeno chamado de evento e o conjunto de eventos


é denominado de espaço amostral (CALLEGARI-JACQUES, 2003; VIEIRA, 2011).
A probabilidade, por sua vez, é uma medida da chance de cada evento acontecer
(CALLEGARI-JACQUES, 2003).

Para estabelecer a probabilidade de um evento acontecer, podemos utilizar


o conceito de frequências relativas (CALLEGARI-JACQUES, 2003; VIEIRA,
2011). Imagine n eventos que são mutuamente excludentes (ou seja, se um evento
ocorre, o outro não pode ocorrer) e igualmente prováveis. Alguns desses eventos
têm a característica A, e outros não têm. A probabilidade de ocorrer um evento
com a característica A (P(A)) é dada por:

39
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Vamos pensar em um exemplo prático. Um baralho é composto por 52


cartas, desconsiderando coringas. Das cartas do baralho, 26 são cartas vermelhas
e 26 são pretas. Podemos perguntar qual é a probabilidade de tirar uma carta
vermelha do baralho? A probabilidade é: P(carta vermelha) = 26/52 = 0,5. Podemos
multiplicar a probabilidade por 100 e obter uma porcentagem, que para esse
exemplo é de 50%.

A probabilidade tem duas propriedades importantes. Ela varia entre 0 e 1


(ou 0% a 100%). A soma das probabilidades de todos os eventos possíveis, dado
um espaço amostral, sempre é igual a 1% ou 100% (CALLEGARI-JACQUES,
2003; VIEIRA, 2011).

Geralmente queremos descobrir a probabilidade de um evento em


situações mais complexas que o exemplo das cartas vermelhas. Para isso,
podemos aplicar duas regras da probabilidade, que são: a regra da soma e a regra
do produto.

Regra da soma: a probabilidade de ocorrer A ou B é igual à soma da


probabilidade de ocorrer A e B, menos a probabilidade de ocorrer A e B juntos
(CALLEGARI-JACQUES, 2003; VIEIRA, 2011). Caso A e B sejam mutuamente
excludentes, a probabilidade de ocorrer A ou B é somente a soma das
probabilidades de A e B (CALLEGARI-JACQUES, 2003; VIEIRA, 2011).

Vamos exemplificar! Imagine que você quer saber qual é a probabilidade


de tirar do baralho uma carta que seja de copas ou uma carta que seja um
rei. O baralho tem 13 cartas de copas e quatro cartas de rei. As cartas não são
mutuamente excludentes, pois uma carta que tem as duas características que você
está procurando (o rei de copas) e, por isso, esta carta deve ser excluída na hora
de fazer o somatório das probabilidades. Então a probabilidade desse evento é:

Para exemplificar eventos mutuamente excludentes, imagine que você


quer calcular a probabilidade de tirar do baralho uma carta que seja dama ou
rei. No baralho existem quatro damas e quatro reis. Como damas e reis são
mutuamente excludentes, ou seja, não existe no baralho uma carta que seja dama
e rei ao mesmo tempo, a probabilidade é calculada por:

40
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES

Regra do produto: essa regra é usada quando queremos saber a


probabilidade de dois eventos que ocorrem simultaneamente ou um seguido do
outro (CALLEGARI-JACQUES, 2003; VIEIRA, 2011). Se A e B são dependentes (ou
seja, a ocorrência de um evento interfere na ocorrência do outro), a probabilidade
de ocorrer A e B é igual à probabilidade de ocorrer A multiplicada pela
probabilidade de ocorrer B, dado que A tenha ocorrido (CALLEGARI-JACQUES,
2003; VIEIRA, 2011). Caso A e B sejam independentes (ou seja, a ocorrência de um
evento não influencia na ocorrência do outro), a probabilidade de A e B ocorrerem
é igual à multiplicação das probabilidades de A e B (CALLEGARI-JACQUES,
2003; VIEIRA, 2011).

Vamos pensar em um exemplo em que os eventos são dependentes.


Imagine que você quer saber qual a probabilidade de tirar duas cartas de copas do
baralho em sequência e sem reposição de cartas. Como o baralho tem 13 cartas de
copas, a probabilidade da primeira carta ser de copas é 13/52. Já a probabilidade
da segunda carta ser de copas vai depender da primeira carta retirada. Se a
primeira carta for uma carta de copas, a probabilidade da segunda carta ser de
copas é 12/51. O denominador da razão é 51, pois a segunda retirada de cartas
tem uma carta a menos que a primeira. O cálculo da probabilidade é dado por:

Veremos um exemplo para eventos independentes. Vamos calcular a


probabilidade de tirar duas cartas de copas do baralho em sequência, mas agora
com reposição de cartas, ou seja, a carta retirada na primeira rodada volta para o
baralho. Nesse caso, é só multiplicar a probabilidade de tirar uma carta de copas
do baralho por ela mesma, como o cálculo a seguir demonstra:

Note que quando não há reposição de cartas no baralho, a probabilidade


de tirar duas cartas de copas na sequência é menor que quando há reposição
de cartas.

Existem casos em que a probabilidade de um evento acontecer muda


de acordo com a condição em que o evento acontece, o que é chamado de
probabilidade condicional (CALLEGARI-JACQUES, 2003; VIEIRA, 2011). Por

41
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

exemplo, a probabilidade de uma pessoa ter alguma doença cardíaca é maior se


ela for obesa. Já a chance de uma pessoa ter cáries é maior se ela não tem uma
higiene bucal adequada.

Voltando ao baralho, a probabilidade de tirar uma carta de paus do baralho


é de: P(tirar uma carta de paus do baralho) = 13/52 = 0,25, entretanto, imagine que o
baralho esteja dividido em cartas pretas e vermelhas, você gostaria de calcular a
probabilidade de tirar uma carta de paus apenas dentre as cartas pretas (26 cartas
do baralho são pretas). Nesse caso, a probabilidade é de P(tirar uma carta de paus
dentre cartas pretas) = 13/52 = 0,25, ou seja, quando consideramos apenas as cartas
pretas (a condição), a probabilidade de tirar uma carta de paus dobra.

2 DISTRIBUIÇÃO DE PROBABILIDADES
Você estudou anteriormente que variável é uma característica observada
nas unidades amostrais e que varia entre as unidades. Uma variável pode assumir
diferentes valores, e se os valores ocorrem por influência do acaso, essa variável é
chamada de variável aleatória (VIEIRA, 2011). Por exemplo, ao tirar uma carta do
baralho, essa carta pode ser qualquer uma dentre as 52 que compõem o baralho.
Qual carta será retirada depende do acaso. No exemplo do reflorestamento de
araucárias, o número de pinhas por araucária também é uma variável aleatória.
Se fizermos um sorteio para amostrar uma araucária, essa araucária terá um
determinado número de pinhas, que possivelmente seria diferente se outra
araucária tivesse sido sorteada.

Variáveis aleatórias são sempre números e, portanto, podem ser discretas


ou contínuas (VIEIRA, 2011). Uma variável aleatória discreta assume valores
que podem ser associados a números naturais, como a contagem do número de
pinhas por araucária. Já uma variável aleatória contínua pode assumir infinitos
valores num dado intervalo, como a altura das araucárias do reflorestamento. Um
tipo especial de variável aleatória discreta são as variáveis aleatórias binárias, que
podem assumir somente um de dois valores possível, como sexo masculino ou
feminino, fator Rh positivo ou negativo.

Variáveis aleatórias são representadas por letras maiúsculas (X, por


exemplo). Já valores observados de uma variável aleatória são representados pela
letra minúscula correspondente à variável (xi, por exemplo), e suas respectivas
probabilidades, por P(xi ).

Cada variável aleatória tem uma distribuição de probabilidades


correspondente (VIEIRA, 2011). A distribuição de probabilidades descreve
a chance de observar os diferentes valores que uma variável aleatória pode
apresentar (VIEIRA, 2011). Apesar de ser muito parecido com a distribuição
de frequências que você estudou para construir tabelas de distribuição de
frequências, distribuições de frequências e de probabilidades são diferentes.

42
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES

Uma distribuição de frequências é construída a partir de dados da amostra, ou


seja, são dados empíricos (VIEIRA, 2011). Se amostras independentes da mesma
população forem coletadas várias vezes, as distribuições de frequência obtidas
dessas amostras serão diferentes. Já uma distribuição de probabilidades é teórica
e estável, não muda, pois é construída com base em teoria e com base nos dados
de toda a população em estudo (VIEIRA, 2011).

A partir de agora você irá estudar dois tipos de distribuição teórica de


probabilidades: a distribuição binomial e a distribuição normal. A primeira
é usada para variáveis aleatórias binárias, e a última para variáveis aleatórias
contínuas.

2.1 DISTRIBUIÇÃO BINOMIAL


A distribuição binomial é usada para representar a distribuição de
probabilidades de variáveis aleatórias binárias (VIEIRA, 2011). Uma variável
aleatória binária assume um dentre dois valores possíveis, como, por exemplo,
feminino ou masculino, alérgico ou não alérgico, saudável ou doente. Para
simplificar, o valor assumido por uma variável aleatória binária é chamado
de “sucesso” ou “fracasso” (VIEIRA, 2011). A probabilidade de sucessos é
representada pela letra p e a probabilidade de fracassos, pela letra q (VIEIRA,
2011). O somatório de p e q resulta em 1 (p + q = 1).

Imagine que em uma determinada população, 30% das pessoas têm


alguma alergia alimentar. Nesse caso, podemos representar ter alergia alimentar
como “sucesso” (p) e não ter alergia alimentar como “fracasso” (q). Ao sortear
uma pessoa da população, a probabilidade dessa pessoa ter alergia alimentar é
P(p) = 0,3, enquanto a probabilidade de a pessoa não ter alergia é de P(p) = 1 - p =
1 - 0,3 = 0,7. Essas duas equações descrevem a distribuição de probabilidades da
variável aleatória alergia alimentar.

No entanto, podemos estar interessados em determinar a distribuição


de probabilidades para situações mais complexas, por exemplo, podemos nos
perguntar qual a probabilidade de sortear duas pessoas da população e ambas
apresentarem alergia alimentar. Para isso, precisamos determinar todas as
possíveis combinações entre alérgicos e não alérgicos a partir do sorteio de duas
pessoas da população, conforme apresentado na Tabela 8.

43
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

TABELA 8 - DISTRIBUIÇÃO DE PROBABILIDADES DE ALÉRGICOS AO SORTEAR DUAS PESSOAS


DA POPULAÇÃO. A PREVALÊNCIA DE PESSOAS ALÉRGICAS NA POPULAÇÃO É DE 30% (p = 0,3)

FONTE: Adaptado de Vieira (2011)

A partir da combinação de todas as possibilidades entre alérgicos e não


alérgicos e do cálculo da probabilidade das combinações (Tabela 8), chegamos ao
resultado de que a probabilidade de sortear duas pessoas da população e ambas
serem alérgicas é de 0,09 ou 9%. A distribuição de probabilidades de alérgicos ao
sortear duas pessoas da população também pode ser representada graficamente.

GRÁFICO 4 - DISTRIBUIÇÃO DE PROBABILIDADES DE ALÉRGICOS AO SORTEAR


DUASPESSOAS DA POPULAÇÃO

FONTE: A autora

44
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES

A distribuição de probabilidades para variáveis aleatórias binárias pode


n!
ser calculada pela equação: P ( x em n) = p x q (n- x )
x !(n - x)!
Nesta equação, p representa a probabilidade de sucesso, q é a probabilidade
de fracasso, x é o número de sucesso e n representa o número de tentativas. O
termo n! indica fatorial de um número. Por exemplo, fatorial do número quatro é
4! = 4 x 3 x 2 x 1 = 24. O fatorial de 0! = 1.

Observe o exemplo prático. Vamos calcular a distribuição de probabilidades


de alérgicos quando amostramos ao acaso cinco pessoas da população. Portanto,
n = 5 e x varia entre 0 e 5. Quando x = 0, ou seja, dentre as cinco pessoas sorteadas
nenhuma for alérgica, teremos a seguinte probabilidade:

Da mesma forma podemos calcular as probabilidades para x = 2, x = 3,


x = 4 e x = 5. A distribuição de probabilidades de alérgicos ao sortear cinco pessoas
da população é apresentada no gráfico a seguir. No diagrama de frequência de
probabilidades, as áreas de todas as barras somam 100%.

GRÁFICO 5 - DISTRIBUIÇÃO DE PROBABILIDADES DE ALÉRGICOS AO SORTEAR


CINCO PESSOAS DA POPULAÇÃO

FONTE: A autora

45
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

A distribuição binomial de uma variável aleatória pode ser determinada


se dois parâmetros forem fornecidos: i) n que é o número de tentativas (por
exemplo, o sorteio de 10 pessoas da população); ii) p que é a probabilidade de
sucesso em uma tentativa (VIEIRA, 2011).

A distribuição binomial assume que existe um número fixo de tentativas n,


e cada tentativa resulta em um de dois valores possíveis (PAGANO; GAUVREAU,
2013). Os resultados de n tentativas são independentes e a probabilidade de p é
constante em todas as tentativas (PAGANO; GAUVREAU, 2013).

A média de uma distribuição binomial é dada por m = np (VIEIRA, 2011).


Enquanto a variância é obtida por s2 = npq (VIEIRA, 2011). Note que a média e a
variância são parâmetros da população, e por isso são representadas por m e s2,
respectivamente.

Para calcular a média e a variância de uma distribuição binomial, vamos


voltar ao exemplo da população que apresenta prevalência de alérgicos de 30% (p
= 0,3). Imagine que você gostaria de saber quantas pessoas em média têm alergia
alimentar considerando uma amostra de 100 pessoas (n = 100). Neste caso, a média
é m = 100 x 0,3 = 30, ou seja, ao amostrar 100 pessoas, em média 30 apresentam
alergia alimentar. A variância para este caso é s2 = 100 x 0,3 x 0,7 = 21.

2.2 DISTRIBUIÇÃO NORMAL


Você já estudou como representar a distribuição de frequências de
variáveis contínuas em forma de histograma. No Gráfico 2 você pôde ver um
histograma para a distribuição de frequências de notas da primeira avaliação de
estatística de 50 acadêmicos de Ciências Biológicas da UNIASSELVI.

Outro histograma de frequências, mas para dados reais, é apresentado no


Gráfico 6. São dados referentes ao peso de 216.682 recém-nascidos vivos na cidade
de São Paulo no ano de 1998 (dados provenientes de MONTEIRO; BENICIO;
ORTIZ, 2000). A amostragem do peso dos recém-nascidos pode ser considerada
um censo, pois todos os recém-nascidos da cidade de São Paulo em 1998 foram
incluídos na amostra.

Note que nos dois histogramas mencionados existe uma maior frequência
de observações para os valores centrais, enquanto valores mais extremos são
menos frequentes. Muitas variáveis estudadas na biologia apresentam esse tipo
de distribuição de frequências, que é muito parecida com uma distribuição de
probabilidades teórica chamada de distribuição normal.

A distribuição normal também pode ser denominada de distribuição


Gaussiana ou curva em forma de sino, e sua representação teórica é apresentada
no Gráfico 7. Apesar de nenhuma distribuição de frequências de dados empíricos

46
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES

ter todas as propriedades de uma distribuição normal, a tendência de uma


variável apresentar distribuição normal permite resolver várias questões em
estatística (VIEIRA, 2011), como veremos nas próximas unidades desse caderno.

GRÁFICO 6 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO PESO DE 216.682 NASCIDOS VIVOS


NO ANO DE 1998 NA CIDADE DE SÃO PAULO

FONTE: Adaptado de Monteiro, Benicio e Ortiz (2000)

2.2.1 Características da distribuição normal


A distribuição normal tem a forma de um sino ou montanha, o Gráfico 6
traz a demonstração. Ela representa uma população infinita, ou seja, os valores
no eixo x podem variar desde infinito negativo (-∞) até o infinito positivo (+∞)
(CALLEGARI-JACQUES, 2003). Portanto, a curva nunca toca o eixo x e as caudas
da curva são abertas (CALLEGARI-JACQUES, 2003). O eixo y não mostra a
proporção de observações por classes como nos outros histogramas que vimos
até agora, pois é impossível calcular a proporção de observações sobre uma
quantidade infinita (VIEIRA, 2011). No entanto, a curva abrange toda a população
em estudo, e assim, a área total sob a curva vale 1% ou 100% (CALLEGARI-
JACQUES, 2003; VIEIRA, 2011).

A distribuição normal pode ser determinada quando dois parâmetros de


uma variável são fornecidos: a média (m) e o desvio padrão (s) (CALLEGARI-
JACQUES, 2003; VIEIRA, 2011), que são calculados conforme as equações que
você já estudou no item sobre Estatística Descritiva. A probabilidade de observar
um valor x qualquer da variável estudada pode ser calculada pela equação:
2
1  x-m 
1 - 
s 
f ( x) = e 2
s 2p

47
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Na equação, x é um valor da variável X para o qual se quer calcular a


probabilidade, p é pi (3,14...), e é exponencial na base do logaritmo natural, m é a
média e s é o desvio padrão.

GRÁFICO 7 - REPRESENTAÇÃO DE UMA CURVA DE DISTRIBUIÇÃO NORMAL TEÓRICA

FONTE: A autora

Na distribuição normal, as medidas de tendência central média, mediana e


moda coincidem e estão no centro da distribuição (CALLEGARI-JACQUES, 2003;
VIEIRA, 2011). A curva é simétrica em torno da média, ou seja, o intervalo entre a
média e o infinito positivo abrange 50% da população, enquanto o intervalo entre
a média e o infinito negativo abriga os outros 50% da população (CALLEGARI-
JACQUES, 2003; VIEIRA, 2011). A curva de distribuição normal tem dois pontos
de inflexão, que correspondem à distância de um desvio padrão positivo (s) e um
desvio padrão negativo (-s) em relação à média (CALLEGARI-JACQUES, 2003).

É importante ressaltar que a distribuição normal representa a probabilidade


(indicada no eixo y do diagrama) de observar os diferentes valores de uma
variável X (indicados no eixo x). Pelo formato da curva, valores próximos à média
têm maior probabilidade de serem observados. Já para valores mais extremos no
eixo x, ou seja, mais distantes da média, a probabilidade de observação diminui.

Sabendo que a área total sob a curva corresponde a 100% da população e


que a curva é simétrica, é possível estabelecer algumas relações entre a área sob a
curva e o desvio padrão (CALLEGARI-JACQUES, 2003; VIEIRA, 2011):

i) A área sob a curva entre a média (m) e um desvio padrão (s) equivale a 34,13%
da população. Como a curva é simétrica, 68,26% da área sob a curva estão
entre m + s e m - s, o que corresponde a aproximadamente 2/3 da população.

ii) A área sob a curva entre m + 2s e m - 2s é equivalente a 95,44% da população.


O ponto no eixo x correspondente a m + 2s até o infinito positivo representa
2,28% da população. Como a curva é simétrica, m - 2s até o infinito negativo
também equivale a 2,28%.
48
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES

iii) A área sob a curva entre m + 3s e m - 3s representa 99,74% da população. O


ponto no eixo x que corresponde a m + 3s até o infinito positivo equivale a
0,13%, da mesma forma, m - 3s até o infinito negativo vale 0,13%.

O gráfico a seguir demonstra a proporção da área sob a curva de


distribuição normal correspondente a: A) m + s e m - s; B) m + 2s e m - 2s; C) m + 3s
e m - 3s (m = média e s = desvio padrão).

GRÁFICO 8 - PROPORÇÃO DA ÁREA SOB A CURVA DE DISTRIBUIÇÃO NORMAL

FONTE: A autora

49
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Vamos exemplificar essas relações entre a área sob a curva e o desvio


padrão a partir dos dados de peso de recém-nascidos vivos da cidade de São
Paulo no ano de 1998. Como vimos no Gráfico 6, essa variável apresenta uma
distribuição de frequências muito próxima à distribuição normal. Conhecendo o
peso médio (m = 3161 g, aqui representado por m, o parâmetro populacional, pois
temos um censo) e o desvio padrão (s = 540 g), podemos estabelecer que:

i) Aproximadamente 2/3 (68,26%) dos recém-nascidos pesam entre (m - s) = 3161


- 540 = 2621 g e (m + s) = 3161 + 540 = 3701 g.

ii) A probabilidade de que um recém-nascido pese entre 3161 g e 3701 g é de


34,13%.

iii) Grande parte (95,44%) dos recém-nascidos pesa entre (m - 2s) = 3161 - (2 x 540)
= 2081 g e (m + 2s) = 3161 + (2 x 540) = 4241 g.

iv) Quase todos (99,74%) os recém-nascidos pesam entre (m - 3s) = 3161 - (3 x 540)
= 1541 g e (m + 3s) = 3161 + (3 x 540) = 4781 g.

Conclusões como as mencionadas para o peso dos recém-nascidos são


válidas somente se a variável estudada apresenta distribuição de frequências
normal ou aproximadamente normal (CALLEGARI-JACQUES, 2003; VIEIRA,
2011). Para variáveis com distribuição de frequências diferente de uma distribuição
normal, esse tipo de inferência não pode ser feito.

2.2.2 Distribuição normal padronizada


A distribuição normal padronizada, também denominada de
distribuição normal reduzida, é uma distribuição normal que apresenta média
igual a zero (m = 0) e desvio padrão de um (s = 1) (CALLEGARI-JACQUES,
2003; VIEIRA, 2011).

Uma variável com distribuição normal padronizada é chamada de variável


padronizada e é indicada pela letra Z (VIEIRA, 2011). Podemos padronizar
qualquer variável X em variável Z, desde que a variável X tenha distribuição
normal e tenha a média e o desvio padrão conhecidos (CALLEGARI-JACQUES,
x-m
2003; VIEIRA, 2011). A equação para fazer a transformação é dada por: z =
s
Na equação, x é um valor qualquer da variável X, m e s são, respectivamente,
a média e o desvio padrão da variável X, e o valor z obtido representa o valor x
padronizado.

Essa padronização pode ser útil porque elimina a escala da variável


original, o que permite a comparação entre diferentes variáveis se todas estiverem
padronizadas. Além disso, cada valor z tem uma área sob a curva correspondente,
que representa a distância entre a média (m = 0) e o valor z.

50
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES

A área sob a curva para cada valor z é tabelada e pode ser consultada em
uma tabela chamada de Tabela de Distribuição Z (veja o Apêndice 1 no final do
caderno). O corpo da tabela mostra a área sob a curva correspondente a cada valor
z da cauda direita da curva, ou seja, somente valores positivos de z. A combinação
entre a primeira coluna (valores inteiros e decimais de z) e a primeira linha (valores
centesimais) da tabela indicam os valores de z possíveis. Por exemplo, para achar
a área sob a curva quando z = 1 (ou seja, igual a um desvio padrão), basta olhar o
valor que está na 11ª linha e na 1ª coluna, que é igual a 0,3413. Assim, a área sob a
curva entre m = 0 e z = 1 é de 0,3413 (ou 34,13%). A área sob a curva de um valor z
negativo é igual ao valor positivo de z, pois a curva normal é simétrica. Portanto,
a área sob a curva entre m = 0 e z = -1 também é de 0,3413.

Voltando aos dados de peso dos recém-nascidos vivos na cidade de


São Paulo em 1998 (m = 3161 g e s = 540 g), podemos nos perguntar qual a
probabilidade de um recém-nascido pesar entre 2000 g e 4000 g? Vamos iniciar
desenhando uma curva normal e indicando os valores do peso médio e da
área sob a curva que desejamos encontrar (o intervalo entre 2000 g e 4000 g).
Na sequência, precisamos transformar os valores de peso (2000 g e 4000 g) em
valores de z, pois assim será possível achar a área sob a curva correspondente
ao intervalo de peso 2000 g e 4000 g.

O valor z equivalente ao peso de 2000 g é dado por: z = (x - m)/ s = (2000


- 3161)/540 = -2,15. Note que o z calculado é negativo, mas, como já discutido,
a área sob a curva de valores negativos de z é igual aos valores positivos de z.
Portanto, a área sob a curva para z = -2,15 é de 0,4842.

O valor z equivalente ao peso de 4000 g é dado por: z = (4000 - 3161)/ 540


= -1,55. A área sob a curva para z = -1,55 é de 0,4394.

Agora basta somar as áreas sob a curva encontradas e obter a probabilidade


(0,4842 + 0,4394 = 0,9236). Assim, temos que a probabilidade de um recém-nascido
pesar entre 2000 g e 4000 g é de 92,36%.

Podemos descobrir qual a probabilidade de um bebê nascer com mais de


4000 g. Já sabemos que a área sob a curva entre a média (x = 3161 g) e o z = 1,55
(que representa 4000 g) é de 0,4394. Agora queremos saber qual a área sob a curva
que vai de z = 1,55 até o infinito positivo. Sabendo que metade da curva normal
vale 0,5 (ou 50%), basta subtrair do total da área sob a curva a porção que não nos
interessa, ou seja, 0,5 - 0,4394 = 0,0606. Encontramos que a probabilidade de um
recém-nascido pesar mais de 4000 g é de apenas 6,06%.

O gráfico a seguir traz a representação da área sob a curva entre: 2000 g


e 3161 g (m - z = 2,15); 3161g e 4000 g (m + z = 1,55); 4000 g até o infinito positivo.

51
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

GRÁFICO 9 - REPRESENTAÇÃO DA ÁREA SOB A CURVA

FONTE: A autora

Também podemos calcular qual o peso de um recém-nascido que está a


1,5 desvios padrão acima da média (m + 1,5 s). Para isso precisamos reorganizar
a equação da distribuição normal padronizada da seguinte forma: x = (z x s) + m.
Já sabemos que m = 3161, s = 540 e z = 1,5. Agora basta substituir os valores na
equação: x = (1,5 x 540) + 3161 = 3971, ou seja, um recém-nascido com 3971 g pesa
1,5 desvios padrões a mais que a média.

TURO S
ESTUDOS FU

Caro acadêmico, o entendimento sobre distribuição normal será fundamental


para os próximos conteúdos deste caderno. Caso você não tenha entendido, por favor,
volte e releia com calma. A distribuição normal é um dos principais requisitos para a maioria
dos testes estatísticos que você irá estudar.

52
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES

3 DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS


Você acabou de ver uma breve introdução sobre probabilidade e estudou
dois dos principais tipos de distribuição de probabilidades, a distribuição binomial
e a distribuição normal. Você estudou isso para poder calcular a probabilidade de
um evento acontecer (por exemplo, a probabilidade de um recém-nascido pesar
mais de 4000 g), dada uma distribuição de probabilidades com os parâmetros
populacionais conhecidos. Como você também já viu, dificilmente é possível
amostrar toda a população e chegar aos parâmetros populacionais. Por isso, os
pesquisadores trabalham com amostras da população, que fornecem estimativas
dos parâmetros.

Para chegar a estimativas confiáveis de parâmetros populacionais (por


exemplo, x é uma estimativa de m, s é uma estimativa de s), precisamos assegurar
a representatividade e completude amostral. A representatividade amostral diz
respeito à seleção das unidades amostrais que compõem a amostra. Uma amostra
é representativa quando todas as unidades amostrais da população tiveram a
mesma chance de terem sido amostradas. Já a completude amostral se refere ao
tamanho amostral. O tamanho da amostra tem que ser grande o suficiente para
estimar os parâmetros populacionais. Conforme a Lei dos Grandes Números,
quanto maior o tamanho da amostra, melhor serão as estimativas dos parâmetros
populacionais.

Podemos chegar a estimativas confiáveis garantindo a representatividade


e completude amostral. No entanto, ao trabalhar com amostras precisamos lidar
com outro ponto importante: as estimativas de um parâmetro (por exemplo, a
média) obtidas a partir de amostras independentes de uma mesma população
variam (CALLEGARI-JACQUES, 2003; PAGANO; GAUVREAU, 2013).

Imagine que foram amostradas aleatoriamente 25 unidades amostrais


de uma população qualquer e a partir dessa amostra foi calculada uma média
(x1). As primeiras 25 unidades amostrais foram devolvidas à população. Na
sequência, uma nova amostragem aleatória de 25 unidades amostrais foi feita e
gerou uma segunda média (x2). Você acha que os valores das médias x1 e x2 serão
exatamente os mesmos? Certamente os valores das duas médias serão diferentes!
Isso acontece porque existe variabilidade entre as unidades amostrais e estamos
trabalhando apenas com parte das unidades amostrais da população (PAGANO;
GAUVREAU, 2013). Cada amostra foi composta por unidades amostrais
diferentes, portanto, os valores obtidos para x1 e x2 também serão diferentes.

Sabendo que estimativas variam, é importante determinar qual a


variabilidade associada à estimativa de um parâmetro. Quando a estimativa é
a média, sua variabilidade pode ser observada a partir da distribuição amostral
das médias.

Imagine uma população hipotética de quatro valores apenas: 5, 10, 15


e 20. A média para esses valores é m = 12,5 (usamos m porque é um parâmetro
da população). Imagine também que você retirou diferentes amostras aleatórias
53
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

dessa população, todas compostas por dois valores. Em cada retirada, antes
de tirar o segundo valor, o primeiro valor foi reposto à população. Para cada
amostra foi calculada uma média a partir dos dois valores, essa média é uma
estimativa da média populacional. Pela combinação dos valores foi possível obter
16 amostras diferentes, que apresentaram sete médias distintas. Na Tabela 9 você
pode ver a frequência em que cada média foi observada. Essa tabela representa
uma distribuição amostral das médias.

Observe na Tabela 9 que médias amostrais iguais ou próximas da média


populacional (m = 12,5) são mais frequentes, enquanto médias amostrais com
valores extremos (por exemplo, x = 5 ou x = 20) são menos frequentes. A distribuição
amostral das médias da Tabela 9 segue uma distribuição normal. No entanto, a
distribuição de frequências da população original é uniforme, ou seja, todos os
valores apresentam a mesma frequência de observações (frequência de 0,25).

TABELA 9 - DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS A PARTIR DE AMOSTRAS COMPOSTAS POR


DOIS VALORES RETIRADOS ALEATORIAMENTE DA POPULAÇÃO (x = 5, 10, 15 E 20)

Média Número de observações Porcentagem de observações

5,0 1 6,25

7,5 2 12,50

10,0 3 18,75

12,5 4 25,00

15,0 3 18,75

17,5 2 12,50

20,0 1 6,25

Total 16 100,00
FONTE: Adaptado de Callegari-Jacques (2003)

Os gráficos a seguir demonstram: A) distribuição amostral das médias


a partir de amostras compostas por dois valores retirados aleatoriamente da
população (x = 5, 10, 15 e 20). B) distribuição de frequências da população original.

54
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES

GRÁFICO 10 - DISTRIBUIÇÕES

FONTE: Adaptado de Callegari-Jacques (2003)

Essa diferença entre as distribuições de frequências das médias amostrais e


da população original é uma das principais características da distribuição amostral
das médias (CALLEGARI-JACQUES, 2003). Essa propriedade é garantida pelo
Teorema do Limite Central, que diz que médias obtidas de amostras grandes,
independentes, de tamanho igual e retiradas aleatoriamente de uma população
apresentam distribuição normal, não importando qual é a distribuição de
frequências da população original (CALLEGARI-JACQUES, 2003).

Normalmente nós não amostramos uma mesma população várias vezes para
construir uma distribuição amostral das médias. No entanto, esse conhecimento
é fundamental, pois ao obter uma amostra de maneira aleatória e suficientemente
grande, podemos assumir que a média amostral segue uma distribuição normal.
Assim, temos maior segurança ao estimar a média populacional a partir da média
amostral, pois sabemos que o valor da média amostral obtido tem grande chance
de estar próximo do valor da média populacional.

A distribuição amostral das médias, como toda distribuição normal,


tem o centro em m (a média populacional) (CALLEGARI-JACQUES, 2003). A
variabilidade que as médias amostrais podem apresentar é descrita pelo erro
padrão da média, que é representado por s (x) (CALLEGARI-JACQUES, 2003). O
erro padrão da média pode ser estimado a partir do desvio padrão da amostra e
s
tamanho amostral, conforme a equação: s (x) = n

Na equação, a estimativa do erro padrão da média (s (x)) é dada pela


razão entre o desvio padrão da amostra (s) e a raiz quadrada do tamanho da
amostra (n).

Para o exemplo da população hipotética de quatro valores (5, 10, 15


e 20), uma das possíveis combinações de dois valores é amostra 10 e 15. Essa
amostra apresenta x = 12,5 e s = 12,5 . Substituídos os valores na equação, temos:
s 3,5
s (=
x) = = 2,5
n 2

A estimativa do erro padrão da média para a amostra 10 e 15 é 2,5.

55
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

O erro padrão da média também pode ser interpretado como uma medida
de variação da média se uma nova amostra aleatória e independe fosse tomada
da população, ou seja, se o estudo fosse repetido, como as estimativas da média
poderiam variar.

O erro padrão da média apresentado acima é uma estimativa. O erro


padrão da média da população é obtido somente quando todas as possíveis
médias amostrais são conhecidas, ou seja, quando temos uma distribuição
amostral das médias (CALLEGARI-JACQUES, 2003). Raramente fazemos várias
amostras independentes da mesma população, por isso precisamos trabalhar
com uma estimativa do erro padrão da média. Sempre melhoramos a estimativa
do erro padrão da média aumentando o tamanho amostral, conforme previsto
pela Lei dos Grandes Números.

Como você viu, a estimativa do erro padrão da média é composta pelo


desvio padrão da amostra, ou seja, a variação natural que as unidades amostrais
apresentam. Sempre que o desvio padrão da amostra for grande, também teremos
um erro padrão da média grande (PAGANO; GAUVREAU, 2013). Uma maneira
de diminuir o erro padrão da média é aumentar o tamanho amostral (PAGANO;
GAUVREAU, 2013).

TURO S
ESTUDOS FU

Caro acadêmico, o conhecimento sobre erro padrão da média é fundamental,


pois vários testes estatísticos que estudaremos nas próximas unidades utilizam a média
amostral para chegar a inferências sobre a população. Como a média amostral varia
conforme conjunto de unidades amostrais que compõem a amostra, precisamos ter uma
medida de variação associada à média amostral, que é o erro padrão da média.

56
RESUMO DO TÓPICO 2
Neste tópico, você aprendeu que:

• A probabilidade mede a chance de eventos acontecerem. A probabilidade de


um evento pode ser calculada usando a regra da soma ou a regra do produto.

• A distribuição binomial é uma distribuição de probabilidades teórica usada


para variáveis aleatórias binárias. Pode ser determinada quando n (número de
tentativas) e p (probabilidade de sucesso em uma tentativa) são conhecidos.

• A distribuição binomial assume que existe um número fixo de tentativas n e


cada tentativa resulta em um de dois eventos possíveis. Os resultados de n
tentativas são independentes e a probabilidade de p é constante em todas as
tentativas.

• A média de uma distribuição binomial é dada por m = np e a variância, por s2 = npq.

• A distribuição normal tem a forma de um sino. Representa uma população


infinita, ou seja, os valores no eixo x variam do -∞ até o +∞. Pode ser determinada
quando m e s são conhecidos. A média, mediana e moda coincidem e estão no
centro da distribuição.

• Área sob a curva vale 1% ou 100%. Como a curva é simétrica em torno da


média, o intervalo entre m - ∞ abrange 50% da área sob a curva e m + ∞ abriga
os outros 50% da área.

• A distribuição normal padronizada é uma distribuição normal com m = 0 e s = 1.

• Variável Z é uma variável com distribuição normal padronizada. Qualquer


variável X pode ser transformada em variável Z, desde que tenha distribuição
normal, m e s conhecidos.

• Cada valor z tem uma área sob a curva correspondente, que representa
a distância entre m = 0 e o valor z, que pode ser consultada na Tabela de
Distribuição Z.

• Uma amostra é representativa quando todas as unidades amostrais da


população tiveram a mesma chance de terem sido amostradas. Já a completude
amostral se refere ao tamanho amostral.

• Estimativas de um parâmetro obtidas a partir de amostras independentes


de uma mesma população variam. Para a média, essa variação pode ser
representada pela distribuição amostral das médias.

57
• Teorema do Limite Central diz que médias obtidas de amostras grandes,
independentes, de tamanho igual e retiradas aleatoriamente de uma população,
apresentam distribuição normal, não importando qual é a distribuição de
frequências da população original.

• A variabilidade que as médias amostrais podem apresentar é descrita pelo erro


padrão da média (s(x)). O erro padrão da média é estimado pela razão entre o
desvio padrão da amostra (s) e a raiz quadrada do tamanho da amostra (n).

• Quando o desvio padrão da amostra é grande, o erro padrão da média também


é grande. Uma maneira de diminuir o erro padrão da média é aumentar o
tamanho amostral.

58
AUTOATIVIDADE

Caro acadêmico! Para fixar melhor o conteúdo estudado, vamos exercitar um


pouco. Leia as questões a seguir e responda-as em seu caderno de estudos.
Bom trabalho!

1 Um pesquisador montou um experimento para testar hipóteses relacionadas


à competição. O experimento é composto por vários tanques e, em cada tanque,
o pesquisador colocou três espécies de peixes em diferentes densidades.
Sabendo que o primeiro tanque (T1) possui 10 indivíduos da espécie 1 (Sp1),
15 indivíduos da espécie 2 (Sp2) e 25 indivíduos da espécie 3 (Sp3) e o segundo
tanque (T2) tem 15 indivíduos da Sp1, 25 indivíduos da Sp2 e 10 indivíduos
da Sp3, responda:

a) Se o pesquisador retirar um peixe por sorteio de cada tanque, qual a


probabilidade do peixe de cada tanque pertencer à Sp1?
b) Se o pesquisador retirar um peixe por sorteio de cada tanque, qual a
probabilidade do peixe de cada tanque pertencer à Sp1 ou à Sp2?
c) Se o pesquisador retirar dois peixes por sorteio de cada tanque, sem
reposição do primeiro peixe sorteado, qual a probabilidade dos dois peixes
de cada tanque pertencerem à Sp3?
d) Se o pesquisador retirar dois peixes por sorteio de cada tanque, com
reposição do primeiro peixe sorteado, qual a probabilidade dos dois peixes
de cada tanque pertencerem à Sp2?

2 A osteoporose é uma doença diagnosticada por um exame que mede a


densidade mineral óssea (g/cm2). Com base em uma grande amostra, a
Organização Mundial da Saúde estabeleceu que pessoas com densidade
mineral óssea abaixo de 2,5 desvios padrão em relação à média (µ - 2,5 σ)
apresentam osteoporose. Imagine que para a coluna lombar a densidade
mineral óssea média é igual a 1,06 g/cm2 e o desvio padrão é de 0,2 g/cm2.
A partir de que valor de densidade mineral óssea na coluna lombar uma
pessoa é diagnosticada com osteoporose? Para responder essa questão utilize
a equação da distribuição normal padronizada.

3 Um pesquisador estava estudando a riqueza de anfíbios na restinga de


Santa Catarina e decidiu registrar a riqueza de espécies de anfíbios em dez
cidades do Estado que apresentam restinga. As dez cidades foram escolhidas
aleatoriamente por um sorteio. A partir de sua amostragem, o pesquisador
observou que a riqueza média de anfíbios foi de 45 espécies e o desvio padrão
foi de cinco espécies. A partir das informações fornecidas, calcule o erro
padrão da média. O que o erro padrão da média nos diz em relação à riqueza
de anfíbios na restinga?

59
60
UNIDADE 1
TÓPICO 3

TESTE DE HIPÓTESES

1 INTRODUÇÃO
Todo estudo científico tem uma pergunta norteadora. Para tentar
responder às perguntas, o pesquisador inicia estabelecendo afirmações que
serão investigadas (CALLEGARI-JACQUES, 2003). Essas afirmações são
denominadas de hipóteses. Depois de definir a pergunta e as hipóteses de
trabalho, o pesquisador monta um delineamento amostral e coleta dados. Os
dados representam evidências que podem suportar ou refutar as hipóteses. Por
isso, o pesquisador precisa avaliar os dados coletados para saber se eles fornecem
evidências que suportam ou não determinada hipótese. Como geralmente os
dados são provenientes de amostras, a decisão sobre uma hipótese sempre
tem uma probabilidade de erro. Assim, o pesquisador também precisa medir o
tamanho do erro associado à decisão em relação a cada hipótese.

2 TESTE DE HIPÓTESES
O teste de hipóteses, também chamado de teste de significância, é
o procedimento estatístico formal que permite testar diferentes hipóteses
(SALSBURG, 2009). Um teste de hipóteses compreende várias etapas e a primeira
delas é estabelecer as hipóteses a serem testadas. De acordo com a pergunta de
trabalho, o pesquisador define dois tipos diferentes de hipóteses: uma é a hipótese
nula e a outra é a hipótese alternativa. A partir de agora você vai estudar o que
são esses tipos de hipótese, bem como as demais etapas de um teste de hipóteses.

2.1 HIPÓTESE NULA


A hipótese nula (H0) é a primeira hipótese a ser formulada e é a explicação
mais simples possível para a variação observada nos dados (GOTELLI;
ELLISON, 2011). Na hipótese nula a variação dos dados é atribuída inteiramente
à aleatoriedade ou a erros de medidas (GOTELLI; ELLISON, 2011). Ela estabelece
a ausência de padrão, como, por exemplo: não há relação entre as variáveis
estudadas; o fenômeno estudado não possui efeito; o tratamento não exerce
influência; não há diferença entre os grupos; o processo biológico não existe; os
dados não diferem da expectativa ao acaso (GOTELLI; ELLISON, 2011).

61
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Um pesquisador coleta dados para juntar evidências que refutem a


hipótese nula, pois geralmente o interesse da pesquisa está na hipótese alternativa.
A partir de um teste estatístico é possível avaliar se os dados fornecem evidências
a favor ou contrárias à hipótese nula. Essa avaliação serve de base para a tomada
de decisão de aceitar ou rejeitar a hipótese nula, ou seja, decidir se a melhor
explicação para a variação nos dados é a hipótese nula.

Vamos exemplificar o que é uma hipótese nula. Imagine que você gostaria
de saber se araucárias de reflorestamentos, como as da Figura 1, produzem mais
pinhas por árvore que as araucárias de fragmentos florestais naturais. Neste
caso, a hipótese nula seria que não existe diferença na produção de pinhas entre
araucárias de reflorestamentos e araucárias de fragmentos florestais naturais.

2.2 HIPÓTESE ALTERNATIVA


A hipótese alternativa (H1) é formulada após a hipótese nula. Representa
a negação lógica da hipótese nula (CALLEGARI-JACQUES, 2003). Na hipótese
alternativa a variação observada nos dados é atribuída a algum fator. Ela
estabelece a existência de um padrão, como, por exemplo: há relação entre as
variáveis estudadas; o fenômeno estudado possui efeito; o tratamento exerce
influência; há diferença entre os grupos; o processo biológico existe; os dados
diferem da expectativa ao acaso (GOTELLI; ELLISON, 2011).

Geralmente, a hipótese alternativa é a hipótese de interesse em uma


pesquisa científica, no entanto, os dados são coletados para suportar ou rejeitar
a hipótese nula e, portanto, a inferência estatística sempre está relacionada à
hipótese nula. Um pesquisador não pode aceitar ou rejeitar a hipótese alternativa,
somente a hipótese nula.

Para o exemplo da produção de pinhas por araucárias de reflorestamentos


e de fragmentos florestais naturais, a hipótese alternativa seria que existe diferença
na produção de pinhas entre araucárias de reflorestamentos e araucárias de
fragmentos florestais. Esta hipótese alternativa não sugere se a produção de pinhas
é maior em reflorestamentos ou em fragmentos florestais, ela apenas considera
a existência de diferença. Um teste de hipóteses em que a hipótese alternativa
não estabelece a priori uma expectativa da direção do padrão, como no exemplo
mencionado, é chamado de teste bilateral (CALLEGARI-JACQUES, 2003).

No entanto, podemos imaginar que as araucárias de reflorestamentos


produzem mais pinhas porque os proprietários dos reflorestamentos adubam o
solo e irrigam as árvores, enquanto araucárias em fragmentos florestais podem
ter se estabelecido em solos pobres ou com deficiência de água e, por isso,
produzem menos pinhas. Neste caso, a hipótese alternativa seria que araucárias de

62
TÓPICO 3 | TESTE DE HIPÓTESES

reflorestamentos produzem mais pinhas que araucárias de fragmentos florestais


naturais. Quando a hipótese alternativa estabelece a priori uma expectativa da
direção do padrão, como neste último exemplo, o teste de hipóteses é chamado
de teste unilateral (CALLEGARI-JACQUES, 2003).

2.3 P-VALOR
Após formular as hipóteses nula e alternativa, o próximo passo de um
teste de hipóteses é avaliar quanto os dados suportam ou não a hipótese nula. A
avaliação dos dados acontece por meio de um teste estatístico. Cada pergunta e
hipótese de estudo tem um teste estatístico específico, que fornece uma estatística
do teste, ou seja, um valor numérico obtido a partir de cálculos estatísticos. Essa
estatística do teste pode ser convertida em uma probabilidade, que é chamada
de p-valor. Portanto, o p-valor é uma medida de probabilidade calculada a partir
dos dados observados.

De acordo com Pagano e Gauvreau (2013), o p-valor indica quão provável


seria obter uma amostra igual à que foi observada se a hipótese nula fosse
verdadeira, ou seja, se o p-valor é baixo, isso significa que a probabilidade de
encontrar um resultado igual ao que foi observado é baixa, se a hipótese nula fosse
verdadeira. Nesses casos em que o p-valor é baixo, a hipótese nula é rejeitada. Já
um p-valor alto significa que é muito provável encontrar o resultado observado
se a hipótese nula fosse verdadeira, o que leva à aceitação da hipótese nula.

O p-valor é calculado com base em três coisas: o tamanho amostral (n);


a diferença entre as médias das amostras estudadas (x1 - x2); e nível de variação
entre as unidades amostrais de cada amostra (s2). O p-valor diminui conforme
aumenta o tamanho da amostra, pois a chance de a estimativa estar próxima do
valor do parâmetro também aumenta, de acordo com a Lei dos Grandes Números.
O p-valor diminui ainda se a diferença entre as médias das amostras for grande
e se a variação entre as unidades amostrais de uma mesma amostra for pequena
(baixo s2) (GOTELLI; ELLISON, 2011).

Vamos supor que um pesquisador avaliou se existe diferença na produção


de pinhas por araucárias de reflorestamentos e de fragmentos florestais naturais.
Ele encontrou que as araucárias de reflorestamentos produzem o dobro de
pinhas em comparação às araucárias de fragmentos florestais. O pesquisador
também observou que essa diferença na produção de pinhas tem a probabilidade
de 1% de acontecer, caso a hipótese nula seja verdadeira (p-valor = 0,01), ou
seja, essa diferença observada na produção de pinhas é pouco provável de
acontecer simplesmente por explicação do acaso. Possivelmente algum fator está
influenciando para que araucárias do reflorestamento produzam mais pinhas,
como, por exemplo, a adubação do solo.

63
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

Outra interpretação para o p-valor de 0,01 é que se a hipótese nula for


verdadeira e o estudo for repetido 100 vezes, e em cada vez as unidades amostrais
forem diferentes, somente em uma das repetições será possível encontrar uma
diferença igual ou maior que a diferença observada na produção de pinhas. Já
se a diferença na produção de pinhas entre araucárias de reflorestamentos e
de fragmentos florestais naturais fosse muito pequena, o p-valor tenderia a ser
mais alto, ou seja, a diferença na produção de pinhas observada teria grande
probabilidade de acontecer se a hipótese nula fosse verdadeira e, portanto, a
diferença na produção de pinhas poderia ser atribuída ao acaso.

2.4 NÍVEL CRÍTICO DE SIGNIFICÂNCIA


Quando o p-valor calculado é muito baixo, ou seja, a probabilidade
de encontrar um resultado igual ao que foi observado se a hipótese nula fosse
verdadeira é muito baixa, tendemos a rejeitar a hipótese nula. Já quando o p-valor
é alto, ou seja, existe uma alta probabilidade de encontrar um resultado igual ao
observado se a hipótese nula fosse verdadeira, geralmente nos leva a aceitar a
hipótese nula.

Suponhamos agora que a probabilidade de encontrar uma diferença


tão grande quanto à observada para a produção de pinhas entre araucárias de
reflorestamentos e de fragmentos florestais é de 8% (p = 0,08), qual seria sua
decisão em relação à hipótese nula? Você aceitaria ou rejeitaria H0? Para tomar
essa decisão é necessário definir um limite de p-valor a partir do qual a hipótese
nula deveria ser rejeitada. Esse limite de p-valor é estabelecido pelo nível crítico
de significância.

O nível crítico de significância, representado por a, é uma probabilidade


a partir da qual se rejeita ou se aceita a hipótese nula. A definição do nível crítico
de significância é uma das etapas do teste de hipóteses e deve ser feita antes
do cálculo do p-valor. A definição do nível crítico de significância é arbitrária e
pode variar de acordo com os objetivos da pesquisa e critérios do pesquisador, no
entanto, trabalhos em Ciências Biológicas costumam usar um a = 0,05, enquanto
pesquisas na área da saúde utilizam um a = 0,01 (CALLEGARI-JACQUES, 2003;
GOTELLI; ELLISON, 2011).

Quando o p-valor calculado a partir dos dados é menor que o nível crítico
de significância, a tomada de decisão é rejeitar a hipótese nula. Já quando o
p-valor calculado for maior que o nível crítico de significância, a decisão é aceitar
a hipótese nula. Veja a relação entre nível crítico de significância e p-valor na
Tabela 10.

64
TÓPICO 3 | TESTE DE HIPÓTESES

TABELA 10 - RELAÇÃO ENTRE P-VALOR, NÍVEL CRÍTICO DE SIGNIFICÂNCIA (a) E HIPÓTESE NULA (H0)

Relação entre p-valor e nível crítico Decisão em relação


Quando a = 0,05
de significância (a) à hipótese nula (H0)
p-valor < a p-valor < 0,05 Rejeita-se H0
p-valor > a p-valor > 0,05 Aceita-se H0
FONTE: A autora

GRÁFICO 11 - INDICAÇÃO DA ÁREA SOB A CURVA DE REJEIÇÃO E ACEITAÇÃO DA HIPÓTESE


NULA (H0) QUANDO O NÍVEL CRÍTICO DE SIGNIFICÂNCIA É DE 5% (a = 0,05)

FONTE: A autora

O nível crítico de significância também pode ser interpretado como uma


medida de erro em relação à tomada de decisão, em que se rejeita a hipótese
nula quando ela é verdadeira (o que é chamado de Erro Tipo I, conforme você
estudará a seguir) (GOTELLI; ELLISON, 2011).

2.5 ETAPAS DE UM TESTE DE HIPÓTESES


Como vimos, um teste de hipóteses é o procedimento estatístico formal
que permite testar diferentes hipóteses. Um teste de hipóteses compreende as
seguintes etapas:

1) Estabelecer as hipóteses nula e alternativa.


2) Definir o nível crítico de significância (a).
3) Escolher o teste estatístico mais adequado de acordo com a pergunta de estudo.
4) Calcular a estatística do teste e o p-valor a partir dos dados coletados.
5) Comparar o p-valor com o nível crítico de significância preestabelecido.
6) Fazer a inferência estatística, ou seja, rejeitar ou aceitar a hipótese nula.

65
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

3 TIPOS DE ERROS
Quando aplicamos um teste de hipóteses, estamos trabalhando com
dados limitados e incompletos. A inferência estatística feita a partir desses dados
apresenta um erro associado. Caso fosse possível fazer um censo, teríamos acesso
aos parâmetros populacionais e certeza se a hipótese nula é falsa ou verdadeira,
porém, isso geralmente é impossível em pesquisas científicas, estamos sujeitos a
cometer dois tipos de erros: erro Tipo I e erro Tipo II.

3.1 ERRO TIPO I


O erro Tipo I acontece quando rejeitamos incorretamente a hipótese
nula quando deveríamos aceitá-la (Tabela 11) (CALLEGARI-JACQUES, 2003;
GOTELLI; ELLISON, 2011), ou seja, atribuímos a variação nos dados a algum
fator, quando na verdade essa variação é resultado apenas do acaso (GOTELLI;
ELLISON, 2011). O erro Tipo I também pode ser chamado de falso positivo.

A probabilidade de cometer o erro Tipo I é indicada pelo nível crítico


de significância (CALLEGARI-JACQUES, 2003; GOTELLI; ELLISON, 2011). Por
exemplo, para um a = 0,05, se a hipótese nula for verdadeira e o estudo for repetido
100 vezes, utilizando diferentes unidades amostrais em cada vez, em cinco das
100 repetições a decisão tomada em relação à hipótese nula estará errada, ou seja,
em cinco estudos a hipótese nula será rejeitada quando deveria ser aceita.

3.2 ERRO TIPO II


O erro Tipo II ocorre quando falhamos em rejeitar a hipótese nula quando
deveríamos rejeitá-la (Tabela 11) (CALLEGARI-JACQUES, 2003; GOTELLI;
ELLISON, 2011), ou seja, atribuímos a variação nos dados somente ao acaso,
quando na verdade existe um padrão que é explicado por algum outro fator
(GOTELLI; ELLISON, 2011). O erro Tipo II pode ser chamado de falso negativo.
Por convenção é representado por b.

TABELA 11 - RELAÇÃO ENTRE A HIPÓTESE NULA VERDADEIRA E A TOMADA DE DECISÃO

Tomada de decisão
Verdade
Não rejeitar H0 Rejeitar H0
Decisão correta Erro Tipo I
H0 é verdadeira
Probabilidade: 1 - a Probabilidade: a
Erro Tipo II Decisão correta
H0 é falsa
Probabilidade: b Probabilidade: 1 - b
FONTE: ADAPTADO DE CALLEGARI-JACQUES (2003)

66
TÓPICO 3 | TESTE DE HIPÓTESES

3.3 PODER DO TESTE


A probabilidade do erro Tipo II é representada por b, que varia entre 0 e 1.
O complemento de b, ou seja, 1 - b, é denominado poder do teste (CALLEGARI-
JACQUES, 2003; GOTELLI; ELLISON, 2011). Assim, o poder do teste pode ser
interpretado como a probabilidade de rejeitar a hipótese nula quando ela é falsa,
ou, em outras palavras, afirmar corretamente a existência de um padrão quando
ele realmente existe (CALLEGARI-JACQUES, 2003; GOTELLI; ELLISON, 2011).

Uma maneira de aumentar o poder do teste é elevar o nível crítico de


significância (a)(PAGANO; GAUVREAU, 2013). Quando o intervalo de a é maior,
a chance de se aceitar a hipótese nula quando ela é falsa diminui (a probabilidade
de b diminui). Se b é menor, o poder do teste aumenta, pois é o complemento de
b (1 - b), no entanto, ao aumentar o a, o risco em cometer o erro Tipo I também
aumenta (rejeitar H0 verdadeira), ou seja, sempre que diminuímos a chance de
cometer o erro Tipo II, a chance de cometer o erro Tipo I aumenta, e vice-versa,
pois os erros são inversamente relacionados (GOTELLI; ELLISON, 2011).

A única maneira de diminuir simultaneamente a (erro Tipo I) e b (erro


Tipo II) é aumentar o tamanho da amostra e, em consequência, se aumenta o
poder do teste (PAGANO; GAUVREAU, 2013).

E
IMPORTANT

O texto que você vai ler a seguir foi retirado do livro “Uma senhora toma chá...
como a estatística revolucionou a ciência no século XX”, de David Salsburg. Este livro é
uma ótima sugestão para quem quer saber um pouco sobre a vida e as contribuições dos
cientistas responsáveis por grandes avanços na estatística moderna e na pesquisa científica.
O livro é excelente e a leitura muito prazerosa! A linguagem é acessível mesmo às pessoas
sem muito conhecimento estatístico ou matemático.

67
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA

LEITURA COMPLEMENTAR

UMA SENHORA TOMA CHÁ...

Era uma tarde de verão em Cambridge, Inglaterra, no final dos anos


1920. Um grupo de professores universitários, suas esposas e alguns convidados
tomaram lugar a uma mesa no jardim para o chá da tarde. Uma das mulheres
insistia em afirmar que o chá servido sobre o leite parecia ficar com gosto diferente
do que apresentava ao receber o leite sobre ele. As cabeças científicas dos homens
zombaram do disparate. Qual seria a diferença? Não podiam conceber diferença
alguma na química da mistura. Um homem de estatura baixa, magro, de óculos
grossos e cavanhaque começando a ficar grisalho interessou-se pelo problema.

‘Vamos testar a proposição’, animou-se. Começou a esboçar um


experimento no qual a senhora que insistira haver diferença seria servida com
uma sequência de xícaras, algumas com o leite servido sobre o chá, e outras com
o chá servido sobre o leite.

[...] alguns leitores podem menosprezar esse esforço como momento menor
de uma conversa em tarde de verão. ‘Que diferença faz se a senhora consegue
distinguir uma infusão da outra?’, perguntarão. ‘Nada existe de importante ou
de grande mérito científico nesse problema’, argumentarão com desprezo. ‘Essas
cabeças privilegiadas deveriam usar sua poderosa capacidade cerebral para algo
que beneficiasse a humanidade’.

[...] apesar do que os não cientistas possam pensar sobre a ciência e sua
importância, [...] a maioria dos cientistas se empenha em suas pesquisas porque
está interessada nos resultados e porque obtém estímulo intelectual com suas
tarefas. Raras vezes os bons cientistas pensam a respeito da importância de seu
trabalho. Assim foi naquela ensolarada tarde em Cambridge. A senhora poderia
ou não estar certa sobre o paladar do chá. A graça estava em encontrar um modo
de afirmar se estava certa, e, sob a direção do homem de cavanhaque, começaram
a discutir como poderiam fazer isso.

Entusiasmados, vários deles se envolveram no experimento e em poucos


minutos estavam servindo diferentes padrões de infusão sem que a senhora os
pudesse ver. Então, com ar de objetividade, o homem de cavanhaque ofereceu-
lhe a primeira xícara. Ela tomou um pequeno gole e declarou que, naquela, o leite
fora colocado sobre o chá. Ele anotou a resposta sem comentários e lhe passou a
segunda xícara... [...]

Testar se a senhora pode sentir o gosto diferente do chá

Vamos supor que queremos testar se a senhora pode detectar a diferença


entre uma xícara na qual o leite foi posto sobre o chá e outra em que o chá foi
posto sobre o leite. Apresentamos duas xícaras e informamos que uma delas

68
TÓPICO 3 | TESTE DE HIPÓTESES

é do primeiro e a outra é do segundo. Ela as prova e identifica corretamente.


Poderia ter adivinhado; tinha 50% de chance. Apresentamos um segundo par, e
novamente ela identifica corretamente. Se tivesse adivinhado, a chance de isso
acontecer duas vezes seguidas seria de 25%. Apresentamos um terceiro par de
xícaras, e outra vez ela identifica corretamente. A chance de isso acontecer como
resultado de pura adivinhação é de 12,5%. Apresentamos mais pares de xícaras,
e ela as identifica corretamente. Em algum instante, teremos que reconhecer
que ela é capaz de perceber a diferença. Suponhamos que ela erre em um par;
suponhamos que erre no par 24, depois de ter acertado todos os outros. Ainda
assim podemos concluir que ela é capaz de detectar a diferença? E se ela tiver
errado em quatro dos 24 pares, ou cinco dos 24?

O teste de hipótese ou de significância é o procedimento estatístico formal


que calcula a probabilidade do que observamos, assumindo que a hipótese a ser
testada é verdadeira. Quando a probabilidade observada é muito baixa, concluímos
que a hipótese não é verdadeira. Um aspecto importante é o fato de o teste de
hipóteses fornecer uma ferramenta para rejeitar a hipótese. No caso mencionado,
a hipótese rejeitada é a de que a senhora está meramente adivinhando.

FONTE: SALSBURG, D. Uma senhora toma chá... como a estatística revolucionou a ciência no
século XX. Rio de Janeiro: Zahar, 2009, p. 288.

ATENCAO

O homem de estatura baixa, magro, de óculos grossos e cavanhaque


começando a ficar grisalho que o autor menciona era Ronald Aylmer Fisher, um dos
principais nomes da estatística.
Para descobrir se a senhora realmente sentia o gosto diferente do chá ou se era só
adivinhação, leia o livro! O autor fornece a resposta no livro.

69
RESUMO DO TÓPICO 3
Neste tópico, você aprendeu que:

• O teste de hipóteses é o procedimento estatístico formal que permite testar


diferentes hipóteses.

• Um teste de hipóteses compreende diferentes etapas: i) estabelecer as hipóteses


nula e alternativa; ii) definir o nível crítico de significância (a); iii) escolher o
teste estatístico mais adequado; iv) calcular a estatística do teste e o p-valor; v)
comparar o p-valor com o a; vi) fazer a inferência estatística.

• A hipótese nula (H0) é a explicação mais simples possível para a variação


observada nos dados. Geralmente a variação nos dados é atribuída inteiramente
à aleatoriedade ou a erros de medidas.

• A hipótese alternativa (H1) é a negação lógica da hipótese nula. A variação


observada nos dados é atribuída a algum fator além do acaso.

• A inferência estatística sempre diz respeito à hipótese nula, portanto, podemos


apenas rejeitar ou aceitar a hipótese nula. A inferência nunca é em relação à
hipótese alternativa.

• Em um teste de hipótese bilateral não estabelecemos a priori uma expectativa


da direção do padrão. Já em um teste unilateral existe uma expectativa da
direção do padrão.

• O p-valor indica quão provável seria obter uma amostra igual à que foi
observada se a hipótese nula fosse verdadeira. O p-valor é calculado a partir
dos dados observados.

• O nível crítico de significância (a) é uma probabilidade a partir da qual se


rejeita ou se aceita a hipótese nula. A delimitação de a é arbitrária, mas em
Ciências Biológicas costumamos usar um a = 0,05.

• Um p-valor menor que a leva à rejeição da hipótese nula. Já um p-valor maior


que a leva à aceitação da hipótese nula.

• O erro Tipo I acontece quando rejeitamos incorretamente a hipótese nula


quando deveríamos aceitá-la. Já o erro Tipo II ocorre quando falhamos em
rejeitar a hipótese nula quando deveríamos rejeitá-la.

• O poder do teste é o complemento de b (erro Tipo II), ou seja, 1 - b. É


interpretado como a probabilidade de rejeitar corretamente a hipótese nula
quando ela é falsa.
70
AUTOATIVIDADE

Caro acadêmico! Para fixar melhor o conteúdo estudado, vamos


exercitar um pouco. Leia as questões a seguir e responda-as em seu caderno
de estudos. Bom trabalho!

1 Para cada caso abaixo, formule a hipótese nula:

a) O comprimento e o peso das sementes de Bauhinia rufa (Bong.) Steud


(Fabaceae) diminuem no sentido base-ápice no fruto.

b) A heterozigosidade da espécie Nasua nasua (Mammalia: Procyonidae)


aumenta com a redução nos níveis de fragmentação da paisagem.

c) Há uma correlação positiva entre o teor de argila e o teor de matéria orgânica


no solo da Floresta Amazônica.

d) A riqueza de espécies da tribo neotropical Bignonieae (Bignoniaceae) é maior


na região equatorial e diminui em direção aos polos.

e) A riqueza de espécies arbustivas da Floresta Ombrófila Densa é maior no


interior, intermediária no meio e menor na borda dos fragmentos florestais.

2 As sentenças abaixo relacionam p-valor, nível crítico de significância (a) e


inferência estatística. Identifique se as sentenças são verdadeiras ou falsas e
corrija as falsas.

( ) O p-valor calculado a partir dos dados foi maior que o valor de a


preestabelecido, assim se aceita a hipótese nula.
( ) O p-valor calculado a partir dos dados foi menor que o valor de a
preestabelecido, assim se aceita a hipótese alternativa.
( ) O p-valor obtido a partir dos dados foi menor que o valor de a
preestabelecido, assim se rejeita a hipótese nula.
( ) O p-valor obtido a partir dos dados foi maior que o valor de a
preestabelecido, assim a hipótese alternativa não é verdadeira.

3 Observe a figura a seguir. De acordo com o que você aprendeu sobre


inferência estatística e teste de hipóteses, quais seriam as hipóteses nula
e alternativa neste caso? Em quais das situações (a, b, c ou d) os médicos
tomaram a decisão correta em relação à hipótese nula (H0) e em quais casos os
médicos cometeram os erros Tipo I e Tipo II?

71
FONTE: Adaptado de <http://flowingdata.com/2014/05/09/type-i-and-ii-errors-simplified/>.
Acesso em: 20 jul. 2016.

72
UNIDADE 2

TESTES ESTATÍSTICOS I

OBJETIVOS DE APRENDIZAGEM
A partir desta unidade você será capaz de:

• fazer uso dos fundamentos básicos em estatística, bem como do teste de


hipóteses;

• compreender os seguintes testes estatísticos: teste Z, teste T e análise de


variância;

• identificar e aplicar o teste estatístico adequado à pergunta biológica;

• planejar delineamentos experimentais que forneçam dados consistentes


para resolução de questões biológicas;

• interpretar e apresentar resultados dos testes estatísticos corretamente.

PLANO DE ESTUDOS
A segunda unidade se divide em três tópicos. Ao final de cada um deles
você encontrará atividades que o auxiliarão na compreensão dos conteúdos
abordados.

TÓPICO 1 – TESTE Z E TESTE T

TÓPICO 2 – DELINEAMENTO EXPERIMENTAL

TÓPICO 3 – ANÁLISE DE VARIÂNCIA

73
74
UNIDADE 2
TÓPICO 1

TESTE Z E TESTE T

1 INTRODUÇÃO
Na Unidade 1 deste caderno você aprendeu conceitos fundamentais que
serão empregados em todos os testes estatísticos apresentados nesta e na próxima
unidade. Vamos fazer uma breve revisão dos conceitos mais importantes da
Unidade 1! Você viu que em Ciências Biológicas geralmente trabalhamos com
amostras, pois é impossível coletar dados de toda a população. A Lei dos Grandes
Números garante que, ao aumentar o tamanho amostral, as estimativas obtidas
a partir das amostras se aproximam do parâmetro populacional. Você aprendeu
como descrever uma amostra a partir da média, variância e desvio padrão. Você
estudou o que é distribuição normal e distribuição amostral de médias e aprendeu
como medir a variabilidade da distribuição amostral de médias por meio do erro
padrão da média. O Teorema do Limite Central garante que médias obtidas de
amostras grandes, independentes, de tamanho igual e retiradas aleatoriamente
de uma população, apresentam distribuição normal, não importando qual é a
distribuição de frequências da população original. Por fim, você estudou todas as
etapas de um teste de hipóteses.

2 TESTE Z
Agora que relembrou os conceitos fundamentais, você está pronto para
realizar o primeiro teste estatístico! Começaremos estudando o teste Z, que é
um teste estatístico em que a distribuição do teste segue a distribuição normal
padronizada, também chamada de Distribuição Z (PAGANO; GAUVREAU, 2013).
O teste Z pode ser usado para avaliar se uma amostra pertence a determinada
população, que é chamada de população de referência. Assim, o teste Z avalia
o tamanho da diferença entre uma média amostral (x) e a média da população
de referência (m) (CALLEGARI-JACQUES, 2003; PAGANO; GAUVREAU,
2013). É necessário aplicar um teste estatístico neste tipo de comparação, pois
o valor paramétrico para a média amostral é desconhecido. No teste Z, o valor
de x é usado como uma estimativa do parâmetro, que é a média paramétrica da
amostra. Como a média amostral e a média paramétrica da amostra dificilmente
são iguais, o teste estatístico fornece uma medida de incerteza relacionada à
estimativa (CALLEGARI-JACQUES, 2003).

Para realizar o teste Z é necessário conhecer a média (m) e o desvio


padrão (s) da população de referência (CALLEGARI-JACQUES, 2003; PAGANO;
x -m
GAUVREAU, 2013). A estatística do teste Z é calculada pela equação: z =
s

n

75
UNIDADE 2 | TESTES ESTATÍSTICOS I

Na equação, z é a estatística do teste Z, x é a média amostral, m é a média


populacional, s é o desvio padrão populacional e n é o tamanho da amostra. Note
que o numerador da equação mede a diferença entre a média amostral e a média
da população de referência, ou seja, é uma medida de efeito. Já o denominador da
s
equação representa o erro padrão da média ( n ), ou seja, é uma medida de erro
ou variabilidade. Portanto, a estatística do teste Z é obtida pela razão entre uma
medida de efeito e uma medida de erro.

Após o cálculo de z é possível obter um p-valor correspondente, por meio


da consulta à Tabela de Distribuição Z (Apêndice 1 no final do caderno). O p-valor
representa a probabilidade de se encontrar uma diferença entre a média amostral
e a média populacional igual ou mais extrema que a diferença observada, dado
que a hipótese nula é verdadeira.

Veremos como o teste Z funciona pensando em um exemplo prático.


Para isso utilizaremos os dados dos recém-nascidos vivos na cidade de São
Paulo em 1998, que apresentaram peso médio de 3161 g e desvio padrão de 540
g (MONTEIRO; BENICIO; ORTIZ, 2000). A média e o desvio padrão do peso
dos recém-nascidos de São Paulo correspondem aos parâmetros da população de
referência. Imagine que nos anos seguintes houve uma grande campanha para
que mulheres gestantes usassem um suplemento de vitaminas que diminuía a
chance de os bebês nascerem com baixo peso. Um pesquisador estava interessado
em saber se o suplemento de vitaminas teve efeito sobre o peso dos bebês. Para
isso, ele sorteou 60 recém-nascidos cujas mães haviam ingerido o suplemento de
vitaminas durante a gestação. O peso médio dos 60 recém-nascidos foi de 3350
g. Será que o suplemento de vitaminas levou a um aumento no peso dos recém-
nascidos? Para responder a essa pergunta, seguiremos todas as etapas de um
teste de hipóteses, conforme a seguir:

1° Definimos a hipótese nula (H0) e a hipótese alternativa (H1). Neste caso,


H0: não há diferença entre o peso dos recém-nascidos cujas mães ingeriram o
suplemento de vitaminas (a média amostral) e o peso dos recém-nascidos de
São Paulo (a média da população de referência), ou, abreviadamente, H0: x = m.
Enquanto H1: o peso dos recém-nascidos cujas mães ingeriram o suplemento é
maior que o peso dos recém-nascidos de São Paulo, ou, abreviadamente, H1: x > m.

Note que na hipótese alternativa é estabelecida uma expectativa da


direção para a diferença entre as médias e, assim, o teste estatístico é unilateral.
Se H1 enunciasse apenas que há diferença entre as médias (H1: x ≠ m), sem indicar
uma direção para a diferença, o teste seria bilateral.

2° Estabelecemos o nível crítico de significância, que também representa


a probabilidade de cometermos o erro tipo I – rejeitar incorretamente a hipótese
nula. Para o nosso teste de hipótese, adotaremos a = 0,05.

3° Calculamos qual é o valor de z crítico correspondente ao a = 0,05. O


z crítico, assim como o a, representa o valor de corte a partir do qual a hipótese

76
TÓPICO 1 | TESTE Z E TESTE T

nula é aceita ou rejeitada. Nosso teste estatístico é unilateral e, portanto, estamos


interessados apenas na cauda direita da curva de distribuição normal (veja o
gráfico a seguir). A área sob a curva da cauda direita equivale a 50%. Precisamos
calcular a área sob a curva que corresponde à região de aceitação da hipótese nula.
Para isso basta subtrair da área total da curva (neste caso é 0,5, que corresponde
à cauda direita da curva normal) da área de rejeição da hipótese nula (neste caso
é 0,05). A área sob a curva de aceitação da hipótese nula é igual a 0,50 - 0,005 =
0,495. Para chegar ao z crítico, precisamos consultar a Tabela de Distribuição Z
(Apêndice 1) e verificar qual é o valor de z que corresponde a 0,495. Neste caso,
o z crítico é igual a 1,64. Assim, se a estatística do teste Z (que calcularemos a
seguir) resultar em um valor z menor que 1,64, aceitamos H0. Se o valor z for
maior que 1,64, rejeitamos H0 (Tabela 12). Quando o teste estatístico é bilateral, o
z crítico correspondente ao a = 0,05 é igual a 1,96 (Tabela 12).

4° Calculamos a estatística do teste Z. Para isso, precisamos das seguintes


informações: x = 3350 g, m = 3161 g, s = 540 g e n = 60. Substituindo na equação:
x - m 3350 - 3161 189
= z = = = 2, 7 . A estatística do teste Z foi de 2,7.
s 540 69, 7
n 60

GRÁFICO 12 - REPRESENTAÇÃO DAS REGIÕES DE ACEITAÇÃO E REJEIÇÃO DA HIPÓTESE


NULA (H0) NA CURVA DE DISTRIBUIÇÃO NORMAL PARA O EXEMPLO DO PESO DOS
RECÉM-NASCIDOS

FONTE: A autora

77
UNIDADE 2 | TESTES ESTATÍSTICOS I

5° A partir do valor z podemos chegar a um p-valor. Basta consultar na


Tabela de Distribuição Z (Apêndice 1) qual é a área sob a curva que corresponde
ao valor z calculado. Para z = 2,7 a área sob a curva é de 0,4965. Para chegar
ao p-valor precisamos subtrair a área sob a curva correspondente ao valor z
calculado (neste caso é 0,4965) da área sob a curva total (neste caso é 0,5, que
corresponde à cauda direita da curva normal). O p-valor é 0,5 - 0,4965 = 0,003, ou
seja, a chance de encontrar uma diferença entre as médias igual ou maior que a
diferença observada é de 0,3%, caso a hipótese nula seja verdadeira.

6° Agora temos informação suficiente para fazer a inferência estatística,


que pode ser realizada com base na comparação entre o a e o p-valor ou com
base no valor crítico e valor calculado da estatística do teste (Tabela 12). No
exemplo, o nível crítico de significância preestabelecido foi de 0,05 e o z crítico
correspondente foi de 1,64. O z calculado a partir dos dados foi de 2,7 e p-valor
correspondente foi de 0,003. Portanto, z calculado foi maior que z crítico e, assim,
rejeitamos a hipótese nula. P-valor foi menor que a, o que também nos leva a
rejeitar a hipótese nula (veja novamente o Gráfico 12 e a Tabela 12).

Assim, concluímos que o peso médio (3350 g) dos recém-nascidos cujas


mães ingeriram o suplemento de vitaminas durante a gestação é maior que o peso
médio (3161 g) dos recém-nascidos de referência, e esta diferença dificilmente
teria sido observada se a hipótese nula fosse verdadeira (z = 2,7; p = 0,003), ou seja,
existem fortes evidências de que o uso do suplemento de vitaminas por gestantes
leva a um aumento do peso dos recém-nascidos. Recomenda-se que na redação
da conclusão do teste de hipótese sejam apresentados a estatística do teste (no
caso, o valor z) e o p-valor.

A estatística do teste Z é simples e, por isso, este teste estatístico é facilmente


calculado. No entanto, o uso do teste Z não é trivial, pois para sua aplicação é
necessário conhecer dois parâmetros populacionais, que são a média e o desvio
padrão da população de referência. Geralmente, os pesquisadores trabalham
com amostras e não têm acesso aos parâmetros populacionais, o que inviabiliza o
emprego do teste Z. A seguir você irá estudar um teste estatístico mais prático e
muito usado nas análises de dados biológicos, que é o teste T.

TABELA 12 - VALOR DE z CRÍTICO USADO EM DIFERENTES SITUAÇÕES, BEM COMO A


INFERÊNCIA ESTATÍSTICA CORRESPONDENTE

Teste Nível crítico de Inferência


p-valor z crítico z calculado
estatístico significância (a) estatística
> 0,05 < 1,96 Aceita-se H0
Bilateral 0,05 1,96
< 0,05 > 1,96 Rejeita-se H0
> 0,05 < 1,64 Aceita-se H0
Unilateral 0,05 1,64
< 0,05 > 1,64 Rejeita-se H0
FONTE: A autora

78
TÓPICO 1 | TESTE Z E TESTE T

3 TESTE T

3.1 DISTRIBUIÇÃO T
O primeiro teste estatístico que você estudou foi o teste Z, que tem a
Distribuição Z como distribuição de referência. Você aprendeu que o teste Z é
usado para medir a diferença entre uma média amostral (x) e a média de uma
população de referência (m), quando a média e o desvio padrão da população
de referência são conhecidos. Em muitos casos temos uma ideia da média da
população de referência, mas não temos acesso ao desvio padrão da população, o
que inviabiliza a realização de um teste Z.

Nesses casos, a solução é estimar o desvio padrão populacional (s) a


partir do desvio padrão da amostra (s). Isso significa assumir que a variação nos
valores da amostra é semelhante à variação na população, ou seja, s é próximo de
s (CALLEGARI-JACQUES, 2003). Em amostras de tamanho grande, s geralmente
fica próximo de s, o que é assegurado pela Lei dos Grandes Números. No
entanto, em amostras de tamanho pequeno, nem sempre s está próximo de s
(CALLEGARI-JACQUES, 2003).

O problema de utilizar o s para estimar o s quando as amostras têm


tamanho pequeno foi investigado por Willian Sealy Gosset (1876-1937), enquanto
trabalhou na cervejaria Guinness, na Irlanda (CALLEGARI-JACQUES, 2003). A
partir de seus estudos e orientação de Karl Pearson, Gosset desenvolveu uma
nova distribuição de referência para os casos em que o s é desconhecido, que é
chamada de distribuição T ou distribuição T de Student (CALLEGARI-JACQUES,
2003). A Distribuição T foi publicada no artigo científico “The probable error of
the mean”, em 1908, mas Gosset precisou adotar o pseudônimo Student para
publicar o artigo, pois a cervejaria não permitia que seus funcionários divulgassem
informações internas relacionadas à empresa (SALSBURG, 2009).

Vejamos como a Distribuição T funciona. Para isso, vamos imaginar uma


população com média (m) conhecida. Desta população retiramos uma amostra
aleatória de nove unidades amostrais (n = 9), a partir da qual calculamos a média
(x) e o desvio padrão (s) amostral. Com os valores de m, x, s e n é possível calcular
um valor t, que representa o tamanho da diferença entre a média amostral (x) e a
média populacional (m), pela equação: t = x - m
s
n
Note que a equação para chegar ao valor t é muito parecida com o teste Z,
que você já aprendeu. No entanto, o denominador da equação t, que representa
o erro padrão da média, é calculado a partir do desvio padrão da amostra (s),
enquanto na equação do teste Z é utilizado o desvio padrão da população (s)
(CALLEGARI-JACQUES, 2003).

79
UNIDADE 2 | TESTES ESTATÍSTICOS I

Vamos imaginar que a amostragem aleatória de nove unidades amostrais


da população foi repetida várias vezes. Ao final teremos vários valores t (t1, t2, t3,
... tn), cada um calculado a partir do desvio padrão (s1, s2, s3, ... sn) da respectiva
amostra. Podemos fazer um histograma com os valores t, que se aproximará
de uma distribuição normal. Se a amostragem fosse repetida infinitas vezes, as
barras do histograma formariam uma curva semelhante à curva de distribuição
normal, com média igual a zero, mas um pouco mais achatada e com as caudas
mais elevadas (observe o gráfico adiante) (CALLEGARI-JACQUES, 2003). Essa
deformação na curva faz com que, por exemplo, o valor de 1,96, que corresponde
à área de rejeição da hipótese nula de 0,05 em um teste bilateral com Distribuição
Z, passe a representar uma área de rejeição muito maior na Distribuição T
(CALLEGARI-JACQUES, 2003).

A diferença entre as curvas de Distribuição Z e T é resultante do uso do


desvio padrão populacional (s) e do desvio padrão amostral (s) para estimar o
erro padrão da média, respectivamente (CALLEGARI-JACQUES, 2003). Em
amostras de tamanho grande, s se aproxima de s e as curvas de Distribuição Z e
T são mais semelhantes. No entanto, quanto menor o tamanho amostral, maior
o erro associado na estimativa de s a partir de s e, em consequência, a curva de
Distribuição T tem valores críticos maiores que a curva de Distribuição Z.

Os valores críticos da Distribuição T podem ser consultados em uma


tabela chamada de Tabela de Distribuição T de Student (Apêndice 2 no final
do caderno). Além do nível crítico de significância (a), os valores críticos de t
também dependem do tamanho amostral, que reflete a precisão da estimativa
de s a partir de s (CALLEGARI-JACQUES, 2003). Essa precisão é indicada por
n - 1 (o tamanho amostral menos um), que é chamada de graus de liberdade (gl).
Portanto, para chegar a um valor crítico de t é necessário indicar o nível crítico de
significância e os graus de liberdade, ou seja, ta; gl.

Vejamos como funciona a consulta à Tabela de Distribuição T na prática.


Na Tabela de Distribuição T do Apêndice 2, as colunas representam diferentes
níveis de significância em testes uni e bilaterais, enquanto as linhas representam
diferentes graus de liberdade. Vamos buscar na tabela qual é o valor crítico t
para um teste bilateral com a = 0,05 e n = 9. Os graus de liberdade, neste caso,
equivalem a oito (n - 1 = 9 - 1 = 8). Precisamos olhar a terceira coluna da Tabela
de Distribuição T, pois o teste é bilateral e a = 0,05. Na sequência basta localizar
a linha que corresponde a nove graus de liberdade, a interseção da coluna com
a linha indica o valor t. No exemplo, o valor para t0,05;8 = 2,31 (Gráfico 13). Isso
significa que, em uma amostra com nove unidades amostrais, a diferença entre as
médias deve ser igual ou maior que 2,31 desvios padrões para que seja rejeitada
a hipótese nula, considerando a = 0,05. Em um teste Z, essa diferença entre as
médias é menor, 1,96 desvios padrões, considerando a = 0,05.

80
TÓPICO 1 | TESTE Z E TESTE T

GRÁFICO 13 - CURVA DE DISTRIBUIÇÃO Z E CURVA DE DISTRIBUIÇÃO T COM OITO GRAUS DE


LIBERDADE E RESPECTIVOS VALORES CRÍTICOS QUANDO O TESTE É BILATERAL COM a = 0,05

FONTE: Adaptado de Callegari-Jacques (2003)

Você aprendeu que a Distribuição T se aproxima da Distribuição


Z conforme se aumenta o tamanho amostral. A última linha da Tabela
de Distribuição T traz os valores de t quando a amostra é muito
grande (Apêndice 2). Note que, em um teste bilateral, o valor de
t0,05; ∞ = 1,96, que é igual ao valor de z quando a = 0,05. Da mesma forma, em um
teste unilateral, o valor de t0,05; ∞ = 1,64 é igual ao valor de z quando a = 0,05.

ATENCAO

Caro acadêmico, a Distribuição T só pode ser utilizada se a variável estudada


apresenta distribuição normal ou aproximadamente normal.

81
UNIDADE 2 | TESTES ESTATÍSTICOS I

3.2 COMPARAÇÃO ENTRE DUAS MÉDIAS


Até agora você estudou como testar se uma média amostral é diferente
da média da população de referência. Essa inferência estatística pode ser feita
pelo teste Z, quando a média e o desvio padrão da população de referência são
conhecidos; ou pelo teste T, quando a média populacional é conhecida, mas o
desvio padrão populacional precisa ser estimado pelo desvio padrão amostral.
Na prática, no entanto, é muito mais frequente a comparação entre duas
amostras cujas médias populacionais são desconhecidas. Isso acontece porque
geralmente trabalhamos com amostras que não permitem chegar aos parâmetros
da população, mas somente uma estimativa destes.

O teste estatístico utilizado para avaliar se duas médias amostrais


pertencem à mesma população ou a populações distintas é o teste T. Como você
vai estudar a seguir, as médias a serem comparadas podem vir de amostras
pareadas ou de amostras independentes e, assim, o teste T é chamado de teste T
pareado e teste T para amostras independentes, respectivamente. Você estudará
primeiro o teste T pareado.

3.2.1 Comparação entre duas médias


de amostras pareadas
Para responder algumas perguntas biológicas, pode ser interessante que
uma mesma unidade amostral forneça duas medidas coletadas em períodos
distintos no tempo, por exemplo, “antes” e “depois” da unidade amostral sofrer
determinada intervenção (VIEIRA, 2011; PAGANO; GAUVREAU, 2013). Cada
medida, “antes” e “depois” da intervenção, representa uma amostra. Como uma
mesma unidade amostral forneceu duas amostras, as amostras são chamadas
de pareadas ou dependentes (VIEIRA, 2011; PAGANO; GAUVREAU, 2013). O
objetivo é testar se existe diferença entre as duas medidas (VIEIRA, 2011). Imagine,
por exemplo, que queremos testar se um novo medicamento para insônia é mais
eficiente que o medicamento convencional. Para isso, avaliaremos 50 pessoas
com problemas de insônia. Após 20 dias de uso do medicamento convencional,
registramos o tempo que cada pessoa leva para dormir. Após o intervalo de
um mês, as pessoas começam a utilizar o novo medicamento e, após 20 dias,
registramos novamente o tempo que cada pessoa leva para dormir. Assim, para
cada uma das 50 pessoas serão tomadas duas medidas: o tempo para dormir com
o medicamento convencional e com o novo medicamento. O teste estatístico para
análise desses dados é o teste T pareado.

Outra maneira de obter amostras pareadas é organizar as unidades
amostrais aos pares, de maneira que as diferenças entre as unidades amostrais de
cada par sejam minimizadas (VIEIRA, 2011; PAGANO; GAUVREAU, 2013). Por
exemplo, imagine que precisamos testar a eficiência de um novo medicamento

82
TÓPICO 1 | TESTE Z E TESTE T

para o tratamento de câncer de pulmão em relação ao medicamento convencional.


Para isso, podemos organizar voluntários com câncer em pares, conforme a idade,
sexo e tempo de desenvolvimento da doença. Um voluntário de cada par receberá
o medicamento convencional, enquanto o outro receberá o novo medicamento.
Novamente, o teste estatístico indicado para análise dos dados é o teste T pareado.

O pareamento das amostras é interessante porque diminui a variabilidade


proveniente das unidades amostrais. A variabilidade nas unidades amostrais
pode diminuir ou impedir a detecção do efeito do fenômeno estudado. Quando as
medidas são tomadas de uma mesma unidade amostral, a variabilidade biológica
é muito menor em comparação às medidas tomadas de unidades amostrais
diferentes (PAGANO; GAUVREAU, 2013). A variabilidade biológica entre as
unidades amostrais também é reduzida quando estas são organizadas em pares.

Para realizar um teste T pareado, precisamos executar todas as etapas de
um teste de hipóteses, conforme a seguir:

1° Estabelecemos as hipóteses nula e alternativa. H0: não existe diferença entre


as duas médias amostrais (x1 = x2); H1: existe diferença entre as duas médias
amostrais (x1 ≠ x2).
2° Estabelecemos se o teste é unilateral ou bilateral.
3° Informamos o nível crítico de significância.
4° Indicamos o valor crítico para a estatística do teste T pareado, que é dado pelo
nível de significância e por n - 1 graus de liberdade (ta; gl).
5° Calculamos a estatística do teste T pareado a partir dos seguintes passos:

a) Calculamos a diferença entre todas as amostras pareadas, ou seja, di = xi1 - xi2,


em que di é a i-ésima diferença entre amostras pareadas (veja a tabela a seguir),
xi1 é a i-ésima unidade amostral da amostra 1 e, xi2 é a i-ésima unidade amostral
da amostra 2.

b) Calculamos a média das diferenças entre todas as amostras pareadas, por:


∑ d . Na equação, d é a média das diferenças, que é dada pelo somatório das
d=
n
diferenças entre todas as amostras pareadas (∑d) sobre o tamanho amostral (n).

c) Calculamos a variância das diferenças entre todas as amostras pareadas, por:


(∑ d )
2

∑d2 -
n . Na equação, s2d é a variância das diferenças entre todas as amostras
n -1
pareadas,∑d é o somatório das diferenças, ∑d2 é o somatório do quadrado das
diferenças e n é tamanho amostral (tabela a seguir).

83
UNIDADE 2 | TESTES ESTATÍSTICOS I

TABELA 13 - ORGANIZAÇÃO DOS DADOS EM UM TESTE T PAREADO

Unidade amostral Amostra 1 Amostra 2 Diferença (d)


Unidade amostral 1 x11 x12 d1 = x11 – x 12
Unidade amostral 2 x21 x22 d2 = x21 – x22
Unidade amostral 3 x31 x23 d3 = x31 – x32
⁞ ⁞ ⁞ ⁞
Unidade amostral n xn1 x1n dn = xn1 – xn2
FONTE: Adaptado de Pagano; Gauvreau (2013)

d
d) Calculamos a estatística do teste T pela equação: t = .
s 2d
n
O numerador da equação é a média das diferenças entre todas as
amostras pareadas (d), o que representa uma medida de diferença entre as duas
amostras estudadas. Já o denominador da equação é o erro padrão da média das
diferenças, dado pela raiz quadrada da razão entre a variância das diferenças (s2d)
e o tamanho amostral (n), ou seja, representa uma medida de erro. A estatística do
teste T pareado segue a lógica da divisão de uma medida de efeito (a média das
diferenças entre as amostras) por uma medida de erro (o erro padrão da média).
Note que o valor t aumenta quando a medida de efeito aumenta e a medida de
erro diminui e, assim, a tendência é rejeitar a hipótese nula; o valor t diminui
quando a medida de efeito diminui e quando a medida de erro aumenta e, assim,
a tendência é aceitar a hipótese nula.

FIGURA 4 - RELAÇÃO ENTRE O NUMERADOR E DENOMINADOR DA EQUAÇÃO DO TESTE T


PAREADO E A ESTATÍSTICA DO TESTE (t)

FONTE: A autora

6° Após calcular a estatística do teste T pareado, podemos encontrar o


p-valor correspondente consultando a Tabela de Distribuição T (Apêndice
2). Também podemos obter o p-valor usando a função “DISTT” do Excel
ao informar o valor de t calculado (representando por “x”), os graus de
liberdade e se o teste é unilateral (“1” indica uma cauda da curva de
Distribuição T em um teste unilateral) ou bilateral (“2” indica as duas
caudas da curva de Distribuição T em um teste bilateral). A função no Excel
é “=DISTT(x; graus_liberdade; caudas)”.

84
TÓPICO 1 | TESTE Z E TESTE T

7° O último passo é fazer a inferência estatística comparando os valores de t


crítico e calculado ou os valores de a e p-valor.

3.2.1.1 Pressupostos do teste T pareado


O teste T pareado possui dois pressupostos que devem ser atendidos
(PAGANO; GAUVREAU, 2013). Primeiro, as amostras devem ser aleatórias. Isso
acontece quando todas as unidades amostrais tiveram a mesma chance de serem
amostradas e, portanto, é um pressuposto que está relacionado ao processo
de amostragem dos dados. Geralmente esse pressuposto é assumido como
verdadeiro sem um teste estatístico para suportá-lo.

O segundo pressuposto é o de normalidade das diferenças entre as


amostras pareadas (d). Quando os dados das duas amostras apresentam
distribuição normal, d também terá distribuição normal. Portanto, basta checar
se d tem distribuição normal para atender ao pressuposto de normalidade. Isso
pode ser feito pela verificação visual de um histograma de frequências de d e, se
a distribuição de frequências de d tiver uma distribuição próxima à distribuição
normal, o pressuposto de normalidade foi atendido. Também se pode avaliar a
normalidade de d por meio de testes estatísticos, como o teste de Shapiro-Wilk.
Esses testes de normalidade podem ser executados em programas estatísticos
específicos, e uma recomendação é o programa PAST (Paleontological Statistic
Software) (HAMMER; HARPER; RYAN, 2001), que é gratuito e tem um manual de
instruções de fácil entendimento e que ensina como fazer os testes de normalidade.

3.2.1.2 Vamos praticar


Agora você verá como o teste T pareado funciona na prática. Imagine que
nosso objetivo é avaliar se existe diferença entre as notas da primeira e segunda
avaliação de estatística realizada por acadêmicos de Ciências Biológicas da
UNIASSELVI. Geralmente, os acadêmicos apresentam uma melhora nas notas da
segunda avaliação em comparação à primeira. Para isso, utilizaremos as notas de
20 acadêmicos, conforme a Tabela 14. Neste exemplo, cada acadêmico representa
uma unidade amostral, as notas da primeira avaliação correspondem à amostra
1 e as notas da segunda à amostra 2. Também podemos representar graficamente
as notas das duas avaliações, conforme o gráfico adiante.

TABELA 14 - NOTAS DAS AVALIAÇÕES DE ESTATÍSTICA DE 20 ACADÊMICOS DE CIÊNCIAS


BIOLÓGICAS DA UNIASSELVI, BEM COMO DIFERENÇAS ENTRE AS NOTAS

Acadêmico 1° Avaliação (notas) 2° Avaliação (notas) Diferença entre as notas


1 5,5 9,5 -4,0
2 3,0 6,0 -3,0
3 5,0 8,0 -3,0

85
UNIDADE 2 | TESTES ESTATÍSTICOS I

4 6,0 9,0 -3,0


5 2,0 4,0 -2,0
6 4,0 6,0 -2,0
7 6,0 8,0 -2,0
8 6,5 8,5 -2,0
9 5,0 6,0 -1,0
10 6,0 7,0 -1,0
11 9,0 10,0 -1,0
12 7,5 8,5 -1,0
13 6,0 7,0 -1,0
14 7,0 7,0 0,0
15 8,5 8,5 0,0
16 6,0 6,0 0,0
17 8,5 7,5 1,0
18 9,5 8,5 1,0
19 7,0 5,0 2,0
20 8,0 5,0 3,0
Média 6,3 7,3 -1,0
Variância 3,2
FONTE: A autora

GRÁFICO 14 - REPRESENTAÇÃO DAS NOTAS DAS AVALIAÇÕES DE ESTATÍSTICA DE 20


ACADÊMICOS DE CIÊNCIAS BIOLÓGICAS DA UNIASSELVI

FONTE: A autora

86
TÓPICO 1 | TESTE Z E TESTE T

Antes de realizar o teste T pareado, precisamos checar os pressupostos do


teste. Assumimos que as amostras são aleatórias, pois este é um pressuposto que
deve ser atendido quando a amostragem é planejada e realizada. Já o pressuposto
de normalidade pode ser checado construindo um histograma das diferenças
das notas da primeira e segunda avaliação. Pelo histograma, notamos que a
distribuição das diferenças das notas segue uma distribuição aproximadamente
normal e, portanto, o pressuposto de normalidade foi atendido.

GRÁFICO 15 - HISTOGRAMA DAS DIFERENÇAS DAS NOTAS DA PRIMEIRA E SEGUNDA


AVALIAÇÃO DE ESTATÍSTICA DE 20 ACADÊMICOS DE CIÊNCIAS BIOLÓGICAS DA UNIASSELVI

FONTE: A autora

Com os pressupostos checados e atendidos, podemos dar sequência ao


teste T pareado. Para isso, precisamos seguir todas as etapas de um teste de
hipóteses, conforme a seguir:

1° Definimos as hipóteses nula e alternativa. H0: não existe diferença entre as


médias das notas da primeira e segunda avaliação de estatística (xAvaliação1 =
xAvaliação2). Sabendo que geralmente as notas da primeira avaliação são mais
baixas que as notas da segunda, podemos estabelecer uma expectativa de
direção da diferença entre as notas na hipótese alternativa. Assim, H1: as notas
da primeira avaliação são menores que as notas da segunda avaliação (xAvaliação1
= xAvaliação2).
2° Neste caso, o teste é unilateral e estamos interessados apenas na cauda esquerda
da curva de Distribuição T, ou seja, nos valores negativos de t.
3° Definimos o nível crítico de significância em 0,05.
4° O t crítico, a partir do qual se rejeita a hipótese nula, pode ser determinado
consultando a Tabela de Distribuição T (Apêndice 2). Para isso, precisamos

87
UNIDADE 2 | TESTES ESTATÍSTICOS I

dos graus de liberdade, dados por n - 1 e, assim, temos 19 graus de liberdade.


O t crítico para um teste unilateral com a = 0,05 e 19 graus de liberdade é t0,05;
19
= -1,729. Portanto, se o t calculado for menor que -1,729 teremos evidências
suficientes para rejeitar a hipótese nula. Note que o valor t é negativo, pois
estamos interessados apenas na cauda esquerda da curva de Distribuição T.
5° Calculamos a estatística do teste T pareado. Para isso, precisamos calcular
as diferenças entre as notas da primeira e segunda avaliação. Na sequência
calculamos a média das diferenças entre as notas das duas avaliações, que foi
de d = -1, 0, bem como a variância das diferenças, que foi de s2d = 3,2. Agora
d -1, 0 -1, 0
basta substituir os valores na equação: t = = = = -2,5
2
sd 3, 2 0, 4

n 20
O t calculado para as diferenças nas notas das duas avaliações foi de -2,5,
ou seja, menor que o t crítico preestabelecido, que foi de -1,729. Com a estatística
do teste já é possível fazer a inferência estatística.

6° Atribuímos o p-valor correspondente ao t calculado. Para isso consultamos


a Tabela de Distribuição T (Apêndice 2) e localizamos qual a probabilidade
associada a t19 = -2,5 (19 representa os graus de liberdade). Temos que a
probabilidade de observar um t19 = -2,5 está entre 0,025 e 0,01, ou seja, menor
que o nível crítico de significância preestabelecido (a = 0,05).

É possível encontrar a probabilidade exata associada ao t19 = -2,5


usando o Excel. Para isso, podemos usar a função “DISTT” do Excel digitando
“=DISTT(2,5;19;1)”. Usando o Excel, o p-valor para t19 = -2,5 é de 0,01.

7° Podemos fazer a inferência estatística. Considerando que o t calculado (t19 = -2,5)


foi menor que o t crítico (t19 = -1,729), rejeitamos a hipótese nula. Considerando
que o p-valor (0,01) foi menor que o nível crítico de significância (0,05), também
rejeitamos a hipótese nula.

Com a inferência estatística e com os pressupostos do teste estatístico
checados, concluímos que a média das notas da primeira avaliação de estatística
(x = 6,3) foi menor que a média das notas da segunda avaliação (x = 7,3) e essa
diferença entre as médias dificilmente teria sido observada se a hipótese nula
fosse verdade (t = -2,5; p = 0,01).

3.2.2 Comparação entre duas médias de amostras


independentes
Você aprendeu que o teste T é usado para avaliar se duas médias
amostrais pertencem a uma mesma população. Você também estudou como
comparar duas médias amostrais provenientes de amostras pareadas, por meio
do teste T pareado. Agora você irá estudar como funciona o teste T para amostras
independentes.

88
TÓPICO 1 | TESTE Z E TESTE T

As amostras são independentes quando as unidades amostrais que


compõem uma amostra diferem, em relação ao fenômeno estudado, das unidades
amostrais que compõem outra amostra (CALLEGARI-JACQUES, 2003). No
entanto, as unidades amostrais de cada amostra devem ser muito semelhantes
entre si em relação a outros fatores que não estão sendo avaliados (CALLEGARI-
JACQUES, 2003). Imagine que queremos avaliar a influência do fogo sobre a
riqueza de árvores. Para isso, podemos selecionar 10 fragmentos florestais que
foram queimados nos últimos cinco anos e 10 fragmentos que não sofreram
queimadas. Os fragmentos florestais devem ser diferentes em relação à variável
estudada – presença de fogo. No entanto, devem ser semelhantes em relação a
outros fatores, como tipo de vegetação, tipo de solo e idade do fragmento. Neste
exemplo, o teste estatístico indicado é o teste T para amostras independentes, que
geralmente é chamado simplesmente de teste T.

Para aplicação do teste T para amostras independentes, devemos seguir


todos os passos de um teste de hipóteses, conforme segue:

1° Definimos as hipóteses nulas e alternativas. H0: não há diferença entre as


médias populacionais (m1 = m2); enquanto H1: há diferença entre as médias
populacionais (m1 ≠ m2).
2° Estabelecemos se o teste é uni ou bilateral.
3° Indicamos o nível crítico de significância (a).
4° Identificamos o valor de t crítico de acordo com a, os graus de liberdade e
se o teste é uni ou bilateral. Os graus de liberdade do teste T para amostras
independentes são dados pelo somatório do tamanho amostral de cada
amostra menos dois (n1 + n2 - 2).
5° Calculamos a estatística do teste T observando os seguintes passos:
a) Calculamos a média de cada amostra, conforme a equação que você já estudou
∑ xij
( xi = ; o subscrito i representa cada amostra e j , cada unidade amostral).
ni
b) Calculamos a variância de cada amostra, conforme a equação que você já
ni
1
( xij - xi ) ).
2
2
estudou ( s i
= ∑
( ni - 1) j =1
c) Calculamos a variância ponderada (s2p), por: s 2 p =
( n1 - 1) s 21 + ( n2 - 1) s 2 2 .
n1 + n2 - 2
Na equação, s 1 e s 2 são as variâncias das amostras 1 e 2, respectivamente.
2 2

Da mesma forma, n1 e n2 são os tamanhos amostrais das amostras 1 e 2,


respectivamente. A variância ponderada combina informações das duas amostras
e gera uma estimativa para a variância populacional comum (s2) (PAGANO;
GAUVREAU, 2013). Note que as duas amostras não precisam apresentar o
mesmo tamanho amostral, pois isso já é considerado na equação.

x1 - x2
d) Calculamos o valor t, pela equação: t = .
1 1 2
 + s p
 n1 n2 
89
UNIDADE 2 | TESTES ESTATÍSTICOS I

Na equação, x1 e x2 são as médias da amostra 1 e 2, respectivamente, e


s2p é a variância ponderada. Note que o numerador da equação é a diferença
entre as médias das duas amostras, o que representa uma medida de efeito. Já o
denominador é o erro padrão das médias amostrais ponderadas pelo tamanho
amostral, o que representa uma medida de erro. Novamente, a lógica do teste
T é a razão do efeito pelo erro. Assim, quanto maior for o efeito e menor for o
erro, maior será o valor de t e, assim, a tendência é rejeitar a hipótese nula. Já
quanto menor for o efeito e maior for o erro, menor será o valor de t e, portanto,
a tendência é aceitar a hipótese nula.

6° Após calcular a estatística do teste T, podemos encontrar o p-valor


correspondente consultando a Tabela de Distribuição T (Apêndice 2) ou
usando a função “DISTT” do Excel.
7° O último passo é fazer a inferência estatística comparando os valores de t crítico
e calculado ou os valores de a e p-valor.

3.2.2.1 Pressupostos do teste T para


amostras independentes
O teste T para amostras independentes apresenta três pressupostos
(CALLEGARI-JACQUES, 2003; VIEIRA, 2011). Primeiro, as amostras
precisam ser aleatórias. Segundo, as amostras devem ter distribuição normal
ou aproximadamente normal, o que pode ser verificado pelo histograma de
frequências construído para os dados de cada amostra. A normalidade de cada
amostra também pode ser avaliada por meio de testes estatísticos executados em
programas estatísticos específicos, como foi mencionado anteriormente.

O terceiro pressuposto de um teste T é a homogeneidade das variâncias,


em que as variâncias das amostras, que representam as estimativas da variância
populacional, devem ser próximas. Vamos voltar ao exemplo da riqueza de
árvores e o efeito do fogo. Imagine que nos fragmentos que foram queimados, a
riqueza de árvores ficou entre 20 e 30 espécies, enquanto os fragmentos sem fogo
tiveram de 40 a 50 espécies. A variabilidade nas duas amostras (fragmentos com
e sem fogo) foi a mesma, embora as médias tenham sido diferentes.

A figura a seguir mostra três curvas de distribuição normal. As curvas A e


B apresentam a mesma variância, o que pode ser verificado pela altura e largura
das curvas, que são iguais. Já as comparações entre as curvas A e C ou entre as
curvas B e C não apresentam homogeneidade de variâncias, pois a curva C é
muito mais alta e estreita, ou seja, tem menor variância que as curvas A e B.

90
TÓPICO 1 | TESTE Z E TESTE T

FIGURA 5 - REPRESENTAÇÃO DA HOMOGENEIDADE DE VARIÂNCIAS

FONTE: Adaptado de Callegari-Jacques (2003)

Para avaliar se as variâncias das duas populações são homogêneas,


podemos fazer um teste estatístico, chamado de teste F. Esse teste segue a
Distribuição F (Apêndice 3 no final do caderno), que foi desenvolvida por Ronald
Aylmer Fisher. A Distribuição F é uma distribuição assimétrica, composta apenas
por valores positivos e tem a forma definida pelos graus de liberdade envolvidos
(CALLEGARI-JACQUES, 2003). Quando as variâncias são iguais, o valor f
esperado é 1. O teste F pode ser calculado observando os seguintes passos:

1° Definimos a hipótese nula e alternativa. H0: não existe diferença nas variâncias
amostrais; H1: uma das variâncias é maior que a outra.

Você verá a seguir que, no teste F, é necessário definir qual das variâncias
das amostras é a maior e qual é a menor. Por isso, podemos estabelecer, já na
hipótese alternativa, uma expectativa de direção da diferença entre as variâncias
e, assim, o teste é unilateral.

2° Estabelecemos o nível crítico de significância, que pode ser de 0,05.


3° Calculamos a variância de cada amostra, conforme a equação que você já
ni
1
( xij - xi ) ).
2
estudou
= ( s 2i ∑
( ni - 1) j =1
4° Obtemos a estatística do teste F, que é dada pela razão entre a maior variância
s 2 Maior
e a menor variância: F = .
s 2 Menor
5° Encontramos o valor de f crítico consultando a Tabela de Distribuição F. Veja
que o Apêndice 3 traz os valores críticos de f para testes unilaterais com a =
0,05. O valor crítico de f é dado pelo a e pelos graus de liberdade das amostras.
As colunas da Tabela de Distribuição F trazem os “graus de liberdade do
numerador” (glN), que é o tamanho da amostra com maior variância menos
um (n - 1. Já as linhas da tabela trazem os “graus de liberdade do denominador”
(glD), que é o tamanho da amostra com menor variância menos um (n - 1).

91
UNIDADE 2 | TESTES ESTATÍSTICOS I

A interseção entre os graus de liberdade do numerador e do denominador


informa o valor de f crítico (Fa; glN; glD).
6° Encontramos o p-valor correspondente ao valor de f calculado. A maneira mais
simples de encontrar o p-valor é usar a função “DISTF” do Excel. Para isso,
precisamos informar o valor de f calculado (indicado por “x”) e os graus de
liberdade do numerador e do denominador. Basta digitar no Excel “=DISTF(x;
glN; glD)”. O p-valor também pode ser determinado consultando as Tabelas de
Distribuição F com diferentes valores de a, que estão disponíveis na internet.
7° O último passo é fazer a inferência estatística pela comparação entre os valores
de f crítico e calculado, bem como entre o p-valor e a. Se a conclusão for que as
variâncias são homogêneas, o teste T para amostras independentes pode ser
usado. Se o pressuposto de homogeneidade de variâncias não for atendido, um
teste T com algumas modificações para considerar as variâncias heterogêneas
deve ser usado e você aprenderá como calculá-lo a seguir.

3.2.2.2 Vamos praticar


Agora que você já estudou um pouco da teoria do teste T para amostras
independentes, bem como seus pressupostos, vamos ver como esse teste funciona
na prática. Vamos voltar ao exemplo do reflorestamento de araucárias. Imagine que
gostaríamos de avaliar se a produção de pinhas por araucárias de reflorestamentos
é diferente da produção em fragmentos florestais naturais. Para isso, foram
selecionadas 25 araucárias de reflorestamentos e 24 de fragmentos florestais, que
tiveram o número de pinhas contado, conforme apresentado na tabela a seguir.

TABELA 15 - NÚMERO DE PINHAS PRODUZIDAS POR ARAUCÁRIAS DE REFLORESTAMENTOS E


DE FRAGMENTOS FLORESTAIS

Araucária Reflorestamento Fragmento florestal


1 60 50
2 65 51
3 55 39
4 50 55
5 53 46
6 45 35
7 54 44
8 61 42
9 54 47
10 56 48
11 59 44
12 48 42
13 49 39
14 52 55
15 57 45
16 58 40
17 53 43

92
TÓPICO 1 | TESTE Z E TESTE T

18 55 46
19 56 43
20 57 47
21 44 43
22 53 38
23 48 48
24 58 51
25 61
Média 54,4 45,0
Variância 26,5 26,2
FONTE: A autora

Antes de iniciar o teste T para amostras independentes, vamos checar


os pressupostos da análise. Assumimos que as amostras são aleatórias. A
normalidade das amostras pode ser verificada pela visualização dos histogramas
de frequências de cada amostra, conforme o gráfico a seguir. Pelos histogramas,
as duas amostras têm distribuição aproximadamente normal.

GRÁFICO 16 - HISTOGRAMAS DE FREQUÊNCIAS DO NÚMERO DE PINHAS PRODUZIDAS POR


ARAUCÁRIAS DE REFLORESTAMENTOS (A) E DE FRAGMENTOS FLORESTAIS (B)

FONTE: A autora

O terceiro pressuposto, que é a homogeneidade de variâncias, é avaliado


pelo teste F. Para isso, devemos observar os seguintes passos:

1° Definimos as hipóteses nula e alternativa do teste F. H0: não existe diferença


nas variâncias amostrais; H1: uma das variâncias é maior que a outra.
2° Assumimos o nível crítico de significância de 0,05.
3° Calculamos a variância das amostras. A variância na produção de pinhas por
araucárias de reflorestamentos foi de s2 = 26,5 e por araucárias de fragmentos
florestais foi de s2 = 26,2.
s 2 Maior 26,5
4° Calculamos a estatística do teste F:
= F = = 1, 01 .
s 2 Menor 26, 2
5° Encontramos o valor crítico para F0,005; 24; 23 = 2,01. No Apêndice 3, basta olhar
qual o valor de F para a interseção da coluna com 24 graus de liberdade do
numerador e da linha com 23 graus de liberdade do denominador.

93
UNIDADE 2 | TESTES ESTATÍSTICOS I

6° Encontramos o p-valor correspondente ao valor de F calculado, que é 0,49, por


meio da função “DISTF” do Excel.
7° O F crítico foi maior que o F calculado, portanto, aceitamos a hipótese nula. O
p-valor foi maior que a, o que também nos faz aceitar a hipótese nula. Assim,
as variâncias são homogêneas e o pressuposto foi atendido.

Como todos os pressupostos da análise foram atendidos, podemos


dar sequência ao teste T. Para isso, precisamos executar os passos do teste de
hipóteses, conforme a seguir:

1° Definimos as hipóteses nula e alternativa do teste T. H0: não há diferença


na produção de pinhas por araucárias de reflorestamentos e de fragmentos
florestais naturais. H1: há diferença na produção de pinhas por araucárias de
reflorestamentos e de fragmentos florestais naturais.
2° De acordo com a formulação da hipótese alternativa, o teste é bilateral.
3° Adotaremos o nível crítico de significância de 0,05.
4° O valor de t crítico é dado pelo a = 0,05 e pelos graus de liberdade (n1 + n2 - 2 =
25 + 24 - 2 = 47). A Tabela de Distribuição T (Apêndice 2) não apresenta o valor
de t0,05; 47, apenas os valores de t0,05; 45 = 2,014 e t0,05; 50 = 2,009, assim, sabemos que
o valor de t crítico para este teste está entre 2,009 e 2,014.
5° Calculamos a estatística do teste T observando os seguintes passos:
a) Já temos a média e variância das amostras calculadas (veja a tabela anterior).
b) Precisamos calcular a variância ponderada, substituindo os valores na
equação:=
s2 p
) s 2 2 ( ( 25 - 1) × 26,5) + ( ( 24 - 1) × 26,=
( n1 - 1) s 21 + ( n2 - 1= 2) 1239
= 26, 4 .
n1 + n2 - 2 25 + 24 - 2 47
c) Agora podemos calcular a estatística do teste T, substituindo os valores na
x1 - x2 54, 4 - 45, 0 9, 4
=
equação: t = = = 6,3 .
1 1 2  1 1  1,5
 + s p  +  × 26, 4
 n1 n2   25 24 
6° Podemos encontrar o p-valor correspondente à estatística do teste T usando a
função “DISTT” do Excel. Pela função, o p-valor < 0,001.
7° Agora podemos fazer a inferência estatística. Considerando que o t calculado
foi maior que o t crítico, rejeitamos a hipótese nula. Considerando que o p-valor
foi menor que o a, também rejeitamos a hipótese nula.

Assim, concluímos que a produção média de pinhas por araucárias de


reflorestamentos (x = 54,4 pinhas por araucária) é diferente da produção de pinhas
em fragmentos florestais (x = 45 pinhas por araucária), e uma diferença igual ou
mais extrema a que foi observada dificilmente seria encontrada se a hipótese nula
fosse verdadeira (t = 6,3; p < 0,001).

3.2.3 Comparação entre duas médias de amostras


independentes e com variâncias heterogêneas
Em alguns casos, os dados disponíveis para comparar duas amostras
independentes não atendem ao pressuposto de homogeneidade de variâncias, ou
seja, s21 ≠ s22. Quando isso acontece, podemos utilizar um teste T com algumas
94
TÓPICO 1 | TESTE Z E TESTE T

modificações, que foi desenvolvido por Smith, em 1936 (CALLEGARI-JACQUES,


2003). O que muda é a maneira de calcular a variância e os graus de liberdade.
No entanto, para fazer o teste T para variâncias heterogêneas, precisamos seguir
todos os passos de um teste de hipóteses, como você já viu anteriormente.

De acordo com Vieira (2011), a estatística do teste T para variâncias


heterogêneas é dada pela equação:

x1 − x2
t=
s 21 s 2 2
+
n1 n2

Na equação, x1 e x2 são as médias de cada amostra,s21 e s22 são as variâncias


de cada amostra e n1 e n2 são os tamanhos amostrais de cada amostra. O numerador
da equação não mudou em relação ao teste T convencional, ainda é a diferença
entre as médias das duas amostras e representa uma medida de efeito. O que
mudou foi o denominador da equação, pois agora as variâncias de cada amostra
são consideradas separadamente. No entanto, o denominador ainda representa
o erro padrão das médias amostrais e é uma medida de erro. A lógica do teste T
continua a mesma, ou seja, a razão do efeito pelo erro.

Ainda de acordo com Vieira (2011), a outra mudança no teste T para


variâncias heterogêneas é o cálculo dos graus de liberdade, que são dados por:

2
 s 21 s 2 2 
 + 
 n1 n2 
gl = 2 2
.
 s 21   s 2 2 
   
 n1  +  n2 
n1 − 1 n2 − 1

Apesar de a equação parecer complicada, os únicos valores necessários


são a variância (s2) e o tamanho amostral (n) de cada amostra. O cálculo dos graus
de liberdade sempre deve ser arredondado para baixo, para o número inteiro
mais próximo (PAGANO; GAUVREAU, 2013).

3.2.3.1 Pressupostos do teste T para


variâncias heterogêneas
O teste T para variâncias heterogêneas apresenta apenas dois pressupostos.
Primeiro, as duas amostras precisam ser aleatórias. Segundo, as duas amostras
devem apresentar distribuição normal ou aproximadamente normal.

95
UNIDADE 2 | TESTES ESTATÍSTICOS I

3.2.3.2 Vamos praticar


Vejamos como o teste T para variâncias heterogêneas funciona na prática.
Imagine que gostaríamos de comparar a produção de pinhas de araucárias de
fragmentos florestais situados até 1000 metros de altitude e fragmentos situados
acima de 1000 metros de altitude. Em cada cota de altitude foram selecionadas
aleatoriamente 16 araucárias, conforme os dados apresentados na tabela a seguir.

TABELA 16 - NÚMERO DE PINHAS PRODUZIDAS POR ARAUCÁRIAS DE FRAGMENTOS


FLORESTAIS SITUADOS ATÉ 1000 METROS E ACIMA DE 1000 METROS DE ALTITUDE
Araucária Até 1000 m de altitude Acima de 1000 m de altitude
1 50 50
2 44 51
3 47 47
4 55 60
5 46 46
6 55 65
7 44 44
8 40 35
9 47 50
10 48 52
11 44 51
12 40 39
13 43 43
14 47 51
15 43 40
16 45 56
Média 46,1 48,8
Variância 19,2 59,9
FONTE: A autora

Antes de executar o teste T para variâncias heterogêneas, precisamos checar


os pressupostos da análise. Assumimos que os dados de produção de pinhas nas duas
cotas de altitude representam amostras aleatórias. Pelo histograma de frequências
notamos que as duas amostras apresentam distribuição aproximadamente normal.

GRÁFICO 17 - HISTOGRAMAS DE FREQUÊNCIAS DO NÚMERO DE PINHAS PRODUZIDAS POR


ARAUCÁRIAS EM FRAGMENTOS FLORESTAIS DE DUAS COTAS DE ALTITUDE DIFERENTES

FONTE: A autora

96
TÓPICO 1 | TESTE Z E TESTE T

Também é interessante checar se as variâncias das amostras são de fato


heterogêneas. Para isso utilizamos o teste F e executamos os seguintes passos:

1° Definimos as hipóteses nula e alternativa do teste F. H0: não existe diferença


nas variâncias amostrais; H1: uma das variâncias é maior que a outra.
2° Assumimos o nível crítico de significância de 0,05.
3° Calculamos as variâncias na produção de pinhas por araucárias em fragmentos
florestais situados até 1000 metros de altitude (s2 = 19,2) e acima de 1000 metros
de altitude (s2 = 59,9).
s 2 Maior 59,9
4° Calculamos a estatística do teste
= F = = 3,12.
s 2 Menor 19, 2
5° Encontramos o valor crítico de F0,05; 15; 15 = 2,86. No Apêndice 3, basta olhar qual
o valor de F para a interseção da coluna e da linha com 15 graus de liberdade.
6° Encontramos o p-valor correspondente ao valor de F calculado, que foi 0,02. O
p-valor foi calculado pela função “DISTF” do Excel.
7° O F crítico foi menor que o F calculado, portanto, rejeitamos a hipótese nula. O
p-valor foi menor que a, o que também nos faz rejeitar a hipótese nula. Assim,
concluímos que as variâncias das amostras são heterogêneas.

Como as variâncias são heterogêneas, precisamos usar o teste T para


variâncias heterogêneas para avaliar se a produção de pinhas difere em relação
às cotas de altitude. Para realizar o teste T, precisamos executar as etapas do teste
de hipóteses, conforme a seguir:

1° Definimos as hipóteses nula e alternativa. H0: a produção de pinhas por araucárias


não difere em relação à altitude dos fragmentos florestais. H1: a produção de
pinhas por araucárias difere em relação à altitude dos fragmentos florestais.
2° Estabelecemos que o teste é bilateral, de acordo com a formulação da hipótese
alternativa.
3° Determinamos o nível crítico de significância de 0,05.
4° Calculamos os graus de liberdade para encontrar o valor de t crítico.
Substituindo os valores na equação:
2
 s 21 s 2 2   19, 2 59, 9 
2

 +   + 
n n2 
gl =  1 2  16 16  24, 44
2
= 2 2
= = 23, 73.
s 1 s 2
2 2
 19, 2   59, 9  1, 03
       
 n1  +  n2   16  +  16 
n1 − 1 n2 − 1 16 − 1 16 − 1

Por arredondamento, temos 23 graus de liberdade. Assim, para o valor


crítico de t0,05; 23 = 2,069.

5° Calculamos a estatística do teste T para variâncias heterogêneas, substituindo


os valores na equação: .
x1 − x2 46,1 − 48, 8 −2, 63
t= = = = −1,18
s 21 s 2 2 19, 2 59, 9
+
2, 22
+
n1 n2 16 16
97
UNIDADE 2 | TESTES ESTATÍSTICOS I

6° Estabelecemos o p-valor correspondente ao valor t calculado usando a função


“DISTT” do Excel. Pela função, o p-valor foi 0,25.
7° Agora podemos fazer a inferência estatística. Considerando que o t calculado
foi menor que o t crítico, aceitamos a hipótese nula. Considerando que o
p-valor foi maior que o a, também aceitamos a hipótese nula.

Assim, concluímos que a produção média de pinhas em fragmentos


florestais situados até 1000 metros de altitude (x = 46,1 pinhas por araucária)
não difere da produção de pinhas de fragmentos acima de 1000 metros de
altitude (x = 48,8 pinhas por araucária). Uma diferença igual à observada
é muito provável de ser encontrada se a hipótese nula fosse verdadeira
(t = -1,18; p = 0,25).

4 MÉTODO ALTERNATIVO – INTERVALOS DE CONFIANÇA


Outra maneira de fazer inferência estatística é por meio dos intervalos de
confiança. Quando a média populacional é desconhecida, esse método fornece
um intervalo de valores, associado a um determinado grau de confiança, que
possivelmente contém a média populacional (PAGANO; GAUVREAU, 2013). O
intervalo de valores é calculado com base no erro padrão da média. O intervalo de
confiança só pode ser calculado quando a variável apresenta distribuição normal
ou aproximadamente normal, pois as distribuições Z e T são usadas no cálculo.

O primeiro passo é estabelecer uma probabilidade para o intervalo de


confiança. Geralmente, assume-se a probabilidade de 95%, o que corresponde
a um a = 0,05 (VIEIRA, 2011). No entanto, outros valores, por exemplo, 90% ou
99%, também podem ser usados.

Nos casos em que se conhece o desvio padrão populacional, o intervalo de


confiança de 95% para uma variável aleatória X é calculado com base na Distribuição
Z. Você já aprendeu que o valor z em um teste bilateral e com a = 0,05 é 1,96. Assim,
s
o limite inferior do intervalo de confiança é dado por x - 1,96 . e, o limite superior,
s s n
por x + 1,96 . . Note que representa o erro padrão da média. De maneira geral,
n n s
o intervalo de confiança é dado por x ± z . (veja tabela a seguir), assim, quando
n
se assume probabilidades diferentes de 95%, o valor z deixa de ser 1,96.

ATENCAO

Caro acadêmico, precisamos ter atenção com a interpretação do intervalo


de confiança! Um intervalo de 95% de confiança significa que, se fossem tomadas 100
amostras independentes da população, em 95 das vezes o intervalo de confiança calculado
abrangeria, de fato, a média populacional; enquanto em cinco das vezes, o intervalo de
confiança não incluiria a média populacional.

98
TÓPICO 1 | TESTE Z E TESTE T

Vejamos como o cálculo do intervalo de confiança funciona na prática.


Imagine que um pesquisador estava investigando o comprimento da concha
de certa espécie de molusco. Para isso, ele mediu 60 conchas e verificou que
o comprimento médio foi de 30,5 mm. O pesquisador também descobriu,
consultando a literatura científica, que o desvio padrão populacional para o
comprimento da concha é de 3,1 mm. Com esses dados podemos estabelecer o
intervalo de confiança para o comprimento da concha.
s 3,1
O limite inferior é dado por: x - 1,96 . n
= 30,5 - 1,96 . 60
= 30,5 - 0,8 = 29,7.
s 3,1
O limite superior é dado por: x - 1,96 . n
= 30,5 + 1,96 . 60
= 30,5 + 0,8 = 31,3.

Portanto, os limites do intervalo de 95% de confiança são 20,7 mm e 31,3


mm. Temos 95% de confiança que a média do comprimento da concha (m) está
entre 20,7 mm e 31,3 mm.

Em alguns casos, estamos interessados somente em determinar um limite


superior para a média populacional (m) ou somente um limite inferior para m.
Nesses casos, o intervalo de confiança é unilateral (PAGANO; GAUVREAU, 2013).
Você já aprendeu que o valor z em um teste unilateral e com a = 0,05 é 1,64. Assim,
um intervalo de 95% de confiança, unilateral, em que temos interesse apenas no
s
limite inferior para m, o limite inferior é estabelecido por x - 1,64 . , enquanto
n
o limite superior do intervalo é a própria média amostral (x). Já um intervalo de
95% de confiança, unilateral, em que temos interesse apenas no limite superior de
s
m, o limite inferior é igual a x e o limite superior é estabelecido por x + 1,64 . .
n

Geralmente, quando a média populacional é desconhecida, o desvio


padrão populacional também é. Assim, o desvio padrão populacional precisa
ser estimado a partir do desvio padrão amostral. Nesses casos, o intervalo de
confiança é calculado com base na distribuição T e o valor z é substituído pelo
valor t (PAGANO; GAUVREAU, 2013). Para chegar ao valor t é necessário
saber se o intervalo de confiança é uni ou bilateral, indicar o nível de confiança
(equivalente ao a) e os graus de liberdade (n - 1). O valor t é dado por ta;gl.

Assim, o intervalo de 95% de confiança bilateral, calculado com base na


s
Distribuição T, tem o limite inferior delimitado por x - ta;gl . e o limite superior,
s n
por x + ta;gl . . Note que agora o desvio padrão é da amostra (s).
n

Vamos calcular o intervalo de confiança para a produção de pinhas


por araucárias de reflorestamentos. A partir de uma amostra de 25 araucárias,
sabemos que a produção média de pinhas foi de 54,4 e o desvio padrão foi de 5,1.
Neste caso, o intervalo de confiança é bilateral e, assumindo 95% de confiança, o
valor t0,05; 24 = 2,064. O número 24 representa os graus de liberdade.
s 5,1
Assim, o limite inferior é dado por: x - t0,05; 24 . = 54,4 - 2,064 . 25
= 54,4
n
- 2,1 = 53,3.
s 5,1
O limite superior é dado por: x - t0,05; 24 . = 54,4 + 2,064 . 25
= 54,4 + 2,1 = 55,5.
n
99
UNIDADE 2 | TESTES ESTATÍSTICOS I

Portanto, os limites do intervalo de 95% de confiança são 53,3 e 55,5 pinhas


por araucárias. Temos 95% de confiança de que a produção média de pinhas por
araucárias de reflorestamentos (m) está entre 53,3 e 55,5 pinhas por araucárias.

O intervalo de confiança construído a partir da Distribuição T também pode


ser unilateral. Quando queremos saber o limite inferior da média populacional
s
(m), o limite inferior é dado por x - ta;gl . e o limite superior é a própria média
n
amostral (x). Quando desejamos saber o limite superior de m, o limite inferior é x
s
e o limite superior é dado por x + ta;gl . .
n

TABELA 17 - EQUAÇÕES PARA ESTABELECER OS LIMITES INFERIOR E SUPERIOR DO


INTERVALO DE CONFIANÇA

FONTE: A autora

Agora que você aprendeu como calcular o intervalo de confiança utilizando


as distribuições Z e T, já pode estudar como usar o intervalo de confiança em um
teste de hipóteses para fazer inferência estatística. O objetivo é saber se o intervalo
construído com base na Distribuição Z ou T inclui a hipótese nula. Assim, se
o intervalo de confiança inclui a hipótese nula, aceitamos H0. Se o intervalo de
confiança não inclui a hipótese nula, rejeitamos H0.

Vejamos como utilizar o intervalo de confiança em um teste de hipóteses


para comparar uma média amostral com a média da população de referência,
quando o desvio padrão populacional é conhecido. Neste caso, a distribuição
utilizada para construir o intervalo de confiança é a Distribuição Z. Novamente,
vamos usar os dados de peso de recém-nascidos (exemplo mencionado no
item de TESTE Z). Sabemos que o peso de recém-nascidos vivos na cidade
de São Paulo em 1998 tem uma média de 3161 g e um desvio padrão de 540 g
(MONTEIRO; BENICIO; ORTIZ, 2000). Uma amostra de 60 recém-nascidos, cujas
mães ingeriram um suplemento de vitaminas durante a gestação, apresentou um
peso médio de 3350 g. A partir desses dados, gostaríamos de saber se o peso

100
TÓPICO 1 | TESTE Z E TESTE T

dos recém-nascidos cujas mães usaram o suplemento de vitaminas é maior que o


peso dos recém-nascidos de referência. Podemos utilizar o intervalo de confiança
para descobrir se as médias de pesos dos recém-nascidos diferem ou não. Para
isso, precisamos seguir todas as etapas de um teste de hipóteses:

1° Definimos as hipóteses nula e alternativa. H0: não há diferença entre o peso


dos recém-nascidos, cujas mães ingeriram o suplemento de vitaminas e o peso
dos recém-nascidos de referência. H1: o peso dos recém-nascidos cujas mães
ingeriram o suplemento é maior que o peso dos recém-nascidos de referência.
2° Estabelecemos o valor z para um intervalo de confiança unilateral, com 95% de
confiança, que é z = 1,64.
3° Construímos o intervalo de confiança, lembrando que o intervalo é unilateral e
estamos interessados apenas no limite inferior de m. Assim, o limite inferior é
s 540
dado por: x - 1, 64 × = 3350 - 1, 64 × = 3350 - 114 = 3234 g . O limite superior
é x = 3350g. n 60
4° Agora podemos fazer a inferência estatística. O intervalo de 95% de confiança
para o peso dos recém-nascidos cujas mães usaram o suplemento de vitaminas
vai de 3234 g até 3350 g. Este intervalo não incluiu a média da população de
referência, que é 3161 g, o que nos faz rejeitar a hipótese nula. Assim, temos
95% de confiança de que o peso dos recém-nascidos cujas mães ingeriram
o suplemento é maior que o peso dos recém-nascidos de referência e,
possivelmente, essa diferença nos pesos dos recém-nascidos é resultado do
uso de suplemento de vitaminas pelas gestantes.

FIGURA 6 - REPRESENTAÇÃO DO INTERVALO DE CONFIANÇA PARA O EXEMPLO DO PESO


DOS RECÉM-NASCIDOS

FONTE: A autora

Até agora, você viu como usar o intervalo de confiança para comparar
uma média amostral com a média de uma população conhecida. Outra
possibilidade é utilizar o intervalo de confiança para comparar duas médias
amostrais. Neste caso, são estabelecidos dois intervalos de confiança (um para
cada amostra), a partir das médias e desvios padrões amostrais e com base na
distribuição T. Se o intervalo de confiança de uma amostra pode abranger a
média populacional da outra amostra, ou seja, existe sobreposição entre os
intervalos de confiança, concluímos, com certo grau de confiança, que as duas
amostras são provenientes de uma mesma população. Quando os intervalos de
confiança não se sobrepõem, concluímos, com certo grau de confiança, que as
amostras apresentam médias populacionais diferentes, ou seja, as amostras são
provenientes de duas populações distintas.

101
UNIDADE 2 | TESTES ESTATÍSTICOS I

Vejamos como fica a comparação entre médias usando o intervalo de


confiança. Para isso, usaremos os dados de produção de pinhas por araucárias
de reflorestamentos e de fragmentos florestais. Ao amostrar 25 araucárias em
reflorestamentos, a média da produção de pinhas foi de 54,4 pinhas por araucária
e o desvio padrão foi de 5,1. Ao amostrar 24 araucárias em fragmentos florestais,
a média da produção de pinhas foi de 45 e o desvio padrão foi de 5,1. Será que a
produção de pinhas é diferente entre araucárias de reflorestamentos e de fragmentos
florestais? Para responder esta pergunta usando o intervalo de confiança, precisamos
executar as etapas de um teste de hipóteses, conforme a seguir:

1° Definimos as hipóteses nula e alternativa. H0: não há diferença na produção


de pinhas por araucárias de reflorestamentos e de fragmentos florestais. H1:
há diferença na produção de pinhas por araucárias de reflorestamentos e de
fragmentos florestais.
2° Estabelecemos o valor t para cada amostra, lembrando que o intervalo de
confiança é bilateral e que assumiremos 95% de confiança. O valor t para a
produção de pinhas em reflorestamentos é t0,05; 24 = 2,064 (24 representa os graus
de liberdade, dados por n - 1). Enquanto o valor t para a produção de pinhas
em fragmentos florestais é t0,05; 23 = 2,069.
3° Construímos o intervalo de confiança para cada amostra.

O intervalo de confiança para a produção de pinhas em reflorestamentos


s 5,1
tem o limite inferior dado por: x - t0,05; 24 . = 54,4 - 2,064 . 25 = 54,4 - 2,1 = 53,3; e
s n 5,1
o limite superior por: x + t0,05; 24 . = 54,4 + 2,064 . 24 = 54,4 + 2,2 = 55,5.
n

O intervalo de confiança para a produção de pinhas em fragmentos


s 5,1
florestais tem o limite inferior dado por: x - t0,05; 23 . = 45 - 2,069 . 24 = 45 - 2,2 =
n 5,1
42,8; e o limite superior por: x + t . s = 45 + 2,069 . 24 = 45 + 2,2 = 47,2.
0,05; 23 n

4° Agora podemos fazer a inferência estatística. O intervalo de 95% de confiança


para a produção de pinhas em reflorestamentos ficou entre 53,3 e 55,5 pinhas
por araucária. Já o intervalo de confiança para a produção de pinhas em
fragmentos florestais ficou entre 42,8 e 47,2 pinhas por araucária. Portanto,
os dois intervalos de confiança não se sobrepõem, o que leva à rejeição da
hipótese nula. Concluímos, com 95% de confiança, que o número médio de
pinhas produzido por araucárias de reflorestamentos é diferente do número
médio de pinhas produzidas por araucárias de fragmentos florestais.

FIGURA 7 - INTERVALO DE 95% DE CONFIANÇA PARA A PRODUÇÃO DE PINHAS POR


ARAUCÁRIAS DE REFLORESTAMENTOS E DE FRAGMENTOS FLORESTAIS

FONTE: A autora

102
RESUMO DO TÓPICO 1
Neste tópico, você aprendeu que:

• O teste Z é um teste estatístico que tem a Distribuição Z como distribuição de


referência. É usado para avaliar se uma amostra (x) pertence à população de
referência (m). Para isso é necessário conhecer a média (m) e o desvio padrão (s)
da população de referência.

• A estatística do teste Z é dada por z = (x - m)/(s/√n).

• A Distribuição T, desenvolvida por Willian Sealy Gosset, é usada quando o


desvio padrão populacional (s) é desconhecido e precisa ser estimado pelo
desvio padrão amostral (s).

• A curva de Distribuição T é semelhante à curva de Distribuição Z (ambas têm


m = 0), mas é um pouco mais achatada e tem as caudas mais elevadas. Em
amostras grandes, s se aproxima de s e as curvas Z e T são mais semelhantes,
mas quanto menor a amostra, maior o erro associado à estimativa de s a partir
de s e, em consequência, a curva de Distribuição T tem valores críticos maiores
que a curva de Distribuição Z.

• Valores críticos da Distribuição T podem ser consultados na Tabela de


Distribuição T, sabendo o a e os graus de liberdade (n - 1), ou seja, ta;gl.

• O teste T pareado é usado para avaliar se duas médias amostrais pareadas


pertencem à mesma população.

• A amostra é pareada quando duas medidas são coletadas da mesma unidade


amostral, mas em períodos distintos no tempo, ou quando as unidades
amostrais são organizadas aos pares, de maneira que as diferenças entre
as unidades de cada par sejam minimizadas. O pareamento diminui a
variabilidade proveniente das unidades amostrais.

d
• A estatística do teste T pareado é dada por t = , em que o denominador é
s 2d
n
a média das diferenças entre todas as amostras pareadas e o denominador é o
erro padrão da média das diferenças. Os graus de liberdade do teste T pareado
são dados por n - 1.

• Os pressupostos do teste T pareado são: amostras aleatórias e normalidade


das diferenças entre as amostras pareadas.

103
• O teste T para amostras independentes é usado para avaliar se duas médias
amostrais independentes pertencem à mesma população. As amostras são
independentes quando as unidades amostrais que compõem uma amostra
diferem, em relação ao fenômeno estudado, das unidades que compõem a
outra amostra.

• A estatística do teste T para amostras independentes é dada por


x1 - x2
t= . Na equação, s2p é a variância ponderada, que é calculada
1 1 2
 + s p
 n1 n2 
( n - 1) s 21 + ( n2 - 1) s 2 2
por s 2 p = 1 .
n1 + n2 - 2
• Os graus de liberdade do teste T para amostras independentes são dados por
n1 + n2 - 2.

• No teste T para amostras independentes as amostras devem ser aleatórias, ter


distribuição normal e apresentar homogeneidade de variâncias.

• A homogeneidade de variâncias é avaliada pelo teste F, que é calculado por


s 2 Maior
F= 2 .
s Menor
• A Distribuição F, desenvolvida por Ronald Aylmer Fisher, é uma distribuição
assimétrica e sua forma varia conforme os graus de liberdade do numerador e
do denominador.

• O teste T para variâncias heterogêneas é usado para comparar duas amostras


independentes cujas variâncias não são homogêneas. O que muda neste teste,
em relação ao convencional, é o cálculo da variância e dos graus de liberdade.

x1 - x2
• A estatística do teste T para variâncias heterogêneas é dada por t = .
s 21 s 2 2
+
2 n1 n2
 s 21 s 2 2 
 + 
Os graus de liberdade são estabelecidos por: gl =  n1 n2  .
2 2
 s 21   s 2 2 
   
 n1  +  n2 
n1 - 1 n2 - 1

• Em um teste T para variâncias heterogêneas, as duas amostras precisam ser


aleatórias e ter distribuição normal ou aproximadamente normal.

• O intervalo de confiança também é usado para fazer inferência estatística. Ele


fornece um intervalo de valores, com certo grau de confiança, que possivelmente
contém m.
104
• Cada intervalo tem uma probabilidade de confiança associada, que geralmente
é de 95%.

• Um intervalo de 95% de confiança deve ser interpretado da seguinte maneira:


se fossem tomadas 100 amostras independentes da população, em 95 das vezes
o intervalo de confiança calculado abrangeria m; enquanto em cinco das vezes,
o intervalo não incluiria m.

• Quando s é conhecido, a Distribuição Z é usada para calcular o intervalo de


confiança, quando somente s é conhecido, a Distribuição T é usada.

s
• Quando s é conhecido, o intervalo de confiança bilateral é dado por: x ± z . .
n

• Quando apenas s é conhecido, o intervalo de confiança bilateral é dado por: x


± ta;gl . s .
s
n

• Em um teste de hipótese, o objetivo é saber se o intervalo de confiança inclui


H0. Se o intervalo inclui H0, aceitamos H0. Se o intervalo de confiança não inclui
H0, rejeitamos H0.

• Para avaliar se duas médias amostrais provêm da mesma população, basta


comparar seus intervalos de confiança. Se os intervalos de confiança se
sobrepõem, concluímos, com certo grau de confiança, que as duas amostras
pertencem à mesma população. Quando os intervalos não se sobrepõem,
concluímos, com certo grau de confiança, que as amostras pertencem a
populações diferentes.

105
AUTOATIVIDADE

Caro acadêmico! Para fixar melhor o conteúdo estudado, vamos


exercitar um pouco. Leia as questões a seguir e responda-as em seu caderno
de estudos. Bom trabalho!

1 Certo pesquisador investigou a eficiência de uma nova dieta que visa


diminuir o nível de colesterol sanguíneo. Para isso, ele selecionou, ao acaso, 50
pessoas adultas, as quais foram submetidas à nova dieta. Após 60 dias de dieta,
o pesquisador coletou amostras sanguíneas dessas pessoas e verificou que o
colesterol médio foi de 245 mg/dL. Sabendo que o nível médio de colesterol
sanguíneo é de 262 mg/dL e o desvio padrão é de 70 mg/dL, o pesquisador
pode afirmar que a nova dieta reduz o nível de colesterol?
FONTE: Adaptado de Callegari-Jacques (2003)

Para responder à pergunta, siga os seguintes passos de um teste de hipóteses:

a) Formule a hipótese nula e a hipótese alternativa.


b) Identifique qual teste estatístico deve ser utilizado.
c) Verifique se o teste estatístico é unilateral ou bilateral.
d) Estabeleça o nível crítico de significância (a) e o valor crítico da estatística
do teste.
e) Calcule a estatística do teste e encontre o p-valor correspondente.
f) Com base nos resultados, faça a inferência estatística.
g) Qual deve ser a conclusão do pesquisador sobre a nova dieta em relação ao
nível de colesterol sanguíneo?

2 Estudos de dinâmica florestal avaliam as mudanças da floresta ao longo


do tempo. Uma medida utilizada nesses estudos é a área basal (AB), que
representa a área do tronco das árvores a 1,30 m do solo e é calculada por
AB = π/4 x d2, em que d é o diâmetro do tronco de cada árvore. Um estudo de
dinâmica florestal foi conduzido no Parque Natural Municipal São Francisco
de Assis, em Blumenau, no qual todas as árvores foram medidas em 1994 e em
2000 (GHODDOSI, 2005). A tabela a seguir mostra a área basal de 15 espécies
nos dois períodos. A partir desses dados é possível afirmar que a área basal
das 15 espécies mudou entre 1994 e 2000? Para responder à pergunta, siga os
seguintes passos de um teste de hipóteses:

106
Área basal (m2/ha)
Espécie
1994 2000
Aparisthmium cordatum 0,463 0,463
Aspidosperma australe 1,219 1,267
Bathysa australis 0,528 0,537
Brosimum lactescens 1,296 1,348
Cryptocarya aschersoniana 1,806 1,658
Euterpe edulis 5,600 5,750
Garcinia gardneriana 0,084 0,095
Guatteria australis 0,383 0,347
Hirtella hebeclada 0,413 0,372
Marlierea obscura 0,346 0,321
Maytenus robusta 0,091 0,080
Ocotea aciphylla 0,266 0,298
Psychotria nuda 0,091 0,094
Psychotria suterella 0,074 0,065
Virola bicuhyba 1,314 1,381

a) Formule a hipótese nula e a hipótese alternativa.


b) Identifique qual teste estatístico deve ser utilizado.
c) Cheque os pressupostos do teste estatístico.
d) Verifique se o teste estatístico é unilateral ou bilateral.
e) Estabeleça o nível crítico de significância (a) e o valor crítico da estatística
do teste.
f) Calcule a estatística do teste e encontre o p-valor correspondente.
g) Com base nos resultados, faça a inferência estatística.

3 Sabbi, Ângelo e Boeger (2010) estudaram a influência de diferentes graus


de luminosidade sobre a estrutura das folhas de Schinus terebinthifolius
Raddi (Anacardiaceae). A área foliar foi um dos aspectos morfológicos que
os pesquisadores avaliaram. Para isso, eles mediram a área foliar de 90
indivíduos da espécie em duas áreas diferentes, uma mais iluminada e a outra
menos iluminada. Os pesquisadores observaram que na área mais iluminada
a área foliar média foi de 33,3 cm2 e a variância foi de 138,3. Já na área menos
iluminada, a área foliar média foi de 38,4 cm2 e a variância foi de 139. Com
base nesses dados, os pesquisadores podem afirmar que a área foliar de S.
terebinthifolius diferiu em relação aos diferentes graus de luminosidade? Para
responder à pergunta, siga os seguintes passos de um teste de hipóteses:

a) Formule a hipótese nula e a hipótese alternativa.


b) Identifique qual teste estatístico deve ser utilizado.
c) Cheque os pressupostos do teste estatístico.
d) Verifique se o teste estatístico é unilateral ou bilateral.
e) Estabeleça o nível crítico de significância (a) e o valor crítico da estatística
do teste.
f) Calcule a estatística do teste e encontre o p-valor correspondente.
g) Com base nos resultados, faça a inferência estatística.
107
4 Hatano et al. (2001) avaliaram a temperatura corpórea de algumas espécies
de lagartos da restinga de Jurubatiba, Macaé-RJ. Esses pesquisadores
mediram a temperatura de 42 indivíduos da espécie Tropidurus torquatus
(Wied-Neuwied, 1820) e obtiveram uma temperatura média de 34,8 °C e um
desvio padrão de 2,4 °C. Eles também avaliaram 24 indivíduos da espécie
Psychosaura macrorhyncha e encontraram uma temperatura média de 32,7
°C e um desvio padrão de 2,7 °C. Com base nos dados dos pesquisadores,
construa intervalos de 95% de confiança e diga se as duas espécies apresentam
temperaturas corpóreas diferentes.

108
UNIDADE 2 TÓPICO 2

DELINEAMENTO EXPERIMENTAL

1 INTRODUÇÃO
Na Unidade 1 deste caderno você estudou sobre a necessidade e importância
de fazer amostragem para coletar dados e responder perguntas científicas. Neste
tópico, você estudará um pouco mais sobre amostragem e delineamento amostral,
mas, principalmente, com foco em estudos experimentais. O planejamento de
estudos experimentais geralmente é denominado de delineamento experimental,
mas também pode ser chamado de delineamento amostral.

O delineamento amostral/experimental é uma das etapas mais importantes


em um estudo científico. Dados obtidos por delineamentos mal planejados
são complicados para analisar estatisticamente e, por vezes, geram evidências
fracas ou inconsistentes. Não existe método estatístico que salve um conjunto de
dados obtido por um delineamento falho! Além disso, a amostragem dos dados
geralmente é a etapa mais cara na execução de um projeto. Um delineamento mal
planejado, além de resultar em dados inconsistentes, também leva ao desperdício
de recursos financeiros e tempo.

Como se trata de uma etapa fundamental em um estudo científico, neste


tópico você estudará os principais tipos de delineamento experimental, mas antes
é importante que você saiba alguns conceitos básicos relacionados aos estudos
experimentais, que serão apresentados a seguir.

2 EXPERIMENTO
Experimento é um procedimento replicável, que normalmente acontece
sob condições controladas e tem por objetivo verificar a validade de hipóteses
(GOTELLI; ELLISON, 2011). Num experimento, geralmente buscamos reduzir
fontes de variação que não são foco do estudo e que podem confundir a
interpretação dos resultados, mas, por outro lado, manipulamos, de maneira
controlada, o fator que influencia o fenômeno estudado.

109
UNIDADE 2 | TESTES ESTATÍSTICOS I

2.1 EXPERIMENTO MANIPULATIVO


Em um experimento manipulativo, o pesquisador manipula e gera
diferentes níveis para o fator que está sendo estudado e, na sequência, observa
a resposta das unidades amostrais aos níveis do fator (GOTELLI; ELLISON,
2011). Imagine, por exemplo, que gostaríamos de estudar se a concentração de
determinado hormônio afeta o crescimento de uma espécie de planta. Nesse
exemplo, o hormônio é o fator estudado. Poderíamos aplicar o hormônio sobre
as plantas em três concentrações diferentes: baixa, média e alta. Assim, as três
concentrações hormonais diferentes representam os níveis do fator.

Ao mesmo tempo em que o pesquisador manipula o fator de interesse, ele


tenta controlar fontes de variações indesejáveis e que podem confundir a resposta
das unidades amostrais. Os estudos experimentais podem ser conduzidos em
ambientes totalmente controlados, por exemplo, em laboratórios ou em estufas.
Nesses ambientes, as condições ambientais, como luminosidade, temperatura e
umidade do ar, são as mesmas para todas as unidades amostrais e apenas o fator
em estudo varia.

Os estudos experimentais também podem ser realizados em ambientes


parcialmente controlados, como é o caso de experimentos conduzidos em
campo. Nesses casos, o pesquisador tenta controlar ao máximo as condições
ambientais que podem afetar o experimento, no entanto, isso é muito mais
difícil em comparação aos experimentos de laboratório ou estufa. Por exemplo,
imagine que um pesquisador estava investigando a influência da herbivoria
sobre o crescimento de uma espécie de planta de sub-bosque (as plantas de
sub-bosque vivem sob a copa das árvores maiores). Para isso, ele montou um
experimento em campo, em um fragmento florestal. Ele selecionou, ao acaso, 40
plantas da espécie estudada, todas com o mesmo tamanho e idade e sob a mesma
intensidade de sombreamento pelas árvores maiores. O pesquisador cobriu 20
das plantas selecionadas com uma rede para impedir o acesso de herbívoros. Já as
outras 20 plantas foram mantidas descobertas para o livre acesso de herbívoros.
Após certo tempo, o pesquisador avaliou o tamanho das plantas herbívoras e
não herbívoras. Nesse experimento, o pesquisador fez o possível para controlar
fontes de variações indesejadas, mas nem tudo pode ser controlado. Por exemplo,
algumas das plantas selecionadas poderiam estar situadas em solos mais pobres,
e como nutrientes do solo são um fator importante para o crescimento das plantas,
isso pode ter influenciado os resultados do estudo.

Estudos experimentais manipulativos são muito importantes para a


pesquisa científica, porque permitem avaliar relações de causa e efeito (GOTELLI;
ELLISON, 2011). Experimentos em ambientes totalmente controlados tendem a
apresentar resultados mais robustos em comparação aos experimentos executados
em campo, pois as fontes de variação indesejadas são mais facilmente controladas
no primeiro.

110
TÓPICO 2 | DELINEAMENTO EXPERIMENTAL

Apesar da importância, os experimentos manipulativos têm algumas


limitações. Dificilmente estudos experimentais manipulativos são conduzidos
em amplas escalas, pois isso exigiria muito tempo e recurso financeiro (GOTELLI;
ELLISON, 2011). Normalmente, os experimentos utilizam poucos metros
quadrados, mas quando abrangem escalas maiores, geralmente apresentam
pouca ou nenhuma repetição (GOTELLI; ELLISON, 2011).

Os experimentos manipulativos costumam lidar somente com organismos


pequenos e de ciclo de vida curto, por serem mais facilmente manipulados
(GOTELLI; ELLISON, 2011). Organismos de ciclo de vida longo, por exemplo,
exigiriam muitos anos de experimentação para que fornecessem resultados.
Por limitações de tempo e recurso financeiro, os experimentos tendem a refletir
a realidade biológica de maneira simplificada. No entanto, em alguns casos a
simplificação é tão grande que faz com que o experimento deixe de ser realista
(GOTELLI; ELLISON, 2011).

2.2 EXPERIMENTO NATURAL


O experimento natural é um estudo observacional em que o pesquisador
aproveita a variação natural do sistema ecológico para coletar evidências contra
ou a favor de determinada hipótese (GOTELLI; ELLISON, 2011). Como o
pesquisador não manipula ou altera o fator estudado, um experimento natural
não é de fato um experimento, mas sim um estudo observacional (GOTELLI;
ELLISON, 2011). Por exemplo, para investigar se a herbivoria influencia o
crescimento da espécie de planta do sub-bosque, o pesquisador não precisa fazer
um experimento manipulativo. Ele pode, simplesmente, medir o tamanho e o
grau de herbivoria de um grande número de plantas e depois relacionar as duas
medidas para ver se plantas maiores tiveram menos herbivoria.

Assim, tanto experimentos manipulativos quanto experimentos naturais


(estudos observacionais) podem gerar os mesmos resultados (GOTELLI;
ELLISON, 2011). No entanto, o poder de inferência dos resultados é diferente
entre os tipos de experimentos (GOTELLI; ELLISON, 2011). Em experimentos
manipulativos, as fontes de variações indesejadas são mais bem controladas e,
assim, o pesquisador tem maior segurança de que o fator investigado influencia as
unidades amostrais. Já em experimentos naturais, nenhum controle de fontes de
variação indesejadas é feito e, portanto, os resultados obtidos podem ser devido
à atuação do fator estudado ou devido a uma gama de fatores que influenciam
o sistema, mas que não foram considerados. No exemplo da relação entre o
crescimento da planta e o grau de herbivoria, o tamanho das plantas pode variar
em função de outros fatores, como luminosidade, nutrientes do solo ou densidade
das plantas vizinhas, que nada têm a ver com o fator estudado – herbivoria.
Enquanto experimentos manipulativos permitem investigar relações de causa e
efeito, experimentos naturais possibilitam apenas estabelecer correlações entre o
fator estudado e a resposta observada (GOTELLI; ELLISON, 2011).

111
UNIDADE 2 | TESTES ESTATÍSTICOS I

Apesar da limitação relacionada ao poder de inferência, experimentos


naturais apresentam menor dependência em relação à escala espacial ou
temporal (GOTELLI; ELLISON, 2011). Experimentos naturais podem ser
realizados em amplas escalas espaciais, como a investigação do padrão de
distribuição da riqueza de espécies pela Terra e, em amplas escalas temporais,
como os estudos fósseis.

2.3 REPLICAÇÃO
Não é possível tirarmos conclusões seguras baseadas na observação de
uma única unidade amostral. As unidades amostrais de uma população variam
entre si e, com a amostragem de apenas uma unidade, essa variabilidade
não pode ser estimada. Além disso, uma única unidade amostral pode não
representar adequadamente a população como um todo. Por isso, é importante
a replicação das unidades amostrais que compõem cada grupo (GOTELLI;
ELLISON, 2011). Cada replicação das unidades amostrais nos grupos é chamada
de réplica (GOTELLI; ELLISON, 2011). Por exemplo, no estudo da relação entre
crescimento da planta e herbivoria, não basta observar apenas uma planta sem
e outra com acesso de herbívoros. É necessário avaliar um conjunto de plantas
de cada grupo (com e sem acesso de herbívoros) e, assim, cada planta de cada
grupo representa uma réplica.

Quanto maior o número de réplicas em cada grupo, mais confiáveis são


os resultados do estudo. No entanto, aumentar o número de réplicas também
significa aumentar o investimento de tempo e recurso financeiro para obtenção
dos dados. Para estabelecer um bom número de réplicas é necessário levar em
conta a variabilidade dos dados, que é estimada pelo erro padrão da amostra,
bem como o tamanho do efeito, que pode ser, por exemplo, a diferença observada
na comparação entre dois grupos (GOTELLI; ELLISON, 2011). Quanto maior o
erro padrão da amostra e quanto menor o tamanho do efeito, maior terá que ser
o número de réplicas. Quando o erro padrão da amostra é pequeno e o tamanho
do efeito é grande, um número menor de réplicas é necessário (GOTELLI;
ELLISON, 2011).

Um ponto de partida para definir um número de réplicas é a Regra dos


10. Segundo essa regra, para cada grupo em estudo devemos obter dados de
no mínimo dez réplicas (GOTELLI; ELLISON, 2011). Assim, para o exemplo
do crescimento das plantas e herbivoria, deveríamos, no mínimo, observar dez
plantas com acesso de herbívoros e dez plantas sem acesso.

112
TÓPICO 2 | DELINEAMENTO EXPERIMENTAL

2.4 TRATAMENTO, FATOR E NÍVEL


Em um experimento manipulativo, os tratamentos representam os tipos
de manipulação pelos quais as unidades amostrais são submetidas. Já em um
experimento natural, os tratamentos são os diferentes grupos que estão sendo
observados (GOTELLI; ELLISON, 2011).

Os tratamentos representam diferentes intensidades ou categorias de


uma variável, e essa variável é chamada de fator (GOTELLI; ELLISON, 2011).
No exemplo da relação entre crescimento da planta e herbivoria, existem dois
tratamentos (plantas com e sem acesso de herbívoros), que se referem a apenas
um fator – herbivoria. As diferentes intensidades ou categorias de um fator são
denominadas de níveis (GOTELLI; ELLISON, 2011).

Imagine que um pesquisador estava investigando a influência do nitrogênio


(N) e do fósforo (P) no crescimento de determinada espécie de planta. Para isso,
o pesquisador elaborou um experimento em que colocava três concentrações
diferentes de nitrogênio (0 mg, 10 mg e 50 mg) e duas concentrações de fósforo
(10 mg e 50 mg) nos vasos das plantas. Nesse exemplo, cada elemento químico (N
e P) representa um fator. Cada concentração de nitrogênio e de fósforo representa
um nível do fator nitrogênio e do fator fósforo, respectivamente. A combinação
entre todos os níveis dos fatores (três níveis do fator N x dois níveis do fator P)
resulta em seis tratamentos distintos.

2.5 GRUPO TRATADO E GRUPO CONTROLE


Em um experimento, o grupo tratado é composto por unidades amostrais
(réplicas) que estão sob efeito do tratamento de interesse (PADOVANI, 2014). Já
o grupo controle é constituído por unidades amostrais que servem de ponto de
referência na comparação com o grupo controle, a fim de evidenciar o efeito do
fenômeno estudado (PADOVANI, 2014).

O grupo controle pode ser representado por um controle negativo, quando


as unidades amostrais não recebem tratamento (PADOVANI, 2014). Por exemplo,
em um experimento que investiga a eficiência de um medicamento para dor de
cabeça, o grupo tratado receberia o medicamento, enquanto o grupo controle
negativo receberia apenas um placebo.

O grupo controle também pode ser um controle positivo, em que as


unidades amostrais recebem o tratamento convencional (PADOVANI, 2014). Por
exemplo, em um experimento que investiga a eficiência de um novo medicamento
para o tratamento de câncer, o grupo tratado receberia o novo medicamento,
enquanto o grupo controle positivo receberia o medicamento convencional.

113
UNIDADE 2 | TESTES ESTATÍSTICOS I

2.6 CASUALIZAÇÃO
A casualização, também chamada de randomização, é alocação aleatória
das unidades amostrais (réplicas) pelos grupos tratados e controle (GOTELLI;
ELLISON, 2011). A casualização é importante por diminuir o risco de tendências
relacionadas às unidades amostrais e deve ser bem planejada, pois é uma das
etapas da amostragem que não pode ser alterada após a execução do experimento.

No exemplo da relação entre crescimento das plantas e herbivoria,


o pesquisador tentou trabalhar com plantas que estivessem sob as mesmas
condições, ou seja, plantas com mesmo tamanho e idade, expostas ao mesmo
nível de sombreamento pelas árvores maiores. No entanto, em um experimento
sempre existem fatores não controláveis. Por isso, é importante aleatorizar
a distribuição dos tratamentos (colocação ou não da rede para evitar o acesso
de herbívoros) pelas plantas. A casualização pode ser feita sorteando qual dos
tratamentos cada planta deve receber.

Em experimentos executados em laboratórios ou estufas, além de


aleatorizar as unidades amostrais pelos tratamentos, também é importante
aleatorizar a distribuição das unidades amostrais pelo espaço físico em que
serão mantidas durante o experimento. Pode acontecer, por exemplo, que uma
extremidade da estufa é mais iluminada que a outra. Para evitar a influência da
luminosidade nos resultados, podemos sortear a posição das unidades amostrais
pelo espaço físico da estufa, de maneira que, tanto réplicas do grupo tratado
quanto do grupo controle sejam alocadas em ambas as extremidades da estufa.

2.7 INDEPENDÊNCIA NAS OBSERVAÇÕES


A independência nas observações é um dos principais pressupostos da
maioria das análises estatísticas. Independência nas observações significa dizer
que medidas tomadas em uma unidade amostral não tiveram influência na
obtenção de medidas em outras unidades amostrais (GOTELLI; ELLISON, 2011).
Quando duas unidades amostrais de um experimento estão muito próximas,
as medidas tomadas em cada unidade podem não ser independentes e isso faz
com que as medidas sejam mais parecidas ou mais diferentes entre si, quando na
realidade não são. Se as medidas forem mais parecidas do que deveriam, não se
detecta a diferença entre os tratamentos que são diferentes, ocorre uma inflação
do erro tipo II (GOTELLI; ELLISON, 2011). Se as medidas forem mais diferentes
do que deveriam, ou seja, uma diferença é detectada entre os tratamentos quando
não existe, ocorre uma inflação do erro tipo I (GOTELLI; ELLISON, 2011).
Essa inflação do erro tipo I ou tipo II acontece porque o número de unidades
amostrais do experimento, utilizado para obter os graus de liberdade e o p-valor,
não foi “contado” corretamente. Quando duas unidades amostrais não são
independentes, elas não podem ser contabilizadas como duas unidades, pois
representam menos que duas unidades de fato.
114
TÓPICO 2 | DELINEAMENTO EXPERIMENTAL

Voltando ao exemplo da relação entre crescimento das plantas e herbivoria,


imagine que duas plantas do experimento estão situadas muito próximas. Uma
das plantas foi coberta com uma rede e não permite o acesso de herbívoros,
enquanto a outra planta não tem rede e os herbívoros têm livre acesso. As duas
plantas juntas representam uma maior fonte de recurso e acabam atraindo mais
herbívoros. No entanto, como uma das plantas tem a rede, todos os herbívoros
atraídos consomem apenas a planta sem rede. Isso faz com que a diferença entre
os dois tratamentos (plantas sem e com acesso de herbívoros) seja acentuada.
Assim, uma diferença entre os dois tratamentos é mais facilmente encontrada,
mas pode não ser real.

No planejamento do delineamento experimental é importante estabelecer


certa distância entre as unidades amostrais, para que as observações sejam
independentes (GOTELLI; ELLISON, 2011). Nem sempre é fácil definir qual deve
ser essa distância. O que pode ajudar é a consulta a outros trabalhos científicos, a
execução de um experimento piloto ou imaginar qual seria uma boa distância de
acordo com grupos de organismos estudados (GOTELLI; ELLISON, 2011).

3 TIPOS DE DELINEAMENTO
Agora que você apreendeu conceitos básicos sobre delineamento, já pode
estudar quais são os principais tipos de delineamento experimental.

3.1 DELINEAMENTO INTEIRAMENTE CASUALIZADO


O delineamento inteiramente casualizado é um dos delineamentos
experimentais mais simples e robusto que existe (GOTELLI; ELLISON, 2011).
Este delineamento é composto por apenas um fator, que apresenta diferentes
níveis, que são os tratamentos. Este delineamento experimental é usado para
avaliar se existem diferenças entre os tratamentos e para descobrir quais
tratamentos são diferentes entre si (GOTELLI; ELLISON, 2011).

O delineamento inteiramente casualizado tem apenas duas exigências


(GOTELLI; ELLISON, 2011). Primeiro, todas as unidades amostrais do
experimento precisam responder de maneira similar e homogênea aos
tratamentos, ou seja, as unidades amostrais devem ser muito parecidas entre
si. Segundo, a distribuição das unidades amostrais pelos tratamentos deve
ser inteiramente casualizada, ou seja, o tipo de tratamento que cada unidade
amostral receberá deve ser definido por sorteio.

Vejamos como o delineamento inteiramente casualizado funciona na


prática. Imagine que um pesquisador avaliou, por meio de um experimento
manipulativo, se diferentes concentrações de nitrogênio no solo influenciam
o crescimento do milho. O pesquisador utilizou três diferentes concentrações

115
UNIDADE 2 | TESTES ESTATÍSTICOS I

de nitrogênio (0 mg, 10 mg e 50 mg) no experimento, e cada concentração


teve 12 réplicas, ou seja, 12 plantas de milho. Assim, no experimento foram
usadas 36 plantas de milho no total, todas da mesma variedade e com a mesma
idade e vigor. Neste exemplo, o nitrogênio representa o fator estudado e as três
concentrações do nutriente (0 mg, 10 mg e 50 mg) são os níveis do fator. Cada
nível do fator representa um tratamento. Na figura a seguir são apresentados os
três tratamentos e as réplicas de cada tratamento. Observe que todas as réplicas
são idênticas entre si.

FIGURA 8 - REPRESENTAÇÃO DE UM DELINEAMENTO INTEIRAMENTE CASUALIZADO

FONTE: Adaptado de Diniz (dados não publicados)

TURO S
ESTUDOS FU

Caro acadêmico, você entendeu como o delineamento experimental inteiramente


casualizado funciona? É importante que tenha entendido, pois este é o delineamento base
para um teste estatístico que você irá aprender a seguir, chamado de análise de variância.

3.2 DELINEAMENTO EM BLOCOS CASUALIZADOS


Quando suspeitamos que as unidades amostrais possam responder de
maneira heterogênea aos tratamentos, pois não são similares entre si, é necessário
utilizar um delineamento em blocos casualizados (GOTELLI; ELLISON, 2011).
Imagine, por exemplo, que um pesquisador estava avaliando a influência de
dois hormônios sobre o crescimento de ratos, mas para conduzir o experimento

116
TÓPICO 2 | DELINEAMENTO EXPERIMENTAL

ele teve que usar ratos de duas idades diferentes, pois não havia um número
suficiente de ratos da mesma idade. Neste exemplo, as unidades amostrais não
são similares entre si e, além disso, podem apresentar respostas diferentes em
relação aos tratamentos. Em experimentos de campo, as unidades amostrais
podem ter respostas heterogêneas aos tratamentos, pois as condições ambientais
em que as unidades estão expostas são diferentes, por exemplo, diferentes níveis
de luminosidade, de altitude, tipos de solo etc.

A heterogeneidade entre as unidades amostrais pode ser considerada no


delineamento do experimento por meio de blocos (GOTELLI; ELLISON, 2011). As
unidades amostrais são separadas em grupos de acordo com a característica que
as distingue. Cada grupo é chamado de bloco e, dentro dos blocos, as unidades
amostrais devem ser similares entre si. Em experimento de campo, cada bloco
deve apresentar características ambientais relativamente homogêneas (GOTELLI;
ELLISON, 2011). No exemplo do crescimento dos ratos e hormônios, um bloco
seria composto pelos ratos mais jovens e o outro, pelos ratos mais velhos.

Para montar um delineamento em blocos casualizados é necessário


garantir que cada bloco recebe todos os tratamentos. Além disso, dentro de
cada bloco, o tipo de tratamento que as unidades amostrais irão receber deve
ser sorteado (GOTELLI; ELLISON, 2011). Sempre que possível, é importante que
os blocos tenham mais de uma réplica para cada tratamento. Um problema do
delineamento em blocos é que à medida que se aumenta o número de blocos,
maior terá que ser o tamanho amostral para garantir que os blocos tenham
replicação (GOTELLI; ELLISON, 2011).

Em experimentos em blocos casualizados com replicação, ou seja, com


mais de uma unidade amostral para cada tratamento dentro de cada bloco, é
possível avaliar a interação entre os efeitos do bloco e do tratamento (GOTELLI;
ELLISON, 2011). Em alguns casos, as unidades amostrais apresentam respostas
diferentes aos tratamentos, o que é esperado, mas as respostas são congruentes
entre os diferentes blocos. Já em outros casos, a resposta das unidades amostrais
depende do tratamento ao qual foram submetidas, bem como do bloco a que
pertencem. Quando isso acontece, dizemos que existe interação entre blocos e
tratamentos, pois os resultados só podem ser interpretados considerando bloco e
tratamento simultaneamente.

Observe a figura a seguir, que exemplifica o emprego de um delineamento


em blocos casualizados com repetição para avaliar a relação entre o crescimento
de ratos e diferentes hormônios. Neste experimento, o pesquisador investigou
dois hormônios diferentes, ou seja, dois tratamentos. Como não havia um número
suficiente de ratos da mesma idade, o pesquisador teve que utilizar 20 ratos mais
velhos e 20 ratos mais jovens. Neste experimento, as idades foram usadas para
separar os ratos em dois blocos. Observe que, dentro dos blocos, cada tratamento
teve 10 réplicas. Note também que cada bloco recebeu os dois tratamentos.

117
UNIDADE 2 | TESTES ESTATÍSTICOS I

FIGURA 9 - REPRESENTAÇÃO DE UM DELINEAMENTO EM BLOCOS CASUALIZADO COM REPETIÇÃO

FONTE: A autora

Geralmente, os pesquisadores não têm interesse em interpretar o efeito


dos blocos, uma vez que os blocos são construídos apenas para lidar com a
heterogeneidade encontrada nas unidades amostrais (GOTELLI; ELLISON, 2011).
Por isso, muitas vezes, os pesquisadores não estabelecem réplicas dentro dos
blocos. Desta maneira, é possível montar um grande número de blocos, cada um
com apenas uma unidade amostral para cada tratamento. Lembrando que, dentro
dos blocos, o tratamento que cada unidade amostral deve receber é sorteado.

Para exemplificar um delineamento em blocos casualizados sem replicação,


imagine que um pesquisador está avaliando se o tamanho das lagartas influencia
a taxa de predação das lagartas por aves. Para isso, o pesquisador selecionou 40
lagartas pequenas e 40 grandes. Para observar o efeito da predação por aves, o
pesquisador foi até um fragmento florestal e selecionou 40 plantas de uma mesma
espécie e, em cada planta, colocou uma lagarta pequena e outra grande. A posição
das lagartas na planta foi sorteada, de maneira que as lagartas ficassem em galhos
opostos na planta. Note neste exemplo que cada planta representa um bloco e cada
bloco tem apenas uma réplica para cada tratamento, ou seja, uma lagarta grande e
uma lagarta pequena.

118
TÓPICO 2 | DELINEAMENTO EXPERIMENTAL

Em experimentos em blocos casualizados sem réplicas é preciso assumir


que não existe interação entre blocos e tratamentos (GOTELLI; ELLISON, 2011).
Além disso, em blocos sem réplicas, se uma das unidades amostrais do bloco
for perdida durante o experimento, o bloco todo precisa ser descartado, porque
fica incompleto e deixa de ser informativo (GOTELLI; ELLISON, 2011). Por isso,
sempre que possível, recomenda-se que os blocos tenham replicação.

3.3 DELINEAMENTO FATORIAL

Em um delineamento fatorial, dois ou mais fatores são avaliados


simultaneamente e cada fator pode ter mais de um nível (GOTELLI; ELLISON,
2011). Esse delineamento experimental permite avaliar o efeito de cada fator
separadamente, bem como a interação dos efeitos dos fatores (GOTELLI;
ELLISON, 2011).

No delineamento fatorial é essencial garantir a combinação entre todos


os níveis dos fatores que estão sendo estudados (GOTELLI; ELLISON, 2011).
Por exemplo, um experimento com dois fatores, em que cada fator apresenta
três níveis, possibilita um total de nove combinações entre os níveis dos fatores
(3 níveis do fator 1 x 3 níveis do fator 2), ou seja, nove tratamentos distintos.
Além disso, no delineamento fatorial é importante que as unidades amostrais
sejam homogêneas entre si em relação à resposta aos tratamentos. Também
é necessário sortear qual tratamento cada uma das unidades amostrais deve
receber (GOTELLI; ELLISON, 2011).

Uma desvantagem do delineamento fatorial é que à medida que se


aumenta o número de fatores analisados, também se aumenta o número de
combinações possíveis (GOTELLI; ELLISON, 2011). Um grande número de
combinações entre fatores demanda um tamanho amostral grande, o que nem
sempre é viável. Por exemplo, ao avaliar quatro fatores, cada um com quatro
níveis (4 x 4 x 4 x 4), o total de combinações possíveis é 256.

Vejamos como um delineamento fatorial funciona na prática. Imagine que


um pesquisador estava investigando a influência de diferentes concentrações de
nitrogênio e fósforo no solo para crescimento de milho. Para isso, o pesquisador
usou três concentrações diferentes de nitrogênio (0 mg, 10 mg e 50 mg) e duas
concentrações distintas de fósforo (10 mg e 50 mg). Neste experimento, um dos
fatores é o nitrogênio, que apresenta três níveis, e outro fator é o fósforo, com
dois níveis (3 x 2) e, assim, é possível estabelecer seis combinações entre os
níveis dos fatores, ou seja, seis tratamentos diferentes. Para cada tratamento, o
pesquisador sorteou oito plantas de milho e, portanto, cada tratamento teve oito
réplicas. Lembrando que todas as plantas de milho eram da mesma variedade
e tinham a mesma idade e vigor. Na figura a seguir você observa a ilustração

119
UNIDADE 2 | TESTES ESTATÍSTICOS I

deste delineamento fatorial. Note que neste experimento é possível avaliar a


influência do nitrogênio sobre o crescimento do milho, a influência do fósforo e
a influência conjunta dos dois nutrientes.

FIGURA 10 - REPRESENTAÇÃO DE UM DELINEAMENTO FATORIAL

FONTE: Adaptado de Diniz (dados não publicados)

120
RESUMO DO TÓPICO 2
Neste tópico, você aprendeu que:

• O delineamento experimental é uma etapa importante em um estudo científico,


pois se for mal planejado gera dados inconsistentes e leva ao desperdício de
recursos financeiros.

• Experimento é um procedimento replicável, que normalmente acontece sob


condições controladas e tem por objetivo testar hipóteses.

• Em um experimento manipulativo, os níveis de um fator são gerados


por manipulação e se observa a resposta das unidades amostrais a esses
diferentes níveis.

• Os experimentos naturais são estudos observacionais em que se aproveita a


variação natural do sistema ecológico para coletar evidências contra ou a favor
de uma hipótese.

• As fontes de variação indesejadas são mais bem controladas em experimentos


manipulativos do que em experimentos naturais. Assim, em experimentos
manipulativos é possível avaliar relações de causa-efeito, enquanto
experimentos naturais permitem apenas estabelecer correlações entre as
variáveis estudadas.

• É preciso replicar as unidades amostrais pelos tratamentos de um experimento


a fim de considerar a variabilidade entre as réplicas.

• Os tratamentos representam diferentes intensidades ou categorias de uma


variável, que é chamada de fator. As diferentes intensidades ou categorias de
um fator são chamadas de níveis.

• O grupo tratado é composto por unidades amostrais sob efeito do tratamento


de interesse. Já o grupo controle é constituído por unidades que servem
de ponto de referência. O grupo controle negativo não recebe tratamento,
enquanto o controle positivo recebe o tratamento convencional.

• A casualização é alocação aleatória das unidades amostrais pelos tratamentos.

• Independência nas observações significa dizer que medidas tomadas em


uma unidade amostral não influenciaram na obtenção de medidas em outras
unidades amostrais.

121
• O delineamento inteiramente casualizado é composto por um fator, que
apresenta diferentes níveis, que são os tratamentos. Serve para avaliar se existem
diferenças entre os tratamentos e quais tratamentos são diferentes entre si.

• O delineamento inteiramente casualizado tem duas exigências: i) as unidades


amostrais devem responder de maneira homogênea aos tratamentos; ii) a
distribuição das unidades amostrais pelos tratamentos deve ser casualizada.

• O delineamento em blocos casualizados deve ser usado quando as unidades


amostrais não são homogêneas entre si. As unidades são separadas em bloco
de acordo com a característica que as distingue. Dentro do bloco as unidades
devem ser similares entre si.

• Cada bloco de um delineamento em blocos casualizados deve receber todos os


tratamentos. Dentro dos blocos, a distribuição das unidades pelos tratamentos
deve ser casualizada. Sempre que possível, é importante que os blocos tenham
replicação para os tratamentos.

• Em experimentos em blocos casualizados com replicação é possível avaliar


a interação entre blocos e tratamentos. Já em blocos sem replicação é preciso
assumir que não existe interação entre blocos e tratamento. Além disso, se
uma das unidades amostrais do bloco for perdida, o bloco todo precisa ser
descartado, porque deixa de ser informativo.

• No delineamento fatorial, dois ou mais fatores são avaliados simultaneamente e


cada fator pode ter mais de um nível. Esse delineamento permite avaliar o efeito
de cada fator separadamente, bem como a interação dos efeitos dos fatores.

• No delineamento fatorial é essencial garantir a combinação entre todos os


níveis dos fatores. As unidades amostrais devem ser homogêneas entre si
em relação à resposta aos tratamentos. A distribuição das unidades pelos
tratamentos deve ser casualizada.

122
AUTOATIVIDADE

Caro acadêmico! Para fixar melhor o conteúdo estudado, vamos exercitar um


pouco. Leia as questões a seguir e responda-as em seu caderno de estudos.
Bom trabalho!

1 Algumas plantas micropropagadas (clones produzidos a partir de um


pequeno pedaço de tecido vegetal) em laboratório precisam de condições
especiais de aclimatação para sobreviverem no meio ex vitro. Batagin et
al. (2009) avaliaram a influência de diferentes níveis de luminosidade no
desenvolvimento de plantas micropropagadas de abacaxizeiro em meio ex
vitro. Os autores produziram 100 microplantas, por meio da micropropagação
vegetal. Todas as microplantas tinham o mesmo tamanho e vigor no momento
em que foram plantadas em vasos com terra vegetal. Metade dos vasos com as
microplantas foi alocada em uma casa de vegetação, com telado com 50% de
sombreamento. Já a outra metade dos vasos ficou em campo, exposta ao pleno
Sol. A alocação dos vasos em cada ambiente foi sorteada. Após um período
de sete meses, as plantas de cada ambiente foram submetidas a análises de
anatomia foliar para verificar se os diferentes níveis de luminosidade tiveram
influência no desenvolvimento das plantas no meio ex vitro. Com o que você
sabe sobre o experimento de Batagin et al. (2009), responda às seguintes
perguntas:

a) Qual foi o fator investigado?


b) Quantos níveis o fator investigado apresentou?
c) Quantos tratamentos foram avaliados no experimento?
d) Qual foi o número de réplicas por tratamento?
e) Que tipo de delineamento experimental os pesquisadores seguiram?

2 Ambientes aquáticos ricos em nutrientes apresentam maior biomassa


fitoplanctônica em comparação a ambientes pobres em nutrientes. Além
disso, alguns experimentos manipulativos mostraram que a presença
de peixes onívoros-filtradores aumenta a biomassa de fitoplâncton em
lagoas eutrofizadas. Teixeira e Attayde (2015) montaram um experimento
manipulativo para avaliar os efeitos dos nutrientes e da presença de peixes
onívoros-filtradores sobre a biomassa fitoplanctônica. O peixe usado no
experimento foi a tilápia, que é onívora e filtradora. Para simular as lagoas,
os pesquisadores usaram 24 caixas d’água com capacidade de 250 litros. Em
cada lagoa, os pesquisadores colocaram água e um dos seguintes tratamentos:
i) adição de nutrientes; ii) adição de alevinos de tilápia; iii) adição de tilápias
jovens; iv) adição de nutrientes e alevinos de tilápia; v) adição de nutrientes
e tilápias jovens; v) sem adição de nutrientes ou tilápias. O tratamento que
cada lagoa recebeu foi sorteado. Após quatro semanas, os pesquisadores
avaliaram a biomassa fitoplanctônica das lagoas. Com o que você sabe sobre
o experimento de Teixeira e Attayde (2015), responda às seguintes perguntas:

123
a) Quantos e quais foram os fatores investigados no experimento?
b) Quantos e quais foram os níveis de cada fator?
c) Qual foi o número de réplicas por tratamento?
d) Que tipo de delineamento experimental os pesquisadores usaram?

3 Ferreira et al. (2012) estudaram o crescimento da espécie de planta Piptadenia


stipulacea (Benth.) Ducke em diferentes níveis de incidência solar. Esses
pesquisadores plantaram 132 mudas de 5 cm de altura em vasos com solo.
Os vasos com as plantas foram distribuídos, por sorteio, entre três casas de
vegetação, cada uma com um nível de incidência solar diferente: i) 10% de
incidência solar; ii) 30% de incidência; iii) 50% de incidência. Cada casa de
vegetação recebeu 44 vasos. Os pesquisadores mediram a altura das plantas
em quatro períodos diferentes: i) após um mês do plantio das mudas; ii) após
dois meses; iii) após três meses; iv) após quatro meses. Em cada período foram
sorteadas 11 das 44 plantas de cada casa de vegetação para medir a altura. Ao
final do experimento, os pesquisadores tinham a altura das plantas em quatro
períodos de vida (um, dois, três e quatro meses após o plantio) e que estavam
crescendo sob três níveis de incidência solar (10%, 30% e 50% de incidência
solar). Com o que você sabe sobre o experimento de Ferreira et al. (2012),
responda às seguintes perguntas:

a) Qual foi o fator investigado no experimento?


b) Quantos e quais foram os níveis do fator investigado?
c) Neste delineamento, as unidades amostrais foram organizadas em blocos?
Se sim, quantos e quais foram os blocos? Qual foi o número de réplicas por
tratamento em cada bloco?
d) Que tipo de delineamento experimental os pesquisadores usaram?

124
UNIDADE 2
TÓPICO 3

ANÁLISE DE VARIÂNCIA

1 INTRODUÇÃO
No primeiro tópico desta unidade você aprendeu como testar se duas
médias amostrais pertencem à mesma população, por meio do teste T. Geralmente,
o que acontece é que temos mais de dois grupos e, portanto, mais de duas médias
amostrais para avaliar se pertencem ou não à mesma população. Nesses casos,
os dados devem ser analisados por meio de uma técnica diferente, chamada de
análise de variância ou anova.

No tópico anterior você aprendeu sobre delineamento experimental e


estudou o delineamento base para a análise de variância. A partir de agora, você
estudará para que serve e como funciona a análise de variância. Antes disso, é
importante que você entenda por que não podemos usar um teste T para comparar
mais de duas médias amostrais.

2 MÚLTIPLAS COMPARAÇÕES ENTRE


MÉDIAS USANDO TESTE T
Para responder algumas perguntas científicas, precisamos comparar três
ou mais grupos que diferem em relação a um fator. Um exemplo é a comparação
da riqueza de espécies entre borda, meio e interior de fragmentos florestais. A
primeira ideia que vem à cabeça é usar um teste T e ir testando, par a par, se existe
diferença entre os grupos. Assim, compararíamos a riqueza entre borda e meio,
meio e interior e, por fim, borda e interior.

O problema em fazer vários testes T para comparar os pares de


combinações é que perdemos o controle do nível crítico de significância assumido
no teste estatístico (CALLEGARI-JACQUES, 2003; PAGANO; GAUVREAU,
2013). Sem saber qual é o nível de significância do teste, também não sabemos
qual a probabilidade do erro tipo I (rejeitar a hipótese nula quando ela é
verdadeira) (CALLEGARI-JACQUES, 2003; PAGANO; GAUVREAU, 2013).
Ao comparar duas médias amostrais ao nível de significância de 0,05, sabemos
que a probabilidade do erro tipo I é de 5%. Já quando comparamos três médias
amostrais, mesmo que assumimos a = 0,05, o nível de significância passa a ser 0,14

125
UNIDADE 2 | TESTES ESTATÍSTICOS I

e, portanto, a chance de cometer o erro tipo I também aumenta para 14%. Assim,
é muito mais fácil encontrar diferenças entre médias em múltiplas comparações,
quando na verdade essas diferenças não existem.

Ao fazer múltiplas comparações usando o teste T, o nível de significância


aumenta de acordo com a equação 1 - (1 - a)m, em que m é o número de
combinações par a par entre médias. Assim, para três médias, assumindo a
= 0,05, o nível de significância passa para 1 - (1 - a)m = 1 - (1 - 0,05)3 = 0,14.
Além disso, ao aumentar o número de médias que estão sendo comparadas, as
possíveis combinações par a par também aumentam (CALLEGARI-JACQUES,
2003). Para três grupos é possível fazer três combinações de médias par a par.
Já para quatro grupos, o número de combinações passa para seis. Com muitos
grupos é inviável fazer comparações par a par, pois o número de combinações
possíveis é muito grande. Veja na tabela a seguir como o nível de significância e
as possíveis combinações par a par aumentam conforme se aumenta o número
de médias comparadas. Note que, ao comparar 40 médias amostrais, a chance
de cometer erro tipo I é de 100%.

Portanto, usar o teste T para fazer múltiplas comparações entre médias


não é a melhor estratégia. Nesses casos, devemos usar a análise de variância,
conforme você irá estudar a seguir.

TABELA 18 - RELAÇÃO ENTRE O NÚMERO DE COMPARAÇÕES ENTRE MÉDIAS, NÚMERO DE


POSSÍVEIS COMBINAÇÕES PAR A PAR E O NÍVEL CRÍTICO DE SIGNIFICÂNCIA

Comparações Combinações Nível crítico de significância assumido no teste


entre médias entre médias 0,05 0,01
2 1 0,05 0,01
3 3 0,14 0,03
4 6 0,26 0,06
5 10 0,40 0,10
6 15 0,54 0,14
10 45 0,90 0,36
20 190 1,00 0,85
40 780 1,00 1,00
FONTE: Adaptado de Callegari-Jacques (2003)

2.1 COMO A ANÁLISE DE VARIÂNCIA FUNCIONA


A análise de variância é o método estatístico indicado para comparar
múltiplas médias amostrais. Esse método informa se existe diferença entre,
pelo menos, duas das médias que estão sendo comparadas simultaneamente
(CALLEGARI-JACQUES, 2003; PAGANO; GAUVREAU, 2013). Essa análise
foi desenvolvida por Ronald Aylmer Fisher para estudar a produtividade
de plantações agrícolas (SALSBURG, 2009). A análise de variância tem como

126
TÓPICO 3 | ANÁLISE DE VARIÂNCIA

distribuição de referência a Distribuição F, assim denominada em homenagem


a Fisher.

A lógica da análise de variância é separar a variância total existente nos


dados em componentes identificáveis (CALLEGARI-JACQUES, 2003; GOTELLI;
ELLISON, 2011). A definição desses componentes depende do delineamento
experimental adotado para obter os dados. Em um delineamento inteiramente
casualizado, em que diferentes níveis de um único fator são avaliados, o método
estatístico indicado é chamado de análise de variância simples ou análise de
variância fator.

ATENCAO

Caro acadêmico, existe uma grande variedade de delineamentos experimentais


e, em consequência, uma grande diversidade em que os componentes da análise de
variância podem ser separados. Em estudos futuros, talvez você precise particionar os
componentes da variância de maneiras mais complexas que a análise de variância simples
apresentada neste caderno. Você pode consultar essas outras formas da análise de variância
no livro de Gotelli e Ellison (2011).

Na análise de variância simples, a variância total existente nos dados


é dividida em dois componentes (CALLEGARI-JACQUES, 2003; GOTELLI;
ELLISON, 2011). Um dos componentes é chamado de “variância entre grupos”
e representa a variância nos dados que é atribuída às diferenças entre as
médias que estão sendo comparadas, ou seja, é a variância correspondente ao
efeito dos tratamentos. A variância entre grupos é o componente de interesse
em um estudo científico, pois representa a resposta das unidades amostrais aos
diferentes tratamentos investigados e, portanto, é uma medida de efeito. Já o
outro componente é denominado de “variância dentro de grupos” e representa a
variação que existe entre as unidades amostrais que compõem cada tratamento.
Sempre buscamos que as unidades amostrais de um experimento sejam
semelhantes entre si, mas é inevitável que as unidades apresentem variabilidade.
A variância dentro de grupos é o componente que captura essa variabilidade
entre as unidades amostrais, que geralmente não é o foco do estudo e representa
uma medida de erro.

Assim, na comparação entre múltiplas médias, a variância total dos


dados é dada pela soma da variância entre grupos e da variância dentro de
grupos (CALLEGARI-JACQUES, 2003; GOTELLI; ELLISON, 2011). A relação
entre o tamanho das variâncias entre e dentro de grupos indica se os tratamentos
investigados têm ou não efeito sobre as unidades amostrais. Quando a variância

127
UNIDADE 2 | TESTES ESTATÍSTICOS I

entre grupos é grande, é possível separar as unidades amostrais em grupos,


conforme a resposta frente aos diferentes tratamentos, mas quando a variância
dentro de grupos é grande, a resposta das unidades amostrais aos tratamentos
é muito variável e não é possível separá-las em grupos de acordo com suas
respostas.

Antes de estudar como se calcula uma análise de variância, é importante


que você apreenda algumas notações matemáticas que serão usadas a partir
de agora. Os dados para análise de variância são organizados em tabelas, cujas
colunas representam os grupos estudados, também chamados de tratamentos, e
as linhas representam as unidades amostrais observadas em cada grupo. Veja a
organização dos dados na tabela adiante e o significado das notações matemáticas
na tabela a seguir.

TABELA 19 - NOTAÇÕES MATEMÁTICAS E SEUS SIGNIFICADOS

Notação matemática Significado


i Indexador dos grupos.
j Indexador das unidades amostrais.
N Número total de unidades amostrais do estudo.
g Número total de grupos do estudo.
ni Número de unidades amostrais no i-ésimo grupo.
xij A j-ésima unidade amostral do i-ésimo grupo.
xgj A j-ésima unidade amostral do último grupo.
xin A última unidade amostral do i-ésimo grupo.
xgn A última unidade amostral do último grupo.
xi A média do i-ésimo grupo.
xg A média do último grupo.
xT A média geral, também chamada de grande média.
FONTE: A autora

128
TÓPICO 3 | ANÁLISE DE VARIÂNCIA

TABELA 20 - ORGANIZAÇÃO DOS DADOS PARA A ANÁLISE DE VARIÂNCIA

FONTE: Adaptado de Pagano; Gauvreau (2013)

Vejamos como são calculadas a média geral (xT) e a média de cada grupo
(xi), mencionadas nas tabelas anteriores. A média geral é obtida pela equação:

N
j =1
xj
xT =
N
A equação indica que devemos somar todas as unidades amostrais do
estudo e dividir pelo número total de unidades amostrais do estudo.


ni
x
j =1 ij .
A média de cada grupo é calculada pela equação: xi = A equação
ni
indica que devemos somar todas as unidades amostrais do grupo i e dividir pelo
número total de unidades amostrais do grupo i.

Agora que você já conhece as notações matemáticas e sabe calcular a


média geral e média de cada grupo, irá estudar como calcular a variância total,
entre grupos e dentro de grupos, que são essenciais para executar uma análise de
variância. De acordo com Gotelli e Ellison (2011), a variância total é representada
pela soma de quadrados total (SQT), que é calculada pelo somatório do quadrado
da diferença de cada unidade amostral (xij) em relação à média geral (xT), conforme
∑ ∑ (x - xT ) .
g ni 2
a equação:
= SQT ij
=i 1 =j 1

Na equação aparecem dois somatórios que indicam que devemos somar o


quadrado da diferença das unidades do grupo 1 com o quadrado da diferença das
unidades do grupo 2, e assim sucessivamente, até que os quadrados da diferença
das unidades amostrais de todos os grupos tenham sido somados. A soma de
quadrados total mede a variância presente em todo o conjunto de dados.
129
UNIDADE 2 | TESTES ESTATÍSTICOS I

A variância entre grupos é representada pela soma de quadrados entre


grupos (SQE), que é calculada pelo somatório da diferença da média de cada
grupo (xi) em relação à média geral (xT), conforme equação (GOTELLI; ELLISON,
∑ i 1∑ ( xi - xT ) .
g ni 2
2011): SQE =
= =j 1

A equação indica que devemos multiplicar o quadrado da diferença


da média de cada grupo em relação à média geral ((xi - xT)2 ) pelo número de
unidades amostrais do grupo (ni) e, na sequência, somar as multiplicações de
todos os grupos estudados. A soma de quadrados entre grupos mede a diferença
entre os grupos, o que é resultado do efeito dos tratamentos. Não é muito fácil
compreender como a soma de quadrados entre grupos é calculada olhando
apenas para a fórmula, mas a seguir você estudará um exemplo resolvido, o que
facilitará o entendimento.

A variância dentro de grupos é representada pela soma de quadrados


dentro de grupos (SQD), que é calculada pelo somatório da diferença de cada
unidade amostral de um grupo (xij) em relação à média desse grupo (xi), conforme
( xij - xi ) .
2
∑ i 1∑
g ni
a equação (GOTELLI; ELLISON, 2011): = =j 1

A equação indica que devemos somar o quadrado da diferença de cada


unidade amostral do grupo 1 em relação à média do grupo 1 com o quadrado da
diferença de cada unidade do grupo 2 em relação à média do grupo 2, e assim
sucessivamente, até o último grupo do estudo. A soma de quadrados dentro
de grupos, também chamada de soma de quadrados do erro, corresponde à
variabilidade das unidades amostrais dentro de cada grupo.

Agora que você aprendeu como calcular a soma de quadrados total,


entre grupos e dentro de grupos, é possível estudar como a análise de variância
funciona. Para realizar essa análise é necessário executar todos os passos de um
teste de hipóteses, conforme a seguir:

1° Estabelecemos as hipóteses nula e alternativa. H0: não existe diferença entre as


médias amostrais (x1 = x2 = … = xn); H1: existe diferença entre, ao menos, duas
das médias comparadas (x1 ≠ x2 ≠ … ≠ xn).
2° Informamos o nível crítico de significância.
3° Indicamos o valor crítico para a estatística do teste. Na análise de variância,
a distribuição de referência é a Distribuição F (Apêndice 3). Para chegar ao
valor crítico da estatística F é necessário indicar: o nível crítico de significância;
os graus de liberdade do numerador (glN), que correspondem aos graus de
liberdade da soma de quadrados entre grupos, que são dados por g - 1; os
graus de liberdade do denominador (glD), que correspondem aos graus de
liberdade da soma de quadrados dentro de grupos, que são dados por N - g.
Assim, F crítico é determinado por Fa;glN;glD.
4° Calculamos a estatística da análise de variância a partir dos seguintes passos:
a) O primeiro passo é calcular a soma de quadrados total, a soma de quadrados
entre grupos e a soma de quadrados dentro de grupos, conforme as equações
que você estudou acima.
b) Na sequência, determinamos os graus de liberdade associados a cada soma
de quadrados: i) os graus de liberdade para a soma de quadrados total são
dados por glT = N - 1; ii) os graus de liberdade para a soma de quadrados
130
TÓPICO 3 | ANÁLISE DE VARIÂNCIA

entre grupos são dados por glE = g - 1; iii) os graus de liberdade para a soma
de quadrados dentro de grupos são dados por glD = N - g.
c) Calculamos a variância entre grupos (s2E) dividindo a soma de quadrados
entre grupos pelos graus de liberdade associados, conforme a equação:
SQE
s2E = .
glE
d) Calculamos a variância dentro de grupos (s2D) dividindo a soma de
quadrados dentro de grupos pelos graus de liberdade associados, conforme
2 SQD
a equação: s D = .
glD
e) Calculamos a estatística F pela divisão da variância entre grupos pela
s2E
variância dentro de grupos, conforme: F = .
s2D
Note que o numerador do teste F – a variância entre grupos – representa
a diferença entre as médias dos grupos, ou seja, é uma medida do efeito dos
tratamentos sobre as unidades amostrais. O denominador do teste F – a variância
dentro de grupos – corresponde à variabilidade entre as unidades amostrais e é
uma medida de erro. Valores elevados para a estatística F são obtidos quando a
variância entre grupos é alta, mas a variância dentro de grupos é baixa e, nesses
casos, a tendência é rejeitar a hipótese nula. Quando a variância entre grupos é
baixa e a variância dentro de grupos é alta, a estatística F é baixa, o que geralmente
leva à aceitação da hipótese nula.

FIGURA 11 - RELAÇÃO ENTRE O NUMERADOR E DENOMINADOR DA EQUAÇÃO DO TESTE F E


A ESTATÍSTICA DO TESTE

FONTE: A autora

Todos os cálculos da estatística do teste podem ser sintetizados em uma


única tabela, chamada de Tabela de anova.

TABELA 21 - TABELA DE ANOVA PARA DELINEAMENTO INTEIRAMENTE CASUALIZADO

FONTE: Adaptado de Gotelli e Ellison (2011)

131
UNIDADE 2 | TESTES ESTATÍSTICOS I

5° Após calcular a estatística do teste F, podemos encontrar o p-valor


correspondente. A maneira mais simples de encontrar o p-valor é usar a
função “DISTF” do Excel. Para isso, precisamos informar o valor de F calculado
(indicado por “x”) e os graus de liberdade do numerador e do denominador.
Basta digitar no Excel “=DISTF(x; glN; glD)”.
6° Podemos calcular um coeficiente de determinação (r2) para a análise de
variância, que mede quanto os tratamentos investigados no estudo explicaram
da variância total presente nos dados. O coeficiente de determinação é obtido
pela divisão da soma de quadrados entre grupos pela soma de quadrados
SQE
total, ou seja, r 2 = . O coeficiente de determinação é alto quando o valor da
SQT
soma de quadrados entre grupos também é alto, o que significa que boa parte da
variância presente nos dados pode ser explicada pelos tratamentos. Já coeficientes
de determinação baixa são obtidos quando a soma de quadrados entre grupos é
pequena em comparação à soma de quadrados total, e isso significa que pequena
parte da variância total pode ser explicada pelos tratamentos.
7° O último passo é fazer a inferência estatística comparando os valores de F
crítico e calculado ou os valores de a e p-valor.

2.2 TESTE A POSTERIORI DE TUKEY


A análise de variância é o método estatístico que informa se existem
diferenças entre múltiplas médias que estão sendo comparadas, mas não indica
quais são as médias que diferem entre si. Para descobrir quais médias dos grupos
são diferentes, é necessário aplicar um teste a posteriori, como o teste de Tukey
(CALLEGARI-JACQUES, 2003; GOTELLI; ELLISON, 2011).

ATENCAO

Caro acadêmico, um teste a posteriori, como o teste de Tukey, só deve ser


usado se a análise de variância indicar que existe diferença entre, ao menos, um dos pares
de médias comparados. Caso a análise de variância não indique diferenças entre as médias,
o teste a posteriori não precisa ser empregado.

132
TÓPICO 3 | ANÁLISE DE VARIÂNCIA

No teste de Tukey, as médias de cada grupo são comparadas par a par,


como em um teste T, mas o nível crítico de significância é controlado e mantido
constante entre todas as comparações (CALLEGARI-JACQUES, 2003; GOTELLI;
ELLISON, 2011). O teste de Tukey tem como distribuição de referência a
Distribuição Q (Apêndice 4 no final do caderno).

Para aplicar o teste de Tukey é necessário seguir todas as etapas de um


teste de hipóteses, conforme a seguir:

1° Precisamos estabelecer uma hipótese nula e uma hipótese alternativa para


cada par de médias que estão sendo comparadas. Para a comparação entre as
médias dos grupos 1 e 2, por exemplo, H0: não existe diferença entre as médias
dos grupos 1 e 2 (m1 = m2); H1: existe diferença entre as médias dos grupos 1
e 2 (m1 ≠ m2). Para a comparação entre as médias dos grupos 1 e 3, H0: não
existe diferença entre as médias dos grupos 1 e 3 m1 = m3); H1: existe diferença
entre as médias dos grupos 1 e 3 (m1 ≠ m3). As hipóteses nulas e alternativas são
construídas sucessivamente até que todas as combinações possíveis entre os
grupos sejam feitas.
2° Informamos o nível crítico de significância.
3° Indicamos o valor crítico para a estatística do teste. Para isso, precisamos utilizar
a Tabela de Distribuição Q (Apêndice 4), em que as colunas representam
o número de grupos que estão sendo comparados, e as linhas, os graus de
liberdade associados à soma de quadrados dentro de grupos (glD = N - g). Para
chegar ao valor de q crítico é preciso indicar o nível crítico de significância
assumido, o número de grupos que estão sendo comparados e os graus de
liberdade correspondentes à soma de quadrados dentro de grupos.
4° Calculamos a estatística do teste de Tukey observando os seguintes passos:
a) Primeiro, estimamos o erro padrão (EP) associado a cada par de médias que
s2D  1 1 
está sendo comparado, pela equação:
= EPA; B  + .
2 n
 A nB 

Na equação, s2D é a variância dentro de grupos, nA e ng correspondem ao


número de unidades amostrais dos dois grupos que estão sendo comparados.
Quando todos os grupos apresentam o mesmo tamanho amostral, o erro padrão
é igual entre todos pares de combinações de médias. Quando os grupos possuem
tamanhos amostrais distintos, o erro padrão varia entre os pares de combinações
de médias.
b) Na sequência, podemos calcular a estatística do teste de Tukey para cada
x A - xB
par de médias que estão sendo comparadas, pela equação: q A; B = .
EPA; B

A estatística do teste de Tukey é dada pela divisão da diferença entre as


médias dos dois grupos pelo seu respectivo erro padrão.

5° Após calcular a estatística do teste de Tukey, é possível descobrir se q calculado


apresenta um p-valor maior ou menor que o nível crítico de significância. Para
isso, é necessário consultar a Tabela de Distribuição Q (Apêndice 4) e informar
o número de grupos comparados e os graus de liberdade correspondentes

133
UNIDADE 2 | TESTES ESTATÍSTICOS I

à soma de quadrados dentro de grupos. Se o valor q calculado for maior


que o valor de q tabelado ao nível de 5%, isso significa que o p-valor para a
comparação das duas médias é menor que a = 0,05. Se o valor de q calculado
for maior que o valor de q tabelado ao nível de 1%, então o p-valor é menor
que a = 0,01.
6° A partir dos valore de q calculado e tabelado, podemos fazer a inferência.

2.3 PRESSUPOSTOS DA ANÁLISE DE VARIÂNCIA


Os pressupostos da análise de variância são os mesmos de um teste
T para amostras independentes. Primeiro, as amostras devem ser aleatórias
(CALLEGARI-JACQUES, 2003). Segundo, todas as amostras precisam
apresentar distribuição normal ou aproximadamente normal, o que pode
ser verificado pelo histograma de frequências construído para os dados
de cada amostra (CALLEGARI-JACQUES, 2003). A normalidade de cada
amostra também pode ser avaliada por meio de testes específicos, como o
teste de Shapiro-Wilk. Esses testes de normalidade podem ser executados
em programas estatísticos, como o programa PAST (Paleontological Statistic
Software). (HAMMER; HARPER; RYAN, 2001).

O terceiro pressuposto é que as amostras devem apresentar variâncias


homogêneas (CALLEGARI-JACQUES, 2003; VIEIRA, 2011). Você aprendeu
a usar o teste F para avaliar a homogeneidade de variâncias quando apenas
duas médias são comparadas. No entanto, quando múltiplas médias são
comparadas simultaneamente, precisamos utilizar outros testes, por exemplo,
o teste de Levene. Esse teste de homogeneidade de variâncias pode ser
facilmente calculado no programa PAST (HAMMER; HARPER; RYAN, 2001).

2.4 VAMOS PRATICAR


Vejamos como a análise de variância funciona na prática. Imagine que
um pesquisador estava interessado em avaliar se a riqueza de árvores varia em
relação à borda, meio e interior do fragmento florestal. Para isso, o pesquisador
amostrou dez fragmentos florestais e, em cada fragmento, ele mediu todas as
árvores em 100 m2 na borda, meio e interior dos fragmentos. Neste exemplo,
o fator de interesse é a localização em relação borda-interior, que apresenta
três níveis (borda, meio e interior) e, portanto, três tratamentos. A riqueza de
espécies que o pesquisador encontrou nas três áreas dos fragmentos florestais é
apresentada na tabela a seguir.

134
TÓPICO 3 | ANÁLISE DE VARIÂNCIA

TABELA 22 - RIQUEZA DE ESPÉCIES DE ÁRVORES NA BORDA, MEIO E INTERIOR DE DEZ


FRAGMENTOS FLORESTAIS

Fragmento florestal Borda Meio Interior


1 11 27 46
2 12 27 47
3 13 28 47
4 12 27 47
5 9 24 44
6 13 28 48
7 16 31 51
8 15 30 50
9 10 25 45
10 14 28 49
Média 12,5 27,5 47,4
Variância 4,7 4,3 4,7
Média geral 29,1
FONTE: A autora

Antes de iniciar a análise de variância, precisamos checar os pressupostos


deste teste estatístico. Assumimos que as amostras são aleatórias, pois esse é um
pressuposto que deve ser atendido no planejamento do delineamento amostral.
A normalidade das amostras pode ser verificada pela visualização do histograma
de frequências de cada amostra, conforme o gráfico a seguir. Pelos histogramas,
as três amostras têm distribuição aproximadamente normal e atendem ao
pressuposto de normalidade.

GRÁFICO 18 - HISTOGRAMAS DE FREQUÊNCIAS DA RIQUEZA DE ESPÉCIES DE ÁRVORES NA


BORDA (A), MEIO (B) E INTERIOR (C) DE FRAGMENTOS FLORESTAIS

FONTE: A autora

135
UNIDADE 2 | TESTES ESTATÍSTICOS I

Também precisamos checar se as variâncias são homogêneas. Podemos


verificar na tabela anterior que as variâncias das três amostras são próximas (variaram
entre 4,3 e 4,7), o que permite assumir que as variâncias são homogêneas. O teste de
Levene, executado no programa PAST (HAMMER; HARPER; RYAN, 2001), também
confirmou a homogeneidade de variâncias para as três amostras (p = 0,93).

Com os pressupostos checados e atendidos, podemos realizar a análise de


variância seguindo todos os passos de um teste de hipóteses. Veja:

1° Estabelecemos as hipóteses nula e alternativa. H0: não existe diferença na riqueza


de espécies de árvores entre borda, meio e interior dos fragmentos florestais
(xBorda = xMeio = xInterior). H1: existe diferença na riqueza de espécies de árvores entre
borda, meio e interior dos fragmentos florestais (xBorda ≠ xMeio ≠ xInterior).
2° Assumimos um nível crítico de significância de 0,05.
3° Para chegar ao valor F crítico precisamos informar: o nível crítico de significância
(a = 0,05); os graus de liberdade do numerador (glN), dados por g - 1 que,
portanto, correspondem a 3 - 1 = 2, pois temos três grupos g (borda, meio e
interior); os graus de liberdade do denominador (glD), dados por N - g, que
correspondem a 30 - 3 = 27, pois temos 30 unidades amostrais no total (N) e
três grupos (g). Consultando a Tabela de Distribuição F (Apêndice 3), o valor
de F0,05; 2; 27 = 3,35.
4° Calculamos a estatística da análise de variância a partir das seguintes etapas:
a) O primeiro passo é calcular a soma de quadrados total (SQT), a soma de
quadrados entre grupos (SQE) e a soma de quadrados dentro de grupos
(SQD), conforme as tabelas a seguir. Observe que a SQT = 6253,5, a SQE =
6130,1 e a SQD = 123,4. Se somarmos as SQE e SQD, chegaremos a SQT (6130,1
+ 123,4 = 6253,5).
b) Determinamos os graus de liberdade associados a cada soma de quadrados,
conforme: i) os graus de liberdade para a SQT são dados por: glT = N - 1 = 30
- 1 = 29; ii) os graus de liberdade para a SQE são dados por: glE = g - 1 = 3 - 1
= 2; iii) os graus de liberdade para a SQD são dados por: glT = N - g = 30 - 3 =
27. Note que, ao somar glE e glD, obtemos glT (2 + 27 = 29).
SQ 6130,1
c) Calculamos a variância entre grupos pela equação:=
s2E =E
= 3065,1.
glE 2

d) Calculamos a variância dentro de grupos pela equação:= SQD 123, 4


s2D = = 4, 6 .
glD 27
2
s 3065, 05
e) Calculamos a estatística F pela equação:=
F =
2
E
= 670, 7. Note que o
s D 4,57
numerador da estatística F foi um valor muito alto e o denominador, um
valor baixo, logo o valor F é alto.
f) Podemos organizar todos os resultados preenchendo a Tabela de anova,
conforme a Tabela 14.

136
TÓPICO 3 | ANÁLISE DE VARIÂNCIA

TABELA 23 - DADOS ORIGINAIS E CÁLCULOS PARA OBTER A SOMA DE QUADRADOS TOTAL (SQT)

Fragmento Borda Meio Interior Borda Meio Interior


1 11 27 46 (11 - 29,1)2 = 328,8 (27 - 29,1)2 = 4,6 (46 - 29,1)2 = 284,5
2 12 27 47 (12 - 29,1)2 = 293,6 (27 - 29,1)2 = 4,6 (47 - 29,1)2 = 319,2
3 13 28 47 (13 - 29,1)2 = 260,3 (28 - 29,1)2 = 1,3 (47 - 29,1)2 = 319,2
4 12 27 47 (12 - 29,1)2 = 293,6 (27 - 29,1)2 = 4,6 (47 - 29,1)2 = 319,2
5 9 24 44 (9 - 29,1)2 = 405,4 (24 - 29,1)2 = 26,4 (44 - 29,1)2 = 221,0
6 13 28 48 (13 - 29,1)2 = 260,3 (28 - 29,1)2 = 1,3 (48 - 29,1)2 = 356,0
7 16 31 51 (16 - 29,1)2 = 172,5 (31 - 29,1)2 = 3,5 (51 - 29,1)2 = 478,2
8 15 30 50 (15 - 29,1)2 = 199,8 (30 - 29,1)2 = 0,8 (50 - 29,1)2 = 435,4
9 10 25 45 (10 - 29,1)2 = 366,1 (25 - 29,1)2 = 17,1 (45 - 29,1)2 = 251,8
10 14 28 49 (14 - 29,1)2 = 229,0 (28 - 29,1)2 = 1,3 (49 - 29,1)2 = 394,7
Média de g ni
12,5 27,5 47,4
∑∑ ( )
2
cada grupo = SQT xij - xT 6253,5*
=i 1 =j 1
Média geral 29,1

FONTE: A autora

* Se você somar os resultados das três colunas correspondentes a SQT, o somatório


será um pouco diferente do valor da SQT apresentado. Essa diferença acontece devido ao
arredondamento dos valores em apenas uma casa decimal.

TABELA 24 - CÁLCULOS PARA OBTER A SOMA DE QUADRADOS ENTRE GRUPOS (SQE) E SOMA
DE QUADRADOS DENTRO DE GRUPOS (SQD)
Borda Meio Interior Borda Meio Interior
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (11 – 12,5)2 = (27 – 27,5)2 = (46 – 47,4)2 =
276,7 = 2,7 333,7 2,3 0,3 2,0
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (12 – 12,5)2 = (27 – 27,5)2 = (47 – 47,4)2 =
276,7 = 2,7 333,7 0,3 0,3 0,2
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (13 – 12,5)2 = (28 – 27,5)2 = (47 – 47,4)2 =
276,7 = 2,7 333,7 0,3 0,3 0,2
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (12 – 12,5)2 = (27 – 27,5)2 = (47 – 47,4)2 =
276,7 = 2,7 333,7 0,3 0,3 0,2
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (9 – 12,5)2 = (24 – 27,5)2 = (44 – 47,4)2 =
276,7 = 2,7 333,7 12,3 12,3 11,6
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (13 – 12,5)2 = (28 – 27,5)2 = (48 – 47,4)2 =
276,7 = 2,7 333,7 0,3 0,3 0,4
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (16 – 12,5)2 = (31 – 27,5)2 = (51 – 47,4)2 =
276,7 = 2,7 333,7 12,3 12,3 13,0
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (15 – 12,5)2 = (30 – 27,5)2 = (50 – 47,4)2 =
276,7 = 2,7 333,7 6,3 6,3 6,8
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (10 – 12,5)2 = (25 – 27,5)2 = (45 – 47,4)2 =
276,7 = 2,7 333,7 6,3 6,3 5,8
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (14 – 12,5)2 = (28 – 27,5)2 = (49 – 47,4)2 =
276,7 = 2,7 333,7 2,3 0,3 2,6
g ni 6130,1* g ni 123,4*
∑∑ ( xi - xT ) ∑∑ ( x - xT )
2 2
SQE
= SQE
= i
=i 1 =j 1 =i 1 =j 1

FONTE: A autora

137
UNIDADE 2 | TESTES ESTATÍSTICOS I

*Se você somar os resultados das três colunas correspondentes a SQE e


SQD, o somatório será um pouco diferente dos valores da SQE e SQD apresentados.
Essas diferenças acontecem devido ao arredondamento dos valores em apenas
uma casa decimal.

TABELA 25 - TABELA DE ANOVA PARA A RIQUEZA DE ESPÉCIES DE ÁRVORES NA BORDA, MEIO


E INTERIOR DOS FRAGMENTOS FLORESTAIS

Fonte de variação Graus de liberdade Soma de quadrados Variância Teste F


Entre grupos 2 6130,1 3065,1 670,7
Dentro de grupos 27 123,4 4,6
Total 29 6253,5
FONTE: A autora

5° Agora podemos encontrar o p-valor correspondente ao valor de F calculado.


Para isso, podemos usar a função “DISTF” do Excel. É preciso informar o valor
de F calculado; os graus de liberdade do numerador e do denominador da
seguinte forma “=DISTF(670,7; 2; 27)”. Pela função DISTF, o p-valor foi < 0,01.
6° Podemos calcular o coeficiente de determinação pela equação:
SQE 6130,1
= r2 = = 0,98. Se multiplicarmos por 100, temos que 98% da variância
SQT 6253,5
total foi explicada pelos tratamentos (borda, meio e interior).
7° O último passo é fazer a inferência estatística. O valor de F crítico foi muito
menor que o valor de F calculado, assim, rejeitamos a hipótese nula. O p-valor
foi menor que o nível crítico de significância e, portanto, também rejeitamos a
hipótese nula.

Com os resultados obtidos pela análise de variâncias, podemos concluir


que existe diferença na riqueza de espécies entre, ao menos, uma das combinações
de borda, meio e interior dos fragmentos florestais. Esse resultado dificilmente
teria sido observado se a hipótese nula fosse verdadeira (F2; 27 = 670,7; p < 0,01).
Grande parte (98%) da variação na riqueza de espécies de árvores foi explicada
pela localização entre borda, meio e interior dos fragmentos florestais.

A partir da análise de variância, sabemos que pelo menos uma combinação


par a par entre os grupos é diferente. Para descobrir quais combinações entre
grupos diferem entre si, precisamos fazer o teste a posteriori de Tukey. Para isso,
executamos todos os passos de um teste de hipóteses, conforme a seguir:

1° Estabelecemos as hipóteses nula e alternativa para cada par de combinações


entre os grupos:
i) Borda x Meio – H0: não existe diferença na riqueza de espécies entre borda e
meio dos fragmentos florestais; H1: existe diferença na riqueza de espécies
entre borda e meio dos fragmentos florestais.
ii) Meio x Interior – H0: não existe diferença na riqueza de espécies entre meio
e interior dos fragmentos florestais; H1: existe diferença na riqueza de
espécies entre meio e interior dos fragmentos florestais.
138
TÓPICO 3 | ANÁLISE DE VARIÂNCIA

iii) Borda x Interior – H0: não existe diferença na riqueza de espécies entre
borda e interior dos fragmentos florestais; H1: existe diferença na riqueza
de espécies entre borda e interior dos fragmentos florestais.
2° Assumimos um nível crítico de significância de 0,05.
3° Encontramos o valor de q crítico indicando: a = 0,05, os graus de liberdade
associados à soma de quadrados dentro de grupos (glD = N - g = 30 - 3 = 27); o
número de grupos que estão sendo comparados que, no caso, equivale a três.
Consultada a Tabela de Distribuição Q, observamos que não temos o valor para
q0,05; 3; 27, mas sabemos que o valor de q crítico está entre q0,05; 3; 24 = 3,53 e q0,05; 3; 30 = 3,49.
4° Calculamos a estatística do teste de Tukey para cada par de combinações entre
grupos. Os resultados do cálculo do erro padrão (EP) e da estatística do teste de
Tukey estão organizados na tabela a seguir. O erro padrão foi calculado pela equação
s2D  1 1  x A - xB
EPA; B
=  +  e a estatística do teste de Tukey foi calculada por q A; B = .
2  nA nB  EP

TABELA 26 - RESULTADOS DA ESTATÍSTICA DO TESTE DE TUKEY PARA AS COMPARAÇÕES PAR


A PAR ENTRE TODOS OS GRUPOS

Comparação xA - xB nA / nB EP q calculado q crítico Decisão


Borda x Meio 12,5 - 27,5 = -15,0 10/ 10 0,68 -22,19 Rejeita-se a H0
Entre
Meio x Interior 27,5 - 47,4 = -19,9 10/ 10 0,68 -29,44 Rejeita-se a H0
3,53 e 3,49
Borda x Interior 12,5 - 47,4 = -34,9 10/ 10 0,68 -51,63 Rejeita-se a H0
FONTE: Adaptado de Callegari-Jacques (2003)

5° Todos os valores de q calculados foram mais altos, quando considerados em


módulo, que o valor de q crítico. Quando observamos os valores de q0,01; 3; 24
e q0,01; 3; 30, ou seja, ao nível de significância de 0,01, na Tabela de Distribuição
Q, também evidenciamos que os valores de q calculados foram mais altos.
Portanto, o p-valor para todas as comparações entre grupos foi p < 0,01.
6° Com o resultado de todas as comparações par a par, podemos fazer a inferência
estatística. Em todos os casos o q calculado foi maior que o q crítico e, portanto,
rejeitamos a hipótese nula.

Concluímos que a riqueza de espécies de árvores difere entre os três


grupos que foram comparados e essa diferença dificilmente teria sido observada
se a hipótese nula fosse verdadeira (p < 0,01). A riqueza de espécies é menor na
borda (x = 12,5 ± s = 2,2), intermediária no meio (x = 27,5 ± s = 2,1) e maior no
interior (x = 47,4 ± s = 2,2) dos fragmentos florestais.

Os resultados desse exemplo podem ser apresentados graficamente. Note


que as barras representam a riqueza de espécies de árvores em cada área, os
intervalos sobre as barras representam o desvio padrão da riqueza de espécies
em cada área. As letras sobre os intervalos indicam quais tratamentos foram

139
UNIDADE 2 | TESTES ESTATÍSTICOS I

diferentes entre si, segundo o Teste de Tukey ao nível de significância de 0,05. No


exemplo, cada tratamento foi representado por uma letra diferente, pois todas as
combinações entre tratamentos foram diferentes em relação à riqueza de espécies.

GRÁFICO 19 - RIQUEZA DE ESPÉCIES DE ÁRVORES NA BORDA, MEIO E INTERIOR DOS


FRAGMENTOS FLORESTAIS

FONTE: A autora

E
IMPORTANT

Caro acadêmico, o texto que você vai ler a seguir trata sobre uma das
grandes contribuições de Ronald Aylmer Fisher para o desenvolvimento da teoria de
delineamento experimental e para a estatística moderna. Fisher desenvolveu esse estudo
durante o período em que trabalhou como matemático e estatístico na Estação Agrícola
Experimental Rothamsted, em Harpenden - Inglaterra (SALSBURG, 2009). Nessa estação
eram desenvolvidos experimentos com fertilizantes artificiais e linhagens de trigo, centeio,
cevada e batata. Na estação também havia um conjunto de dados histórico de 90 anos
com registros diários de chuva e temperatura, registros semanais de preparação de
fertilizantes e registros anuais de colheita (SALSBURG, 2009). Fisher foi contratado para
analisar estatisticamente esse enorme conjunto de dados. No primeiro estudo, Fisher usou
o banco de dados da Rothamsted, mas no segundo trabalho desenvolveu experimentos
próprios. Veja o texto de Salsburg (2009) a seguir:

140
TÓPICO 3 | ANÁLISE DE VARIÂNCIA

LEITURA COMPLEMENTAR

EXPERIMENTOS RANDOMIZADOS CONTROLADOS

O segundo estudo [...] apareceu em Journal of Agricultural Science, em 1923.


Esse não lida com dados acumulados de experiências passadas em Rothamsted;
em vez disso, descreve um conjunto de experimentos a respeito dos efeitos de
diferentes misturas de fertilizantes sobre diferentes variedades de batata. Algo
notável acontecera com os experimentos em Rothamsted desde a chegada de
Fisher. Não se aplicava mais um único experimento em um campo inteiro. Agora
separava-se o campo em pequenos lotes; cada lote era subdividido em fileiras de
plantas, e cada fileira recebia um tratamento diferente.

A ideia básica era simples, isto é, simples depois que foi proposta por
Fisher. Ninguém pensara nisso antes. É óbvio para qualquer um que observe um
campo de grãos que algumas partes são melhores que outras. Em alguns locais, as
plantas crescem altas e carregadas de grãos. Em outros, fracas e irregulares. Isso
pode ser atribuído à forma como a água é drenada, às mudanças no tipo de solo,
à presença de nutrientes desconhecidos, a blocos de ervas perenes ou a alguma
outra força não prevista. Se o cientista agrícola quer testar a diferença entre dois
componentes de fertilizante, ele pode colocar um componente em um lugar do
campo e outro em outra parte. Isso confundirá os efeitos dos fertilizantes com
os efeitos atribuídos às propriedades do solo ou da drenagem. Se os testes são
feitos nos mesmos campos, mas em diferentes anos, os efeitos dos fertilizantes
são confundidos com mudanças de clima de ano a ano.

Se os fertilizantes são comparados um ao lado do outro e no mesmo ano,


então as diferenças de solo serão minimizadas. Elas ainda estarão ali, já que
as plantas tratadas não estão exatamente no mesmo solo. Se usarmos muitos
desses pares, as diferenças do solo se anularão em certo sentido. Suponhamos
que queiramos comparar dois fertilizantes, um com o dobro de fósforo do outro.
Dividimos o campo em pequenos lotes, cada um com duas fileiras de plantas.
Sempre colocamos o fósforo extra na fileira norte de plantas e tratamos a fileira
sul com a outra mistura. As diferenças do solo não se “anularão” se o gradiente
de fertilidade do solo corre de norte a sul, pois a fileira norte em cada bloco terá
um solo ligeiramente melhor que a fileira sul.

Nós alternaremos então, no primeiro bloco, o fósforo extra estará na fileira


norte; no segundo bloco, fileira sul, e assim sucessivamente. Se desenharmos
um mapa do campo e colocar a letra X para indicar as fileiras com fósforo extra,
concluiremos que se o gradiente de fertilidade corre do noroeste a sudeste, as
fileiras com fósforo extra terão melhor solo que as outras. [...] se o gradiente
correr de nordeste a sudoeste o oposto é válido. Bem, [...] como ficamos? Como
corre o gradiente de fertilidade? Responderemos que ninguém sabe. Conceito de
141
UNIDADE 2 | TESTES ESTATÍSTICOS I

gradiente de fertilidade é abstrato. O padrão real de fertilidade pode correr para


cima e para baixo de modo complexo à medida que vamos do norte a sul e de
leste a oeste.

Posso imaginar essas discussões entre os cientistas de Rothamsted, uma


vez que Fisher assinalou que estabelecer os tratamentos dentro de blocos pequenos
permitiria uma experimentação mais cuidadosa. Posso imaginar as discussões
sobre como determinar o gradiente de fertilidade, enquanto Fisher se senta e
sorri, deixando-os se embrenhar cada vez mais em complicadas construções.
Ele já havia considerado essas questões e tinha uma resposta simples. Ele tira
o cachimbo da boca – quem o conheceu o descreve sentado, silenciosamente
tirando baforadas de seu cachimbo, enquanto os argumentos esquentavam à sua
volta, esperando o momento em que pudesse introduzir sua resposta – e diz:
“randomização”.

FONTE: SALSBURG, D. Uma senhora toma chá... como a estatística revolucionou a ciência no
século XX. Rio de Janeiro: Zahar, 2009, p. 288.

NOTA

Caro acadêmico, você estudou o conceito de randomização e sua importância


para um delineamento experimental adequado. No livro, a randomização foi chamada de
casualização, mas ambas as palavras têm o mesmo significado, representam a alocação
aleatória das unidades amostrais pelos grupos estudados.

142
RESUMO DO TÓPICO 3
Neste tópico, você aprendeu que:

• Não podemos usar vários testes T para comparar múltiplas médias amostrais,
pois perdemos o controle do nível crítico de significância e da probabilidade
do erro tipo I assumidos no teste. Além disso, ao aumentar o número de
comparações entre médias, as possíveis combinações par a par também
aumentam e, por vezes, muitas comparações, que geram muitas combinações
par a par, são inviáveis.

• A análise de variância é usada para comparar múltiplas médias amostrais. Ela


informa se existe diferença entre, ao menos, duas das médias que estão sendo
comparadas. Esse método foi desenvolvido por Ronald Aylmer Fisher e tem
como distribuição de referência a Distribuição F.

• A lógica da análise de variância é separar a variância total existente nos dados


em componentes identificáveis. Na análise de variância simples, a variância
total é dividida em variância entre grupos e variância dentro de grupos.

• A variância entre grupos representa a variância nos dados que é atribuída às


diferenças entre as médias que estão sendo comparadas, ou seja, é a variância
correspondente ao efeito dos tratamentos. Já a variância dentro de grupos
representa a variação que existe entre as unidades amostrais que compõem
cada tratamento.

• A variância total é representada pela soma de quadrados total (SQT), que é


∑ ∑ (x - xT ) e mede a variância presente em todo
g ni 2
calculada
= por SQT ij
=i 1 =j 1
o conjunto de dados.

• A variância entre grupos é representada pela soma de quadrados entre grupos


∑ ∑ (x - x )
g ni 2
=
(SQE), que é calculada pela equação SQE =i 1 =j 1 i T e mede a
diferença entre os grupos, o que é resultado do efeito dos tratamentos.

• A variância dentro de grupos é representada pela soma de quadrados dentro


∑ ∑ (x - xj ) e
g ni 2
de grupos (SQD), que é calculada pela equação
= SQD ij
=i 1 =j 1
corresponde à variabilidade das unidades amostrais dentro de cada grupo.

• Os graus de liberdade (gl) associados a cada soma de quadrados são: i) soma


de quadrados total: glT = N - 1; ii) soma de quadrados entre grupos: glE = g - 1;
iii) soma de quadrados dentro de grupos: glD = N - g.

143
SQE
• A variância entre grupos é dada por: s 2 E = . A variância dentro de grupos
SQD glE
é calculada por: s 2 D = .
glD
s2E
• A estatística F é calculada por: F = .
s2D
• O p-valor correspondente ao F calculado pode ser obtido pela função “DISTF”
do Excel.

• O coeficiente de determinação (r2) mede quanto os tratamentos investigados


no estudo explicaram da variância total presente nos dados. É calculado por:
SQE
r2 = .
SQT
• A análise de variância informa se existem diferenças entre múltiplas médias
comparadas, mas não indica quais são as médias que diferem entre si. Para
descobrir isso é necessário aplicar um teste a posteriori, como o teste de Tukey.

• No teste de Tukey, as médias de cada grupo são comparadas par a par e o


nível crítico de significância é controlado e mantido constante entre todas as
comparações.

• Para calcular a estatística do teste de Tukey é necessário estimar erro


padrão (EP) associado a cada par de médias comparadas, pela equação:
s2D  1 1 
EPA; B
=  + .
2  nA nB 
• A estatística do teste de Tukey para cada par de médias é obtida por:
x A - xB
q A; B =
EPA; B .
• Pressupostos da análise de variância: i) as amostras devem ser aleatórias; ii)
as amostras precisam apresentar distribuição normal ou aproximadamente
normal; iii) as amostras devem ter variâncias homogêneas.

144
AUTOATIVIDADE

Caro acadêmico! Para fixar melhor o conteúdo estudado, vamos exercitar um


pouco. Leia as questões a seguir e responda-as em seu caderno de estudos.
Bom trabalho!

1 Um pesquisador, em seu primeiro projeto de pesquisa, precisava analisar os


dados que tinha coletado. O objetivo do projeto era avaliar se a disponibilidade
de recursos alimentares influencia o número de visitas por polinizadores às
flores de uma determinada espécie de planta. Para isso, o pesquisador observou
as visitas de polinizadores em 30 plantas, por um período de cinco horas em
cada planta, mas, antes das observações, ele fez alterações em algumas das
plantas para estabelecer três tratamentos: i) tratamento 1 – em 10 das plantas
foram adicionados 20 ml de uma solução açucarada para representar uma
fonte de recurso alimentar para os polinizadores; ii) tratamento 2 – em 10
das plantas foram adicionados 80 ml da solução açucarada; iii) tratamento
3 – em 10 das plantas não foi adicionada a solução açucarada. No final do
experimento, o pesquisador tinha o número de visitas de polinizadores em
cada uma das 10 plantas dos três tratamentos. Ele decidiu que a melhor
estratégia de análise dos dados era ir comparando os tratamentos par a par. A
primeira comparação foi tratamento 1 X tratamento 2, a segunda, tratamento
1 X tratamento 3 e a última comparação, tratamento 2 X tratamento 3. Em
cada uma das comparações, o pesquisador utilizou um teste T. De acordo com
o que você estudou ao longo do caderno, responda:

a) A estratégia utilizada pelo pesquisador é a melhor estratégia de análise do


conjunto de dados? Justifique sua resposta.
b) Você sugeriria alguma outra estratégia para análise desses dados? Justifique
sua resposta.

2 Uma taxonomista estava investigando três espécies de roedores e queria


encontrar características morfológicas que possibilitassem a identificação das
espécies. As três espécies de roedores são muito parecidas morfologicamente
e difíceis de serem distinguidas. O comprimento do crânio foi uma das
características que a taxonomista avaliou. Ela mediu o comprimento do
crânio de dez indivíduos de cada espécie de roedor. Os dados encontrados
são apresentados na tabela a seguir. Com base no comprimento do crânio,
a taxonomista é capaz de diferenciar as três espécies de roedores? Para
responder à pergunta, você deve realizar uma análise de variância e seguir os
passos a seguir:

145
Unidade amostral Espécie 1 Espécies 2 Espécie 3
1 4,80 5,30 6,50
2 5,00 5,10 6,30
3 5,00 5,30 6,40
4 5,10 5,20 6,30
5 4,90 5,70 6,00
6 5,00 5,40 5,90
7 5,30 5,40 6,10
8 5,20 5,50 6,00
9 4,90 5,50 6,20
10 5,10 5,40 6,20
Média dos grupos 5,03 5,38 6,19
Variância 0,02 0,03 0,04
Média geral 5,53

a) Formule a hipótese nula e a hipótese alternativa.


b) Cheque os pressupostos da análise de variância.
c) Estabeleça o nível crítico de significância (a) e o valor crítico do teste F.
d) Monte uma Tabela de anova com: as somas de quadrados (total, entre grupos e
dentro de grupos); os graus de liberdade associados a cada soma de quadrados;
a variância entre grupos e dentro de grupos; a estatística do teste F.
e) Encontre o p-valor correspondente à estatística do teste F.
f) Se necessário, faça um teste a posteriori de Tukey.
g) Com base nos resultados, responda se o comprimento do crânio é uma
característica morfológica que permite distinguir as três espécies de roedores.

146
UNIDADE 3

TESTES ESTATÍSTICOS II

OBJETIVOS DE APRENDIZAGEM
A partir desta unidade você será capaz de:

• fazer uso dos fundamentos básicos em estatística, bem como do teste de


hipóteses;

• compreender os seguintes testes estatísticos: correlação, regressão linear


simples e qui-quadrado;

• identificar e aplicar o teste estatístico adequado à pergunta biológica;

• interpretar e apresentar resultados dos testes estatísticos corretamente.

PLANO DE ESTUDOS
A terceira unidade se divide em três tópicos. Ao final de cada tópico você
encontrará atividades que visam melhorar a compreensão dos conteúdos
abordados.

TÓPICO 1 – CORRELAÇÃO

TÓPICO 2 – REGRESSÃO LINEAR SIMPLES

TÓPICO 3 – QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS

147
148
UNIDADE 3
TÓPICO 1

CORRELAÇÃO

1 INTRODUÇÃO
Na Unidade 2 você estudou o teste T e análise de variância, que são testes
estatísticos que buscam avaliar se conjuntos de unidades amostrais respondem
de maneiras diferentes aos níveis de um determinado fator. Neste tópico você
estudará a correlação, que é um método estatístico que apresenta uma lógica
de funcionamento diferente do teste T e análise de variância. Na correlação, o
objetivo é avaliar se existe alguma relação entre duas variáveis. Portanto, não
temos um fator principal influenciando as unidades amostrais, as duas variáveis
estão no mesmo nível. Por exemplo, podemos investigar se existe relação entre a
temperatura global e a concentração de gases de efeito estufa na atmosfera; entre
a riqueza de espécies e distúrbios antrópicos; ou entre o desempenho de alunos
nas avaliações e o tempo dedicado ao estudo dos conteúdos.

Na correlação, para cada unidade amostral da amostra são obtidos dois


valores, um corresponde à variável X e o outro à variável Y (VIEIRA, 2011). As duas
variáveis investigadas devem ser quantitativas. Podemos representar os valores
das duas variáveis por meio de um gráfico de dispersão, que você aprendeu como
construir na Unidade 1. No gráfico de dispersão, uma das variáveis é representada
no eixo x e a outra no eixo y. As unidades amostrais são posicionadas no gráfico
de acordo com os valores que apresentam para as variáveis X e Y. A disposição
dos pontos no gráfico, que correspondem às unidades amostrais, permite avaliar
a direção, força e forma da relação entre as duas variáveis.

Em relação à direção, o gráfico de dispersão permite observar se os


valores das variáveis X e Y estão variando na mesma direção ou em direções
opostas. Quando duas variáveis mudam na mesma direção, a correlação entre
as variáveis é chamada de correlação positiva (VIEIRA, 2011). Na correlação
positiva, os valores da variável X aumentam à medida que os valores da variável
Y também aumentam (Figura 12 A, B e C); ou os valores da variável X diminuem,
enquanto os valores da variável Y também diminuem, ou seja, ambos os valores
estão variando na mesma direção. Por exemplo, podemos esperar uma correlação
positiva entre a temperatura global e a concentração de gases de efeito estufa
na atmosfera, de modo que quando a concentração de gases de efeito estufa
aumenta, a temperatura também aumenta. Quando as variáveis mudam em
direções opostas, a correlação é chamada de correlação negativa (VIEIRA, 2011).

149
UNIDADE 3 | TESTES ESTATÍSTICOS II

Isso acontece quando os valores da variável X aumentam, enquanto os valores da


variável Y diminuem (Figura 12 D, E e F); ou à medida que os valores da variável
X diminuem, os valores da variável Y aumentam, ou seja, as variáveis estão
mudando em direções opostas. Por exemplo, podemos esperar uma correlação
negativa entre a riqueza de espécies e o nível de distúrbios antrópicos, de modo
que quando os distúrbios antrópicos aumentam, a riqueza de espécies diminui.

A força da correlação entre as duas variáveis pode ser verificada pela


dispersão dos pontos em relação a uma reta imaginária que corta o gráfico de
dispersão na diagonal (VIEIRA, 2011) (Figura 12 A). Quanto mais os pontos se
agrupam ao longo da reta imaginária, mais forte é a correlação entre as duas
variáveis. Assim, nas Figuras 12 A e D, em que os pontos estão praticamente
alinhados na diagonal, a correlação entre as duas variáveis é dita forte. Já nas
Figuras 12 B e E, em que existe certa dispersão dos pontos em relação à reta
diagonal imaginária, a força da correlação entre as variáveis é chamada de
intermediária. Nas Figuras 12 C e F, em que os pontos estão muito dispersos
e é difícil estabelecer a direção da relação entre as duas variáveis, a força da
correlação é dita fraca.

As duas variáveis podem apresentar uma correlação com forma linear,


conforme observado nas Figuras 12 A até F, ou ainda, a correlação das variáveis
pode ter um formato não linear, como na Figura 12 G, em que a relação é quadrática.
Neste tópico, nos concentraremos nas relações entre variáveis com forma linear.
A seguir, você estudará como medir a força de uma correlação linear por meio de
um método estatístico.

150
TÓPICO 1 | CORRELAÇÃO

FIGURA 12 - REPRESENTAÇÃO DOS POSSÍVEIS TIPOS DE DIREÇÃO, FORÇA E FORMA DA


CORRELAÇÃO ENTRE DUAS VARIÁVEIS

FONTE: A autora

2 COEFICIENTE DE CORRELAÇÃO DE PEARSON


Você estudou que o gráfico de dispersão pode ser usado para estabelecer
a forma, direção e força da relação entre duas variáveis quantitativas. Além de
representar graficamente os dados, por vezes, também é necessário descrever
a força da relação entre as duas variáveis por meio de um número. Quando a
relação entre as duas variáveis é linear, a força da correlação pode ser mensurada
pelo coeficiente de correlação de Pearson (r) (VIEIRA, 2011). Este coeficiente foi
desenvolvido por Karl Pearson, em 1896 (CALLEGARI-JACQUES, 2003).

O coeficiente de correlação de Pearson é calculado pela equação (VIEIRA,


2011):

151
UNIDADE 3 | TESTES ESTATÍSTICOS II

(∑ x )× (∑ y )
i
n
i 1 i
n


n =i 1 =
i =1 i
x ×y -
i
r= n

( ) ( ) 
2
  2

 n 2 ∑ i 1x=   n 2 ∑ i 1yi
n n
i
 ∑ i 1x=  ×  ∑ i 1yi -
=
i - 
=
 n   n 
   

Na equação, xi e yi representam o i-ésimo valor da variável X e Y,


respectivamente. Os dados das variáveis X e Y podem ser organizados em uma
tabela conforme apresentado na tabela a seguir. A partir desta organização é fácil
obter os valores dos somatórios exigidos pela equação. É preciso calcular apenas
cinco somatórios:

i) somatório dos valores da variável X (∑ni = 1 xi);


ii) somatório dos valores da variável Y (∑ni = 1 yi);
iii) somatório do quadrado dos valores da variável X (∑ni = 1 x2i);
iv) somatório do quadrado dos valores da variável Y (∑ni = 1 y2i);
v) somatório da multiplicação de cada valor de xi por yi (∑ni = 1 xi x yi).

TABELA 27 - ORGANIZAÇÃO DOS DADOS PARA CALCULAR O COEFICIENTE DE CORRELAÇÃO


DE PEARSON (r)

Variável x Variável y x2i y2i xi x yi

x1 y1 x21 y21 x1 x y1

x2 y2 x22 y22 x2 x y2

x3 y3 x23 y23 x3 x y3

⁞ ⁞ ⁞ ⁞ ⁞

xn yn x2n y2n xn x yn

n n n n n

∑x
i =1
i ∑y
i =1
i ∑x
i =1
2
i ∑y
i =1
2
i ∑x ×y
i =1
i i

FONTE: A autora

152
TÓPICO 1 | CORRELAÇÃO

O numerador da equação do coeficiente de correlação é chamado de


covariância de X e Y e corresponde a uma medida de quanto as duas variáveis
mudam conjuntamente, ou seja, o quanto elas variam sincronicamente. Quando
as duas variáveis mudam na mesma direção, o numerador da equação é positivo.
Já quando as variáveis mudam em direções opostas, o numerador da equação é
negativo. Note que o numerador da equação – a covariância – já mede o tamanho
da força da relação entre as duas variáveis, mas então por que precisamos
do denominador da equação? O denominador da equação corresponde à
multiplicação da variância de X pela variância de Y e representa o limite máximo
de variação presente no conjunto de dados. O denominador da equação é
necessário para padronizar o coeficiente de correlação e deixá-lo adimensional,
ou seja, sem unidade de medida.

É importante que o coeficiente de correlação seja adimensional, porque


assim podemos comparar os valores de r obtidos entre diferentes variáveis. Por
exemplo, podemos comparar o valor de r da correlação entre a temperatura e
a concentração de gases de efeito estufa com o valor de r da correlação entre a
precipitação e a concentração de gases de efeito estufa e, assim, determinar qual
das duas variáveis está mais relacionada à concentração de gases de efeito estufa.

O coeficiente de correlação varia entre -1 e 1, ou seja, -1 ≤ r ≤ +1 (VIEIRA,


2011). Observe a tabela a seguir com a interpretação dos valores de r. Valores de r
negativos representam correlações negativas, ou seja, as variáveis estão variando
em direções opostas, enquanto valores de r positivos correspondem a correlações
positivas, ou seja, as variáveis estão variando na mesma direção. Quanto mais
próximo de -1 ou 1 o coeficiente de correlação for, mais forte é a correlação. Já
valores de r iguais ou próximos de zero significam que não existe correlação entre
duas variáveis estudadas, ou seja, a correlação é nula.

TABELA 28 - VALORES DO COEFICIENTE DE CORRELAÇÃO DE PEARSON E RESPECTIVA


INTERPRETAÇÃO

Valor do coeficiente de correlação de Pearson (r) Interpretação da relação


r=1 Correlação perfeita positiva
r = -1 Correlação perfeita negativa
r≅0 Correlação nula
0<r<1 Correlação positiva
-1 < r < 0 Correlação negativa
FONTE: Adaptado de Vieira (2011)

153
UNIDADE 3 | TESTES ESTATÍSTICOS II

2.1 TESTE DE HIPÓTESES PARA O COEFICIENTE


DE CORRELAÇÃO DE PEARSON
Na maioria dos casos, os dados usados para avaliar a correlação entre
as variáveis X e Y são provenientes de uma amostra da população. Por isso,
além de calcular o valor de r, que mede a correlação entre as duas variáveis,
também é necessário estabelecer uma probabilidade associada ao valor de r. Essa
probabilidade é representada pelo p-valor e indica a chance de se encontrar um
valor de r igual ou mais extremo que o valor observado caso a hipótese nula fosse
verdadeira. Para chegar ao p-valor correspondente ao valor de r é necessário
calcular um teste T com algumas adaptações e utilizar a tabela de distribuição
T com n - 2 graus de liberdade (CALLEGARI-JACQUES, 2003). Lembrando
que para chegar ao p-valor é necessário seguir todos os passos de um teste de
hipóteses, como você já está acostumado a fazer:

1° Precisamos estabelecer as hipóteses nula e alternativa. Neste caso, H0: não existe
relação entre as variáveis X e Y, ou seja, r ≅ 0. Já a hipótese alternativa pode ser
estabelecida de três maneiras, dependendo do conhecimento prévio sobre o
comportamento das variáveis. Se não temos conhecimento e não conseguimos
estabelecer previamente uma direção para a correlação entre as duas variáveis,
então H1: existe relação entre as variáveis X e Y, ou seja, r ≠ 0. Já quando temos
algum conhecimento e conseguimos estabelecer que a relação entre as duas
variáveis provavelmente é positiva, então H1: à medida que a variável X
aumenta, a variável Y também aumenta, ou seja, r > 0; ou quando esperamos
que a relação entre as duas variáveis seja negativa, então H1: à medida que a
variável X aumenta, a variável Y diminui, ou seja, r < 0.
2° Identificamos se o teste estatístico é uni ou bilateral. Se na hipótese alternativa
não estabelecemos uma direção para a relação entre as duas variáveis, o teste
estatístico é bilateral. Quando determinamos uma direção da relação entre as
duas variáveis na hipótese alternativa, tanto positiva quanto negativa, o teste
é unilateral.
3° Indicamos o nível crítico de significância (a).
4° Estabelecemos o valor crítico da estatística do teste. Sabendo que usaremos
um teste T, então a distribuição de referência que deve ser utilizada para
chegar ao valor crítico é a distribuição T (Apêndice 2). Os graus de liberdade
são definidos por n - 2, ou seja, o tamanho da amostra menos dois. Assim, ao
informar a, graus de liberdade e se o teste é uni ou bilateral, chegamos ao valor
crítico, que é representado por ta; n - 2.
5° Calculamos a estatística do teste T, pela equação (CALLEGARI-JACQUES, 2003):
r
t=
1− r2
n−2

154
TÓPICO 1 | CORRELAÇÃO

Na equação, r é o valor do coeficiente de correlação de Pearson que deve


ser calculado anteriormente e n é o tamanho amostral.

6° Após calcular a estatística do teste T, podemos encontrar o p-valor


correspondente consultando a Tabela de Distribuição T (conforme você já
apreendeu na Unidade 2) ou usando a função “DISTT” do Excel.
7° O último passo é fazer a inferência estatística pela comparação dos valores de
𝑡 crítico e calculado ou os valores de 𝛼 e p-valor.

2.2 PRESSUPOSTOS PARA CALCULAR O COEFICIENTE


DE CORRELAÇÃO DE PEARSON
Quatro pressupostos devem ser atendidos para que o coeficiente de
correlação de Pearson e o p-valor associado possam ser calculados e interpretados
com segurança (CALLEGARI-JACQUES, 2003; VIEIRA, 2011). Primeiro, as
variáveis X e Y devem ser provenientes de uma amostra aleatória. Como você já
apreendeu, esse pressuposto deve ser atendido no planejamento do delineamento
amostral, em que todas as unidades amostrais da população devem ter tido a
mesma chance de terem sido amostradas. Segundo, a relação entre as duas
variáveis deve ser linear. Não podemos interpretar um coeficiente de correlação
de Pearson calculado para duas variáveis que apresentam relação não linear
(Figura 12G). A forma da relação entre as duas variáveis pode ser verificada
construindo um gráfico de dispersão, como na Figura 12.

O terceiro pressuposto é a homogeneidade de variância. Para cada


valor em x, os valores em y devem ter aproximadamente a mesma variância.
Assim como, para cada valor em y, os valores em x devem apresentar a mesma
variância. Esse pressuposto também pode ser avaliado pelo gráfico de dispersão.
Quando a nuvem de pontos apresenta o formato aproximado de uma elipse,
como na Figura 13A, o pressuposto foi atendido. Quando a nuvem de pontos
não mostra uma elipse, como o que acontece na Figura 13B, os dados não têm
homogeneidade de variâncias. Na Figura 13A, por exemplo, a variância nos
valores de y é constante para qualquer valor em x. Já na Figura 13B, a variância
nos valores de y quando x = 1 é muito menor que quando x = 5.

155
UNIDADE 3 | TESTES ESTATÍSTICOS II

FIGURA 13 - GRÁFICO DE DISPERSÃO DE PONTOS PARA AVALIAR O PRESSUPOSTO DE


HOMOGENEIDADE DE VARIÂNCIAS

FONTE: Adaptado de Callegari-Jacques (2003)

O último pressuposto é que ambas as variáveis precisam apresentar


distribuição normal ou aproximadamente normal. Esse pressuposto deve ser
atendido para que possamos calcular um p-valor associado ao valor de r, pois
o cálculo do p-valor é baseado na distribuição T e assume que os dados têm
distribuição normal. Como você já estudou, a normalidade pode ser checada
construindo histogramas de frequência para cada variável ou por um teste de
normalidade, como o teste de Shapiro-Wilk.

3 VAMOS PRATICAR
Veremos como calcular o coeficiente de correlação de Pearson na prática.
Imagine que gostaríamos de investigar se existe alguma correlação entre as
notas da primeira avaliação de estatística dos alunos de Ciências Biológicas da
UNIASSELVI e o tempo que cada aluno dedicou ao estudo do conteúdo em casa.
Para isso, foram amostrados 20 alunos e para cada aluno foram obtidas as duas
variáveis de interesse: nota da primeira avaliação e tempo de estudo, conforme
apresentado na Tabela 29 (adiante).

Antes de calcular o coeficiente de correlação, é importante fazer um


gráfico de dispersão dos dados para verificar a forma, direção e força da relação
entre as duas variáveis. No Gráfico 20, observamos que a relação entre as duas
variáveis é positiva, ou seja, a nota dos alunos aumenta à medida que o tempo de
estudo também aumenta. A relação entre as duas variáveis parece ser forte, pois
os pontos estão agrupados em relação à reta imaginária que corta o gráfico na
diagonal. Também é possível evidenciar que a relação entre as duas variáveis é
linear e, portanto, podemos calcular o coeficiente de correlação de Pearson.
156
TÓPICO 1 | CORRELAÇÃO

GRÁFICO 20 - RELAÇÃO ENTRE AS NOTAS DA PRIMEIRA AVALIAÇÃO DE ESTATÍSTICA E O


TEMPO DEDICADO AO ESTUDO

FONTE: A autora

Além da relação linear entre as duas variáveis, também é necessário


checar os outros pressupostos da análise. Assumimos que as duas variáveis
foram obtidas de uma amostra aleatória. Observando o gráfico de dispersão
(Gráfico 20), verificamos que o pressuposto de homogeneidade de variância
também é atendido, pois a variância nos valores de y é semelhante para qualquer
valor de x, assim como a variância nos valores de x é constante para qualquer
valor de y. A partir do histograma de frequências de cada variável, notamos que
ambas apresentam distribuição aproximadamente normal.

GRÁFICO 21 - HISTOGRAMA DE FREQUÊNCIA PARA AS NOTAS DA PRIMEIRA AVALIAÇÃO DE


ESTATÍSTICA (A) E O TEMPO DEDICADO AO ESTUDO (B)

FONTE: A autora

157
UNIDADE 3 | TESTES ESTATÍSTICOS II

Com todos os pressupostos checados e atendidos, podemos calcular o


coeficiente de correlação de Pearson. Para obter os valores dos cinco somatórios
que a equação exige, podemos organizar os dados conforme a Tabela 29.

TABELA 29 - ORGANIZAÇÃO DOS DADOS PARA CALCULAR O COEFICIENTE DE CORRELAÇÃO


ENTRE AS NOTAS DA 1ª AVALIAÇÃO DE ESTATÍSTICA E TEMPO DE ESTUDO

Tempo de Notas da 1ª
Aluno estudo Avaliação x2i y2i xi x yi
(Variável x) (Variável y)
1 5,0 5,5 25,0 30,3 27,5
2 2,5 3,0 6,3 9,0 7,5
3 3,5 5,0 12,3 25,0 17,5
4 6,0 6,0 36,0 36,0 36,0
5 2,0 2,0 4,0 4,0 4,0
6 3,8 4,0 14,4 16,0 15,2
7 6,5 6,0 42,3 36,0 39,0
8 5,0 6,5 25,0 42,3 32,5
9 4,1 5,0 16,8 25,0 20,5
10 5,5 6,0 30,3 36,0 33,0
11 8,0 9,0 64,0 81,0 72,0
12 7,0 7,5 49,0 56,3 52,5
13 4,3 6,0 18,5 36,0 25,8
14 7,5 7,0 56,3 49,0 52,5
15 8,0 8,5 64,0 72,3 68,0
16 5,0 6,0 25,0 36,0 30,0
17 9,5 8,5 90,3 72,3 80,8
18 9,5 9,5 90,3 90,3 90,3
19 6,0 7,0 36,0 49,0 42,0
20 9,0 8,0 81,0 64,0 72,0
n n n n n

∑x i = 117, 7 ∑ yi = 126, 0 ∑x
i =1
2
i = 786,5 ∑y 2
i = 865,5 ∑x × y
i =1
i i 818,5
=
i =1 i =1 i =1

FONTE: A autora

Com os cinco somatórios calculados, basta substituir os valores na


equação:

158
TÓPICO 1 | CORRELAÇÃO

(∑ x )× (∑ y )
i
n
i 1 i
n
117, 7 ×126, 0

n =i 1 =
x ×y -
i =1 i i 818,5 -
= r n 20

( ) ( ) (117, 7 )  ×  865,5 - (126, 0 ) 
2
  2
  2
  2

∑ ∑
n n
 xi   yi   786,5 -
 ∑ i 1x= ×  ∑ i 1yi -
= n i 1= n i 1
2
i - 
2
  20   20 
=
n n 
   
   
818,5 - 741,5 77, 0
=r = = 0,94
93,8 × 71, 7 82, 0

Resolvendo a equação, observamos que a correlação entre a nota dos


alunos e o tempo de estudo foi de r = 0,94. Esse valor está muito próximo de
uma correlação perfeita positiva (r = 1), o que provavelmente levará à rejeição da
hipótese nula se o teste de hipóteses for realizado.

Vamos determinar qual a probabilidade de encontrar um r = 0,94 se a


hipótese nula fosse verdadeira. Para isso seguiremos todos os passos de um teste
de hipóteses:

1° Precisamos estabelecer as hipóteses nula e alternativa. H0: não há correlação


entre a nota dos alunos e o tempo dedicado ao estudo do conteúdo da avaliação.
Imaginando que a correlação entre as duas variáveis deve ser positiva, podemos
estabelecer essa expectativa na hipótese alternativa, de modo que H1: à medida
que o tempo de estudo aumenta as notas também aumentam.
2° Para esse exemplo, o teste estatístico é unilateral, pois estabelecemos uma
direção para a relação entre as duas variáveis na hipótese alternativa.
3° Determinamos o nível crítico de significância em 5% (a = 0,05).
4° Estabelecemos o valor crítico da estatística do teste. Para isso precisamos
informar o a = 0,05 e os graus de liberdade (n - 2 = 20 - 2 = 18). Para um teste
unilateral, o valor crítico é t0,05; 18 = 1,734 (consulte a tabela de distribuição T
no Apêndice 2).
5° Calculamos a estatística do teste T, pela equação:

r 0,94 0,94 0,94


=t = = = = 11, 75
1- r2 1 - ( 0,94 )
2
0,12 0, 08
n-2 20 - 2 18

6° Ao utilizar a função “DISTT” do Excel e informar o valor da estatística do teste


(t = 11,75), os graus de liberdade e que o teste é unilateral (=DISTT(11,75; 18;
1)), encontramos que o p-valor correspondente é menor que 0,01.
7° Com os resultados podemos fazer a inferência estatística. Como o valor de t
calculado foi maior que t crítico, rejeitamos a hipótese nula; como o p-valor
(p < 0,01) foi menor que o nível crítico de significância (a = 0,05), também
rejeitamos a hipótese nula.
159
UNIDADE 3 | TESTES ESTATÍSTICOS II

Podemos concluir que existe uma correlação de 0,94 entre as notas da


primeira avaliação de estatística e o tempo dedicado ao estudo dos conteúdos.
Essa correlação de 0,94 dificilmente teria sido observada se a hipótese nula
fosse verdadeira (t = 11,75; gl = 18; p < 0,01). Além de descrever o resultado e
a conclusão, os trabalhos científicos também apresentam o gráfico de dispersão
das duas variáveis e incluem no gráfico o valor do coeficiente de correlação e o
p-valor associado, veja o gráfico a seguir.

GRÁFICO 22 - RELAÇÃO ENTRE AS NOTAS DA PRIMEIRA AVALIAÇÃO DE ESTATÍSTICA E O


TEMPO DEDICADO AO ESTUDO

FONTE: A autora

3.1 CUIDADOS NA INTERPRETAÇÃO DO COEFICIENTE


DE CORRELAÇÃO DE PEARSON
Você acabou de estudar o exemplo da correlação entre notas da avaliação
e tempo de estudo. Neste exemplo, parece bastante lógico que quanto mais os
alunos estudam, melhor é o desempenho deles na avaliação, ou seja, parece
existir uma relação de causa e efeito entre as duas variáveis. No entanto, quando
trabalhamos com correlação não podemos fazer afirmações de causa e efeito,
pois não controlamos outras variáveis que podem ter influenciado as variáveis
investigadas (VIEIRA, 2011). Por exemplo, pode ser que os alunos que tiraram
notas altas estudaram as anotações do caderno e o livro didático recomendado
pelo professor. Enquanto os alunos que tiraram nota mais baixa basearam seus
estudos apenas nas anotações do caderno que estavam incompletas. A qualidade
do material de estudo não foi uma variável considerada, mas que pode ter
influenciado o resultado da correlação entre notas e tempo de estudo. Lembre-
se sempre de que, mesmo nos casos de forte correlação entre as variáveis, não

160
TÓPICO 1 | CORRELAÇÃO

podemos fazer afirmações de relação causa e efeito entre elas, mas temos indícios
de que as duas variáveis estão relacionadas de alguma maneira.

Vamos pensar em outro exemplo: um pesquisador observou que cidades


com grande número de escolas de Ensino Fundamental tinham maior número de
pizzarias. Já cidades com menos escolas tinham menos pizzarias. O pesquisador
amostrou 100 cidades e para cada cidade anotou o número de escolas e pizzarias,
depois calculou o coeficiente de correlação e p-valor associado. A correlação
entre as duas variáveis foi altíssima e significativa (r = 0,88; p < 0,01). A partir
dos resultados do pesquisador, podemos concluir que o aumento no número
de escolas de Ensino Fundamental leva ao aumento de pizzarias, ou vice-
versa? Essa interpretação do resultado não é muito lógica. Possivelmente outra
variável, que não foi considerada pelo pesquisador, está influenciando tanto
o número de escolas quanto o número de pizzarias e, por isso, essas variáveis
estão correlacionadas. Podemos pensar, por exemplo, no tamanho populacional.
Cidades menos populosas têm menos escolas e pizzarias porque um número
reduzido desses estabelecimentos é suficiente para suprir as necessidades da
população. Já cidades mais populosas precisam de mais escolas e pizzarias para
atender à população. Neste exemplo, fica claro que a alta correlação entre escolas
e pizzarias não implica em uma relação causa e efeito entre as duas variáveis.
Quando duas variáveis estão correlacionadas, mas não existe uma explicação
lógica e simples para tal correlação, a correlação é chamada de correlação espúria
(VIEIRA, 2011). Em casos de correlação espúria, como o exemplo das escolas e
pizzarias, a correlação não deve ser interpretada.

Outro ponto importante é que o coeficiente de correlação é muito sensível a


valores extremos (CALLEGARI-JACQUES, 2003; PAGANO; GAUVREAU, 2013),
que também são chamados de outliers. A presença ou não desses valores pode
alterar muito o resultado da correlação. Veja o exemplo da correlação entre duas
variáveis quaisquer X e Y na figura a seguir, que apresenta um outlier. Quando o
outlier é considerado na análise, a correlação é de r = 0,50 e significativa (p = 0,03).
Já quando o outlier é removido da análise, a força da correlação entre X e Y diminui
muito (r = 0,25; p = 0,10). Removemos ou deixamos o outlier na análise? Quando os
outliers correspondem a erros de anotação ou medição durante a coleta de dados
e não podem ser corrigidos, eles podem ser removidos das análises. Quando não
temos boas justificativas para remoção de outliers, estes devem ser mantidos nas
análises (CALLEGARI-JACQUES, 2003). Nos casos em que os outliers não podem
ser removidos da análise, pode ser interessante apresentar ambos os resultados,
com e sem a presença dos outliers.

161
UNIDADE 3 | TESTES ESTATÍSTICOS II

FIGURA 14 - CORRELAÇÃO ENTRE AS VARIÁVEIS X E Y COM E SEM A PRESENÇA DE UM


OUTLIER

FONTE: Adaptado de Callegari-Jacques (2003)

162
RESUMO DO TÓPICO 1

Neste tópico, você aprendeu que:

• Na correlação, avaliamos se existe alguma relação entre duas variáveis


quantitativas. Cada unidade amostral da amostra fornece dois valores, um
corresponde à variável X e o outro à variável Y.

• O gráfico de dispersão permite representar a forma, direção e força da relação


entre duas variáveis quantitativas.

• Se duas variáveis mudam na mesma direção, a correlação entre as variáveis


é positiva; quando as variáveis mudam em direções opostas, a correlação é
negativa.

• A força da correlação depende do grau de dispersão dos pontos em relação a


uma reta imaginária que corta o gráfico de dispersão na diagonal. Quanto mais
os pontos se agrupam ao longo dessa reta imaginária, mais forte é a correlação
entre as duas variáveis.

• Duas variáveis podem apresentar uma correlação com forma linear ou não
linear.

• O coeficiente de correlação de Pearson é usado para medir a força da correlação


entre duas variáveis quantitativas e que apresentam relação linear. Esse
coeficiente foi desenvolvido por Karl Pearson, em 1896.

• O coeficiente de correlação é calculado por:

(∑ x )× (∑ y ) n
i =1 i
n
i =1 i

n
x ×y −
i =1 i i
r= n

( ∑ x )  ×  ( ∑ y) 

n 2 n 2

 n 2 i =1 i i =1 i
 ∑ i =1xi −   ∑ i =1yi
n 2
− 
 n   n 
   

• O numerador da equação representa a covariância de X e Y e corresponde a uma


medida de quanto as duas variáveis mudam sincronicamente. O denominador
da equação é necessário para padronizar o coeficiente de correlação e deixá-lo
adimensional.

163
• O coeficiente de correlação varia entre -1 ≤ r ≤ +1. Valores de r positivos
representam correlações positivas e valores de r negativos correspondem a
correlações negativas. A força da correlação aumenta conforme os valores de r
se aproximam de -1 ou 1. Valores de r ≅ 0 representam correlações nulas.

• Frequentemente, precisamos associar um p-valor ao valor de r calculado. O


p-valor informa a chance de se encontrar um valor de r igual ou mais extremo
que o valor observado, caso a hipótese nula fosse verdadeira.

• Para chegar ao p-valor é necessário calcular um teste T com algumas adaptações,


utilizar a distribuição T com n – 2 graus de liberdade e seguir todos os passos
de um teste de hipóteses. A hipótese nula é que não existe relação entre as
variáveis X e Y; enquanto a hipótese alternativa pode estabelecer que existe
relação X e Y, ou que essa correlação é negativa ou positiva.

r
• O teste T é calculado por: t =
1− r2
n−2

• Para calcular o coeficiente de correção de Pearson e estabelecer um p-valor


associado, quatro pressupostos devem ser atendidos: i) as variáveis devem
ser provenientes de uma amostra aleatória; ii) a forma da relação entre as
variáveis precisa ser linear; iii) as variâncias devem ser homogêneas; iv) as
variáveis precisam ter distribuição normal.

• Mesmo que o coeficiente de correlação seja alto e significativo, não podemos


inferir relação de causa e efeito entre as variáveis, mas temos indícios de que
as duas variáveis estão relacionadas de alguma maneira.

• Quando duas variáveis estão correlacionadas, mas não existe uma explicação
lógica e simples para tal correlação, a correlação é chamada de correlação
espúria.

• O coeficiente de correlação é muito sensível à presença de outliers nos dados.


No entanto, um outlier pode ser removido das análises somente se tivermos
boas justificativas para essa remoção.

164
AUTOATIVIDADE

Caro acadêmico! Para fixar melhor o conteúdo estudado, vamos exercitar um


pouco. Leia as questões a seguir e responda-as em seu caderno de estudos.
Bom trabalho!

1 Cada gráfico de dispersão a seguir representa a relação entre duas variáveis


(X e Y) e seu respectivo coeficiente de correlação e p-valor associado. Para cada
gráfico, indique se existe correlação entre as duas variáveis e, caso as variáveis
estejam correlacionadas, identifique a forma, direção e força da correlação.
Em um dos casos o coeficiente de correlação foi calculado erroneamente.
Identifique esse caso e justifique.

165
2 Muitos estudos científicos evidenciaram que a riqueza de espécies de plantas
arbóreas tende a diminuir com o aumento da altitude. Os dados apresentados
na tabela a seguir correspondem à riqueza de espécies arbóreas da Floresta
Ombrófila Mista de 13 locais, em diferentes altitudes, de Santa Catarina. Com
base nesses dados, faça o que é solicitado:

Local Altitude (m) Riqueza

1 559 41

2 749 33

3 806 50

4 833 40

5 865 21

6 869 36

7 927 35

8 979 34

9 1051 38

10 1091 17

11 1269 22

12 1407 18

13 1449 10

a) Construa um gráfico de dispersão com a riqueza de espécies arbóreas e a


altitude e indique se existe relação entre as duas variáveis.

b) Se as duas variáveis estão correlacionadas, identifique qual a forma, direção


e força dessa relação com base no gráfico de dispersão.

c) Verifique se os dados atendem todos os pressupostos para calcular um


coeficiente de correlação e o p-valor associado.

d) Calcule o coeficiente de correlação de Pearson para as duas variáveis.

166
e) Determine a probabilidade de se obter um coeficiente de correlação igual ou
maior ao que foi encontrado, caso a hipótese nula fosse verdadeira. Para chegar
ao p-valor, você terá que seguir todos os passos de um teste de hipóteses: i)
estabelecer as hipóteses nula e alternativa; ii) definir se o teste estatístico é
uni ou bilateral; iii) estabelecer um nível crítico de significância; iv) encontrar
o valor crítico da estatística do teste consultando a tabela de distribuição T e
informando a, os graus de liberdade e se o teste é uni ou bilateral; v) calcular a
estatística do teste T; vi) determinar o p-valor correspondente à estatística do
teste T; vii) fazer a inferência estatística.

f) Com base no gráfico de dispersão, coeficiente de correlação e p-valor,


conclua se as variáveis estão correlacionadas.

167
168
UNIDADE 3
TÓPICO 2

REGRESSÃO LINEAR SIMPLES

1 INTRODUÇÃO
No tópico anterior, você estudou como avaliar se duas variáveis
quantitativas estão relacionadas. Na correlação, as duas variáveis são simétricas,
ou seja, estão no mesmo nível e o objetivo é apenas identificar se existe alguma
relação entre elas. Neste tópico você irá estudar a regressão linear simples, um
método estatístico que pressupõe que uma das variáveis influencia a outra
(VIEIRA, 2011; PAGANO; GAUVREAU, 2013), ou seja, as variáveis não são mais
simétricas. Por exemplo, podemos assumir que a concentração de gases de efeito
estufa na atmosfera influencia a temperatura global e, assim, mensurar quanto
da variação da temperatura pode ser explicada pela variação da concentração
de gases de efeito estufa. Na regressão linear, a relação entre duas variáveis
quantitativas pode ser descrita analiticamente por meio de uma reta. O método é
chamado de regressão linear, pois a relação entre as duas variáveis deve ser linear
para que possa ser descrita por uma reta. Esse método estatístico foi desenvolvido
por Francis Galton e publicado em 1886 (CALLEGARI-JACQUES, 2003).

2 REGRESSÃO LINEAR SIMPLES


Chamamos a variável que influencia outra de variável preditora (ou
também, variável independente ou explanatória), justamente porque ela prediz
outra variável (CALLEGARI-JACQUES, 2003). Já a variável que sofre influência
é denominada de variável resposta (ou variável dependente), pois essa variável
responde e depende de outra variável (CALLEGARI-JACQUES, 2003). A
regressão linear é dita simples quando temos apenas uma variável preditora
explicando uma variável resposta. No entanto, podemos ter mais de uma variável
preditora influenciando a variável resposta e, nestes casos, temos uma regressão
linear múltipla.

Na regressão linear simples, para cada unidade amostral são coletadas


duas informações, uma referente à variável preditora e outra referente à variável
resposta. A relação entre as duas variáveis pode ser evidenciada por meio de um
gráfico de dispersão. Representamos a variável preditora no eixo x do gráfico e
a variável resposta no eixo y. Além disso, uma linha reta é desenhada sobre os

169
UNIDADE 3 | TESTES ESTATÍSTICOS II

pontos e indica a relação linear entre as duas variáveis. A seguir, você irá estudar
como essa reta pode ser estabelecida. O gráfico a seguir ilustra uma dispersão
para regressão linear em que a relação entre as variáveis é positiva.

GRÁFICO 23 - REPRESENTAÇÃO DE UM GRÁFICO DE DISPERSÃO PARA REGRESSÃO


LINEAR SIMPLES

FONTE: Adaptado de Callegari-Jacques (2003)

2.1 RETA DE REGRESSÃO LINEAR SIMPLES


A reta que representa a relação linear entre duas variáveis quantitativas
é chamada de reta de regressão (VIEIRA, 2011). Essa reta é determinada por
dois parâmetros, conforme a equação: yi = a + bxi.

Na equação da reta, yi representa um valor da variável resposta, a é


o primeiro parâmetro e é chamado de coeficiente linear ou intercepto, b é o
segundo parâmetro e é chamado de coeficiente angular ou de inclinação e xi
representa um valor da variável preditora (CALLEGARI-JACQUES, 2003). Os
dois parâmetros são estabelecidos com base nos valores das variáveis preditora
e resposta que foram mensurados nas unidades amostrais. A reta obtida pela
equação representa a menor distância entre todos os valores da variável resposta
observados e a própria reta.

A inclinação (b) mede quanto y muda com a mudança de uma unidade


em x (GOTELLI; ELLISON, 2011) e é representada graficamente pela inclinação
da reta (VIEIRA, 2011). Quando o valor de b é positivo, a reta é ascendente e
representa uma relação positiva entre as variáveis, ou seja, os valores da variável
resposta variam na mesma direção que os valores da variável preditora. Já quando

170
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES

o valor de b é negativo, a reta de regressão é descendente, o que corresponde


a uma relação negativa entre as variáveis, ou seja, a variável resposta varia em
uma direção contrária em relação à variável preditora. Quando b = 0, a reta é
paralela ao eixo x e isso significa que a variável preditora não exerce influência
sobre a variável resposta. A Figura 5 mostra as possibilidades de inclinação da
reta de regressão.

A inclinação é estimada por meio da equação:

(∑ x )× (∑ y )
n
i =1 i
n
i =1 i

n
x ×y −
i =1 i i
b= n
(∑ x )n 2

i =1 i

n
x −
2
i =1 i
n

Na equação, xi é o i-ésimo valor da variável X, que representa a variável


preditora, yi é o i-ésimo valor da variável Y, que corresponde à variável resposta.
Note que o numerador da equação corresponde à covariância entre as variáveis
preditora e resposta (variáveis X e Y) e é uma medida de quando as duas variáveis
variam sincronicamente. O denominador da equação é a variância da variável
preditora (variável X). Para resolver a equação podemos organizar os dados
conforme a tabela a seguir e obter os quatro somatórios necessários:

i) somatório dos valores da variável X (∑ni = 1 xi);


ii) somatório dos valores da variável Y (∑ni = 1 yi);
iii) somatório do quadrado dos valores da variável X (∑ni = 1 x2i);
iv) somatório da multiplicação de cada valor de xi por yi (∑ni = 1 xi x yi).

O intercepto (a) corresponde ao valor de y quando x é igual a zero


(GOTELLI; ELLISON, 2011). Portanto, equivale à altura em que a reta de regressão
corta o eixo y (VIEIRA, 2011). Quando o valor de a é positivo, a reta corta o eixo y
acima da origem. Já quando o valor de a é negativo, a reta passa pelo eixo y abaixo
da origem. Quando a = 0, a reta passa exatamente na origem dos eixos x e y. A
Figura 15 mostra as possíveis combinações dos valores de inclinação e intercepto
para determinar a reta de regressão.

=
O intercepto é estimado pela equação: a
i
=i 1 = i 1 i (∑ y ) - b × (∑ x ).
n n

n n
Note que o intercepto é estimado a partir das médias das variáveis
preditora e resposta e pela inclinação (b). Para calcular as médias, podemos
usar os somatórios de cada variável, organizados na Tabela 30. O intercepto é
mensurado na mesma unidade de medida que a variável resposta.

171
UNIDADE 3 | TESTES ESTATÍSTICOS II

TABELA 30 - ORGANIZAÇÃO DOS DADOS PARA CALCULAR A INCLINAÇÃO E O INTERCEPTO

Variável preditora (x) Variável preditora (x) x2i xi x yi

x1 y1 x21 x1 x y1

x2 y2 x22 x2 x y2

x3 y3 x23 x3 x y3

⁞ ⁞ ⁞ ⁞

xn yn x2n xn x yn

n n n n

∑ xi
i =1
∑ yi
i =1
∑ xi2
i =1
∑x ×y
i =1
i i

FONTE: A autora

FIGURA 15 - POSSIBILIDADES PARA A RETA DE REGRESSÃO (EM CINZA) A PARTIR DE


DIFERENTES VALORES DE INCLINAÇÃO (b) E INTERCEPTO (a)

FONTE: Adaptado de Vieira (2011)

172
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES

Com a inclinação (b) e intercepto (a) estimados, podemos utilizar a equação


da reta (^yi = a + bxi) para calcular qual o valor de ^y esperado para qualquer valor
de x. Note que os valores da variável resposta observados são representados por
y, enquanto os valores da variável resposta esperados segundo a equação da reta
são representados por ^y.

Para desenhar a reta de regressão no gráfico de dispersão, basta calcular


o valor de ^y para dois pontos extremos em x (um valor de x mais baixo e outro
x mais alto), plotar estes dois pontos no gráfico de dispersão e ligá-los por meio
de uma reta (CALLEGARI-JACQUES, 2003). Essa reta será a reta de regressão
(Gráfico 23).

Com a equação da reta podemos descobrir qual o valor de ^y para diferentes


valores de x que não foram amostrados. Quando a predição de ^y é feita para um
valor de x que está dentro do intervalo de valores de x que foram amostrados,
chamamos esse processo de interpolação (GOTELLI; ELLISON, 2011). Por
exemplo, imagine que o intervalo de valores da variável preditora X foi de 10 a
30, mas nenhuma unidade amostral com x = 25 foi amostrada. Com a equação
da reta podemos interpolar o valor de ^y quando x = 25. Quando a predição de ^y
é feita para um valor de x que está fora do intervalo de valores de x que foram
amostrados, o processo é denominado extrapolação (GOTELLI; ELLISON, 2011).
Por exemplo, se as unidades amostrais apresentaram x variando entre 10 e 30,
ao calcular qual o valor de ^y quando x = 40, estamos fazendo uma extrapolação.
A extrapolação é mais arriscada que a interpolação, pois não temos certeza se
existem unidades amostrais com o valor de x que foi extrapolado (VIEIRA, 2011).

A equação da reta é um modelo que busca descrever, de maneira


simplificada, o comportamento entre duas variáveis por meio de uma reta.
Geralmente, a reta não consegue capturar toda a variação existente nos dados e,
assim, nem todas as unidades amostrais ficam posicionadas exatamente sobre a
reta de regressão (Gráfico 23). Isso significa que existe um erro entre a predição
do modelo (equação da reta) e a variação real dos dados. Para descrever toda
variação existente nos dados, precisamos fazer uma adaptação na equação da reta
e acrescentar mais um parâmetro, da seguinte forma: yi = a + bxi + ei (GOTELLI;
ELLISON, 2011). O parâmetro ei é chamado de erro ou resíduo, representa a
diferença entre um valor observado para a variável resposta (^yi) e seu respectivo
valor estimado pela equação da reta (^yi). Em outras palavras, o erro é a variação
presente nos dados que não pode ser capturada pelos parâmetros a (intercepto)
e b (inclinação) da equação da reta. A seguir você irá aprender a calcular o erro e
avaliar se a reta de regressão representa bem a relação entre as variáveis preditora
e resposta.

173
UNIDADE 3 | TESTES ESTATÍSTICOS II

2.2 AJUSTE DA RETA DE REGRESSÃO LINEAR SIMPLES


Você já sabe que o modelo de regressão (a equação da reta) tenta descrever
a realidade, mas nem toda variação presente nas variáveis preditora e resposta
consegue ser capturada pelo modelo. A partir de agora, você irá aprender como
avaliar o quão bem o modelo de regressão representa os dados reais. Para isso,
trilharemos os seguintes passos:

1° Precisamos descobrir qual é o valor esperado para a variável resposta (^yi) a cada
valor observado da variável preditora (xi). Para chegar aos valores esperados
usaremos a equação da reta (^yi = a + bxi), bem como os valores calculados
para a inclinação (b) e o intercepto (a). Veja a terceira coluna da Tabela 5, que
demonstra como os valores esperados são obtidos.
2° Com os valores estimados para a variável resposta é possível determinar o erro
(e). O erro é dado pela diferença entre os valores observados da variável
resposta e os valores preditos pela equação da reta, ou seja, (ei = yi - ^yi. O erro
é calculado para cada unidade amostral da amostra. Veja a quarta coluna da
Tabela 31, que mostra como os valores de erro são obtidos.

O erro representa uma porção da variável resposta que não pode ser
explicada pela variável preditora do modelo de regressão. Para tentar explicar essa
porção da variável resposta, possivelmente outras variáveis preditoras deveriam
ser avaliadas. O erro pode ser interpretado como nossa ignorância acerca de
determinado processo biológico, que precisa ser investigada em estudos futuros.

3° Para avançarmos, precisamos relembrar a lógica da partição de variância, que


é a separação da variação total presente nos dados em diferentes conjuntos. Na
regressão linear simples, a variação total presente nos dados deve ser separada
em dois componentes: i) a variação explicada pelo modelo; ii) a variação
não explicada pelo modelo. Mas, antes de determinar cada componente,
precisamos calcular uma média geral para os valores observados da variável

resposta (yT). A média geral é dada pela equação: yT = ∑ i =i i . A equação indica


n
y
n
que devemos somar os valores observados da variável resposta (yi) e dividir
pelo número total de unidades amostrais do estudo (n).

4° O passo seguinte é determinar a variação total presente nos dados. A variação


total é representada pela soma de quadrados total da variável resposta (SQT),
que é calculada pelo somatório do quadrado da diferença de cada valor
observado da variável resposta (yi) em relação à média geral (yT) (Tabela 31),
conforme a equação (GOTELLI; ELLISON, 2011): SQT = ∑ni = 1 (yi - yT)2.
5° Na sequência, precisamos estabelecer quanto da variação total presente nos
dados foi explicada pelo modelo de regressão. A variação explicada pelo
modelo é representada pela soma de quadrados da regressão (SQR), que é
calculada pelo somatório do quadrado da diferença de cada valor esperado
da variável resposta (^yi) em relação à média geral (yT) (Tabela 31), conforme a
equação (GOTELLI; ELLISON, 2011): SQR = ∑ni = 1 (^yi - yT)2.

174
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES

Note que para chegar à soma de quadrados da regressão (SQR) é necessário


usar os valores estimados da variável resposta (^y). A SQR representa quanto a
equação da reta acertou na predição dos valores da variável resposta.

6° Também precisamos calcular quanto da variação total presente nos dados não
pode ser explicado pelo modelo de regressão. Essa proporção é representada
pela soma de quadrados do erro (SQE), que é calculada pelo somatório do
quadrado da diferença de cada valor observado da variável resposta (yi) em
relação ao valor estimado para a variável resposta (^yi ) (Tabela 31), conforme a
equação (GOTELLI; ELLISON, 2011): SQE = ∑ni = 1 (yi - ^yi )2.

Note que a soma de quadrados total da variável resposta (SQT) é igual à


soma de quadrados da regressão (SQR) e à soma de quadrados do erro (SQE), ou
seja, SQT = SQR + SQE .

TABELA 31 - ORGANIZAÇÃO DOS DADOS PARA CALCULAR UMA REGRESSÃO LINEAR SIMPLES

Variável Variável resposta


preditora Erro (e) SQT SQR SQE
(x) Observado Esperado
(y) y)
(^
x1 y1 ^
y1 = a + bx1 e1 = y1 - ^y1 (y1 - yT)2 (^y1 - yT)2 (y1 - ^y1)2
x2 y2 ^
y2 = a + bx2 e2 = y2 - ^y2 (y2 - yT)2 (^y2 - yT)2 (y2 - ^y2)2
x3 y3 ^
y3 = a + bx3 e3 = y3 - ^y3 (y3 - yT)2 (^y3 - yT)2 (y3 - ^y3)2
⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞
xn yn ^
yn = a + bxn en = yn - ^yn (yn - yT)2 (^yn - yT)2 (yn - ^yn)2
n n n

∑ ( yi - yT ) ∑ ( yˆ i - yT ) ∑ ( yi - yˆ i )
2 2 2

i =1 i =1 i =1

FONTE: A autora

7° Com as somas de quadrados calculadas, podemos determinar qual é o ajuste


entre a predição do modelo de regressão e os valores reais observados. Esse
ajuste é mensurado pelo coeficiente de determinação (r2), que representa
quanto da variação da variável resposta foi explicado pela variável preditora
(VIEIRA, 2011). O coeficiente de determinação é calculado pela divisão da
soma de quadrados da regressão pela soma de quadrados total, conforme a
SQR
equação: r 2 = .
SQT
O coeficiente de determinação varia de 0 a 1 e, se for multiplicado por
100, torna-se uma porcentagem e varia entre 0 a 100% (VIEIRA, 2011). Quanto
mais próximo de 1 ou 100%, maior a proporção da variação da variável resposta
que pode ser explicada pela variável preditora, ou seja, melhor o ajuste do
175
UNIDADE 3 | TESTES ESTATÍSTICOS II

modelo de regressão em relação aos dados observados. Note que o coeficiente


de determinação (r2) é o quadrado do coeficiente de correlação de Pearson (r)
(VIEIRA, 2011). Portanto, podemos transformar um coeficiente de correlação de
Pearson em coeficiente de determinação e vice-versa.

8° O último passo da avaliação do ajuste da reta de regressão é a execução de um


teste de hipóteses. Isto é necessário porque o intercepto (a) e a inclinação (b), os
dois parâmetros da equação da reta que permitem obter as somas de quadrados
e o coeficiente de determinação, são calculados com base em uma amostra
(GOTELLI; ELLISON, 2011). Geralmente não conseguimos amostrar toda a
população e, portanto, obtemos os valores das variáveis preditora e resposta
de apenas uma amostra. Isso significa que se fossem tomadas diferentes
amostras independentes da população, o intercepto e a inclinação iriam
variar entre as amostras, assim como as somas de quadrados e o coeficiente
de determinação. Portanto, é preciso estabelecer uma probabilidade de que a
soma de quadrados da regressão é maior que a soma de quadrados de erro,
dado a soma de quadrados total. Em outras palavras, temos que determinar
qual é a probabilidade de que a reta de regressão que descreve a relação entre
as duas variáveis é diferente de zero.

Para realizar o teste de hipóteses, precisamos organizar os dados em


uma tabela de Anova e utilizar a distribuição F como distribuição de referência,
conforme descrito a seguir:

a) Começamos determinando as hipóteses nula e alternativa. Na regressão linear


simples é a inclinação (b) que representa a relação entre as variáveis preditora
e resposta. Quando b ≅ 0 significa que a variável resposta é independente
da variável preditora. Assim, podemos definir H0: a variável preditora não
influencia a variável resposta, ou seja, yi = a + ei . Já H1: a variável preditora
influencia a variável resposta, ou seja, yi = a + bxi + ei .
b) Indicamos o nível crítico de significância (a).
c) Estabelecemos o valor crítico da estatística do teste, que neste caso é determinado
com base na tabela de distribuição F (Apêndice 3). Para chegar ao valor crítico
da estatística F é necessário indicar: o a; os graus de liberdade do numerador
(glN), que correspondem aos graus de liberdade da soma de quadrados da
regressão, que é igual a 1 (glN = 1); os graus de liberdade do denominador (glD),
que correspondem aos graus de liberdade da soma de quadrados do erro, que
são dados por n - 2. Assim, o valor de F crítico é dado por Fa; glN; glD.
d) Determinamos a estatística do teste F. Para chegar à estatística F basta preencher a
tabela de Anova e calcular os valores conforme as equações da tabela (Tabela 32).

176
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES

TABELA 32 - TABELA DE ANOVA PARA REGRESSÃO LINEAR SIMPLES

Graus de Soma de
Fonte de variação Variância Teste F
liberdade quadrados
n SQR s2
∑ ( yˆi - yT ) s R =
2 2
Regressão glR = 1 SQR
= F = 2R
i =1 glR s E
n SQE
∑ ( y - yˆ ) s2E =
2
Erro glE = n - 2 SQE
= i i
i =1 glE
n

∑( y - y )
2
Total glT = n - 1 SQT
= i T
i =1

FONTE: Adaptado de Gotelli; Ellison (2011)

Note que o numerador da estatística F, a variância da regressão (s2R),


representa uma medida de efeito, ou seja, quanto as predições do modelo de
regressão foram corretas em relação aos dados reais. Já o denominador da
equação, a variância do erro (s2E), representa quanto o modelo de regressão errou
nas predições. Note que quanto maior o valor da variância da regressão em
relação à variância do erro, melhor é o ajuste entre as predições do modelo de
regressão e os dados reais.

Após calcular a estatística do teste F, podemos encontrar o p-valor


correspondente por meio da função “DISTF” do Excel. Para isso, precisamos
informar o valor de F calculado (indicado por “x”) e os graus de liberdade do
numerador e do denominador. Basta digitar no Excel “=DISTF(x; glN; glD)”.

Para terminar, fazemos a inferência estatística comparando o valor de F


crítico com o valor de F calculado, bem como os valores de a e p-valor.

2.3 PRESSUPOSTOS DA REGRESSÃO LINEAR SIMPLES


A análise de regressão linear simples apresenta cinco pressupostos
(GOTELLI; ELLISON, 2011; VIEIRA, 2011). Primeiro, os valores da variável
resposta devem ser obtidos aleatoriamente da população e devem ser
independentes. Esse pressuposto precisa ser atendido no planejamento do
delineamento amostral. Segundo, a variável preditora deve ser mensurada
sem erro. Esse pressuposto é difícil de ser atendido, mas assumimos que o erro
associado à variável preditora é desprezível. Terceiro, a relação entre a variável
preditora e a variável resposta deve ser linear. Esse pressuposto pode ser checado
pela construção de um gráfico de dispersão ou pelo gráfico de resíduos (veja a
seguir como construir esse gráfico). Quarto, o erro, que representa a diferença
entre os valores observados e estimados da variável resposta (ei = yi - ^y i ), deve
ter distribuição normal ou aproximadamente normal. Esse pressuposto pode ser

177
UNIDADE 3 | TESTES ESTATÍSTICOS II

checado ao construir um histograma de frequências dos erros ou ao executar um


teste estatístico específico, por exemplo, o teste de normalidade de Shapiro-Wilk.
Quinto pressuposto, as variâncias devem ser homogêneas ao longo da reta de
regressão. Esse pressuposto também pode ser verificado pelo gráfico de resíduos.

O gráfico de resíduos permite avaliar graficamente os erros (também


chamados de resíduos) entre os valores observados e estimados para a variável
resposta. No eixo x do gráfico de resíduos são representados os valores estimados
da variável resposta (^y i ) e no eixo y são representados os erros (ei) (GOTELLI;
ELLISON, 2011) (observe a Figura 16).

Quando os pontos no gráfico de resíduos estão distribuídos de maneira


aleatória, sem apresentarem tendências, os pressupostos de linearidade e
homogeneidade de variâncias foram atendidos (GOTELLI; ELLISON, 2011)
(Figura 16A). Quando os pontos no gráfico de resíduos tendem a se distribuírem
mais acima ou mais abaixo da linha que marca e = 0, ou ainda, quando os pontos
formam uma curva, significa que o pressuposto de linearidade foi violado (Figura
16B e C). Já quando os pontos do gráfico de resíduos têm sua distribuição em
forma de cone, o pressuposto de homogeneidade de variâncias foi violado (Figura
16D). Além disso, o gráfico de resíduos também permite identificar outliers, que
são pontos que ficam muito afastados da nuvem dos demais pontos (Figura 16E).

178
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES

FIGURA 16 - GRÁFICOS DE RESÍDUOS

FONTE: Adaptado de Gotelli; Ellison (2011)

179
UNIDADE 3 | TESTES ESTATÍSTICOS II

3 VAMOS PRATICAR
Vejamos como a análise de regressão linear simples funciona na prática.
Muitos estudos observaram que existe uma relação entre o tamanho de ilhas e
a riqueza de espécies encontradas nas ilhas. Geralmente, ilhas maiores abrigam
maior riqueza de espécies. Na Tabela 33 são apresentados dados referentes ao
tamanho de 10 ilhas e a respectiva riqueza de espécies de répteis (dados fictícios).
Note que nesse exemplo as unidades amostrais são as ilhas e para cada ilha foram
coletadas informações sobre a riqueza de espécies e o tamanho da ilha, duas
variáveis quantitativas. A pergunta é: Quanto da variação na riqueza de espécies de
répteis pode ser explicada pelo tamanho das ilhas? Assim, a variável preditora é o
tamanho das ilhas e a variável resposta é a riqueza de espécies de répteis. O método
estatístico indicado para responder essa pergunta é a regressão linear simples.

Como na correlação, na regressão linear simples também é importante


construir um gráfico de dispersão com as duas variáveis (Gráfico 24). Pelo gráfico
de dispersão notamos que a relação entre as duas variáveis é linear, o que permite
realizar uma análise de regressão linear. Diferente dos outros métodos estatísticos
que você estudou até agora, na regressão linear checaremos os pressupostos
somente no final da análise, pois todos os pressupostos que precisam ser verificados
dependem dos valores estimados da variável resposta (^yi ) e do erro (ei).

GRÁFICO 24 - REPRESENTAÇÃO DO TAMANHO DAS ILHAS (m2) E RIQUEZA DE ESPÉCIES DE RÉPTEIS

FONTE: A autora

180
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES

Iremos começar estimando os dois parâmetros da equação da reta de


regressão: a inclinação (b) e o intercepto (a). Para calcular a inclinação precisamos
encontrar os valores dos quatro somatórios exigidos pela equação. Para isso,
podemos organizar os dados conforme a Tabela 7. Na sequência é só substituir os
valores na equação:

( ∑ x )× (∑ y )
n
i =1 i
n
i =1 i 749 × 88

n
x ×y −
i =1 i i 7693 −
b= n = 10 =
1101, 80
= 0, 098
( )
2 2

∑ i =1xi
n 749 11244, 90
67345 −

n
x −
2
i =1 i
10
n

Agora que chegamos ao valor da inclinação (b = 0,098), podemos calcular


o intercepto, conforme a seguinte equação:

a=
( ∑ y ) − b × ( ∑ x ) = 88 − 0, 098 × 749 = 8, 80 − 7, 34 = 1, 46
n
i =1 i
n
i =1 i

n n 10 10

Com a inclinação e o intercepto estimados, podemos construir a equação


da reta de regressão: ^y i = 1,46 + 0,098xi. Pela equação da reta, concluímos que a
relação entre as duas variáveis é positiva, pois o sinal da inclinação é positivo. A
inclinação b = 0,098) indica que a cada aumento de 1 m2 no tamanho das ilhas, a
riqueza de espécie de répteis aumenta em 0,098. O intercepto indica qual o valor
de y quando x = 0 e, para este exemplo, teríamos 1,46 espécies de répteis quando
o tamanho da ilha fosse de 0 m2.

Observando a Tabela 33, notamos que não foram amostradas ilhas com 50 m2.
Se quisermos saber qual a riqueza de espécies de répteis esperada para uma ilha com
50 m2, basta utilizar a equação da reta e fazer uma interpolação, da seguinte forma:
yi = a + bxi = 1,46 + 0,098 x 50 = 6,36. Pela equação da reta, podemos esperar que uma
^

ilha de 50 m2 tenha em torno de seis espécies de répteis. Se quisermos saber qual


a riqueza esperada para uma ilha de 150 m2, precisamos fazer uma extrapolação
da seguinte maneira: ^yi = a + bxi = 1,46 + 0,098 x 150 = 16,36. A expectativa é de que
uma ilha de 150 m2 abrigue em torno de 16 espécies de répteis.

Com a equação da reta de regressão estabelecida, a próxima etapa é


avaliar o quão bem o modelo de regressão representa os dados reais. Para isso,
trilharemos os seguintes passos:

1° Iniciaremos calculando a riqueza de espécies esperada para cada tamanho de


ilha, por meio da equação da reta. Por exemplo, para a ilha com 20 m2, a equação
da reta (^yi = a + bxi = 1,46 + 0,098 x 20 = 3,42) indica que a riqueza esperada é de
3,42 espécies. Pela Tabela 7, percebemos que a riqueza de espécies observada
na ilha com 20 m2 foi de três espécies. A diferença entre a riqueza observada

181
UNIDADE 3 | TESTES ESTATÍSTICOS II

e a riqueza esperada representa o erro da estimativa do modelo de regressão


em relação aos dados reais. Precisamos estimar a riqueza esperada para cada
tamanho de ilha amostrado, conforme a sexta coluna da Tabela 33.
2° Na sequência, é possível calcular o erro (ei), que é a diferença entre os valores
observados e os valores estimados pela equação da reta para a variável
resposta, conforme apresentado na sétima coluna da Tabela 33.
3° Antes de calcular as somas de quadrados, precisamos estabelecer qual é a
média geral para os valores da variável resposta observados (yT). A média

n
y 88
geral é dada pela equação: yT = i
= = 8,80 , ou seja, a riqueza média de
=i i

n 10
espécies de répteis nas ilhas é de 8,80 espécies.
4° Para calcular a soma de quadrados total da variável resposta (SQT), podemos
organizar os dados conforme a coluna 8 da Tabela 33. Observando a Tabela 33,
notamos que SQT = 121,60.
5° Para calcular a soma de quadrados da regressão (SQR), podemos organizar os
dados conforme a coluna 9 da Tabela 33. Verificando a Tabela 33, notamos que
SQR = 117,98.
6° Para calcular a soma de quadrados do erro (SQE), podemos organizar os
dados conforme a coluna 10 da Tabela 33. Olhando a Tabela 33, notamos que
SQE = 13,64.

TABELA 33 - ORGANIZAÇÃO DOS DADOS PARA ANÁLISE DE REGRESSÃO LINEAR SIMPLES

Tamanho (m2) Riqueza de espécies Esperado


Ilha x2i xi x yi
Variável x Variável y yi = a + bxi
^

1 20 3 400 60 y = 1,46 + 0,098 x 20 = 3,42


^
1

2 30 6 900 180 y = 1,46 + 0,098 x 30 = 4,40


^
2

3 45 4 2025 180 y = 1,46 + 0,098 x 45 = 5,87


^
3

4 60 7 3600 420 y = 1,46 + 0,098 x 60 = 7,34


^
4

5 75 10 5625 750 y = 1,46 + 0,098 x 75 = 8,81


^
5

6 85 9 7225 765 y = 1,46 + 0,098 x 85 = 9,79


^
6

7 96 12 9216 1152 y = 1,46 + 0,098 x 96 = 10,87


^
7

8 100 11 10000 1100 y = 1,46 + 0,098 x 100 = 11,26


^
8

9 115 14 13225 1610 y = 1,46 + 0,098 x 115 = 12,73


^
9

10 123 12 15129 1476 y = 1,46 + 0,098 x 123 = 13,51


^
10

∑ 749 88 67345 7693 –

Continua...

... continuação da Tabela 33

182
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES

n n n

∑ ( yi - yT ) ∑ ( yˆi - yT ) ∑ ( y - yˆ )
2 2 2
Erro (ei = yi - y )
^
i
SQT
= SQR
= SQE
= i i
i =1 i =1 i =1

e1 = (3 - 3,42) = - 0,42 (3 - 8,80)² = 33,64 (3,42 - 8,80)² = 28,94 (3 - 3,42)² = 0,18


e2 = (6 - 4,40) = 1,60 (6 - 8,80)² = 7,84 (4,40 - 8,80)² = 19,36 (6 - 4,40)² = 2,56
e3 = (4 - 5,87) = - 1,87 (4 - 8,80)² = 23,04 (5,87 - 8,80)² = 8,58 (4 - 5,87)² = 3,50
e4 = (7 - 7,34) = - 0,34 (7 - 8,80)² = 3,24 (7,34 - 8,80)² = 2,13 (7 - 7,34)² = 0,12
e5 = (10 - 8,81) = 1,19 (10 - 8,80)² = 1,44 (8,81 - 8,80)² = 0,00 (10 - 8,81)² = 1,42
e6 = (9 - 9,79) = - 0,79 (9 - 8,80)² = 0,04 (9,79 - 8,80)² = 0,98 (9 - 9,79)² = 0,62
e7 = (12 - 10,87) = 1,13 (12 - 8,80)² = 10,24 (10,87 - 8,80)² = 4,28 (12 - 10,87)² = 1,28
e8 = (11 - 11,26) = - 0,26 (11 - 8,80)² = 4,84 (11,26 - 8,80)² = 6,05 (11 - 11,26)² = 0,07
e9 = (14 - 12,73) = 1,27 (14 - 8,80)² = 27,04 (12,73 - 8,80)² = 15,44 (14 - 12,73)² = 1,61
e10 = (12 - 13,51) = - 1,51 (12 - 8,80)² = 10,24 (13,51 - 8,80)² = 22,22 (12 - 13,51)² = 2,28
0 121,60 107,98 13,64
FONTE: A autora

7° Agora que já calculamos as somas de quadrados, podemos estabelecer o


SQR 107,98
r2 =
coeficiente de determinação (r2), conforme a equação:= = 0,89.
SQT 121, 60
O coeficiente de determinação foi r2 = 0,89 ou 89%. Isso significa que o
tamanho das ilhas explica 89% da variação na riqueza de espécies de répteis.

8° Chegamos ao ponto em que precisamos determinar a probabilidade de que a


reta de regressão que descreve a relação entre as duas variáveis é diferente de
zero. Para isso, faremos um teste de hipóteses, conforme as etapas a seguir:

Determinamos as hipóteses nula e alternativa. H0: a riqueza de espécies


não é explicada pelo tamanho das ilhas, ou seja, yi = a + ei. H1: a riqueza de espécies
é explicada pelo tamanho das ilhas, ou seja, yi = a + bxi + ei.

Indicamos o nível crítico de significância que será de 5% (a = 0,05).

Estabelecemos o valor crítico da estatística do teste, que é determinado com


base: no a = 0,05; nos graus de liberdade do numerador (glN), que correspondem
aos graus de liberdade da soma de quadrados da regressão, que é igual a 1;
nos graus de liberdade do denominador (glD), que correspondem aos graus de
liberdade da soma de quadrados do erro, dados por n - 2 = 10 - 2 = 8. Consultando
a tabela de distribuição F (Apêndice 3), o valor de F crítico é t0,05; 1; 8 = 5,32.

Determinamos a estatística do teste F completando a tabela de Anova


(Tabela 34).

183
UNIDADE 3 | TESTES ESTATÍSTICOS II

TABELA 34 - TABELA DE ANOVA PARA REGRESSÃO LINEAR SIMPLES DA RIQUEZA DE ESPÉCIES


DE RÉPTEIS E TAMANHO DAS ILHAS

Fonte de Graus de Soma de


Variância Teste F
variação liberdade quadrados
SQR s2R
s2R = F=
glR s2E
Regressão glR = 1 SQR = 107,98
107,98 107,98
= =
s 2 R = 107,98 F = 63,52
1 1, 70

SQE
s2E =
glE = n - 2 glE
Erro SQE = 13,64
glE = 10 - 2 = 8 13, 64
s2E
= = 1, 70
81
glT = n - 1
Total SQT = 121,60
glT = 10 - 1 = 9
FONTE: A autora

a) Podemos determinar o p-valor correspondente ao valor de F calculado por


meio da função “DISTF” do Excel digitando “=DISTF(63,50; 1; 8)”. O p-valor
encontrado foi menor que 0,01.
b) Agora podemos fazer a inferência estatística. O valor de F calculado foi maior
que o F crítico, portanto, rejeitamos a hipótese nula. O p-valor (p < 0,01) foi
menor que nível crítico de significância (a = 0,05), portanto, também rejeitamos
a hipótese nula.

Antes de redigir a conclusão, é importante checar os pressupostos da


análise de regressão linear simples. Começamos construindo um gráfico de
resíduos, no qual são representados os valores esperados da variável resposta
(eixo x) e os valores dos erros (eixo y), conforme o Gráfico 25. Observamos que os
pontos se distribuem aleatoriamente pelo gráfico de resíduos, sem tendências, o
que indica que os pressupostos de linearidade e de homogeneidade de variâncias
foram atendidos.

184
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES

GRÁFICO 25 - GRÁFICO DE RESÍDUOS

FONTE: A autora

Assumimos que os valores da variável resposta foram obtidos


aleatoriamente da população e são independentes. Esse pressuposto deve ser
atendido no delineamento amostral. Também assumimos que a variável preditora
foi mensurada sem erro. O último pressuposto a ser checado é se os erros têm
distribuição normal. A partir do histograma de frequências dos erros, notamos
que estes têm distribuição aproximadamente normal (Gráfico 26).

GRÁFICO 26 - HISTOGRAMA DE FREQUÊNCIA DOS ERROS

FONTE: A autora

185
UNIDADE 3 | TESTES ESTATÍSTICOS II

Com todos os pressupostos checados e atendidos, podemos redigir


a conclusão da análise. Concluímos que o tamanho das ilhas explica 89% da
variação na riqueza de espécies de répteis nas ilhas. À medida que o tamanho da
ilha aumenta em 1 m2, esperamos que a riqueza de espécies aumente em 0,098
(^yi = 1,46 + 0,098xi). Essa relação entre o tamanho das ilhas e riqueza de espécies
dificilmente teria sido observada se a hipótese nula fosse verdadeira (t1; 8 = 63,52,
p < 0,01). Esta conclusão também pode ser sintetizada em um gráfico de dispersão
das duas variáveis que deve conter a reta de regressão, a equação da reta e os
valores do coeficiente de determinação (r2) e p-valor, conforme o Gráfico 27.

GRÁFICO 27 - REPRESENTAÇÃO DO TAMANHO DAS ILHAS (m2) E RIQUEZA DE ESPÉCIES DE RÉPTEIS

FONTE: A autora

DICAS

Caro acadêmico, para responder algumas perguntas biológicas pode ser


interessante investigar a influência de múltiplas variáveis preditoras sobre uma variável
resposta. Quando isso acontecer, e se a relação entre as variáveis for linear, você terá que usar
um modelo de regressão chamado de regressão linear múltipla. Você pode ler mais sobre
esse método estatístico nos livros de Gotelli e Ellison (2011) e de Pagano e Gauvreau (2013).

186
RESUMO DO TÓPICO 2

Neste tópico, você aprendeu que:

• A regressão linear simples permite descrever a relação linear entre duas


variáveis quantitativas por meio de uma reta. Este método foi desenvolvido
por Francis Galton.

• Na regressão linear simples temos uma variável preditora e uma variável


resposta. A variável preditora influencia outra variável. Já a variável resposta
é a variável que sofre influência da variável preditora.

• A reta de regressão, que representa a relação linear entre duas variáveis


quantitativas, é determinada pela equação: yi = a + bxi.

• A inclinação (b) mede quanto y muda com a mudança de uma unidade em x.


A inclinação é estimada por:

(∑ x )× (∑ y )
n
i =1 i
n
i =1 i

n
x ×y −
i =1 i i
b= n
(∑ x ) n 2

i =1 i

n
x −
2
i =1 i
n

• O intercepto (a) corresponde ao valor de y quando x é igual a zero. O intercepto


é estimado por:

a=
( ∑ y)
−b×
n
( ∑ x)
i =1 i
n
i =1 i

n n

• Com a equação da reta podemos calcular qual o valor de ^y esperado para


qualquer valor de x. Quando a predição de ^y é feita para um valor de x que
está dentro do intervalo de valores de x amostrados, estamos fazendo uma
interpolação. Quando a predição de ^y é feita para um valor de x que está fora do
intervalo de valores de x amostrados, o processo é denominado extrapolação.

• Nem sempre a inclinação e o intercepto conseguem descrever toda variação


existente nos dados e, por isso, precisamos incluir mais um parâmetro na
equação: yi = a + bxi + ei. O ei é chamado de erro ou resíduo, representa a
variação presente nos dados que não pode ser capturada pela inclinação e pelo
intercepto.
187
• Para avaliar quão bem o modelo de regressão representa os dados reais
precisamos: i) calcular os valores esperados da variável resposta (^yi ), por meio
da equação da reta; ii) calcular o erro, conforme: ei = yi - ^yi ; iii) calcular an média
geral para os valores observados da variável resposta, por: yT =
∑ y
i =i i
; iv)
n
determinar a soma de quadrados total da variável resposta, por: SQT = ∑ (yi - yT)2; v)
n
i= 1
determinar a soma de quadrados da regressão, por: SQR = ∑ni = 1 (^yi - yT)2; vi) calcular a
soma de quadrados do erro, por:SQR = ∑ni= 1 (^yi - yT)2; vii) calcular o coeficiente de
SQR
determinação, por: r 2 = ; viii) realizar um teste de hipóteses para encontrar
SQT
a probabilidade de que a reta de regressão que descreve a relação entre as duas
variáveis é diferente de zero.

• Os erros (ei), também chamados de resíduos, representam a porção da variável


resposta que não pode ser explicada pela variável preditora.

• O coeficiente de determinação (r2) representa quanto da variação da variável


resposta foi explicado pela variável preditora. Ele varia de 0 a 1 (ou 0 a 100%).
Quanto mais próximo de 1 ou 100%, melhor o ajuste do modelo de regressão
em relação aos dados reais.

• O teste de hipóteses para regressão linear simples é baseado na estatística F. É


necessário preencher a tabela de Anova, como os graus de liberdade, as somas
de quadrados, as variâncias da regressão e do erro para chegar à estatística F.

• Os pressupostos da regressão linear simples são: i) os valores da variável


resposta devem ser obtidos aleatoriamente da população e devem ser
independentes; ii) a variável preditora deve ser mensurada sem erro; iii) a
relação entre a variável preditora e a variável resposta deve ser linear; os erros
devem ter distribuição normal ou aproximadamente normal; v) as variâncias
devem ser homogêneas ao longo da reta de regressão.

• O gráfico de resíduos permite avaliar graficamente os erros entre os valores


observados e estimados para a variável resposta. Quando os pontos se
distribuem de forma aleatória pelo gráfico de resíduos, os pressupostos da
análise foram atendidos. Quando os pontos se distribuírem mais acima ou
mais abaixo da linha que marca e = 0, ou quando os pontos formam uma curva,
o pressuposto de linearidade foi violado. Quando os pontos se distribuem em
forma de cone, o pressuposto de homogeneidade de variâncias foi violado.
Outliers também podem ser detectados pelo gráfico de resíduos.

188
AUTOATIVIDADE

Caro acadêmico! Para fixar melhor o conteúdo estudado, vamos exercitar um


pouco. Leia as questões a seguir e responda-as em seu caderno de estudos.
Bom trabalho!

1 Observe os três casos abaixo e interprete os resultados da regressão linear


simples de acordo com a inclinação e intercepto da equação da reta; o
coeficiente de determinação (r2) e o p-valor apresentados.

2 A altitude é uma variável que influencia a estrutura e composição de espécies


florestais. A densidade, que representa o número de indivíduos (plantas) por
hectare, é uma variável relacionada à estrutura florestal que é afetada pela
altitude. A tabela abaixo apresenta 15 locais em diferentes altitudes na região
da Floresta Ombrófila Mista e suas respectivas densidades de árvores. A partir
dos dados da tabela, faça o que é solicitado:

Densidade de árvores (número de


Local Altitude (m)
indivíduos por hectare)
1 750 400
2 785 485
3 800 530
4 825 525

189
5 850 510
6 865 565
7 870 590
8 874 574
9 925 585
10 940 640
11 960 690
12 990 690
13 1010 700
14 1025 725
15 1050 780

a) Com base no que você leu sobre a relação entre a altitude e a densidade de
árvores, defina qual das duas variáveis é a preditora e qual é a resposta em
uma análise de regressão linear simples.
b) Construa um gráfico de dispersão para as duas variáveis. Coloque a
variável preditora no eixo x do gráfico e a variável resposta no eixo y.
c) Caso o gráfico de dispersão mostre que a relação entre as duas variáveis é
linear, determine a inclinação e intercepto e construa a equação da reta de
regressão.
d) Utilize a equação da reta de regressão e calcule qual o valor esperado para
a variável resposta (^yi ) em cada valor observado da variável preditora.
e) Calcule o erro entre cada valor da variável resposta observado e estimado
pela equação da reta (εi).
f) Calcule a média geral para os valores observados da variável resposta (yT).
g) Calcule a soma de quadrados total, a soma de quadrados da regressão e a
soma de quadrados do erro.
h) Calcule o coeficiente de determinação.
i) Faça o teste de hipóteses para a análise de regressão linear simples e siga
as etapas: i) determine as hipóteses nula e alternativa; ii) estabeleça o nível
crítico de significância; iii) encontre o valor crítico da estatística F com base
no a, nos graus de liberdade do numerador e do denominador e consultando
o Apêndice 3; iv) preencha a tabela de Anova (Tabela 6) e obtenha a estatística
F; v) encontre o p-valor correspondente ao valor de F calculado por meio da
função “DISTF” do Excel; vi) faça a inferência estatística.
j) Cheque os pressupostos da análise de regressão linear simples.
k) Conclua sobre a relação entre a altitude e a densidade de árvores e interprete
a equação da reta de regressão, o coeficiente de determinação e o p-valor.
l) No gráfico de dispersão que você construiu anteriormente, inclua a reta de
regressão, a equação da reta e os valores do coeficiente de determinação e
do p-valor.

190
UNIDADE 3
TÓPICO 3

QUI-QUADRADO E OUTROS TESTES


NÃO PARAMÉTRICOS

1 INTRODUÇÃO
Todos os métodos estatísticos que você estudou até agora, como o teste Z,
o teste T pareado, o teste T para amostras independentes, a análise de variância,
o coeficiente de correlação de Pearson e a regressão linear simples, são testes
estatísticos paramétricos. Os testes paramétricos utilizam algum parâmetro da
distribuição, por exemplo, a média e a variância, ou estimativas desses parâmetros
para calcular a estatística do teste. A aplicação dos testes paramétricos exige que as
variáveis investigadas tenham distribuição normal ou aproximadamente normal,
bem como apresentem homogeneidade das variâncias (CALLEGARI-JACQUES,
2003; PAGANO; GAUVREAU, 2013).

2 TESTES PARAMÉTRICOS X TESTES


NÃO PARAMÉTRICOS
Nem sempre os pressupostos de normalidade e de homogeneidade
de variâncias são atendidos. Nestes casos, podemos transformar as variáveis
investigadas e avaliar se tais valores transformados atendem aos pressupostos.
Caso os pressupostos sejam atendidos, podemos usar os valores obtidos após a
transformação para realizar a análise estatística. As transformações comumente
utilizadas para dados biológicos são (GOTELLI; ELLISON, 2011):

a) Transformação logarítmica: cada valor observado da variável é substituído pelo


seu logaritmo, ou seja, ^xi = log xi. Na equação, xi representa cada valor observado
da variável X e ^x i é o respectivo valor transformado. Geralmente usamos o
logaritmo natural.
b) Transformação da raiz quadrada: cada valor observado da variável é substituído
pela sua raiz quadrada, ou seja, xˆi = xi . Geralmente essa transformação é usada
para variáveis quantitativas discretas, por exemplo, dados de contagens.
c) Transformação do arcoseno: cada valor observado da variável é substituído
pelo seu arcoseno da raiz quadrada, ou seja, xˆi = arcoseno xi . Essa transformação
geralmente é usada para variáveis qualitativas nominais expressas em proporções.
d) Transformação inversa: cada valor observado é substituído pelo seu inverso,
x i = 1/xi. Geralmente essa transformação é utilizada para variáveis expressas
^

em taxas.

191
UNIDADE 3 | TESTES ESTATÍSTICOS II

e) Transformação Box-Cox: o valor transformado é calculado usando a equação


xi = (xli - 1/l, quando l ≠ 0. Podemos usar diferentes valores de l até encontrar os
^

valores transformados que melhoram a distribuição das variáveis.

Essas transformações podem ser executadas no Excel ou em programas


estatísticos específicos, por exemplo, o programa PAST (Paleontological Statistic
Software) (HAMMER; HARPER; RYAN, 2001).

Existem casos em que, mesmo transformando as variáveis, os pressupostos


dos testes paramétricos não são atendidos. Quando isso acontece, precisamos
utilizar um teste não paramétrico (CALLEGARI-JACQUES, 2003; PAGANO;
GAUVREAU, 2013). Nos testes não paramétricos não é necessário conhecer
a distribuição da variável investigada e os pressupostos de normalidade e
homogeneidade de variâncias não precisam ser atendidos (CALLEGARI-
JACQUES, 2003). A lógica dos testes não paramétricos baseia-se em ordenar os
valores da variável investigada e atribuir um posto para cada valor. O posto é
um número (por exemplo 1, 2, 3 etc.) que corresponde à posição de determinado
valor da variável na ordenação de todos os valores. A estatística dos testes não
paramétricos não utiliza os valores observados da variável, mas os valores dos
postos. Assim, valores extremos, que são problemáticos nos testes paramétricos
por influenciarem o cálculo da média e da variância, deixam de ser importantes
nos testes não paramétricos.

Vejamos um exemplo de como os postos são definidos: Imagine que um


pesquisador estava investigando a riqueza de espécies de pequenos roedores em
áreas com e sem distúrbios antrópicos. Os dados coletados em cada amostra são
muito variáveis e apresentam valores extremos (veja a Tabela 35). Por exemplo,
42 espécies é um valor extremo na amostra sem distúrbio. Para definir os postos,
primeiro precisamos identificar quais valores de riqueza de espécies pertencem
a cada área. Na sequência, juntamos os valores de riqueza de espécies das duas
amostras e ordenamos. O menor valor de riqueza será o posto 1, a segunda
menor riqueza será o posto 2 e assim por diante. Quando os valores de riqueza
se repetem, precisamos fazer a média entre os postos ocupados por esses valores
repetidos e atribuir o valor médio como posto dos valores repetidos. Por exemplo,
para a riqueza de 10 espécies, que aparece duas vezes, o posto correspondente é
5,5, pois é a média entre os postos 5 e 6. Isso também acontece com os valores de
16 e 17 espécies. Depois de definir o posto para cada valor de riqueza, precisamos
separar as unidades amostrais de acordo com cada área (com e sem distúrbios).
A organização final dos postos é apresentada na Tabela 35. O teste estatístico
não paramétrico utiliza os valores dos postos para testar se as duas amostras
diferem em relação à riqueza de espécies. Observe que, em geral, os postos da
amostra com distúrbios apresentam valores menores em comparação aos valores
dos postos da amostra sem distúrbios.

192
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS

TABELA 35 - ORGANIZAÇÃO DOS DADOS PARA DEFINIR OS POSTOS EM UM TESTE NÃO


PARAMÉTRICO

Com distúrbios Sem distúrbios


Unidade Riqueza de Unidade Riqueza de
Posto Posto
amostral espécies amostral espécies
1 1 1 11 14 9
2 7 2 12 16 11,5
3 8 3 13 17 13,5
4 9 4 14 17 13,5
5 10 5,5 15 18 15
6 10 5,5 16 19 16
7 12 7 17 20 17
8 13 8 18 21 18
9 15 10 19 23 19
10 16 11,5 20 42 20
FONTE: Adaptado de Callegari-Jacques (2003)

Para testar hipóteses com testes não paramétricos, seguimos a mesma


lógica de um teste de hipóteses paramétrico, ou seja, precisamos:

i) definir as hipóteses nula e alternativa;


ii) estabelecer o nível crítico de significância;
iii) determinar o valor crítico da estatística do teste não paramétrico;
iv) calcular a estatística do teste não paramétrico;
v) comparar os valores crítico e calculado da estatística do teste;
vi) fazer a inferência estatística (PAGANO; GAUVREAU, 2013).

2.1 VANTAGENS E DESVANTAGENS DOS


TESTES NÃO PARAMÉTRICOS
Os testes não paramétricos apresentam algumas vantagens e outras
desvantagens em relação aos testes paramétricos (CALLEGARI-JACQUES,
2003; PAGANO; GAUVREAU, 2013). Vamos começar com as vantagens. Os
testes não paramétricos são úteis quando não conhecemos a distribuição da
variável investigada ou, ainda, quando a variável não tem distribuição normal ou
homogeneidade de variância. A ordenação dos dados em postos evita que valores
extremos muito baixos ou muito altos influenciem o resultado da análise.

Em relação às desvantagens, não se recomenda usar um teste não


paramétrico quando os pressupostos de um teste paramétrico, como a normalidade
e homogeneidade de variâncias, são atendidos, pois os testes não paramétricos são
menos eficientes em detectar diferenças. Isso quer dizer que, quando a hipótese
nula deve ser rejeitada porque existe diferença entre os grupos comparados, um
teste não paramétrico precisa de um tamanho amostral maior para encontrar essa

193
UNIDADE 3 | TESTES ESTATÍSTICOS II

diferença em comparação aos testes paramétricos (CALLEGARI-JACQUES, 2003;


PAGANO; GAUVREAU, 2013). Outra desvantagem é a perda de informação
da variabilidade dos dados ao transformar os valores observados da variável
em postos (CALLEGARI-JACQUES, 2003; PAGANO; GAUVREAU, 2013).
Portanto, sempre que os pressupostos forem atendidos, recomenda-se o uso dos
testes paramétricos, mas se os pressupostos não forem atendidos, um teste não
paramétrico deve ser conduzido.

2.2 ALGUNS TESTES NÃO PARAMÉTRICOS


A seguir você irá estudar os testes não paramétricos mais comuns, suas
aplicações e pressupostos. Você também verá quais são os testes paramétricos
equivalentes aos testes não paramétricos estudados. Não entraremos em detalhes
sobre os cálculos dos testes não paramétricos, mas para estudar mais sobre isso
você pode consultar os livros de Callegari-Jacques (2003) e Pagano e Gauvreau
(2013). Todos esses testes estatísticos podem ser calculados à mão, no Excel ou em
programas estatísticos específicos, como o PAST.

2.2.1 Teste T de Wilcoxon


O teste T de Wilcoxon é o teste não paramétrico equivalente ao teste T
pareado. Assim, o objetivo do teste é avaliar se existe diferença entre amostras
pareadas. Esse teste foi desenvolvido por Wilcoxon, em 1945 (CALLEGARI-
JACQUES, 2003).

Tanto no teste T de Wilcoxon quanto no teste T pareado, o cálculo da


estatística do teste é baseado na diferença entre os valores de cada par de amostras
pareadas. No teste T pareado, a distribuição das diferenças deve ser normal. O
teste T de Wilcoxon não tem essa exigência, mas a distribuição das diferenças
deve ser simétrica, ou seja, metade dos postos equivalentes às diferenças deve
ter valores baixos e metade dos pontos deve ter valores altos (CALLEGARI-
JACQUES, 2003). As amostras devem ser aleatórias em ambos os testes.

2.2.2 Teste U de Wilcoxon-Mann-Whitney


O teste U de Wilcoxon-Mann-Whitney é o teste não paramétrico
equivalente ao teste T para amostras independentes. Portanto, ele é usado para
testar se duas amostras diferem entre si em relação a um fator. Esse método foi
desenvolvido primeiro por Frank Wilcoxon, em 1945, mas só podia ser aplicado
quando as amostras tivessem o mesmo tamanho amostral (CALLEGARI-
JACQUES, 2003). Em 1947, Henry Berthold Mann e Donald Ransom Whitney
fizeram uma generalização do teste para que pudesse ser aplicado para amostras
com tamanhos diferentes.

194
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS

Para executar o teste U não é necessário que amostras tenham distribuição


normal e homogeneidade de variâncias, como no teste T para amostras
independentes (PAGANO; GAUVREAU, 2013). No entanto, o teste U exige que
as amostras sejam aleatórias. Além disso, é importante que as duas amostras
tenham a distribuição com mesma forma geral (PAGANO; GAUVREAU, 2013).
Por exemplo, se uma amostra tem distribuição assimétrica à esquerda, a outra
amostra também precisa ser assimétrica à esquerda. A variável investigada pode
ser quantitativa contínua ou discreta ou qualitativa ordinal.

2.2.3 Teste de Kruskal-Wallis


O teste de Kruskal-Wallis é o teste não paramétrico equivalente à análise
de variância. Ele é uma extensão do teste U de Wilcoxon-Mann-Whitney e pode
ser aplicado para testar se três ou mais amostras diferem entre si em relação a
um fator (CALLEGARI-JACQUES, 2003).

No teste de Kruskal-Wallis as amostras não precisam ter distribuição


normal ou homogeneidade de variância, como é exigido pela análise de
variância (CALLEGARI-JACQUES, 2003). Todavia, as amostras devem ser
aleatórias. Este método estatístico indica se existe diferença entre pelo menos
um par de amostras que estão sendo comparadas. Para descobrir quais pares
de amostras são diferentes entre si é necessário executar um teste a posteriori.
O teste a posteriori não paramétrico que pode ser utilizado é o teste de Dunn
(CALLEGARI-JACQUES, 2003).

2.2.4 Coeficiente de correlação de Spearman

O coeficiente de correlação de Spearman é o método não paramétrico


equivalente ao coeficiente de correlação de Pearson. Ele é usado com o objetivo
de avaliar se duas variáveis estão correlacionadas. Este método é bastante
antigo, foi desenvolvido em 1904 (CALLEGARI-JACQUES, 2003). Pode ser
aplicado para variáveis quantitativas contínuas ou discretas ou para variáveis
qualitativas ordinais.

O coeficiente de correlação de Spearman é simbolizado por rs e sua


interpretação é semelhante ao coeficiente de correlação de Pearson. O coeficiente
de Spearman varia de -1 ≤ rs ≤ +1. Quanto mais próximo de -1 o coeficiente de
correlação for, mais negativa é a correlação; quanto mais próximo de 1, mais
positiva é a correlação, e quando rs ≅ 0, a correlação é nula (CALLEGARI-
JACQUES, 2003). Como os valores das variáveis são substituídos por postos, o
coeficiente de Spearman indica a correlação entre postos.

195
UNIDADE 3 | TESTES ESTATÍSTICOS II

Para calcular um coeficiente de correlação de Spearman é necessário que


as variáveis tenham sido obtidas de uma amostra aleatória. Os pressupostos
de linearidade, normalidade e homogeneidade de variância, exigidos para se
obter o coeficiente de correlação de Pearson, não precisam ser atendidos para
calcular o coeficiente de correlação de Spearman (CALLEGARI-JACQUES,
2003; PAGANO; GAUVREAU, 2013).

3 TESTE QUI-QUADRADO
Todos os testes que você estudou até agora são aplicados quando ambas
as variáveis são quantitativas, como acontece na correlação e na regressão linear
simples, ou uma das variáveis é quantitativa e a outra é qualitativa, como no
teste T e análise de variância. A partir de agora, você irá estudar um método
estatístico em que as duas variáveis avaliadas são qualitativas (também chamadas
de variáveis categóricas). Esse método é o denominado qui-quadrado e é um
teste não paramétrico utilizado para avaliar se duas variáveis qualitativas são
independentes (GOTELLI; ELLISON, 2011). Este método foi desenvolvido por
Karl Pearson, em 1899 (CALLEGARI-JACQUES, 2003).

Para aplicar o teste qui-quadrado, precisamos organizar os dados das


duas variáveis qualitativas em uma tabela de contingência (você já estudou como
montar uma tabela de contingência no Tópico 1 da Unidade 1). Na tabela de
contingência, as colunas representam as categorias de uma variável qualitativa e as
linhas representam as categorias de outra variável qualitativa. Veja a organização
genérica de uma tabela de contingência na Tabela 36, em que a variável qualitativa
1 apresenta as categorias 1 e 2, enquanto a variável qualitativa 2 apresenta as
categorias 3 e 4. As letras de a a d representam o número de unidades amostrais
observadas na combinação entre duas categorias. No final de cada linha e de
cada coluna anotamos o número total de unidades amostrais observadas em cada
categoria das variáveis qualitativas. Por exemplo, para saber quantas unidades
amostrais foram observadas na categoria 3 da variável 2, basta somar a e b, que
correspondem aos valores da primeira linha da tabela. No canto inferior direito
temos n, que é o número total de unidades amostrais avaliadas no estudo.

196
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS

TABELA 36 - ORGANIZAÇÃO DE UMA TABELA DE CONTINGÊNCIA PARA APLICAR O TESTE


QUI-QUADRADO

FONTE: Adaptado de Pagano e Gauvreau (2013)

A lógica do teste qui-quadrado consiste em comparar o número de


unidades amostrais observado em cada categoria com o número de unidades
esperado (GOTELLI; ELLISON, 2011). O número de unidades observado
representa os dados coletados em campo. Já o esperado são os valores que
deveriam ser encontrados se a distribuição das unidades amostrais acontecesse
ao acaso pelas categorias. Por exemplo, se existe algum motivo biológico que
faz com que unidades amostrais que pertencem às categorias 1 e 3 sejam mais
frequentes, o valor observado para a (a representa as categorias 1 e 3, veja
Tabela 36) será maior que o valor esperado se a distribuição das unidades
ocorresse ao acaso.

Vamos estudar como calcular o número de unidades amostrais


esperado em cada categoria se a distribuição fosse ao acaso. Para encontrar
o valor esperado para a, por exemplo, precisamos multiplicar o número total
de unidades amostrais da linha à qual a pertence (que é a + b) pelo total de
unidades amostrais da coluna à qual a pertence (que é a + c), depois dividir
(a + b) × (a + c)
pelo total de unidades amostrais (n), ou seja, EEa ==( a + b ) ×n ( a + c ) . Na equação, Ea
n
a

é o valor esperado para a. Simplificando, cada valor esperado (Ei) é obtido


total
total da linha
da linha ×total
×total da coluna da coluna
por: EEi i == . Observe a Tabela 37, que indica como cada valor
n
n
esperado é calculado. Note que os somatórios no final de cada linha e de cada
coluna e o número total de unidades amostrais (n) se mantêm iguais à tabela
de valores observados (Tabela 36).

197
UNIDADE 3 | TESTES ESTATÍSTICOS II

TABELA 37 - ORGANIZAÇÃO DE UMA TABELA DE CONTINGÊNCIA PARA CALCULAR OS


VALORES ESPERADOS

FONTE: Adaptado de Pagano e Gauvreau (2013)

O teste qui-quadrado tem como distribuição de referência a distribuição


qui-quadrado (que é simbolizada por X2) (CALLEGARI-JACQUES, 2003;
PAGANO; GAUVREAU, 2013). A forma da distribuição qui-quadrado varia
conforme o número de categorias que a variável qualitativa apresenta. Quanto
maior o número de categorias, maiores serão os graus de liberdade (você irá
aprender a calcular os graus de liberdade a seguir). A distribuição qui-quadrado
para poucos graus de liberdade é bastante assimétrica à direita, mas conforme o
número de graus de liberdade aumenta, a distribuição se torna mais simétrica.
A distribuição qui-quadrado, assim como a distribuição F, é composta apenas
por valores positivos, ou seja, os valores variam de zero até o infinito positivo. A
área sob a curva da distribuição qui-quadrado equivale a 1. Para encontrar um
valor crítico de X2 é necessário consultar a tabela de distribuição qui-quadrado
(Apêndice 5, no final deste caderno) e informar o nível crítico de significância
e os graus de liberdade. Os graus de liberdade são calculados por: gl = (número
de linhas - 1) × (número de colunas - 1). Lembrando que cada linha e cada coluna
representam uma categoria de uma variável qualitativa.

Para realizar um teste qui-quadrado, precisamos passar todos os passos


de um teste de hipóteses:

1° Precisamos definir as hipóteses nula e alternativa. Neste caso, H0: não existe
relação entre as duas variáveis qualitativas, ou seja, as duas variáveis são
independentes. H1: as duas variáveis são relacionadas, ou seja, as duas variáveis
não são independentes.
2° Precisamos definir o nível crítico de significância (a).
3° Estabelecemos o valor crítico da estatística do teste qui-quadrado. Para isso,
é necessário consultar a tabela de distribuição qui-quadrado (Apêndice 5) e
informar o a e os graus de liberdade. Portanto, o valor crítico é dado por X a2 ; gl .
4° Calculamos a estatística do teste qui-quadrado, mas antes de calcular a
estatística do teste, é necessário estabelecer todos os valores esperados,
conforme apresentado na Tabela 11. Com os valores esperados calculados,
( Oi - Ei )
r 2

podemos aplicar a equação do qui-quadrado: X = ∑ 2


.
i =1 Ei
Na equação, i representa cada célula da tabela de contingência, ou seja,
cada valor de a a d (Tabela 36), enquanto r é o número total de células da tabela. Oi
198
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS

é o número de unidades amostrais observado em cada célula e Ei é o número de


unidades amostrais esperado em cada célula. A equação informa que, para cada
célula da tabela de contingência, devemos calcular o quadrado da diferença entre
cada valor observado e esperado e dividir pelo valor esperado. Na sequência,
devemos somar o resultado da divisão de todas as células.

5° Após calcular a estatística do teste qui-quadrado, podemos encontrar o p-valor


associado. A maneira mais fácil de chegar ao p-valor é usar a função “DIST.
QUI” do Excel. Basta informar a estatística do teste qui-quadrado, representada
por “x” e os graus de liberdade, da seguinte forma: “=DIST.QUI(x; gl)”.
6° O último passo é fazer a inferência estatística comparando os valores de x2
crítico e calculado ou os valores de a e p-valor.

3.1 PRESSUPOSTOS DO TESTE QUI-QUADRADO


Só podemos aplicar um teste qui-quadrado quando o tamanho amostral
é grande (PAGANO; GAUVREAU, 2013). Tamanhos amostrais pequenos geram
valores esperados (Ei) baixos. Um valor esperado baixo tende a aumentar o
resultado da estatística qui-quadrado e, assim, se muitos valores esperados
forem baixos, a estatística do teste será inflada (GOTELLI; ELLISON, 2011).
Segundo Gotelli e Ellison (2011), o tamanho amostral é grande quando n é 10
vezes maior que o número de células da tabela de contingência. Na Tabela 36,
por exemplo, temos quatro células, então um tamanho amostral grande seria n
≥ 40 unidades amostrais.

Nos casos em que o tamanho amostral é baixo, podemos utilizar um


teste estatístico alternativo, chamado de teste exato de Fisher (CALLEGARI-
JACQUES, 2003; PAGANO; GAUVREAU, 2013). Esse teste estatístico está
disponível na maioria dos programas estatísticos a exemplo do programa PAST
(HAMMER; HARPER; RYAN, 2001). Você pode ler mais sobre esse teste no
livro de Callegari-Jacques (2003).

4 VAMOS PRATICAR
Vejamos como o teste qui-quadrado funciona na prática: Imagine
que um pesquisador avaliou se existe alguma relação entre a classificação
de ameaça de extinção e o tamanho corpóreo de espécies de vertebrados.
Geralmente, o risco de extinção é maior para espécies de tamanho maior.
Para avaliar esta relação, o pesquisador amostrou 100 espécies e as classificou
quanto: i) à ameaça de extinção em ameaçada ou não ameaçada; ii) ao tamanho
corpóreo em porte pequeno ou porte grande. Neste exemplo, cada espécie
representa uma unidade amostral. Observe os dados organizados em uma
tabela de contingência (Tabela 38), estes são os valores observados. Note que
das 100 espécies de vertebrados amostradas, 42 estão ameaçadas de extinção e
58 não estão ameaçadas, 35 têm porte grande e 65 têm porte pequeno.

199
UNIDADE 3 | TESTES ESTATÍSTICOS II

TABELA 38 - CLASSIFICAÇÃO DAS ESPÉCIES DE VERTEBRADOS QUANTO À AMEAÇA DE


EXTINÇÃO E O TAMANHO CORPÓREO

Número de espécies Ameaçada de extinção Não ameaçada de extinção Total


Porte grande 25 10 35
Porte pequeno 17 48 65
Total 42 58 100
FONTE: A autora

O único pressuposto do teste qui-quadrado é de que o tamanho amostral


seja grande, caso contrário este método estatístico não pode ser aplicado. Para o
exemplo que estamos estudando, o tamanho amostral de 100 espécies pode ser
considerado grande, pois é 25 vezes maior que o número de células da tabela de
contingência. Portanto, o uso do teste qui-quadrado é adequado para esse exemplo.

O passo seguinte, após checar o pressuposto do teste qui-quadrado, é


estabelecer o valor esperado para cada célula da tabela de contingência. Os valores
total
total da linha
da linha ×total
×total da coluna da coluna
esperados são calculados pela equação: EEi i == . Observe, na
n
n
Tabela 39, como cada valor esperado foi obtido.

TABELA 39 - VALORES ESPERADOS PARA CADA CATEGORIA DE AMEAÇA DE EXTINÇÃO E


TAMANHO CORPÓREO

FONTE: A autora

Com os valores esperados calculados, podemos aplicar o teste qui-


quadrado seguindo todos os passos de um teste de hipóteses, conforme segue:

1° Estabelecemos as hipóteses nula e alternativa. H0: não existe relação entre


a classificação de ameaça de extinção e o tamanho corpóreo das espécies de
vertebrados. H1: existe relação entre a classificação de ameaça de extinção e o
tamanho corpóreo das espécies de vertebrados.
2° Estabelecemos o nível crítico de significância em 5% (a = 0,05).
3° Determinamos o valor crítico da estatística do teste qui-quadrado consultando
a tabela de distribuição qui-quadrado (Apêndice 5) e informando o a = 0,05 e
os graus de liberdade. Os graus de liberdade são obtidos por: gl = (número de
linhas - 1) × (número de colunas - 1) = (2 - 1) × (2 - 1) = 1. Assim, o valor crítico é
X20,05; 1 = 3,84.
200
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS

4° Calculamos a estatística do teste qui-quadrado usando os valores observado


e esperado para cada célula da tabela de contingência, conforme a equação:
( Oi - Ei ) ( 25 - 14, 7 ) (10 - 20,3) (17 - 27,3) ( 58 - 37, 7 )
r 2 2 2 2 2

X2 = ∑
i =1 Ei
=
14, 7
+
20,3
+
27,3
+
37, 7
= 19,1 . Pela equação,

temos que o valor calculado é de X2 = 19,1.


5° Agora podemos encontrar o p-valor associado à estatística do teste qui-
quadrado. Utilizando a função “DIST.QUI” do Excel e digitando “=DIST.
QUI(19,1; 1)”, temos que o p-valor é menor que 0,01.
6° Podemos fazer a inferência estatística. O valor calculado de X2 foi maior que o
valor crítico, portanto, rejeitamos a hipótese nula. O p-valor (p < 0,01) foi menor
que o nível crítico de significância (a = 0,05), portanto, também rejeitamos a
hipótese nula.

Concluímos que, para espécies de vertebrados, existe uma relação entre


a espécie estar ameaçada de extinção e seu tamanho corpóreo. Esta relação
dificilmente teria sido observada se a hipótese nula fosse verdadeira (X2 = 19,1;
gl = 1; p < 0,01). Dentre as 35 espécies de vertebrados de porte grande, 25 delas
estão ameaçadas de extinção. Para as espécies de porte pequeno, apenas 17
entre 65 estão ameaçadas de extinção.

5 TESTE QUI-QUADRADO PARA TABELAS DE


CONTINGÊNCIAS l x c
O teste qui-quadrado do exemplo anterior foi aplicado a uma tabela de
contingência chamada de 2 x 2, porque temos duas variáveis qualitativas e cada
uma com duas categorias. Em alguns casos, precisaremos trabalhar com variáveis
qualitativas com mais de duas categorias. Quando isso acontece, a tabela de
contingência é denominada l x c, em que l representa o número de categorias
da variável qualitativa que foi alocada nas linhas da tabela e c é o número de
categorias da variável alocada nas colunas da tabela.

Nas tabelas de contingência l x c, o cálculo dos valores esperados, a


estatística do teste qui-quadrado e a determinação dos graus de liberdade são
feitos da mesma maneira que em uma tabela 2 x 2. A única diferença é que o teste
qui-quadrado de uma tabela l x c é mais trabalhoso, porque temos mais células na
tabela de contingência para fazer os cálculos.

E
IMPORTANT

Caro acadêmico, a seguir você terá a oportunidade de ler mais um trecho do


livro “Uma senhora toma chá... como a estatística revolucionou a ciência no século XX”, de
David Salsburg. O texto fala um pouco do histórico de desenvolvimento dos métodos não
paramétricos e os principais cientistas que desenvolveram este campo da estatística. O texto
também traz uma breve discussão sobre a relevância desses métodos em comparação aos
métodos paramétricos. Faça uma boa leitura!

201
UNIDADE 3 | TESTES ESTATÍSTICOS II

LEITURA COMPLEMENTAR

ABOLIR OS PARÂMETROS

Durante os anos 1940, Frank Wilcoxon, químico da American Cyanamid,


foi importunado por um problema estatístico. Estivera fazendo testes de hipótese
comparando os efeitos de diferentes tratamentos, usando os testes t de Student e
as análises de variância de Fisher. Esse era o modo padrão de analisar os dados
experimentais àquela época. [...] Wilcoxon, porém, estava preocupado com o que
frequentemente parecia ser uma falha nesses métodos.

Podia fazer uma série de experimentos em que era óbvio para ele que
os tratamentos seriam diferentes no efeito. Algumas vezes os testes t indicariam
significância, outras vezes, não. Frequentemente, ao fazer um experimento em
engenharia química, o reator químico em que a reação ocorre não está aquecido
o bastante no começo da sequência de ensaios experimentais. Pode acontecer
de uma enzima particular começar a variar em sua capacidade de reagir. O
resultado é um valor experimental que parece errado. Muitas vezes o número
é demasiadamente grande ou pequeno. Algumas delas, é possível identificar a
causa desse resultado fora de padrão. Outras, o resultado é discrepante, diferindo
drasticamente de todos os demais resultados, sem razão óbvia para isso.

Wilcoxon examinou as fórmulas para calcular testes t e análises de


variância e compreendeu que esses valores discrepantes, extremos e incomuns,
influenciavam enormemente os resultados, causando valores de t de Student
menores do que deveriam ser (em geral, valores grandes do teste t levam a
valores de p pequenos). Era tentador eliminar o dado discrepante do conjunto
de observações e calcular o teste t a partir dos demais valores. Isso introduziria
problemas na derivação matemática dos testes de hipótese. Como o químico
poderia saber se um número realmente era discrepante? Quantos valores
discrepantes teriam de ser eliminados? O químico poderia continuar utilizando
as tabelas de probabilidade para as estatísticas-padrão de teste se os valores
discrepantes tivessem sido eliminados?

Wilcoxon pesquisou o assunto na literatura. Certamente os grandes


mestres matemáticos que criaram os métodos estatísticos teriam visto o problema
antes! Não achou, no entanto, nenhuma referência a isso. Pensou que tivesse
encontrado uma solução para o problema. Ela envolvia cálculos tediosos baseados
em combinações e permutações [...]. Wilcoxon começou a elaborar um método
para calcular esses valores combinatórios.

Ah, mas isso era bobagem! Por que um químico como Wilcoxon teria
de elaborar cálculos simples, mas tediosos? Sem dúvida alguém da estatística
já havia feito isso antes! Mais uma vez ele voltou à literatura estatística a fim
de localizar algum artigo prévio sobre o assunto. Nada encontrou. Sobretudo
para verificar sua própria matemática, ele submeteu o artigo à revista Biometrics
[...]. Ainda acreditava que seu trabalho não poderia ser original e contava com

202
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS

que os pareceristas e editores da revista soubessem onde artigos sobre o assunto


tivessem sido publicados antes – e esperava, assim, que rejeitassem seu artigo.
Ao rejeitar, eles também o notificariam sobre as outras referências. No entanto,
tanto quanto pareceristas e editores da revista puderam determinar, aquele era
um trabalho original. Ninguém tinha mesmo pensado naquilo antes, e o artigo de
Wilcoxon foi publicado em 1945.

O que nem Wilcoxon nem os editores de Biometrics sabiam é que um


economista chamado Henry B. Mann e um estudante de pós-graduação em estatística
na Universidade do Estado de Ohio, chamado D. Ransom Whitney, estavam
trabalhando em problema correlato. Eles tentavam ordenar distribuições estatísticas
para que se pudesse dizer, por exemplo, se a distribuição de salários de 1940 era
menor do que a distribuição de salários em 1944, e criaram um método de ordenar
que envolvia uma sequência simples, embora tediosa, de métodos de contagem.

Isso levou Mann e Whitney a uma estatística-teste cuja distribuição podia


ser calculada por aritmética combinatória – o mesmo tipo de computação que
Wilcoxon usava. Eles publicaram um artigo descrevendo sua nova técnica em
1947, dois anos depois que o artigo de Wilcoxon aparecera. Logo se verificou que
os testes de Wilcoxon e de Mann-Whitney estavam relacionados e produziam
os mesmos valores de p. Os dois testes envolviam algo novo. Até a publicação
do artigo de Wilcoxon, pensava-se que todas as estatísticas-teste teriam de ser
baseadas em estimativas de parâmetros de distribuições. Esse era um teste, no
entanto, que não estimava nenhum parâmetro. Ele comparava a dispersão de
dados observada com o que se poderia esperar de uma dispersão puramente
aleatória. Era um teste não paramétrico.

Dessa forma, a revolução estatística avançou um passo além das ideias


originais de Pearson. Ela agora podia lidar com distribuições de medições sem
lançar mão de parâmetros. Bastante desconhecido no Ocidente, no final dos anos
1930, Andrei Kolmogorov investigou, na União Soviética, com um aluno seu,
N. V. Smirnov, um enfoque diferente para a comparação de distribuições que
não utilizava parâmetros. Os trabalhos de Wilcoxon e de Mann-Whitney tinham
aberto uma nova janela de investigação matemática ao atrair a atenção para a
natureza subjacente de níveis ordenados, e o trabalho de Kolmogorov-Smirnov
foi logo acrescentado à lista. [...]

Problemas não resolvidos

O desenvolvimento de procedimentos não paramétricos pode ter levado à


explosão de atividade nesse novo campo. No entanto, não havia um vínculo óbvio
entre os métodos paramétricos usados até então e os métodos não paramétricos.

Havia duas questões a resolver:

1. Se os dados têm distribuição paramétrica conhecida, como a distribuição


normal, o que aconteceria de ruim com a análise se usássemos métodos não
paramétricos?

203
UNIDADE 3 | TESTES ESTATÍSTICOS II

2. Se os dados não se ajustam bem a um modelo paramétrico, quão afastados


daquele modelo os dados precisam estar para que os métodos não paramétricos
sejam os melhores?

Em 1948, os editores de Annals of Mathematical Statistics receberam o artigo


de um desconhecido professor de matemática da Universidade da Tasmânia, ilha
na costa sul da Austrália. Esse artigo notável resolveu os dois problemas. Edwin
James George Pitman tinha publicado três artigos anteriores [...]. Além desses
quatro artigos, Pitman, que tinha 52 anos quando submeteu seu artigo à revista
Annals, nada mais publicara e era desconhecido. [...]

O que Pitman descobriu surpreendeu a todos. Mesmo quando as


suposições originais eram verdadeiras, os testes não paramétricos eram
quase tão bons quanto os paramétricos. Ele foi capaz de responder à primeira
pergunta: quão mal será usarmos testes não paramétricos em uma situação na
qual conhecemos o modelo paramétrico e em que deveríamos utilizar um teste
paramétrico específico? Nada mau, diria Pitman.

A resposta à segunda pergunta era ainda mais surpreendente. Se os dados


não se ajustam ao modelo paramétrico, quão longe desse modelo eles devem
estar para que os testes não paramétricos sejam melhores? Os cálculos de Pitman
mostraram que bastava um ligeiro desvio do modelo paramétrico para que os
testes não paramétricos se mostrassem muito melhores do que os paramétricos.

Parece que Frank Wilcoxon, o químico que estava certo de que alguém já
fizera essa descoberta antes dele, tinha tropeçado numa verdadeira pedra filosofal.
Os resultados de Pitman sugerem que todos os testes de hipótese deveriam ser
não paramétricos. A descoberta de Pearson das distribuições estatísticas baseadas
em parâmetros era apenas o primeiro passo. Agora os estatísticos eram capazes de
lidar com distribuições estatísticas sem se preocupar com parâmetros específicos.

Existem sutilezas dentro das sutilezas em matemática. De modo bem


profundo, em seus enfoques aparentemente simples, Wilcoxon, Mann e Whitney
tinham premissas sobre as distribuições dos dados. Ainda seriam necessários
outros 25 anos para que essas premissas fossem entendidas. O primeiro problema
perturbador foi descoberto por R. R. Bahadur e L. J. Savage, na Universidade de
Chicago, em 1956.

Os problemas que Savage e Bahadur revelaram originavam-se do problema


que primeiramente sugeriu os testes não paramétricos a Wilcoxon: o problema dos
dados discrepantes. Se as discrepâncias são observações raras e completamente
“erradas”, então os métodos não paramétricos reduzem sua influência sobre a
análise. Se as discrepâncias são parte de uma sistemática contaminação de dados,
mudar para métodos não paramétricos só agrava a situação.

FONTE: SALSBURG, D. Uma senhora toma chá... como a estatística revolucionou a ciência no
século XX. Rio de Janeiro: Zahar, 2009, p. 288.

204
RESUMO DO TÓPICO 3

Neste tópico, você aprendeu que:

• Os testes paramétricos utilizam algum parâmetro da distribuição ou


estimativas desses parâmetros para calcular a estatística do teste. As variáveis
investigadas precisam ter distribuição normal ou aproximadamente normal e
homogeneidade das variâncias.

• Quando a normalidade e a homogeneidade de variâncias não são atendidas,


podemos transformar as variáveis investigadas. As transformações mais
usadas são: logarítmica, raiz quadrada, arcoseno, inversa e Box-Cox.

• Nos testes não paramétricos não é necessário conhecer a distribuição da


variável investigada e os pressupostos de normalidade e homogeneidade de
variâncias não precisam ser atendidos.

• A estatística dos testes não paramétricos não utiliza os valores observados da


variável, mas os valores dos postos. O posto é um número que corresponde à
posição de determinado valor da variável na ordenação de todos os valores.

• Vantagens dos testes não paramétricos: i) são úteis quando não conhecemos
a distribuição da variável investigada, ou ainda, quando a variável não tem
distribuição normal ou homogeneidade de variância; ii) a ordenação dos dados
em postos evita que valores extremos muito baixos ou muito altos influenciem
o resultado da análise.

• Desvantagens dos testes não paramétricos: i) são menos eficientes em detectar


diferenças e, por isso, não devem ser usados quando os pressupostos de
normalidade e homogeneidade de variâncias são atendidos; ii) levam à perda
de informação da variabilidade dos dados na transformação dos valores
observados da variável em postos.

• Sempre que os pressupostos forem atendidos, recomenda-se o uso dos testes


paramétricos.

• O teste T de Wilcoxon é o teste não paramétrico equivalente ao teste T pareado.


É usado para avaliar se existe diferença entre duas amostras pareadas.

• O teste U de Wilcoxon-Mann-Whitney é equivalente ao teste T para amostras


independentes. É usado para testar se duas amostras diferem entre si em
relação a um fator.

• O teste de Kruskal-Wallis é equivalente à análise de variância. Ele é uma


extensão do teste U e é aplicado para testar se três ou mais amostras diferem
entre si em relação a um fator.
205
• O coeficiente de correlação de Spearman é equivalente ao coeficiente de
correlação de Pearson. Ele é usado para avaliar se duas variáveis estão
correlacionadas.

• O qui-quadrado é um teste não paramétrico utilizado para avaliar se duas


variáveis qualitativas são independentes. Foi desenvolvido por Karl Pearson,
em 1899.

• Para aplicar o teste qui-quadrado, precisamos organizar os dados das variáveis


qualitativas em uma tabela de contingência, em que as colunas representam as
categorias de uma variável qualitativa e as linhas representam as categorias de
outra variável.

• A lógica do teste qui-quadrado consiste em comparar o número de unidades


amostrais observado em cada categoria com o número de unidades esperado
se a distribuição das unidades acontecesse ao acaso pelas categorias.
total
total da linha
da linha ×total
×total da coluna da coluna
• Cada valor esperado (Ei) é obtido por: EEi i == .
n
n
• A distribuição qui-quadrado (X ) é a distribuição de referência do teste qui-
2

quadrado. A forma desta distribuição varia conforme o número de categorias


que a variável qualitativa apresenta. Esta distribuição é composta apenas por
valores positivos.

• A hipótese nula em um teste qui-quadrado é de ausência de relação entre as


variáveis qualitativas. Enquanto a hipótese alternativa é que as duas variáveis
são relacionadas.

• O valor crítico da estatística do qui-quadrado é encontrado ao consultar a


tabela de distribuição qui-quadrado e informar o a e os graus de liberdade,
ou seja, X a2 ; gl . Os graus de liberdade são dados por: gl = (número de linhas - 1) ×
(número de colunas - 1).

( Oi - Ei )
r 2

• A estatística do teste qui-quadrado é calculada por: X 2 = ∑ .


i =1 Ei
• Para chegar ao p-valor correspondente à estatística do teste qui-quadrado,
podemos usar a função “DIST.QUI” do Excel.

• O teste qui-quadrado só pode ser aplicado quando o tamanho amostral é


grande. Amostras grandes têm n 10 vezes maior que o número de células da
tabela de contingência. Se o tamanho amostral for pequeno, devemos usar o
teste exato de Fisher.

206
AUTOATIVIDADE

Caro acadêmico! Para fixar melhor o conteúdo estudado, vamos exercitar um


pouco.Leia as questões a seguir e responda-as em seu caderno de estudos.
Bom trabalho!

1 Abaixo você encontra uma breve descrição da natureza dos dados de


diferentes estudos e uma relação de testes estatísticos. Relacione cada estudo
com o teste estatístico adequado para análise dos dados. Note que nem todos
os testes estatísticos serão utilizados no exercício.

Estudo 1. Uma pesquisadora investigou se havia relação entre a síndrome


de dispersão e o tamanho da área de distribuição geográfica de espécies
da família botânica Bignoniaceae. Para isso, a pesquisadora amostrou 300
espécies de Bignoniaceae e as classificou quanto: i) à síndrome de dispersão
em: anemocóricas (espécies com sementes dispersas pelo vento) e hidrocóricas
(espécies com sementes dispersas pela água); ii) à área de distribuição
geográfica em: grande, intermediária e pequena.
Estudo 2. Um pesquisador avaliou se a riqueza de espécies de macroinvertebrados
aquáticos varia em relação ao nível de perturbação antrópica dos riachos. O
pesquisador amostrou a riqueza de espécies em 15 riachos não perturbados,
15 riachos com perturbação intermediária e 15 riachos muito perturbados. Nas
análises, o pesquisador percebeu que os dados não atendiam ao pressuposto
de normalidade, mas tinham homogeneidade de variâncias.
Estudo 3. Uma pesquisadora estudou se a intensidade de herbivoria é
diferente em plantas de borda e interior da floresta. Para isso, a pesquisadora
coletou folhas de plantas na borda e no interior de 15 fragmentos florestais. A
intensidade de herbivoria foi mensurada como a área da folha consumida por
herbívoros em relação à área total da folha. Ao analisar os dados, a pesquisadora
observou que tinham normalidade e homogeneidade de variâncias.
Estudo 4. Um pesquisador investigou se a quantidade de nutrientes em
lagos está relacionada à riqueza de algas. O pesquisador amostrou 25 lagos
e quantificou a quantidade de fósforo dissolvido na água e a riqueza de
algas de cada lago. Nas análises, o pesquisador observou que os dados não
apresentavam normalidade e nem homogeneidade de variância, mesmo após
tentar transformar os dados.

Testes estatísticos:

a) Teste T de Wilcoxon
b) Teste U de Wilcoxon-Mann-Whitney
c) Teste de Kruskal-Wallis
d) Coeficiente de correlação de Spearman
e) Teste qui-quadrado
f) Teste T para amostras independentes

207
g) Análise de variância
h) Coeficiente de correlação de Pearson

2 A estocagem de carbono é considerada um serviço fornecido por


ecossistemas naturais e compreende o armazenamento de carbono em
estruturas vegetais e no solo. Um pesquisador avaliou a efetividade de
diferentes categorias de unidades de conservação em representar o serviço de
estocagem de carbono. As unidades de conservação foram classificadas em
proteção integral ou de uso sustentável, bem como efetivas ou não efetivas
em representar o serviço de estocagem de carbono. No total, o pesquisador
amostrou 77 unidades de conservação distribuídas pelo Brasil. Os dados
coletados são apresentados no quadro de contingência a seguir. Com base
nestes dados, faça o que é solicitado:

Proteção
Unidades de conservação Uso sustentável Total
integral
Efetivas em representar carbono 26 17 43
Não efetivas em representar carbono 11 23 34
Total 37 40 77

a) O teste estatístico indicado para análise desses dados é o qui-quadrado.


Justifique.
b) Verifique se os dados atendem aos pressupostos do teste qui-quadrado.
c) Calcule os valores esperados para cada célula da tabela de contingência.
d) Execute o teste qui-quadrado seguindo todos os passos de um teste de
hipóteses:
I. defina as hipóteses nula e alternativa;
II. estabeleça o nível crítico de significância;
III. encontre o valor crítico da estatística do teste qui-quadrado consultando
a tabela de distribuição qui-quadrado;
IV. calcule a estatística do teste qui-quadrado;
V. encontre o p-valor associado à estatística do teste;
VI. faça a inferência estatística.
e) Com base nos resultados do teste qui-quadrado, redija uma conclusão sobre
a relação entre as categorias das unidades de conservação e a efetividade em
representar o carbono.

208
REFERÊNCIAS
BATAGIN, K. D. et al. Alterações morfológicas foliares em abacaxizeiros cv. IAC
“Gomo-de-mel” micropropagados e aclimatizados em diferentes condições de
luminosidade. Acta Botanica Brasilica. Vol. 23, N. 1, 85-92, 2009.

BOEGER, M. R. T.; WISNIEWSKI, C. Comparação da morfologia foliar de


espécies arbóreas de três estádios sucessionais distintos de floresta ombrófila
densa (Floresta Atlântica) no Sul do Brasil. Revista Brasileira de Botânica. Vol.
26, n. 1, 61-72, 2003.

CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto


Alegre: Artmed, 2003.

FERREIRA, W. N. et al. Crescimento inicial de Piptadenia stipulacea (Benth.)


Ducke (Mimosaceae) e Anadenanthera colubrina (Vell.) Brenan var. cebil
(Griseb.) Altshul (Mimosaceae) sob diferentes níveis de sombreamento. Acta
Botanica Brasilica. Vol. 26, n. 2, 408-414, 2012.

GASPER, A. L. et al. Floristic and Forest Inventory of Santa Catarina: species of


evergreen rainforest. Rodriguésia. Vol. 65, n. 4, 807-816, 2014.

GHODDOSI, S. M. Dinâmica do componente arbóreo (1999-2004) de um


trecho de Floresta Ombrófila Densa em Blumenau, SC. 2005. 140 f. Dissertação
(Mestrado em Engenharia Ambiental) – Centro de Ciências Tecnológicas,
Universidade Regional de Blumenau: Blumenau, 2005.

GOTELLI, N. J.; ELLISON, A. M. Princípios de estatística em ecologia. Porto


Alegre: Artmed, 2011.

HAMMER, Øyvind; HARPER, D. A. T.; RYAN, P. D. PAST: Paleontological


Statistics software package for education and data analysis. Palaeontological
Electronica. Vol. 4, n. 1, 1-9, 2001.

HATANO, F. H. et al. Thermal ecology and activity patterns of the lizard


community of the restinga of Jurubatiba, Macaé, RJ. Revista Brasileira de
Biologia. Vol. 61, n. 2, 287-294, 2001.

MEMÓRIA, J. M. P. Breve história da estatística. Brasília: Embrapa, 2004.

MONTEIRO, C. A.; BENICIO, M. H. D’A.; ORTIZ, L. P. Tendência secular do


peso ao nascer na cidade de São Paulo (1976-1998). Revista de Saúde Pública.
Vol. 34, Supl. 6, 26-40, 2000.

209
PADOVANI, C. R. Delineamento de experimentos. São Paulo: Cultura
Acadêmica, 2014.

PAGANO, M.; GAUVREAU, K. Princípios de bioestatística. São Paulo:


Cengage Learning, 2013.

SABBI, L. B. C.; ÂNGELO, A. C.; BOEGER, M. R. Influência da luminosidade


nos aspectos morfoanatômicos e fisiológicos de folhas de Schinus
terebinthifolius Raddi (Anacardiaceae) implantadas em duas áreas com
diferentes graus de sucessão, nas margens do Reservatório Iraí, Paraná, Brasil.
Iheringia. Vol. 65, n. 2, 171-181, 2010.

SALSBURG, D. Uma senhora toma chá... como a estatística revolucionou a


ciência no século XX. Rio de Janeiro: Zahar, 2009.

TEIXEIRA, L. H.; ATTAYDE, J. L. Synergistic effects between omnivorous


filter-feeding fish and nutrient enrichment on algal biomass. Acta Limnologica
Brasiliensia. Vol. 27, n. 2, 223-227, 2015.

VIEIRA, S. Introdução à bioestatística. Rio de Janeiro: Elsevier, 2011.

210
APÊNDICES
APÊNDICE 1 - TABELA DE DISTRIBUIÇÃO NORMAL PADRONIZADA (TABELA DE DISTRIBUIÇÃO
Z) COM OS VALORES DE Z E ÁREA SOB A CURVA ENTRE A MÉDIA (m = 0) E UM VALOR
POSITIVO DE Z. AS ÁREAS SOB A CURVA PARA OS VALORES DE Z NEGATIVOS SÃO OBTIDAS
POR SIMETRIA

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549
0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
FONTE: Adaptado de Callegari-Jacques (2003)

211
APÊNDICE 2 - TABELA DE VALORES CRÍTICOS DA DISTRIBUIÇÃO T DE STUDENT

Graus de a Bilateral 0,20 0,10 0,05 0,02 0,01


liberdade a Unilateral 0,10 0,05 0,025 0,01 0,005
1 3,078 6,314 12,706 31,821 63,656
2 1,886 2,920 4,303 6,965 9,925
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604
5 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,707
7 1,415 1,895 2,365 2,998 3,499
8 1,397 1,860 2,306 2,896 3,355
9 1,383 1,833 2,262 2,821 3,250
10 1,372 1,812 2,228 2,764 3,169
11 1,363 1,796 2,201 2,718 3,106
12 1,356 1,782 2,179 2,681 3,055
13 1,350 1,771 2,160 2,650 3,012
14 1,345 1,761 2,145 2,624 2,977
15 1,341 1,753 2,131 2,602 2,947
16 1,337 1,746 2,120 2,583 2,921
17 1,333 1,740 2,110 2,567 2,898
18 1,330 1,734 2,101 2,552 2,878
19 1,328 1,729 2,093 2,539 2,861
20 1,325 1,725 2,086 2,528 2,845
21 1,323 1,721 2,080 2,518 2,831
22 1,321 1,717 2,074 2,508 2,819
23 1,319 1,714 2,069 2,500 2,807
24 1,318 1,711 2,064 2,492 2,797
25 1,316 1,708 2,060 2,485 2,787
26 1,315 1,706 2,056 2,479 2,779
27 1,314 1,703 2,052 2,473 2,771
28 1,313 1,701 2,048 2,467 2,763
29 1,311 1,699 2,045 2,462 2,756
30 1,310 1,697 2,042 2,457 2,750
35 1,306 1,690 2,030 2,438 2,724
40 1,303 1,684 2,021 2,423 2,704
45 1,301 1,679 2,014 2,412 2,690
50 1,299 1,676 2,009 2,403 2,678
60 1,296 1,671 2,000 2,390 2,660
70 1,294 1,667 1,994 2,381 2,648
80 1,292 1,664 1,990 2,374 2,639
90 1,291 1,662 1,987 2,368 2,632
100 1,290 1,660 1,984 2,364 2,626
110 1,289 1,659 1,982 2,361 2,621
120 1,289 1,658 1,980 2,358 2,617
130 1,288 1,657 1,978 2,355 2,614
∞ 1,282 1,645 1,960 2,326 2,576
FONTE: Adaptado de Callegari-Jacques (2003)

212
APÊNDICE 3 - TABELA DE VALORES CRÍTICOS DA DISTRIBUIÇÃO F PARA UM TESTE UNILATERAL COM a = 0,05
Graus de Graus de liberdade do Numerador
liberdade do
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
Denominador
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 2,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,23 2,29 2,25 2,20 2,16 2,11 2,07

213
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3.07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
FONTE: Adaptado de Callegari-Jacques (2003)
APÊNDICE 4 - TABELA DE VALORES CRÍTICOS DA DISTRIBUIÇÃO Q PARA OS NÍVEIS DE
SIGNIFICÂNCIA DE 0,05 E 0,01. glD SÃO OS GRAUS DE LIBERDADE ASSOCIADOS À SOMA DE
QUADRADOS DENTRO DE GRUPOS
g – número de grupos comparados
glD a
2 3 4 5 6 7 8 9 10
0,05 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99
5
0,01 5,70 6,98 7,80 8,42 8,91 9,32 9,67 9,97 10,24
0,05 3,46 4,34 4,90 5,30 5,63 5,90 6,12 6,32 6,49
6
0,01 5,24 6,33 7,03 7,56 7,97 8,32 8,61 8,87 9,10
0,05 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16
7
0,01 4,95 5,92 6,54 7,01 7,37 7,68 7,94 8,17 8,37
0,05 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92
8
0,01 4,75 5,64 6,20 6,62 6,96 7,24 7,47 7,68 7,86
0,05 3,20 3,95 4,41 4,76 5,02 5,24 5,43 5,59 5,74
9
0,01 4,60 5,43 5,96 6,35 6,66 6,91 7,13 7,33 7,49
0,05 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,60
10
0,01 4,48 5,27 5,77 6,14 6,43 6,67 6,87 7,05 7,21
0,05 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49
11
0,01 4,39 5,15 5,62 5,97 6,25 6,48 6,67 6,84 6,99
0,05 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,39
12
0,01 4,32 5,05 5,50 5,84 6,1 6,32 6,51 6,67 6,81
0,05 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5,32
13
0,01 4,26 4,96 5,40 5,73 5,98 6,19 6,37 6,53 6,67
0,05 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25
14
0,01 4,21 4,89 5,32 5,63 5,88 6,08 6,26 6,41 6,54
0,05 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08 5,20
15
0,01 4,17 4,84 5,25 5,56 5,8 5,99 6,16 6,31 6,44
0,05 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15
16
0,01 4,13 4,79 5,19 5,49 5,72 5,92 6,08 6,22 6,35
0,05 2,98 3,63 4,02 4,30 4,52 4,70 4,86 4,99 5,11
17
0,01 4,10 4,74 5,14 5,43 5,66 5,85 6,01 6,15 6,27
0,05 2,97 3,61 4,00 4,28 4,49 4,67 4,82 4,96 5,07
18
0,01 4,07 4,70 5,09 5,38 5,60 5,79 5,94 6,08 6,20
0,05 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04
19
0,01 4,05 4,67 5,05 5,33 5,55 5,73 5,89 6,02 6,14
0,05 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01
20
0,01 4,02 4,64 5,02 5,29 5,51 5,69 5,84 5,97 6,09
0,05 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92
24
0,01 3,96 4,55 4,91 5,17 5,37 5,54 5,69 5,81 5,92
0,05 2,89 3,49 3,85 4,10 4,30 4,46 4,60 4,72 4,82
30
0,01 3,89 4,45 4,80 5,05 5,24 5,40 5,54 5,65 5,76
0,05 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63 4,73
40
0,01 3,82 4,37 4,70 4,93 5,11 5,26 5,39 5,50 5,60
0,05 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65
60
0,01 3,76 4,28 4,59 4,82 4,99 5,13 5,25 5,36 5,45
0,05 2,80 3,36 3,68 3,92 4,10 4,24 4,36 4,47 4,56
120
0,01 3,70 4,20 4,50 4,71 4,87 5,01 5,12 5,21 5,30
0,05 2,77 3,31 3,63 3,86 4,03 4,17 4,29 4,39 4,47

0,01 3,64 4,12 4,40 4,60 4,76 4,88 4,99 5,08 5,16
FONTE: Adaptado de Callegari-Jacques (2003)

214
APÊNDICE 5 - TABELA DE VALORES CRÍTICOS DA DISTRIBUIÇÃO QUI-QUADRADO (X²)

Nível crítico de significância (a)


Graus de liberdade (gl) 0,10 0,05 0,01
1 2,71 3,84 6,63
2 4,61 5,99 9,21
3 6,25 7,82 11,34
4 7,78 9,49 13,28
5 9,24 11,07 15,09
6 10,65 12,59 16,81
7 12,02 14,07 18,48
8 13,36 15,51 20,09
9 14,68 16,92 21,67
10 15,99 18,31 23,21
11 17,28 19,68 24,73
12 18,55 21,03 26,22
13 19,81 22,36 27,69
14 21,06 23,69 29,14
15 22,31 25,00 30,58
16 23,54 26,30 32,00
17 24,77 27,59 33,41
18 25,99 28,87 34,81
19 27,20 30,14 36,19
20 28,41 31,41 37,57
21 29,62 32,67 38,93
22 30,81 33,92 40,29
23 32,01 35,17 41,64
24 33,20 36,42 42,98
25 34,38 37,65 44,31
26 35,56 38,89 45,64
27 36,74 40,11 46,96
28 37,92 41,34 48,28
29 39,09 42,56 49,59
30 40,26 43,77 50,89
FONTE: Adaptado de Callegari-Jacques (2003)

215

Você também pode gostar