Escolar Documentos
Profissional Documentos
Cultura Documentos
à Biologia
Prof.ª Leila Meyer
2016
Copyright © UNIASSELVI 2016
Elaboração:
Prof.ª Leila Meyer
M612e
Meyer; Leila
Estatística aplicada à biologia / Leila Meyer: UNIASSELVI, 2016.
215 p. : il
ISBN 978-85-515-0040-8
Impresso por:
Apresentação
Caro acadêmico! Chegou a hora de você conhecer melhor a estatística
e aprender um pouco mais sobre ela! Essa é uma disciplina de grande
importância, tanto para a sua vida acadêmica e profissional quanto para o
cotidiano.
Bons estudos!
Leila Meyer
NOTA
Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto para
você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há
novidades em nosso material.
O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova
diagramação no texto, aproveitando ao máximo o espaço da página, o que também
contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo.
Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas
institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa
continuar seus estudos com um material de qualidade.
IV
V
VI
Sumário
UNIDADE 1 - FUNDAMENTOS EM ESTATÍSTICA....................................................................1
VII
2.1 DISTRIBUIÇÃO BINOMIAL.......................................................................................................43
2.2 DISTRIBUIÇÃO NORMAL..........................................................................................................46
2.2.1 Características da distribuição normal..............................................................................47
2.2.2 Distribuição normal padronizada......................................................................................50
3 DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS.............................................................................53
RESUMO DO TÓPICO 2.....................................................................................................................57
AUTOATIVIDADE...............................................................................................................................59
VIII
2.4 TRATAMENTO, FATOR E NÍVEL..............................................................................................113
2.5 GRUPO TRATADO E GRUPO CONTROLE.............................................................................113
2.6 CASUALIZAÇÃO.........................................................................................................................114
2.7 INDEPENDÊNCIA NAS OBSERVAÇÕES.................................................................................114
3 TIPOS DE DELINEAMENTO..........................................................................................................115
3.1 DELINEAMENTO INTEIRAMENTE CASUALIZADO..........................................................115
3.2 DELINEAMENTO EM BLOCOS CASUALIZADOS................................................................116
3.3 DELINEAMENTO FATORIAL....................................................................................................119
RESUMO DO TÓPICO 2.....................................................................................................................121
AUTOATIVIDADE...............................................................................................................................123
TÓPICO 1 - CORRELAÇÃO................................................................................................................149
1 INTRODUÇÃO...................................................................................................................................149
2 COEFICIENTE DE CORRELAÇÃO DE PEARSON....................................................................151
2.1 TESTE DE HIPÓTESES PARA O COEFICIENTE DE
CORRELAÇÃO DE PEARSON...................................................................................................154
2.2 PRESSUPOSTOS PARA CALCULAR O COEFICIENTE DE
CORRELAÇÃO DE PEARSON...................................................................................................155
3 VAMOS PRATICAR...........................................................................................................................156
3.1 CUIDADOS NA INTERPRETAÇÃO DO COEFICIENTE DE
CORRELAÇÃO DE PEARSON...................................................................................................160
RESUMO DO TÓPICO 1.....................................................................................................................163
AUTOATIVIDADE...............................................................................................................................165
IX
2.2.1 Teste T de Wilcoxon..............................................................................................................194
2.2.2 Teste U de Wilcoxon-Mann-Whitney.................................................................................194
2.2.3 Teste de Kruskal-Wallis........................................................................................................195
2.2.4 Coeficiente de correlação de Spearman.............................................................................195
3 TESTE QUI-QUADRADO................................................................................................................196
3.1 PRESSUPOSTOS DO TESTE QUI-QUADRADO......................................................................199
4 VAMOS PRATICAR...........................................................................................................................199
5 TESTE QUI-QUADRADO PARA TABELAS DE CONTINGÊNCIAS l x c.............................201
LEITURA COMPLEMENTAR.............................................................................................................202
RESUMO DO TÓPICO 3.....................................................................................................................205
AUTOATIVIDADE...............................................................................................................................207
REFERÊNCIAS.......................................................................................................................................209
APÊNDICES............................................................................................................................................211
X
UNIDADE 1
FUNDAMENTOS EM
ESTATÍSTICA
OBJETIVOS DE APRENDIZAGEM
Caro acadêmico, o objetivo desta unidade é:
PLANO DE ESTUDOS
Esta unidade está dividida em três tópicos. Em cada um deles você
encontrará atividades visando à compreensão dos conteúdos apresentados.
1
2
UNIDADE 1
TÓPICO 1
INTRODUÇÃO À ESTATÍSTICA
1 INTRODUÇÃO
Assim como toda ciência, as ciências biológicas são movidas por perguntas.
Podemos nos perguntar, por exemplo: que fatores influenciam na diferença do
número de espécies de mamíferos entre duas regiões? O barramento de um rio
para construção de uma hidrelétrica altera a densidade populacional dos peixes
desse rio? Quais serão os efeitos das alterações na temperatura e precipitação
decorrentes das mudanças climáticas sobre a vegetação? A infecção de mulheres
gestantes pelo vírus Zika está associada à prevalência de microcefalia em seus
bebês? Qual a didática mais eficiente para o ensino de doenças sexualmente
transmissíveis aos educandos do Ensino Fundamental?
Assim, a estatística é definida como a ciência que tem por objetivo orientar
a coleta, a organização, a análise e a interpretação de dados (CALLEGARI-
JACQUES, 2003; PAGANO; GAUVREAU, 2013). Essa ciência pode ser dividida
em duas grandes áreas: i) a estatística descritiva, que se preocupa com o resumo
e a apresentação de dados; ii) a estatística inferencial, que é usada para obter
conclusões sobre um conjunto amplo de dados a partir do estudo de apenas parte
desses dados (CALLEGARI-JACQUES, 2003). Quando a estatística é usada nas
ciências biológicas e na saúde, ela também pode ser chamada de Bioestatística.
3
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
Já nos séculos XIX e XX, a estatística passou por grandes avanços graças
a Karl Pearson (1857-1936), William Sealy Gosset (1876-1937) e, em especial, a
Ronald Aylmer Fisher (1890-1962) (CALLEGARI-JACQUES, 2003; MEMÓRIA,
2004). Pearson se interessou pela aplicação dos métodos estatísticos na biologia,
principalmente em estudos de seleção natural. Ele também foi muito importante
no desenvolvimento teórico do coeficiente de correlação e do teste qui-quadrado
(CALLEGARI-JACQUES, 2003). Gosset, que foi acadêmico de Pearson, se
dedicou a solucionar problemas práticos com amostras pequenas e, com seus
estudos, desenvolveu o teste t (CALLEGARI-JACQUES, 2003). Fisher, além de
ter revolucionado a estatística, também foi essencial para o desenvolvimento da
genética. Ele apresentou as bases do planejamento de experimentos, desenvolveu
a análise da variância e introduziu o conceito de aleatorização. O trabalho de
Fisher influenciou o uso da estatística em inúmeras áreas do conhecimento,
sobretudo na agronomia, biologia e genética (CALLEGARI-JACQUES, 2003).
4
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
NOTA
Caro acadêmico, você sabia que o censo demográfico realizado pelo IBGE,
em que uma porção representativa da população brasileira é entrevistada, é apenas uma
amostra? O “Censo do IBGE” não é de fato um censo, pois nem todos os indivíduos que
compõem a população brasileira são entrevistados.
5
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
FONTE: A autora
6
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
3 TIPOS DE DADOS
O dado é a menor unidade de informação obtida de cada unidade
amostral (CALLEGARI-JACQUES, 2003). Os dados podem ser valores numéricos
(por exemplo, alguma característica medida em metros ou tempo), ou categorias
(por exemplo, grande, médio ou pequeno). No exemplo do reflorestamento de
araucárias (Figura 1), em que queremos descobrir o número médio de pinhas
produzidas por araucária, o dado é o valor numérico que representa a quantidade
de pinhas produzida por cada araucária amostrada.
7
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
i) Razão é uma variável que expressa relação entre duas variáveis a partir
de um único valor. Um exemplo é a razão entre comprimento e largura da asa de
aves, que é usada para relacionar características da asa ao voo das aves.
8
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
4 INTRODUÇÃO À AMOSTRAGEM
Você já estudou que um dos objetivos da estatística é fazer inferências
a respeito da população com base em um conjunto reduzido de informações,
a amostra. Para que as conclusões sobre a população sejam válidas, é preciso
garantir que a amostra represente a população. Neste tópico você estudará
por que precisamos amostrar e quais são os principais tipos de amostragem.
Esses conhecimentos são fundamentais para definir qual é a melhor estratégia
de amostragem.
9
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
TURO S
ESTUDOS FU
Caro acadêmico, você verá adiante que garantir uma amostra aleatória, ou
seja, assegurar que todas as unidades amostrais tiveram a mesma chance de terem sido
amostradas é um dos pressupostos para todos os testes estatísticos que vamos aprender.
10
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
11
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
12
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
FONTE: A autora
13
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
14
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
5 ESTATÍSTICA DESCRITIVA
Você acabou de aprender que um estudo científico sempre busca obter
conclusão a respeito da população, no entanto, na maioria dos trabalhos não
é possível amostrar todas as unidades amostrais da população para suportar
as conclusões. Assim, é necessário trabalhar com uma amostra, ou seja, parte
das unidades amostrais que compõem a população. A partir da amostra se
estima os parâmetros populacionais e, com base nessas informações, inferências
em relação à população são feitas. Você também estudou quais são os tipos
de variáveis que podem ser coletadas nas unidades amostrais (variáveis
quantitativas, qualitativas ou derivadas). Por fim, você estudou os principais
métodos de amostragem das unidades amostrais. Portanto, até agora, você deve
ter uma ideia por que coletamos dados de apenas algumas unidades amostrais
da população; de que tipos podem ser os dados coletados; e como esses dados
podem ser coletados por meio de um delineamento amostral. Um exemplo de
conjunto de dados é apresentado na Tabela 1.
15
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
5.1.1 Média
A média é a medida de tendência central mais utilizada, pois é facilmente
calculada e interpretada (CALLEGARI-JACQUES, 2003). Você mesmo já deve ter
calculado alguma média antes! Além disso, a média tem propriedades estatísticas
que permitem que ela seja usada em vários testes estatísticos e na inferência
estatística (CALLEGARI-JACQUES, 2003), conforme veremos nas próximas
unidades desse caderno.
16
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
Agora que você já sabe o que cada termo da equação significa, vamos
calcular a média das notas da primeira avaliação de estatística da turma de
Ciências Biológicas da UNIASSELVI. Os dados estão na Tabela 1. Essa amostra
é composta de 10 unidades amostrais (n = 10). Cada acadêmico representa uma
unidade amostral (xi). Precisamos somar a nota de todos os acadêmicos, ou seja,
a nota do primeiro acadêmico que é x1 = 2, a nota do segundo acadêmico que é x2
= 6 , a nota do terceiro acadêmico que é x3 = 7 e assim até o último acadêmico x10 =
9. O somatório das notas de todos os acadêmicos deve ser dividido pelo número
total de acadêmicos da amostra, ou seja, n = 10.
1 n 1
=x ∑
n i =1
xi ≡ × ( 2 + 6 + 7 + 5 + 8 + 4 + 6 + 7 + 3 + 9 )
10
57
x = 5, 7
=
10
Foi difícil fazer esse cálculo? Vamos praticar um pouco mais? Tente
calcular a média para as notas da segunda avaliação de estatística. Os dados estão
na Tabela 1. No final dos cálculos você deve chegar ao resultado x = 6,4.
17
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
TURO S
ESTUDOS FU
Caro acadêmico, você entendeu como calcular uma média? Se não, leia
novamente para tentar entender. É muito importante que você tenha entendido isso, pois
utilizaremos a média em outros momentos ao longo do caderno.
5.1.2 Mediana
Para achar o valor que representa a mediana, primeiramente precisamos
fazer uma ordenação crescente de todos os valores das unidades amostrais da
amostra (VIEIRA, 2011). A mediana é o valor que ocupa a posição central na
ordenação. Assim, metade dos valores da amostra é igual ou menor que a
mediana, enquanto metade dos valores é igual ou maior que a mediana.
18
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
3° 6 4
4° 4 5
5° 2 6
6° 7 6
7° 3 7
8° 8 7
9° 5 8
10° 10 9
FONTE: A autora
5.1.3. Moda
A moda é o valor observado com maior frequência. Na sequência de
números 1, 7, 9, 3, 4, 3 e 5, a moda é igual a 3, pois é o valor observado mais vezes.
No entanto, algumas amostras podem não apresentar uma moda. Por exemplo,
na sequência 1, 6, 3, 1, 9, 3, 6 e 9 não existe uma moda, pois todos os valores foram
observados duas vezes.
19
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
5.2.1 Amplitude
A amplitude é o valor obtido pela diferença entre o menor e o maior
valor observado na amostra. Apesar de ser facilmente calculada e interpretada,
a amplitude não reflete bem a variabilidade da amostra, pois é obtida utilizando
apenas dois valores da amostra (VIEIRA, 2011). Assim, dois conjuntos de dados
podem apresentar a mesma amplitude, mas terem variabilidades muito diferentes
(VIEIRA, 2011). Além disso, a amplitude é afetada pelos valores extremos e só
pode ser utilizada para variáveis discretas ou contínuas.
20
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
5.2.3 Variância
Uma medida de dispersão muito usada é a variância, e como veremos nas
próximas unidades desse caderno, ela é utilizada em vários testes estatísticos.
A variância mede como os dados variam em torno da média (PAGANO;
GAUVREAU, 2013). Se a variância é pequena, quer dizer que os dados estão
agrupados em torno da média, enquanto uma variância grande significa que os
dados estão dispersos em relação à média (VIEIRA, 2011).
21
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
∑ ( xi - x )
2 2
=
elevar (xi - x ) ao quadrado, conforme a equação: s
( n - 1) i =1
Sempre que você for calcular uma variância, utilize essa última
equação. A equação nos diz que devemos fazer o somatório do quadrado da
diferença de cada unidade amostral em relação à média e depois dividir esse
somatório por n - 1. Na equação anterior dividimos o somatório apenas por
n, mas o correto é dividir por n - 1, pois a equação da variância apresenta
uma estimativa, que é x . Sempre que existirem estimativas em uma equação,
o número equivalente às estimativas deve ser descontado do tamanho
amostral (n).
1 n
1 44, 2
∑ ( xi - x ) =
2
s2 = × 44, 2 = = 4,9
( n - 1) i =1 10 - 1 9
22
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
FONTE: A autora
∑(x - x )
2
2
=s s
=
n -1
23
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
ATENCAO
avaliação de estatística (Tabela 1). Para isso precisamos do desvio padrão (s = 2,2)
e da média ( x = 5,7). Substituindo os valores na equação, temos:
s 2, 2
CV = ×100 = ×100 =38, 6%
x 5, 7
24
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
25
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
6.1 TABELAS
Toda tabela é composta por quatro elementos: o título, que explica o
conteúdo da tabela; o cabeçalho, que indica qual é o conteúdo de cada coluna;
a coluna indicadora, que especifica o conteúdo de cada linha; e o corpo, que é
preenchido pelos dados dispostos em linhas e colunas (VIEIRA, 2011).
26
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
27
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
1,0 1,5 2,0 2,2 2,3 2,8 3,0 3,3 3,7 3,9
4,0 4,2 4,4 4,9 5,0 5,0 5,0 5,3 5,5 5,7
5,7 5,9 6,0 6,0 6,0 6,0 6,0 6,1 6,4 6,5
6,5 6,5 6,9 7,0 7,0 7,0 7,2 7,3 7,5 7,5
7,6 7,9 8,0 8,3 8,4 8,5 9,0 9,5 10,0 10,0
FONTE: A autora
Além disso, a frequência absoluta de cada classe também pode ser expressa
em frequência relativa (veja a Tabela 6). Para isso, é necessário dividir o número
de acadêmicos de cada classe pelo número total de acadêmicos estudados (n = 50)
e multiplicar por 100. Por exemplo, a frequência relativa da primeira classe é (11
x 50)/100 = 22% (Tabela 6).
28
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
Estágio sucessional
Síndrome de
Não Total
dispersão Pioneira Secundária Climácica
classificada
Zoocoria 106 264 137 57 564
Anemocoria 32 64 5 6 107
Autocoria 16 20 6 7 49
Não
0 0 0 3 3
classificada
Total 154 348 148 73 723
FONTE: Adaptado de Gasper et al. (2014)
6.2 GRÁFICOS
Além da estatística descritiva e de tabelas, também podemos utilizar
gráficos para organizar e resumir dados. A partir de agora você conhecerá os
principais tipos de gráficos que podem ser usados para apresentar dados.
29
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
30
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
6.2.2 Histograma
O histograma é um tipo de gráfico usado para representar distribuições
de frequências de variáveis discretas ou contínuas (PAGANO; GAUVREAU,
2013). É composto por um eixo horizontal (eixo x) que representa as classes em
que a amplitude de valores da variável foi separada; e um eixo vertical (eixo y),
que compreende a frequência de observações dentro de cada classe. A frequência
de observações de cada classe é representada pela área de barras verticais. O
conjunto da área de todas as barras deve somar 100% (PAGANO; GAUVREAU,
2013). Dessa forma, a proporção da área de uma classe é equivalente à sua
frequência relativa e, assim, um histograma de frequências relativas tem o mesmo
formato que um histograma de frequências absolutas. Note que as barras devem
ser justapostas, o que indica que a variável representada é contínua.
FONTE: A autora
31
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
Um box plot é composto por uma caixa central, que se estende verticalmente,
que corresponde ao intervalo interquartil e representa 50% dos dados. O limite
inferior da caixa corresponde ao valor do primeiro quartil, o limite superior da
caixa representa o valor do terceiro quartil, e o pequeno quadrado no centro
indica a mediana (PAGANO; GAUVREAU, 2013). Caso a mediana esteja situada
próxima ao meio da caixa, os dados são ligeiramente simétricos.
32
TÓPICO 1 | INTRODUÇÃO À ESTATÍSTICA
FONTE: A autora
33
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
FONTE: A autora
34
RESUMO DO TÓPICO 1
Neste tópico, você aprendeu que:
• A Lei dos Grandes Números estabelece que quanto maior o tamanho amostral,
mais próxima uma estimativa estará do parâmetro populacional.
35
• A Estatística Descritiva é utilizada para descrever resumidamente um
conjunto de dados por meio das: i) medidas de tendência central (média,
mediana e moda), que descrevem o valor central dentre a variação de valores
que as unidades amostrais podem apresentar; ii) medidas de dispersão
(amplitude, intervalo interquartil, variância, desvio padrão e coeficiente de
variação), que avaliam quanto os valores das unidades amostrais podem
variar além da medida de tendência central.
36
AUTOATIVIDADE
Sp1 Sp2 Sp3 Sp4 Sp5 Sp6 Sp7 Sp8 Sp9 Sp10 Sp11
Área foliar (cm )
2
47,1 42,5 32,0 27,9 22,6 20,5 5,0 16,0 35,6 23,1 15,9
Área foliar específica
108,6 83,9 75,8 76,3 138,6 82,4 91,5 76,1 89,3 82,5 87,7
(cm2.g-1)
Para cada variável apresentada acima (área foliar e área foliar específica),
calcule:
DISTRIBUIÇÃO DE PROBABILIDADES
1 INTRODUÇÃO
Você acabou de aprender que a maioria dos estudos científicos precisa
trabalhar com amostras, pois é impossível coletar dados de toda a população.
Você também estudou como resumir e apresentar dados de uma amostra por
meio da estatística descritiva, tabelas e gráficos. No entanto, os pesquisadores
geralmente querem ir além de apenas apresentar dados. O objetivo maior é usar
informações contidas na amostra para fazer inferências a respeito da população.
A base teórica que permite dar esse passo é a probabilidade. Portanto, agora é
importante fazer uma revisão dos conceitos relacionados à probabilidade, bem
como estudar os principais tipos de distribuição de probabilidades.
39
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
40
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES
41
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
2 DISTRIBUIÇÃO DE PROBABILIDADES
Você estudou anteriormente que variável é uma característica observada
nas unidades amostrais e que varia entre as unidades. Uma variável pode assumir
diferentes valores, e se os valores ocorrem por influência do acaso, essa variável é
chamada de variável aleatória (VIEIRA, 2011). Por exemplo, ao tirar uma carta do
baralho, essa carta pode ser qualquer uma dentre as 52 que compõem o baralho.
Qual carta será retirada depende do acaso. No exemplo do reflorestamento de
araucárias, o número de pinhas por araucária também é uma variável aleatória.
Se fizermos um sorteio para amostrar uma araucária, essa araucária terá um
determinado número de pinhas, que possivelmente seria diferente se outra
araucária tivesse sido sorteada.
42
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES
43
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
FONTE: A autora
44
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES
FONTE: A autora
45
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
Note que nos dois histogramas mencionados existe uma maior frequência
de observações para os valores centrais, enquanto valores mais extremos são
menos frequentes. Muitas variáveis estudadas na biologia apresentam esse tipo
de distribuição de frequências, que é muito parecida com uma distribuição de
probabilidades teórica chamada de distribuição normal.
46
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES
47
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
FONTE: A autora
i) A área sob a curva entre a média (m) e um desvio padrão (s) equivale a 34,13%
da população. Como a curva é simétrica, 68,26% da área sob a curva estão
entre m + s e m - s, o que corresponde a aproximadamente 2/3 da população.
FONTE: A autora
49
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
iii) Grande parte (95,44%) dos recém-nascidos pesa entre (m - 2s) = 3161 - (2 x 540)
= 2081 g e (m + 2s) = 3161 + (2 x 540) = 4241 g.
iv) Quase todos (99,74%) os recém-nascidos pesam entre (m - 3s) = 3161 - (3 x 540)
= 1541 g e (m + 3s) = 3161 + (3 x 540) = 4781 g.
50
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES
A área sob a curva para cada valor z é tabelada e pode ser consultada em
uma tabela chamada de Tabela de Distribuição Z (veja o Apêndice 1 no final do
caderno). O corpo da tabela mostra a área sob a curva correspondente a cada valor
z da cauda direita da curva, ou seja, somente valores positivos de z. A combinação
entre a primeira coluna (valores inteiros e decimais de z) e a primeira linha (valores
centesimais) da tabela indicam os valores de z possíveis. Por exemplo, para achar
a área sob a curva quando z = 1 (ou seja, igual a um desvio padrão), basta olhar o
valor que está na 11ª linha e na 1ª coluna, que é igual a 0,3413. Assim, a área sob a
curva entre m = 0 e z = 1 é de 0,3413 (ou 34,13%). A área sob a curva de um valor z
negativo é igual ao valor positivo de z, pois a curva normal é simétrica. Portanto,
a área sob a curva entre m = 0 e z = -1 também é de 0,3413.
51
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
FONTE: A autora
TURO S
ESTUDOS FU
52
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES
dessa população, todas compostas por dois valores. Em cada retirada, antes
de tirar o segundo valor, o primeiro valor foi reposto à população. Para cada
amostra foi calculada uma média a partir dos dois valores, essa média é uma
estimativa da média populacional. Pela combinação dos valores foi possível obter
16 amostras diferentes, que apresentaram sete médias distintas. Na Tabela 9 você
pode ver a frequência em que cada média foi observada. Essa tabela representa
uma distribuição amostral das médias.
5,0 1 6,25
7,5 2 12,50
10,0 3 18,75
12,5 4 25,00
15,0 3 18,75
17,5 2 12,50
20,0 1 6,25
Total 16 100,00
FONTE: Adaptado de Callegari-Jacques (2003)
54
TÓPICO 2 | DISTRIBUIÇÃO DE PROBABILIDADES
GRÁFICO 10 - DISTRIBUIÇÕES
Normalmente nós não amostramos uma mesma população várias vezes para
construir uma distribuição amostral das médias. No entanto, esse conhecimento
é fundamental, pois ao obter uma amostra de maneira aleatória e suficientemente
grande, podemos assumir que a média amostral segue uma distribuição normal.
Assim, temos maior segurança ao estimar a média populacional a partir da média
amostral, pois sabemos que o valor da média amostral obtido tem grande chance
de estar próximo do valor da média populacional.
55
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
O erro padrão da média também pode ser interpretado como uma medida
de variação da média se uma nova amostra aleatória e independe fosse tomada
da população, ou seja, se o estudo fosse repetido, como as estimativas da média
poderiam variar.
TURO S
ESTUDOS FU
56
RESUMO DO TÓPICO 2
Neste tópico, você aprendeu que:
• Cada valor z tem uma área sob a curva correspondente, que representa
a distância entre m = 0 e o valor z, que pode ser consultada na Tabela de
Distribuição Z.
57
• Teorema do Limite Central diz que médias obtidas de amostras grandes,
independentes, de tamanho igual e retiradas aleatoriamente de uma população,
apresentam distribuição normal, não importando qual é a distribuição de
frequências da população original.
58
AUTOATIVIDADE
59
60
UNIDADE 1
TÓPICO 3
TESTE DE HIPÓTESES
1 INTRODUÇÃO
Todo estudo científico tem uma pergunta norteadora. Para tentar
responder às perguntas, o pesquisador inicia estabelecendo afirmações que
serão investigadas (CALLEGARI-JACQUES, 2003). Essas afirmações são
denominadas de hipóteses. Depois de definir a pergunta e as hipóteses de
trabalho, o pesquisador monta um delineamento amostral e coleta dados. Os
dados representam evidências que podem suportar ou refutar as hipóteses. Por
isso, o pesquisador precisa avaliar os dados coletados para saber se eles fornecem
evidências que suportam ou não determinada hipótese. Como geralmente os
dados são provenientes de amostras, a decisão sobre uma hipótese sempre
tem uma probabilidade de erro. Assim, o pesquisador também precisa medir o
tamanho do erro associado à decisão em relação a cada hipótese.
2 TESTE DE HIPÓTESES
O teste de hipóteses, também chamado de teste de significância, é
o procedimento estatístico formal que permite testar diferentes hipóteses
(SALSBURG, 2009). Um teste de hipóteses compreende várias etapas e a primeira
delas é estabelecer as hipóteses a serem testadas. De acordo com a pergunta de
trabalho, o pesquisador define dois tipos diferentes de hipóteses: uma é a hipótese
nula e a outra é a hipótese alternativa. A partir de agora você vai estudar o que
são esses tipos de hipótese, bem como as demais etapas de um teste de hipóteses.
61
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
Vamos exemplificar o que é uma hipótese nula. Imagine que você gostaria
de saber se araucárias de reflorestamentos, como as da Figura 1, produzem mais
pinhas por árvore que as araucárias de fragmentos florestais naturais. Neste
caso, a hipótese nula seria que não existe diferença na produção de pinhas entre
araucárias de reflorestamentos e araucárias de fragmentos florestais naturais.
62
TÓPICO 3 | TESTE DE HIPÓTESES
2.3 P-VALOR
Após formular as hipóteses nula e alternativa, o próximo passo de um
teste de hipóteses é avaliar quanto os dados suportam ou não a hipótese nula. A
avaliação dos dados acontece por meio de um teste estatístico. Cada pergunta e
hipótese de estudo tem um teste estatístico específico, que fornece uma estatística
do teste, ou seja, um valor numérico obtido a partir de cálculos estatísticos. Essa
estatística do teste pode ser convertida em uma probabilidade, que é chamada
de p-valor. Portanto, o p-valor é uma medida de probabilidade calculada a partir
dos dados observados.
63
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
Quando o p-valor calculado a partir dos dados é menor que o nível crítico
de significância, a tomada de decisão é rejeitar a hipótese nula. Já quando o
p-valor calculado for maior que o nível crítico de significância, a decisão é aceitar
a hipótese nula. Veja a relação entre nível crítico de significância e p-valor na
Tabela 10.
64
TÓPICO 3 | TESTE DE HIPÓTESES
TABELA 10 - RELAÇÃO ENTRE P-VALOR, NÍVEL CRÍTICO DE SIGNIFICÂNCIA (a) E HIPÓTESE NULA (H0)
FONTE: A autora
65
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
3 TIPOS DE ERROS
Quando aplicamos um teste de hipóteses, estamos trabalhando com
dados limitados e incompletos. A inferência estatística feita a partir desses dados
apresenta um erro associado. Caso fosse possível fazer um censo, teríamos acesso
aos parâmetros populacionais e certeza se a hipótese nula é falsa ou verdadeira,
porém, isso geralmente é impossível em pesquisas científicas, estamos sujeitos a
cometer dois tipos de erros: erro Tipo I e erro Tipo II.
Tomada de decisão
Verdade
Não rejeitar H0 Rejeitar H0
Decisão correta Erro Tipo I
H0 é verdadeira
Probabilidade: 1 - a Probabilidade: a
Erro Tipo II Decisão correta
H0 é falsa
Probabilidade: b Probabilidade: 1 - b
FONTE: ADAPTADO DE CALLEGARI-JACQUES (2003)
66
TÓPICO 3 | TESTE DE HIPÓTESES
E
IMPORTANT
O texto que você vai ler a seguir foi retirado do livro “Uma senhora toma chá...
como a estatística revolucionou a ciência no século XX”, de David Salsburg. Este livro é
uma ótima sugestão para quem quer saber um pouco sobre a vida e as contribuições dos
cientistas responsáveis por grandes avanços na estatística moderna e na pesquisa científica.
O livro é excelente e a leitura muito prazerosa! A linguagem é acessível mesmo às pessoas
sem muito conhecimento estatístico ou matemático.
67
UNIDADE 1 | FUNDAMENTOS EM ESTATÍSTICA
LEITURA COMPLEMENTAR
[...] alguns leitores podem menosprezar esse esforço como momento menor
de uma conversa em tarde de verão. ‘Que diferença faz se a senhora consegue
distinguir uma infusão da outra?’, perguntarão. ‘Nada existe de importante ou
de grande mérito científico nesse problema’, argumentarão com desprezo. ‘Essas
cabeças privilegiadas deveriam usar sua poderosa capacidade cerebral para algo
que beneficiasse a humanidade’.
[...] apesar do que os não cientistas possam pensar sobre a ciência e sua
importância, [...] a maioria dos cientistas se empenha em suas pesquisas porque
está interessada nos resultados e porque obtém estímulo intelectual com suas
tarefas. Raras vezes os bons cientistas pensam a respeito da importância de seu
trabalho. Assim foi naquela ensolarada tarde em Cambridge. A senhora poderia
ou não estar certa sobre o paladar do chá. A graça estava em encontrar um modo
de afirmar se estava certa, e, sob a direção do homem de cavanhaque, começaram
a discutir como poderiam fazer isso.
68
TÓPICO 3 | TESTE DE HIPÓTESES
FONTE: SALSBURG, D. Uma senhora toma chá... como a estatística revolucionou a ciência no
século XX. Rio de Janeiro: Zahar, 2009, p. 288.
ATENCAO
69
RESUMO DO TÓPICO 3
Neste tópico, você aprendeu que:
• O p-valor indica quão provável seria obter uma amostra igual à que foi
observada se a hipótese nula fosse verdadeira. O p-valor é calculado a partir
dos dados observados.
71
FONTE: Adaptado de <http://flowingdata.com/2014/05/09/type-i-and-ii-errors-simplified/>.
Acesso em: 20 jul. 2016.
72
UNIDADE 2
TESTES ESTATÍSTICOS I
OBJETIVOS DE APRENDIZAGEM
A partir desta unidade você será capaz de:
PLANO DE ESTUDOS
A segunda unidade se divide em três tópicos. Ao final de cada um deles
você encontrará atividades que o auxiliarão na compreensão dos conteúdos
abordados.
73
74
UNIDADE 2
TÓPICO 1
TESTE Z E TESTE T
1 INTRODUÇÃO
Na Unidade 1 deste caderno você aprendeu conceitos fundamentais que
serão empregados em todos os testes estatísticos apresentados nesta e na próxima
unidade. Vamos fazer uma breve revisão dos conceitos mais importantes da
Unidade 1! Você viu que em Ciências Biológicas geralmente trabalhamos com
amostras, pois é impossível coletar dados de toda a população. A Lei dos Grandes
Números garante que, ao aumentar o tamanho amostral, as estimativas obtidas
a partir das amostras se aproximam do parâmetro populacional. Você aprendeu
como descrever uma amostra a partir da média, variância e desvio padrão. Você
estudou o que é distribuição normal e distribuição amostral de médias e aprendeu
como medir a variabilidade da distribuição amostral de médias por meio do erro
padrão da média. O Teorema do Limite Central garante que médias obtidas de
amostras grandes, independentes, de tamanho igual e retiradas aleatoriamente
de uma população, apresentam distribuição normal, não importando qual é a
distribuição de frequências da população original. Por fim, você estudou todas as
etapas de um teste de hipóteses.
2 TESTE Z
Agora que relembrou os conceitos fundamentais, você está pronto para
realizar o primeiro teste estatístico! Começaremos estudando o teste Z, que é
um teste estatístico em que a distribuição do teste segue a distribuição normal
padronizada, também chamada de Distribuição Z (PAGANO; GAUVREAU, 2013).
O teste Z pode ser usado para avaliar se uma amostra pertence a determinada
população, que é chamada de população de referência. Assim, o teste Z avalia
o tamanho da diferença entre uma média amostral (x) e a média da população
de referência (m) (CALLEGARI-JACQUES, 2003; PAGANO; GAUVREAU,
2013). É necessário aplicar um teste estatístico neste tipo de comparação, pois
o valor paramétrico para a média amostral é desconhecido. No teste Z, o valor
de x é usado como uma estimativa do parâmetro, que é a média paramétrica da
amostra. Como a média amostral e a média paramétrica da amostra dificilmente
são iguais, o teste estatístico fornece uma medida de incerteza relacionada à
estimativa (CALLEGARI-JACQUES, 2003).
75
UNIDADE 2 | TESTES ESTATÍSTICOS I
76
TÓPICO 1 | TESTE Z E TESTE T
FONTE: A autora
77
UNIDADE 2 | TESTES ESTATÍSTICOS I
78
TÓPICO 1 | TESTE Z E TESTE T
3 TESTE T
3.1 DISTRIBUIÇÃO T
O primeiro teste estatístico que você estudou foi o teste Z, que tem a
Distribuição Z como distribuição de referência. Você aprendeu que o teste Z é
usado para medir a diferença entre uma média amostral (x) e a média de uma
população de referência (m), quando a média e o desvio padrão da população
de referência são conhecidos. Em muitos casos temos uma ideia da média da
população de referência, mas não temos acesso ao desvio padrão da população, o
que inviabiliza a realização de um teste Z.
79
UNIDADE 2 | TESTES ESTATÍSTICOS I
80
TÓPICO 1 | TESTE Z E TESTE T
ATENCAO
81
UNIDADE 2 | TESTES ESTATÍSTICOS I
82
TÓPICO 1 | TESTE Z E TESTE T
∑d2 -
n . Na equação, s2d é a variância das diferenças entre todas as amostras
n -1
pareadas,∑d é o somatório das diferenças, ∑d2 é o somatório do quadrado das
diferenças e n é tamanho amostral (tabela a seguir).
83
UNIDADE 2 | TESTES ESTATÍSTICOS I
d
d) Calculamos a estatística do teste T pela equação: t = .
s 2d
n
O numerador da equação é a média das diferenças entre todas as
amostras pareadas (d), o que representa uma medida de diferença entre as duas
amostras estudadas. Já o denominador da equação é o erro padrão da média das
diferenças, dado pela raiz quadrada da razão entre a variância das diferenças (s2d)
e o tamanho amostral (n), ou seja, representa uma medida de erro. A estatística do
teste T pareado segue a lógica da divisão de uma medida de efeito (a média das
diferenças entre as amostras) por uma medida de erro (o erro padrão da média).
Note que o valor t aumenta quando a medida de efeito aumenta e a medida de
erro diminui e, assim, a tendência é rejeitar a hipótese nula; o valor t diminui
quando a medida de efeito diminui e quando a medida de erro aumenta e, assim,
a tendência é aceitar a hipótese nula.
FONTE: A autora
84
TÓPICO 1 | TESTE Z E TESTE T
85
UNIDADE 2 | TESTES ESTATÍSTICOS I
FONTE: A autora
86
TÓPICO 1 | TESTE Z E TESTE T
FONTE: A autora
87
UNIDADE 2 | TESTES ESTATÍSTICOS I
88
TÓPICO 1 | TESTE Z E TESTE T
x1 - x2
d) Calculamos o valor t, pela equação: t = .
1 1 2
+ s p
n1 n2
89
UNIDADE 2 | TESTES ESTATÍSTICOS I
90
TÓPICO 1 | TESTE Z E TESTE T
1° Definimos a hipótese nula e alternativa. H0: não existe diferença nas variâncias
amostrais; H1: uma das variâncias é maior que a outra.
Você verá a seguir que, no teste F, é necessário definir qual das variâncias
das amostras é a maior e qual é a menor. Por isso, podemos estabelecer, já na
hipótese alternativa, uma expectativa de direção da diferença entre as variâncias
e, assim, o teste é unilateral.
91
UNIDADE 2 | TESTES ESTATÍSTICOS I
92
TÓPICO 1 | TESTE Z E TESTE T
18 55 46
19 56 43
20 57 47
21 44 43
22 53 38
23 48 48
24 58 51
25 61
Média 54,4 45,0
Variância 26,5 26,2
FONTE: A autora
FONTE: A autora
93
UNIDADE 2 | TESTES ESTATÍSTICOS I
x1 − x2
t=
s 21 s 2 2
+
n1 n2
2
s 21 s 2 2
+
n1 n2
gl = 2 2
.
s 21 s 2 2
n1 + n2
n1 − 1 n2 − 1
95
UNIDADE 2 | TESTES ESTATÍSTICOS I
FONTE: A autora
96
TÓPICO 1 | TESTE Z E TESTE T
+ +
n n2
gl = 1 2 16 16 24, 44
2
= 2 2
= = 23, 73.
s 1 s 2
2 2
19, 2 59, 9 1, 03
n1 + n2 16 + 16
n1 − 1 n2 − 1 16 − 1 16 − 1
ATENCAO
98
TÓPICO 1 | TESTE Z E TESTE T
FONTE: A autora
100
TÓPICO 1 | TESTE Z E TESTE T
FONTE: A autora
Até agora, você viu como usar o intervalo de confiança para comparar
uma média amostral com a média de uma população conhecida. Outra
possibilidade é utilizar o intervalo de confiança para comparar duas médias
amostrais. Neste caso, são estabelecidos dois intervalos de confiança (um para
cada amostra), a partir das médias e desvios padrões amostrais e com base na
distribuição T. Se o intervalo de confiança de uma amostra pode abranger a
média populacional da outra amostra, ou seja, existe sobreposição entre os
intervalos de confiança, concluímos, com certo grau de confiança, que as duas
amostras são provenientes de uma mesma população. Quando os intervalos de
confiança não se sobrepõem, concluímos, com certo grau de confiança, que as
amostras apresentam médias populacionais diferentes, ou seja, as amostras são
provenientes de duas populações distintas.
101
UNIDADE 2 | TESTES ESTATÍSTICOS I
FONTE: A autora
102
RESUMO DO TÓPICO 1
Neste tópico, você aprendeu que:
d
• A estatística do teste T pareado é dada por t = , em que o denominador é
s 2d
n
a média das diferenças entre todas as amostras pareadas e o denominador é o
erro padrão da média das diferenças. Os graus de liberdade do teste T pareado
são dados por n - 1.
103
• O teste T para amostras independentes é usado para avaliar se duas médias
amostrais independentes pertencem à mesma população. As amostras são
independentes quando as unidades amostrais que compõem uma amostra
diferem, em relação ao fenômeno estudado, das unidades que compõem a
outra amostra.
x1 - x2
• A estatística do teste T para variâncias heterogêneas é dada por t = .
s 21 s 2 2
+
2 n1 n2
s 21 s 2 2
+
Os graus de liberdade são estabelecidos por: gl = n1 n2 .
2 2
s 21 s 2 2
n1 + n2
n1 - 1 n2 - 1
s
• Quando s é conhecido, o intervalo de confiança bilateral é dado por: x ± z . .
n
105
AUTOATIVIDADE
106
Área basal (m2/ha)
Espécie
1994 2000
Aparisthmium cordatum 0,463 0,463
Aspidosperma australe 1,219 1,267
Bathysa australis 0,528 0,537
Brosimum lactescens 1,296 1,348
Cryptocarya aschersoniana 1,806 1,658
Euterpe edulis 5,600 5,750
Garcinia gardneriana 0,084 0,095
Guatteria australis 0,383 0,347
Hirtella hebeclada 0,413 0,372
Marlierea obscura 0,346 0,321
Maytenus robusta 0,091 0,080
Ocotea aciphylla 0,266 0,298
Psychotria nuda 0,091 0,094
Psychotria suterella 0,074 0,065
Virola bicuhyba 1,314 1,381
108
UNIDADE 2 TÓPICO 2
DELINEAMENTO EXPERIMENTAL
1 INTRODUÇÃO
Na Unidade 1 deste caderno você estudou sobre a necessidade e importância
de fazer amostragem para coletar dados e responder perguntas científicas. Neste
tópico, você estudará um pouco mais sobre amostragem e delineamento amostral,
mas, principalmente, com foco em estudos experimentais. O planejamento de
estudos experimentais geralmente é denominado de delineamento experimental,
mas também pode ser chamado de delineamento amostral.
2 EXPERIMENTO
Experimento é um procedimento replicável, que normalmente acontece
sob condições controladas e tem por objetivo verificar a validade de hipóteses
(GOTELLI; ELLISON, 2011). Num experimento, geralmente buscamos reduzir
fontes de variação que não são foco do estudo e que podem confundir a
interpretação dos resultados, mas, por outro lado, manipulamos, de maneira
controlada, o fator que influencia o fenômeno estudado.
109
UNIDADE 2 | TESTES ESTATÍSTICOS I
110
TÓPICO 2 | DELINEAMENTO EXPERIMENTAL
111
UNIDADE 2 | TESTES ESTATÍSTICOS I
2.3 REPLICAÇÃO
Não é possível tirarmos conclusões seguras baseadas na observação de
uma única unidade amostral. As unidades amostrais de uma população variam
entre si e, com a amostragem de apenas uma unidade, essa variabilidade
não pode ser estimada. Além disso, uma única unidade amostral pode não
representar adequadamente a população como um todo. Por isso, é importante
a replicação das unidades amostrais que compõem cada grupo (GOTELLI;
ELLISON, 2011). Cada replicação das unidades amostrais nos grupos é chamada
de réplica (GOTELLI; ELLISON, 2011). Por exemplo, no estudo da relação entre
crescimento da planta e herbivoria, não basta observar apenas uma planta sem
e outra com acesso de herbívoros. É necessário avaliar um conjunto de plantas
de cada grupo (com e sem acesso de herbívoros) e, assim, cada planta de cada
grupo representa uma réplica.
112
TÓPICO 2 | DELINEAMENTO EXPERIMENTAL
113
UNIDADE 2 | TESTES ESTATÍSTICOS I
2.6 CASUALIZAÇÃO
A casualização, também chamada de randomização, é alocação aleatória
das unidades amostrais (réplicas) pelos grupos tratados e controle (GOTELLI;
ELLISON, 2011). A casualização é importante por diminuir o risco de tendências
relacionadas às unidades amostrais e deve ser bem planejada, pois é uma das
etapas da amostragem que não pode ser alterada após a execução do experimento.
3 TIPOS DE DELINEAMENTO
Agora que você apreendeu conceitos básicos sobre delineamento, já pode
estudar quais são os principais tipos de delineamento experimental.
115
UNIDADE 2 | TESTES ESTATÍSTICOS I
TURO S
ESTUDOS FU
116
TÓPICO 2 | DELINEAMENTO EXPERIMENTAL
ele teve que usar ratos de duas idades diferentes, pois não havia um número
suficiente de ratos da mesma idade. Neste exemplo, as unidades amostrais não
são similares entre si e, além disso, podem apresentar respostas diferentes em
relação aos tratamentos. Em experimentos de campo, as unidades amostrais
podem ter respostas heterogêneas aos tratamentos, pois as condições ambientais
em que as unidades estão expostas são diferentes, por exemplo, diferentes níveis
de luminosidade, de altitude, tipos de solo etc.
117
UNIDADE 2 | TESTES ESTATÍSTICOS I
FONTE: A autora
118
TÓPICO 2 | DELINEAMENTO EXPERIMENTAL
119
UNIDADE 2 | TESTES ESTATÍSTICOS I
120
RESUMO DO TÓPICO 2
Neste tópico, você aprendeu que:
121
• O delineamento inteiramente casualizado é composto por um fator, que
apresenta diferentes níveis, que são os tratamentos. Serve para avaliar se existem
diferenças entre os tratamentos e quais tratamentos são diferentes entre si.
122
AUTOATIVIDADE
123
a) Quantos e quais foram os fatores investigados no experimento?
b) Quantos e quais foram os níveis de cada fator?
c) Qual foi o número de réplicas por tratamento?
d) Que tipo de delineamento experimental os pesquisadores usaram?
124
UNIDADE 2
TÓPICO 3
ANÁLISE DE VARIÂNCIA
1 INTRODUÇÃO
No primeiro tópico desta unidade você aprendeu como testar se duas
médias amostrais pertencem à mesma população, por meio do teste T. Geralmente,
o que acontece é que temos mais de dois grupos e, portanto, mais de duas médias
amostrais para avaliar se pertencem ou não à mesma população. Nesses casos,
os dados devem ser analisados por meio de uma técnica diferente, chamada de
análise de variância ou anova.
125
UNIDADE 2 | TESTES ESTATÍSTICOS I
e, portanto, a chance de cometer o erro tipo I também aumenta para 14%. Assim,
é muito mais fácil encontrar diferenças entre médias em múltiplas comparações,
quando na verdade essas diferenças não existem.
126
TÓPICO 3 | ANÁLISE DE VARIÂNCIA
ATENCAO
127
UNIDADE 2 | TESTES ESTATÍSTICOS I
128
TÓPICO 3 | ANÁLISE DE VARIÂNCIA
Vejamos como são calculadas a média geral (xT) e a média de cada grupo
(xi), mencionadas nas tabelas anteriores. A média geral é obtida pela equação:
∑
N
j =1
xj
xT =
N
A equação indica que devemos somar todas as unidades amostrais do
estudo e dividir pelo número total de unidades amostrais do estudo.
∑
ni
x
j =1 ij .
A média de cada grupo é calculada pela equação: xi = A equação
ni
indica que devemos somar todas as unidades amostrais do grupo i e dividir pelo
número total de unidades amostrais do grupo i.
entre grupos são dados por glE = g - 1; iii) os graus de liberdade para a soma
de quadrados dentro de grupos são dados por glD = N - g.
c) Calculamos a variância entre grupos (s2E) dividindo a soma de quadrados
entre grupos pelos graus de liberdade associados, conforme a equação:
SQE
s2E = .
glE
d) Calculamos a variância dentro de grupos (s2D) dividindo a soma de
quadrados dentro de grupos pelos graus de liberdade associados, conforme
2 SQD
a equação: s D = .
glD
e) Calculamos a estatística F pela divisão da variância entre grupos pela
s2E
variância dentro de grupos, conforme: F = .
s2D
Note que o numerador do teste F – a variância entre grupos – representa
a diferença entre as médias dos grupos, ou seja, é uma medida do efeito dos
tratamentos sobre as unidades amostrais. O denominador do teste F – a variância
dentro de grupos – corresponde à variabilidade entre as unidades amostrais e é
uma medida de erro. Valores elevados para a estatística F são obtidos quando a
variância entre grupos é alta, mas a variância dentro de grupos é baixa e, nesses
casos, a tendência é rejeitar a hipótese nula. Quando a variância entre grupos é
baixa e a variância dentro de grupos é alta, a estatística F é baixa, o que geralmente
leva à aceitação da hipótese nula.
FONTE: A autora
131
UNIDADE 2 | TESTES ESTATÍSTICOS I
ATENCAO
132
TÓPICO 3 | ANÁLISE DE VARIÂNCIA
133
UNIDADE 2 | TESTES ESTATÍSTICOS I
134
TÓPICO 3 | ANÁLISE DE VARIÂNCIA
FONTE: A autora
135
UNIDADE 2 | TESTES ESTATÍSTICOS I
136
TÓPICO 3 | ANÁLISE DE VARIÂNCIA
TABELA 23 - DADOS ORIGINAIS E CÁLCULOS PARA OBTER A SOMA DE QUADRADOS TOTAL (SQT)
FONTE: A autora
TABELA 24 - CÁLCULOS PARA OBTER A SOMA DE QUADRADOS ENTRE GRUPOS (SQE) E SOMA
DE QUADRADOS DENTRO DE GRUPOS (SQD)
Borda Meio Interior Borda Meio Interior
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (11 – 12,5)2 = (27 – 27,5)2 = (46 – 47,4)2 =
276,7 = 2,7 333,7 2,3 0,3 2,0
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (12 – 12,5)2 = (27 – 27,5)2 = (47 – 47,4)2 =
276,7 = 2,7 333,7 0,3 0,3 0,2
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (13 – 12,5)2 = (28 – 27,5)2 = (47 – 47,4)2 =
276,7 = 2,7 333,7 0,3 0,3 0,2
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (12 – 12,5)2 = (27 – 27,5)2 = (47 – 47,4)2 =
276,7 = 2,7 333,7 0,3 0,3 0,2
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (9 – 12,5)2 = (24 – 27,5)2 = (44 – 47,4)2 =
276,7 = 2,7 333,7 12,3 12,3 11,6
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (13 – 12,5)2 = (28 – 27,5)2 = (48 – 47,4)2 =
276,7 = 2,7 333,7 0,3 0,3 0,4
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (16 – 12,5)2 = (31 – 27,5)2 = (51 – 47,4)2 =
276,7 = 2,7 333,7 12,3 12,3 13,0
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (15 – 12,5)2 = (30 – 27,5)2 = (50 – 47,4)2 =
276,7 = 2,7 333,7 6,3 6,3 6,8
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (10 – 12,5)2 = (25 – 27,5)2 = (45 – 47,4)2 =
276,7 = 2,7 333,7 6,3 6,3 5,8
(12,5 – 29,1)2 = (27,5 – 29,1)2 (47,4 - 29,1)2 = (14 – 12,5)2 = (28 – 27,5)2 = (49 – 47,4)2 =
276,7 = 2,7 333,7 2,3 0,3 2,6
g ni 6130,1* g ni 123,4*
∑∑ ( xi - xT ) ∑∑ ( x - xT )
2 2
SQE
= SQE
= i
=i 1 =j 1 =i 1 =j 1
FONTE: A autora
137
UNIDADE 2 | TESTES ESTATÍSTICOS I
iii) Borda x Interior – H0: não existe diferença na riqueza de espécies entre
borda e interior dos fragmentos florestais; H1: existe diferença na riqueza
de espécies entre borda e interior dos fragmentos florestais.
2° Assumimos um nível crítico de significância de 0,05.
3° Encontramos o valor de q crítico indicando: a = 0,05, os graus de liberdade
associados à soma de quadrados dentro de grupos (glD = N - g = 30 - 3 = 27); o
número de grupos que estão sendo comparados que, no caso, equivale a três.
Consultada a Tabela de Distribuição Q, observamos que não temos o valor para
q0,05; 3; 27, mas sabemos que o valor de q crítico está entre q0,05; 3; 24 = 3,53 e q0,05; 3; 30 = 3,49.
4° Calculamos a estatística do teste de Tukey para cada par de combinações entre
grupos. Os resultados do cálculo do erro padrão (EP) e da estatística do teste de
Tukey estão organizados na tabela a seguir. O erro padrão foi calculado pela equação
s2D 1 1 x A - xB
EPA; B
= + e a estatística do teste de Tukey foi calculada por q A; B = .
2 nA nB EP
139
UNIDADE 2 | TESTES ESTATÍSTICOS I
FONTE: A autora
E
IMPORTANT
Caro acadêmico, o texto que você vai ler a seguir trata sobre uma das
grandes contribuições de Ronald Aylmer Fisher para o desenvolvimento da teoria de
delineamento experimental e para a estatística moderna. Fisher desenvolveu esse estudo
durante o período em que trabalhou como matemático e estatístico na Estação Agrícola
Experimental Rothamsted, em Harpenden - Inglaterra (SALSBURG, 2009). Nessa estação
eram desenvolvidos experimentos com fertilizantes artificiais e linhagens de trigo, centeio,
cevada e batata. Na estação também havia um conjunto de dados histórico de 90 anos
com registros diários de chuva e temperatura, registros semanais de preparação de
fertilizantes e registros anuais de colheita (SALSBURG, 2009). Fisher foi contratado para
analisar estatisticamente esse enorme conjunto de dados. No primeiro estudo, Fisher usou
o banco de dados da Rothamsted, mas no segundo trabalho desenvolveu experimentos
próprios. Veja o texto de Salsburg (2009) a seguir:
140
TÓPICO 3 | ANÁLISE DE VARIÂNCIA
LEITURA COMPLEMENTAR
A ideia básica era simples, isto é, simples depois que foi proposta por
Fisher. Ninguém pensara nisso antes. É óbvio para qualquer um que observe um
campo de grãos que algumas partes são melhores que outras. Em alguns locais, as
plantas crescem altas e carregadas de grãos. Em outros, fracas e irregulares. Isso
pode ser atribuído à forma como a água é drenada, às mudanças no tipo de solo,
à presença de nutrientes desconhecidos, a blocos de ervas perenes ou a alguma
outra força não prevista. Se o cientista agrícola quer testar a diferença entre dois
componentes de fertilizante, ele pode colocar um componente em um lugar do
campo e outro em outra parte. Isso confundirá os efeitos dos fertilizantes com
os efeitos atribuídos às propriedades do solo ou da drenagem. Se os testes são
feitos nos mesmos campos, mas em diferentes anos, os efeitos dos fertilizantes
são confundidos com mudanças de clima de ano a ano.
FONTE: SALSBURG, D. Uma senhora toma chá... como a estatística revolucionou a ciência no
século XX. Rio de Janeiro: Zahar, 2009, p. 288.
NOTA
142
RESUMO DO TÓPICO 3
Neste tópico, você aprendeu que:
• Não podemos usar vários testes T para comparar múltiplas médias amostrais,
pois perdemos o controle do nível crítico de significância e da probabilidade
do erro tipo I assumidos no teste. Além disso, ao aumentar o número de
comparações entre médias, as possíveis combinações par a par também
aumentam e, por vezes, muitas comparações, que geram muitas combinações
par a par, são inviáveis.
143
SQE
• A variância entre grupos é dada por: s 2 E = . A variância dentro de grupos
SQD glE
é calculada por: s 2 D = .
glD
s2E
• A estatística F é calculada por: F = .
s2D
• O p-valor correspondente ao F calculado pode ser obtido pela função “DISTF”
do Excel.
144
AUTOATIVIDADE
145
Unidade amostral Espécie 1 Espécies 2 Espécie 3
1 4,80 5,30 6,50
2 5,00 5,10 6,30
3 5,00 5,30 6,40
4 5,10 5,20 6,30
5 4,90 5,70 6,00
6 5,00 5,40 5,90
7 5,30 5,40 6,10
8 5,20 5,50 6,00
9 4,90 5,50 6,20
10 5,10 5,40 6,20
Média dos grupos 5,03 5,38 6,19
Variância 0,02 0,03 0,04
Média geral 5,53
146
UNIDADE 3
TESTES ESTATÍSTICOS II
OBJETIVOS DE APRENDIZAGEM
A partir desta unidade você será capaz de:
PLANO DE ESTUDOS
A terceira unidade se divide em três tópicos. Ao final de cada tópico você
encontrará atividades que visam melhorar a compreensão dos conteúdos
abordados.
TÓPICO 1 – CORRELAÇÃO
147
148
UNIDADE 3
TÓPICO 1
CORRELAÇÃO
1 INTRODUÇÃO
Na Unidade 2 você estudou o teste T e análise de variância, que são testes
estatísticos que buscam avaliar se conjuntos de unidades amostrais respondem
de maneiras diferentes aos níveis de um determinado fator. Neste tópico você
estudará a correlação, que é um método estatístico que apresenta uma lógica
de funcionamento diferente do teste T e análise de variância. Na correlação, o
objetivo é avaliar se existe alguma relação entre duas variáveis. Portanto, não
temos um fator principal influenciando as unidades amostrais, as duas variáveis
estão no mesmo nível. Por exemplo, podemos investigar se existe relação entre a
temperatura global e a concentração de gases de efeito estufa na atmosfera; entre
a riqueza de espécies e distúrbios antrópicos; ou entre o desempenho de alunos
nas avaliações e o tempo dedicado ao estudo dos conteúdos.
149
UNIDADE 3 | TESTES ESTATÍSTICOS II
150
TÓPICO 1 | CORRELAÇÃO
FONTE: A autora
151
UNIDADE 3 | TESTES ESTATÍSTICOS II
(∑ x )× (∑ y )
i
n
i 1 i
n
∑
n =i 1 =
i =1 i
x ×y -
i
r= n
( ) ( )
2
2
n 2 ∑ i 1x= n 2 ∑ i 1yi
n n
i
∑ i 1x= × ∑ i 1yi -
=
i -
=
n n
x1 y1 x21 y21 x1 x y1
x2 y2 x22 y22 x2 x y2
x3 y3 x23 y23 x3 x y3
⁞ ⁞ ⁞ ⁞ ⁞
xn yn x2n y2n xn x yn
n n n n n
∑x
i =1
i ∑y
i =1
i ∑x
i =1
2
i ∑y
i =1
2
i ∑x ×y
i =1
i i
FONTE: A autora
152
TÓPICO 1 | CORRELAÇÃO
153
UNIDADE 3 | TESTES ESTATÍSTICOS II
1° Precisamos estabelecer as hipóteses nula e alternativa. Neste caso, H0: não existe
relação entre as variáveis X e Y, ou seja, r ≅ 0. Já a hipótese alternativa pode ser
estabelecida de três maneiras, dependendo do conhecimento prévio sobre o
comportamento das variáveis. Se não temos conhecimento e não conseguimos
estabelecer previamente uma direção para a correlação entre as duas variáveis,
então H1: existe relação entre as variáveis X e Y, ou seja, r ≠ 0. Já quando temos
algum conhecimento e conseguimos estabelecer que a relação entre as duas
variáveis provavelmente é positiva, então H1: à medida que a variável X
aumenta, a variável Y também aumenta, ou seja, r > 0; ou quando esperamos
que a relação entre as duas variáveis seja negativa, então H1: à medida que a
variável X aumenta, a variável Y diminui, ou seja, r < 0.
2° Identificamos se o teste estatístico é uni ou bilateral. Se na hipótese alternativa
não estabelecemos uma direção para a relação entre as duas variáveis, o teste
estatístico é bilateral. Quando determinamos uma direção da relação entre as
duas variáveis na hipótese alternativa, tanto positiva quanto negativa, o teste
é unilateral.
3° Indicamos o nível crítico de significância (a).
4° Estabelecemos o valor crítico da estatística do teste. Sabendo que usaremos
um teste T, então a distribuição de referência que deve ser utilizada para
chegar ao valor crítico é a distribuição T (Apêndice 2). Os graus de liberdade
são definidos por n - 2, ou seja, o tamanho da amostra menos dois. Assim, ao
informar a, graus de liberdade e se o teste é uni ou bilateral, chegamos ao valor
crítico, que é representado por ta; n - 2.
5° Calculamos a estatística do teste T, pela equação (CALLEGARI-JACQUES, 2003):
r
t=
1− r2
n−2
154
TÓPICO 1 | CORRELAÇÃO
155
UNIDADE 3 | TESTES ESTATÍSTICOS II
3 VAMOS PRATICAR
Veremos como calcular o coeficiente de correlação de Pearson na prática.
Imagine que gostaríamos de investigar se existe alguma correlação entre as
notas da primeira avaliação de estatística dos alunos de Ciências Biológicas da
UNIASSELVI e o tempo que cada aluno dedicou ao estudo do conteúdo em casa.
Para isso, foram amostrados 20 alunos e para cada aluno foram obtidas as duas
variáveis de interesse: nota da primeira avaliação e tempo de estudo, conforme
apresentado na Tabela 29 (adiante).
FONTE: A autora
FONTE: A autora
157
UNIDADE 3 | TESTES ESTATÍSTICOS II
Tempo de Notas da 1ª
Aluno estudo Avaliação x2i y2i xi x yi
(Variável x) (Variável y)
1 5,0 5,5 25,0 30,3 27,5
2 2,5 3,0 6,3 9,0 7,5
3 3,5 5,0 12,3 25,0 17,5
4 6,0 6,0 36,0 36,0 36,0
5 2,0 2,0 4,0 4,0 4,0
6 3,8 4,0 14,4 16,0 15,2
7 6,5 6,0 42,3 36,0 39,0
8 5,0 6,5 25,0 42,3 32,5
9 4,1 5,0 16,8 25,0 20,5
10 5,5 6,0 30,3 36,0 33,0
11 8,0 9,0 64,0 81,0 72,0
12 7,0 7,5 49,0 56,3 52,5
13 4,3 6,0 18,5 36,0 25,8
14 7,5 7,0 56,3 49,0 52,5
15 8,0 8,5 64,0 72,3 68,0
16 5,0 6,0 25,0 36,0 30,0
17 9,5 8,5 90,3 72,3 80,8
18 9,5 9,5 90,3 90,3 90,3
19 6,0 7,0 36,0 49,0 42,0
20 9,0 8,0 81,0 64,0 72,0
n n n n n
∑x i = 117, 7 ∑ yi = 126, 0 ∑x
i =1
2
i = 786,5 ∑y 2
i = 865,5 ∑x × y
i =1
i i 818,5
=
i =1 i =1 i =1
FONTE: A autora
158
TÓPICO 1 | CORRELAÇÃO
(∑ x )× (∑ y )
i
n
i 1 i
n
117, 7 ×126, 0
∑
n =i 1 =
x ×y -
i =1 i i 818,5 -
= r n 20
( ) ( ) (117, 7 ) × 865,5 - (126, 0 )
2
2
2
2
∑ ∑
n n
xi yi 786,5 -
∑ i 1x= × ∑ i 1yi -
= n i 1= n i 1
2
i -
2
20 20
=
n n
818,5 - 741,5 77, 0
=r = = 0,94
93,8 × 71, 7 82, 0
FONTE: A autora
160
TÓPICO 1 | CORRELAÇÃO
podemos fazer afirmações de relação causa e efeito entre elas, mas temos indícios
de que as duas variáveis estão relacionadas de alguma maneira.
161
UNIDADE 3 | TESTES ESTATÍSTICOS II
162
RESUMO DO TÓPICO 1
• Duas variáveis podem apresentar uma correlação com forma linear ou não
linear.
(∑ x )× (∑ y ) n
i =1 i
n
i =1 i
∑
n
x ×y −
i =1 i i
r= n
( ∑ x ) × ( ∑ y)
n 2 n 2
n 2 i =1 i i =1 i
∑ i =1xi − ∑ i =1yi
n 2
−
n n
163
• O coeficiente de correlação varia entre -1 ≤ r ≤ +1. Valores de r positivos
representam correlações positivas e valores de r negativos correspondem a
correlações negativas. A força da correlação aumenta conforme os valores de r
se aproximam de -1 ou 1. Valores de r ≅ 0 representam correlações nulas.
r
• O teste T é calculado por: t =
1− r2
n−2
• Quando duas variáveis estão correlacionadas, mas não existe uma explicação
lógica e simples para tal correlação, a correlação é chamada de correlação
espúria.
164
AUTOATIVIDADE
165
2 Muitos estudos científicos evidenciaram que a riqueza de espécies de plantas
arbóreas tende a diminuir com o aumento da altitude. Os dados apresentados
na tabela a seguir correspondem à riqueza de espécies arbóreas da Floresta
Ombrófila Mista de 13 locais, em diferentes altitudes, de Santa Catarina. Com
base nesses dados, faça o que é solicitado:
1 559 41
2 749 33
3 806 50
4 833 40
5 865 21
6 869 36
7 927 35
8 979 34
9 1051 38
10 1091 17
11 1269 22
12 1407 18
13 1449 10
166
e) Determine a probabilidade de se obter um coeficiente de correlação igual ou
maior ao que foi encontrado, caso a hipótese nula fosse verdadeira. Para chegar
ao p-valor, você terá que seguir todos os passos de um teste de hipóteses: i)
estabelecer as hipóteses nula e alternativa; ii) definir se o teste estatístico é
uni ou bilateral; iii) estabelecer um nível crítico de significância; iv) encontrar
o valor crítico da estatística do teste consultando a tabela de distribuição T e
informando a, os graus de liberdade e se o teste é uni ou bilateral; v) calcular a
estatística do teste T; vi) determinar o p-valor correspondente à estatística do
teste T; vii) fazer a inferência estatística.
167
168
UNIDADE 3
TÓPICO 2
1 INTRODUÇÃO
No tópico anterior, você estudou como avaliar se duas variáveis
quantitativas estão relacionadas. Na correlação, as duas variáveis são simétricas,
ou seja, estão no mesmo nível e o objetivo é apenas identificar se existe alguma
relação entre elas. Neste tópico você irá estudar a regressão linear simples, um
método estatístico que pressupõe que uma das variáveis influencia a outra
(VIEIRA, 2011; PAGANO; GAUVREAU, 2013), ou seja, as variáveis não são mais
simétricas. Por exemplo, podemos assumir que a concentração de gases de efeito
estufa na atmosfera influencia a temperatura global e, assim, mensurar quanto
da variação da temperatura pode ser explicada pela variação da concentração
de gases de efeito estufa. Na regressão linear, a relação entre duas variáveis
quantitativas pode ser descrita analiticamente por meio de uma reta. O método é
chamado de regressão linear, pois a relação entre as duas variáveis deve ser linear
para que possa ser descrita por uma reta. Esse método estatístico foi desenvolvido
por Francis Galton e publicado em 1886 (CALLEGARI-JACQUES, 2003).
169
UNIDADE 3 | TESTES ESTATÍSTICOS II
pontos e indica a relação linear entre as duas variáveis. A seguir, você irá estudar
como essa reta pode ser estabelecida. O gráfico a seguir ilustra uma dispersão
para regressão linear em que a relação entre as variáveis é positiva.
170
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES
(∑ x )× (∑ y )
n
i =1 i
n
i =1 i
∑
n
x ×y −
i =1 i i
b= n
(∑ x )n 2
i =1 i
∑
n
x −
2
i =1 i
n
=
O intercepto é estimado pela equação: a
i
=i 1 = i 1 i (∑ y ) - b × (∑ x ).
n n
n n
Note que o intercepto é estimado a partir das médias das variáveis
preditora e resposta e pela inclinação (b). Para calcular as médias, podemos
usar os somatórios de cada variável, organizados na Tabela 30. O intercepto é
mensurado na mesma unidade de medida que a variável resposta.
171
UNIDADE 3 | TESTES ESTATÍSTICOS II
x1 y1 x21 x1 x y1
x2 y2 x22 x2 x y2
x3 y3 x23 x3 x y3
⁞ ⁞ ⁞ ⁞
xn yn x2n xn x yn
n n n n
∑ xi
i =1
∑ yi
i =1
∑ xi2
i =1
∑x ×y
i =1
i i
FONTE: A autora
172
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES
173
UNIDADE 3 | TESTES ESTATÍSTICOS II
1° Precisamos descobrir qual é o valor esperado para a variável resposta (^yi) a cada
valor observado da variável preditora (xi). Para chegar aos valores esperados
usaremos a equação da reta (^yi = a + bxi), bem como os valores calculados
para a inclinação (b) e o intercepto (a). Veja a terceira coluna da Tabela 5, que
demonstra como os valores esperados são obtidos.
2° Com os valores estimados para a variável resposta é possível determinar o erro
(e). O erro é dado pela diferença entre os valores observados da variável
resposta e os valores preditos pela equação da reta, ou seja, (ei = yi - ^yi. O erro
é calculado para cada unidade amostral da amostra. Veja a quarta coluna da
Tabela 31, que mostra como os valores de erro são obtidos.
O erro representa uma porção da variável resposta que não pode ser
explicada pela variável preditora do modelo de regressão. Para tentar explicar essa
porção da variável resposta, possivelmente outras variáveis preditoras deveriam
ser avaliadas. O erro pode ser interpretado como nossa ignorância acerca de
determinado processo biológico, que precisa ser investigada em estudos futuros.
174
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES
6° Também precisamos calcular quanto da variação total presente nos dados não
pode ser explicado pelo modelo de regressão. Essa proporção é representada
pela soma de quadrados do erro (SQE), que é calculada pelo somatório do
quadrado da diferença de cada valor observado da variável resposta (yi) em
relação ao valor estimado para a variável resposta (^yi ) (Tabela 31), conforme a
equação (GOTELLI; ELLISON, 2011): SQE = ∑ni = 1 (yi - ^yi )2.
TABELA 31 - ORGANIZAÇÃO DOS DADOS PARA CALCULAR UMA REGRESSÃO LINEAR SIMPLES
∑ ( yi - yT ) ∑ ( yˆ i - yT ) ∑ ( yi - yˆ i )
2 2 2
i =1 i =1 i =1
FONTE: A autora
176
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES
Graus de Soma de
Fonte de variação Variância Teste F
liberdade quadrados
n SQR s2
∑ ( yˆi - yT ) s R =
2 2
Regressão glR = 1 SQR
= F = 2R
i =1 glR s E
n SQE
∑ ( y - yˆ ) s2E =
2
Erro glE = n - 2 SQE
= i i
i =1 glE
n
∑( y - y )
2
Total glT = n - 1 SQT
= i T
i =1
177
UNIDADE 3 | TESTES ESTATÍSTICOS II
178
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES
179
UNIDADE 3 | TESTES ESTATÍSTICOS II
3 VAMOS PRATICAR
Vejamos como a análise de regressão linear simples funciona na prática.
Muitos estudos observaram que existe uma relação entre o tamanho de ilhas e
a riqueza de espécies encontradas nas ilhas. Geralmente, ilhas maiores abrigam
maior riqueza de espécies. Na Tabela 33 são apresentados dados referentes ao
tamanho de 10 ilhas e a respectiva riqueza de espécies de répteis (dados fictícios).
Note que nesse exemplo as unidades amostrais são as ilhas e para cada ilha foram
coletadas informações sobre a riqueza de espécies e o tamanho da ilha, duas
variáveis quantitativas. A pergunta é: Quanto da variação na riqueza de espécies de
répteis pode ser explicada pelo tamanho das ilhas? Assim, a variável preditora é o
tamanho das ilhas e a variável resposta é a riqueza de espécies de répteis. O método
estatístico indicado para responder essa pergunta é a regressão linear simples.
FONTE: A autora
180
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES
( ∑ x )× (∑ y )
n
i =1 i
n
i =1 i 749 × 88
∑
n
x ×y −
i =1 i i 7693 −
b= n = 10 =
1101, 80
= 0, 098
( )
2 2
∑ i =1xi
n 749 11244, 90
67345 −
∑
n
x −
2
i =1 i
10
n
a=
( ∑ y ) − b × ( ∑ x ) = 88 − 0, 098 × 749 = 8, 80 − 7, 34 = 1, 46
n
i =1 i
n
i =1 i
n n 10 10
Observando a Tabela 33, notamos que não foram amostradas ilhas com 50 m2.
Se quisermos saber qual a riqueza de espécies de répteis esperada para uma ilha com
50 m2, basta utilizar a equação da reta e fazer uma interpolação, da seguinte forma:
yi = a + bxi = 1,46 + 0,098 x 50 = 6,36. Pela equação da reta, podemos esperar que uma
^
181
UNIDADE 3 | TESTES ESTATÍSTICOS II
n 10
espécies de répteis nas ilhas é de 8,80 espécies.
4° Para calcular a soma de quadrados total da variável resposta (SQT), podemos
organizar os dados conforme a coluna 8 da Tabela 33. Observando a Tabela 33,
notamos que SQT = 121,60.
5° Para calcular a soma de quadrados da regressão (SQR), podemos organizar os
dados conforme a coluna 9 da Tabela 33. Verificando a Tabela 33, notamos que
SQR = 117,98.
6° Para calcular a soma de quadrados do erro (SQE), podemos organizar os
dados conforme a coluna 10 da Tabela 33. Olhando a Tabela 33, notamos que
SQE = 13,64.
Continua...
182
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES
n n n
∑ ( yi - yT ) ∑ ( yˆi - yT ) ∑ ( y - yˆ )
2 2 2
Erro (ei = yi - y )
^
i
SQT
= SQR
= SQE
= i i
i =1 i =1 i =1
183
UNIDADE 3 | TESTES ESTATÍSTICOS II
SQE
s2E =
glE = n - 2 glE
Erro SQE = 13,64
glE = 10 - 2 = 8 13, 64
s2E
= = 1, 70
81
glT = n - 1
Total SQT = 121,60
glT = 10 - 1 = 9
FONTE: A autora
184
TÓPICO 2 | REGRESSÃO LINEAR SIMPLES
FONTE: A autora
FONTE: A autora
185
UNIDADE 3 | TESTES ESTATÍSTICOS II
FONTE: A autora
DICAS
186
RESUMO DO TÓPICO 2
(∑ x )× (∑ y )
n
i =1 i
n
i =1 i
∑
n
x ×y −
i =1 i i
b= n
(∑ x ) n 2
i =1 i
∑
n
x −
2
i =1 i
n
a=
( ∑ y)
−b×
n
( ∑ x)
i =1 i
n
i =1 i
n n
188
AUTOATIVIDADE
189
5 850 510
6 865 565
7 870 590
8 874 574
9 925 585
10 940 640
11 960 690
12 990 690
13 1010 700
14 1025 725
15 1050 780
a) Com base no que você leu sobre a relação entre a altitude e a densidade de
árvores, defina qual das duas variáveis é a preditora e qual é a resposta em
uma análise de regressão linear simples.
b) Construa um gráfico de dispersão para as duas variáveis. Coloque a
variável preditora no eixo x do gráfico e a variável resposta no eixo y.
c) Caso o gráfico de dispersão mostre que a relação entre as duas variáveis é
linear, determine a inclinação e intercepto e construa a equação da reta de
regressão.
d) Utilize a equação da reta de regressão e calcule qual o valor esperado para
a variável resposta (^yi ) em cada valor observado da variável preditora.
e) Calcule o erro entre cada valor da variável resposta observado e estimado
pela equação da reta (εi).
f) Calcule a média geral para os valores observados da variável resposta (yT).
g) Calcule a soma de quadrados total, a soma de quadrados da regressão e a
soma de quadrados do erro.
h) Calcule o coeficiente de determinação.
i) Faça o teste de hipóteses para a análise de regressão linear simples e siga
as etapas: i) determine as hipóteses nula e alternativa; ii) estabeleça o nível
crítico de significância; iii) encontre o valor crítico da estatística F com base
no a, nos graus de liberdade do numerador e do denominador e consultando
o Apêndice 3; iv) preencha a tabela de Anova (Tabela 6) e obtenha a estatística
F; v) encontre o p-valor correspondente ao valor de F calculado por meio da
função “DISTF” do Excel; vi) faça a inferência estatística.
j) Cheque os pressupostos da análise de regressão linear simples.
k) Conclua sobre a relação entre a altitude e a densidade de árvores e interprete
a equação da reta de regressão, o coeficiente de determinação e o p-valor.
l) No gráfico de dispersão que você construiu anteriormente, inclua a reta de
regressão, a equação da reta e os valores do coeficiente de determinação e
do p-valor.
190
UNIDADE 3
TÓPICO 3
1 INTRODUÇÃO
Todos os métodos estatísticos que você estudou até agora, como o teste Z,
o teste T pareado, o teste T para amostras independentes, a análise de variância,
o coeficiente de correlação de Pearson e a regressão linear simples, são testes
estatísticos paramétricos. Os testes paramétricos utilizam algum parâmetro da
distribuição, por exemplo, a média e a variância, ou estimativas desses parâmetros
para calcular a estatística do teste. A aplicação dos testes paramétricos exige que as
variáveis investigadas tenham distribuição normal ou aproximadamente normal,
bem como apresentem homogeneidade das variâncias (CALLEGARI-JACQUES,
2003; PAGANO; GAUVREAU, 2013).
em taxas.
191
UNIDADE 3 | TESTES ESTATÍSTICOS II
192
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS
193
UNIDADE 3 | TESTES ESTATÍSTICOS II
194
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS
195
UNIDADE 3 | TESTES ESTATÍSTICOS II
3 TESTE QUI-QUADRADO
Todos os testes que você estudou até agora são aplicados quando ambas
as variáveis são quantitativas, como acontece na correlação e na regressão linear
simples, ou uma das variáveis é quantitativa e a outra é qualitativa, como no
teste T e análise de variância. A partir de agora, você irá estudar um método
estatístico em que as duas variáveis avaliadas são qualitativas (também chamadas
de variáveis categóricas). Esse método é o denominado qui-quadrado e é um
teste não paramétrico utilizado para avaliar se duas variáveis qualitativas são
independentes (GOTELLI; ELLISON, 2011). Este método foi desenvolvido por
Karl Pearson, em 1899 (CALLEGARI-JACQUES, 2003).
196
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS
197
UNIDADE 3 | TESTES ESTATÍSTICOS II
1° Precisamos definir as hipóteses nula e alternativa. Neste caso, H0: não existe
relação entre as duas variáveis qualitativas, ou seja, as duas variáveis são
independentes. H1: as duas variáveis são relacionadas, ou seja, as duas variáveis
não são independentes.
2° Precisamos definir o nível crítico de significância (a).
3° Estabelecemos o valor crítico da estatística do teste qui-quadrado. Para isso,
é necessário consultar a tabela de distribuição qui-quadrado (Apêndice 5) e
informar o a e os graus de liberdade. Portanto, o valor crítico é dado por X a2 ; gl .
4° Calculamos a estatística do teste qui-quadrado, mas antes de calcular a
estatística do teste, é necessário estabelecer todos os valores esperados,
conforme apresentado na Tabela 11. Com os valores esperados calculados,
( Oi - Ei )
r 2
4 VAMOS PRATICAR
Vejamos como o teste qui-quadrado funciona na prática: Imagine
que um pesquisador avaliou se existe alguma relação entre a classificação
de ameaça de extinção e o tamanho corpóreo de espécies de vertebrados.
Geralmente, o risco de extinção é maior para espécies de tamanho maior.
Para avaliar esta relação, o pesquisador amostrou 100 espécies e as classificou
quanto: i) à ameaça de extinção em ameaçada ou não ameaçada; ii) ao tamanho
corpóreo em porte pequeno ou porte grande. Neste exemplo, cada espécie
representa uma unidade amostral. Observe os dados organizados em uma
tabela de contingência (Tabela 38), estes são os valores observados. Note que
das 100 espécies de vertebrados amostradas, 42 estão ameaçadas de extinção e
58 não estão ameaçadas, 35 têm porte grande e 65 têm porte pequeno.
199
UNIDADE 3 | TESTES ESTATÍSTICOS II
FONTE: A autora
X2 = ∑
i =1 Ei
=
14, 7
+
20,3
+
27,3
+
37, 7
= 19,1 . Pela equação,
E
IMPORTANT
201
UNIDADE 3 | TESTES ESTATÍSTICOS II
LEITURA COMPLEMENTAR
ABOLIR OS PARÂMETROS
Podia fazer uma série de experimentos em que era óbvio para ele que
os tratamentos seriam diferentes no efeito. Algumas vezes os testes t indicariam
significância, outras vezes, não. Frequentemente, ao fazer um experimento em
engenharia química, o reator químico em que a reação ocorre não está aquecido
o bastante no começo da sequência de ensaios experimentais. Pode acontecer
de uma enzima particular começar a variar em sua capacidade de reagir. O
resultado é um valor experimental que parece errado. Muitas vezes o número
é demasiadamente grande ou pequeno. Algumas delas, é possível identificar a
causa desse resultado fora de padrão. Outras, o resultado é discrepante, diferindo
drasticamente de todos os demais resultados, sem razão óbvia para isso.
Ah, mas isso era bobagem! Por que um químico como Wilcoxon teria
de elaborar cálculos simples, mas tediosos? Sem dúvida alguém da estatística
já havia feito isso antes! Mais uma vez ele voltou à literatura estatística a fim
de localizar algum artigo prévio sobre o assunto. Nada encontrou. Sobretudo
para verificar sua própria matemática, ele submeteu o artigo à revista Biometrics
[...]. Ainda acreditava que seu trabalho não poderia ser original e contava com
202
TÓPICO 3 | QUI-QUADRADO E OUTROS TESTES NÃO PARAMÉTRICOS
203
UNIDADE 3 | TESTES ESTATÍSTICOS II
Parece que Frank Wilcoxon, o químico que estava certo de que alguém já
fizera essa descoberta antes dele, tinha tropeçado numa verdadeira pedra filosofal.
Os resultados de Pitman sugerem que todos os testes de hipótese deveriam ser
não paramétricos. A descoberta de Pearson das distribuições estatísticas baseadas
em parâmetros era apenas o primeiro passo. Agora os estatísticos eram capazes de
lidar com distribuições estatísticas sem se preocupar com parâmetros específicos.
FONTE: SALSBURG, D. Uma senhora toma chá... como a estatística revolucionou a ciência no
século XX. Rio de Janeiro: Zahar, 2009, p. 288.
204
RESUMO DO TÓPICO 3
• Vantagens dos testes não paramétricos: i) são úteis quando não conhecemos
a distribuição da variável investigada, ou ainda, quando a variável não tem
distribuição normal ou homogeneidade de variância; ii) a ordenação dos dados
em postos evita que valores extremos muito baixos ou muito altos influenciem
o resultado da análise.
( Oi - Ei )
r 2
206
AUTOATIVIDADE
Testes estatísticos:
a) Teste T de Wilcoxon
b) Teste U de Wilcoxon-Mann-Whitney
c) Teste de Kruskal-Wallis
d) Coeficiente de correlação de Spearman
e) Teste qui-quadrado
f) Teste T para amostras independentes
207
g) Análise de variância
h) Coeficiente de correlação de Pearson
Proteção
Unidades de conservação Uso sustentável Total
integral
Efetivas em representar carbono 26 17 43
Não efetivas em representar carbono 11 23 34
Total 37 40 77
208
REFERÊNCIAS
BATAGIN, K. D. et al. Alterações morfológicas foliares em abacaxizeiros cv. IAC
“Gomo-de-mel” micropropagados e aclimatizados em diferentes condições de
luminosidade. Acta Botanica Brasilica. Vol. 23, N. 1, 85-92, 2009.
209
PADOVANI, C. R. Delineamento de experimentos. São Paulo: Cultura
Acadêmica, 2014.
210
APÊNDICES
APÊNDICE 1 - TABELA DE DISTRIBUIÇÃO NORMAL PADRONIZADA (TABELA DE DISTRIBUIÇÃO
Z) COM OS VALORES DE Z E ÁREA SOB A CURVA ENTRE A MÉDIA (m = 0) E UM VALOR
POSITIVO DE Z. AS ÁREAS SOB A CURVA PARA OS VALORES DE Z NEGATIVOS SÃO OBTIDAS
POR SIMETRIA
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549
0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
FONTE: Adaptado de Callegari-Jacques (2003)
211
APÊNDICE 2 - TABELA DE VALORES CRÍTICOS DA DISTRIBUIÇÃO T DE STUDENT
212
APÊNDICE 3 - TABELA DE VALORES CRÍTICOS DA DISTRIBUIÇÃO F PARA UM TESTE UNILATERAL COM a = 0,05
Graus de Graus de liberdade do Numerador
liberdade do
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
Denominador
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 2,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,23 2,29 2,25 2,20 2,16 2,11 2,07
213
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3.07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
FONTE: Adaptado de Callegari-Jacques (2003)
APÊNDICE 4 - TABELA DE VALORES CRÍTICOS DA DISTRIBUIÇÃO Q PARA OS NÍVEIS DE
SIGNIFICÂNCIA DE 0,05 E 0,01. glD SÃO OS GRAUS DE LIBERDADE ASSOCIADOS À SOMA DE
QUADRADOS DENTRO DE GRUPOS
g – número de grupos comparados
glD a
2 3 4 5 6 7 8 9 10
0,05 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99
5
0,01 5,70 6,98 7,80 8,42 8,91 9,32 9,67 9,97 10,24
0,05 3,46 4,34 4,90 5,30 5,63 5,90 6,12 6,32 6,49
6
0,01 5,24 6,33 7,03 7,56 7,97 8,32 8,61 8,87 9,10
0,05 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16
7
0,01 4,95 5,92 6,54 7,01 7,37 7,68 7,94 8,17 8,37
0,05 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92
8
0,01 4,75 5,64 6,20 6,62 6,96 7,24 7,47 7,68 7,86
0,05 3,20 3,95 4,41 4,76 5,02 5,24 5,43 5,59 5,74
9
0,01 4,60 5,43 5,96 6,35 6,66 6,91 7,13 7,33 7,49
0,05 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,60
10
0,01 4,48 5,27 5,77 6,14 6,43 6,67 6,87 7,05 7,21
0,05 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49
11
0,01 4,39 5,15 5,62 5,97 6,25 6,48 6,67 6,84 6,99
0,05 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,39
12
0,01 4,32 5,05 5,50 5,84 6,1 6,32 6,51 6,67 6,81
0,05 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5,32
13
0,01 4,26 4,96 5,40 5,73 5,98 6,19 6,37 6,53 6,67
0,05 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25
14
0,01 4,21 4,89 5,32 5,63 5,88 6,08 6,26 6,41 6,54
0,05 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08 5,20
15
0,01 4,17 4,84 5,25 5,56 5,8 5,99 6,16 6,31 6,44
0,05 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15
16
0,01 4,13 4,79 5,19 5,49 5,72 5,92 6,08 6,22 6,35
0,05 2,98 3,63 4,02 4,30 4,52 4,70 4,86 4,99 5,11
17
0,01 4,10 4,74 5,14 5,43 5,66 5,85 6,01 6,15 6,27
0,05 2,97 3,61 4,00 4,28 4,49 4,67 4,82 4,96 5,07
18
0,01 4,07 4,70 5,09 5,38 5,60 5,79 5,94 6,08 6,20
0,05 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04
19
0,01 4,05 4,67 5,05 5,33 5,55 5,73 5,89 6,02 6,14
0,05 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01
20
0,01 4,02 4,64 5,02 5,29 5,51 5,69 5,84 5,97 6,09
0,05 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92
24
0,01 3,96 4,55 4,91 5,17 5,37 5,54 5,69 5,81 5,92
0,05 2,89 3,49 3,85 4,10 4,30 4,46 4,60 4,72 4,82
30
0,01 3,89 4,45 4,80 5,05 5,24 5,40 5,54 5,65 5,76
0,05 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63 4,73
40
0,01 3,82 4,37 4,70 4,93 5,11 5,26 5,39 5,50 5,60
0,05 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65
60
0,01 3,76 4,28 4,59 4,82 4,99 5,13 5,25 5,36 5,45
0,05 2,80 3,36 3,68 3,92 4,10 4,24 4,36 4,47 4,56
120
0,01 3,70 4,20 4,50 4,71 4,87 5,01 5,12 5,21 5,30
0,05 2,77 3,31 3,63 3,86 4,03 4,17 4,29 4,39 4,47
∞
0,01 3,64 4,12 4,40 4,60 4,76 4,88 4,99 5,08 5,16
FONTE: Adaptado de Callegari-Jacques (2003)
214
APÊNDICE 5 - TABELA DE VALORES CRÍTICOS DA DISTRIBUIÇÃO QUI-QUADRADO (X²)
215