Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
Ambiental
População/Universo
Amostra
Parâmetro
Estatística
2007
4ª Edição
Revisada
O Autor:
William Costa Rodrigues é Agrônomo, Doutor em
Fitotecnia e Pós-Doutor em Entomologia, pela Univ.
Federal Rural do Rio de Janeiro. Prof. da Universi-
dade Severino Sombra, ministra aulas de Ecologia,
Toxicologia, Climatologia e Estudos de Impacto
Ambiental na graduação e de Estatística Ambiental e
Biondicadores Ambientais na especialização de Pla-
nejamento e Gestão Ambiental, USS, onde também
é Supervisor Pedagógico. Atua como desenvolvedor
de softwares. Coordenador Geral do projeto Ento-
mologistas do Brasil (www.ebras.bio.br). Coorde-
nador e autor de capítulos no livro Citricultura
Fluminense: Principais pragas e seus inimigos
naturais. Trabalha ativamente com análise estatísti-
ca em projetos na área agrícola e ambiental. O autor
poderá ser contatado através do e-mail
wcostarodrigues@yahoo.com.br.
Esta Obra:
A apostila Estatística Ambiental é utilizada no pro-
grama de Pós-Graduação Lato Sensu, Planejamento
e Gestão Ambiental, tendo como objetivo informar o
discente sobre os princípios básicos da estatística,
relacionando-a com a metodologia científica, possi-
bilitando um entendimento básico sobre o assunto.
Copyright©2004-
Copyright©2004-2007
2007, W.C. Rodri
Rodrigues
Sumário
1 Introdução................................................................................................................. 1
1.1 Crescimento e Desenvolvimento da Estatística Moderna ................................ 1
1.2 Variação ao Acaso ............................................................................................ 1
2 Ensaio x Experimentação ......................................................................................... 2
3 Conceitos Estatísticos ............................................................................................... 2
3.1 Estatística Descritiva ........................................................................................ 2
3.2 Inferência Estatística......................................................................................... 2
3.3 Tipos de Dados ................................................................................................. 3
3.3.1 Variáveis Aleatórias Categorizadas.......................................................... 3
3.3.2 Variáveis Aleatórias Numéricas ............................................................... 3
4 Por que Utilizar a Estatística .................................................................................... 4
5 Planejamento Experimental...................................................................................... 4
5.1 Fases do Planejamento ..................................................................................... 4
5.1.1 Problema................................................................................................... 4
5.1.2 Informações Existentes............................................................................. 5
5.1.3 Noções Gerais Sobre Hipótese ................................................................. 5
5.1.4 Formulação das Hipóteses ........................................................................ 5
5.1.4.1 Elaborando as hipóteses........................................................................ 6
5.1.4.2 Hipótese Estatística x Hipótese Científica ........................................... 6
5.1.5 Testando as Hipóteses .............................................................................. 6
5.1.6 Aleatorização ............................................................................................ 6
5.2 Erros de Observações ....................................................................................... 6
5.2.1 Erros do Observador................................................................................. 7
5.2.2 Erro do Método de Observação ................................................................ 7
5.2.3 Por Falta de Resposta ............................................................................... 7
5.3 Controle dos Erros nas Observações ................................................................ 8
5.4 Métodos de Coleta de Dados ............................................................................ 8
5.4.1 Fontes Primárias ....................................................................................... 8
5.4.2 Fontes Secundárias ................................................................................... 8
5.5 Pesquisa Observacional .................................................................................... 8
5.6 Pesquisa Experimental...................................................................................... 9
5.6.1 Princípios da Experimentação ................................................................ 10
5.7 Tipos de Amostras .......................................................................................... 10
5.7.1 Amostras Simples ao Acaso ................................................................... 10
5.7.2 Amostra Estratificada ............................................................................. 10
5.7.3 Amostra Sistemática ............................................................................... 10
5.7.4 Amostra por Área ................................................................................... 11
5.7.5 Amostra por Conglomeradas .................................................................. 11
5.7.6 Amostra Selecionada .............................................................................. 11
5.8 Determinação do Tamanho da Amostra ......................................................... 11
5.8.1 Tamanho da Amostra para Dados Discretos .......................................... 12
5.8.2 Tamanho da Amostra para Dados Contínuos ......................................... 13
6 Técnicas Estatísticas Para Análise de dados .......................................................... 13
6.1 Medidas de Tendência Central ....................................................................... 13
6.1.1 Média Aritmética Simples ( X ) .............................................................. 14
6.1.2 Média Aritmética Ponderada .................................................................. 14
6.1.3 Média Aritmética de Dados Agrupados em Intervalos .......................... 15
6.1.4 Mediana (Me) ......................................................................................... 15
6.2 Medidas de Variação ...................................................................................... 17
6.2.1 Desvio-Médio (DM) ............................................................................... 17
6.2.2 Desvio Padrão......................................................................................... 17
6.3 Variância ou Quadrado Médio ....................................................................... 18
6.4 Erro-Padrão da Média - s(x) ........................................................................... 18
6.5 Coeficiente de Variação.................................................................................. 19
6.6 Curva de Distribuição Normal........................................................................ 19
6.6.1 Limites de Confiança.............................................................................. 21
6.6.2 Erro Padrão ............................................................................................. 21
6.7 Teste de Normalidade dos Dados ................................................................... 21
6.8 Teste de Klomogorov-Smirnov (K-S) ............................................................ 22
6.9 Teste de Shapiro-Wilks (S-W) ....................................................................... 22
7 Testes Paramétricos e Não Paramétricos................................................................ 22
7.1 Teste t - Student.............................................................................................. 22
7.1.1 Dados Pareados ...................................................................................... 23
7.1.2 Dados Não-Pareados - Variâncias Desiguais (Heterocedásticas)........... 24
7.1.3 Dados Não-Pareados - Variâncias Iguais (Homocedásticas) ................. 25
7.2 Teste Qui-Quadrado (χ²) ................................................................................ 26
7.3 Tabela de Contingência .................................................................................. 27
7.4 Teste de Kruskal-Wallis ................................................................................. 28
7.5 Teste de Friedman (Análise da Variância) ..................................................... 29
8 Correlação Linear ................................................................................................... 30
8.1 Coeficiente de Correlação (r) ......................................................................... 31
8.1.1 Correlação de Pearson ............................................................................ 31
8.1.2 Correlação de Spearman......................................................................... 31
8.1.3 Aspectos Gerais da Correlação Linear ................................................... 31
8.2 Coeficiente de Determinação (r²) ................................................................... 32
8.3 Coeficiente de Alienação (K) ......................................................................... 32
8.4 Significância do Teste de Correlação ............................................................. 32
8.4.1 Significância Baseada nos Intervalos ..................................................... 32
8.4.2 Significância Baseada no Teste t para r (Pearson) ................................. 33
9 Análise de Regressão.............................................................................................. 33
9.1 Regressão Linear Simples .............................................................................. 34
9.2 Regressão Linear Múltipla.............................................................................. 35
9.3 Regressão Múltipla ......................................................................................... 35
10 Transformação de Dados .................................................................................... 36
10.1 Raiz Quadrada ................................................................................................ 36
10.2 Transformação Logarítimica .......................................................................... 36
10.3 Transformação Angular (Arcoseno)............................................................... 36
10.4 Considerações Gerais ..................................................................................... 37
11 Testes Específicos Para Análise de Populações e Comunidades ....................... 37
11.1 Índice de Diversidade e Dominância Populacional........................................ 37
11.1.1 Índice de Margalef (α)............................................................................ 37
11.1.2 Índice de Glason (Dg) ............................................................................. 37
11.1.3 Índice de Menhinick (Dm) ...................................................................... 37
11.1.4 Índice de Shanon-Wiener (H') ................................................................ 38
11.1.5 Índice de Dominância Berger-Parker (d)................................................ 38
11.2 Exemplo.......................................................................................................... 38
11.3 Índice de Similaridade entre Populações........................................................ 38
11.3.1 Quociente de Similaridade...................................................................... 38
11.3.2 Porcentagem de Similaridade ................................................................. 39
11.3.3 Índice de Afinidade ................................................................................ 39
11.3.4 Constância .............................................................................................. 39
11.3.5 Índice de Associação (IA) ...................................................................... 40
12 Bibliografia......................................................................................................... 41
13 Anexos ................................................................................................................ 42
Índice de Tabelas
Tabela 1. Resultados da interpretação de 500 fotos aéreas de diversas áreas com
presença de mata. (dados fictícios)........................................................................... 7
Tabela 2. Dados da do peso de 10 crianças antes e depois da administração de a base de
folhas de mandioca (dados fictícios). ..................................................................... 23
Tabela 3. Resultados das amostras de cinco diferentes áreas delimitadas pelas
características edáficas do solo, em quatro diferentes profundidades. Os dados
apresentados referem-se a o poluente α-β β -16-Imaginol-Poluentis, em mg.mm³ de
solo ......................................................................................................................... 30
Tabela 4. Correlação de Spearman entre as notas brutas de matemática e biologia (Zar,
1999)....................................................................................................................... 31
Tabela 5. Classificação do valor r através de intervalos de 0 a 1................................... 33
Tabela 6. Classificação do valor r através de intervalos de acordo com e Teste de Rugg.
................................................................................................................................ 33
Tabela 7. Série de dados da correlação da flutuação populacional do pulgão Toxoptera
aurantii (Homoptera, Aphididae) em função da brotação foliar de tangerina cv
Poncã, sob cultivo orgânico na Fazendinha Agroecológica, no período de outubro
de 2002 e outubro de 2003 (Extraído de Rodrigues, 2004). Exemplo para o
Microsoft Excel. ..................................................................................................... 34
Tabela 8. Índices de diversidade de cochonilhas em agroecossiema cítrico. ................. 38
Tabela 9. Duas comunidades com sua composição de espécies em percentagem ......... 39
Tabela 10. Valores de t -student em níveis de 5% e 1% (α α=0,05 a 0,01) de
probabilidade. ......................................................................................................... 42
Tabela 11. Valores de χ² (Qui-quadrado) em níveis de 5% e 1% (α α=0,05 a 0,01) de
probabilidade .......................................................................................................... 43
Tabela 12. Valores críticos para o Coeficiente de Correlação de Spearman (rs)............ 44
Tabela 13. Valores para transformação arcsen % ....................................................... 45
Tabela 14. Valores mínimos de j, significativos a 0,5% (Southwood, 1971). ............... 46
Índice de Figuras
Figura 1. Diagrama de uma estatística descritiva, com seus diversos níveis de
categorias. ................................................................................................................. 3
Figura 2. Diagrama de tipos de dados .............................................................................. 4
Figura 3. Interpretação dos dados experimentais. O gráfico à esquerda, baseado em
apenas dois pares de valores anotados para X e Y (que definem os pontos A e D),
parece sugerir que Y cresce a medida que X cresce, entretanto no gráfico à direita,
em que foram registrados outros valores intermediários (definidos pelo pontos B e
C), mostra que a relação entre X e Y obedece a uma lei mais completa.................. 9
Figura 4. Curva de distribuição normal simétrica, onde µ é a média e s o desvio padrão.
................................................................................................................................ 19
Figura 5. Curvas de distribuição normal das freqüências de X, tendo a mesma média (µ µ)
e diferentes graus de dispersão dos valores de X, isto é, desvios padrões (s)
diferentes. ............................................................................................................... 20
Figura 6. Curva normal padrão, tendo por parâmetros µ=0 e s= 1. As áreas sob a curva
assinaladas entre os traços verticais, indicam as percentagens de valores de X aí
contidas................................................................................................................... 20
Figura 7. Os valores de Z (compreendidos entre -Z e +Z) correspondem aos
afastamentos de X em relação à média µ, medidos em unidades de desvio-padrão.
A probabilidade (P) com que X possa ter valor menor que uma coordenada
escolhida (C) é indicada pela área, sob a curva, situada à esquerda de C. ............. 21
Figura 8. Correlação linear simples positiva (A); e inversa ou negativa (B),
apresentando a linha de tendência de regressão linear simples de dados fictícios. 32
Figura 9. Janela de configuração da linha de tendência (linha de regressão) e
configuração da equação de regressão no Microsoft Excel.................................... 34
Figura 10. Regressão linear simples entre a flutuação populacional de T. aurantii e a
brotação foliar de tangerina cv. Poncã, em cultivo orgânico de tangerina cv. Poncã,
na Fazendinha Agroecológica, no período de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004).............................................................................. 35
Figura 11. Correlação múltipla da amplitude térmica (variável x), brotação (variável y) e
a flutuação populacional de Toxoptera citricida (variável z), em cultivo orgânico
de tangerina cv. Poncã, na Fazendinha Agroecológica, no período de outubro de
2002 a outubro de 2003 (Adaptado de Rodrigues, 2004)....................................... 35
Figura 12. Regressão múltipla entre a flutuação populacional de T. aurantii e a brotação
foliar de tangerina cv. Poncã, em cultivo orgânico de tangerina cv. Poncã, na
Fazendinha Agroecológica, no período de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004).............................................................................. 36
Curso de Estatística Ambiental 1
1 Introdução
Diariamente estamos envolvidos em análises estatísticas, por exemplo, quando
você é abordado na rua para responder qual o candidato irá votar na próxima eleição,
quando o IBGE faz uma visita a sua casa para o censo. Desta forma você está fazendo
parte da estatística, mas não é só desta forma que você faz parte do infinito mundo da
estatística. Quando você está desempregado ou empregado, está fazendo parte da esta-
tística, quando seu salário aumenta, faz parte também. Bom, podemos ver que em quase
tudo, eu disse quase tudo, podemos empregar a estatística, obviamente que não pode-
mos deixar a estatística dominar nossas vidas, pois o principal objetivo da estatística é
auxiliar na tomada de decisão ou de avaliar uma determinada situação e poder melhor
indicar o caminho para uma tomada de decisão.
A estatística, como parte da matemática aplicada, trata da coleta, da análise e da
interpretação de dados observados. Estudando os mais variados fenômenos das diversas
áreas do conhecimento, ela representa um valioso instrumento de trabalho nos dias de
hoje.
Na área ambiental, o estudo da estatística justifica-se pela necessidade de desen-
volver pesquisas, realizar experimentos, e mesmo pela utilização dos resultados e pes-
quisas feitas, realizar experimentos, e mesmo pela utilização dos resultados e pesquisas
feitas por aqueles que a isso se dediquem, seja visando o aprimoramento de métodos e
técnicas de investigação, seja por exigências do próprio desenvolvimento do país.
2 Ensaio x Experimentação
Existem diferenças básicas entre os dois métodos de avaliar um dado científico.
As diferenças vão desde a simples forma de avaliar e encarar a coleta dos dados até a
forma de apresentação dos dados. Abaixo no Quadro 1 são listadas as diferenças entre
os dois métodos.
3 Conceitos Estatísticos
Para melhor elucidar estes conceitos, digamos que há uma necessidade de saber
a opinião da qualidade de vida no campus de sua faculdade. A população, ou universo,
será todos os alunos da faculdade, enquanto a amostra consistirá os estudantes selecio-
nados para participar da pesquisa. O objetivo da pesquisa é descrever várias atitudes ou
características de toda a população (os parâmetros). Isto seria alcançado utilizando-se
as estatísticas obtidas da amostra de estudantes para estimar atitudes ou características
de interesse da população. Desse modo, um aspecto principal da inferência é o processo
que utiliza a estatística amostral para tomar decisões sobre os parâmetros da população.
População/Universo
Amostra
Parâmetro
Estatística
Figura 1. Diagrama de uma estatística descritiva, com seus diversos níveis de categori-
as.
A necessidade da inferência estatística deriva da necessidade da amostragem.
Quando a população se torna grande, é geralmente dispendioso demais, consome muito
tempo e é muito cansativo obter informações sobre a população inteira. Decisões perti-
nentes às características da população devem ser baseadas na informação contida numa
amostra da população.
Tipos de Dados
Categorizadas Numéricas
5 1,75m
5 Planejamento Experimental
5.1.1 Problema
Ao planejar o problema que se vai pesquisar, deverá ser dada especial atenção
aos seguintes pontos:
Definição da importância do problema que se estuda;
Curso de Estatística Ambiental 5
5.1.6 Aleatorização
Na oportunidade em que organizamos os ensaios devemos proporcionar condi-
ções idênticas para cada tratamento, possibilitando que houver algum erro este seja atri-
buído ao acaso, ou seja, não tendencioso. Com este processo o erro experimental poderá
ser mensurado através do modelo matemático utilizado para analisar os dados.
Tabela 1. Resultados da interpretação de 500 fotos aéreas de diversas áreas com pre-
sença de mata. (dados fictícios)
Fotos onde a degradação foi considerada positiva (nº)
Observador
1ª leitura 2ª leitura
A 118 139
B 69 78
C 83 88
D 96 89
E 106 92
Observa-se pela tabela acima que em nenhuma das duas ocasiões os diferentes
observadores coincidiram quanto ao número de fotos consideradas positivas para o refe-
rido diagnóstico. O mesmo foi verificado em relação a cada um dos observadores que
apresentaram resultados diferentes entre as duas leituras.
Devemos concluir que, tais discordâncias não refletem uma variação real, e sim
cometida por quem procedeu à leitura do material fotográfico.
Os modelos matemáticos que prevêem erros por falta de resposta são apropria-
dos, pois irão permitir uma flexibilidade de estimar o dado faltoso.
sentam concomitantemente. Por isso deve ser atenta, precisa e metódica. Deve ser per-
sistente, completa, porém analítica.
Exige que o pesquisador seja curioso, paciente, objetivo e imparcial; capaz de
com os olhos isentos de preconceitos e a cabeça livre das fórmulas tradicionais, de idéi-
as fixas ou baseadas em dogmas ou em autoridades que não demonstraram cabalmente,
na praticam a validade de suas bases.
Sempre que possível, portanto, as observações devem ser corretamente registra-
das, repetidas e quantificadas, partindo-se de medidas rigorosas que permitam a análise
estatística dos dados.
24
C
30
22
25
B D
20
20
18
15
16
A 10 A
14
0 1 2 3 4 5 6 7 8 5
X 0 1 2 3 4 5 6 7 8
384 384
n= ∴n = = 380,35
384 1,0096
1+
40.0000
Exemplo: numa pesquisa para determinar a taxa média de hemoglobina dos in-
divíduos de uma comunidade, deparamos com o problema de definir o tamanho da a-
mostra. Apenas sabemos que a população desta comunidade é de aproximadamente de
25.000 indivíduos, o que torna impraticável utilizar todos os elementos. Face a isto,
resolvemos determinar o número de elementos que comporão a amostra. Selecionamos
ao acaso 30 elementos, determinamos o valor do teor de hemoglobina de cada um e cal-
culamos a variância (medida de dispersão), cujo valor foi igual a 9mg2.
Para tal estudo, a fórmula a empregar para determinação do tamanho da amostra
será a fórmula 1 deste item.
A precisão considerada para esta pesquisa foi de 0,5mg e o valor z= 1,96. Substi-
tuindo na fórmula teremos:
1,96 2 × 9 3,84 × 9 34,56
n0 = 2
∴n 0 = ∴n 0 = ∴ n 0 = 138,24 ≅ 138
0,5 0,25 0,25
138,24 138,24
n= ∴n = ∴ n = 137,48 ≅ 137
138,24 1,0055
1+
25.000
Para o estudo a será realizado recomenda-se que o número mínimo de indivíduos
será igual a 138 para populações infinitas e 137 para populações finitas.
X=
∑x
n
Onde X : representa a média; ∑ x : a soma das variáveis; e o n o números de
indivíduos ou elementos.
Exemplo: deseja-se saber o valor médio do seguinte conjunto de dados: 32, 25,
32, 30, 26, 30, 29, 26, 29 e 33.
∑ x : 32 + 25 + 32 + 30 + 26 + 30 + 29 + 26 + 29 + 33.
n = 10
292
X= ⇒ 29,2
10
X=
∑ xf = x 1f1 + x 2 f 2 + ... + x n f n
n f 1 + f 2 + ... + f n
Exemplo: Calcular a média de idade de crianças até 9 anos de uma determinada locali-
dade.
Idade (anos) Freqüência
2 10
3 8
Curso de Estatística Ambiental 15
2 × 10 + 3 × 8 + ... + 9 × 4 250
X= = = 5 anos
10 + 8 + ... + 4 50
X=
∑ xf ∴ 80 = 8 anos
n 10
Desta forma a média da população avaliada é oito anos.
Quando os dados apresentam homogeneidade, é possível o uso da média aritmé-
tica, que tem como:
Vantagens:
o Ser fácil de calcular e entender;
o Unir em um valor todas as observações do conjunto.
Desvantagens:
o Não servir para séries variáveis assimétricas;
o Não expressar variações dentro da distribuição de dados.
Exemplo:
a) Em determinada localidade foram selecionadas oito escolas, com a finalidade de
estimar a mediana referente ao número de alunos. Tendo verificado o seguinte
quadro:
Escola Nº de alunos
A 150
B 180
C 230
D 2.500
E 200
F 160
G 250
H 170
Inicialmente ordenam-se os dados: 150, 160, 170, 180, 200, 250 e 2.500.
n n
Como o número de observações é par utilizam-se as duas fórmulas e + 1 ,
2 2
para obter os dois valores centrais. Assim os valores centrais para este conjunto de da-
dos são 180 (4º) e 200 (5º), portanto o valor médio destes dois valores é igual a 190, que
corresponde à mediana.
Me= 190 alunos.
2 - 11 + 5 - 11 + 9 - 11 + 11 - 11 + 14 - 11 + 25 - 11
D.M. =
6
9 + 6 + 2 + 0 + 3 + 14 34
D.M. = ∴ D.M. = ∴ D.M. = 5,6
6 6
∑x 2
n
−
s=
n −1
Onde: x: valores do conjunto de dados; Σ: somatório; e n: número de observa-
ções.
66 2 4.356
1.052 − 1.052 −
s= 6 ∴s = 6 ∴s = 1.052 − 726 ∴ s = 326 ∴s = 65,20
6 −1 5 6 −1 5
∴s = 8,07
Observamos agora uma série de dados agrupados, isto é, uma série de valores
que se repetem e, por conseguinte, são representados pela sua freqüência.
x f fx
2 2 4
3 2 6
4 4 16
5 4 20
6 2 12
TOTAL 14 58
Temos um total de 14 valores agrupados em cinco categorias. Desta forma lan-
ça-se mão de um novo quadro de dados para facilitar os cálculos
x f fx fx²
2 2 4 16
3 2 6 36
4 4 16 256
5 4 20 400
6 2 12 144
TOTAL 14 58 852
∑ fx ∑ fx
2 2
s= − , ou seja,
n n
2
852 58
s= − ∴ s = 60,68 − 4,14 2 ∴s = 60,68 − 17,16 ∴ s = 43,69 ∴ s = 6,61
14 14
É importante ressaltar que valores acima de 30% não significam um C.V. insa-
tisfatório, pois alguns experimentos em campo podem ter o valor C.V. de até
65% e serem considerados bons.
Figura 6. Curva normal padrão, tendo por parâmetros µ=0 e s= 1. As áreas sob a curva
assinaladas entre os traços verticais, indicam as percentagens de valores de X aí conti-
das.
A área compreendida entre -2s e +2s abrange cerca de 95,5% dos valores de X,
restando, portanto duas áreas extremas, apenas 4,5% das observações ou eventos medi-
dos.
As propriedades da curva normal permitem seu uso para o cálculo de probabili-
dade com que determinados valores obtidos durante as observações, ou as medições,
possam ocorrer em função das variações.
Curso de Estatística Ambiental 21
pação quantos às suas restrições. Testes estatísticos com grandes amostras mostram que
nem sempre as suposições de normalidade de confirmam. Por outro lado, como nem
sempre se dispões de um número elevado de casos para estudo, às vezes nem é possível
decidir se determinada variável possui ou não distribuição normal (na prática a amostra
deve ter o valor n > 100).
Os testes comumente utilizados são Klomogorov–Smirnov, ou teste K-S, que é
um teste tradicional de normalidade e o teste de Shapiro-Wilks, ou teste S-W, vem sen-
do empregado cada vez com maior freqüência.
Procedimento:
a) Obtêm-se as diferenças entre os valores antes e depois (quadro acima);
b) Verifica-se a média aritmética das diferenças;
c) Verifica-se a variância das diferenças e;
d) Aplica-se o teste t - student.
37
b) X d = = 3,7
10
William Costa Rodrigues 24
c) Σd²=173; Σd=37; n= 10
1369
173 −
s2 = 10 = 173 − 136,9 43,3 = 4,01
9 9 9
O próximo passo e recorrer à tabela do teste t - student (Tabela 10, p. 42) e com-
para-se o valor do t calculado com o valor crítico da tabela em função de α com n-1
graus de liberdade.
No exemplo acima, n= 10, portanto, devemos verificar os valores críticos com
nove graus de liberdade. Desta forma, encontramos os valores 2,26 (5% ou α=0,05) e
3,35 (1% ou α=0,01).
O valor encontrado (calculado) de t= 5,84 é maior do que os valores da tabela.
Concluímos pela rejeição de H0 (hipótese nula) em nível de 1% de probabilidade
(α=0,01).
Conclui-se que a adição do farelo de mandioca na alimentação contribuiu para o
aumento do peso corpóreo das crianças.
X1 − X 2
t=
s12 s 22
+
n1 n 2
Calculado o valor de t teremos:
160 − 148 12 12
t= = = = 5,82
74 18 4,26 2,06
+
20 32
Para verificar a significância deste valor, devemos calcular o grau de liberdade
para o conjunto de dados, em que g é calculado através da fórmula:
2
s12 s 22
+
n1 n 2
g=
2 2
s2 s2
1 2
n1 n2
+
n1 − 1 n2 −1
Para nosso exemplo seria:
2
74 18
+
4,26 2
g= 2
20 32
2
= = 24,8 ≅ 25
74 18 0,73 2
20 + 32
20 − 1 32 − 1
Consulta-se então a tabela do teste t-student (Tabela 10, p. 42), para verificar os
valores críticos nos níveos de 5% e 1% de probabilidade para 25 graus de liberdade.
Na tabela iremos obter o valor de 2,06 (5%) e 2,79 (1%). Desta forma, conclui-
se que o valor obtido pata t = 5,82 é significativo no nível de 1% (1% ou α=0,01), acei-
tando-se a hipótese alternativa, devido à diferença significativa entre as médias das duas
amostras.
Exemplo:
Amostra (mg.L)
Marca A Marca B
1,4 1,7
1,5 1,8
1,8 1,4
1,3 1,2
1,1 1,9
1,6 1,0
1,5 1,5
1,4 -
1,2 -
1,4 -
X A= 1,42 X B= 1,5
sA²= 0,04 sB²= 0,11
nA= 10 nB = 7
s =
2 (n A − 1) × s 2A + (n B − 1) × s 2B
nA + nB − 2
Para nosso exemplo teríamos:
s2 =
(10 − 1)× 0,04 + (7 − 1)× 0,11 = 9 × 0,04 + 6 × 0,11 = 0,36 + 0,66 = 1,01 = 0,0673
10 + 7 − 2 15 15 15
Em seguida aplica-se a fórmula para o teste t.
XA − XB
t=
1 1
s 2 +
n
A n B
Assim temos:
1,42 - 1,5 − 0,8 − 0,8
t= = = ≅ − 1,98
1 1 0,1634 0,4043
0,0673 +
10 7
fe
Onde: fo= freqüência observada e; fe= freqüência esperada.
Curso de Estatística Ambiental 27
Neste caso temos uma tabela de contingência de 2 x 3, pois temos duas situações
as serem testadas (com ou sem diabete) em três grupos (faixas etárias).
O Grau de liberdades para tabelas de contingências será calculado pela seguinte
fórmula: GL = (n s − 1) × (n g − 1) . No nosso exemplo teremos:
GL = (2 − 1) × (3 − 1) ∴ GL = 1 × 2 ∴ GL = 2
Para calcular as freqüências realiza-se uma regra de três simples como segue:
34 ----------------------- 223
fe ------------------------- 77
34 × 77
Ou seja, fe A = a fe da terceira coluna (sem diabete) é calculada pela diferença
223
entre os valores da fe da 2ª coluna (com diabete) e o valor da coluna total (Σ). Os de-
mais valores da linha subseqüentes são obtidos com a realização da regra de três para
cada valor da 2ª coluna.
William Costa Rodrigues 28
χ =
2 (2 − 11,74 )
2
+
(75 − 65,26 )
2
+
(12 − 11,28)
2
+
(62 − 62,72 )
2
+
(20 − 10,98)
2
+
11,74 65,26 11,28 62,71 10,98
(52 − 61,62)2 ∴ χ 2 = 94,87 + 94,87 + 0,5184 + 0,5184 + 92,54 + 92,54 ∴
61,62 11,74 65,26 11,28 62,71 10,98 61,62
χ = 8,09 + 1,45 + 0,05 + 0,01 + 8,43 + 1,50 ∴ χ = 19,53
2 2
Métodos
A B C
DD posto DD posto DD posto
4 2 9 6 26 15
8 5 13 8 34 18,5
29 16 34 18,5 21 13
6 4 2 1 45 21
15 10 11 7 50 23
- - 22 14 47 22
RA=57,0 RC= 69,5 RC= 149,5
nA= 7 nC = 8 nC = 8
x A= 13,29 x B= 14,50 x C= 36,25
DD= dias para dessalinização.
Como já foi dito este teste segue a distribuição do teste χ². Desta forma, sendo k
= 3 (métodos), os graus de liberdade correspondem a 2, pois GL= k-1. Portanto, os valo-
res da tabela χ², correspondem a 5 e 1%, são 5,99 e 9,21, respectivamente.
Considerando que o valor calculado H=11,95 é maior que os valores tabelados,
rejeitamos H0 (não há diferenças entre os métodos testados no tempo de dessalinização
das amostras), assim aceita a H1. Pelos valores R encontrados nos resultados verifica-se
que o método A e mais eficiente no processo de dessalinização, pois leva menos tempo
em comparação aos demais.
Como valor de graus de liberdade é igual a k-1 graus de liberdade e sendo k=4
(tratamentos), têm-se 3 graus de liberdade. A partir da tabela χ² (Tabela 11, p. 43). Os
valores para 5 e 1% de probabilidade são 7,82 e 11,32, respectivamente.
Sendo o valor de χ²r calculado maior que os valores da tabela de χ², rejeita-se a
hipótese nula (H0) e aceita a hipótese alternativa (H1). Ou seja, a profundidade de 21-30
cm tem uma maior concentração do poluente que as demais profundidades avaliadas,
nas áreas onde foram coletadas amostras.
8 Correlação Linear
A correlação linear é utilizada para verificar, num determinado conjunto, a de-
pendência entre duas séries de variáveis.
Trata-se de um valor abstrato que dá uma idéia sobre a dependência entre os
dados apresentados.
A correlação pode ser denominada positiva ou negativa. Quando positiva há a
variação positiva da variável dependente (Y), quando há variação positiva da variável
Curso de Estatística Ambiental 31
Figura 8. Correlação linear simples positiva (A); e inversa ou negativa (B), apresentan-
do a linha de tendência de regressão linear simples de dados fictícios.
A utilização de um ou outro coeficiente, dependerá da normalidade dos dados
(veja o tópico Teste de Normalidade dos Dados, p.21).
A significância das tabelas acima poderá ser utilizada tanto na correlação de Pe-
arson, quanto na de Spearmann.
Figura 9. Janela
de configuração
da linha de ten-
dência (linha de
regressão) e
configuração da
equação de re-
gressão no Mi-
crosoft Excel.
T. aurantii
70
60
Figura 10. Regressão li-
50 near simples entre a flutu-
y = 0,3095x - 2,3472
ação populacional de T.
40
2
R = 0,3984
aurantii e a brotação foliar
30 de tangerina cv. Poncã, em
cultivo orgânico de tange-
20 rina cv. Poncã, na Fazen-
10
dinha Agroecológica, no
período de outubro de
0 2002 a outubro de 2003
0 20 40 60 80 100 120 (Adaptado de Rodrigues,
-10
2004).
Figura 11. Correlação múltipla da amplitude térmica (variável x), brotação (variável y)
e a flutuação populacional de Toxoptera citricida (variável z), em cultivo orgânico de
tangerina cv. Poncã, na Fazendinha Agroecológica, no período de outubro de 2002 a
outubro de 2003 (Adaptado de Rodrigues, 2004).
10 Transformação de Dados
Para uma aplicação válida dos testes de significância, baseados nas propriedades
das curva normal, é necessário que o dados tenham uma distribuição normal (Figura 4,
Figura 5 e Figura 6). As porcentagens, as contagens e as notas dadas a certas caracterís-
ticas qualitativas, exigem quase sempre essa transformação.
Vamos apresentar nesta apostila algumas das principais transformações de dados
empregadas na normalização dos dados e as situações que cada uma se aplica.
11.2 Exemplo
O exemplo hipotético abaixo da diversidade de cochonilhas em agroecossistema
cítrico, ilustra os índices de diversidade das cochonilhas de um pomar de citros.
Tabela 8. Índices de diversidade de cochonilhas em agroecossiema cítrico.
Período S N α Dg Dm
1994 10 268 1,609 4,118 0,611
1995 10 235 1,648 4,218 0,652
1996 10 323 1,557 3,985 0,556
1997 10 435 1,481 3,790 0,479
Média 10 315,25 1,574 4,045 0,575
% S = ∑ (% a + % b + % c + ... + % n )
Onde: % a = menor porcentagem da espécie a observada no confronto das comunida-
des; % b = idem, para espécies b; % c = idem, para espécies c e % n = idem, para espé-
cies n.
Tabela 9. Duas comunidades com sua composição de espécies em percentagem
Espécies
Comunidade
a b c d
A 15 35 27 23
B 33 14 36 17
11.3.4 Constância
Este parâmetro indica a percentagem de uma determinada espécie em relação a
todos os levantamentos realizados.
É dado pela fórmula:
n × 100
C=
N
Onde: n = Número de coletas contendo a espécies em estudo e N = Número total de
coletas realizadas.
A Constância de uma espécie poderá ser classificada da seguinte forma:
a) Espécies constantes – presentes em mais de 50% dos levantamentos;
b) Espécies acessórias – presentes entre 25–50% dos levantamentos;
c) Espécies Acidentais – Presentes em menos de 25% dos levantamentos.
William Costa Rodrigues 40
12 Bibliografia
13 Anexos
Tabela 10. Valores de t -student em níveis de 5% e 1% (α=0,05 a 0,01) de probabilida-
de1.
Grau de liberdade 5% (α=0,05) 1% (α=0,01)
1 12,71 63,66
2 4,30 9,92
3 3,18 5,84
4 2,78 4,60
5 2,57 4,03
6 2,45 3,71
7 2,36 3,50
8 2,31 3,36
9 2,26 3,25
10 2,23 3,17
11 2,20 3,11
12 2,18 3,06
13 2,16 3,01
14 2,14 2,98
15 2,13 2,95
16 2,12 2,92
17 2,11 2,90
18 2,10 2,88
19 2,09 2,86
20 2,09 2,84
25 2,06 2,79
30 2,04 2,75
50 2,01 2,68
100 1,98 2,63
500 1,96 2,59
∞ 1,96 2,58
1
A tabela completa poderá ser encontrada em Gomes (1990) e Levine et al. (1998).
Curso de Estatística Ambiental 43
2
A tabela completa poderá ser encontrada em Gomes (1990) e Levine et al. (1998).
William Costa Rodrigues 44
3
A tabela completa poderá ser consultada em Zar (1999).
Curso de Estatística Ambiental 45
4
A tabela completa poderá ser consultada em Zar (1999).
William Costa Rodrigues 46
*************
O minuto que você está vivendo agora é o mais importante de sua vida, onde quer que
você esteja.
Preste atenção ao que está fazendo.
O ontem já lhe fugiu das mãos.
O amanhã ainda não chegou.
Viva o momento presente, porque dele depende todo o seu futuro.
Procure aproveitar ao máximo o momento que está vivendo, tirando todas as vantagens
que puder, para seu aperfeiçoamento.
C. Torres Pastorinho
Minutos da Sabedoria, p. 154
*************