Escolar Documentos
Profissional Documentos
Cultura Documentos
Estat Ambiental PDF
Estat Ambiental PDF
Estatstica
Ambiental
Populao/Universo
Amostra
Parmetro
Estatstica
2006
3 Edio
Revisada e Ampliada
O Autor:
William Costa Rodrigues Agrnomo, Doutor em
Fitotecnia e Ps-Doutor em Entomologia, pela Univ.
Federal Rural do Rio de Janeiro. Prof. da universidade Severino Sombra, ministra aulas de Ecologia,
Toxicologia na graduao e de Bioestatstica na especializao, desenvolvedor de softwares. Coordenador Geral do projeto Entomologistas do Brasil
(www.ebras.bio.br). Coordenador e autor de captulos no livro Citricultura Fluminense: Principais
pragas e seus inimigos naturais. Trabalha ativamente com anlise estatstica em projetos na rea
agrcola e ambiental. O autor poder ser contatado
atravs do e-mail wcostarodrigues@yahoo.com.br.
Esta Obra:
A apostila Estatstica Ambiental utilizada no programa de Ps-Graduao Lato Sensu, Planejamento
e Gesto Ambiental, tendo como objetivo informar o
discente sobre os princpios bsicos da estatstica,
relacionando-a com a metodologia cientfica, possibilitando um entendimento bsico sobre o assunto.
Sumrio
1
2
3
4
5
Introduo ............................................................................................................. 1
1.1
Crescimento e Desenvolvimento da Estatstica Moderna................................ 1
1.2
Variao ao Acaso ......................................................................................... 1
Ensaio x Experimentao ...................................................................................... 2
Conceitos Estatsticos............................................................................................ 2
3.1
Estatstica Descritiva ..................................................................................... 2
3.2
Inferncia Estatstica...................................................................................... 2
3.3
Tipos de Dados.............................................................................................. 3
3.3.1
Variveis Aleatrias Categorizadas ........................................................ 3
3.3.2
Variveis Aleatrias Numricas ............................................................. 3
Por que Utilizar a Estatstica.................................................................................. 4
Planejamento Experimental ................................................................................... 4
5.1
Fases do Planejamento................................................................................... 4
5.1.1
Problema ............................................................................................... 4
5.1.2
Informaes Existentes .......................................................................... 5
5.1.3
Noes Gerais Sobre Hiptese ............................................................... 5
5.1.4
Formulao das Hipteses...................................................................... 5
5.1.4.1 Elaborando as hipteses ..................................................................... 6
5.1.4.2 Hiptese Estatstica x Hiptese Cientfica .......................................... 6
5.1.5
Testando as Hipteses............................................................................ 6
5.1.6
Aleatorizao ......................................................................................... 6
5.2
Erros de Observaes .................................................................................... 6
5.2.1
Erros do Observador .............................................................................. 7
5.2.2
Erro do Mtodo de Observao .............................................................. 7
5.2.3
Por Falta de Resposta............................................................................. 7
5.3
Controle dos Erros nas Observaes .............................................................. 8
5.4
Mtodos de Coleta de Dados ......................................................................... 8
5.4.1
Fontes Primrias .................................................................................... 8
5.4.2
Fontes Secundrias ................................................................................ 8
5.5
Pesquisa Observacional ................................................................................. 8
5.6
Pesquisa Experimental................................................................................... 9
5.6.1
Princpios da Experimentao .............................................................. 10
5.7
Tipos de Amostras....................................................................................... 10
5.7.1
Amostras Simples ao Acaso ................................................................. 10
5.7.2
Amostra Estratificada........................................................................... 10
5.7.3
Amostra Sistemtica ............................................................................ 10
5.7.4
Amostra por rea ................................................................................ 11
5.7.5
Amostra por Conglomeradas................................................................ 11
5.7.6
Amostra Selecionada ........................................................................... 11
5.8
Determinao do Tamanho da Amostra ....................................................... 11
5.8.1
Tamanho da Amostra para Dados Discretos ......................................... 12
5.8.2
Tamanho da Amostra para Dados Contnuos........................................ 13
Tcnicas Estatsticas Para Anlise de dados......................................................... 13
6.1
Medidas de Tendncia Central..................................................................... 13
6.1.1
Mdia Aritmtica Simples ( X ) ............................................................ 14
6.1.2
Mdia Aritmtica Ponderada................................................................ 14
6.1.3
Mdia Aritmtica de Dados Agrupados em Intervalos.......................... 15
6.1.4
Mediana (Me) ...................................................................................... 15
6.2
Medidas de Variao ................................................................................... 16
6.2.1
Desvio-Mdio (DM) ............................................................................ 16
6.2.2
Desvio Padro...................................................................................... 17
6.3
Varincia ou Quadrado Mdio ..................................................................... 18
6.4
Erro-Padro da Mdia - s(x)......................................................................... 18
6.5
Coeficiente de Variao............................................................................... 19
6.6
Curva de Distribuio Normal ..................................................................... 19
6.6.1
Limites de Confiana ........................................................................... 21
6.6.2
Erro Padro.......................................................................................... 21
7
Teste de Normalidade dos Dados......................................................................... 21
7.1
Teste de Klomogorov-Smirnov (K-S) .......................................................... 22
7.2
Teste de Shapiro-Wilks (S-W) ..................................................................... 22
8
Testes Paramtricos e No Paramtricos.............................................................. 22
8.1
Teste t - Student........................................................................................... 22
8.1.1
Dados Pareados.................................................................................... 23
8.1.2
Dados No-Pareados - Varincias Desiguais (Heterocedsticas)........... 24
8.1.3
Dados No-Pareados - Varincias Iguais (Homocedsticas) ................. 25
8.2
Teste Qui-Quadrado ().............................................................................. 26
8.3
Tabela de Contingncia ............................................................................... 27
8.4
Teste de Kruskal-Wallis............................................................................... 28
8.5
Teste de Friedman (Anlise da Varincia).................................................... 29
9
Correlao Linear................................................................................................ 30
9.1
Coeficiente de Correlao (r) ....................................................................... 31
9.1.1
Correlao de Pearson.......................................................................... 31
9.1.2
Correlao de Spearman ...................................................................... 31
9.1.3
Aspectos Gerais da Correlao Linear.................................................. 31
9.2
Coeficiente de Determinao (r) ................................................................. 32
9.3
Coeficiente de Alienao (K)....................................................................... 32
9.4
Significncia do Teste de Correlao ........................................................... 32
9.4.1
Significncia Baseada nos Intervalos.................................................... 32
9.4.2
Significncia Baseada no Teste t para r (Pearson)................................. 33
10
Anlise de Regresso....................................................................................... 33
10.1 Regresso Linear Simples............................................................................ 34
10.2 Regresso Linear Mltipla ........................................................................... 35
10.3 Regresso Mltipla ...................................................................................... 35
11
Transformao de Dados ................................................................................. 36
11.1 Raiz Quadrada ............................................................................................. 36
11.2 Transformao Logartimica........................................................................ 36
11.3 Transformao Angular (Arcoseno)............................................................. 36
11.4 Consideraes Gerais .................................................................................. 37
12
Testes Especficos Para Anlise de Populaes e Comunidades....................... 37
12.1 ndice de Diversidade e Dominncia Populacional....................................... 37
12.1.1 ndice de Margalef () ......................................................................... 37
12.1.2 ndice de Glason (Dg)........................................................................... 37
12.1.3 ndice de Menhinick (Dm) .................................................................... 37
12.1.4 ndice de Shanon-Wiener (H') .............................................................. 38
12.1.5 ndice de Dominncia Berger-Parker (d) .............................................. 38
12.2 Exemplo ...................................................................................................... 38
12.3 ndice de Similaridade entre Populaes ...................................................... 38
12.3.1 Quociente de Similaridade ................................................................... 38
13
14
ndice de Tabelas
Tabela 1. Resultados da interpretao de 500 fotos areas de diversas reas com
presena de mata. (dados fictcios) ........................................................................ 7
Tabela 2. Dados da do peso de 10 crianas antes e depois da administrao de a base de
folhas de mandioca (dados fictcios). ................................................................... 23
Tabela 3. Resultados das amostras de cinco diferentes reas delimitadas pelas
caractersticas edficas do solo, em quatro diferentes profundidades. Os dados
apresentados referem-se a o poluente --16-Imaginol-Poluentis, em mg.mm de
solo ..................................................................................................................... 30
Tabela 4. Correlao de Spearman entre as notas brutas de matemtica e biologia (Zar,
1999)................................................................................................................... 31
Tabela 5. Classificao do valor r atravs de intervalos de 0 a 1.................................. 33
Tabela 6. Classificao do valor r atravs de intervalos de acordo com e Teste de Rugg.
............................................................................................................................ 33
Tabela 7. Srie de dados da correlao da flutuao populacional do pulgo Toxoptera
aurantii (Homoptera, Aphididae) em funo da brotao foliar de tangerina cv
Ponc, sob cultivo orgnico na Fazendinha Agroecolgica, no perodo de outubro
de 2002 e outubro de 2003 (Extrado de Rodrigues, 2004). Exemplo para o
Microsoft Excel................................................................................................... 34
Tabela 8. ndices de diversidade de cochonilhas em agroecossiema ctrico.................. 38
Tabela 9. Duas comunidades com sua composio de espcies em percentagem ......... 39
Tabela 10. Valores de t -student em nveis de 5% e 1% (=0,05 a 0,01) de
probabilidade....................................................................................................... 42
Tabela 11. Valores de (Qui-quadrado) em nveis de 5% e 1% (=0,05 a 0,01) de
probabilidade ...................................................................................................... 43
Tabela 12. Valores crticos para o Coeficiente de Correlao de Spearman (rs)............ 44
Tabela 13. Valores para transformao arcsen % ..................................................... 45
Tabela 14. Valores mnimos de j, significativos a 0,5% (Southwood, 1971). ............... 46
ndice de Figuras
Figura 1. Diagrama de uma estatstica descritiva, com seus diversos nveis de
categorias. ............................................................................................................. 3
Figura 2. Diagrama de tipos de dados............................................................................ 4
Figura 3. Interpretao dos dados experimentais. O grfico esquerda, baseado em
apenas dois pares de valores anotados para X e Y (que definem os pontos A e D),
parece sugerir que Y cresce a medida que X cresce, entretanto no grfico direita,
em que foram registrados outros valores intermedirios (definidos pelo pontos B e
C), mostra que a relao entre X e Y obedece a uma lei mais completa. ................ 9
Figura 4. Curva de distribuio normal simtrica, onde a mdia e s o desvio padro.
............................................................................................................................ 19
Figura 5. Curvas de distribuio normal das freqncias de X, tendo a mesma mdia ()
e diferentes graus de disperso dos valores de X, isto , desvios padres (s)
diferentes. ........................................................................................................... 20
Figura 6. Curva normal padro, tendo por parmetros =0 e s= 1. As reas sob a curva
assinaladas entre os traos verticais, indicam as percentagens de valores de X a
contidas............................................................................................................... 20
Figura 7. Os valores de Z (compreendidos entre -Z e +Z) correspondem aos
afastamentos de X em relao mdia , medidos em unidades de desvio-padro.
A probabilidade (P) com que X possa ter valor menor que uma coordenada
escolhida (C) indicada pela rea, sob a curva, situada esquerda de C. ............. 21
Figura 8. Correlao linear simples positiva (A); e inversa ou negativa (B),
apresentando a linha de tendncia de regresso linear simples de dados fictcios. 32
Figura 9. Janela de configurao da linha de tendncia (linha de regresso) e
configurao da equao de regresso no Microsoft Excel................................... 34
Figura 10. Regresso linear simples entre a flutuao populacional de T. aurantii e a
brotao foliar de tangerina cv. Ponc, em cultivo orgnico de tangerina cv. Ponc,
na Fazendinha Agroecolgica, no perodo de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004). .......................................................................... 35
Figura 11. Correlao mltipla da amplitude trmica (varivel x), brotao (varivel y) e
a flutuao populacional de Toxoptera citricida (varivel z), em cultivo orgnico
de tangerina cv. Ponc, na Fazendinha Agroecolgica, no perodo de outubro de
2002 a outubro de 2003 (Adaptado de Rodrigues, 2004)...................................... 35
Figura 12. Regresso mltipla entre a flutuao populacional de T. aurantii e a
brotao foliar de tangerina cv. Ponc, em cultivo orgnico de tangerina cv. Ponc,
na Fazendinha Agroecolgica, no perodo de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004). .......................................................................... 36
Introduo
Ensaio x Experimentao
Experimentao
O tempo de avaliao dever ser o suficiente
para que o dados coletado possam garantir
uma avaliao, com margem de erro menor
possvel.
O nmero de amostra dever ser suficiente
para avaliar os dados com a maior preciso
possvel
O tamanho do experimento dever ser suficiente para avaliar os dados.
As variaes ao acaso so controladas com
rigor, possibilitando assim menor erro amostral e na anlise estatstica.
A anlise e interpretao dos dados devero
ser rigorosas e adequadas ao tipo de experimentao realizada.
Conceitos Estatsticos
Para melhor elucidar estes conceitos, digamos que h uma necessidade de saber
a opinio da qualidade de vida no campus de sua faculdade. A populao, ou universo,
ser todos os alunos da faculdade, enquanto a amostra consistir os estudantes selecionados para participar da pesquisa. O objetivo da pesquisa descrever vrias atitudes ou
caractersticas de toda a populao (os parmetros). Isto seria alcanado utilizando-se
as estatsticas obtidas da amostra de estudantes para estimar atitudes ou caractersticas
de interesse da populao. Desse modo, um aspecto principal da inferncia o processo
que utiliza a estatstica amostral para tomar decises sobre os parmetros da populao.
Populao/Universo
Amostra
Parmetro
Estatstica
Figura 1. Diagrama de uma estatstica descritiva, com seus diversos nveis de categorias.
A necessidade da inferncia estatstica deriva da necessidade da amostragem.
Quando a populao se torna grande, geralmente dispendioso demais, consome muito
tempo e muito cansativo obter informaes sobre a populao inteira. Decises pertinentes s caractersticas da populao devem ser baseadas na informao contida numa
amostra da populao.
3.3 Tipos de Dados
Existem basicamente dois tipos de dados de caractersticas de variveis aleatrias que podem ser estudadas e que produzem os resultados ou os dados observados:
categorizados ou numricos (Figura 2).
3.3.1 Variveis Aleatrias Categorizadas
Este tipo de varivel produz respostas categorizadas. Por exemplo, voc tem
Sim
No.
carro?
3.3.2 Variveis Aleatrias Numricas
Produz respostas numricas, podendo ser nmeros discretos ou contnuos. A
resposta para pergunta: "Quantos livros voc possui?", a resposta discreta, enquanto a
reposta para "Qual a sua altura?", contnua.
Dados discretos so respostas numricas que surgem a partir de processo de contagem e dados contnuos so repostas numricas que surgem a partir de um processo de
medio.
Na Figura 2, segue exemplos de variveis tanto para aleatrias categorizadas,
quanto para aleatrias numricas (discretas e contnuas).
Tipos de Dados
Categorizadas
Numricas
Sim
No
Discretas
Contnuas
1,75m
Planejamento Experimental
Observa-se pela tabela acima que em nenhuma das duas ocasies os diferentes
observadores coincidiram quanto ao nmero de fotos consideradas positivas para o referido diagnstico. O mesmo foi verificado em relao a cada um dos observadores que
apresentaram resultados diferentes entre as duas leituras.
Devemos concluir que, tais discordncias no refletem uma variao real, e sim
cometida por quem procedeu leitura do material fotogrfico.
Os modelos matemticos que prevem erros por falta de resposta so apropriados, pois iro permitir uma flexibilidade de estimar o dado faltoso.
sentam concomitantemente. Por isso deve ser atenta, precisa e metdica. Deve ser persistente, completa, porm analtica.
Exige que o pesquisador seja curioso, paciente, objetivo e imparcial; capaz de
com os olhos isentos de preconceitos e a cabea livre das frmulas tradicionais, de idias fixas ou baseadas em dogmas ou em autoridades que no demonstraram cabalmente,
na praticam a validade de suas bases.
Sempre que possvel, portanto, as observaes devem ser corretamente registradas, repetidas e quantificadas, partindo-se de medidas rigorosas que permitam a anlise
estatstica dos dados.
26
Y 35
24
30
22
25
20
20
18
15
16
10
14
0
5
0
10
11
12
3. Nvel de confiana (). Deve-se imaginar que, ao apresentarmos um valor percentual, referente taxa de prevalncia do fenmeno estudado na amostra observada, aquele
valor tem, em relao ao valor percentual da populao, uma diferena, que , a priori,
arbitrada pelo pesquisador. Esta diferena arbitrada considerada tendo em conta um
nvel de acerto que normalmente consideramos de 95% ou 99% de confiana, ou seja, o
nvel de confiana de que aquela diferena arbitrada realmente ocorra at o limite de
diferena proposto.
Os nveis de confiana propostos rotineiramente so de 95% e 99% de confiana. Simbolizado pela letra z, este valor substitudo na frmula (1) por uma constante
1,96, quando o nvel de confiana corresponde a 95%, e por 2,58 quando o nvel de confiana de 99%.
4. Informao da literatura (p). Toda pesquisa a realizar em que investigamos a taxa
de prevalncia que fenmeno apresenta, na literatura, resultados os quais utilizaremos
quando da determinao do valor de n em relao ao valor de p. Chamamos q o valor
complementar de p para 100%, ou seja, p + q = 100%.
5. Erro de amostragem ou preciso. Ao procedermos s tcnicas de amostragem para
determinao do tamanho da amostra (n), entende-se que a amostra obtida apresentar
um determinado valor para a taxa de prevalncia de certo evento. Normalmente esperada uma diferena em relao taxa de prevalncia da populao-alvo. Esta diferena
conhecida como erro de amostragem ou preciso, a qual geralmente arbitrada pelo
pesquisador.
5.8.1 Tamanho da Amostra para Dados Discretos
Quando dispomos de variveis discretas, utilizamos as seguintes frmulas:
n
z2 p q
n0 =
(1) e n = 0 (2 )
2
n
(P p )
1+ 0
N
Onde n0: nmero inicial; Z: nvel e confiana; p: valor obtido de trabalho anteriormente realizado; N tamanho da populao; q: 100%-p; (P-p): erro arbitrado pelo pesquisador.
Quando se trata de trabalho original e no se dispe de nenhum valor usamos
p=50%.
Em populaes finitas, so utilizadas as frmulas (1) e (2). Para populaes infinitas e para as que N seja um valor muito elevado, apenas a frmula (1) deve ser utilizada.
Exemplo: com a finalidade para verificar a incidncia de doena de Chagas em
uma populao de certa regio, desejamos determinar o tamanho da amostra, sendo o
tamanho da populao igual a 40.000 pessoas.
Considerando uma prevalncia de anos anteriores igual a 20% com valor z =
1,96 (=5%) e sendo estabelecida uma preciso de 4%, qual seria o nmero de elementos que a amostra deveria conter?
A frmula adequada para mensurar o tamanho da amostra a equao 1. Desta
forma temos:
Z = 1,96; p = 20%; q = 80%; e (P-p)= 4%
1,96 2 20 80
3,84 1.600
n0 =
n0 =
2
16
4
13
14
Representam ou resumem todos os valores obtidos pelo grupo e, como tal, fornecem uma descrio precisa da execuo do grupo como um todo, e;
Permitem o confronto de dois ou mais grupos.
Usam -se, em geral, trs medidas de tendncia central: mdia aritmtica (simples, ponderada, de dados agrupados em intervalos), mediana e moda.
x : 32 + 25 + 32 + 30 + 26 + 30 + 29 + 26 + 29 + 33.
n = 10
292
X=
29,2
10
15
Idade (anos)
9
X=
Freqncia
4
2 10 + 3 8 + ... + 9 4 250
= 5 anos
=
10 + 8 + ... + 4
50
Freqncia (f)
4
2
3
1
10
X.f
10,0
15,0
37,5
17,5
80,0
16
n +1
, quando o nmero de ob2
n n
e + 1 , quando o nmero de observaes par, o
2 2
que corresponde mdia dos valores centrais.
Exemplo:
a) Em determinada localidade foram selecionadas oito escolas, com a finalidade de
estimar a mediana referente ao nmero de alunos. Tendo verificado o seguinte
quadro:
Escola
N de alunos
A
150
B
180
C
230
D
2.500
E
200
F
160
G
250
H
170
Inicialmente ordenam-se os dados: 150, 160, 170, 180, 200, 250 e 2.500.
n n
Como o nmero de observaes par utilizam-se as duas frmulas e + 1 ,
2 2
para obter os dois valores centrais. Assim os valores centrais para este conjunto de dados so 180 (4) e 200 (5), portanto o valor mdio destes dois valores igual a 190, que
corresponde mediana.
Me= 190 alunos.
b) Em coletas de amostra de solo em cinco cidades, foram verificadas amostras poludas com metais pesados, conforme o quadro a seguir:
Municpios
Amostras Poludas
A
48
B
42
C
52
D
95
E
46
Aps ordenar os dados teremos: 42, 46, 48, 52 e 95. Como o nmero de obsern +1
vaes mpar utilizaremos a frmula
, para encontra o valor central. Desta forma,
2
o valor central 48, que corresponde ao valor da mediana.
Me= 48 amostras poludas
17
X=
D.M. =
D.M. =
2 + 5 + 9 + 11 + 14 + 25
66
X =
= 11
6
6
2 - 11 + 5 - 11 + 9 - 11 + 11 - 11 + 14 - 11 + 25 - 11
6
9 + 6 + 2 + 0 + 3 + 14
6
D.M. =
34
6
D.M. = 5,6
( x )
n
n 1
Onde: x: valores do conjunto de dados; : somatrio; e n: nmero de observas=
es.
Exemplo: Calcular o desvio padro do seguinte conjunto de dados: 2, 5, 9, 11, 14 e 25
x= 2+ 5 + 9 + 11 + 14 + 25 = 66
x= 2 + 5 + 9 + 11 + 14 + 25 x= 4 + 25 + 81 + 121 + 196 + 625 = 1.052
n=6
66 2
4.356
1.052
6 s =
6 s = 1.052 726 s =
s=
6 1
5
6 1
s = 8,07
1.052
326
s = 65,20
5
importante ressaltar que no clculo do desvio padro utilizou-se o denominador (n-1), ou seja, o grau de liberdade, pois como o valor s uma estimativa, devemos ajustar o erro desta estimativa, eliminando um elemento do conjunto de
observaes. Vale ressaltar que, no caso de populaes finitas o denominador
ser n e o desvio passa ser o (desvio padro absoluto ou verdadeiro).
Observamos agora uma srie de dados agrupados, isto , uma srie de valores
que se repetem e, por conseguinte, so representados pela sua freqncia.
x
f
fx
2
2
4
3
2
6
4
4
16
18
x
f
fx
5
4
20
6
2
12
14
58
TOTAL
Temos um total de 14 valores agrupados em cinco categorias. Desta forma lana-se mo de um novo quadro de dados para facilitar os clculos
x
f
fx
fx
2
2
4
8
3
2
6
18
4
4
16
64
5
4
20
100
6
2
12
72
14
58
262
TOTAL
Para calcular o desvio padro desta distribuio, utiliza-se a seguinte frmula:
s=
s=
fx
n
fx
, ou seja,
262 58
s = 18,71 4,12 s = 18,71 16,81 s = 1,90 s = 1,38
14 14
2
19
20
Figura 6. Curva normal padro, tendo por parmetros =0 e s= 1. As reas sob a curva
assinaladas entre os traos verticais, indicam as percentagens de valores de X a contidas.
A rea compreendida entre -2s e +2s abrange cerca de 95,5% dos valores de X,
restando, portanto duas reas extremas, apenas 4,5% das observaes ou eventos medidos.
As propriedades da curva normal permitem seu uso para o clculo de probabilidade com que determinados valores obtidos durante as observaes, ou as medies,
possam ocorrer em funo das variaes.
21
Figura 7. Os valores de Z (compreendidos entre -Z e +Z) correspondem aos afastamentos de X em relao mdia , medidos em unidades de desvio-padro. A probabilidade
(P) com que X possa ter valor menor que uma coordenada escolhida (C) indicada pela
rea, sob a curva, situada esquerda de C.
6.6.2 Erro Padro
Em alguns casos, conveniente trabalhar com a mdia das mdias amostrais.
Nesse caso o desvio padro de uma distribuio de mdias ou de diferenas entre mdias tambm chamado de erro padro.
22
pao quantos s suas restries. Testes estatsticos com grandes amostras mostram que
nem sempre as suposies de normalidade de confirmam. Por outro lado, como nem
sempre se dispes de um nmero elevado de casos para estudo, s vezes nem possvel
decidir se determinada varivel possui ou no distribuio normal (na prtica a amostra
deve ter o valor n > 100).
Os testes comumente utilizados so KlomogorovSmirnov, ou teste K-S, que
um teste tradicional de normalidade e o teste de Shapiro-Wilks, ou teste S-W, vem sendo empregado cada vez com maior freqncia.
7.1 Teste de Klomogorov-Smirnov (K-S)
Este teste compara a distribuio real dos dados (amostra) com uma distribuio
normal gerada por uma mdia e um desvio padro supostamente conhecidos (populacionais).
7.2 Teste de Shapiro-Wilks (S-W)
Este teste uma boa opo para se testas a normalidade de uma distribuio. o
teste pode ser usado em amostra de at 2.000 observaes. Nos ltimos anos o teste SW tem sido preferido ao teste K-S pela capacidade de adaptao a uma variada gama de
problemas sobre a variao de normalidade.
23
Peso (Kg)
Antes
24
23
24
23
30
31
31
14
20
18
238
Depois
28
25
25
29
32
34
38
19
22
23
275
Diferena
4
2
1
6
2
3
7
5
2
5
37
Procedimento:
a) Obtm-se as diferenas entre os valores antes e depois (quadro acima);
b) Verifica-se a mdia aritmtica das diferenas;
c) Verifica-se a varincia das diferenas e;
d) Aplica-se o teste t - student.
37
b) X d =
= 3,7
10
24
c) d=173; d=37; n= 10
1369
10 = 173 136,9 43,3 = 4,01
9
9
9
173
s2 =
d) t =
3,7
4,01
10
=t=
3,7
0,401
3,7
= 5,84
0,6332
O prximo passo e recorrer tabela do teste t - student (Tabela 10, p. 42) e compara-se o valor do t calculado com o valor crtico da tabela em funo de com n-1
graus de liberdade.
No exemplo acima, n= 10, portanto, devemos verificar os valores crticos com
nove graus de liberdade. Desta forma, encontramos os valores 2,26 (5% ou =0,05) e
3,35 (1% ou =0,01).
O valor encontrado (calculado) de t= 5,84 maior do que os valores da tabela.
Conclumos pela rejeio de H0 (hiptese nula) em nvel de 1% de probabilidade
(=0,01).
Conclui-se que a adio do farelo de mandioca na alimentao contribuiu para o
aumento do peso corpreo das crianas.
25
t=
X1 + X 2
s 12 s 22
+
n1 n 2
g=
s2 s2
1 + 2
n1 n 2
s2
1
n1
+
n1 1
n2 1
2
s2
2
n2
26
Exemplo:
Amostra (mg.L)
Marca A
1,4
1,5
1,8
1,3
1,1
1,6
1,5
1,4
1,2
1,4
X A= 1,42
sA= 0,04
nA= 10
Marca B
1,7
1,8
1,4
1,2
1,9
1,0
1,5
X B= 1,5
sB= 0,11
nB= 7
s 2
+
n
n
A
B
Assim temos:
t=
1,42 - 1,5
1 1
0,0753 +
10 7
0,8
5,92
0,0183
Os valores de t tabelado para 15 graus de liberdade a 5 e 1% so respectivamente, 2,13 e 2,95. Desta forma, conclui-se que as duas marcas de gua mineral apresentam
diferentes propores de sulfatos em sua composio, sendo que a marca B possui maiores concentraes em relao marca A.
2
=
fe
Onde: fo= freqncia observada e; fe= freqncia esperada.
27
77
74
72
223
Neste caso temos uma tabela de contingncia de 2 x 3, pois temos duas situaes
as serem testadas (com ou sem diabete) em trs grupos (faixas etrias).
O Grau de liberdades para tabelas de contingncias ser calculado pela seguinte
frmula: GL = (n s 1) (n g 1) . No nosso exemplo teremos:
GL = (2 1) (3 1) GL = 1 2 GL = 2
Para calcular as freqncias realiza-se uma regra de trs simples como segue:
34 ----------------------- 223
fe ------------------------- 77
34 77
a fe da terceira coluna (sem diabete) calculada pela diferena
223
entre os valores da fe da 2 coluna (com diabete) e o valor da coluna total (). Os demais valores da linha subseqentes so obtidos com a realizao da regra de trs para
cada valor da 2 coluna.
Ou seja, fe A =
28
Para calcular o do conjunto de dados utilizaremos a frmula vista anteriormente. Assim teremos:
2
2
2
2
2
(
2 11,74 )
(
75 65,26 )
(
12 11,28)
(
62 62,72 )
(
20 10,98)
2
=
+
+
+
+
+
11,74
65, 26
11, 28
62,71
10,98
11,74
65,26
11, 28
62,71
10,98
61,62
29
A
DD
posto
4
2
8
5
29
16
6
4
15
10
RA=57,0
nA= 7
x A= 13,29
Mtodos
B
DD
posto
9
6
13
8
34
18,5
2
1
11
7
22
14
RC= 69,5
nC= 8
x B= 14,50
C
DD
posto
26
15
34
18,5
21
13
45
21
50
23
47
22
RC= 149,5
nC= 8
x C= 36,25
+
+
23 (23 + 1) 7
8
8
3 (23 + 1)
12
3.249 4.830,25 22.350,25
H=
+
+
3 24
23 24 7
8
8
12
H=
(464,14 + 603,78 + 2.793,78) 3 24
552
12
(3.861,70) 72 H = 0,0217 3.861,70 72
H=
552
H = 11,95
Como j foi dito este teste segue a distribuio do teste . Desta forma, sendo k
= 3 (mtodos), os graus de liberdade correspondem a 2, pois GL= k-1. Portanto, os valores da tabela , correspondem a 5 e 1%, so 5,99 e 9,21, respectivamente.
Considerando que o valor calculado H=11,95 maior que os valores tabelados,
rejeitamos H0 (no h diferenas entre os mtodos testados no tempo de dessalinizao
das amostras), assim aceita a H1. Pelos valores R encontrados nos resultados verifica-se
que o mtodo A e mais eficiente no processo de dessalinizao, pois leva menos tempo
em comparao aos demais.
30
Tabela 3. Resultados das amostras de cinco diferentes reas delimitadas pelas caractersticas edficas do solo, em quatro diferentes profundidades. Os dados apresentados
referem-se a o poluente --16-Imaginol-Poluentis, em mg.mm de solo
Blocos
rea A
rea B
rea C
rea D
rea E
Total
0-10
12 (2)
8 (2)
14 (2)
17 (3)
12 (2)
Profundidade (cm)
11-20
21-30
13 (3)
16 (4)
9 (3)
12 (4)
20 (3)
22 (4)
16 (2)
21 (4)
15 (3)
16 (4)
31-50
7 (1)
5 (1)
6 (1)
11 (1)
10 (1)
R1= 11
R2= 14
R4= 5
R3= 20
*Os valores entre parnteses e em negrito correspondem ordenao dos tratamentos dentro dos blocos
(linhas). Sendo o valor Ri a somas dos valores de ordenao nos tratamentos (colunas).
Como valor de graus de liberdade igual a k-1 graus de liberdade e sendo k=4
(tratamentos), tm-se 3 graus de liberdade. A partir da tabela (Tabela 11, p. 43). Os
valores para 5 e 1% de probabilidade so 7,82 e 11,32, respectivamente.
Sendo o valor de r calculado maior que os valores da tabela de , rejeita-se a
hiptese nula (H0) e aceita a hiptese alternativa (H1). Ou seja, a profundidade de 21-30
cm tem uma maior concentrao do poluente que as demais profundidades avaliadas,
nas reas onde foram coletadas amostras.
Correlao Linear
A correlao linear utilizada para verificar, num determinado conjunto, a dependncia entre duas sries de variveis.
Trata-se de um valor abstrato que d uma idia sobre a dependncia entre os
dados apresentados.
A correlao pode ser denominada positiva ou negativa. Quando positiva h a
variao positiva da varivel dependente (Y), quando h variao positiva da varivel
31
Notas de
Matemtica
57
45
72
78
53
63
86
98
59
71
n= 10; di2=72
Rank de
Xi
3
1
7
8
2
5
9
10
4
6
Notas de
Biologia
83
37
41
84
56
85
77
87
70
59
Rank de
Yi
7
1
2
8
3
9
6
10
5
4
di
di2
4
0
5
0
1
4
3
0
1
2
Total
16
0
25
0
1
16
9
0
1
4
72
6 (72 )
432
432
1
1
1 0, 4364 0,5636
3
10 10
1000 10
990
Para verificar se h significncia na correlao
rs = 1
32
B
3
2,5
2,5
1,5
1,5
0,5
0,5
0
0
20
40
60
20
40
60
Figura 8. Correlao linear simples positiva (A); e inversa ou negativa (B), apresentando a linha de tendncia de regresso linear simples de dados fictcios.
A utilizao de um ou outro coeficiente, depender da normalidade dos dados
(veja o tpico Teste de Normalidade dos Dados, p.21).
33
Significncia
Correlaes nulas
Correlaes fracas
Correlaes substncias
Correlaes fortes
Correlaes extremamente Fortes
Significncia
r desprezvel
r baixo
r aprecivel
r acentuado
A significncia das tabelas acima poder ser utilizada tanto na correlao de Pearson, quanto na de Spearmann.
10 Anlise de Regresso
freqente o estudo da relao entre duas sries de variveis. Por exemplo, o
peso de crianas de acordo coma dieta oferecida em diferentes dosagens. Sabe-se que
determinadas dietas tm interferncia no ganho ou na reduo do peso de indivduos da
raa humana. Portanto h um interesse de expressar essa relao sob a forma matemtica, atravs da apresentao de uma funo.
Para identificao de uma possvel correlao entre sries de variveis, torna-se
bastante eficaz a construo de um diagrama que se obtm em sistemas de eixos cartesianos.
Hoje em dia os programas (softwares) de planilha de clculo e de estatstica,
fornecem a equao da reta ou de outro tipo de regresso que se queira plotar. Desta
forma, basta organizar os dado de forma correta e selecionar a criao de um grfico de
disperso, para verificar a com o prprio nome diz, a disperso dos dados de Y em funo de X. A mostra como montar uma srie de dados para criao de um grfico de disperso no Microsoft Excel.
34
T. a
0,00
0,00
20,00
5,00
40,00
7,50
40,00
2,50
60,00
2,50
0,00
0,00
30,00
2,50
50,00
10,00
100,00
12,50
100,00
25,00
100,00
60,00
1
2
3
4
Para criao do grfico de disperso basta selecionar os dados das linhas 2 e 3
(Tabela 1) e selecionar o menu Inserir Grfico e selecionar o grfico Disperso (XY)
em seguida clique em Avanar > para configurar o grfico ou em Concluir para finalizar a criao. Aps criar o grfico selecione um dos pontos e em seguida clique no boto direito de mouse e selecione a opo Adicionar linha de tendncia... Ser exibida
uma janela com mostra a Figura 9. O tipo de linha ser de acordo com a equao que
melhor de adeqei a distribuio dos dados, lembrando que um evento biolgico somente poder ser explicado at uma equao de segundo grau, ou seja, caos opte por linha
do tipo polinomial a ordem para eventos biolgico dever ser 2..
A exibio da equao e do valor de R feita atravs da seleo da Aba Opes, selecionando a caixa de seleo:
Exibir equao no grfico
Exibir valor de R-quadrado no grfico
Figura 9. Janela
de configurao
da linha de tendncia (linha de
regresso)
e
configurao da
equao de regresso no Microsoft Excel.
10.1 Regresso Linear Simples
Neste tipo de regresso possvel verificar a associao entre as sries de dados,
plotar a linha e a equao da reta de duas variveis, X independente e Y dependente.
35
T. aurantii
70
60
50
y = 0,3095x - 2,3472
40
R = 0,3984
30
20
10
0
0
-10
20
40
60
80
100
120
Figura 11. Correlao mltipla da amplitude trmica (varivel x), brotao (varivel y)
e a flutuao populacional de Toxoptera citricida (varivel z), em cultivo orgnico de
tangerina cv. Ponc, na Fazendinha Agroecolgica, no perodo de outubro de 2002 a
outubro de 2003 (Adaptado de Rodrigues, 2004).
10.3 Regresso Mltipla
Neste tipo de regresso possvel verificar a associao entre as sries de dados,
plotar a linha de tendncia polinomial e a equao de segundo graus das duas variveis,
X independente e Y dependente.
36
T. aurantii
70
60
50
40
R = 0,4695
30
20
10
0
0
20
40
60
80
100
120
11 Transformao de Dados
Para uma aplicao vlida dos testes de significncia, baseados nas propriedades
das curva normal, necessrio que o dados tenham uma distribuio normal (Figura 4,
Figura 5 e Figura 6). As porcentagens, as contagens e as notas dadas a certas caractersticas qualitativas, exigem quase sempre essa transformao.
Vamos apresentar nesta apostila algumas das principais transformaes de dados
empregadas na normalizao dos dados e as situaes que cada uma se aplica.
37
morrido aps a poluio de um determinado solo. Os dados so transformados em percentagens e, em seguida, so calculados os valores atravs da frmula p' = arcsen % ,
utilizando-se uma tabela apropriada. Nesse tipo de transformao, todos os dados deveriam estar baseados em um nmero de observaes iguais, mas o mtodo pode tambm
ser utilizado quando esse nmero no rigorosamente igual sugerido na literatura que
valores de 0 e 100%, sejam substitudos por n e 100- n, respectivamente, antes de
entrar na tabela.
38
12.2 Exemplo
O exemplo hipottico abaixo da diversidade de cochonilhas em agroecossistema
ctrico, ilustra os ndices de diversidade das cochonilhas de um pomar de citros.
Tabela 8. ndices de diversidade de cochonilhas em agroecossiema ctrico.
Perodo
1994
1995
1996
1997
Mdia
S
10
10
10
10
10
N
268
235
323
435
315,25
1,609
1,648
1,557
1,481
1,574
Dg
4,118
4,218
3,985
3,790
4,045
Dm
0,611
0,652
0,556
0,479
0,575
Sorensen QS =
2j
(a + b )
Onde: a = Nmero de espcies presente no habitat ou comunidade A, ou nmero de levantamentos com a espcie a; b = Nmero de espcies presente no habitat ou comunidade B; ou nmero de levantamentos com a espcie b e j = Nmero de espcies presente nos dois habitats ou comunidades ou nmero de levantamentos contendo, simultaneamente, as duas espcies.
39
Espcies
a
15
33
b
35
14
c
27
36
d
23
17
40
41
13 Bibliografia
Arango, H.G. 2001. Bioestatstica Terica e Computacional. Rio de Janeiro: Guanabara
Koogan, 235p.
Beiguelman, B. 2002. Curso prtico de bioestatstica. Ribeiro Preto: FUNPEC, 5 Ed.,
272p.
Berger, W.H. & Parker, F.L. 1970. Diversity of Planktonic Foraminifera in Deep-Sea
sediments. Science, 168: 1345-1347.
Brower, J.E.; Zar, J.H. & von Ende, C.N. 1998. Field and Laboratory Methods for
General Ecology. Quebecor: MC Graw Hill, 4th ed., 273p and software included.
Centeno, A.J. 2002. Curso de Estatstica Aplicada Biologia. Goinia (Coleo Didtica, 3): Ed. Da UFG, 2 ed., 2 reimpr. 234p.
Clark, L.R.; Geier, P.W.; Hughes, R.D. & Morris, R.F. 1967. The Ecology of insect
Populations in Theory and Practice. Methuen & Co., London. 232p.
Dauber, J.; Hirsch. M.; Simmering, D.; Waldhardt, R.; Otte A. & Wolters, V.
2003. Landscape structure as an indicator of biodiversity: matrix effects on species
richness. Agriculture, Ecosystems and Environment, 98: 321-329.
Fager, E.W. 1957. Determination and analysis of recurrent groups. Ecology, 38:586595.
Gomes, F.P. 1990. Curso de Estatstica Experimental, Piracicaba: Nobel, 13 ed (revista
e ampliada), 467p.
Jaccard, P. 1912. The distribution of the flora in the alpine zone, NeroPhytal. 11:37-50.
Lara, F.M. 1992. Princpios de Entomologia. Ed. cone, 3 ed. 331 p.
Laroca, S. 1995. Ecologia: princpios e mtodos: Petrpolis: Vozes, 197p.
Levine, D.M.; Berenson, M.L & Stephan, D. 2000. Estatstica: teoria e Aplicaes
usando Microsoft Excel em portugus. Souza, T.C.P (Trad.). Rio de Janeiro:
LTC. 811p.
Lewinsohn, T.M & Prado, P. I. K.L. 1997.O uso de anlise multivariadas ecolgicas
em estudos ambientais interdisciplinares. Caderno V, Campinas: UNICAMP, 43p.
Mulekar, M.S. & Mishra, S.T. 2000. Confidence interval estimation of overlap: equal
means case. Computational Statistics & Data Analysis, 34: 121-137.
Rey, L. 2000. Planejar e redigir trabalhos cientficos, So Paulo: Edgard Blcher, 2 ed.
(revista e ampliada), 318p.
Rodrigues, P.C. 2002. Bioestatstica. Niteri: EdUFF. 3 ed. 339p.
Rodrigues, W.C. 2004. Hompteros (Homoptera: Sternorrhyncha) associados tangerina cv. Ponc (Citrus reticulata Blanco) em cultivo orgnico e a interao com
predadores e formigas. Seropdica, UFRuralRJ. 63f. Tese de Doutorado.
Siegel, S. 1979. Estatstica no paramtrica. So Paulo: MC Graw Hill do Brasil. 169p.
Silveira Neto, S.; Nakano, O; Barbin, D. & Villa Nova, N. A. 1976. Manual de Ecologia de Insetos. Ed. Agronmica Ceres, 419 p.
Sorensen, T. 1948. A method of establishing groups of equal amplitude in plant sociology basead an similarity of species. Biol. Skr. 5:1-34
Southwood, T.R.E. 1971. Ecological Methods. Chapman and Hall Ltd., 391p.
Zar. J.H. 1999. Biostatistical Analysis. New Jersey: Prentice Hall. 4th ed., 663p and
index included.
42
14 Anexos
Tabela 10. Valores de t -student em nveis de 5% e 1% (=0,05 a 0,01) de probabilidade1.
Grau de liberdade
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
50
100
500
5% (=0,05)
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,06
2,04
2,01
1,98
1,96
1,96
1% (=0,01)
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,06
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,84
2,79
2,75
2,68
2,63
2,59
2,58
A tabela completa poder ser encontrada em Gomes (1990) e Levine et al. (1998).
43
5% (=0,05)
3,84
5,99
7,82
9,49
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
22,36
23,68
25,00
26,30
27,59
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,88
40,11
41,34
42,30
43,77
44,99
46,19
47,40
48,60
49,80
50,99
52,19
53,38
54,57
55,76
1% (=0,01)
6,64
9,21
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,72
26,22
27,69
29,14
30,58
32,00
33,41
34,80
36,19
37,57
38,98
40,29
41,64
42,98
44,31
45,64
46,96
48,28
49,60
50,89
48,23
49,49
54,78
56,06
57,34
58,62
59,89
61,16
62,43
63,69
A tabela completa poder ser encontrada em Gomes (1990) e Levine et al. (1998).
44
(2)
0,50
0,600
0,500
0,371
0,321
0,310
0,267
0,248
0,236
0,217
0,209
0,200
0,189
0,182
0,176
0,170
0,165
0,161
0,156
0,152
0,148
0,144
0,142
0,128
0,118
0,110
0,103
0,097
0,093
0,089
0,085
0,082
0,079
0,076
0,074
0,072
0,070
0,068
0,10
1,000
0,900
0,829
0,714
0,643
0,600
0,564
0,536
0,503
0,484
0,464
0,446
0,429
0,414
0,401
0,391
0,380
0,370
0,361
0,353
0,344
0,337
0,306
0,283
0,264
0,248
0,235
0,224
0,214
0,206
0,198
0,191
0,185
0,180
0,174
0,170
0,165
0,05
1,000
0,886
0,786
0,738
0,700
0,648
0,618
0,587
0,560
0,538
0,521
0,503
0,485
0,472
0,460
0,447
0,435
0,425
0,415
0,406
0,398
0,362
0,335
0,313
0,294
0,279
0,266
0,255
0,244
0,235
0,227
0,220
0,213
0,207
0,202
0,197
0,01
1,000
0,929
0,881
0,833
0,794
0,755
0,727
0,703
0,679
0,654
0,635
0,615
0,600
0,584
0,570
0,556
0,544
0,532
0,521
0,511
0,467
0,433
0,405
0,382
0,363
0,346
0,331
0,318
0,307
0,297
0,287
0,279
0,271
0,264
0,257
45
0
0
1,81
2,56
3,14
3,63
4,05+
4,44
4,80
5,13
5,44
5,74
8,13
9,98
11,54
12,92
14,18
15,34
16,43
17,46
18,44
19,37
20,27
21,13
21,97
22,79
23,58
24,35+
25,10
25,84
26,56
%
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
0
27,28
27,97
28,66
29,33
30,00
30,66
31,31
31,9532,58
32,21
33,83
34,4535,06
35,67
36,27
36,87
37,47
38,06
38,6539,23
39,82
40,40
40,98
41,55+
42,13
42,71
43,28
43,85
44,43
45,00
%
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
0
45,57
46,1546,72
47,29
47,87
48,4549,02
49,60
50,18
50,77
51,35+
51,94
52,53
53,13
53,73
54,33
54,94
55,55+
56,17
56,79
57,42
58,05+
58,69
59,34
60,00
60,67
61,34
62,03
62,72
63,44
%
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99,0
99,1
99,2
99,3
99,4
99,5
99,6
99,7
99,8
99,9
100,0
-
0
64,16
64,90
65,65
66,42
67,21
68,03
68,87
69,73
70,63
71,56
72,54
73,57
74,66
75,82
77,08
78,45
80,02
81,87
84,26
84,56
84,87
85,20
85,56
85,9586,37
86,86
87,44
88,19
90,00
-
Os sinais (+) e (-), seguindo ngulos terminados em 5, so orientaes para arredondamento a uma decimal.
46
1,0
5
5
6
7
7
8
14
19
25
29
36
41
46
52
57
nB/na
1,5
5
6
7
8
8
9
16
22
29
35
42
48
55
61
67
2,0
6
7
8
9
10
17
24
32
39
46
53
59
67
74
47
*************
O minuto que voc est vivendo agora o mais importante de sua vida, onde quer que
voc esteja.
Preste ateno ao que est fazendo.
O ontem j lhe fugiu das mos.
O amanh ainda no chegou.
Viva o momento presente, porque dele depende todo o seu futuro.
Procure aproveitar ao mximo o momento que est vivendo, tirando todas as vantagens
que puder, para seu aperfeioamento.
C. Torres Pastorinho
Minutos da Sabedoria, p. 154
*************