Você está na página 1de 70

O Autor:

William Costa Rodrigues Agrnomo, Doutor em Agronomia (Fito-


tecnia) e Ps-Doutor em Entomologia, pela Univ. Federal Rural do
Rio de Janeiro. Prof. da Universidade Severino Sombra e no Instituto
Superior de Tecnologia de Paracambi/ FAETEC-RJ, ministra aulas de
Ecologia
1
, Toxicologia
1
, Climatologia
1
, Estudos de Impacto Ambien-
tal
1
, Estatstica Aplicada
2
e Auditoria Certificao Ambiental
2
, na gra-
duao e de Estatstica Ambiental
1
e Biondicadores Ambientais
1
na
especializao de Planejamento e Gesto Ambiental
1
, onde tambm
Supervisor Pedaggico. Atua como desenvolvedor de softwares agr-
colas e Cientficos. Coordenador Geral do projeto Entomologistas do
Brasil (www.ebras.bio.br) e Editor-Chefe do Peridico Online En-
tomoBrasilis (www.periodico.ebras.bio.br). Coordenador e autor de
captulos no livro Citricultura Fluminense: Principais pragas e
seus inimigos naturais. Trabalha ativamente com anlise estatstica
em projetos na rea agrcola e ambiental. O autor poder ser contatado
atravs do e-mail: wcostarodrigues@yahoo.com.br. Para maiores
informaes acesse o currculo Lattes do autor no seguinte endereo:
http://lattes.cnpq.br/9873385223698434.

Esta Obra:
A apostila Estatstica Ambiental foi inicialmente utilizada no progra-
ma de Ps-Graduao Lato Sensu, Planejamento e Gesto Ambiental e
no Curso de graduao em Gesto Ambiental, na disciplina Estatstica
Aplicada, tendo como objetivo informar o discente sobre os princpios
bsicos da estatstica, relacionando-a com a metodologia cientfica,
possibilitando um entendimento bsico sobre o assunto. Hoje a aposti-
la tambm utilizada em cursos de graduao e desde 2009 mudou o
ttulo para Estatstica Aplicada.

Esta obra distribuda atravs da Creative Commons Licence.
http://creativecommons.org/licenses/by-nc-sa/2.5/br


Copyright2003 Copyright2003 Copyright2003 Copyright2003- -- -20 20 20 2010 10 10 10, W.C. Rodrigues , W.C. Rodrigues , W.C. Rodrigues , W.C. Rodrigues


1
Disciplina Ministrada na Universidade Severino Sombra
2
Disciplina Ministrada no Instituto Superior de Tecnologia em Paracambi, RJ- Curso de Gesto Ambiental
8 Edio
Revisada e Ampliada
Com listas de Exerccios

Sumrio

1 Introduo ................................................................................................................. 1
1.1 Crescimento e Desenvolvimento da Estatstica Moderna ................................ 1
1.2 Variao ao Acaso ............................................................................................ 1
2 Ensaio x Experimentao ......................................................................................... 2
3 Conceitos Estatsticos ............................................................................................... 2
3.1 Estatstica Descritiva ........................................................................................ 2
3.2 Inferncia Estatstica......................................................................................... 2
3.3 Tipos de Dados ................................................................................................. 3
3.3.1 Variveis Aleatrias Categorizadas .............................................................. 3
3.3.2 Variveis Aleatrias Numricas ................................................................... 3
4 Por que Utilizar a Estatstica .................................................................................... 4
5 Planejamento Experimental ...................................................................................... 4
5.1 Fases do Planejamento ..................................................................................... 4
5.1.1 Problema ....................................................................................................... 5
5.1.2 Informaes Existentes ................................................................................. 5
5.1.3 Noes Gerais Sobre Hiptese ..................................................................... 5
5.1.4 Formulao das Hipteses ............................................................................ 6
5.1.4.1 Elaborando as hipteses........................................................................ 6
5.1.4.2 Hiptese Estatstica x Hiptese Cientfica ........................................... 6
5.1.5 Testando as Hipteses .................................................................................. 6
5.1.6 Riscos na Tomada de Deciso Atravs Teste de Hipteses ......................... 6
5.1.7 Aleatorizao ................................................................................................ 7
5.2 Erros de Observaes ....................................................................................... 7
5.2.1 Erros do Observador ..................................................................................... 7
5.2.2 Erro do Mtodo de Observao .................................................................... 7
5.2.3 Por Falta de Resposta ................................................................................... 8
5.3 Controle dos Erros nas Observaes ................................................................ 8
5.4 Mtodos de Coleta de Dados ............................................................................ 8
5.4.1 Fontes Primrias ........................................................................................... 8
5.4.2 Fontes Secundrias ....................................................................................... 8
5.5 Pesquisa Observacional .................................................................................... 9
5.6 Pesquisa Experimental ...................................................................................... 9
5.6.1 Princpios da Experimentao .................................................................... 10
5.7 Tipos de Amostras .......................................................................................... 10
5.7.1 Amostras Simples ao Acaso ....................................................................... 10
5.7.2 Amostra Estratificada ................................................................................. 11
5.7.3 Amostra Sistemtica ................................................................................... 11
5.7.4 Amostra por rea ....................................................................................... 11
5.7.5 Amostra por Conglomeradas ...................................................................... 11
5.7.6 Amostra Selecionada .................................................................................. 11
5.8 Determinao do Tamanho da Amostra ......................................................... 12
5.8.1 Tamanho da Amostra para Dados Discretos .............................................. 12
5.8.2 Tamanho da Amostra para Dados Contnuos ............................................. 13
6 Tabela ..................................................................................................................... 14
6.1 Elementos Fundamentais de uma Tabela Estatstica ...................................... 14
6.2 Elementos Complementares de uma Tabela Estatstica ................................. 14
6.3 Observaes para a Construo de Tabelas Estatsticas ................................. 15
6.4 Sinais Convencionais Utilizados em Tabela Estatstica ................................. 15

6.5 Tipo de Tabela ................................................................................................ 15
6.5.1 Tabela Simples (Unidimensional) .............................................................. 15
6.5.2 Tabela de Dupla Entrada ou Cruzada (Bidimensional) .............................. 16
7 Representao Grfica dos Dados Estatsticos ....................................................... 16
7.1 Grficos de Colunas ....................................................................................... 16
7.2 Grficos em Barras ......................................................................................... 17
7.3 Grficos de Linhas .......................................................................................... 18
7.4 Grficos de Pizza ............................................................................................ 18
7.5 Grficos Compostos ....................................................................................... 19
8 Probabilidade Estatstica......................................................................................... 19
8.1 Regras para Combinar Probabilidade ............................................................. 21
8.2 Probabilidade Condicionada ........................................................................... 22
9 Tcnicas Estatsticas Para Anlise de dados .......................................................... 22
9.1 Medidas de Tendncia Central ....................................................................... 22
9.1.1 Mdia Aritmtica Simples ( X) .................................................................. 23
9.1.2 Mdia Aritmtica Ponderada ...................................................................... 23
9.1.3 Mdia Aritmtica de Dados Agrupados em Intervalos .............................. 24
9.1.4 Mediana (Me) ............................................................................................. 24
9.2 Medidas de Variao ...................................................................................... 25
9.2.1 Desvio-Mdio (DM) ................................................................................... 25
9.2.2 Desvio Padro ............................................................................................. 26
9.3 Varincia ou Quadrado Mdio ....................................................................... 27
9.4 Erro-Padro da Mdia - s(x) ........................................................................... 27
9.5 Coeficiente de Variao.................................................................................. 28
9.6 Curva de Distribuio Normal ........................................................................ 28
9.6.1 Limites de Confiana .................................................................................. 29
9.6.2 Erro Padro ................................................................................................. 30
9.7 Teste de Normalidade dos Dados ................................................................... 30
9.8 Teste de Klomogorov-Smirnov (K-S) ............................................................ 31
9.9 Teste de Shapiro-Wilks (S-W) ....................................................................... 31
10 Testes Paramtricos e No Paramtricos ................................................................ 31
10.1 Teste t - Student .............................................................................................. 31
10.1.1 Dados Pareados (Amostras Dependentes) .............................................. 32
10.1.2 Dados Pareados (Amostras Independentes) ........................................... 33
10.1.3 Dados No-Pareados - Varincias Desiguais (Heterocedsticas)........... 34
10.1.4 Dados No-Pareados - Varincias Iguais (Homocedsticas) ................. 35
10.2 Teste Qui-Quadrado () ................................................................................ 36
10.3 Tabela de Contingncia .................................................................................. 36
10.4 Teste de Kruskal-Wallis ................................................................................. 37
10.5 Teste de Friedman (Anlise da Varincia) ..................................................... 39
11 Correlao Linear ................................................................................................... 40
11.1 Coeficiente de Correlao (r) ......................................................................... 40
11.1.1 Correlao de Pearson ............................................................................ 40
11.1.2 Correlao de Spearman ......................................................................... 41
11.1.3 Aspectos Gerais da Correlao Linear ................................................... 41
11.2 Coeficiente de Determinao (r) ................................................................... 42
11.3 Coeficiente de Alienao (K) ......................................................................... 42
11.4 Significncia do Teste de Correlao ............................................................. 42
11.4.1 Significncia Baseada nos Intervalos ..................................................... 42
11.4.2 Significncia Baseada no Teste t para r (Pearson) ................................. 43

12 Anlise de Regresso .............................................................................................. 43
12.1 Regresso Linear Simples .............................................................................. 44
12.2 Regresso Linear Mltipla.............................................................................. 45
12.3 Regresso Mltipla ......................................................................................... 45
13 Transformao de Dados ........................................................................................ 46
13.1 Raiz Quadrada ................................................................................................ 46
13.2 Transformao Logartimica .......................................................................... 46
13.3 Transformao Angular (Arcoseno) ............................................................... 46
13.4 Consideraes Gerais ..................................................................................... 46
14 Testes Especficos Para Anlise de Populaes e Comunidades ........................... 47
14.1 ndice de Diversidade e Dominncia Populacional ........................................ 47
14.1.1 ndice de Margalef () ............................................................................ 47
14.1.2 ndice de Glason (D
g
) ............................................................................. 47
14.1.3 ndice de Menhinick (D
m
) ...................................................................... 47
14.1.4 ndice de Shanon-Wiener (H') ................................................................ 47
14.1.5 ndice de Dominncia Berger-Parker (d)................................................ 47
14.2 Exemplo .......................................................................................................... 48
14.3 ndice de Similaridade entre Populaes ........................................................ 48
14.3.1 Quociente de Similaridade...................................................................... 48
14.3.2 Porcentagem de Similaridade ................................................................. 48
14.3.3 ndice de Afinidade ................................................................................ 49
14.3.4 Constncia .............................................................................................. 49
14.3.5 ndice de Associao (IA) ...................................................................... 49
15 Lista de Exerccios.................................................................................................. 50
16 Bibliografia ............................................................................................................. 54
17 Anexos .................................................................................................................... 56


ndice de Tabelas
Tabela 1. Resultados da interpretao de 500 fotos areas de diversas reas com
presena de mata. (dados fictcios) ........................................................................... 7
Tabela 2. Dados do peso de 10 crianas antes e depois da administrao a base de folhas
de mandioca (dados fictcios). ................................................................................ 32
Tabela 3. Dados de um experimento com a taxa de crescimento de mudas de duas
leguminosas em sistema agro-silvo-pastoril, numa rea de re-vegetao (dados
fictcios). ................................................................................................................. 33
Tabela 4. Resultados das amostras de cinco diferentes reas delimitadas pelas
caractersticas edficas do solo, em quatro diferentes profundidades. Os dados
apresentados referem-se a o poluente --16-Imaginol-Poluentis, em mg.mm de
solo ......................................................................................................................... 39
Tabela 5. Correlao de Spearman entre as notas brutas de matemtica e biologia (Zar,
1999). ...................................................................................................................... 41
Tabela 6. Classificao do valor r atravs de intervalos de 0 a 1. .................................. 42
Tabela 7. Classificao do valor r atravs de intervalos de acordo com e Teste de Rugg.
................................................................................................................................ 43
Tabela 8. Srie de dados da correlao da flutuao populacional do pulgo Toxoptera
aurantii (Homoptera, Aphididae) em funo da brotao foliar de tangerina cv
Ponc, sob cultivo orgnico na Fazendinha Agroecolgica, no perodo de outubro
de 2002 e outubro de 2003 (Extrado de Rodrigues, 2004). Exemplo para o
Microsoft Excel. ..................................................................................................... 43
Tabela 9. ndices de diversidade de cochonilhas em agroecossiema ctrico. ................. 48
Tabela 10. Duas comunidades com sua composio de espcies em percentagem ....... 49
Tabela 11. Valores de t -student em nveis de 5% e 1% (=0,05 a 0,01) de
probabilidade. ......................................................................................................... 57
Tabela 12. Valores de (Qui-quadrado) em nveis de 5% e 1% (=0,05 a 0,01) de
probabilidade .......................................................................................................... 58
Tabela 13. Valores crticos para o Coeficiente de Correlao de Spearman (r
s
) ............ 59
Tabela 14. Valores para transformao % arcsen ....................................................... 60
Tabela 15. Valores mnimos de j, significativos a 0,5% (Southwood, 1971). ............... 61

ndice de Figuras
Figura 1. Diagrama de uma estatstica descritiva, com seus diversos nveis de
categorias. ................................................................................................................. 3
Figura 2. Diagrama de tipos de dados estatsticos. ........................................................... 4
Figura 3. Interpretao dos dados experimentais. O grfico esquerda, baseado em
apenas dois pares de valores anotados para X e Y (que definem os pontos A e B),
parece sugerir que Y cresce medida que X cresce, entretanto no grfico direita,
em que foram registrados outros valores intermedirios (definidos pelos pontos B e
C), mostra que a relao entre X e Y obedece a uma lei mais completa. ............... 10
Figura 4. Produo de veculos no Brasil (1992-1996). ................................................. 16
Figura 5. Alunos formados na Universidade Federal de Pernambuco em 1999. ........... 17
Figura 6. Preferncia de programas de televiso por sexo. ............................................ 17
Figura 7. Produo de cebola no Brasil em 1992. .......................................................... 17
Figura 8. Crescimento demogrfico do Brasil de 1995 a 1999. ..................................... 18
Figura 9. Fatia de mercado de empresas de venda de seguros de sade no estado do Rio
de Janeiro. ............................................................................................................... 18
Figura 10. Eleitores por estado da regio Sudeste do Brasil. ......................................... 19
Figura 11. Flutuao populacional de pulgo preto dos citros em funo da temperatura
mdia em 1996, no campus da Universidade Federal Rural do Rio de Janeiro. .... 19
Figura 12. Curva de distribuio normal simtrica, onde a mdia e s o desvio
padro. .................................................................................................................... 28
Figura 13. Curvas de distribuio normal das freqncias de X, tendo a mesma mdia
() e diferentes graus de disperso dos valores de X, isto , desvios padres (s)
diferentes. ............................................................................................................... 29
Figura 13. Curva normal padro, tendo por parmetros =0 e s= 1. As reas sob a curva
assinaladas entre os traos verticais indicam as percentagens de valores de X a
contidas. .................................................................................................................. 29
Figura 15. Os valores de Z (compreendidos entre -Z e +Z) correspondem aos
afastamentos de X em relao mdia , medidos em unidades de desvio-padro.
A probabilidade (P) com que X possa ter valor menor que uma coordenada
escolhida (C) indicada pela rea, sob a curva, situada esquerda de C. ............. 30
Figura 16. Correlao linear simples positiva (A); e inversa ou negativa (B),
apresentando a linha de tendncia de regresso linear simples de dados fictcios. 42
Figura 17. Janela de configurao da linha de tendncia (linha de regresso) e
configurao da equao de regresso no Microsoft Excel. ................................... 44
Figura 18. Regresso linear simples entre a flutuao populacional de T. aurantii e a
brotao foliar de tangerina cv. Ponc, em cultivo orgnico de tangerina cv. Ponc,
na Fazendinha Agroecolgica, no perodo de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004). ............................................................................. 44
Figura 19. Correlao mltipla da amplitude trmica (varivel x), brotao (varivel y) e
a flutuao populacional de Toxoptera citricida (varivel z), em cultivo orgnico
de tangerina cv. Ponc, na Fazendinha Agroecolgica, no perodo de outubro de
2002 a outubro de 2003 (Adaptado de Rodrigues, 2004). ...................................... 45
Figura 20. Regresso mltipla entre a flutuao populacional de T. aurantii e a brotao
foliar de tangerina cv. Ponc, em cultivo orgnico de tangerina cv. Ponc, na
Fazendinha Agroecolgica, no perodo de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004). ............................................................................. 45
Figura 20. Fluxograma Para Auxiliar na Escolha de Testes Estatsticos ....................... 56

Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
1

1 Introduo
Diariamente estamos envolvidos em anlises estatsticas, por exemplo, quando
voc abordado na rua para responder qual o candidato ir votar na prxima eleio,
quando o IBGE faz uma visita a sua casa para o censo. Desta forma, voc est fazendo
parte da estatstica, mas no s desta forma que voc faz parte do infinito mundo da
estatstica. Quando voc est desempregado ou empregado, est fazendo parte da esta-
tstica, quando seu salrio aumenta, faz parte tambm. Bom, podemos ver que em quase
tudo, eu disse quase tudo, podemos empregar a estatstica, obviamente que no pode-
mos deixar a estatstica dominar nossas vidas, pois o principal objetivo desta ferramenta
auxiliar na tomada de deciso ou de avaliar uma determinada situao e poder melhor
indicar o caminho para uma tomada de deciso.
A estatstica, como parte da matemtica aplicada, trata da coleta, da anlise e da
interpretao de dados observados. Estudando os mais variados fenmenos das diversas
reas do conhecimento, ela representa um valioso instrumento de trabalho nos dias de
hoje.
Na rea ambiental, o estudo da estatstica justifica-se pela necessidade de desen-
volver pesquisas, realizar experimentos, e mesmo pela utilizao dos resultados e pes-
quisas feitas, realizar experimentos, e mesmo pela utilizao dos resultados e pesquisas
feitas por aqueles que a isso se dediquem, seja visando o aprimoramento de mtodos e
tcnicas de investigao, seja por exigncias do prprio desenvolvimento do pas.

1.1 Crescimento e Desenvolvimento da Estatstica Moderna
Historicamente, o crescimento e o desenvolvimento da estatstica moderna po-
dem ser relacionados a trs fatores isolados a necessidade dos governos de coletar
dados dos cidados, o desenvolvimento da teoria da probabilidade e o advento da in-
formtica.
Foram levantados dados atravs dos registros histricos. Durante as civilizaes
egpcias, grega e romana, os dados eram obtidos principalmente com o objetivo de reco-
lherem impostos e para o recenseamento militar. Na Idade Mdia, as instituies religi-
osas freqentemente mantinham registros relativos a nascimentos, morte e casamentos.
No Brasil o censo realizado a cada 10 anos, avaliando o crescimento populacional e a
distribuio desta populao no territrio nacional entre outros aspectos avaliados. De
fato, a crescente necessidade dos censos ajudou a incentivar o desenvolvimento de e-
quipamentos de tabulao no incio do sculo XX. Isso levou ao desenvolvimento de
computadores mainframe e finalmente a revoluo dos computadores pessoais.

1.2 Variao ao Acaso
O que dificulta ao trabalho de pesquisador e exige a anlise estatstica a pre-
sena, em todos os dados obtidos, de efeitos fatores no controlados (que podem ser
controlados). Esses efeitos, sempre presentes, no podem ser conhecidos individualmen-
te e alteram pouco ou muito, os resultados obtidos. Eles so indicados pela designao
geral de variao do acaso ou variao aleatria. O efeito dessa variao do acaso tal
que pode alterar completamente os resultados experimentais. Assim, ao comparar no
campo duas paisagens, poder haver, se a avaliao for, em dias diferentes, uma interfe-
rncia da luz solar, que ir interferir na distino das cores. As variaes ao acaso po-
dem ser exemplificadas como: temperatura ambiente, aferio do aparelho utilizado
para mensurar, variao nos intervalos de amostragem, variao no horrio de coleta
dos dados, etc.

William Costa Rodrigues

P

g
i
n
a
2


2 Ensaio x Experimentao
Existem diferenas bsicas entre os dois mtodos de avaliar um dado cientfico.
As diferenas vo desde a simples forma de avaliar e encarar a coleta dos dados at a
forma de apresentao dos dados. Abaixo no Quadro 1 so listadas as diferenas entre
os dois mtodos.

Quadro 1. Diferenas entre Ensaio e Experimentao.
Ensaio Experimentao
Tempo de durao da avaliao curta, obje-
tivando somente uma pr-avaliao dos resul-
tados.
O tempo de avaliao dever ser o suficiente
para que os dados coletado possam garantir
uma avaliao, com margem de erro menor
possvel.
O nmero de amostras reduzido. O nmero de amostra dever ser suficiente
para avaliar os dados com a maior preciso
possvel
O tamanho do experimento reduzido. O tamanho do experimento dever ser sufici-
ente para avaliar os dados.
As variaes ao acaso so parcialmente con-
trolados, no havendo rigor.
As variaes ao acaso so controladas com
rigor, possibilitando assim menor erro amos-
tral e na anlise estatstica.
A anlise e interpretao dos dados no podem
possuir muito rigor e deve se adequar ao tipo
de ensaio realizado, nmero de amostras, n-
mero de amostragens realizadas, etc.
A anlise e interpretao dos dados devero
ser rigorosas e adequadas ao tipo de experi-
mentao realizada.


3 Conceitos Estatsticos

3.1 Estatstica Descritiva
Pode ser definida como os mtodos que envolvem a coleta, a apresentao e a
caracterizao de um conjunto de dados de modo a descrever apropriadamente as vrias
caractersticas deste conjunto.
Embora os mtodos estatsticos descritivos sejam importantes para a apresenta-
o e a caracterizao dos dados, foi o desenvolvimento de mtodos estatsticos de infe-
rncia, como um produto de teoria da probabilidade, que levou ampla aplicao da
estatstica em todos os campos de pesquisas atuais.

3.2 Inferncia Estatstica
Pode ser definida como os mtodos que tornam possvel a estimativa de uma
caracterstica de uma populao ou a tomada de uma deciso referente populao com
base somente em resultados de amostras (Figura 1).
Para tornar mais claro esta definio, as definies seguintes so necessrias:
Uma populao (ou universo) a totalidade dos itens ou objetos a ser considerado.
Uma amostra a parte da populao selecionada para anlise.
Um parmetro a medida calculada para descrever uma caracterstica de toda uma
populao.
Uma estatstica a medida calculada para descrever uma caracterstica de apenas uma
amostra da populao.

Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
3

Para melhor elucidar estes conceitos, digamos que h uma necessidade de saber
a opinio da qualidade de vida no campus de sua faculdade. A populao, ou universo,
ser todos os alunos da faculdade, enquanto a amostra consistir os estudantes selecio-
nados para participar da pesquisa. O objetivo da pesquisa descrever vrias atitudes ou
caractersticas de toda a populao (os parmetros). Isto seria alcanado utilizando-se
as estatsticas obtidas da amostra de estudantes para estimar atitudes ou caractersticas
de interesse da populao. Desse modo, um aspecto principal da inferncia o processo
que utiliza a estatstica amostral para tomar decises sobre os parmetros da populao.


Figura 1. Diagrama de uma estatstica descritiva, com seus diversos nveis de categorias.
A amostra pode ser definida tambm como o conjunto de observaes extradas de uma fonte
(populao), segundo determinadas regras e critrios, sendo a populao a fonte de observa-
es.
A populao pode ser constituda de elementos simples, como o caso dos seres humanos ou
das plantas superiores ou das bactrias, ou por elementos coletivos, como o caso das irman-
dades com mais de um indivduo, das famlias, ou das pessoas que habitam uma casa.

A necessidade da inferncia estatstica deriva da necessidade da amostragem.
Quando a populao se torna grande, geralmente dispendioso demais, consome muito
tempo e muito cansativo obter informaes sobre a populao inteira. Decises perti-
nentes s caractersticas da populao devem ser baseadas na informao contida numa
amostra da populao.

3.3 Tipos de Dados
Existem basicamente dois tipos de dados de caractersticas de variveis aleat-
rias que podem ser estudadas e que produzem os resultados ou os dados observados:
categorizados ou numricos (Figura 2).

3.3.1 Variveis Aleatrias Categorizadas
Este tipo de varivel produz respostas categorizadas. Por exemplo, voc tem
carro? Sim No.

3.3.2 Variveis Aleatrias Numricas
Produz respostas numricas, podendo ser nmeros discretos ou contnuos. A
resposta para pergunta: "Quantos livros voc possui?", a resposta discreta, enquanto a
reposta para "Qual a sua altura?", contnua.
Dados discretos so respostas numricas que surgem a partir de processo de con-
tagem e dados contnuos so repostas numricas que surgem a partir de um processo de
medio.
P Po op pu ul la a o o/ /U Un ni iv ve er rs so o
A Am mo os st tr ra a
P Pa ar r m me et tr ro o
E Es st ta at t s st ti ic ca a
William Costa Rodrigues

P

g
i
n
a
4

Na Figura 2, segue exemplos de variveis tanto para aleatrias categorizadas,
quanto para aleatrias numricas (discretas e contnuas).

Figura 2. Diagrama de tipos de dados estatsticos.


4 Por que Utilizar a Estatstica
A Estatstica uma rea da matemtica muito utilizada hoje em dia, entretanto
o uso inadequado e fantico desta ferramenta torna muito difcil a compreenso dos
resultados e levam-na ao descrdito.
A Estatstica nada mais que uma ferramenta que poder auxiliar na interpre-
tao dos resultados e poder confirmar a hiptese a ser testada ou simplesmente recu-
s-la.
Desta forma devemos ter muito cuidado ao utilizar estatstica, como a ferra-
menta que ir dizer se, por exemplo, "uma rea ser condenada por poluio de metais
pesado no solo". O que pode ocorrer que a estatstica ir indicar uma diferena num-
rica, caber ao profissional avaliar os parmetros no previsveis no modelo matemtico
e tomar a deciso.


5 Planejamento Experimental

5.1 Fases do Planejamento
Quando realizamos um estudo, primeiro consideramos sua importncia. Em se-
guida, traamos os objetivos que pretendemos alcanar e a finalidade de sua realizao.
Se houver alguma informao que possa auxiliar como ponto de partida, esta poder
fornecer alguns indicadores ou ensinar novas tcnicas que serviro para complementar
nossa experincia. Estas informaes devero ser avaliadas e criticadas, pois os dados
podero apresentar falhas ou nada representaram para o estudo do problema ou para a
elaborao das hipteses a serem formuladas. Em suma, diremos que os dados selecio-
nados devem ser os estritamente necessrios.

Tipos de Dados
Categorizadas Numricas
Voc possui
carro?
Sim No
Discretas Contnuas
Qual sua altura? Quantas revistas voc
assina?
5 1,75m
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
5

5.1.1 Problema
Ao planejar o problema que se vai pesquisar, dever ser dada especial ateno
aos seguintes pontos:
Definio da importncia do problema que se estuda;
Determinao do(s) objetivo(s) e finalidade da investigao.

Definir a importncia do problema que se estuda explicar o que vamos estudar.
Ser impossvel o planejamento das etapas subseqentes se no ficar claramente evi-
denciado o problema a investigar. No basta, por exemplo, dizer que se vai estudar a
biodiversidade da floresta atlntica, o efeito da poluio do rio Paraba do Sul, pois pro-
vavelmente nenhum pesquisador ter possibilidade e capacidade de abordar todos os
aspectos da biodiversidade ou da poluio. importante tambm especificar sua exten-
so.

5.1.2 Informaes Existentes
Antes de empreender o experimento, o pesquisador deve revisar tudo o que diz
respeito ao fato em estudo, com a finalidade de saber o que j se conhece sobre o assun-
to. Decerto sero encontrados vrios subsdios que fornecero valiosa colaborao para
o estudo.
A reviso bibliogrfica sobre o assunto dever sofrer cuidadosa seleo para que
os resultados mais afins possam ser aproveitados no conforto e discusso posteriores
da pesquisa.
5.1.3 Noes Gerais Sobre Hiptese
A hiptese, resultado de um raciocnio indutivo (consciente ou subconsciente),
requer demonstrao ou prova de sua adequao. Sabemos que a veracidade de uma
hiptese nunca pode ser demonstrada ou provada definitivamente. O que se faz verifi-
car se ela no seria falsa; o que nos levaria a rejeit-la e a formular outra, se necessrio.
Enquanto no se possa demonstrar que ela incorreta, mantm-se a hiptese
como boa. Dela deduzimos as conseqncias ou fazemos previses.
Por sua vez, essas conseqncias e previses sero testadas, para ver se a hipte-
se adotada ainda se mantm ou no.
O planejamento de pesquisa consiste, portanto, na elaborao de um plano de
observao, ou de experimentao, destinado a contestar determinada hiptese, por mais
justa e slida que possa parecer. A estratgia para isso depende da natureza do problema
em causa.
Muitas vezes, o que se tem em vista verificar uma relao de causa e efeito:
queremos saber se a varivel X e a varivel Y, peculiares a determinado fenmeno,
guardam entre si relaes de causa e efeito (direta ou indiretamente).
Na prtica, teremos de montar uma observao ou uma experincia em que se
possa verificar o aparecimento de Y quando ocorre X, ou alteraes dos valores de Y
quando varia X, de tal forma que se possa demonstrar a existncia de uma relao cons-
tante entre os valores de X e Y. A varivel X, que precede a outra, chamada varivel
independente, enquanto Y, que se supe depender de X, a varivel dependente.
Do ponto de vista operacional, podemos encontrar duas situaes. Uma prpria
de fenmenos sobre os quais no podemos influir nem exercer qualquer controle, limi-
tando-se o estudo cientfico observao de como X e Y se apresentam espontaneamen-
te, ento, como observar e medir seus valores e como analisar as relaes qualitativas e
quantitativas que possam existir entre eles (ver item Pesquisa Observacional, p. 9). A
outra seria a interdependncia das duas variveis.

William Costa Rodrigues

P

g
i
n
a
6

5.1.4 Formulao das Hipteses
A estatstica, testa duas hipteses, que geralmente so denominadas de H0 ou
Hiptese nula e H1 ou Hiptese alternativa.
As hipteses estatsticas no necessariamente devero ser idnticas hiptese
cientfica.

5.1.4.1 Elaborando as hipteses
O pressuposto a hiptese estatstica sempre testar a nulidade dos dados. Por
exemplo, em um experimente est sendo testada a capacidade de duas substncias pos-
surem o mesmo poder de reao qumica, nas propores utilizadas. A H0 dever ser a
seguinte: As substncias possuem a mesma capacidade de reao. J a H1, ser As
substncias no possuem a mesma capacidade de reao.
A hiptese nula admite que os resultados sejam iguais ou com diferenas aleat-
rias entre os tratamentos.
n 3 2 1 0
X ... X X X : H = = =

J a hiptese alternativa, testa a falta de nulidade ou falta de diferenas aleat-
rias entre os tratamentos.
n 3 2 1 a
X ... X X X : H

5.1.4.2 Hiptese Estatstica x Hiptese Cientfica
A hiptese estatstica testa somente os dados numricos obtidos atravs de um
modelo matemtico fixo e contendo restries, que no o permite avaliar variveis
complexas e multveis (clima, efeito antrpico, etc.).
A hiptese cientfica poder ser a mesma hiptese estatstica ou basear-se nela,
porm a resposta para entendimento dos resultados, no ser somente baseada em um
modelo matemtico. Desta forma, valer alm da experincia do pesquisador, uma boa
reviso bibliogrfica e uma interpretao imparcial dos dados, somada com uma facili-
dade de concluir de acordo no somente pelos nmeros, mas pela descrio do fato, seja
ela: biolgica, social, etc.

5.1.5 Testando as Hipteses
Existem vrias formas de testar as hipteses elaboradas. Normalmente testa-se
atravs de modelos matemticos, que so denominados testes estatsticos, que se divi-
dem basicamente em Teste Paramtricos e No Paramtricos, que sero visto no item
Tcnicas Estatsticas Para Anlise de dados, p. 22.

5.1.6 Riscos na Tomada de Deciso Atravs Teste de Hipteses
Quando se utiliza uma estatstica para tomar deciso sobre um parmetro da po-
pulao, existe um risco de se chegar a uma concluso incorreta. Na verdade, dois tipos
de erro podem ocorrer quando aplicamos a metodologia do teste de hipteses:
Um erro do tipo I ocorre se a hiptese nula H
0
for rejeitada quando de fato
verdadeira e no deveria ser rejeitada.
Um erro do tipo II ocorre se a hiptese nula H
0
for aceita quando de fato falsa
e no deveria ser aceita.

Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
7

5.1.7 Aleatorizao
Na oportunidade em que organizamos os ensaios devemos proporcionar condi-
es idnticas para cada tratamento, possibilitando que se houver algum erro este seja
atribudo ao acaso, ou seja, no tendencioso. Com este processo o erro experimental
poder ser mensurado atravs do modelo matemtico utilizado para analisar os dados.

5.2 Erros de Observaes
Quanto aos componentes de uma populao, o pesquisador ter a oportunidade
de verificar a existncia de diferenas entre os mesmos.
Atravs da observao ou coleta de dados, haver sempre uma discrepncia en-
tre as amostragens realizadas, seja por falha no aparelho utilizado ou pela desateno do
observador. So os erros experimentais oriundos de fatores que no podem ser controla-
dos.

5.2.1 Erros do Observador
O grau de treinamento dos observadores, o excesso de trabalho, seu estado fsico
e condies ambientais podem ser as principais causas de erros das observaes. Como
exemplo, poderamos citar a experincia de que participaram cinco tcnicos especiali-
zados em anlise de foto area (foto interpretao), que examinaram em pocas separa-
das por um perodo de dois meses, as mesmas 500 fotos, com a finalidade de verificar a
degradao ambiental acentuada das reas fotografadas. As fotos foram interpretadas
separadamente por cada tcnico conforme a Tabela 1.
Erros cometidos pelo observador devero ser considerados no modelo matemti-
co escolhido para anlise dos dados. Entretanto se estes erros forem muito distantes, ou
seja, forem muito discrepantes, o modelo matemtico poder no prev erro to grande.
Assim o treinamento dos observadores dever ser de forma a permitir um menor erro
experimental possvel.

Tabela 1. Resultados da interpretao de 500 fotos areas de diversas reas com presena de mata. (dados
fictcios)
Observador
Fotos onde a degradao foi considerada positiva (n)
1 leitura 2 leitura
A 118 139
B 69 78
C 83 88
D 96 89
E 106 92

Observa-se pela tabela acima que em nenhuma das duas ocasies os diferentes
observadores coincidiram quanto ao nmero de fotos consideradas positivas para o refe-
rido diagnstico. O mesmo foi verificado em relao a cada um dos observadores que
apresentaram resultados diferentes entre as duas leituras.
Devemos concluir que, tais discordncias no refletem uma variao real, e sim
cometida por quem procedeu leitura do material fotogrfico.

5.2.2 Erro do Mtodo de Observao
Os mtodos de observao possuem erros mais ou menos importantes. Por isso
h uma preocupao natural de todo pesquisador em aperfeio-los ou substitu-los por
outros mtodos mais eficientes a fim de aumentar a exatido dos resultados.
William Costa Rodrigues

P

g
i
n
a
8

Cada mtodo em particular pode ter uma srie de fatores que conduzem distor-
o dos resultados.

5.2.3 Por Falta de Resposta
Este tipo de erro poder ou no ocorrer no experimento. Ele ocorrer se no
houver a possibilidade de obter, dentro da metodologia, o dado que ir compor o con-
junto de informaes a serem analisadas. Por exemplo, na coleta de informaes a res-
peito da poluio de um determinado crrego, houve uma seca muito intensa secando a
gua no ponto de coleta pr-determinado, desta forma, houve um erro por falta de res-
posta, assim no poder o observador coletar em outro ponto, j que a metodologia pre-
viu que aquele era o ponto a ser amostrado.
Em experimento, que constituem blocos e parcelas, o erro por falta de resposta
ocorrer atravs da perda de uma parcela.
Os modelos matemticos que prevem erros por falta de resposta so apropria-
dos, pois iro permitir uma flexibilidade de estimar o dado faltoso.

5.3 Controle dos Erros nas Observaes
Apesar da distino que procuramos dar s diferentes fontes de erros. Devemos
lembrar que eles so bastante independentes.
Qualquer que seja a causa dos erros anteriormente abordados, estes podero ser
reduzidos ou eliminados de acordo com as coisas que os determinam.
Os erros dependentes dos observadores podem ser minimizados por uma prepa-
rao e por um treinamento mais eficientes, assim como por uma melhoria das condi-
es fsicas e de trabalho.
Os erros causados pelos mtodos de observao podem ser reduzidos selecio-
nando-se o funcionamento dos aparelhos utilizados.

5.4 Mtodos de Coleta de Dados
Embora a maioria das experimentaes as informaes devam ser retiradas dire-
tamente no "campo", em muitas ocasies podem-se aproveitar dados previamente obti-
dos por outras pessoas. No primeiro caso, consideramos que a informao foi recolhida
de fonte primria e no segundo caso dizemos que a fonte secundria.

5.4.1 Fontes Primrias
Quando no h informaes dos dados que queremos estudar, devemos ir a a-
campo para obt-lo, assim a metodologia dever prever a coleta de dados na fonte pri-
mria.
Um exemplo deste tipo de fonte a coleta de gua para a anlise de poluio de
um determinado crrego. A coleta esta sendo realizada no campo, no sendo utilizados
dados previamente coletados por outro pesquisador.

5.4.2 Fontes Secundrias
Quando as informaes que nos interessa j foram coletadas por outro pesquisa-
dor, podemos utiliz-las. Este tipo de fonte chamado secundrio, pelo simples fato, da
coleta dos dados ter sido realizada por outra pessoa. bvio que a qualidade dever ser
levada em considerao, alm do que, devemos verificar a metodologia utilizada, para
saber se esta poder responder ao questionamento que a pesquisa prope-se a responder.

Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
9

5.5 Pesquisa Observacional
Em certos campos da biologia e das cincias sociais, por exemplo, os mtodos
experimentais podem ser difceis ou mesmo impossveis de aplicar. Ento a observao
cientfica adquire grande importncia e deve ser feita com o mximo de cuidado.
Teorias to fundamentais como a da evoluo forma estabelecidas com base
exclusiva na observao da natureza. A viagem de Darwin ao redor do mundo permitiu-
lhe coligir tal quantidade de informaes que pde consubstanciar a hiptese formulada
por Lamarck, Saint Hilaire e outros naturalistas sobre a evoluo dos seres vivos. Dar-
win buscou correlacionar as caractersticas prprias das espcies com as condies do
meio em que vivia cada uma delas. Suas observaes sobre as relaes entre organismos
e o meio contriburam decisivamente para a criao da ecologia.
A observao deve ser inteligente e sagaz, de modo permitir clara distino entre
os fatos que so relevantes, para o estudo em causa, e os inmeros outros que se apre-
sentam concomitantemente. Por isso deve ser atenta, precisa e metdica. Deve ser per-
sistente, completa, porm analtica.
Exige que o pesquisador seja curioso, paciente, objetivo e imparcial; capaz de
com os olhos isentos de preconceitos e a cabea livre das frmulas tradicionais, de idi-
as fixas ou baseadas em dogmas ou em autoridades que no demonstraram cabalmente,
na praticam a validade de suas bases.
Sempre que possvel, portanto, as observaes devem ser corretamente registra-
das, repetidas e quantificadas, partindo-se de medidas rigorosas que permitam a anlise
estatstica dos dados.

5.6 Pesquisa Experimental
A experimentao ou simplesmente experimento um mtodo cientfico e de
observao dos fatos ou fenmenos naturais, sob condies particulares estabelecidas
pelo pesquisador.
Em sua essncia, a experimentao deve permitir comparar o efeito de suas ou
mais condies ou tratamentos, bem definidos, sobre um atributo do organismo ou ma-
terial que objeto da pesquisa.
As condies, que o pesquisador seleciona ou manipula na experincia, so ge-
ralmente denominadas variveis dependentes, enquanto que as mudanas observadas em
conseqncia, no atributo, so as variveis independentes. Assim, em estudos de dietas
ou os alimentos administrados seriam as variveis independentes, e o crescimento em
peso ou altura, corresponderiam s variveis dependentes.
Em experincias mais simples, os valores de uma varivel independente (eixo
das abscissas - X), so confrontados com os dados da varivel dependente (eixo das
ordenadas - Y). Por vezes, apenas duas condies da varivel so testadas (por exemplo:
duas temperaturas, duas concentraes de uma substncia, a presena ou a ausncia de
luz, a administrao ou no de um medicamento, etc.). Mas, como a resposta do orga-
nismo ou do fenmeno pode no ser diretamente proporcional intensidade do fator
ensaiado, torna-se em geral necessrio experimentar trs ou mais valores de varivel
independente, para que se possa apreciar seu efeito e estabelecer a lei do fenmeno.
(Figura 3).

William Costa Rodrigues

P

g
i
n
a
1
0

B
A
5
10
15
20
25
30
A B
X
Y
A
C
D
B
5
10
15
20
25
30
35
A B C D
X
Y

Figura 3. Interpretao dos dados experimentais. O grfico esquerda, baseado em apenas dois pares de
valores anotados para X e Y (que definem os pontos A e B), parece sugerir que Y cresce medida que X
cresce, entretanto no grfico direita, em que foram registrados outros valores intermedirios (definidos
pelos pontos B e C), mostra que a relao entre X e Y obedece a uma lei mais completa.

5.6.1 Princpios da Experimentao
A experimentao a forma que o pesquisador, seja na rea cientfica ou social,
encontra para estimar os dados da pesquisa que ir realizar.
Os princpios bsicos da experimentao cientfica so:
a. A experimentao dever ter impreterivelmente repeties, para assegurar que a
resposta no foi obtida por mera casualidade e sim por inerncia do tratamento.
b. A casualizao um princpio fundamental, pois permite que o experimento possa
ser regido por efeitos gerais a todos os experimentos. Assim as parcelas dos trata-
mentos devero ser distribudas ao acaso pelo experimento, caso a rea experimental
no apresente uniformidade;
c. O controle das variveis aleatrias (chuva, vento, temperatura, efeito antrpico,
etc.), dever ser controlado, caso no seja possvel, recomenda-se que o efeito seja
igual para todos os tratamentos ou itens testados;
d. O experimento dever ser realizado de acordo com uma tcnica j conhecida e testa-
da;
e. Caso a tcnica a ser utilizada seja original, esta dever ser experimentada antes de
ser utilizada na experimentao;
f. Os modelos estatsticos a serem utilizados na experimentao devero ser adequados
ao que se pretende responder, ou seja, dever haver uma adequao da metodologia
(objetivos) com o modelo, para que os resultados possam levar o pesquisador a uma
resposta coerente e segura;
g. Amostragens regulares, quando possveis, pois permitem uma melhor anlise dos
dados;
h. Certificao de que as pessoas envolvidas na experimentao possuam treinamento e
conhecimento a cerca do modelo estatstico e da metodologia a ser empregada.

5.7 Tipos de Amostras
5.7.1 Amostras Simples ao Acaso
Um dos mtodos mais usados. Emprega-se este processo, quando dispomos de
uma populao que apresenta caractersticas homogneas, isto , pouca variao no con-
junto dos elementos, ou seja, varincia prxima ou igual mdia.

Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
1
1

5.7.2 Amostra Estratificada
Utilizada quando dispomos de informaes de que a populao apresenta carac-
tersticas heterogneas, isto , grande nmero de fatores ou variveis que podem com-
prometer as concluses se no eliminados, atravs de um procedimento correto.
A populao heterognea transformada em subpopulaes homogneas. Estas
subpopulaes tm nome de estratos. O tamanho da amostra ser determinado em fun-
o da varincia de caracterstica a estudar em cada estrato, ou ento considerando o
nmero de seus elementos e procedendo-se a um percentual de cada estrato. Obtm-se,
assim, uma amostra estratificada proporcional.
Considera-se este tipo de amostra que possibilita maior preciso quanto aos re-
sultados.

5.7.3 Amostra Sistemtica
Aplicada quando a populao apresenta um nmero finito de elementos e os da-
dos esto distribudos aleatoriamente. O nmero de elementos da amostra ser obtido da
seguinte forma:
Numa populao constituda por 500 elementos e a amostra por 50 elementos,
onde N = 500 e n = 50 dividem-se N por n, isto , 500 por 50, obtendo-se 10, em segui-
da, sorteia-se um nmero da primeira dezena e, a partir dele, escolhem-se os demais,
observando-se que se o nmero sorteado for, por exemplo, cinco, o segundo dever ser
15, o terceiro ser 25, e assim por diante, at obterem-se os 50 elementos que constitui-
ro a amostra.

5.7.4 Amostra por rea
Utiliza mapas geogrficos de cidades e municpios. As unidades que comporo a
amostra sero sorteadas em funo das condies de variabilidade existentes, podendo a
seqncia ser obtida atravs de sorteio de ruas e residncias. A famlia poder ser a uni-
dade mais simples a ser pesquisada.

5.7.5 Amostra por Conglomeradas
Visto que, pela estratificao, o uso de amostragem nos conduz a ganhar em
preciso. Embora a subdiviso da populao seja em estratos, para que, de cada um,
utiliza-se uma quantidade de elementos o que torna o mtodo de seleo um pouco
mais trabalhoso ele redunda conseqentemente em ganho de preciso, o que , no en-
tanto, compensado apenas pela diminuio das tarefas. Aps a determinao dos con-
glomerados da populao, sorteiam-se aleatoriamente os conglomerados que iro parti-
cipar da amostra.
Outros mtodos de seleo podero ser associados para determinao dos ele-
mentos de cada conglomerado para compor a frao amostral.

5.7.6 Amostra Selecionada
Este tipo de amostra se caracteriza por elementos que o pesquisador seleciona
para avaliar o perfil de seus componentes, considerando que os mesmos apresentam
pelo menos uma caracterstica em comum.
Por exemplo, na rea de sade comum a realizao de pesquisas de que so
selecionados os pacientes portadores de determinadas enfermidades. Poderia ser a doen-
a de Parkinson, hepatite, tuberculose, entre outras. Portanto, neste caso, s faro parte
do estudo indivduos portadores de enfermidade a ser pesquisada.

William Costa Rodrigues

P

g
i
n
a
1
2

5.8 Determinao do Tamanho da Amostra
muito comum um pesquisador indagar qual o nmero de amostras a serem
estabelecidas para uma determinada pesquisa de campo, laboratrio ou uma simples
investigao.
A determinao do tamanho da amostra depende de alguns fatores:
1. Tamanho da populao alvo. Quanto ao nmero de elementos que compe, pode-
mos classificar em finitas e infinitas. Na obteno do tamanho amostral ser importante
esta informao.
Na populao finita, por exemplo, N= 3.000, a obteno da amostra se torna
menos complexa do que nos casos de populaes infinitas de (N= 800.000).

2. Varincia ou porcentual. Em alguns casos so empregadas caractersticas que apre-
sentam determinada variabilidade. Em outros casos, observamos a percentagem de cer-
tas caractersticas em um conjunto. Dependendo do tipo de investigao, ora usamos a
varincia, ora usamos a percentagem.

3. Nvel de confiana ( ). Deve-se imaginar que, ao apresentarmos um valor percentu-
al, referente taxa de prevalncia do fenmeno estudado na amostra observada, aquele
valor tem, em relao ao valor percentual da populao, uma diferena, que , a priori,
arbitrada pelo pesquisador. Esta diferena arbitrada considerada tendo em conta um
nvel de acerto que normalmente consideramos de 95% ou 99% de confiana, ou seja, o
nvel de confiana de que aquela diferena arbitrada realmente ocorra at o limite de
diferena proposto.
Os nveis de confiana propostos rotineiramente so de 95% e 99% de confian-
a. Simbolizado pela letra z, este valor substitudo na frmula (1) por uma constante
1,96, quando o nvel de confiana corresponde a 95%, e por 2,58 quando o nvel de con-
fiana de 99%.

4. Informao da literatura (p). Toda pesquisa a realizar em que investigamos a taxa
de prevalncia que fenmeno apresenta, na literatura, resultados os quais utilizaremos
quando da determinao do valor de n em relao ao valor de p. Chamamos q o valor
complementar de p para 100%, ou seja, p + q = 100%.

5. Erro de amostragem (e). Ao procedermos s tcnicas de amostragem para determi-
nao do tamanho da amostra (n), entende-se que a amostra obtida apresentar um de-
terminado valor para a taxa de prevalncia de certo evento. Normalmente esperada
uma diferena em relao taxa de prevalncia da populao-alvo. Esta diferena
conhecida como erro de amostragem, a qual geralmente arbitrada pelo pesquisador.

5.8.1 Tamanho da Amostra para Dados Discretos
Quando dispomos de variveis discretas, utilizamos as seguintes frmulas:
n
2
2
0
e
q p z
= (Equao 1)

N
n
1
n
n
0
0
+
= (Equao 2)
Onde n
0
: nmero inicial; Z: nvel e confiana; p: valor obtido de trabalho anteri-
ormente realizado; N tamanho da populao; q: 100%-p; (P-p): erro arbitrado pelo pes-
quisador.
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
1
3


Quando se trata de trabalho original e no se dispe de nenhum valor usamos
p=50%.
Em populaes finitas, so utilizadas as frmulas (1) e (2). Para populaes infi-
nitas e para as que N seja um valor muito elevado, apenas a frmula (1) deve ser utiliza-
da.
Exemplo: com a finalidade para verificar a incidncia de doena de Chagas em
uma populao de certa regio, desejamos determinar o tamanho da amostra, sendo o
tamanho da populao igual a 40.000 pessoas.
Considerando uma prevalncia de anos anteriores igual a 20% com valor z =
1,96 (=5%) e sendo estabelecida um erro de 4%, qual seria o nmero de elementos que
a amostra deveria conter?
A frmula adequada para mensurar o tamanho da amostra a equao 1. Desta
forma temos:
Z = 1,96; p = 20%; q = 80%; e (P-p)= 4%
384 100 3,84
16
600 . 1 84 , 3
n
4
80 20 96 , 1
n
0 2
2
0
=

=

=
35 , 380
1,0096
384
n
40.0000
384
1
384
n = =
+
=

O nmero de indivduos que deveramos examinar para a determinao da pre-
valncia de 384 para uma populao infinita e 380, para uma populao finita.

5.8.2 Tamanho da Amostra para Dados Contnuos
Para variveis quantitativas contnuas, dispomos das seguintes frmulas:
( )

X X
S z
n
2
2 2
0

= (Equao 1)

N
n
1
n
n
0
0
+
= (Equao 2)

Onde n
0
: nmero inicial; z: nvel de confiana; X: mdia da amostra; X: mdia
da populao alvo; S: desvio padro obtido de trabalho anteriormente realizado. ( X-
X): erro arbitrado pelo pesquisador; N: tamanho da populao.
No sendo encontrado um desvio padro em outro trabalho, procede-se a uma
pr-amostragem, retirando-se 30 observaes da populao e calculando-se o desvio
padro da caracterstica a ser estudada.
A utilizao das frmulas (1) e (2), deste item, tem procedimento semelhante ao
amostrado para variveis discretas.

Exemplo: numa pesquisa para determinar a taxa mdia de hemoglobina dos in-
divduos de uma comunidade, deparamos com o problema de definir o tamanho da a-
mostra. Apenas sabemos que a populao desta comunidade de aproximadamente de
25.000 indivduos, o que torna impraticvel utilizar todos os elementos. Face a isto,
resolvemos determinar o nmero de elementos que comporo a amostra. Selecionamos
William Costa Rodrigues

P

g
i
n
a
1
4

ao acaso 30 elementos, determinamos o valor do teor de hemoglobina de cada um e cal-
culamos a varincia (medida de disperso), cujo valor foi igual a 9mg
2
.
Para tal estudo, a frmula a empregar para determinao do tamanho da amostra
ser a frmula 1 deste item.
A preciso considerada para esta pesquisa foi de 0,5mg e o valor z= 1,96. Substi-
tuindo na frmula teremos:
138 138,2976 n
25 , 0
34,5744
n
25 , 0
9 8416 , 3
n
5 , 0
9 96 , 1
n
0 0 0 2
2
0
= =

=
137 5411 , 137 n
1,0055
138,2976
n
000 . 25
138.2976
1
138,2976
n = =
+
=
Para o estudo a ser realizado recomenda-se que o nmero mnimo de indivduos
ser igual a 138 para populaes infinitas e 137 para populaes finitas.

6 Tabela
Trata-se simplesmente de um quadro, que sintetiza em conjunto de observaes,
com o objetivo de uniformiz-la e racionaliz-la, de forma a tornar mais simples e fcil
seu entendimento. Desta forma, uma tabela deve ser construda de modo a fornecer o
mximo de esclarecimentos, com o mnimo espao, comeando com sua legenda que
deve ser explicativa.

6.1 Elementos Fundamentais de uma Tabela Estatstica
a) Legenda: a indicao contida na parte superior da tabela, onde deve estar de-
finido o fato observado, com a especificao de local e poca, referentes a esse
fato, ou seja, deve ser autoexplicativa;
o Exemplo: Nmero (N), freqncia relativa (F) de fmeas e riqueza de
espcies (S) de moscas-das-frutas (Diptera: Tephritidae) capturadas nas
armadilhas McPhail, em trs municpios da regio Norte e dois munic-
pios da regio Noroeste do Estado do Rio de Janeiro (maio de 2005 a
abril de 2007).
b) Corpo: construdo por linhas e colunas, que fornecem o contedo das informa-
es prestadas.
c) Cabealho: a parte da tabela que apresenta a natureza do que contm cada co-
luna. Ou seja, apresenta o contedo referente a cada coluna.
o Exemplo:
Local Ocorrncia (n)

d) Coluna indicadora: a que determina o que contm cada linha. Ou seja, apre-
senta o contedo referente a cada linha.
Local Ocorrncia (n)
Regio metropolitana
Regio serrana
Regio dos lagos
e) Linha/Coluna de Totais: quando pertinente a tabela dever apresentar uma li-
nha e/ou coluna de totais, contendo a soma dos valores das linhas e colunas.

6.2 Elementos Complementares de uma Tabela Estatstica
a) Fonte: designa a entidade/autor que forneceu os dados estatsticos.
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
1
5

o Exemplo: Fonte: IBGE, IBOPE, Ministrio da Agricultura
b) Notas: esclarecimentos de natureza geral, a nota pode ser usada para indicar
uma informao extra do cabealho, que no cabe na respectiva clula, ou escla-
recer a natureza da informao.
Preferencialmente, as fontes e notas devem ser inseridas no rodap da tabela, ou seja, logo a-
baixo dela e com fonte menor que o corpo.

6.3 Observaes para a Construo de Tabelas Estatsticas
As recomendaes aqui so meramente formais e facilitam o entendimento dos
dados inseridos dentre da tabela. Desta forma, uma tabela:
No dever ser fechada lateralmente;
As casas (clulas) no devero estar em branco, apresentando sempre um nme-
ro ou sinal convencional;
As linhas horizontais devero estar presentes somente na diviso do cabealho e
corpo e entre o corpo e a linha de total.
As linhas verticais devem ser evitadas, exceto quando houver a coluna de total,
onde o uso facultativo, mas em geral no se usa.
Podero ser utilizadas linhas alternativas ou em faixas, com fundo cinza claro,
em geral 10%, para diferenciar uma linha da outra e facilitar a leitura da tabela,
principalmente quando h muitas linhas. Inclusive este sombreamento pode ser
utilizado no cabealho e na linha de total da tabela.

6.4 Sinais Convencionais Utilizados em Tabela Estatstica
So tambm convenes, referentes ao aspecto formal de uma tabela estatstica:
Trs pontos (...): quando o dado (informao) existe, mas no dispomos dele;
Ponto de Interrogao (?): quando h dvida quanto exatido de determinado
dado;
O zero (0): quando o valor for realmente zero;
Trao horizontal (- ou ): quando no houve dado na coleta do mesmo.
Mais ou menos (): quando os dados inseridos na tabela representam a mdia e o
desvio-padro utiliza-se deste smbolo, ou seja, o nmero antes representa a m-
dia e depois representa o desvio padro, respectivamente.
o Exemplo: 12,543,2455

6.5 Tipo de Tabela
6.5.1 Tabela Simples (Unidimensional)
uma tabela que possui dados ou informaes relativas a uma nica varivel.
Ou seja, uma coluna com a varivel que se quer representar e outras colunas com os
dados numricos a serem exibidos pela tabela.
Exemplo:
Taxa de crescimento de variedades de leguminosas submetidas a um composto rico em
matria orgnica, no municpio de Vassouras, RJ, de janeiro a abril de 2009.
Variedade Taxa de Crescimento (cm)
Amendoim forrageiro 20
Crotalaria juncea 15
Crotalaria spectabilis 19
Gliricdia 08

William Costa Rodrigues

P

g
i
n
a
1
6

6.5.2 Tabela de Dupla Entrada ou Cruzada (Bidimensional)
Este tipo de tabela possui dados relativos a mais de uma varivel. Ou seja, uma
coluna para a varivel e outras colunas para cada varivel, que sero representadas nu-
mericamente nas linhas.
Programao
Gnero
Total
Masculino Feminino
Noticirio 08 05 13
Musical 10 10 20
Novela 07 15 22
Esportivo 15 06 21
Outros 05 03 08
Total 45 39 84


7 Representao Grfica dos Dados Estatsticos
Grfico estatstico nada mais do que uma forma de apresentao dos dados
estatsticos. Tem como objetivo produzir, em quem o analisa, uma informao direta e
objetiva do fenmeno em anlise.
Convm ressaltar que o mais relevante interpretar os resultados, ou seja, reco-
nhecer no grfico alguma(s) medida(s) estatstica(s) que possa(m) eventualmente se-
ja(m) demonstrada(s) no grfico.

7.1 Grficos de Colunas
a representao estatstica de uma srie estatstica por meio de retngulos con-
tguos, dispostos verticalmente, ou seja, perpendiculares ao eixo x e paralelas ao eixo y.
As barras possuem mesma base (eixo x), entretanto seus valores dependem dos dados
das variveis dependentes (eixo y).
0
100
200
300
400
500
600
700
800
900
1000
92 93 94 95 96
Ano
V
e

c
u
l
o
s
(
m
i
l
h
a
r
e
s

d
e

u
n
i
d
a
d
e
s
)

Figura 4. Produo de veculos no Brasil (1992-1996).
Este tipo de grfico utilizado geralmente para sries temporais (Figura 4), sries especficas
(Figura 5) ou sries geogrficas (Figura 6).
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
1
7

0
50
100
150
200
250
Advogados Mdicos Engenheiros
Profisso
A
l
u
n
o
s

(
n

)

Figura 5. Alunos formados na Universidade Federal de Pernambuco em 1999.
0
2
4
6
8
10
12
14
16
Masculino Feminino
Sexo
P
e
s
s
o
a
s

(
n

)
a - Noticirio
b - Musical
c - Novela
d - Esportivo
e - Outros

Figura 6. Preferncia de programas de televiso por sexo.
7.2 Grficos em Barras
a representao de uma srie estatstica por meio de retngulos dispostos hori-
zontalmente, ou seja, perpendicular ao eixo y e paralelo o eixo x. Os retngulos possuem
mesma altura e os seus comprimentos so variveis, de acordo com os valores das vari-
veis dependentes.
0 50 100 150 200 250 300 350
Minas Gerais
Pernambuco
Sta. Catarina
R.G. Sul
So Paulo
Produo cebola (mil toneladas)

Figura 7. Produo de cebola no Brasil em 1992.
normalmente utilizado em sries geogrficas ou na representao de sries especficas.

William Costa Rodrigues

P

g
i
n
a
1
8

7.3 Grficos de Linhas
Este tipo de grfico utilizado em sries temporais ou que os dados tenham re-
lao entre si. Um exemplo a flutuao populacional de um animal ou planta ou a
flutuao demogrfica de um pas (Figura 8).

0
10
20
30
40
50
60
70
80
90
1995 1996 1997 1998 1999
Ano
P
o
p
u
l
a

o

(
e
m

m
i
l
h

e
s
)

Figura 8. Crescimento demogrfico do Brasil de 1995 a 1999.

7.4 Grficos de Pizza
So grficos utilizados em sries geogrficas que possibilitam a visualizao
dos resultados na forma de porcentagem. Vale ressaltar que os valores a serem especifi-
cados devem ser os valores reais, pois os programas calculam automaticamente a por-
centagem.
49%
16%
11%
24%
Empresa A
Empresa B
Empresa C
Empresa D

Figura 9. Fatia de mercado de empresas de venda de seguros de sade no estado do Rio de Janeiro.
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
1
9


Figura 10. Eleitores por estado da regio Sudeste do Brasil.
Nete caso h uma subdiviso, separando os dois menores valores de percentagem dos dados


7.5 Grficos Compostos
Podemos ter grficos compostos e assim trabalhar com duas sries independen-
tes. Como o caso de sries especficas e sries temporais. Ou mesmo variveis com
mesma srie, mas com escalas numricas diferentes (Figura 11).

0
5
10
15
20
25
30
35
40
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Perodo levantamento
T
e
m
p
e
r
a
t
u
r
a

(

C
)
0
2
4
6
8
10
12
F
l
u
t
u
a

o

p
o
p
u
l
a
c
i
o
n
a
l

(
%
)
Temperatura mdia Toxoptera citricida

Figura 11. Flutuao populacional de pulgo preto dos citros em funo da temperatura mdia em 1996,
no campus da Universidade Federal Rural do Rio de Janeiro.


8 Probabilidade Estatstica
Os acontecimentos na natureza ocorrem e se repetem segundo normas e leis. A
maior ou menor ocorrncia de um determinado acontecimento deve-se s circunstncias
nas quais ele se realiza. Assim no podemos assumir como certo a ocorrncia do acon-
tecimento, uma vez que est sujeita a uma srie de fatores. Contudo, podemos tomar
decises, tendo-se em vista experincias anteriores, com bases nos mais provveis resul-
William Costa Rodrigues

P

g
i
n
a
2
0

tados. Essa tomada de deciso, quando o conhecimento da ocorrncia de um determina-
do acontecimento, no exata, feita atravs do conceito de probabilidade.
A probabilidade pode ser conceituada, usando o bom senso, como o grau de
crena que podemos ter na ocorrncia de qualquer acontecimento eventual.
Para firma esta ilustrao, consideremos duas urnas, A e B, cada qual contendo
200 bolas de igual tamanho e mesmo material, distribudas sem qualquer regularidade
em seu interior. A respeito dessas urnas temos a informao de que existem 100 bolas
de cor preta e outras tantas de cor vermelha na urna A, enquanto a urna B contm 199
bolas de cor preta e apenas uma de cor vermelha.
Suponhamos, agora, um jogo no qual as bolas de urna A devem ser extradas
uma de cada vez, s cegas e no exaustivamente, isto , com retorno imediato de cada
bola extrada dessa urna. Se nos pedssemos para optar por uma aposta na retirada de
uma bola preta ou na de uma bola vermelha da urna A, responderamos, prontamente,
que nos indiferente apostar em uma ou na outra cor. Por que prontamente? Talvez
porque saibamos, empiricamente, que, por existir a mesa quantidade de bolas pretas e de
bolas vermelhas distribudas na urna A sem qualquer regularidade, isto , ao acaso, no
se deve esperar que as bolas com uma das cores sejam extradas preferencialmente.
Pelas mesmas razes empricas diramos que, em relao urna B, optaramos
por apostar na extrao de uma bola de cor preta, pois o nosso grau de crena a respeito
da extrao de uma bola preta da urna B maior do que aquele a respeito da extrao de
uma bola vermelha.
O bom senso que empregamos em relao aos jogos com as urnas de nosso e-
xemplo pode ser traduzido em termos matemticos por intermdio do conceito clssico
de probabilidade. Assim, pode-se dizer que num conjunto de n casos igualmente poss-
veis e mutuamente exclusivos, submetidas s mesmas condies fsicas, se x desses ca-
sos so favorveis a um acontecimento a, a probabilidade do acontecimento a ser ex-
pressa por intermdio da diviso do nmero de casos favorveis ao acontecimento a
pelo nmero de casos igualmente possveis e mutuamente exclusivos, isto :
n
x
P(a) =
Em relao urna A, pode-se dizer que existem n = 200 casos igualmente poss-
veis e mutuamente exclusivos ou incompatveis, isto , se uma determinada bola for
retirada em uma extrao, as outras necessariamente no sero naquela mesma extrao.
Desses casos, 100 so favorveis a retirada de uma bola preta e 100 favorveis a retirada
de uma bola vermelha. Desse modo, se apostarmos na extrao de uma bola preta tere-
mos um nmero de caso favorveis x = 100, portanto:
2
1
200
100
P(a) = = , isto , 0,5 ou 50%
Em relao urna B, teremos que a probabilidade de extrair uma bola preta ser:
0,995
200
199
P(a) = = ou 99,5%
Em relao extrair uma bola vermelha termos:
0,005
200
1
P(a) = = ou 0,5%

De outra forma, seja F o nmero de casos favorveis ocorrncia do evento A e
C o nmero de casos contrrios. Chamamos de probabilidade de ocorrncia de A na
razo do nmero de casos favorveis ocorrncia (F) pelo numero de casos totais (F +
C).
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
2
1

C F
F
(A) p
+
=
A frmula acima no aplicvel se o espao amostrado for finito e os acontecimentos igualmen-
te provveis.
Exemplo 1:
Supondo que uma sacola contendo 3 bolas amarelas, 4 vermelhas e 6 brancas.
Qual a probabilidade de tirarmos uma bola amarela?
Soluo:
N casos favorveis (F) = 3
N casos contrrios (C) = 10 (4 +6)
N casos totais (F+C) = 13 (10 + 3)
0,2308
13
3
10 3
3
(A) p = =
+
=
A probabilidade de 0,2308, ou seja 23,08%. Assim a probabilidade poder ser
expressa em porcentagem, j que assumimos que F+C o total, este valor passa a ser
100%.
Nesse caso a probabilidade ir variar entre 0 e 1, como podemos verificar na
item 8.1 Regras para Combinar Probabilidade.


Exemplo 2:
Qual a probabilidade de um dado espermatozide conter um cromossoma x?
Soluo:
Partindo da pressuposio de que igualmente possvel ter x e y, a probabilidade
de .
Dois conceitos so fundamentais para o entendimento da probabilidade:
Se a ocorrncia de um evento certa, sua probabilidade 1. Se sua no-
ocorrncia certa, sua probabilidade 0 (zero). Em qualquer outro caso, a pro-
babilidade uma frao entre 0 e 1;
Se a probabilidade de um evento acontecer p, a probabilidade de no acontecer
1-p. Chamamos aqui a probabilidade de um evento no ocorrer de q. Assim
temos:
o q = 1-p logo, p + q = 1

8.1 Regras para Combinar Probabilidade
As duas regras a seguir representam um mtodo simplificado de trabalhar e ope-
rar com probabilidade.
Regra 1 A probabilidade de um grupo de evento, mutuamente exclusivos, ocor-
rer a soma das probabilidades de cada evento.
Dois eventos so ditos mutuamente exclusivos se a ocorrncia de um deles, em
dado ensaio, exclui a possibilidade de ocorrncia do outro.
Exemplo:
Qual probabilidade de tirarmos um s ou uma Rainha de um baralho de cartas?
Soluo:
A probabilidade de tirarmos um s 4/52, pela definio de probabilidade.
tambm vlido para uma rainha.
Desta forma:
13
2
52
4
52
4
p = + = (pela regra 1)
William Costa Rodrigues

P

g
i
n
a
2
2

Regra 2 A probabilidade de que dois ou mais eventos independentes ocorram
juntos o produto das probabilidades individuais.
Exemplo:
Dois pais de olhos castanhos so heterozigotos para o alelo olhos azuis?
dado pela primeira Lei de Mendel.
16
1
4
1
4
1
p = =

8.2 Probabilidade Condicionada
Sejam A e B dois eventos associados a um experimento E. Representamos por
P(B/A) a probabilidade condicionada do evento B quando A tiver ocorrido. Sempre que
calculamos P (B), dado A, estaremos essencialmente calculando P (B) em relao ao
espao amostral reduzindo a (A) em lugar de faz-lo em relao ao espao amostral (S).
quando calculamos P (B/A), estaremos nos perguntando o quanto provvel ser estare-
mos em (B), sabendo que devemos estar em (A). Isto , espao amostral fica reduzido
de (S) para (A).
Exemplo:
Dois dados equilibrados so lanados, registrando-se os resultados com (x
1
,

x
2
).
Por isso, o espao amostral (A) pode ser representado pela seguinte matriz de 36 resul-
tados igualmente provveis.

=
) 6 , 6 ( ) 2 , 6 ( ) 1 , 6 (
) 6 , 2 ( ) 2 , 2 ( ) 1 , 2 (
) 6 , 1 ( ) 2 , 1 ( 1) 1, (
A
K
L M L M M M
K
K


Consideramos os dois eventos seguintes:
A = {(x
1
, x
2
)|x
1
+ x
2
= 10} e B = {(x
1
, x
2
)|x
1
> x
2
}
A = {(5, 5), (4, 6), (6, 4)}
B = {(2, 1), (3, 1), (4, 1), (5, 1), (6, 1), (3, 2), (4, 2), (5, 2), (6, 2), (4, 3), (5, 3), (6, 3), (5,
4), (6, 4), (6, 5)}
36
15
(B) P
36
3
(A) P = =

Existem vrias outras aplicaes e formas de utilizar a probabilidade, que podero ser encon-
trada na vasta literatura sobre estatstica e probabilidade.

9 Tcnicas Estatsticas Para Anlise de dados

9.1 Medidas de Tendncia Central
Os fenmenos quando estudados estatisticamente, so traduzidos por um conjun-
to de dados numricos. A descrio desse conjunto de dados torna-se mais clara quando
se obtm medidas que resumem as informaes necessrias. Essas medidas do-nos o
valor tpico do conjunto de dados.
Os valores tpicos de um conjunto de dados tendem a se localizar no centro da
srie. So, por isso, chamados medidas de tendncia central.
A importncia das medidas de tendncia central dupla:
Representam ou resumem todos os valores obtidos pelo grupo e, como tal, for-
necem uma descrio precisa da execuo do grupo como um todo, e;
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
2
3

Permitem o confronto de dois ou mais grupos.
Usam-se, em geral, trs medidas de tendncia central: mdia aritmtica (simples,
ponderada, de dados agrupados em intervalos), mediana e moda.

9.1.1 Mdia Aritmtica Simples ( X)
A mdia aritmtica simples a soma dos valores ou medidas, divididas pela
quantidade destes. Sendo representado pela frmula:
n
x
X

=
Onde X: representa a mdia;

x : a soma das variveis; e o n o nmeros de


indivduos ou elementos.
Exemplo: deseja-se saber o valor mdio do seguinte conjunto de dados: 32, 25,
32, 30, 26, 30, 29, 26, 29 e 33.

x : 32 + 25 + 32 + 30 + 26 + 30 + 29 + 26 + 29 + 33.
n = 10
2 , 29
10
292
X =

9.1.2 Mdia Aritmtica Ponderada
Quando se tem uma srie de valores sucessivos com a respectiva distribuio de
freqncia, pode-se calcular a mdia aritmtica ponderada. A forma de apresentao da
distribuio de freqncia seria:

Varivel Freqncia
X
1
f
1
X
2
f
2

. .
. .
. .
X
n
f
n


A expresso da mdia ponderada ser:
n 2 1
n n 2 2 1 1
f ... f f
f x ... f x f x
n
f x
X
+ + +
+ + +
= =



Exemplo: Calcular a mdia de idade de crianas at 9 anos de uma determinada locali-
dade.
Idade (anos) Freqncia
2 10

3 8
4 6
5 5
6 5
7 5
8 7
9 4
William Costa Rodrigues

P

g
i
n
a
2
4


50
250
4 ... 8 10
4 9 ... 8 3 10 2
X =
+ + +
+ + +
= = 5 anos

9.1.3 Mdia Aritmtica de Dados Agrupados em Intervalos
H vezes em que os dados no so verificados com seu verdadeiro valor indivi-
dual, mas so representados por uma classe que pode ter um determinado intervalo.
Neste caso, operamos da mesma maneira do caso anterior. Considerando que o intervalo
no tem um valor definido e sim um conjunto de valores. Utilizaremos como represen-
tante o ponto mdio de cada intervalo.

Por exemplo, a distribuio de freqncia abaixo, procede-se da seguinte forma:
Idade (anos) Freqncia (f)
0 | 5 4
5 | 10 2
10 | 15 3
15 | 20 1

Idade (anos) Valor central (X) Freqncia (f) X.f
0 | 5 2,5 4 10,0
5 | 10 7,5 2 15,0
10 | 15 12,5 3 37,5
15 | 20 17,5 1 17,5
10 80,0

Aplicando a frmula para calcular a mdia ponderada teremos:
anos 8
10
80

n
xf
X = =


Desta forma a mdia da populao avaliada oito anos.
Quando os dados apresentam homogeneidade, possvel o uso da mdia aritm-
tica, que tem como:
Vantagens:
o Ser fcil de calcular e entender;
o Unir em um valor todas as observaes do conjunto.
Desvantagens:
o No servir para sries variveis assimtricas;
o No expressar variaes dentro da distribuio de dados.

9.1.4 Mediana (Me)
um valor situado no centro da distribuio de freqncias. A distribuio tem,
portanto, como objetivo encontrar um valor que permita conter 50% dos dados acima
deste valor e 50% abaixo.
A mediana especialmente til quando se trata de sries assimtricas, isto ,
quando alguns valores so elevados ou baixos em relao aos demais. A mediana no
influenciada pela magnitude de cada uma dessas sries. Para o clculo da mediana de-
vemos previamente realizar alguns ajustes aos dados como segue:
Ordenam-se todos os valores, de forma crescente;
Determina-se o total de valores (n);
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
2
5

Localiza-se o valor central mediante a frmula:
2
1 n +
, quando o nmero de ob-
servaes (n) for mpar e 1
2
n
e
2
n
+ , quando o nmero de observaes par, o
que corresponde mdia dos valores centrais.

Exemplo:
a) Em determinada localidade foram selecionadas oito escolas, com a finalidade de
estimar a mediana referente ao nmero de alunos. Tendo verificado o seguinte
quadro:
Escola N de alunos
A 150
B 180
C 230
D 2.500
E 200
F 160
G 250
H 170
Inicialmente ordenam-se os dados: 150, 160, 170, 180, 200, 230, 250 e 2.500.
Como o nmero de observaes par utilizam-se as duas frmulas 1
2
n
e
2
n
+ ,
para obter os dois valores centrais. Assim os valores centrais para este conjunto de da-
dos so 180 (4) e 200 (5), portanto o valor mdio destes dois valores igual a 190, que
corresponde mediana.
Me= 190 alunos.

b) Em coletas de amostra de solo em cinco cidades, foram verificadas amostras po-
ludas com metais pesados, conforme o quadro a seguir:
Municpios Amostras Poludas
A 48
B 42
C 52
D 95
E 46
Aps ordenar os dados teremos: 42, 46, 48, 52 e 95. Como o nmero de obser-
vaes mpar utilizaremos a frmula
2
1 n +
, para encontra o valor central. Desta forma,
o valor central 48, que corresponde ao valor da mediana.
Me= 48 amostras poludas

9.2 Medidas de Variao
9.2.1 Desvio-Mdio (DM)
Considerado que num conjunto de dados cada valor apresenta um afastamento
em relao mdia. O desvio-mdio ser a mdia aritmtica destes afastamentos, le-
vando-se em conta os valores absolutos desses desvios.
Para um conjunto de observaes: 2, 5, 9, 11, 14 e 25
William Costa Rodrigues

P

g
i
n
a
2
6

11
6
66
X
6
25 14 11 9 5 2
X = =
+ + + + +
=

6
11 - 25 11 - 14 11 - 11 11 - 9 11 - 5 11 - 2
D.M.
+ + + + +
=

6 , 5 D.M.
6
34
D.M.
6
14 3 0 2 6 9
D.M. = =
+ + + + +
=

9.2.2 Desvio Padro
Existem dois tipos de desvio padro, o chamado desvio padro estimado ou s e o
desvio padro absoluto ou . O Desvio padro estimado (s) utilizado em populaes
infinitas, ou seja, onde no se conhece com preciso o valor absoluto de n, j o (des-
vio padro absoluto ou verdadeiro) calculado para populaes com valor n, bem co-
nhecido, ou seja, em populaes finitas.
O desvio padro o afastamento atribudo ao acaso, ou seja, o erro amostral, que
o conjunto de dados contm. Este erro refere-se diferena do valor s calculado e a m-
dia aritmtica. Para calcular o Desvio Padro utiliza-se a seguinte frmula:
( )
1 n
n
x
x
s
2
2

=



Onde: x: valores do conjunto de dados; : somatrio; e n: nmero de observa-
es.

Exemplo: Calcular o desvio padro do seguinte conjunto de dados: 2, 5, 9, 11, 14 e 25
x= 2+ 5 + 9 + 11 + 14 + 25 = 66
x= 2 + 5 + 9 + 11 + 14 + 25 x= 4 + 25 + 81 + 121 + 196 + 625 = 1.052
n = 6

07 , 8 s
5,20 6 s
5
326
s
1 6
726 052 . 1
s
5
6
356 . 4
052 . 1
s
1 6
6
66
052 . 1
s
2
=
= =

=

importante ressaltar que no clculo do desvio padro utilizou-se o denominador (n-1), ou se-
ja, o grau de liberdade, pois como o valor s uma estimativa, devemos ajustar o erro desta es-
timativa, eliminando um elemento do conjunto de observaes. Vale ressaltar que, no caso de
populaes finitas o denominador ser n e o desvio passa ser o (desvio padro absoluto ou
verdadeiro).

Observamos agora uma srie de dados agrupados, isto , uma srie de valores
que se repetem e, por conseguinte, so representados pela sua freqncia.
x f fx
2 2 4
3 2 6
4 4 16
5 4 20
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
2
7

x f fx
6 2 12
Total 14 58

Temos um total de 14 valores agrupados em cinco categorias. Desta forma lan-
a-se mo de um novo quadro de dados para facilitar os clculos
x f fx fx
2 2 4 16
3 2 6 36
4 4 16 256
5 4 20 400
6 2 12 144
Total 14 58 852

Para calcular o desvio padro desta distribuio, utiliza-se a seguinte frmula:
2 2
n
fx
n
fx
s
|
|

\
|
=

, ou seja,

6,6101 s 6935 , 43 s 1636 , 17 8571 , 60 s 1429 , 4 8571 , 60 s
14
58
14
852
s
2
2
= = = =
|

\
|
=


9.3 Varincia ou Quadrado Mdio
o valor do desvio padro estimado ao quadrado, originando a varincia esti-
mada (s), ou o valor do desvio padro populacional, originando a varincia populacio-
nal ( ).
A varincia a medida estimada ou calculada que determina a variao dos va-
lores entre si, ou seja, quanto menor este valor menor ser a diferena entre os valores
dos elementos do conjunto de dados.

9.4 Erro-Padro da Mdia - s(x)
Quando uma investigao cientfica realizada atravs de amostra, a mdia a-
ritmtica teria outros afastamentos (erros) em relao mdia populacional ou real. Para
se determinar a mdia destes afastamentos utilizaremos o erro padro da mdia, cujo
clculo expresso pela frmula:
( )
n
s
x s =
Onde: s: desvio padro da amostra e; n: nmero de observaes do conjunto de dados.
Exemplo: em uma amostra com 100 observaes, obteve-se um valor s igual a
1,25, o erro-padro da mdia ser:
( ) ( ) ( ) 125 , 0 x s
10
25 , 1
x s
100
1,25
x s = = =
importante ressaltar que quanto menor for o valor do erro-padro da mdia, mais preciso se-
r os resultados em relao estimativa da mdia, anlise da varincia entre outras anlises,
baseadas na estimativa de dados.

William Costa Rodrigues

P

g
i
n
a
2
8

9.5 Coeficiente de Variao
O coeficiente de variao (CV) uma medida abstrata que independe das unida-
des em que foram medidas os dados. Ele expressa o desvio padro que obteramos se a
mdia representasse o ndice 100. Pode ser tambm interpretado com uma medida de
preciso alcanada das estimativas dos dados em relao aos valores reais. Este parme-
tro estimado pela frmula:
100
x
s
C.V. =
Onde: s: desvio padro da amostra; x : mdia aritmtica da amostra.

Quanto maior for a disperso no conjunto de observaes, maior ser o valor do
coeficiente de variao. Desta forma, podemos classificar o C.V. da seguinte forma:
C.V. Classificao
C.V. < 10% timo
11% < C.V. <20% Bom
21% < C.V.< 30% Regular

importante ressaltar que valores acima de 30% no significam um C.V. insatisfatrio, pois
alguns experimentos em campo podem ter o valor C.V. de at 65% e serem considerados bons.

9.6 Curva de Distribuio Normal
A maioria dos fenmenos da natureza, em especial os biolgicos, apresentam
variaes dentro de um intervalo definido.
Se coletssemos os dados quanto ao peso de mil indivduos, encontraramos di-
versos valores, dos quais haveria pequena quantidade de baixos e altos, e grande quanti-
dade em torno dos valores centrais.
Numa representao grfica dos dados obtidos encontraramos uma distribuio
normal conforme a figura abaixo.

Figura 12. Curva de distribuio normal simtrica, onde a mdia e s o desvio padro.
A curva de distribuio normal ou simplesmente curva normal caracterizada
por dois parmetros: a mdia e o desvio padro (ou a varincia).
O ponto mximo da funo ocorre no valor mdio (situado ao centro da curva,
que simtrica); a distncia entre ele e cada um dos pontos em que muda a direo da
curvatura, esquerda e a direita da mdia () corresponde ao valor do desvio padro(s)
(Figura 12).
A forma desta curva depende do desvio padro, sendo tanto mais alta e estreita
quanto menor for o valor de s (Figura 13).
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
2
9


Figura 13. Curvas de distribuio normal das freqncias de X, tendo a mesma mdia () e diferentes
graus de disperso dos valores de X, isto , desvios padres (s) diferentes.
A rea da figura sob a curva compreendida entre valores iguais a s, de um e ou-
tro lado da mdia (), contm 68,2% dos valores de X, que sero tanto mais prximos
de quanto menor for o desvio padro (Figura 14).

Figura 14. Curva normal padro, tendo por parmetros =0 e s= 1. As reas sob a curva assinaladas entre
os traos verticais indicam as percentagens de valores de X a contidas.
A rea compreendida entre -2s e +2s abrange cerca de 95,5% dos valores de X,
restando, portanto duas reas extremas, apenas 4,5% das observaes ou eventos medi-
dos.
As propriedades da curva normal permitem seu uso para o clculo de probabili-
dade com que determinados valores obtidos durante as observaes, ou as medies,
possam ocorrer em funo das variaes.

9.6.1 Limites de Confiana
Quando se desconhece o valor de determinado parmetro de uma populao (sua
mdia, por exemplo), podemos estim-lo a partir de uma amostra extrada dessa popula-
o. A estimativa, entretanto, pode ser inexata e no saberemos o quanto ela incorreta.
William Costa Rodrigues

P

g
i
n
a
3
0

Para a estimativa de um parmetro, consideram-se como sendo seus limites de
confiana, aqueles valores entre os quais fica includo, com uma alta probabilidade, o
valor exato desse parmetro.
A probabilidade P= 0,05 (ou 5%), que corresponde a um desvio ou erro padro
de aproximadamente 2s (ou, mais precisamente, 1,96s), geralmente aceita, por con-
veno, como limite para decidir se um resultado afastado da mdia (ou a diferena en-
tre duas mdias) significativo ou no.
Um afastamento maior que 2s indica uma probabilidade menor que 1 para 20 de
que os valores encontrados pertenam a uma mesma populao. Assim, se o valor m-
dio (m) de uma observao comportar um desvio ou erro padro maior que 1,96s, em
relao ao valor hipottico da mdia verdadeira (), concluiremos que ele no pertence
populao cuja mdia .
Na Figura 15, os limites de confiana so representados pelos valores de -C e +C
que circunscrevem, com grande probabilidade, o valor do parmetro em causa. A ampli-
tude entre esses valores limites denomina-se domnio de confiana ou intervalo de con-
fiana.


Figura 15. Os valores de Z (compreendidos entre -Z e +Z) correspondem aos afastamentos de X em rela-
o mdia , medidos em unidades de desvio-padro. A probabilidade (P) com que X possa ter valor
menor que uma coordenada escolhida (C) indicada pela rea, sob a curva, situada esquerda de C.

9.6.2 Erro Padro
Em alguns casos, conveniente trabalhar com a mdia das mdias amostrais.
Nesse caso o desvio padro de uma distribuio de mdias ou de diferenas entre m-
dias tambm chamado de erro padro.

9.7 Teste de Normalidade dos Dados
Os testes empregados para verificar a distribuio normal dos dados, tm por
objetivo direcionar o pesquisador a saber qual o tipo de teste ser utilizado, se um teste
paramtrico ou no paramtrico.
necessrio explorar um pouco mais a idia sobre a distribuio de variveis.
Uma questo que pode ser levantada primeiramente se a maioria das variveis nor-
malmente distribuda e, portanto poder ser empregados testes paramtricos sem preocu-
pao quantos s suas restries. Testes estatsticos com grandes amostras mostram que
nem sempre as suposies de normalidade de confirmam. Por outro lado, como nem
sempre se dispes de um nmero elevado de casos para estudo, s vezes nem possvel
decidir se determinada varivel possui ou no distribuio normal (na prtica a amostra
deve ter o valor n > 100).
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
3
1

Os testes comumente utilizados so KlomogorovSmirnov, ou teste K-S, que
um teste tradicional de normalidade e o teste de Shapiro-Wilks, ou teste S-W, vem sen-
do empregado cada vez com maior freqncia.

9.8 Teste de Klomogorov-Smirnov (K-S)
Este teste compara a distribuio real dos dados (amostra) com uma distribuio
normal gerada por uma mdia e um desvio padro supostamente conhecidos (popula-
cionais).

9.9 Teste de Shapiro-Wilks (S-W)
Este teste uma boa opo para se testas a normalidade de uma distribuio. o
teste pode ser usado em amostra de at 2.000 observaes. Nos ltimos anos o teste S-
W tem sido preferido ao teste K-S pela capacidade de adaptao a uma variada gama de
problemas sobre a variao de normalidade.

10 Testes Paramtricos e No Paramtricos
De acordo com a distribuio dos dados, utilizam-se testes de duas categorias:
Os testes paramtricos - aplicam-se a amostras extradas de populaes com dis-
tribuio normal e varincias iguais ou muito prximas, alm de exigirem que as
medidas sejam feitas em escalas numricas intervalares, suscetveis de tratamen-
to matemtico. Estes testes so, em geral, os de maior potncia, podendo ser a-
plicados mesmo quando ocorram pequenos desvios de normalidade ou da vari-
ncia entre as amostras.
Os testes no-paramtricos - so menos exigentes quanto natureza da distribu-
io dos dados experimentais, so em geral menos potentes.
Se os dados experimentais no estiverem de acordo com os pressupostos para a
aplicao de provas paramtricas (por exemplo, se no seguirem a distribuio normal),
uma alternativa a transformao de dados dos seus valores (vide item Transformao
de Dados, p. 46), de tal forma que os pressupostos possam ser satisfeitos. A transforma-
o mais utilizada a converso dos dados em logaritmos decimais.
Os elementos necessrios para a utilizao de um teste so:
Formular as duas hipteses: a de nulidade (H
0
), que supe no haver diferena
significativa entre os valores encontrados e os esperados; e a hiptese alternativa
(H
1
), onde essa diferena existir;
Estabelecer o nvel de significncia e, conseqentemente, as regies crticas de
aceitao de H
0
;
Definir se, se trata de um teste mono ou bicaudal;
Tomar as amostras de tamanho n e registrar os valores, calcular a mdia (), a
varincia (s) e o desvio padro (s) e;
Escolher o teste estatstico adequado.
Para maiores detalhes e saber com escolher um teste, consulte o Fluxograma
Para Auxiliar na Escolha de Testes Estatsticos, p. 56.

10.1 Teste t - Student
H certas ocasies em que o pesquisador deseja a comparao de suas amostras
que provm de populaes diferentes. Neste caso, ao constatar as mdias destas amos-
tras para verificar se h a diferena entre elas, estaremos indiretamente comparando as
duas populaes. E por analogia, poderamos proceder a um experimento em que um
grupo receberia uma droga (grupo tratado), enquanto outro grupo nada receberia (grupo
William Costa Rodrigues

P

g
i
n
a
3
2

controle). O efeito do tratamento aplicado seria verificado pela comparao dos dois
grupos.
Nesses casos, o teste t seria indicado para tal comparao salientando que a vari-
vel em anlise teria que apresentar os dados em distribuio normal ou aproximada-
mente normal.
O valor t - student calculado dado pela frmula:
n
s
X
t
2
=
Onde: X: mdia; s= varincia e N: nmero de observaes

As formas de utilizao deste teste apresentam situaes diferentes como mos-
tras os subitens abaixo:

10.1.1 Dados Pareados (Amostras Dependentes)
Trata-se do estudo de um tipo de tratamento em que se utilizam pares de indiv-
duos ou animais ou plantas. H a uma preocupao em que haja um pareamento entre
indivduos para que eles difiram somente no aspecto, tratado e no-tratado.
Em um estudo foi separada uma populao de 10 crianas para os testes com
administrao da dieta de folha de mandioca, obtivemos os seguintes dados:

Tabela 2. Dados do peso de 10 crianas antes e depois da administrao a base de folhas de mandioca
(dados fictcios).
Item
Peso (Kg)
Diferena
Antes Depois
1 24 28 4
2 23 25 2
3 24 25 1
4 23 29 6
5 30 32 2
6 31 34 3
7 31 38 7
8 14 19 5
9 20 22 2
10 18 23 5
Total 238 275 37

Procedimento:
a) Obtm-se as diferenas entre os valores antes e depois (quadro acima);
b) Verifica-se a mdia aritmtica das diferenas;
c) Verifica-se a varincia das diferenas e;
d) Aplica-se o teste t - student.
b) 7 , 3
10
37
X
d
= =

c) d=173; d=37; n= 10

Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
3
3

01 , 4
9
1 , 39
9
9 , 136 173
9
10
1369
173
s
2
= =

=

d) 84 , 5
0,6332
3,7

0,401
3,7
t
10
4,01
3,7
t = = = = =

O prximo passo e recorrer tabela do teste t - student (Tabela 11, p. 57) e
compara-se o valor do t calculado com o valor crtico da tabela em funo de com n-1
graus de liberdade.
No exemplo acima, n= 10, portanto, devemos verificar os valores crticos com
nove graus de liberdade. Desta forma, encontramos os valores 2,26 (5% ou =0,05) e
3,25 (1% ou =0,01).
O valor encontrado (calculado) de t= 5,84 maior do que os valores da tabela.
Conclumos pela rejeio de H
0
(hiptese nula) em nvel de 1% de probabilidade
(=0,01).
Conclui-se que a adio do farelo de mandioca na alimentao contribuiu para o
aumento do peso corpreo das crianas.

10.1.2 Dados Pareados (Amostras Independentes)
Neste caso os dados so tratados de forma diferente, ou seja, possuem o mesmo
valor n, mas no pertencem ao mesmo tratamento ou no h comparao entre antes e
depois. O teste t utilizado nesta situao pressupe varincias diferentes, mesmo o as
duas amostras possuindo valores n iguais.
O valor t - student calculado dado pela frmula:
2
2
2
1
2
1
2 1
n
s
n
s
X X
t
+

=
Onde:
1
X e
2
X : mdias das amostras; s
1
= e s
2
= desvios-padro das amostras; e n
1
e n
2
:
nmero de observaes das amostras.

Esta equao deve ser utilizada, quando se conhece a varincia populacional ().
Exemplo:
Tabela 3. Dados de um experimento com a taxa de crescimento de mudas de duas leguminosas em siste-
ma agro-silvo-pastoril, numa rea de re-vegetao (dados fictcios).
Leguminosa A Leguminosa B
1
X = 38 cm
2
X = 33,5 cm
s
1
= 5 cm
s2
= 6 cm
n
1
= 26 n
2
= 26
Calculado o valor de t teremos:
94 , 2 9379 , 2
5317 , 1
4,5
3461 , 2
4,5
3846 , 1 9615 , 0
4,5
26
36
26
25
4,5
26
6
26
5
33,5 - 38
t
2 2
= = =
+
=
+
=
+
=

Para calcular o Grau de Liberdade, procedemos da seguinte forma:
William Costa Rodrigues

P

g
i
n
a
3
4

GL= n
1
+ n
2
2 ou (n
1
1) + (n
2
1).
Para o nosso exemplo acima temos o GL = 26 + 26 2 = 50 ou (261) + (26
1)=50. Os valores a 5% e 1% de probabilidade so 2,68 e 2,01, respectivamente (Tabela
11, p. 57). Comparando o valor calculado (2,94) com os valores tabelados verifica-se
que h diferena estatstica a 5% e a 1% de probabilidade. Desta forma, conclumos que
h 99% de probabilidade de que a leguminosa A, possuam taxa de crescimento mdia
mais elevada que a leguminosa B.

10.1.3 Dados No-Pareados - Varincias Desiguais (Heterocedsticas)
Caso os dados no pertenam s amostras no pareadas, o teste T ser aplicado
baseando-se na diferena entre as mdias das duas amostras, podendo as mesmas apre-
sentarem tamanhos diferentes (n
1
e n
2
).
Supe-se, neste caso, que as amostras so independentes e que apresentam vari-
ncias desiguais.
H uma regra prtica que identifica tal desigualdade a ponto de justificar tal pro-
cedimento. Se a relao entre as varincias apresentarem valor maior do que quatro, isto
justifica a conduta sugerida.
Por exemplo: s
1
= 27 e s
2
= 5
Portanto = 5,4
5
27

s
s
2
2
2
1
= =
Seguindo o critrio estabelecido, as amostras sero comparadas de acordo com
este resultado.
Exemplo: temos duas amostras de gua em que os dados quanto ao nvel de con-
taminao de mercrio apresentam os seguintes valores:
Amostra A Amostra B
X
1
=160 ppm X
2
=148 ppm
s
1
=74 ppm s
2
=18 ppm
n
1
= 20 n
2
= 32

O valor do teste t ser obtido atravs da expresso:
2
2
2
1
2
1
2 1
n
s
n
s
X X
t
+

=
Calculado o valor de t teremos:
5,82
2,06
12

4,26
12

32
18
20
74
148 160
t = = =
+

=
Para verificar a significncia deste valor, devemos calcular o grau de liberdade
para o conjunto de dados, em que g calculado atravs da frmula:
1 n
n
s
1 n
n
s
n
s
n
s
g
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1

|
|

\
|
+

|
|

\
|
|
|

\
|
+
= ou
2
n n
g
2 1
+
=
Para nosso exemplo seria:
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
3
5

25 8 , 24
73 , 0
4,26

1 32
32
18
1 20
20
74
32
18
20
74
g
2
2
2 2
2
= =

\
|
+

\
|
|

\
|
+
=

Consulta-se ento a tabela do teste t-student (Tabela 11, p. 57), para verificar os
valores crticos nos nveos de 5% e 1% de probabilidade para 25 graus de liberdade.
Na tabela iremos obter o valor de 2,06 (5%) e 2,79 (1%). Desta forma, conclui-
se que o valor obtido pata t = 5,82 significativo no nvel de 1% (1% ou =0,01), acei-
tando-se a hiptese alternativa, devido diferena significativa entre as mdias das duas
amostras.

10.1.4 Dados No-Pareados - Varincias Iguais (Homocedsticas)
A aplicao do teste t de Student para este caso realizada quando comparamos
as mdias aritmticas de duas amostras independentes, nas quais as varincias apresen-
tam valores aproximadamente iguais. Ainda neste caso, o procedimento metodolgico
consiste em se utilizar uma varincia ponderada, considerando tambm o nmero de
graus de liberdade de cada uma das amostras.
Exemplo: para verificar se duas amostras de gua mineral de duas marcas possu-
em a mesma quantidade sulfatos, um pesquisador separou ao acaso, um lote de caixa de
cada marca e ao acaso avaliou o contedo de uma garrafa de cada caixa. A marca A e
marca B, possuam 10 e 7 caixas no lote selecionado, respectivamente. Ou seja, foram
avaliados os contedos de 10 e 7 garrafas, respectivamente.
Exemplo:
Amostra (mg.L)
Marca A Marca B
1,4 1,7
1,5 1,8
1,8 1,4
1,3 1,2
1,1 1,9
1,6 1,0
1,5 1,5
1,4 -
1,2 -
1,4 -
X
A
= 1,42

X
B
= 1,50
s
A
= 0,04 s
B
= 0,11
n
A
= 10 n
B
= 7

A varincia ponderada dada pela frmula:
( ) ( )
2 n n
s 1 n s 1 n
s
B A
2
B B
2
A A 2
+
+
=
Para nosso exemplo teramos:
( ) ( )
0680 , 0
15
02 , 1
15
0,66 0,36

15
11 , 0 6 04 , 0 9

2 7 0 1
11 , 0 1 7 04 , 0 1 10

2
= =
+
=
+
=
+
+
= s
William Costa Rodrigues

P

g
i
n
a
3
6

Em seguida aplica-se a frmula para o teste t.
|
|

\
|
+

=
B A
2
B A
n
1
n
1
s
X X
t
Assim temos:
23 , 6
1285 , 0
8 , 0
0165 , 0
8 , 0
7
1
10
1
0680 , 0
1,5 - 1,42

=
|

\
|
+
= t

Os valores de t tabelado para 15 graus de liberdade a 5 e 1% so respectivamen-
te, 2,13 e 2,95. Desta forma, conclui-se que as duas marcas de gua mineral apresentam
diferentes propores de sulfatos em sua composio, sendo que a marca B possui mai-
ores concentraes em relao marca A.

10.2 Teste Qui-Quadrado ( )
O teste no-paramtrico de qui-quadrado foi desenvolvido por Pearson, sendo
muito utilizado em pesquisas biolgicas.
O grau de liberdade para o teste de o nmero de observaes/ classes menos
1.
A frmula utilizada para calcular o :
( )
fe
fe - fo
2
2

=
Onde: fo= freqncia observada e; fe= freqncia esperada.
Portanto o valor do desvio elevado ao quadrado e dividido pela freqncia es-
perada.
Em muitos casos utiliza-se este teste em experimentos probabilsticos, por e-
xemplo, lanamentos de moedas ou proporo de doentes aps uma epidemia. No pri-
meiro caso a probabilidade de lanarmos 10 vezes uma moeda e cair cara de 50%
(freqncia esperada) e o valor real aps os lanamentos ser a freqncia observada.
No segundo caso a freqncia esperada dever ser corrigida (calculada) atravs da Ta-
bela de Contingncia.

10.3 Tabela de Contingncia
Em muitos trabalhos experimentais, os dados colhidos representam ocorrncia
de certos fenmenos que se podem classificar numa tabela, chamada tabela de contin-
gncia.
Estas tabelas tm como objetivo estudar a possvel associao entre duas vari-
veis que classificam os dados. Em tal situao a H
0
(hiptese nula) ser testar a inde-
pendncia entre as variveis.
Para poder calcular o , necessrio que tenhamos as freqncias tericas, o
que se faz admitindo-se a hiptese de que todos os grupos reajam da mesma maneira
diante da condio a elas imposta.
A comparao entre os valores calculados de , para verificar a significncia
pode ser obtido na tabela de (Tabela 12, p. 58).
Exemplo: Num Shopping Center, foram escolhidas ao acaso pessoas com trs
diferentes faixas etrias, para verificar a incidncia de diabete. Para tal, foram coletadas
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
3
7

amostras de sangue. A H
0
que no diferena entre as faixas etrias em relao a ter
diabete.

Os dados coletados ao final do experimento foram:
Faixa Etria
(anos)
Pessoas*

Com diabete Sem diabete
A: 10-15 2 (11,74) 75 (65,26) 77
B: 16-21 12 (11,28) 62 (62,72) 74
C: 22-40 20 (10,98) 52 (61,02) 72
34 189 223
* Valores entre parnteses e em negrito representam as freqncias calculadas

Neste caso temos uma tabela de contingncia de 2 x 3, pois temos duas situaes
as serem testadas (com ou sem diabete) em trs grupos (faixas etrias).
O Grau de liberdades para tabelas de contingncias ser calculado pela seguinte
frmula: ( ) ( ) 1 n 1 n GL
g s
= . No nosso exemplo teremos:
( ) ( ) 2 GL 2 1 GL 1 3 1 2 GL = = =
Para calcular as freqncias realiza-se uma regra de trs simples como segue:
34 223
fe 77

Ou seja,
223
77 4 3
fe
A

= a fe da terceira coluna (sem diabete) calculada pela diferena


entre os valores da fe da 2 coluna (com diabete) e o valor da coluna total (). Os de-
mais valores da linha subseqentes so obtidos com a realizao da regra de trs para
cada valor da 2 coluna.
Para calcular o do conjunto de dados utilizaremos a frmula vista anterior-
mente. Assim teremos:
( ) ( ) ( ) ( ) ( )
( )
34 , 18 1,33 41 , 7 0,01 0,05 1,45 8,09
02 , 61
36 , 81
98 , 10
36 , 81
72 , 62
5184 , 0
28 , 11
5184 , 0
26 , 65
87 , 94
74 , 11
87 , 94

02 , 61
02 , 61 52
98 , 10
98 , 10 20
71 , 62
72 , 62 62
28 , 11
28 , 11 12
26 , 65
26 , 65 75
74 , 11
74 , 11 2
2 2
2
2
2 2 2 2 2
2
= + + + + + =
+ + + + + =

=


De acordo com a Tabela 12 (p. 58), o valor para 2 graus de liberdade a 5 e 1%
de probabilidade seriam 5,99 e 9,21, respectivamente. Desta forma, conclui-se que h
diferena entre as faixas etrias, ou seja, a ocorrncia de diabete depende da faixa etria,
segundo o teste de a 5 e 1% de probabilidade.

10.4 Teste de Kruskal-Wallis
Este teste foi criado como substitutivo anlise de varincia paramtrica (Teste
F).
Ele utilizado para que se verifique o contraste entre k amostras independentes.
Os valores obtidos nas diversas amostras diferem entre si e, portanto, ser uma
maneira se verificar se estas diferenas so devidas ao acaso ou se as amostras provm
de populaes diferentes.
William Costa Rodrigues

P

g
i
n
a
3
8

No teste de Kruskal-Wallis todas as observaes recebem uma pontuao atra-
vs dos nmeros 1, 2, 3, 4, ...n. Assim, ao menor valor se atribuir o valor 1, e assim
sucessivamente at atingir o maior valor, que receber a maior pontuao.
Da mesma forma que nos outros testes, sero consideradas sempre duas hipte-
ses (H
0
e H
1
).
Para o clculo do valor H do teste de Kruskal-Wallis utiliza-se a frmula:
( )
( ) 1 N 3
n
R
1 N N
12
H
k
1 i
i
2
i
+
+
=

=

Onde: Ri = a soma das ordens atribudas ao tratamento i; k =corresponde ao nmero de
tratamentos a comparar; n
i
= nmero de observaes em cada tratamento k e; N = n-
mero total de observaes em todos os tratamentos k.
Na ordenao global que se faz para atribuio dos postos aos dados, considera-
se que nos casos de empate entre duas ou mais observaes, calcula-se a mdia das or-
dens que seria atribuda a elas se no houvesse o empate.
Para verificao de significncia quanto s diferenas observadas entre tratamen-
tos k, considera-se que o teste tem uma distribuio aproximada de , com k-1 graus de
liberdade, ou seja, a tabela para comparar os valores a tabela de (Tabela 12, p. 58).
Para exemplificarmos o teste de Kruskal-Wallis, supomos que foram testados ou
experimentados trs mtodos para dessalinizao de gua. Assim sendo, foram coleta-
das diversas amostras de gua com diversas concentraes de sal, que no vem ao caso
no exemplo a ser testado. Desta forma, testou-se o tempo de dessalinizao dos trs m-
todos. Os resultados do experimento seguem abaixo:
Mtodos
A B C
DD posto DD posto DD posto
17 11 20 12 32 17
14 9 5 3 35 20
4 2 9 6 26 15
8 5 13 8 34 18,5
29 16 34 18,5 21 13
6 4 2 1 45 21
15 10 11 7 50 23
- - 22 14 47 22
R
A
=57,0 R
B
= 69,5 R
C
= 149,5
n
A
= 7 N
B
= 8 n
C
= 8
x
A
= 13,29 x
B
= 14,50 x
C
= 36,25
DD= dias para dessalinizao.

Para calcular H teremos:
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
3
9

( )
( )
( )
( )
95 , 11 H
72 70 , 861 . 3 0217 , 0 H 72 70 , 861 . 3
552
12
H
24 3 78 , 793 . 2 78 , 603 14 , 464
552
12
H
24 3
8
25 , 350 . 22
8
25 , 830 . 4
7
249 . 3
4 2 23
12
H
1 23 3
8
5 , 149
8
5 , 69
7
57
1 23 23
12
H
2 2 2
=
= =
+ + =
|

\
|
+ +

=
+
|
|

\
|
+ +
+
=


Como j foi dito este teste segue a distribuio do teste . Desta forma, sendo k
= 3 (mtodos), os graus de liberdade correspondem a 2, pois GL= k-1. Portanto, os valo-
res da tabela , correspondem a 5 e 1%, so 5,99 e 9,21, respectivamente.
Considerando que o valor calculado H=11,95 maior que os valores tabelados,
rejeitamos H
0
(no h diferenas entre os mtodos testados no tempo de dessalinizao
das amostras), assim aceita a H
1
. Pelos valores R encontrados nos resultados verifica-se
que o mtodo A e mais eficiente no processo de dessalinizao, pois leva menos tempo
em comparao aos demais.

10.5 Teste de Friedman (Anlise da Varincia)
Da mesma forma que o teste de Kruskal-Wallis, este teste um substitutivo ao
teste F para anlise de varincia paramtrica, sendo utilizado quando as amostras, cujas
observaes podem verificar valores com acentuada variao e em cada tratamento so
constitudos blocos com a inteno de que isto resulte em um pareamento considervel
entres os diversos tratamentos.
De forma anloga aos demais testes, formula-se a H
0
e a H
1
. Para testar a H
0,
utiliza-se tabela de , co grau de liberdade k-1.
O valor do teste de Friedman (X
r
2
) calculado atravs da seguinte equao:
( )
( ) ( ) 1 k 3n R
1 k nk
12

k
1 i
2
i
2
r
+
+
=

=

Onde: n = nmero de blocos; k = o nmero de tratamentos; Ri = a soma das ordens atri-
budas aos dados do tratamento i, nos blocos n.
Para os casos de empate entre observaes de mesmo bloco, calcula-se a mdia
aritmtica das ordens. A ordenao dos valores se d dentro dos blocos.
Exemplo: Foram coletadas cinco amostras em quatro profundidades (tratamen-
tos) em cinco reas diferentes, delimitados pelas caractersticas edficas do solo (blo-
cos). Este solo foi exposto h poluentes de uma determinada fbrica. Assim sendo, quer
saber se o poluente est distribudo de forma igual entre as profundidades avaliadas, ou
seja, as concentraes do poluente so iguais em todas as profundidades (Hiptese Nula
ou H
0
). Os resultados da anlise foram as seguintes:
Tabela 4. Resultados das amostras de cinco diferentes reas delimitadas pelas caractersticas edficas do
solo, em quatro diferentes profundidades. Os dados apresentados referem-se a o poluente --16-
Imaginol-Poluentis, em mg.mm de solo
Blocos
Profundidade (cm)
0-10 11-20 21-30 31-50
rea A 12 (2) 13 (3) 16 (4) 7 (1)
rea B 8 (2) 9 (3) 12 (4) 5 (1)
William Costa Rodrigues

P

g
i
n
a
4
0

Blocos
Profundidade (cm)
0-10 11-20 21-30 31-50
rea C 14 (2) 20 (3) 22 (4) 6 (1)
rea D 17 (3) 16 (2) 21 (4) 11 (1)
rea E 12 (2) 15 (3) 16 (4) 10 (1)
Total
R
1
= 11 R
2
= 14 R
3
= 20 R
4
= 5
*Os valores entre parnteses e em negrito correspondem ordenao dos tratamentos dentro dos blocos
(linhas). Sendo o valor Ri a somas dos valores de ordenao nos tratamentos (colunas).

Substituindo os valores na frmula para o clculo do valor
r
, teremos:
( )
( )
( )
( )
04 , 14
75 04 , 89 75 742
100
12

75 25 400 196 121
1 4 4 5
12
5 5 3 5 20 14 11
1 4 4 5
12
2
r
2
r
2
r
2 2 2 2 2
r
=
= =
+ + +
+
=
+ + +
+
=


Como valor de graus de liberdade igual a k-1 graus de liberdade e sendo k=4
(tratamentos), tm-se 3 graus de liberdade. A partir da tabela (Tabela 12, p. 58). Os
valores para 5 e 1% de probabilidade so 7,82 e 11,32, respectivamente.
Sendo o valor de
r
calculado maior que os valores da tabela de , rejeita-se a
hiptese nula (H
0
) e aceita a hiptese alternativa (H
1
). Ou seja, a profundidade de 21-30
cm tem uma maior concentrao do poluente que as demais profundidades avaliadas,
nas reas onde foram coletadas amostras.

11 Correlao Linear
A correlao linear utilizada para verificar, num determinado conjunto, a de-
pendncia entre duas sries de variveis.
Trata-se de um valor abstrato que d uma idia sobre a dependncia entre os
dados apresentados.
A correlao pode ser denominada positiva ou negativa. Quando positiva h a
variao positiva da varivel dependente (Y), quando h variao positiva da varivel
independente (X) vice-versa. Quando negativa h a variao negativa de Y, quando h
variao positiva de X e vice-versa.

11.1 Coeficiente de Correlao (r)
O coeficiente de correlao e designado pela letra r. Pode ser utilizado para da-
dos normais (Correlao de Pearson) e para dados no normais (Correlao de Spear-
man).
11.1.1 Correlao de Pearson
Utilizado na anlise de dados que possuem distribuio normal.
( )
Y X
s s 1 n
n
Y X
XY
r

=



Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
4
1

Onde: r= coeficiente de correlao de Pearson; XY = soma dos produtos entre os valo-
res de X e Y; X x Y= produto da soma dos valores de X e Y; n = nmero de amostras
de X e Y; s
X
e s
Y
= desvios padres de X e Y

11.1.2 Correlao de Spearman
Este coeficiente de correlao baseia-se no rank dos valores X e Y e largamen-
te utilizado em anlise de correlao e dados no paramtricos.
n n
d 6
1 r
3
2
i
s

=


Onde: r
s
= coeficiente de correlao de Spearman; d
1
= a diferena entre cada valor X e
cada valor Y correspondente; n = nmero de pares de dados.
A correlao de Spearman, no possui um teste de significncia especfico, en-
tretanto o teste de Rugg ou Significncia Baseada nos Intervalos perfeitamente aceit-
vel nos caso de comparao e verificao de significncias do valor r.
Este tipo de correlao em geral utilizado em dados oriundos de experimentos
biolgicos, ou de dados coletados no campo, em geral, so dados no paramtricos.
Muitos autores preferem transformar os dados para ter mais preciso na anlise,
mas nesse caso o teste de correlao de Spearman j no possui validade, tendo que ser
aplicado o Teste de correlao de Pearson.

Exemplo:

Tabela 5. Correlao de Spearman entre as notas brutas de matemtica e biologia (Zar, 1999).
Estudante
Notas de
Matemtica
Rank de
X
i

Notas de
Biologia
Rank de
Y
i
di d
i
2
1 57 3 83 7 4 16
2 45 1 37 1 0 0
3 72 7 41 2 5 25
4 78 8 84 8 0 0
5 53 2 56 3 1 1
6 63 5 85 9 4 16
7 86 9 77 6 3 9
8 98 10 87 10 0 0
9 59 4 70 5 1 1
10 71 6 59 4 2 4
Total 72
n= 10; d
i
2=
72
( )
5636 , 0 4364 , 0 1
990
432
1
10 1000
432
1
10 10
72 6
1 r
3 s

=
Para verificar se h significncia na correlao

11.1.3 Aspectos Gerais da Correlao Linear
Os valores de r variam entre -1 (associao negativa completa) e +1 (associao
positiva completa). Quando um valor significativo, atravs do teste de t para r, apre-
sentado de forma negativa dizemos que a correlao negativa e significativa, caso o
valor seja positivo, dizemos que a correlao positiva e significativa.
Para melhor entender melhor a explanao anterior, deve-se ter em mente que a
varivel Y quem sofre variao em funo de X. Assim sendo, quando um valor
William Costa Rodrigues

P

g
i
n
a
4
2

negativo, quer dizer que com o aumento dos valores de X, Y diminuem e quando o va-
lor positivo, existe uma proporcionalidade direta entre as variveis, ou seja, quando
aumenta os valores de X aumenta os valores de Y (Figura 16).
0
0,5
1
1,5
2
2,5
3
0 20 40 60
A

0
0,5
1
1,5
2
2,5
3
0 20 40 60
B

Figura 16. Correlao linear simples positiva (A); e inversa ou negativa (B), apresentando a linha de ten-
dncia de regresso linear simples de dados fictcios.
A utilizao de um ou outro coeficiente depender da normalidade dos dados (veja o tpico Tes-
te de Normalidade dos Dados, p.30).

11.2 Coeficiente de Determinao (r)
Ao valor encontrado de r elevado ao quadrado (r) denomina-se coeficiente de
determinao.
Este coeficiente expressa a porcentagem de variao dos valores de Y em funo
do valor X. Por exemplo, o valor r encontrado em determinada anlise igual a 0,30.
Sendo r= 0,30, logo 30% da variao de Y so atribudas a X.

11.3 Coeficiente de Alienao (K)
Este coeficiente funo do coeficiente de correlao, expresso pela frmula:
2
r 1 K =
Este coeficiente exprime a ausncia de relao entre X e Y. Por exemplo, r=
0,30.
8367 , 0 K 70 , 0 K 30 , 0 1 K = = =
Desta forma, conclumos que h mais ausncia de relao do que intensidade de
relao entre X e Y.

11.4 Significncia do Teste de Correlao
Existem basicamente duas formas de verificar a significncia do var r, a mais
simples baseia-se simplesmente nos intervalos de valores de r, a outra considera o teste
t, conhecido como teste t para r.

11.4.1 Significncia Baseada nos Intervalos
A classificao simples e basea-se nas Tabelas 6 e 7, que acordo com a neces-
sidade de com uma maior preciso intervalar (Tabela 6) pode ser utilizada um ou outra
tabela.
Tabela 6. Classificao do valor r atravs de intervalos de 0 a 1.
Intervalo Significncia
0,0 0,20 Correlaes nulas
0,21 0,40 Correlaes fracas
0,41 0,70 Correlaes substncias
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
4
3

Intervalo Significncia
0,71 0,90 Correlaes fortes
0,91 1,0 Correlaes extremamente Fortes

Tabela 7. Classificao do valor r atravs de intervalos de acordo com e Teste de Rugg.
Intervalo Significncia
r < 0,15 r desprezvel
0,15 < r < 0,29 r baixo
0,30 < r < 0,49 r aprecivel
r >0,50 r acentuado

A significncia das tabelas acima poder ser utilizada tanto na correlao de Pearson, quanto
na de Spearmann.

11.4.2 Significncia Baseada no Teste t para r (Pearson)
O teste de t para r calculado atravs da seguinte equao:
2 n
r 1
r
t
2
r

=
Para este teste compara-se o valor de t
r
calculado com o valor de t, na Tabela 11
(p, 57), com n-2 graus de liberdade.

12 Anlise de Regresso
freqente o estudo da relao entre duas sries de variveis. Por exemplo, o
peso de crianas de acordo coma dieta oferecida em diferentes dosagens. Sabe-se que
determinadas dietas tm interferncia no ganho ou na reduo do peso de indivduos da
raa humana. Portanto h um interesse de expressar essa relao sob a forma matemti-
ca, atravs da apresentao de uma funo.
Para identificao de uma possvel correlao entre sries de variveis, torna-se
bastante eficaz a construo de um diagrama que se obtm em sistemas de eixos cartesi-
anos.
Hoje em dia os programas (softwares) de planilha de clculo e de estatstica,
fornecem a equao da reta ou de outro tipo de regresso que se queira plotar. Desta
forma, basta organizar os dado de forma correta e selecionar a criao de um grfico de
disperso, para verificar a com o prprio nome diz, a disperso dos dados de Y em fun-
o de X. A mostra como montar uma srie de dados para criao de um grfico de dis-
perso no Microsoft Excel.
Tabela 8. Srie de dados da correlao da flutuao populacional do pulgo Toxoptera aurantii (Homop-
tera, Aphididae) em funo da brotao foliar de tangerina cv Ponc, sob cultivo orgnico na Fazendinha
Agroecolgica, no perodo de outubro de 2002 e outubro de 2003 (Extrado de Rodrigues, 2004). Exem-
plo para o Microsoft Excel.
A B C D E F G H I J L M
1
2 0,00 20,00 40,00 40,00 60,00 0,00 30,00 50,00 100,00 100,00 100,00
3 T. a 0,00 5,00 7,50 2,50 2,50 0,00 2,50 10,00 12,50 25,00 60,00
4

Para criao do grfico de disperso basta selecionar os dados das linhas 2 e 3
(Tabela 1) e selecionar o menu Inserir Grfico e selecionar o grfico Disperso (XY)
William Costa Rodrigues

P

g
i
n
a
4
4

em seguida clique em Avanar > para configurar o grfico ou em Concluir para finali-
zar a criao. Aps criar o grfico selecione um dos pontos e em seguida clique no bo-
to direito de mouse e selecione a opo Adicionar linha de tendncia... Ser exibida
uma janela com mostra a Figura 17. O tipo de linha ser de acordo com a equao que
melhor de adeqei a distribuio dos dados, lembrando que um evento biolgico somen-
te poder ser explicado at uma equao de segundo grau, ou seja, caos opte por linha
do tipo polinomial a ordem para eventos biolgicos dever ser 2.
A exibio da equao e do valor de R feita atravs da seleo da Aba Op-
es, selecionando a caixa de seleo:
Exibir equao no grfico
Exibir valor de R-quadrado no grfico

Figura 17. Janela de configurao da linha de tendncia (linha de regresso) e configurao da equao de
regresso no Microsoft Excel.

12.1 Regresso Linear Simples
Neste tipo de regresso possvel verificar a associao entre as sries de dados,
plotar a linha e a equao da reta de duas variveis, X independente e Y dependente.
y = 0,3095x - 2,3472
R = 0,3984
-10
0
10
20
30
40
50
60
70
0 20 40 60 80 100 120
T. aurantii

Figura 18. Regresso linear simples entre a flutuao populacional de T. aurantii e a brotao foliar de
tangerina cv. Ponc, em cultivo orgnico de tangerina cv. Ponc, na Fazendinha Agroecolgica, no pero-
do de outubro de 2002 a outubro de 2003 (Adaptado de Rodrigues, 2004).
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
4
5


12.2 Regresso Linear Mltipla
Este tipo de regresso possibilita a associao de uma varivel dependentes (Z),
com duas variveis independentes (X e Y), neste caso uma das varveis independentes
(X) poder parcialmente interferir na outra varivel independente (Y). Como pode ser
visto na Figura 19.

Figura 19. Correlao mltipla da amplitude trmica (varivel x), brotao (varivel y) e a flutuao po-
pulacional de Toxoptera citricida (varivel z), em cultivo orgnico de tangerina cv. Ponc, na Fazendinha
Agroecolgica, no perodo de outubro de 2002 a outubro de 2003 (Adaptado de Rodrigues, 2004).

12.3 Regresso Mltipla
Neste tipo de regresso possvel verificar a associao entre as sries de dados,
plotar a linha de tendncia polinomial e a equao de segundo graus das duas variveis,
X independente e Y dependente.
y = 0,0046x
2
- 0,2141x + 7,1984
R
2
= 0,4695
0
10
20
30
40
50
60
70
0 20 40 60 80 100 120
T. aurantii

Figura 20. Regresso mltipla entre a flutuao populacional de T. aurantii e a brotao foliar de tangeri-
na cv. Ponc, em cultivo orgnico de tangerina cv. Ponc, na Fazendinha Agroecolgica, no perodo de
outubro de 2002 a outubro de 2003 (Adaptado de Rodrigues, 2004).

William Costa Rodrigues

P

g
i
n
a
4
6

13 Transformao de Dados
Para uma aplicao vlida dos testes de significncia, baseados nas propriedades
das curva normal, necessrio que o dados tenham uma distribuio normal (Figura 12,
Figura 13 e Figura 14). As porcentagens, as contagens e as notas dadas a certas caracte-
rsticas qualitativas, exigem quase sempre essa transformao.
Vamos apresentar nesta apostila algumas das principais transformaes de dados
empregadas na normalizao dos dados e as situaes que cada uma se aplica.

13.1 Raiz Quadrada
Essa transformao utilizada quando a varincia e proporcional a mdia, ou
seja, quando h uma reduo dos valores de mdia e varincia diminui simultaneamen-
te. freqentemente utilizado em dados biolgicos quando amostras so tiradas da dis-
tribuio de Poisson (isto , quando os dados consistem em ocorrncias aleatrias de
objetos ou eventos). Transformando os dados utilizando suas razes quadradas resulta
em uma amostra cuja distribuio normal. As equaes normalmente utilizadas so:
x ' x ou 1 x ' x ou 5 , 0 x ' x = + = + = , sendo a primeira mais utilizada.
Os dados que se recomenda utilizar este tipo de transformao so dados de per-
centagens e contagens (nmeros inteiros).

13.2 Transformao Logartimica
Este transformao utilizada principalmente quando as mdias e os desvios
padres (erros) tendem a serem proporcionais, sendo, nesse caso, os coeficientes de
variao aproximadamente iguais. utilizada, ainda, quando os dados so representados
por nmeros positivos, ou porcentagens que abrangem uma grande amplitude de varia-
o. Quando aparece o valor zero, utiliza-se a transformao x' = log (x+1). A base 10
para os logaritmos utilizada normalmente, por convenincia, porm qualquer outra
base poder ser utilizada, desde que, seja especificada.

13.3 Transformao Angular (Arcoseno)
Essa transformao utilizada quando os dados esto associados a uma distribu-
io binomial (presena-ausncia), como muitas vezes que um determinado carter apa-
rece num total definido. o caso, por exemplo, do nmero de plantas sobreviventes em
relao ao nmero total de plantas que deveriam estar presentes se nenhuma tivesse
morrido aps a poluio de um determinado solo. Os dados so transformados em per-
centagens e, em seguida, so calculados os valores atravs da frmula % arcsen ' p = ,
utilizando-se uma tabela apropriada. Nesse tipo de transformao, todos os dados deve-
riam estar baseados em um nmero de observaes iguais, mas o mtodo pode tambm
ser utilizado quando esse nmero no rigorosamente igual sugerido na literatura que
valores de 0 e 100%, sejam substitudos por n e 100- n, respectivamente, antes de
entrar na tabela.

13.4 Consideraes Gerais
Quando utilizada uma transformao de dados, todas as comparaes entre
mdias so realizadas na escala transformada. Quando se achar prefervel no se apre-
sentar os resultados na escala transformada, os dados finais devem ser transformados
novamente para escala original. Por exemplo, elevar ao quadrado os valore submetido
transformao de raiz quadrada.

Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
4
7

14 Testes Especficos Para Anlise de Populaes e Comunidades
14.1 ndice de Diversidade e Dominncia Populacional
Existe uma srie de ndice de diversidade, que podem ser utilizados em diversas
situaes.
A medida mais simples de diversidade de espcie o nmero de espcie (s), ou a
riqueza de espcie. Vrios ndices de diversidade foram propostos que incorporam am-
bos S e N, o nmero total de indivduos em todas as espcies (Brower et al. 1997).
Quando o ndice de diversidade diminui, indica que h competio interespecfi-
ca e que o local menos diversificado, tendendo a dominncia de uma determinada es-
pcie, porm quando h um aumento deste ndice, h um indicativo de que o local
bastante diversificado, mesmo que o nmero de indivduos seja reduzido.

14.1.1 ndice de Margalef ()
Este ndice foi proposto por Margalef (1951) e tem como objetivo estimar o n-
mero de espcies e o nmero de indivduos de uma comunidade.
Este ndice dado pela frmula abaixo:
N log
1
=
S

Onde: S: Nmero de espcies levantadas; N: Nmero de indivduos total

14.1.2 ndice de Glason (D
g
)
semelhante ao ndice anterior, porm considera todas as espcies da amostra.
N log
S
D
g
=
Onde: S = Nmero de espcies levantadas e N = Nmero de indivduos total

14.1.3 ndice de Menhinick (D
m
)
Este ndice semelhante aos dois anteriores, entretanto utiliza a raiz quadrada do
nmero de indivduos total de cada amostra, numa tentativa de normalizar os dados.
N
S
D
b
=
Onde: S = Nmero de espcies levantadas e N = Nmero de indivduos total

14.1.4 ndice de Shanon-Wiener (H')
considerado o ndice de diversidade mais completo, pois alm de considerar o
nmero de espcies, considera a proporo de cada espcie em relao ao todo. Norma-
lizando os dados e diminuindo a probabilidade de erro dos clculos.

=
i' i
p log p - ' H
Onde: p = proporo da espcie em relao ao nmero total de indivduos

14.1.5 ndice de Dominncia Berger-Parker (d)
Este ndice estima a dominncia dentro de uma comunidade, ou seja, verifica se
h ou no dominncia de uma determinada espcie numa comunidade.
total
Max
N
N
= d
William Costa Rodrigues

P

g
i
n
a
4
8

Onde: N
Max
= o nmero de indivduos da espcie mais abundante e N
Total
= total de
indivduos amostrados.

14.2 Exemplo
O exemplo hipottico abaixo da diversidade de cochonilhas em agroecossistema
ctrico ilustra os ndices de diversidade das cochonilhas de um pomar de citros.

Tabela 9. ndices de diversidade de cochonilhas em agroecossiema ctrico.
Perodo S N D
g
D
m

1994 10 268 1,609 4,118 0,611
1995 10 235 1,648 4,218 0,652
1996 10 323 1,557 3,985 0,556
1997 10 435 1,481 3,790 0,479
Mdia 10 315 1,574 4,045 0,575

14.3 ndice de Similaridade entre Populaes

14.3.1 Quociente de Similaridade
O objetivo deste quociente verificar a similaridade entre duas comunidades ou
habitat, no que se refere a composio especfica (espcies). Existem duas frmulas para
calcular o QS propostas por Jaccard (1912) e Sorensen (1948), que so as seguintes:
Jaccard
( ) j b a
j
QS
+
=

Sorensen
( ) b a
j
QS
+
=
2

Onde: a = Nmero de espcies presente no habitat ou comunidade A, ou nmero de le-
vantamentos com a espcie a; b = Nmero de espcies presente no habitat ou comuni-
dade B; ou nmero de levantamentos com a espcie b e j = Nmero de espcies presen-
te nos dois habitats ou comunidades ou nmero de levantamentos contendo, simultane-
amente, as duas espcies.

14.3.2 Porcentagem de Similaridade
Expressa os resultados semelhantes ao do Quociente de Similaridade, porm
leva em conta no somente a composio das espcies, como tambm o nmero de in-
divduos, pois se calcula pelo somatrio dos menores valores das percentagens observa-
das de cada espcies em relao ao total de indivduos, nas duas comunidades (South-
wood, 1971).

( )

+ + + + = n % ... c % b % a % %S
Onde: % a = menor porcentagem da espcie a observada no confronto das comunida-
des; % b = idem, para espcies b; % c = idem, para espcies c e % n = idem, para esp-
cies n.
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
4
9


Tabela 10. Duas comunidades com sua composio de espcies em percentagem
Comunidade
Espcies
A b c d
A 15 35 27 23
B 33 14 36 17

A partir dos dados daTabela 10, podemos calcular a %S:
( ) % 73 % 17 27 14 15 % = + + + = S S

14.3.3 ndice de Afinidade
Este ndice estima a freqncia com que duas espcies ocorrem simultaneamente
em determinada comunidade ou habitat. Foi proposto por FAGER (1957).
dado pela frmula:
B A
AB
n n
j
I
+
=
2

Onde: n
A
= Nmero de ocorrncia da espcie A; n
B
= Nmero de ocorrncia da espcie
B e j = Nmero de ocorrncia conjunta das espcies A e B;

Os valores mnimos de j significativos a 0,5% de probabilidade so dados na
Tabela 15, p. 59.

14.3.4 Constncia
Este parmetro indica a percentagem de uma determinada espcie em relao a
todos os levantamentos realizados.
dado pela frmula:
N
n
C
100
=
Onde: n = Nmero de coletas contendo a espcies em estudo e N = Nmero total de
coletas realizadas.
A Constncia de uma espcie poder ser classificada da seguinte forma:
a) Espcies constantes presentes em mais de 50% dos levantamentos;
b) Espcies acessrias presentes entre 2550% dos levantamentos;
c) Espcies Acidentais Presentes em menos de 25% dos levantamentos.

14.3.5 ndice de Associao (IA)
Verifica o ndice de o nvel de associao existente entre duas espcies, baseia-
se no total do nmero de indivduos de ambas as espcies que ocorrem simultaneamente
nos levantamentos realizados.
5 , 0
+
=
B A
J
IA
Onde: A = Nmero total de indivduos da espcie A coletados ou amostrados em todos
os levantamentos; B = Idem, para espcies B e J = Nmero de indivduos da espcie A e
B nos levantamentos em que ocorrem simultaneamente.
A significncia de j pode ser observada atravs da Tabela 15, p. 59.

William Costa Rodrigues

P

g
i
n
a
5
0

15 Lista de Exerccios
1. Qual a diferena bsica entre ensaio e experimento?

2. Qual a ligao entre a varivel independente e a dependente?

3. Para as seguintes situaes abaixo elabora a hiptese estatstica (hiptese nula).
a. Um experimento pretende testar cinco cultivares de leguminosas para verificar a e-
ficincia na fixao de nitrognio no solo
b. Para avaliar a contaminao de crrego foram utilizados seis mtodos, para saber
qual o mais eficiente.
c. Para avaliar a incidncia de mosquitos transmissor da dengue (Aedes aegipty), fo-
ram aplicados dois mtodos para contagem de nmero de larvas.
d. Foi selecionada uma populao de moradores de um bairro para saber a opinio de-
les sobre o impacto ambiental da regio.
e. Foram selecionados moradores da margem de um crrego, para verificar a incidn-
cia de doenas infecciosas, provocadas por contaminao da gua consumida.
f. Um pesquisador quer saber qual o dimetro mdio de rvores de uma determinada
espcie, que crescem numa floresta.
g. Num solo rico em bactrias fixadoras de nitrognio, um pesquisador quer saber a
taxa de crescimento mdio desta populao.

4. Quanto aos tipos de dados indique os tipos correspondentes, se categorizados, discretos ou
contnuos.
a. Nmero de livros que possuo: _________________
b. Altura da instante da biblioteca: _________________
c. Distncia Paracambi-Rio de Janeiro: _________________
d. Quantas turmas tm no curso de Gesto Ambiental: _________________
e. Quantas rvores tm no horto florestal: _________________
f. Qual altura mdia de plantas: _________________

5. Qual o princpio bsico da experimentao?

6. Exemplifique erro por
a. Falta de resposta
b. Do observador
c. Do mtodo de amostra

7. Exemplifique amostra dos tipos estratificada e amostra selecionada.

8. Diferencie amostras com dados pareados e no-pareados.

9. Qual a diferena de amostra homocedsticas e heterocedsticas?

10. Quais os elementos necessrios para a utilizao de um teste estatstico.

11. Voc foi convidado para realizar um estudo numa populao de mamferos que continha
48.000 indivduos, para saber a incidncia de uma determinada enfermidade. Sabe-se que o
valor de ocorrncia anterior foi de 15%, o nvel de confiana igual a 95% (=5%). Para
esta pesquisa foi estabelecido um erro de 5%. Pergunta-se qual o nmero mnimo que a a-
mostra desta populao deve conter para que possamos confiar nos dados obtidos no estudo
a ser realizado?

12. Para realizar um estudo sobre nvel de escolaridade de pessoas de uma determinada cidade,
realizou-se um estudo bibliogrfico. Foi verificado que em estudo prvio a taxa de analfabe-
tismo foi de 15%. O nvel de confiana para realizar o estudo de 1,96% e a o erro atribu-
do ao estudo de 2%. Sabe-se ainda que a populao da cidade de 45.560 pessoas.
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
5
1


13. No conjunto de dados abaixo, calcule a mdia aritmtica simples e a mediana.
23, 12, 34, 54, 32, 33, 21, 23, 27, 49, 39, 34, 32, 21, 28, 17, 23, 34, 45, 32, 39 e 56

14. Numa escola temos crianas divididas em classe por idade, para verificar o ndice de desnu-
trio. Em um determinado estudo contabilizou-se a freqncia destas, conforme tabela a-
baixo. Qual a hiptese estatstica? Qual a mdia de caso de desnutrio.
Idade (anos) Freqncia (f)
5 58
6 21
7 32
8 25
9 25
10 08

15. Numa escola temos crianas divididas em classe por idade, para verificar o ndice de desnu-
trio. Em um determinado estudo contabilizou-se a freqncia destas, conforme tabela a-
baixo. Qual a hiptese estatstica? Qual a mdia de caso de desnutrio.
Idade (anos) Freqncia (f)
1 |4 32
4 |7 25
7 |-9 62
9 |-13 25

16. Qual a mdia ponderada para os dados apresentados na tabela abaixo.
Idade (anos) Freqncia (f)
1 21
2 21
3 45
4 25
5 63
6 38
7 29
8 14
9 19
10 28
11 25
12 26
13 14
14 25
15 37

17. Em determinada localidade foram selecionadas 12 escolas, determine a mediana referente
ao nmero de alunos das escolas a partir dos dados apresentados no seguinte quadro:
Escola N de alunos
A 125
B 138
C 235
D 1.250
E 1.365
F 568
G 250
H 165
I 432
J 560
L 321
M 285

William Costa Rodrigues

P

g
i
n
a
5
2

18. Observando o conjunto de dados na tabela abaixo, pede para se calcular a media e o desvio
padro, erro-padro da mdia e o coeficiente de variao.
x f fx
2 5
3 28
4 45
5 46
6 27

19. Aps a coleta de dados a respeito do nmero sementes produzidos por uma determinada
essncia florestas. Tornou necessrio determinar a mdia, o desvio padro a varincia do e o
erro padro da mdia do nmero de sementes produzida pelas plantas amostradas. Os dados
seguem no quadro abaixo:
Planta N sementes Planta N sementes Planta N sementes
A 125 C 210 E 152
B 232 D 131 F 98

20. Um pesquisador realizou um estudo sobre amostra de gua em dois crregos, para medir a
contaminao por tetracloreto de carbono (CCl4). Aps a coleta os dados o pesquisador
construiu a tabela abaixo.

Repetio Amostra A Amostra B
1 56 12
2 43 23
3 23 65
4 45 43
5 67 43
6 34 23
7 32 19
8 34 22
9 56 16
10 32 -
11 24 -
A partir dos dados acima o pesquisador necessita realizar uma anlise estatstica para testar a
hiptese nula. Desta forma, pede-se para calcular o Coeficiente de variao, Desvio Padro,
Varincia, aplique o teste estatstico pertinente e conclua com base nos resultados.

21. Para verificar a eficincia da adubao nitrogenada, no crescimento de leguminosas, foi
realizado um experimento com dois tratamentos (dados na tabela abaixo). Verifique se h
diferena estatstica entre os tratamentos.
Repetio Tratamento A (cm) Tratamento B (cm)
1 56 34
2 45 23
3 65 39
4 47 27
5 38 18
6 59 43
7 63 23
8 49 22
9 56 21
10 34 23

Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
5
3


22. Num experimento para comparar a o peso mdio entre duas raas de porco (Duroc e Lan-
drace). Um pesquisador fez a mensurao de 26 animais para cada raa, onde obteve os da-
dos conforme a tabela abaixo:
Duroc Landrace
x
= 38 kg
x
= 33,5 kg
S1 = 5 kg S2 = 6 kg
n1 = 26 n2 = 26
Pede-se para verificar se h diferena estatstica entre os tratamentos e concluir baseado nos
resultados encontrados.

23. Um pesquisador resolve medir o nvel de poluio em uma comunidade prxima a uma
indstria. Os mtodos escolhidos foram amostrar solo e gua, j que a comunidade ribei-
rinha. A partir do conjunto de dados abaixo, calcule a mdia, o desvio padro e a varincia,
comparando os dois tipos de amostras e concluindo sobre as diferenas.
Nvel de metal pesado a partir da amostra de solo e gua numa comunidade prxima a uma indstria.
Amostra de Solo Amostra de gua
Amostra Metal pesado (mg) Amostra Metal pesado (mg)
1 250 1 198
2 273 2 215
3 185 3 236
4 192 4 176
5 132 5 321
6 224 6 245
7 125 7 268
8 321 8 301

24. Em testes de contaminao de solo, foi verificado que duas reas estavam com ndices de
poluente acima do permitido. Para se fazer uma anlise mais crtica os dados so apresenta-
dos abaixo. Desta forma, qual das duas reas apresenta maior poluio? E qual a hiptese
nula para a questo.
rea A rea B
xA
= 195,3 mg
xB =198,7 mg
S
2
A =351 S
2
B =75
nA = 35 nB = 28

25. Num experimento para verificar entre a diferena de duas amostras que no possuem dis-
tribuio normal. Os dados se referentes ao nmero de pessoas sadias e infectadas por den-
gue, dividido por faixa etria.
Faixa Etria (anos)
Pessoas

Com Dengue Sem Dengue
10-15 10 25 35
16-25 15 40 55
26-40 22 56 78
47 121 168


William Costa Rodrigues

P

g
i
n
a
5
4

16 Bibliografia

Arango, H.G. 2001. Bioestatstica Terica e Computacional. Rio de Janeiro: Guanabara
Koogan, 235p.
Beiguelman, B. 2002. Curso prtico de bioestatstica. Ribeiro Preto: FUNPEC, 5 Ed.,
272p.
Berger, W.H. & Parker, F.L. 1970. Diversity of Planktonic Foraminifera in Deep-Sea
sediments. Science, 168: 1345-1347.
Brower, J.E.; Zar, J.H. & von Ende, C.N. 1998. Field and Laboratory Methods for
General Ecology. Quebecor: MC Graw Hill, 4
th
ed., 273p and software included.
Carvalho, S. & Campos, W. 2008. Estatstica simplificada. Rio de Janeiro: Elsevier.
608p.
Centeno, A.J. 2002. Curso de Estatstica Aplicada Biologia. Goinia (Coleo Didti-
ca, 3): Ed. Da UFG, 2 ed., 2 reimpr. 234p.
Clark, L.R.; Geier, P.W.; Hughes, R.D. & Morris, R.F. 1967. The Ecology of insect
Populations in Theory and Practice. Methuen & Co., London. 232p.
Dauber, J.; Hirsch. M.; Simmering, D.; Waldhardt, R.; Otte A. & Wolters, V.
2003. Landscape structure as an indicator of biodiversity: matrix effects on species
richness. Agriculture, Ecosystems and Environment, 98: 321-329.
Fager, E.W. 1957. Determination and analysis of recurrent groups. Ecology, 38:586-
595.
Gomes, F.P. 1990. Curso de Estatstica Experimental, Piracicaba: Nobel, 13 ed (revista
e ampliada), 467p.
Jaccard, P. 1912. The distribution of the flora in the alpine zone, NeroPhytal. 11:37-50.
Lara, F.M. 1992. Princpios de Entomologia. Ed. cone, 3 ed. 331 p.
Laroca, S. 1995. Ecologia: princpios e mtodos: Petrpolis: Vozes, 197p.
Levine, D.M.; Berenson, M.L & Stephan, D. 2000. Estatstica: teoria e Aplicaes
usando Microsoft Excel em portugus. Souza, T.C.P (Trad.). Rio de Janeiro:
LTC. 811p.
Lewinsohn, T.M & Prado, P. I. K.L. 1997.O uso de anlise multivariadas ecolgicas
em estudos ambientais interdisciplinares. Caderno V, Campinas: UNICAMP, 43p.
Magnusson, W. E. & Mouro, G. 2003. Estatstica [Sem] Matemtica: A ligao entre
as questes e a anlise. Londrina: Planta. 126p.
Mulekar, M.S. & Mishra, S.T. 2000. Confidence interval estimation of overlap: equal
means case. Computational Statistics & Data Analysis, 34: 121-137.
Rey, L. 2000. Planejar e redigir trabalhos cientficos, So Paulo: Edgard Blcher, 2 ed.
(revista e ampliada), 318p.
Rodrigues, P.C. 2002. Bioestatstica. Niteri: EdUFF. 3 ed. 339p.
Rodrigues, W.C. 2004. Hompteros (Homoptera: Sternorrhyncha) associados tange-
rina cv. Ponc (Citrus reticulata Blanco) em cultivo orgnico e a interao com
predadores e formigas. Seropdica, UFRuralRJ. 63f. Tese de Doutorado.
Siegel, S. 1979. Estatstica no paramtrica. So Paulo: MC Graw Hill do Brasil. 169p.
Silveira Neto, S.; Nakano, O; Barbin, D. & Villa Nova, N. A. 1976. Manual de Eco-
logia de Insetos. Ed. Agronmica Ceres, 419 p.
Sorensen, T. 1948. A method of establishing groups of equal amplitude in plant sociol-
ogy basead an similarity of species. Biol. Skr. 5:1-34
Southwood, T.R.E. 1971. Ecological Methods. Chapman and Hall Ltd., 391p.
Vanzolini, P.E.1993. Mtodos estatsticos elementares em sistemtica zoolgica. So
Paulo, Huirtec. 130p.
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
5
5

Zar. J.H. 1999. Biostatistical Analysis. New Jersey: Prentice Hall. 4
th
ed., 663p and
index included.
William Costa Rodrigues

P

g
i
n
a
5
6

17 Anexos
2 Tratamentos > 2 Tratamentos
ANOVA
Teste F
Dados no
Pareados
Dados Pareados
Teste T
Varincias iguais
(Homocedsticas)
S
2
Maior
S
2
Menor 4
S
2
Maior
S
2
Menor < 4
Varincias desiguais
(Heterocedsticas)
Calcula Varincia
Ponderada
Calcula Valor T
Conclui
textualmente
Compara com T
tabelado ( =5%)
Se Tcalc Ttab
Rejeita H0
Coloca *
Se Tcalc < Ttab
Aceita H0
Coloca
ns
Compara com T
tabelado ( =1%)
Se Tcalc Ttab
Coloca **
Se Tcalc < Ttab
Mantm*
2 Tratamentos
Dados Numricos
divididos em
Categorias
Teste
2
(Qui-Quadrado)
Calcula Valor
2
Compara com
valor
2
Tabelado
( = 5%)
No dividido em
blocos
(Amostras
compostas)
Dividido em Bloco
Teste de Kruskal-
Wallis
Teste de Friedman
Calcula Valor H Calcula Valor
2
r
Dados com Distribuio No Normal Dados com Distribuio Normal
No ser
abordado
Se
2
calc <
2
tab
Aceita H0
Coloca
ns
Se
2
calc
2
tab
Rejeita H0
Coloca *
Compara com
2
tabelado ( =1%)
Se
2
calc
2
tab
Coloca **
Se
2
calc <
2
tab
Mantm*

Figura 21. Fluxograma Para Auxiliar na Escolha de Testes Estatsticos
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
5
7

Tabela 11. Valores de t -student em nveis de 5% e 1% (=0,05 a 0,01) de probabilidade
3
.
Grau de liberdade 5% ( =0,05) 1% ( =0,01)
1 12,71 63,66
2 4,30 9,92
3 3,18 5,84
4 2,78 4,60
5 2,57 4,03
6 2,45 3,71
7 2,36 3,50
8 2,31 3,36
9 2,26 3,25
10 2,23 3,17
11 2,20 3,11
12 2,18 3,06
13 2,16 3,01
14 2,14 2,98
15 2,13 2,95
16 2,12 2,92
17 2,11 2,90
18 2,10 2,88
19 2,09 2,86
20 2,09 2,84
25 2,06 2,79
30 2,04 2,75
50 2,01 2,68
100 1,98 2,63
500 1,96 2,59
1,96 2,58


3
A tabela completa poder ser encontrada em Gomes (1990) e Levine et al. (1998).
William Costa Rodrigues

P

g
i
n
a
5
8

Tabela 12. Valores de (Qui-quadrado) em nveis de 5% e 1% (=0,05 a 0,01) de probabilidade
4
.
Grau de Liberdade 5% ( =0,05) 1% ( =0,01)
1 3,84 6,64
2 5,99 9,21
3 7,82 11,34
4 9,49 13,28
5 11,07 15,09
6 12,59 16,81
7 14,07 18,48
8 15,51 20,09
9 16,92 21,67
10 18,31 23,21
11 19,68 24,72
12 21,03 26,22
13 22,36 27,69
14 23,68 29,14
15 25,00 30,58
16 26,30 32,00
17 27,59 33,41
18 28,87 34,80
19 30,14 36,19
20 31,41 37,57
21 32,67 38,98
22 33,92 40,29
23 35,17 41,64
24 36,42 42,98
25 37,65 44,31
26 38,88 45,64
27 40,11 46,96
28 41,34 48,28
29 42,30 49,60
30 43,77 50,89
31 44,99 48,23
32 46,19 49,49
33 47,40 54,78
34 48,60 56,06
35 49,80 57,34
36 50,99 58,62
37 52,19 59,89
38 53,38 61,16
39 54,57 62,43
40 55,76 63,69


4
A tabela completa poder ser encontrada em Gomes (1990) e Levine et al. (1998).
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
5
9

Tabela 13. Valores crticos para o Coeficiente de Correlao de Spearman (r
s
)
5

n (2) 0,50 0,10 0,05 0,01
4 0,600 1,000
5 0,500 0,900 1,000
6 0,371 0,829 0,886 1,000
7 0,321 0,714 0,786 0,929
8 0,310 0,643 0,738 0,881
9 0,267 0,600 0,700 0,833
10 0,248 0,564 0,648 0,794
11 0,236 0,536 0,618 0,755
12 0,217 0,503 0,587 0,727
13 0,209 0,484 0,560 0,703
14 0,200 0,464 0,538 0,679
15 0,189 0,446 0,521 0,654
16 0,182 0,429 0,503 0,635
17 0,176 0,414 0,485 0,615
18 0,170 0,401 0,472 0,600
19 0,165 0,391 0,460 0,584
20 0,161 0,380 0,447 0,570
21 0,156 0,370 0,435 0,556
22 0,152 0,361 0,425 0,544
23 0,148 0,353 0,415 0,532
24 0,144 0,344 0,406 0,521
25 0,142 0,337 0,398 0,511
30 0,128 0,306 0,362 0,467
35 0,118 0,283 0,335 0,433
40 0,110 0,264 0,313 0,405
45 0,103 0,248 0,294 0,382
50 0,097 0,235 0,279 0,363
55 0,093 0,224 0,266 0,346
60 0,089 0,214 0,255 0,331
65 0,085 0,206 0,244 0,318
70 0,082 0,198 0,235 0,307
75 0,079 0,191 0,227 0,297
80 0,076 0,185 0,220 0,287
85 0,074 0,180 0,213 0,279
90 0,072 0,174 0,207 0,271
95 0,070 0,170 0,202 0,264
100 0,068 0,165 0,197 0,257


5
A tabela completa poder ser consultada em Zar (1999).
William Costa Rodrigues

P

g
i
n
a
6
0

Tabela 14. Valores para transformao % arcsen
6

% 0 % 0 % 0 % 0
0,0 0 21 27,28 51 45,57 81 64,16
0,1 1,81 22 27,97 52 46,15- 82 64,90
0,2 2,56 23 28,66 53 46,72 83 65,65
0,3 3,14 24 29,33 54 47,29 84 66,42
0,4 3,63 25 30,00 55 47,87 85 67,21
0,5 4,05+ 26 30,66 56 48,45- 86 68,03
0,6 4,44 27 31,31 57 49,02 87 68,87
0,7 4,80 28 31,95- 58 49,60 88 69,73
0,8 5,13 29 32,58 59 50,18 89 70,63
0,9 5,44 30 32,21 60 50,77 90 71,56
1 5,74 31 33,83 61 51,35+ 91 72,54
2 8,13 32 34,45- 62 51,94 92 73,57
3 9,98 33 35,06 63 52,53 93 74,66
4 11,54 34 35,67 64 53,13 94 75,82
5 12,92 35 36,27 65 53,73 95 77,08
6 14,18 36 36,87 66 54,33 96 78,45
7 15,34 37 37,47 67 54,94 97 80,02
8 16,43 38 38,06 68 55,55+ 98 81,87
9 17,46 39 38,65- 69 56,17 99,0 84,26
10 18,44 40 39,23 70 56,79 99,1 84,56
11 19,37 41 39,82 71 57,42 99,2 84,87
12 20,27 42 40,40 72 58,05+ 99,3 85,20
13 21,13 43 40,98 73 58,69 99,4 85,56
14 21,97 44 41,55+ 74 59,34 99,5 85,95-
15 22,79 45 42,13 75 60,00 99,6 86,37
16 23,58 46 42,71 76 60,67 99,7 86,86
17 24,35+ 47 43,28 77 61,34 99,8 87,44
18 25,10 48 43,85 78 62,03 99,9 88,19
19 25,84 49 44,43 79 62,72 100,0 90,00
20 26,56 50 45,00 80 63,44 - -
Os sinais (+) e (-), seguindo ngulos terminados em 5, so orientaes para arredondamento a uma deci-
mal.


6
A tabela completa poder ser consultada em Zar (1999).
Apostila de Estatstica Aplicada - 2010

P

g
i
n
a
6
1

Tabela 15. Valores mnimos de j, significativos a 0,5% (Southwood, 1971).
n
A
n
B
/n
a
1,0 1,5 2,0
5 5 5
6 5 6 6
7 6 7 7
8 7 8 8
9 7 8 9
10 8 9 10
20 14 16 17
30 19 22 24
40 25 29 32
50 29 35 39
60 36 42 46
70 41 48 53
80 46 55 59
90 52 61 67
100 57 67 74
William Costa Rodrigues

P

g
i
n
a
6
2

*************
O minuto que voc est vivendo agora o mais importante de sua vida, onde quer que
voc esteja.
Preste ateno ao que est fazendo.
O ontem j lhe fugiu das mos.
O amanh ainda no chegou.
Viva o momento presente, porque dele depende todo o seu futuro.
Procure aproveitar ao mximo o momento que est vivendo, tirando todas as vantagens
que puder, para seu aperfeioamento.
C. Torres Pastorinho
Minutos da Sabedoria, p. 154
*************