Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatistica - Aplicada Ed 2010 PDF
Estatistica - Aplicada Ed 2010 PDF
Revisada e Ampliada
Com listas de Exercícios
O Autor:
William Costa Rodrigues é Agrônomo, Doutor em Agronomia (Fito-
tecnia) e Pós-Doutor em Entomologia, pela Univ. Federal Rural do
Rio de Janeiro. Prof. da Universidade Severino Sombra e no Instituto
Superior de Tecnologia de Paracambi/ FAETEC-RJ, ministra aulas de
Ecologia1, Toxicologia1, Climatologia1, Estudos de Impacto Ambien-
tal1, Estatística Aplicada2 e Auditoria Certificação Ambiental2, na gra-
duação e de Estatística Ambiental1 e Biondicadores Ambientais1 na
especialização de Planejamento e Gestão Ambiental1, onde também é
Supervisor Pedagógico. Atua como desenvolvedor de softwares agrí-
colas e Científicos. Coordenador Geral do projeto Entomologistas do
Brasil (www.ebras.bio.br) e Editor-Chefe do Periódico Online En-
tomoBrasilis (www.periodico.ebras.bio.br). Coordenador e autor de
capítulos no livro Citricultura Fluminense: Principais pragas e
seus inimigos naturais. Trabalha ativamente com análise estatística
em projetos na área agrícola e ambiental. O autor poderá ser contatado
através do e-mail: wcostarodrigues@yahoo.com.br. Para maiores
informações acesse o currículo Lattes do autor no seguinte endereço:
http://lattes.cnpq.br/9873385223698434.
Esta Obra:
A apostila Estatística Ambiental foi inicialmente utilizada no progra-
ma de Pós-Graduação Lato Sensu, Planejamento e Gestão Ambiental e
no Curso de graduação em Gestão Ambiental, na disciplina Estatística
Aplicada, tendo como objetivo informar o discente sobre os princípios
básicos da estatística, relacionando-a com a metodologia científica,
possibilitando um entendimento básico sobre o assunto. Hoje a aposti-
la é também utilizada em cursos de graduação e desde 2009 mudou o
título para Estatística Aplicada.
Copyright©2003-
Copyright©2003-2010
2010,
10, W.C. Rodrigues
1
Disciplina Ministrada na Universidade Severino Sombra
2
Disciplina Ministrada no Instituto Superior de Tecnologia em Paracambi, RJ- Curso de Gestão Ambiental
Sumário
1 Introdução ................................................................................................................. 1
1.1 Crescimento e Desenvolvimento da Estatística Moderna ................................ 1
1.2 Variação ao Acaso ............................................................................................ 1
2 Ensaio x Experimentação ......................................................................................... 2
3 Conceitos Estatísticos ............................................................................................... 2
3.1 Estatística Descritiva ........................................................................................ 2
3.2 Inferência Estatística......................................................................................... 2
3.3 Tipos de Dados ................................................................................................. 3
3.3.1 Variáveis Aleatórias Categorizadas .............................................................. 3
3.3.2 Variáveis Aleatórias Numéricas ................................................................... 3
4 Por que Utilizar a Estatística .................................................................................... 4
5 Planejamento Experimental ...................................................................................... 4
5.1 Fases do Planejamento ..................................................................................... 4
5.1.1 Problema ....................................................................................................... 5
5.1.2 Informações Existentes ................................................................................. 5
5.1.3 Noções Gerais Sobre Hipótese ..................................................................... 5
5.1.4 Formulação das Hipóteses ............................................................................ 6
5.1.4.1 Elaborando as hipóteses........................................................................ 6
5.1.4.2 Hipótese Estatística x Hipótese Científica ........................................... 6
5.1.5 Testando as Hipóteses .................................................................................. 6
5.1.6 Riscos na Tomada de Decisão Através Teste de Hipóteses ......................... 6
5.1.7 Aleatorização ................................................................................................ 7
5.2 Erros de Observações ....................................................................................... 7
5.2.1 Erros do Observador ..................................................................................... 7
5.2.2 Erro do Método de Observação .................................................................... 7
5.2.3 Por Falta de Resposta ................................................................................... 8
5.3 Controle dos Erros nas Observações ................................................................ 8
5.4 Métodos de Coleta de Dados ............................................................................ 8
5.4.1 Fontes Primárias ........................................................................................... 8
5.4.2 Fontes Secundárias ....................................................................................... 8
5.5 Pesquisa Observacional .................................................................................... 9
5.6 Pesquisa Experimental...................................................................................... 9
5.6.1 Princípios da Experimentação .................................................................... 10
5.7 Tipos de Amostras .......................................................................................... 10
5.7.1 Amostras Simples ao Acaso ....................................................................... 10
5.7.2 Amostra Estratificada ................................................................................. 11
5.7.3 Amostra Sistemática ................................................................................... 11
5.7.4 Amostra por Área ....................................................................................... 11
5.7.5 Amostra por Conglomeradas ...................................................................... 11
5.7.6 Amostra Selecionada .................................................................................. 11
5.8 Determinação do Tamanho da Amostra ......................................................... 12
5.8.1 Tamanho da Amostra para Dados Discretos .............................................. 12
5.8.2 Tamanho da Amostra para Dados Contínuos ............................................. 13
6 Tabela ..................................................................................................................... 14
6.1 Elementos Fundamentais de uma Tabela Estatística ...................................... 14
6.2 Elementos Complementares de uma Tabela Estatística ................................. 14
6.3 Observações para a Construção de Tabelas Estatísticas ................................. 15
6.4 Sinais Convencionais Utilizados em Tabela Estatística ................................. 15
6.5 Tipo de Tabela ................................................................................................ 15
6.5.1 Tabela Simples (Unidimensional) .............................................................. 15
6.5.2 Tabela de Dupla Entrada ou Cruzada (Bidimensional) .............................. 16
7 Representação Gráfica dos Dados Estatísticos ....................................................... 16
7.1 Gráficos de Colunas ....................................................................................... 16
7.2 Gráficos em Barras ......................................................................................... 17
7.3 Gráficos de Linhas .......................................................................................... 18
7.4 Gráficos de Pizza ............................................................................................ 18
7.5 Gráficos Compostos ....................................................................................... 19
8 Probabilidade Estatística......................................................................................... 19
8.1 Regras para Combinar Probabilidade ............................................................. 21
8.2 Probabilidade Condicionada ........................................................................... 22
9 Técnicas Estatísticas Para Análise de dados .......................................................... 22
9.1 Medidas de Tendência Central ....................................................................... 22
9.1.1 Média Aritmética Simples ( X ) .................................................................. 23
9.1.2 Média Aritmética Ponderada ...................................................................... 23
9.1.3 Média Aritmética de Dados Agrupados em Intervalos .............................. 24
9.1.4 Mediana (Me) ............................................................................................. 24
9.2 Medidas de Variação ...................................................................................... 25
9.2.1 Desvio-Médio (DM) ................................................................................... 25
9.2.2 Desvio Padrão ............................................................................................. 26
9.3 Variância ou Quadrado Médio ....................................................................... 27
9.4 Erro-Padrão da Média - s(x) ........................................................................... 27
9.5 Coeficiente de Variação.................................................................................. 28
9.6 Curva de Distribuição Normal ........................................................................ 28
9.6.1 Limites de Confiança .................................................................................. 29
9.6.2 Erro Padrão ................................................................................................. 30
9.7 Teste de Normalidade dos Dados ................................................................... 30
9.8 Teste de Klomogorov-Smirnov (K-S) ............................................................ 31
9.9 Teste de Shapiro-Wilks (S-W) ....................................................................... 31
10 Testes Paramétricos e Não Paramétricos ................................................................ 31
10.1 Teste t - Student .............................................................................................. 31
10.1.1 Dados Pareados (Amostras Dependentes) .............................................. 32
10.1.2 Dados Pareados (Amostras Independentes) ........................................... 33
10.1.3 Dados Não-Pareados - Variâncias Desiguais (Heterocedásticas)........... 34
10.1.4 Dados Não-Pareados - Variâncias Iguais (Homocedásticas) ................. 35
10.2 Teste Qui-Quadrado (χ²) ................................................................................ 36
10.3 Tabela de Contingência .................................................................................. 36
10.4 Teste de Kruskal-Wallis ................................................................................. 37
10.5 Teste de Friedman (Análise da Variância) ..................................................... 39
11 Correlação Linear ................................................................................................... 40
11.1 Coeficiente de Correlação (r) ......................................................................... 40
11.1.1 Correlação de Pearson ............................................................................ 40
11.1.2 Correlação de Spearman ......................................................................... 41
11.1.3 Aspectos Gerais da Correlação Linear ................................................... 41
11.2 Coeficiente de Determinação (r²) ................................................................... 42
11.3 Coeficiente de Alienação (K) ......................................................................... 42
11.4 Significância do Teste de Correlação ............................................................. 42
11.4.1 Significância Baseada nos Intervalos ..................................................... 42
11.4.2 Significância Baseada no Teste t para r (Pearson) ................................. 43
12 Análise de Regressão .............................................................................................. 43
12.1 Regressão Linear Simples .............................................................................. 44
12.2 Regressão Linear Múltipla.............................................................................. 45
12.3 Regressão Múltipla ......................................................................................... 45
13 Transformação de Dados ........................................................................................ 46
13.1 Raiz Quadrada ................................................................................................ 46
13.2 Transformação Logarítimica .......................................................................... 46
13.3 Transformação Angular (Arcoseno) ............................................................... 46
13.4 Considerações Gerais ..................................................................................... 46
14 Testes Específicos Para Análise de Populações e Comunidades ........................... 47
14.1 Índice de Diversidade e Dominância Populacional ........................................ 47
14.1.1 Índice de Margalef (α)............................................................................ 47
14.1.2 Índice de Glason (Dg) ............................................................................. 47
14.1.3 Índice de Menhinick (Dm) ...................................................................... 47
14.1.4 Índice de Shanon-Wiener (H') ................................................................ 47
14.1.5 Índice de Dominância Berger-Parker (d)................................................ 47
14.2 Exemplo .......................................................................................................... 48
14.3 Índice de Similaridade entre Populações ........................................................ 48
14.3.1 Quociente de Similaridade...................................................................... 48
14.3.2 Porcentagem de Similaridade ................................................................. 48
14.3.3 Índice de Afinidade ................................................................................ 49
14.3.4 Constância .............................................................................................. 49
14.3.5 Índice de Associação (IA) ...................................................................... 49
15 Lista de Exercícios.................................................................................................. 50
16 Bibliografia ............................................................................................................. 54
17 Anexos .................................................................................................................... 56
Índice de Tabelas
Tabela 1. Resultados da interpretação de 500 fotos aéreas de diversas áreas com
presença de mata. (dados fictícios) ........................................................................... 7
Tabela 2. Dados do peso de 10 crianças antes e depois da administração a base de folhas
de mandioca (dados fictícios). ................................................................................ 32
Tabela 3. Dados de um experimento com a taxa de crescimento de mudas de duas
leguminosas em sistema agro-silvo-pastoril, numa área de re-vegetação (dados
fictícios). ................................................................................................................. 33
Tabela 4. Resultados das amostras de cinco diferentes áreas delimitadas pelas
características edáficas do solo, em quatro diferentes profundidades. Os dados
apresentados referem-se a o poluente α-β-16-Imaginol-Poluentis, em mg.mm³ de
solo ......................................................................................................................... 39
Tabela 5. Correlação de Spearman entre as notas brutas de matemática e biologia (Zar,
1999). ...................................................................................................................... 41
Tabela 6. Classificação do valor r através de intervalos de 0 a 1. .................................. 42
Tabela 7. Classificação do valor r através de intervalos de acordo com e Teste de Rugg.
................................................................................................................................ 43
Tabela 8. Série de dados da correlação da flutuação populacional do pulgão Toxoptera
aurantii (Homoptera, Aphididae) em função da brotação foliar de tangerina cv
Poncã, sob cultivo orgânico na Fazendinha Agroecológica, no período de outubro
de 2002 e outubro de 2003 (Extraído de Rodrigues, 2004). Exemplo para o
Microsoft Excel. ..................................................................................................... 43
Tabela 9. Índices de diversidade de cochonilhas em agroecossiema cítrico. ................. 48
Tabela 10. Duas comunidades com sua composição de espécies em percentagem ....... 49
Tabela 11. Valores de t -student em níveis de 5% e 1% (α=0,05 a 0,01) de
probabilidade. ......................................................................................................... 57
Tabela 12. Valores de χ² (Qui-quadrado) em níveis de 5% e 1% (α=0,05 a 0,01) de
probabilidade .......................................................................................................... 58
Tabela 13. Valores críticos para o Coeficiente de Correlação de Spearman (rs)............ 59
Tabela 14. Valores para transformação arcsen % ....................................................... 60
Tabela 15. Valores mínimos de j, significativos a 0,5% (Southwood, 1971). ............... 61
Índice de Figuras
Figura 1. Diagrama de uma estatística descritiva, com seus diversos níveis de
categorias. ................................................................................................................. 3
Figura 2. Diagrama de tipos de dados estatísticos. ........................................................... 4
Figura 3. Interpretação dos dados experimentais. O gráfico à esquerda, baseado em
apenas dois pares de valores anotados para X e Y (que definem os pontos A e B),
parece sugerir que Y cresce à medida que X cresce, entretanto no gráfico à direita,
em que foram registrados outros valores intermediários (definidos pelos pontos B e
C), mostra que a relação entre X e Y obedece a uma lei mais completa. ............... 10
Figura 4. Produção de veículos no Brasil (1992-1996). ................................................. 16
Figura 5. Alunos formados na Universidade Federal de Pernambuco em 1999. ........... 17
Figura 6. Preferência de programas de televisão por sexo. ............................................ 17
Figura 7. Produção de cebola no Brasil em 1992. .......................................................... 17
Figura 8. Crescimento demográfico do Brasil de 1995 a 1999. ..................................... 18
Figura 9. Fatia de mercado de empresas de venda de seguros de saúde no estado do Rio
de Janeiro. ............................................................................................................... 18
Figura 10. Eleitores por estado da região Sudeste do Brasil. ......................................... 19
Figura 11. Flutuação populacional de pulgão preto dos citros em função da temperatura
média em 1996, no campus da Universidade Federal Rural do Rio de Janeiro. .... 19
Figura 12. Curva de distribuição normal simétrica, onde µ é a média e s o desvio
padrão. .................................................................................................................... 28
Figura 13. Curvas de distribuição normal das freqüências de X, tendo a mesma média
(µ) e diferentes graus de dispersão dos valores de X, isto é, desvios padrões (s)
diferentes. ............................................................................................................... 29
Figura 13. Curva normal padrão, tendo por parâmetros µ=0 e s= 1. As áreas sob a curva
assinaladas entre os traços verticais indicam as percentagens de valores de X aí
contidas. .................................................................................................................. 29
Figura 15. Os valores de Z (compreendidos entre -Z e +Z) correspondem aos
afastamentos de X em relação à média µ, medidos em unidades de desvio-padrão.
A probabilidade (P) com que X possa ter valor menor que uma coordenada
escolhida (C) é indicada pela área, sob a curva, situada à esquerda de C. ............. 30
Figura 16. Correlação linear simples positiva (A); e inversa ou negativa (B),
apresentando a linha de tendência de regressão linear simples de dados fictícios. 42
Figura 17. Janela de configuração da linha de tendência (linha de regressão) e
configuração da equação de regressão no Microsoft Excel.................................... 44
Figura 18. Regressão linear simples entre a flutuação populacional de T. aurantii e a
brotação foliar de tangerina cv. Poncã, em cultivo orgânico de tangerina cv. Poncã,
na Fazendinha Agroecológica, no período de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004). ............................................................................. 44
Figura 19. Correlação múltipla da amplitude térmica (variável x), brotação (variável y) e
a flutuação populacional de Toxoptera citricida (variável z), em cultivo orgânico
de tangerina cv. Poncã, na Fazendinha Agroecológica, no período de outubro de
2002 a outubro de 2003 (Adaptado de Rodrigues, 2004). ...................................... 45
Figura 20. Regressão múltipla entre a flutuação populacional de T. aurantii e a brotação
foliar de tangerina cv. Poncã, em cultivo orgânico de tangerina cv. Poncã, na
Fazendinha Agroecológica, no período de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004). ............................................................................. 45
Figura 20. Fluxograma Para Auxiliar na Escolha de Testes Estatísticos ....................... 56
Apostila de Estatística Aplicada - 2010
1 Introdução
Diariamente estamos envolvidos em análises estatísticas, por exemplo, quando
você é abordado na rua para responder qual o candidato irá votar na próxima eleição,
quando o IBGE faz uma visita a sua casa para o censo. Desta forma, você está fazendo
parte da estatística, mas não é só desta forma que você faz parte do infinito mundo da
estatística. Quando você está desempregado ou empregado, está fazendo parte da esta-
tística, quando seu salário aumenta, faz parte também. Bom, podemos ver que em quase
tudo, eu disse quase tudo, podemos empregar a estatística, obviamente que não pode-
mos deixar a estatística dominar nossas vidas, pois o principal objetivo desta ferramenta
é auxiliar na tomada de decisão ou de avaliar uma determinada situação e poder melhor
indicar o caminho para uma tomada de decisão.
A estatística, como parte da matemática aplicada, trata da coleta, da análise e da
interpretação de dados observados. Estudando os mais variados fenômenos das diversas
áreas do conhecimento, ela representa um valioso instrumento de trabalho nos dias de
hoje.
Na área ambiental, o estudo da estatística justifica-se pela necessidade de desen-
volver pesquisas, realizar experimentos, e mesmo pela utilização dos resultados e pes-
quisas feitas, realizar experimentos, e mesmo pela utilização dos resultados e pesquisas
feitas por aqueles que a isso se dediquem, seja visando o aprimoramento de métodos e
técnicas de investigação, seja por exigências do próprio desenvolvimento do país.
2 Ensaio x Experimentação
Existem diferenças básicas entre os dois métodos de avaliar um dado científico.
As diferenças vão desde a simples forma de avaliar e encarar a coleta dos dados até a
forma de apresentação dos dados. Abaixo no Quadro 1 são listadas as diferenças entre
os dois métodos.
Ensaio Experimentação
Tempo de duração da avaliação é curta, obje- O tempo de avaliação deverá ser o suficiente
tivando somente uma pré-avaliação dos resul- para que os dados coletado possam garantir
tados. uma avaliação, com margem de erro menor
possível.
O número de amostras é reduzido. O número de amostra deverá ser suficiente
para avaliar os dados com a maior precisão
possível
O tamanho do experimento é reduzido. O tamanho do experimento deverá ser sufici-
ente para avaliar os dados.
As variações ao acaso são parcialmente con- As variações ao acaso são controladas com
trolados, não havendo rigor. rigor, possibilitando assim menor erro amos-
tral e na análise estatística.
A análise e interpretação dos dados não podem A análise e interpretação dos dados deverão
possuir muito rigor e deve se adequar ao tipo ser rigorosas e adequadas ao tipo de experi-
de ensaio realizado, número de amostras, nú- mentação realizada.
mero de amostragens realizadas, etc.
3 Conceitos Estatísticos
amostra da população.
Página
Apostila de Estatística Aplicada - 2010
Para melhor elucidar estes conceitos, digamos que há uma necessidade de saber
a opinião da qualidade de vida no campus de sua faculdade. A população, ou universo,
será todos os alunos da faculdade, enquanto a amostra consistirá os estudantes selecio-
nados para participar da pesquisa. O objetivo da pesquisa é descrever várias atitudes ou
características de toda a população (os parâmetros). Isto seria alcançado utilizando-se
as estatísticas obtidas da amostra de estudantes para estimar atitudes ou características
de interesse da população. Desse modo, um aspecto principal da inferência é o processo
que utiliza a estatística amostral para tomar decisões sobre os parâmetros da população.
População/Universo
Amostra
Parâmetro
Estatística
Figura 1. Diagrama de uma estatística descritiva, com seus diversos níveis de categorias.
A amostra pode ser definida também como o conjunto de observações extraídas de uma fonte
(população), segundo determinadas regras e critérios, sendo a população a fonte de observa-
ções.
A população pode ser constituída de elementos simples, como é o caso dos seres humanos ou
das plantas superiores ou das bactérias, ou por elementos coletivos, como é o caso das irman-
dades com mais de um indivíduo, das famílias, ou das pessoas que habitam uma casa.
Dados discretos são respostas numéricas que surgem a partir de processo de con-
Página
tagem e dados contínuos são repostas numéricas que surgem a partir de um processo de
medição.
William Costa Rodrigues
Tipos de Dados
Categorizadas Numéricas
Discretas Contínuas
Você possui
carro?
Quantas revistas você Qual sua altura?
assina?
Sim Não
5 1,75m
5 Planejamento Experimental
5.1.1 Problema
Ao planejar o problema que se vai pesquisar, deverá ser dada especial atenção
aos seguintes pontos:
Definição da importância do problema que se estuda;
Determinação do(s) objetivo(s) e finalidade da investigação.
quantitativas que possam existir entre eles (ver item Pesquisa Observacional, p. 9). A
Página
5.1.7 Aleatorização
Na oportunidade em que organizamos os ensaios devemos proporcionar condi-
ções idênticas para cada tratamento, possibilitando que se houver algum erro este seja
atribuído ao acaso, ou seja, não tendencioso. Com este processo o erro experimental
poderá ser mensurado através do modelo matemático utilizado para analisar os dados.
Tabela 1. Resultados da interpretação de 500 fotos aéreas de diversas áreas com presença de mata. (dados
fictícios)
Observa-se pela tabela acima que em nenhuma das duas ocasiões os diferentes
observadores coincidiram quanto ao número de fotos consideradas positivas para o refe-
rido diagnóstico. O mesmo foi verificado em relação a cada um dos observadores que
apresentaram resultados diferentes entre as duas leituras.
Devemos concluir que, tais discordâncias não refletem uma variação real, e sim
cometida por quem procedeu à leitura do material fotográfico.
Cada método em particular pode ter uma série de fatores que conduzem à distor-
ção dos resultados.
30 35
25 B 30 C
25 B
20
20 D
Y
Y
15 A 15 A
10 10
5 5
A B A B C D
X X
Figura 3. Interpretação dos dados experimentais. O gráfico à esquerda, baseado em apenas dois pares de
valores anotados para X e Y (que definem os pontos A e B), parece sugerir que Y cresce à medida que X
cresce, entretanto no gráfico à direita, em que foram registrados outros valores intermediários (definidos
pelos pontos B e C), mostra que a relação entre X e Y obedece a uma lei mais completa.
uma população que apresenta características homogêneas, isto é, pouca variação no con-
junto dos elementos, ou seja, variância próxima ou igual à média.
Página
Apostila de Estatística Aplicada - 2010
N
Onde n0: número inicial; Z: nível e confiança; p: valor obtido de trabalho anteri-
Página
ormente realizado; N tamanho da população; q: 100%-p; (P-p): erro arbitrado pelo pes-
quisador.
Apostila de Estatística Aplicada - 2010
Exemplo: numa pesquisa para determinar a taxa média de hemoglobina dos in-
divíduos de uma comunidade, deparamos com o problema de definir o tamanho da a-
mostra. Apenas sabemos que a população desta comunidade é de aproximadamente de
13
25.000 indivíduos, o que torna impraticável utilizar todos os elementos. Face a isto,
Página
6 Tabela
Trata-se simplesmente de um quadro, que sintetiza em conjunto de observações,
com o objetivo de uniformizá-la e racionalizá-la, de forma a tornar mais simples e fácil
seu entendimento. Desta forma, uma tabela deve ser construída de modo a fornecer o
máximo de esclarecimentos, com o mínimo espaço, começando com sua legenda que
deve ser explicativa.
d) Coluna indicadora: é a que determina o que contêm cada linha. Ou seja, apre-
senta o conteúdo referente a cada linha.
Local Ocorrência (nº)
Região metropolitana
Região serrana
Região dos lagos
e) Linha/Coluna de Totais: quando pertinente a tabela deverá apresentar uma li-
nha e/ou coluna de totais, contendo a soma dos valores das linhas e colunas.
14
Página
Gliricídia 08
Página
William Costa Rodrigues
1000
(milhares de unidades)
900
800
700
Veículos
600
500
400
300
200
100
0
92 93 94 95 96
Ano
250
200
Alunos (nº)
150
100
50
0
Advogados Médicos Engenheiros
Profissão
16
14
12 a - Noticiário
Pessoas (nº)
10 b - Musical
8 c - Novela
6 d - Esportivo
4 e - Outros
2
0
Masculino Feminino
Sexo
São Paulo
R.G. Sul
Sta. Catarina
Pernambuco
Minas Gerais
90
16% 11%
Empresa A
24%
Empresa B
Empresa C
Empresa D
49%
Figura 9. Fatia de mercado de empresas de venda de seguros de saúde no estado do Rio de Janeiro.
18
Página
Apostila de Estatística Aplicada - 2010
40 12
8
25
20 6
15
4
10
2
5
0 0
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Período levantamento
Figura 11. Flutuação populacional de pulgão preto dos citros em função da temperatura média em 1996,
no campus da Universidade Federal Rural do Rio de Janeiro.
8 Probabilidade Estatística
Os acontecimentos na natureza ocorrem e se repetem segundo normas e leis. A
maior ou menor ocorrência de um determinado acontecimento deve-se às circunstâncias
nas quais ele se realiza. Assim não podemos assumir como certo a ocorrência do acon-
19
tecimento, uma vez que está sujeita a uma série de fatores. Contudo, podemos tomar
decisões, tendo-se em vista experiências anteriores, com bases nos mais prováveis resul-
Página
William Costa Rodrigues
razão do número de casos favoráveis à ocorrência (F) pelo numero de casos totais (F +
C).
Apostila de Estatística Aplicada - 2010
F
p (A) =
F+C
A fórmula acima não é aplicável se o espaço amostrado for finito e os acontecimentos igualmen-
te prováveis.
Exemplo 1:
Supondo que uma sacola contendo 3 bolas amarelas, 4 vermelhas e 6 brancas.
Qual a probabilidade de tirarmos uma bola amarela?
Solução:
Nº casos favoráveis (F) = 3
Nº casos contrários (C) = 10 (4 +6)
Nº casos totais (F+C) = 13 (10 + 3)
3 3
p (A) = = = 0,2308
3 + 10 13
A probabilidade é de 0,2308, ou seja 23,08%. Assim a probabilidade poderá ser
expressa em porcentagem, já que assumimos que F+C é o total, este valor passa a ser
100%.
Nesse caso a probabilidade irá variar entre 0 e 1, como podemos verificar na
item 8.1 Regras para Combinar Probabilidade.
Exemplo 2:
Qual a probabilidade de um dado espermatozóide conter um cromossoma x?
Solução:
Partindo da pressuposição de que é igualmente possível ter x e y, a probabilidade
é de ½.
Dois conceitos são fundamentais para o entendimento da probabilidade:
Se a ocorrência de um evento é certa, sua probabilidade é 1. Se sua não-
ocorrência é certa, sua probabilidade é 0 (zero). Em qualquer outro caso, a pro-
babilidade é uma fração entre 0 e 1;
Se a probabilidade de um evento acontecer é p, a probabilidade de não acontecer
é 1-p. Chamamos aqui a probabilidade de “ um evento não ocorrer “ de q. Assim
temos:
o q = 1-p logo, p+q=1
Desta forma:
4 4 2
p= + =
Página
(pela regra 1)
52 52 13
William Costa Rodrigues
Existem várias outras aplicações e formas de utilizar a probabilidade, que poderão ser encon-
trada na vasta literatura sobre estatística e probabilidade.
Representam ou resumem todos os valores obtidos pelo grupo e, como tal, for-
necem uma descrição precisa da execução do grupo como um todo, e;
Apostila de Estatística Aplicada - 2010
X=
∑x
n
Onde X : representa a média; ∑ x : a soma das variáveis; e o n o números de
indivíduos ou elementos.
Exemplo: deseja-se saber o valor médio do seguinte conjunto de dados: 32, 25,
32, 30, 26, 30, 29, 26, 29 e 33.
∑ x : 32 + 25 + 32 + 30 + 26 + 30 + 29 + 26 + 29 + 33.
n = 10
292
X= ⇒ 29,2
10
Variável Freqüência
X1 f1
X2 f2
. .
. .
. .
Xn fn
X=
∑ xf = x 1f1 + x 2 f 2 + ... + x n f n
n f 1 + f 2 + ... + f n
Exemplo: Calcular a média de idade de crianças até 9 anos de uma determinada locali-
dade.
Idade (anos) Freqüência
2 10
3 8
4 6
5 5
23
6 5
7 5
Página
8 7
9 4
William Costa Rodrigues
2 × 10 + 3 × 8 + ... + 9 × 4 250
X= = = 5 anos
10 + 8 + ... + 4 50
X=
∑ xf ∴ 80 = 8 anos
n 10
Desta forma a média da população avaliada é oito anos.
Quando os dados apresentam homogeneidade, é possível o uso da média aritmé-
tica, que tem como:
Vantagens:
o Ser fácil de calcular e entender;
o Unir em um valor todas as observações do conjunto.
Desvantagens:
o Não servir para séries variáveis assimétricas;
o Não expressar variações dentro da distribuição de dados.
n +1
Localiza-se o valor central mediante a fórmula: , quando o número de ob-
2
n n
servações (n) for ímpar e e + 1 , quando o número de observações é par, o
2 2
que corresponde à média dos valores centrais.
Exemplo:
a) Em determinada localidade foram selecionadas oito escolas, com a finalidade de
estimar a mediana referente ao número de alunos. Tendo verificado o seguinte
quadro:
Escola Nº de alunos
A 150
B 180
C 230
D 2.500
E 200
F 160
G 250
H 170
Inicialmente ordenam-se os dados: 150, 160, 170, 180, 200, 230, 250 e 2.500.
n n
Como o número de observações é par utilizam-se as duas fórmulas e + 1 ,
2 2
para obter os dois valores centrais. Assim os valores centrais para este conjunto de da-
dos são 180 (4º) e 200 (5º), portanto o valor médio destes dois valores é igual a 190, que
corresponde à mediana.
Me= 190 alunos.
2 + 5 + 9 + 11 + 14 + 25 66
X= ∴X = = 11
6 6
2 - 11 + 5 - 11 + 9 - 11 + 11 - 11 + 14 - 11 + 25 - 11
D.M. =
6
9 + 6 + 2 + 0 + 3 + 14 34
D.M. = ∴ D.M. = ∴ D.M. = 5,6
6 6
∑x − n2
s=
n −1
Onde: x: valores do conjunto de dados; Σ: somatório; e n: número de observa-
ções.
66 2 4.356
1.052 − 1.052 −
s= 6 ∴s = 6 ∴s = 1.052 − 726 ∴ s = 326 ∴s = 65,20
6 −1 5 6 −1 5
∴s = 8,07
É importante ressaltar que no cálculo do desvio padrão utilizou-se o denominador (n-1), ou se-
ja, o grau de liberdade, pois como o valor s é uma estimativa, devemos ajustar o erro desta es-
timativa, eliminando um elemento do conjunto de observações. Vale ressaltar que, no caso de
populações finitas o denominador será n e o desvio passa ser o σ (desvio padrão absoluto ou
verdadeiro).
Observamos agora uma série de dados agrupados, isto é, uma série de valores
que se repetem e, por conseguinte, são representados pela sua freqüência.
x f fx
2 2 4
26
3 2 6
Página
4 4 16
5 4 20
Apostila de Estatística Aplicada - 2010
x f fx
6 2 12
Total 14 58
∑ fx ∑ fx
2 2
s= − , ou seja,
n n
2
852 58
s= − ∴ s = 60,8571 − 4,1429 2 ∴ s = 60,8571 − 17,1636 ∴ s = 43,6935 ∴ s = 6,6101
14 14
É importante ressaltar que valores acima de 30% não significam um C.V. insatisfatório, pois
alguns experimentos em campo podem ter o valor C.V. de até 65% e serem considerados bons.
Figura 12. Curva de distribuição normal simétrica, onde µ é a média e s o desvio padrão.
A curva de distribuição normal ou simplesmente curva normal é caracterizada
por dois parâmetros: a média e o desvio padrão (ou a variância).
O ponto máximo da função ocorre no valor médio (situado ao centro da curva,
que é simétrica); a distância entre ele e cada um dos pontos em que muda a direção da
curvatura, à esquerda e a direita da média (µ) corresponde ao valor do desvio padrão(s)
(Figura 12).
A forma desta curva depende do desvio padrão, sendo tanto mais alta e estreita
28
Figura 13. Curvas de distribuição normal das freqüências de X, tendo a mesma média (µ) e diferentes
graus de dispersão dos valores de X, isto é, desvios padrões (s) diferentes.
A área da figura sob a curva compreendida entre valores iguais a s, de um e ou-
tro lado da média (µ), contém 68,2% dos valores de X, que serão tanto mais próximos
de µ quanto menor for o desvio padrão (Figura 14).
Figura 14. Curva normal padrão, tendo por parâmetros µ=0 e s= 1. As áreas sob a curva assinaladas entre
os traços verticais indicam as percentagens de valores de X aí contidas.
A área compreendida entre -2s e +2s abrange cerca de 95,5% dos valores de X,
restando, portanto duas áreas extremas, apenas 4,5% das observações ou eventos medi-
dos.
As propriedades da curva normal permitem seu uso para o cálculo de probabili-
dade com que determinados valores obtidos durante as observações, ou as medições,
possam ocorrer em função das variações.
média, por exemplo), podemos estimá-lo a partir de uma amostra extraída dessa popula-
ção. A estimativa, entretanto, pode ser inexata e não saberemos o quanto ela é incorreta.
Página
William Costa Rodrigues
Figura 15. Os valores de Z (compreendidos entre -Z e +Z) correspondem aos afastamentos de X em rela-
ção à média µ, medidos em unidades de desvio-padrão. A probabilidade (P) com que X possa ter valor
menor que uma coordenada escolhida (C) é indicada pela área, sob a curva, situada à esquerda de C.
sempre se dispões de um número elevado de casos para estudo, às vezes nem é possível
decidir se determinada variável possui ou não distribuição normal (na prática a amostra
Página
que provêm de populações diferentes. Neste caso, ao constatar as médias destas amos-
tras para verificar se há a diferença entre elas, estaremos indiretamente comparando as
Página
controle). O efeito do tratamento aplicado seria verificado pela comparação dos dois
grupos.
Nesses casos, o teste t seria indicado para tal comparação salientando que a vari-
ável em análise teria que apresentar os dados em distribuição normal ou aproximada-
mente normal.
O valor t - student calculado é dado pela fórmula:
X
t=
s2
n
Onde: X : média; s²= variância e N: número de observações
Tabela 2. Dados do peso de 10 crianças antes e depois da administração a base de folhas de mandioca
(dados fictícios).
Peso (Kg)
Item Diferença
Antes Depois
1 24 28 4
2 23 25 2
3 24 25 1
4 23 29 6
5 30 32 2
6 31 34 3
7 31 38 7
8 14 19 5
9 20 22 2
10 18 23 5
Total 238 275 37
Procedimento:
a) Obtêm-se as diferenças entre os valores antes e depois (quadro acima);
b) Verifica-se a média aritmética das diferenças;
c) Verifica-se a variância das diferenças e;
d) Aplica-se o teste t - student.
37
b) X d = = 3,7
10
32
c) Σd²=173; Σd=37; n= 10
Página
Apostila de Estatística Aplicada - 2010
1369
173 −
s2 = 10 = 173 − 136,9 = 39,1 = 4,01
9 9 9
Esta equação deve ser utilizada, quando se conhece a variância populacional (σ²).
Exemplo:
Tabela 3. Dados de um experimento com a taxa de crescimento de mudas de duas leguminosas em siste-
ma agro-silvo-pastoril, numa área de re-vegetação (dados fictícios).
Leguminosa A Leguminosa B
X1 = 38 cm X 2 = 33,5 cm
s1= 5 cm s2= 6 cm
n1= 26 n2= 26
Calculado o valor de t teremos:
38 - 33,5 4,5 4,5 4,5 4,5
t= = = = = = 2,9379 ≅ 2,94
52 6 2 0,9615 + 1,3846 2,3461 1,5317
33
25 36
+ +
26 26 26 26
Página
n1 n2
+
Página
n1 − 1 n2 −1
Para nosso exemplo seria:
Apostila de Estatística Aplicada - 2010
2
74 18
+
4,26 2
g= 2
20 32
2
= = 24,8 ≅ 25
74 18 0,73 2
20 + 32
20 − 1 32 − 1
Consulta-se então a tabela do teste t-student (Tabela 11, p. 57), para verificar os
valores críticos nos níveos de 5% e 1% de probabilidade para 25 graus de liberdade.
Na tabela iremos obter o valor de 2,06 (5%) e 2,79 (1%). Desta forma, conclui-
se que o valor obtido pata t = 5,82 é significativo no nível de 1% (1% ou α=0,01), acei-
tando-se a hipótese alternativa, devido à diferença significativa entre as médias das duas
amostras.
s2 =
10 + 7 − 2 15 15 15
William Costa Rodrigues
fe
Onde: fo= freqüência observada e; fe= freqüência esperada.
Portanto o valor do desvio é elevado ao quadrado e dividido pela freqüência es-
perada.
Em muitos casos utiliza-se este teste em experimentos probabilísticos, por e-
xemplo, lançamentos de moedas ou proporção de doentes após uma epidemia. No pri-
meiro caso a probabilidade de lançarmos 10 vezes uma moeda e cair cara é de 50%
(freqüência esperada) e o valor real após os lançamentos será a freqüência observada.
No segundo caso a freqüência esperada deverá ser corrigida (calculada) através da Ta-
bela de Contingência.
diferentes faixas etárias, para verificar a incidência de diabete. Para tal, foram coletadas
Apostila de Estatística Aplicada - 2010
amostras de sangue. A H0 é que não diferença entre as faixas etárias em relação a ter
diabete.
Neste caso temos uma tabela de contingência de 2 x 3, pois temos duas situações
as serem testadas (com ou sem diabete) em três grupos (faixas etárias).
O Grau de liberdades para tabelas de contingências será calculado pela seguinte
fórmula: GL = (n s − 1) × (n g − 1) . No nosso exemplo teremos:
GL = (2 − 1) × (3 − 1) ∴GL = 1 × 2 ∴GL = 2
Para calcular as freqüências realiza-se uma regra de três simples como segue:
34 –––––––––––––––– 223
fe –––––––––––––––– 77
34 × 77
Ou seja, fe A = a fe da terceira coluna (sem diabete) é calculada pela diferença
223
entre os valores da fe da 2ª coluna (com diabete) e o valor da coluna total (Σ). Os de-
mais valores da linha subseqüentes são obtidos com a realização da regra de três para
cada valor da 2ª coluna.
Para calcular o χ² do conjunto de dados utilizaremos a fórmula vista anterior-
mente. Assim teremos:
χ2 =
(2 − 11,74)2 + (75 − 65,26)2 + (12 − 11,28)2 + (62 − 62,72)2 + (20 − 10,98)2 +
11,74 65,26 11,28 62,71 10,98
(52 − 61,02)2 ∴ χ 2 = 94,87 + 94,87 + 0,5184 + 0,5184 + 81,36 + 81,36 ∴
61,02 11,74 65,26 11,28 62,72 10,98 61,02
χ = 8,09 + 1,45 + 0,05 + 0,01 + 7,41 + 1,33∴ χ = 18,34
2 2
Os valores obtidos nas diversas amostras diferem entre si e, portanto, será uma
maneira se verificar se estas diferenças são devidas ao acaso ou se as amostras provêm
Página
de populações diferentes.
William Costa Rodrigues
57 2 69,5 2 149,5 2
− 3 (23 + 1)∴
12
H= × + +
23 (23 + 1) 7 8 8
12 3.249 4.830,25 22.350,25
H= × + + − 3 × 24 ∴
23 × 24 7 8 8
× (464,14 + 603,78 + 2.793,78) − 3 × 24 ∴
12
H=
552
× (3.861,70 ) − 72 ∴ H = 0,0217 × 3.861,70 − 72
12
H=
552
H = 11,95
Como já foi dito este teste segue a distribuição do teste χ². Desta forma, sendo k
= 3 (métodos), os graus de liberdade correspondem a 2, pois GL= k-1. Portanto, os valo-
res da tabela χ², correspondem a 5 e 1%, são 5,99 e 9,21, respectivamente.
Considerando que o valor calculado H=11,95 é maior que os valores tabelados,
rejeitamos H0 (não há diferenças entre os métodos testados no tempo de dessalinização
das amostras), assim aceita a H1. Pelos valores R encontrados nos resultados verifica-se
que o método A e mais eficiente no processo de dessalinização, pois leva menos tempo
em comparação aos demais.
Profundidade (cm)
Blocos
0-10 11-20 21-30 31-50
Página
Profundidade (cm)
Blocos
0-10 11-20 21-30 31-50
Área C 14 (2) 20 (3) 22 (4) 6 (1)
Área D 17 (3) 16 (2) 21 (4) 11 (1)
Área E 12 (2) 15 (3) 16 (4) 10 (1)
Total
R1= 11 R2= 14 R3= 20 R4 = 5
*Os valores entre parênteses e em negrito correspondem à ordenação dos tratamentos dentro dos blocos
(linhas). Sendo o valor Ri a somas dos valores de ordenação nos tratamentos (colunas).
Como valor de graus de liberdade é igual a k-1 graus de liberdade e sendo k=4
(tratamentos), têm-se 3 graus de liberdade. A partir da tabela χ² (Tabela 12, p. 58). Os
valores para 5 e 1% de probabilidade são 7,82 e 11,32, respectivamente.
Sendo o valor de χ²r calculado maior que os valores da tabela de χ², rejeita-se a
hipótese nula (H0) e aceita a hipótese alternativa (H1). Ou seja, a profundidade de 21-30
cm tem uma maior concentração do poluente que as demais profundidades avaliadas,
nas áreas onde foram coletadas amostras.
11 Correlação Linear
A correlação linear é utilizada para verificar, num determinado conjunto, a de-
pendência entre duas séries de variáveis.
Trata-se de um valor abstrato que dá uma idéia sobre a dependência entre os
dados apresentados.
A correlação pode ser denominada positiva ou negativa. Quando positiva há a
variação positiva da variável dependente (Y), quando há variação positiva da variável
independente (X) vice-versa. Quando negativa há a variação negativa de Y, quando há
variação positiva de X e vice-versa.
∑ XY − n
r=
(n − 1) × s X × s Y
Página
Apostila de Estatística Aplicada - 2010
Onde: r= coeficiente de correlação de Pearson; ΣXY = soma dos produtos entre os valo-
res de X e Y; ΣX x ΣY= produto da soma dos valores de X e Y; n = número de amostras
de X e Y; sX e sY= desvios padrões de X e Y
Exemplo:
Tabela 5. Correlação de Spearman entre as notas brutas de matemática e biologia (Zar, 1999).
Para melhor entender melhor a explanação anterior, deve-se ter em mente que a
variável Y é quem sofre variação em função de X. Assim sendo, quando um valor é
William Costa Rodrigues
negativo, quer dizer que com o aumento dos valores de X, Y diminuem e quando o va-
lor é positivo, existe uma proporcionalidade direta entre as variáveis, ou seja, quando
aumenta os valores de X aumenta os valores de Y (Figura 16).
A B
3 3
2,5 2,5
2 2
1,5 1,5
1 1
0,5 0,5
0 0
0 20 40 60 0 20 40 60
Figura 16. Correlação linear simples positiva (A); e inversa ou negativa (B), apresentando a linha de ten-
dência de regressão linear simples de dados fictícios.
A utilização de um ou outro coeficiente dependerá da normalidade dos dados (veja o tópico Tes-
te de Normalidade dos Dados, p.30).
Intervalo Significância
0,0 – 0,20 Correlações nulas
Página
Intervalo Significância
0,71 – 0,90 Correlações fortes
0,91– 1,0 Correlações extremamente Fortes
Intervalo Significância
r < 0,15 r desprezível
0,15 < r < 0,29 r baixo
0,30 < r < 0,49 r apreciável
r >0,50 r acentuado
A significância das tabelas acima poderá ser utilizada tanto na correlação de Pearson, quanto
na de Spearmann.
12 Análise de Regressão
É freqüente o estudo da relação entre duas séries de variáveis. Por exemplo, o
peso de crianças de acordo coma dieta oferecida em diferentes dosagens. Sabe-se que
determinadas dietas têm interferência no ganho ou na redução do peso de indivíduos da
raça humana. Portanto há um interesse de expressar essa relação sob a forma matemáti-
ca, através da apresentação de uma função.
Para identificação de uma possível correlação entre séries de variáveis, torna-se
bastante eficaz a construção de um diagrama que se obtém em sistemas de eixos cartesi-
anos.
Hoje em dia os programas (softwares) de planilha de cálculo e de estatística,
fornecem a equação da reta ou de outro tipo de regressão que se queira plotar. Desta
forma, basta organizar os dado de forma correta e selecionar a criação de um gráfico de
dispersão, para verificar a com o próprio nome diz, a dispersão dos dados de Y em fun-
ção de X. A mostra como montar uma série de dados para criação de um gráfico de dis-
persão no Microsoft Excel.
Tabela 8. Série de dados da correlação da flutuação populacional do pulgão Toxoptera aurantii (Homop-
tera, Aphididae) em função da brotação foliar de tangerina cv Poncã, sob cultivo orgânico na Fazendinha
Agroecológica, no período de outubro de 2002 e outubro de 2003 (Extraído de Rodrigues, 2004). Exem-
plo para o Microsoft Excel.
A B C D E F G H I J L M
1
2 0,00 20,00 40,00 40,00 60,00 0,00 30,00 50,00 100,00 100,00 100,00
3 T. a 0,00 5,00 7,50 2,50 2,50 0,00 2,50 10,00 12,50 25,00 60,00
43
4
Página
em seguida clique em Avançar > para configurar o gráfico ou em Concluir para finali-
zar a criação. Após criar o gráfico selecione um dos pontos e em seguida clique no bo-
tão direito de mouse e selecione a opção Adicionar linha de tendência... Será exibida
uma janela com mostra a Figura 17. O tipo de linha será de acordo com a equação que
melhor de adeqüei a distribuição dos dados, lembrando que um evento biológico somen-
te poderá ser explicado até uma equação de segundo grau, ou seja, caos opte por linha
do tipo polinomial a ordem para eventos biológicos deverá ser 2.
A exibição da equação e do valor de R² é feita através da seleção da Aba Op-
ções, selecionando a caixa de seleção:
Exibir equação no gráfico
Exibir valor de R-quadrado no gráfico
Figura 17. Janela de configuração da linha de tendência (linha de regressão) e configuração da equação de
regressão no Microsoft Excel.
70
60
50
y = 0,3095x - 2,3472
40
R² = 0,3984
30
20
10
0
-10 0 20 40 60 80 100 120
44
Figura 18. Regressão linear simples entre a flutuação populacional de T. aurantii e a brotação foliar de
tangerina cv. Poncã, em cultivo orgânico de tangerina cv. Poncã, na Fazendinha Agroecológica, no perío-
Página
Figura 19. Correlação múltipla da amplitude térmica (variável x), brotação (variável y) e a flutuação po-
pulacional de Toxoptera citricida (variável z), em cultivo orgânico de tangerina cv. Poncã, na Fazendinha
Agroecológica, no período de outubro de 2002 a outubro de 2003 (Adaptado de Rodrigues, 2004).
70
60
50
y = 0,0046x2 - 0,2141x + 7,1984
40
R2 = 0,4695
30
20
10
0
0 20 40 60 80 100 120
Figura 20. Regressão múltipla entre a flutuação populacional de T. aurantii e a brotação foliar de tangeri-
na cv. Poncã, em cultivo orgânico de tangerina cv. Poncã, na Fazendinha Agroecológica, no período de
outubro de 2002 a outubro de 2003 (Adaptado de Rodrigues, 2004).
45
Página
William Costa Rodrigues
13 Transformação de Dados
Para uma aplicação válida dos testes de significância, baseados nas propriedades
das curva normal, é necessário que o dados tenham uma distribuição normal (Figura 12,
Figura 13 e Figura 14). As porcentagens, as contagens e as notas dadas a certas caracte-
rísticas qualitativas, exigem quase sempre essa transformação.
Vamos apresentar nesta apostila algumas das principais transformações de dados
empregadas na normalização dos dados e as situações que cada uma se aplica.
N
d = Max
N total
Página
William Costa Rodrigues
14.2 Exemplo
O exemplo hipotético abaixo da diversidade de cochonilhas em agroecossistema
cítrico ilustra os índices de diversidade das cochonilhas de um pomar de citros.
Período S N α Dg Dm
1994 10 268 1,609 4,118 0,611
1995 10 235 1,648 4,218 0,652
1996 10 323 1,557 3,985 0,556
1997 10 435 1,481 3,790 0,479
Média 10 315 1,574 4,045 0,575
% S = ∑ (% a + % b + % c + ... + % n )
Onde: % a = menor porcentagem da espécie a observada no confronto das comunida-
des; % b = idem, para espécies b; % c = idem, para espécies c e % n = idem, para espé-
cies n.
48
Página
Apostila de Estatística Aplicada - 2010
Espécies
Comunidade
A b c d
A 15 35 27 23
B 33 14 36 17
14.3.4 Constância
Este parâmetro indica a percentagem de uma determinada espécie em relação a
todos os levantamentos realizados.
É dado pela fórmula:
n × 100
C=
N
Onde: n = Número de coletas contendo a espécies em estudo e N = Número total de
coletas realizadas.
A Constância de uma espécie poderá ser classificada da seguinte forma:
a) Espécies constantes – presentes em mais de 50% dos levantamentos;
b) Espécies acessórias – presentes entre 25–50% dos levantamentos;
c) Espécies Acidentais – Presentes em menos de 25% dos levantamentos.
15 Lista de Exercícios
1. Qual a diferença básica entre ensaio e experimento?
11. Você foi convidado para realizar um estudo numa população de mamíferos que continha
48.000 indivíduos, para saber a incidência de uma determinada enfermidade. Sabe-se que o
valor de ocorrência anterior foi de 15%, o nível de confiança é igual a 95% (α=5%). Para
esta pesquisa foi estabelecido um erro de 5%. Pergunta-se qual o número mínimo que a a-
mostra desta população deve conter para que possamos confiar nos dados obtidos no estudo
a ser realizado?
50
12. Para realizar um estudo sobre nível de escolaridade de pessoas de uma determinada cidade,
Página
realizou-se um estudo bibliográfico. Foi verificado que em estudo prévio a taxa de analfabe-
tismo foi de 15%. O nível de confiança para realizar o estudo é de 1,96% e a o erro atribuí-
do ao estudo é de 2%. Sabe-se ainda que a população da cidade é de 45.560 pessoas.
Apostila de Estatística Aplicada - 2010
14. Numa escola temos crianças divididas em classe por idade, para verificar o índice de desnu-
trição. Em um determinado estudo contabilizou-se a freqüência destas, conforme tabela a-
baixo. Qual a hipótese estatística? Qual a média de caso de desnutrição.
Idade (anos) Freqüência (f)
5 58
6 21
7 32
8 25
9 25
10 08
15. Numa escola temos crianças divididas em classe por idade, para verificar o índice de desnu-
trição. Em um determinado estudo contabilizou-se a freqüência destas, conforme tabela a-
baixo. Qual a hipótese estatística? Qual a média de caso de desnutrição.
Idade (anos) Freqüência (f)
1 |–4 32
4 |–7 25
7 |-9 62
9 |-13 25
J 560
L 321
M 285
Página
William Costa Rodrigues
18. Observando o conjunto de dados na tabela abaixo, pede para se calcular a media e o desvio
padrão, erro-padrão da média e o coeficiente de variação.
x f fx
2 5
3 28
4 45
5 46
6 27
19. Após a coleta de dados a respeito do número sementes produzidos por uma determinada
essência florestas. Tornou necessário determinar a média, o desvio padrão a variância do e o
erro padrão da média do número de sementes produzida pelas plantas amostradas. Os dados
seguem no quadro abaixo:
Planta Nº sementes Planta Nº sementes Planta Nº sementes
A 125 C 210 E 152
B 232 D 131 F 98
20. Um pesquisador realizou um estudo sobre amostra de água em dois córregos, para medir a
contaminação por tetracloreto de carbono (CCl4). Após a coleta os dados o pesquisador
construiu a tabela abaixo.
8 49 22
9 56 21
Página
10 34 23
Apostila de Estatística Aplicada - 2010
22. Num experimento para comparar a o peso médio entre duas raças de porco (Duroc e Lan-
drace). Um pesquisador fez a mensuração de 26 animais para cada raça, onde obteve os da-
dos conforme a tabela abaixo:
Duroc Landrace
x = 38 kg x = 33,5 kg
S1 = 5 kg S2 = 6 kg
n1 = 26 n2 = 26
Pede-se para verificar se há diferença estatística entre os tratamentos e concluir baseado nos
resultados encontrados.
23. Um pesquisador resolve medir o nível de poluição em uma comunidade próxima a uma
indústria. Os métodos escolhidos foram amostrar solo e água, já que a comunidade é ribei-
rinha. A partir do conjunto de dados abaixo, calcule a média, o desvio padrão e a variância,
comparando os dois tipos de amostras e concluindo sobre as diferenças.
Nível de metal pesado a partir da amostra de solo e água numa comunidade próxima a uma indústria.
24. Em testes de contaminação de solo, foi verificado que duas áreas estavam com índices de
poluente acima do permitido. Para se fazer uma análise mais crítica os dados são apresenta-
dos abaixo. Desta forma, qual das duas áreas apresenta maior poluição? E qual a hipótese
nula para a questão.
Área A Área B
25. Num experimento para verificar entre a diferença de duas amostras que não possuem dis-
tribuição normal. Os dados se referentes ao número de pessoas sadias e infectadas por den-
gue, dividido por faixa etária.
Pessoas
Faixa Etária (anos) Σ
Com Dengue Sem Dengue
10-15 10 25 35
16-25 15 40 55
26-40 22 56 78
53
Σ 47 121 168
Página
William Costa Rodrigues
16 Bibliografia
Southwood, T.R.E. 1971. Ecological Methods. Chapman and Hall Ltd., 391p.
Vanzolini, P.E.1993. Métodos estatísticos elementares em sistemática zoológica. São
Página
Zar. J.H. 1999. Biostatistical Analysis. New Jersey: Prentice Hall. 4th ed., 663p and
index included.
55
Página
William Costa Rodrigues
17 Anexos
Dados com Distribuição Normal Dados com Distribuição Não Normal
2 Tratamentos
2 Tratamentos > 2 Tratamentos
Dados Numéricos
divididos em
Categorias Não dividido em
blocos
ANOVA Dividido em Bloco
(Amostras
Teste T Teste F compostas)
Teste 2
(Qui-Quadrado)
Teste de Kruskal-
Teste de Friedman
Wallis
S2Maior S2Maior
S2Menor < 4 S2Menor 4
Compara com
valor 2 Tabelado
( = 5%)
Calcula Variância
Ponderada
Rejeita H0 Aceita H0
Coloca * Coloca ns
Calcula Valor T
Compara com T
tabelado ( =1%)
Se Tcalc < Ttab
Se 2calc 2tab
Se 2calc < 2tab
Aceita H0
Coloca ns Coloca ** Mantém *
Conclui
textualmente
57
Página
3
A tabela completa poderá ser encontrada em Gomes (1990) e Levine et al. (1998).
William Costa Rodrigues
4
A tabela completa poderá ser encontrada em Gomes (1990) e Levine et al. (1998).
Apostila de Estatística Aplicada - 2010
5
A tabela completa poderá ser consultada em Zar (1999).
William Costa Rodrigues
60
Página
6
A tabela completa poderá ser consultada em Zar (1999).
Apostila de Estatística Aplicada - 2010
61
Página
William Costa Rodrigues
*************
O minuto que você está vivendo agora é o mais importante de sua vida, onde quer que
você esteja.
Preste atenção ao que está fazendo.
O ontem já lhe fugiu das mãos.
O amanhã ainda não chegou.
Viva o momento presente, porque dele depende todo o seu futuro.
Procure aproveitar ao máximo o momento que está vivendo, tirando todas as vantagens
que puder, para seu aperfeiçoamento.
C. Torres Pastorinho
Minutos da Sabedoria, p. 154
*************
62
Página