Estatística e Indicadores Ambientais

Estatística e Indicadores
Ambientais
Prof. Luis Augusto Ebert
Prof.ª Rafaela Tamara Marquardt
2015
Copyright © UNIASSELVI 2015
Elaboração:
Prof. Luis Augusto Ebert
Prof.ª Rafaela Tamara Marquardt
Revisão, Diagramação e Produção:

Centro Universitário Leonardo da Vinci – UNIASSELVI
Ficha catalográfica elaborada na fonte pela Biblioteca Dante Alighieri

UNIASSELVI – Indaial.
310.7
E16eSilva, Igor de Oliveira Insaurriaga
Estatística e indicadores ambientais/ Luis Augusto Ebert,
Rafaela Tamara Marquardt. Indaial : UNIASSELVI, 2015.
204 p. : il.
ISBN 978-85-7830-907-7
1. Estatística.
I. Centro Universitário Leonardo Da Vinci.
Impresso por:
Apresentação
Ao realizar e comparar uma pesquisa, nós necessitamos de parâmetros
para tal comparação. E a melhor forma de fazê-la é através da estatística,
que aplicamos a ela. Através de coleta de dados, informações pertinentes à
pesquisa, podemos aferir tais valores. E é isso sobre que a disciplina trata,
contudo, não é algo complexo, pois realizamos o planejamento e a ordenação
de todos os dados, e assim aplicamos vários modelos estatísticos.
A estatística pode ser adotada em vários campos de estudos, e nas

áreas das ciências naturais sua denominação intitula-se bioestatística, em que
são trabalhados dados biológicos. Então, caso você em algum artigo ou livro
ler estatística voltada às ciências naturais, nada mais é que bioestatística.
Contudo, todo experimento começa com uma hipótese, uma pergunta.

Ao analisarmos e trabalharmos os dados obtidos através desta análise,
devemos como pesquisador ater-nos a estas informações obtidas, pois com
os dados em mãos podemos reduzi-los ou agrupá-los, não esquecendo que a
estatística é uma ciência exata, e devemos cuidar para que nossos dados não
tenham incoerências.
Para tanto, na primeira unidade deste Caderno de Estudos, vamos ver

as principais definições, nomenclaturas utilizadas pela estatística dentro do
contexto das ciências naturais, bem como ter uma compreensão das teorias
das probabilidades e da distribuição. Já na segunda unidade, iremos calcular
os dados obtidos e analisá-los dentro do espectro da pesquisa, e averiguar
estas informações se os dados são paramétricos ou não paramétricos. E
na terceira unidade, veremos os indicadores ambientais e suas atribuições
dentro da pesquisa voltada às ciências naturais.
Vamos aos estudos!
III
NOTA
Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto para
você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há
novidades em nosso material.
Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é

o material base da disciplina. A partir de 2017, nossos livros estão de visual novo, com um
formato mais prático, que cabe na bolsa e facilita a leitura.
O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova
diagramação no texto, aproveitando ao máximo o espaço da página, o que também
contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo.
Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente,

apresenta também este livro no formato digital. Assim, você, acadêmico, tem a possibilidade
de estudá-lo com versatilidade nas telas do celular, tablet ou computador.

Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para
apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto
em questão.
Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas
institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa
continuar seus estudos com um material de qualidade.
Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de

Desempenho de Estudantes – ENADE.

Bons estudos!
IV
V
VI
Sumário
UNIDADE 1 – O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE
DE DADOS ................................................................................................................. 1
TÓPICO 1 – CONCEITOS APLICADOS À ESTATÍSTICA ......................................................... 3

1 INTRODUÇÃO .................................................................................................................................. 3
2 DEFINIÇÃO DE ESTATÍSTICA E BIOESTATÍSTICA .............................................................. 3
3 CONCEITOS APLICADOS À ESTATÍSTICA ............................................................................. 5
LEITURA COMPLEMENTAR ............................................................................................................ 7
RESUMO DO TÓPICO 1 .................................................................................................................... 12
AUTOATIVIDADE .............................................................................................................................. 13
TÓPICO 2 – MÉTODOS ESTATÍSTICOS ....................................................................................... 15

1 INTRODUÇÃO .................................................................................................................................. 15
2 MÉTODOS .......................................................................................................................................... 15
2.1 MÉTODO EXPERIMENTAL ....................................................................................................... 15
2.2. MÉTODO ESTATÍSTICO ............................................................................................................ 16
2.3 IMPORTÂNCIA DA ESCOLHA DO MÉTODO ...................................................................... 16
3 ETAPAS DO TRABALHO ESTATÍSTICO ................................................................................... 16
3.1 PLANEJAMENTO – DEFINIÇÃO DO PROBLEMA .............................................................. 16
3.2 COLETA DE DADOS ................................................................................................................... 16
3.3 TAMANHO AMOSTRAL . .......................................................................................................... 17
3.3.1 Estudos analíticos ................................................................................................................ 18
3.3.2 Estudos descritivos . ............................................................................................................ 19
RESUMO DO TÓPICO 2 .................................................................................................................... 21
AUTOATIVIDADE .............................................................................................................................. 22
TÓPICO 3 – APRESENTAÇÃO DE DADOS .................................................................................. 23

1 INTRODUÇÃO .................................................................................................................................. 23
2 TABELAS ESTATÍSTICAS ............................................................................................................... 23
3 DISTRIBUIÇÃO POR FREQUÊNCIA ........................................................................................... 26
3.1 DISTRIBUIÇÃO DE FREQUÊNCIA POR PONTOS ................................................................ 26
3.2. DISTRIBUIÇÃO DE FREQUÊNCIA POR INTERVALOS ...................................................... 27
4 GRÁFICOS ........................................................................................................................................... 31
4.1 TIPOS DE GRÁFICOS ................................................................................................................... 31
4.1.1 Gráfico em linha ou curva ................................................................................................... 31
4.1.2 Gráfico em coluna ou em barras . ....................................................................................... 32
4.1.3 Gráfico em barras . ................................................................................................................ 32
4.1.4 Gráfico em coluna ou em barras múltiplas . ..................................................................... 33
4.1.5 Gráfico em setores ................................................................................................................ 34
4.2 GRÁFICOS ESPECIAIS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA POR
INTERVALOS ................................................................................................................................. 35
4.2.1 Histograma ............................................................................................................................ 35
4.2.2 Polígono de frequências ...................................................................................................... 36
VII
4.2.3 Ogiva ...................................................................................................................................... 37
RESUMO DO TÓPICO 3 .................................................................................................................... 38
AUTOATIVIDADE .............................................................................................................................. 39
TÓPICO 4 – MÉTODOS DE AMOSTRAGEM ............................................................................... 41

1 INTRODUÇÃO .................................................................................................................................. 41
2 MÉTODOS DE AMOSTRAGEM ................................................................................................... 41
2.1 AMOSTRA DE CONVENIÊNCIAS ........................................................................................... 42
2.2 AMOSTRAGEM ALEATÓRIA SIMPLES . ................................................................................ 42
2.3 AMOSTRAGEM SISTEMÁTICA . .............................................................................................. 43
2.4 AMOSTRAGEM ALEATÓRIA ESTRATIFICADA .................................................................. 44
2.5 AMOSTRAGEM POR CONGLOMERADOS ........................................................................... 44
2.6 AMOSTRAGEM POR ESTÁGIOS MÚLTIPLOS . .................................................................... 44
RESUMO DO TÓPICO 4 .................................................................................................................... 45
AUTOATIVIDADE .............................................................................................................................. 46
TÓPICO 5 – DISTRIBUIÇÃO DE PROBABILIDADES ............................................................... 47

1 INTRODUÇÃO .................................................................................................................................. 47
2 DISTRIBUIÇÃO DE PROBABILIDADES .................................................................................... 47
2.1 DISTRIBUIÇÃO BINOMINAL ................................................................................................... 48
2.2 DISTRIBUIÇÃO DE POISSON ................................................................................................... 50
2.3 DISTRIBUIÇÃO EXPONENCIAL . ............................................................................................ 51
2.4 DISTRIBUIÇÃO NORMAL ......................................................................................................... 51
2.5 DISTRIBUIÇÃO DE T DE STUDENT . ...................................................................................... 55
RESUMO DO TÓPICO 5 .................................................................................................................... 58
AUTOATIVIDADE .............................................................................................................................. 59
TÓPICO 6 – INFERÊNCIAS ESTATÍSTICAS ................................................................................. 61

1 INTRODUÇÃO .................................................................................................................................. 61
2 DISTRIBUIÇÃO DE PROBABILIDADES .................................................................................... 61
2.1 VARIÁVEIS QUANTITATIVAS . ................................................................................................ 61
2.2 VARIÁVEIS QUALITATIVAS ..................................................................................................... 62
3 ESCALAS ESTATÍSTICAS .............................................................................................................. 63
4 ERROS DE OBSERVAÇÃO ............................................................................................................. 64
5 ARREDONDAMENTO DE NÚMEROS ....................................................................................... 64
RESUMO DO TÓPICO 6 .................................................................................................................... 66
AUTOATIVIDADE .............................................................................................................................. 67
UNIDADE 2 – MEDIDAS ESTATÍSTICAS ..................................................................................... 69
TÓPICO 1 – MEDIDAS DE POSIÇÃO E VARIAÇÃO ................................................................. 71

1 INTRODUÇÃO .................................................................................................................................. 71
2 MEDIDAS DE POSIÇÃO ................................................................................................................ 71
2.1 MÉDIA ARITMÉTICA SIMPLES ( X ) . ...................................................................................... 71
2.2 MÉDIA ARITMÉTICA PONDERADA . .................................................................................... 72
2.3 MÉDIA ARITMÉTICA DE DADOS AGRUPADOS EM INTERVALOS ............................... 74
2.4 MEDIANA (ME) ........................................................................................................................... 75
2.5 MODA (MO) . ................................................................................................................................ 78
3 MEDIDAS DE VARIAÇÃO ............................................................................................................. 79
3.1 DESVIO-MÉDIO (D.M.) . ............................................................................................................. 79
3.2 DESVIO-PADRÃO . ...................................................................................................................... 80
VIII
3.3 VARIÂNCIA OU QUADRADO MÉDIO .................................................................................. 83
3.4 COEFICIENTE DE VARIAÇÃO (C.V.) ...................................................................................... 84
3.5 ERRO-PADRÃO DA MÉDIA – s X ........................................................................................ 84
3.6 ERRO-PADRÃO DE PERCENTAGEN – S (P) . ........................................................................ 85
3.7 SEPARATRIZES ............................................................................................................................ 86
3.7.1 Quartis . ................................................................................................................................. 86
3.7.2 Decis ...................................................................................................................................... 89
3.7.3 Centis ..................................................................................................................................... 90
3.8 BOX PLOT (QUANTIL) ............................................................................................................... 92
RESUMO DO TÓPICO 1 .................................................................................................................... 94
AUTOATIVIDADE .............................................................................................................................. 95
TÓPICO 2 – TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS ................................ 97

1 INTRODUÇÃO .................................................................................................................................. 97
2 DIFERENÇAS ENTRE DADOS PARAMÉTRICOS E NÃO PARAMÉTRICOS ................... 97
3 TESTES DE NORMALIDADE ........................................................................................................ 98
3.1. TESTE SHAPIRO-WILK.............................................................................................................. 98
3.2 TESTE KOLMOGOROV-SMIRNOV ......................................................................................... 99
4 TESTES PARAMÉTRICOS .............................................................................................................. 99
RESUMO DO TÓPICO 2 .................................................................................................................... 102
AUTOATIVIDADE .............................................................................................................................. 103
ANEXOS ................................................................................................................................................. 104
TÓPICO 3 – TESTES DE HIPÓTESE ................................................................................................ 107

1 INTRODUÇÃO .................................................................................................................................. 107
2 HIPÓTESE ESTATÍSTICA ............................................................................................................... 107
3 QUI-QUADRADO (TESTE DE ADERÊNCIA) ............................................................................ 108
4 TESTE T – (STUDENT) ..................................................................................................................... 110
4.1 DADOS DEPENDENTES ............................................................................................................ 113
4.2 DIFERENÇA ENTRA A MÉDIA AMOSTRAL E O PARÂMETRO
POPULACIONAL ........................................................................................................................ 115
5 COMPARAÇÃO DE DUAS PROPORÇÕES ................................................................................ 116
RESUMO DO TÓPICO 3 .................................................................................................................... 118
AUTOATIVIDADE .............................................................................................................................. 119
ANEXOS ................................................................................................................................................. 120
TÓPICO 4 – TESTES NÃO PARAMÉTRICOS ............................................................................... 125

1 INTRODUÇÃO .................................................................................................................................. 125
2 TESTE U MANN-WHITEY .............................................................................................................. 125
3 TESTE T DE WILCOXON ................................................................................................................ 128
3.1 PEQUENAS AMOSTRAS ............................................................................................................ 129
3.2 GRANDES AMOSTRAS .............................................................................................................. 130
4 TESTE DE KRUSKAL-WALLIS ...................................................................................................... 132
5 TESTE EXATO DE FISHER ............................................................................................................. 134
6 TESTE DE FRIEDMAN .................................................................................................................... 136
7 TESTE DE MCNEMAR ..................................................................................................................... 138
8 COEFICIENTE DE CORRELAÇÃO DE SPEARMAN (Rs) ....................................................... 140
RESUMO DO TÓPICO 4 .................................................................................................................... 143
AUTOATIVIDADE .............................................................................................................................. 144
IX
ANEXOS ................................................................................................................................................. 146
UNIDADE 3 – ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE

QUALIDADE AMBIENTAL .................................................................................... 149
TÓPICO 1 – AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES

ECOLÓGICOS ................................................................................................................ 151
1 INTRODUÇÃO .................................................................................................................................. 151
2 POR QUE UTILIZAR ÍNDICES DE QUALIDADE AMBIENTAL? ........................................ 151
3 OS ÍNDICES ECOLÓGICOS SÃO CONFIÁVEIS? .................................................................... 161
4 ESPÉCIES R E K ESTRATEGISTAS ............................................................................................... 162
5 CONSERVAÇÃO AMBIENTAL X DIVERSIDADE BIOLÓGICA .......................................... 165
RESUMO DO TÓPICO 1 .................................................................................................................... 168
AUTOATIVIDADE .............................................................................................................................. 169
TÓPICO 2 – ÍNDICES ECOLÓGICOS ............................................................................................. 171

1 INTRODUÇÃO .................................................................................................................................. 171
2 ÍNDICES DE DIVERSIDADE ......................................................................................................... 171
2.1 ÍNDICES DE RIQUEZA . ............................................................................................................. 179
2.2 ÍNDICES DE DOMINÂNCIA ..................................................................................................... 181
2.3 ÍNDICES DE EQUITATIVIDADE .............................................................................................. 184
2.4 A UTILIZAÇÃO DO SOFTWARE PAST PARA CÁLCULO DOS ÍNDICES
ECOLÓGICOS . ............................................................................................................................. 185
RESUMO DO TÓPICO 2 .................................................................................................................... 198
AUTOATIVIDADE .............................................................................................................................. 199
REFERÊNCIAS ...................................................................................................................................... 201
X
UNIDADE 1
O MÉTODO ESTATÍSTICO E SUA

UTILIZAÇÃO NA ANÁLISE DE
DADOS
OBJETIVOS DE APRENDIZAGEM
A partir dessa unidade, você estará apto(a) a:
• reconhecer terminologias, símbolos e conceitos básicos encontrados na li-

teratura da estatística;
• reconhecer, em seus experimentos, a forma como organizar seus dados, de

forma concisa, e interpretando suas informações;
• ter maior compreensão em relação às teorias da probabilidade e da distri-

buição
PLANO DE ESTUDOS
Essa primeira unidade de estudo está dividida em seis tópicos. Você
encontrará, ao final de cada um deles, uma leitura complementar e atividades
que contribuirão para a compreensão dos conteúdos abordados
TÓPICO 1 – CONCEITOS APLICADOS À ESTATÍSTICA
TÓPICO 2 – OS MÉTODOS ESTATÍSTICOS
TÓPICO 3 – APRESENTAÇÃO DE DADOS
TÓPICO 4 – MÉTODOS DE AMOSTRAGEM
TÓPICO 5 – DISTRIBUIÇÃO DE PROBABILIDADE
TÓPICO 6 – INFERÊNCIAS ESTATÍSTICAS
1
2
UNIDADE 1
TÓPICO 1
CONCEITOS APLICADOS À ESTATÍSTICA
1 INTRODUÇÃO
Como acadêmico(a), você precisa conhecer alguns conceitos, de onde
derivam, quais são suas aplicações, e na estatística não é diferente, pois, como
dizem, “todo prédio deve ter um bom fundamento”.
Portanto, nesta unidade, você terá uma noção de alguns conceitos básicos
aplicados à estatística, bem como um breve histórico na leitura complementar.
A estatística possui uma importância relevante nas pesquisas, pois

acrescenta credibilidade aos dados analisados, tendo um grau elevado das
conclusões que o pesquisador tem de seus dados coletados e observados.
2 DEFINIÇÃO DE ESTATÍSTICA E BIOESTATÍSTICA

Ao olharmos para um experimento, ou mesmo montá-lo, queremos
sempre ter uma resposta ou equipará-lo a outras pesquisas parecidas. Para isso
precisamos de valores, de indicadores, para que possamos compará-los, atestá-
los, e, então, precisaremos da estatística.
Afinal, o que é essa tal de estatística?
Etimologicamente, a palavra estatística vem de “status” (estado), expressão

latina que define “sensu lato” como o estudo do estado (DORIA FILHO, 1999;
SOUNIS, 1971).
Segundo Padovani (2012, p. 16), a estatística constitui-se em uma ciência

destinada a:
I. Decidir o melhor plano (experimental ou observacional) para a

execução de uma pesquisa metodologia científica.
II. Organizar e resumir dados de contagem, mensuração e classificação
raciocínio dedutivo.
III. Inferir sobre populações de unidades (indivíduos, animais, objetos)
quando uma parte (amostra) é considerada raciocínio indutivo.
3
UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS
Padovani (2012, p. 16) menciona ainda que “[...] os métodos da estatística

matemática são universais (ubíquos), e o estatístico, assim como o especialista em
modelagem matemática, é capaz de colaborar em, praticamente, qualquer área de
conhecimento e atividade profissional [...]”.
Portanto, você poderá aplicar a estatística em qualquer experimento que

irá realizar, independentemente de sua área de atuação, pois é uma ciência que se
preocupa com a análise e interpretação e, assim, você terá dados concretos para
a tomada de possíveis decisões, baseado(a) nos valores obtidos de sua estatística.
De acordo com Motta e Wagner (2003, p. 15), a estatística se apresenta em

duas partes:
• Estatística descritiva: é aquela que você como o próprio nome diz,

aquela que se preocupa com a coleta, que organiza, que descreve,
expõe os dados nas tabelas, gráficos, além do cálculo de estimativas de
parâmetros representativos desses dados.
• Estatística inferencial: a partir das conclusões sobre a população
estatística, estabelece-se hipóteses sobre a população de origem.
FIGURA 1 - VISUALIZAÇÃO DA INTERAÇÃO DA ESTATÍSTICA DESCRITIVA

E A INFERÊNCIA ESTATÍSTICA
FONTE: Adaptado de Battisti e Battisti (2008)
Na estatística, há várias formas de se obter o resultado da análise de

um experimento, nos diversos ramos, como matemática, engenharia mecânica,
contabilidade, entre outros, porém, quando se trabalha com dados obtidos
nas áreas das ciências naturais, usa-se a estatística voltada para este campo,
denominada de bioestatística.
4
TÓPICO 1 | CONCEITOS APLICADOS À ESTATÍSTICA
Já a Bioestatística, de acordo com Padovani (2012, p. 15), “[...] é a

metodologia estatística aplicada às ciências biológicas, com a finalidade planejar,
coletar, organizar, resumir, analisar e interpretar os dados, permitindo tirar
conclusões biológicas sobre populações a partir do estudo de amostras [...]”.
A bioestatística pode ser aplicada, também, à medicina e às ciências

agrárias, porque ela está voltada às ciências ambientais, pois, muitas vezes, vocês
irão utilizar os fatores climáticos, ou dados de população, com diversos fatores
que influenciam de forma direta o resultado final.
Portanto, a estatística tem como objetivo principal tirar conclusões com

base nos resultados observados, levando em consideração todos os fatores
envolvidos no estudo.
NOTA
“[...] As aplicações na área de biometria (medicina, biologia, agronomia, psicologia

etc.), bem como nas ciências humanas, que tiveram enorme importância no desenvolvimento
dos métodos estatísticos. Recentemente, até mesmo áreas que tradicionalmente não faziam
análises baseadas em métodos quantitativos estão empregando modelos estatísticos
extremamente sofisticados na pesquisa científica. Como exemplo, pode-se citar o uso de
modelos logísticos em estudos de variação linguística, na sociolinguística [...]” (INSTITUTO DE
MATEMÁTICA DA UFRGS).
3 CONCEITOS APLICADOS À ESTATÍSTICA

Alguns conceitos são importantes, para que você saiba, como proceder, ou
levantar seus dados em campo, ou fazer comparações de dados ou entre dados.
Vamos a eles:
• População: é qualquer conjunto de informações que tenham entre si uma

característica comum (DORIA FILHO, 1999). Ex.: Num bairro, o conjunto das
estaturas de todos os moradores constitui uma “população de estaturas”, e o
tamanho de uma população é expressa pela letra N (maiúscula).
• Amostras: são subconjuntos representativos de uma dada população (DORIA

FILHO, 1999). Esta amostra deve representar de forma significativa seus valores
quantitativos e qualitativos, e ela é expressa pela letra n (minúscula).
5
• Hipótese: Segundo Kato (2015, p. 01), “em estatística, é uma suposição

formulada a respeito dos parâmetros de uma distribuição de probabilidade de
uma ou mais populações. Esta hipótese será testada com base em resultados
amostrais, sendo aceita ou rejeitada. Ela somente será rejeitada se o resultado
da amostra for claramente improvável de ocorrer quando a hipótese for
verdadeira. Consideremos Ho a hipótese nula, e H1 a hipótese alternativa a ser
testada (complementar de Ho). O teste pode levar à aceitação ou rejeição de Ho,
que corresponde, respectivamente, à negação ou afirmação de H1”.
• Nível de significância de um teste (α): é a probabilidade máxima de rejeitar

Ho. Se, por exemplo, utilizarmos o nível de significância de 5%, a hipótese nula
(Ho) será rejeitada somente se o resultado da amostra for tão diferente do valor
suposto que uma diferença igual ou maior ocorreria com uma probabilidade
máxima de 0,05. Na prática, o valor de α é fixo (geralmente, α = 0,01 ou 0,05 ou
0,10) (KATO, 2015).
• Variável aleatória: De acordo com Battisti e Battisti (2008), são as características

de uma população ou uma amostra. Para o exemplo dado, as variáveis aleatórias
são as questões que o instrumento de coleta de dados (também chamado
de questionário) contempla, por exemplo: idade, estado civil, escolaridade,
número de filhos, qual atividade exerce, tempo que exerce a atividade, quantas
horas trabalha por semana, se é autônomo ou empregado, e muitas outras.
Classificamos as variáveis aleatórias em qualitativas e quantitativas:
- As variáveis qualitativas têm seus valores (respostas para cada questão do

questionário) não numéricos, como sexo, estado civil, nível de escolaridade,
bairro, profissão, nível de satisfação. As variáveis quantitativas têm seus
valores numéricos, tais como: idade, peso, salário, tempo de serviço,
número de filhos. As variáveis qualitativas são subdivididas em nominais e
ordinais. Quando as diferentes categorias (respostas) não têm relação entre
si, ou seja, são independentes, classificamos a variável como qualitativa
nominal, por exemplo, sexo, estado civil, curso de graduação e bairro. Por
outro lado, quando as categorias têm uma relação entre si, geralmente
atribuindo níveis, como o nível de escolaridade e o grau de satisfação do
cliente, são denominadas qualitativas ordinais.
- As variáveis quantitativas são subdivididas em discretas e contínuas. Motta e

Wagner (2003) descrevem que as variáveis quantitativas discretas assumem
somente valores numéricos inteiros, como: número de filhos, número de
alunos, número de computadores. Já as variáveis quantitativas contínuas
podem assumir qualquer valor numérico, resultado de uma medida dentro
de um certo intervalo de variação possível, como: peso, idade e salário.
6
FIGURA 2 - RESUMO DAS VARIÁVEIS ALEATÓRIAS
Nominal
Qualitativa
Ordinal
Variável
Aleatória
Discreta
Quantitativa
Contínua
FONTE: Adaptado de Battisti e Battisti (2008)
• Dados primários e dados secundários: De acordo com Battisti e Battisti (2008),

os dados primários estão disponíveis na sociedade (idade, sexo, estado civil) e
os secundários estão organizados de alguma forma, geralmente, nos meios de
comunicação e publicações científicas (tabelas, gráficos).
LEITURA COMPLEMENTAR
O texto a seguir foi retirado, na íntegra, do site do Instituto de Matemática da

Universidade Federal do Rio Grande do Sul. Nele você conhecerá o começo da história da
estatística, e seus principais percursores.
HISTÓRIA DA ESTATÍSTICA
A origem da palavra Estatística está associada à palavra latina STATUS

(Estado). Há indícios de que há 3.000 anos a.C. já se faziam censos na Babilônia,
China e Egito; até mesmo o 4º livro do Velho Testamento faz referência a uma
instrução dada a Moisés para que fizesse um levantamento dos homens de Israel
que estivessem aptos para guerrear. Usualmente, estas informações eram utilizadas
para a taxação de impostos ou para o alistamento militar. O Imperador César
Augusto, por exemplo, ordenou que se fizesse o censo de todo o Império Romano.
A palavra CENSO é derivada da palavra CENSERE, que em latim

significa TAXAR. Em 1085, Guilherme, o Conquistador, solicitou um
levantamento estatístico da Inglaterra, que deveria conter informações sobre
terras, proprietários, uso da terra, empregados e animais. Os resultados deste
censo foram publicados em 1086, no livro intitulado “Domesday Book”, e
serviram de base para o cálculo de impostos.
7
Contudo, mesmo que a prática de coletar dados sobre colheitas, composição

da população humana ou de animais, impostos etc. fosse conhecida pelos egípcios,
hebreus, caldeus e gregos, e se atribua a Aristóteles cento e oitenta descrições de
estados, apenas no século XVII a Estatística passou a ser considerada disciplina
autônoma, tendo como objetivo básico a descrição dos BENS do Estado.
A palavra Estatística foi cunhada pelo acadêmico alemão Gottfried

Achenwall (1719-1772), que foi um notável continuador dos estudos de Hermann
Conrig (1606-1681). A escola alemã atingiu sua maturidade com A. L. von Schlozer
(1735-1809), mas sempre com ideias diferentes daquelas que fundamentaram
a Estatística Moderna. Com algum exagero, pode-se dizer que o seu principal
legado foi o termo “STAATENKUNDE”, que deu origem à designação atual. Na
Enciclopédia Britânica, o verbete “STATISTICS” apareceu em 1797.
Em contraposição à natureza eminentemente qualitativa da escola

alemã, na Inglaterra do século XVII surgiram os aritméticos políticos, dentre os
quais destacaram-se John Graunt (1620-1674) e William Petty (1623-1687). Eles
preocuparam-se com o estudo numérico dos fenômenos sociais e políticos, na busca
de leis quantitativas que pudessem explicá-los. O estudo consistia essencialmente
de exaustivas análises de nascimentos e mortes, realizadas através das Tábuas de
Mortalidade, que deram origem às atuais Tábuas de Mortalidade usadas pelas
companhias de seguros. Um dos resultados mais importantes foi a constatação de
que o percentual de nascimento de crianças do sexo masculino (51%) é levemente
superior ao do sexo feminino (49%). Dessa forma, a escola dos aritméticos políticos
pode ser considerada o berço da Demografia. Um de seus mais notáveis adeptos foi
o pastor alemão Sussmilch (1707-1767), com o qual pode-se dizer que a Estatística
aparece pela primeira vez como meio indutivo de investigação.
Na última metade do século XIX, os alemães Helmert (1843-1917) e

Wilhelm Lexis (1837-1914), o dinamarquês Thorvald Nicolai Thiele (1838-1910) e o
inglês Francis Ysidro Edgeworth (1845-1926) obtiveram resultados extremamente
valiosos para o desenvolvimento da Inferência Estatística, muitos dos quais só
foram completamente compreendidos mais tarde. Contudo, o impulso decisivo
deve-se a Karl Pearson (1857-1936), William S. Gosset (1876-1937) e, em especial,
a Ronald A. Fisher (1890-1962).
Karl Pearson (1857-1936) formou-se em 1879 pela Cambridge University

e, inicialmente, dedicou-se ao estudo da evolução de Darwin, aplicando os
métodos estatísticos aos problemas biológicos relacionados com a evolução e
hereditariedade. Em 1896, Pearson foi eleito membro da Royal Society of London.
Entre 1893 e 1912 escreveu um conjunto de 18 artigos denominado

Mathematical Contribution to the Theory Evolution, com contribuições extremamente
importantes para o desenvolvimento da teoria da Análise de Regressão e do
Coeficiente de Correlação, bem como do teste de hipóteses de qui-quadrado. Em
sua maioria, seus trabalhos foram publicados na revista Biometrika, que fundou
8
em parceria com Walter Frank Raphael Weldon (1860-1906) e Francis Galton

(1822-1911). Além da valiosa contribuição que deu para a teoria da regressão e
da correlação, Pearson fez com que a Estatística fosse reconhecida como uma
disciplina autônoma. Uma coleção de seus artigos foi publicada em “Karl Pearson
Early Statistical Papers” (Ed. por E. S. Pearson, Cambridge University Press, 1948).
Para ver uma relação de alguns trabalhos publicados por Karl Pearson
William Sealey Gosset (1876-1937) estudou Química e Matemática na New

College Oxford. Em 1899, foi contratado como Químico da Cervejaria Guiness
em Dublin, desenvolvendo um trabalho extremamente importante na área de
Estatística. Devido à necessidade de manipular dados provenientes de pequenas
amostras, extraídas para melhorar a qualidade da cerveja, Gosset derivou o teste
t de Student baseado na distribuição de probabilidades.
Esses resultados foram publicados em 1908 na revista Biometrika, sob

o pseudônimo de Student, dando origem a uma nova e importante fase dos
estudos estatísticos. Gosset usava o pseudônimo de Student, pois a Cervejaria
Guiness não desejava revelar aos concorrentes os métodos estatísticos que estava
empregando no controle de qualidade da cerveja. Os estudos de Gosset podem
ser encontrados em “Student Collected Papers” (Ed. por E.S.Pearson e J. Wishart,
University College, Londres, 1942).
A contribuição de Ronald Aylmer Fisher (1890-1962) para a Estatística

Moderna é, sem dúvidas, a mais importante e decisiva de todas. Formado
em astronomia pela Universidade de Cambridge, em 1912, foi o fundador do
célebre Statistical Laboratory da prestigiosa Estação Agronômica de Rothamsted,
contribuindo enormemente tanto para o desenvolvimento da Estatística quanto
da Genética. Ele apresentou os princípios de planejamento de experimentos,
introduzindo os conceitos de aleatorização e da Análise da Variância,
procedimentos muito usados atualmente.
No princípio dos anos 20, estabeleceu o que a maioria aceita como a

estrutura da moderna Estatística Analítica, através do conceito da verossimilhança
(likelihood, em inglês). O seu livro intitulado “Statistical Methods for Research
Workers”, publicado pela primeira vez em 1925, foi extremamente importante
para familiarizar os investigadores com as aplicações práticas dos métodos
estatísticos e, também, para criar a mentalidade estatística entre a nova geração de
cientistas. Os trabalhos de Fisher encontram-se dispersos em numerosas revistas,
mas suas contribuições mais importantes foram reunidas em “Contributions to
Mathematical Statistics” (J. Wiley & Sons, Inc., Nova Iorque, 1950).
Fisher foi eleito membro da Royal Society em 1929 e condecorado com as

medalhas Royal Medal of the Society e Darwin Medal of the Society em 1938 e
em 1948, respectivamente. Em 1955, foi novamente condecorado, desta vez com a
medalha Copley Medal of the Royal Society.
9
Outra área de investigação extremamente importante para o

desenvolvimento da Estatística é a Teoria das Probabilidades. Usualmente,
costuma-se atribuir a origem do Cálculo de Probabilidades às questões relacionadas
aos jogos de azar que o célebre cavaleiro Méré (1607-1684) encaminhou à Blaise
Pascal (1623-1662).
No entanto, outros autores sustentam que o Cálculo de Probabilidades

teve a sua origem na Itália, com especial referência para Luca Pacioli (1445-1517),
Girolamo Cardano (1501-1576), Nicolo Fontana Tartaglia (1500-1557) e Galileo
Galilei (1564-1642).
Três anos depois de Pascal ter previsto que a “aliança do rigor geométrico”
com a “incerteza do azar” daria lugar a uma nova ciência, Christiaan Huygens
(1629-1695) publicou o trabalho denominado “De Raciociciis in Ludo Aleae”, que é
considerado o primeiro livro sobre o Cálculo de Probabilidades. Além disso, ainda
teve a notável particularidade de introduzir o conceito de esperança matemática.
Gottfried Wilhelm von Leibniz (1646-1716) também dedicou-se ao

estudo do Cálculo de Probabilidades, publicando um trabalho sobre a “arte
combinatória” e outro sobre aplicações às questões financeiras. Leibniz
também estimulou Jacques Bernoulli (1654-1705) ao estudo do Cálculo
de Probabilidades, cuja grande obra, denominada “Ars Conjectandi”, foi
publicada oito anos após a sua morte.
Em Ars Conjectandi, de Jacques Bernoulli, foi publicada e rigorosamente

provada a Lei dos Grandes Números de Bernoulli, considerado o primeiro
teorema limite. Pode-se dizer que, graças às contribuições de Bernoulli, o Cálculo
de Probabilidades adquiriu o status de ciência.
Além da obra póstuma de Bernoulli, o início do século XVII foi marcado

pelos livros de Pierre Rémond de Montmort (1678-1719), denominado Essai
d’Analyse sur les Jeux de Hazard, e de Abraham De Moivre (1667-1754), intitulado
The Doctrine of Chances.
De Moivre era francês de nascimento, mas desde a sua infância refugiou-

se na Inglaterra devido às guerras religiosas, fazendo aplicações ao cálculo de
anuidades e estabelecendo uma equação simples para a lei da mortalidade entre 22
anos e o limite da longevidade que fixou em 86 anos. Mais tarde, na “Miscellanea
Analytica”, apresentou resultados aos quais Laplace deu uma forma mais geral e
que constituem o segundo teorema limite.
É extremamente importante falar, também, do reverendo Thomas Bayes

(1702-1761), a quem se deve o conceito de probabilidade inversa, relacionado com
situações em que se caminha do particular para o geral. No seu livro denominado
“Essay towards solving a problem of the doctrine of chances” (Philosophical
Transactions of the Royal Society of London, 1764-65, póstumo), Bayes formula,
10
através do teorema que leva seu nome e do postulado que tantas vezes se lhe
associa, a primeira tentativa de matematização da inferência Estatística. Mesmo
sem ter publicado nenhum trabalho com seu nome, em 1742 Thomas Bayes foi
eleito membro da Royal Society of London.
Os estudos dos astrônomos Pierre-Simon Laplace (1749-1827), Johann

Carl Friedrich Gauss (1777-1855) e Lambert Adolphe Jacques Quetelet (1796-
1874) foram fundamentais para o desenvolvimento do Cálculo de Probabilidades.
Devido aos novos métodos e ideias, o trabalho de Laplace de 1812, intitulado
“Théorie Analytique des Probabilités”, até o presente é considerado um dos mais
importantes trabalhos sobre a matéria.
Johann Carl Friedrich Gauss, professor de astronomia e diretor do

Observatório de Gottingen, em 1809, apresentou o estudo intitulado “Theoria
combinationis Observatorium Erroribus Minimis Obnoxia”, explanando uma
teoria sobre a análise de observações aplicável a qualquer ramo da ciência,
alargando o campo de aplicação do Cálculo de Probabilidades.
Com Lambert Adolphe Jacques Quetelet, por sua vez, inicia-se a aplicação
aos fenômenos sociais. O seu escrito “Sur l’homme et le développement de ses
facultés” foi publicado em segunda edição com o título “Physique sociale ou
Essai sur le développement des facultés de l’homme”, que incluía pormenorizada
análise da teoria da probabilidade. Quetelet introduziu também o conceito de
“homem médio” e chamou particular atenção para a notável consistência dos
fenômenos sociais. Por exemplo, mostrou que fatores como a criminalidade
apresentam permanências em relação a diferentes países e classes sociais.
Antoine Augustin Cournot (1801-1877) percebeu a importância da Teoria

das probabilidades na análise estatística, tendo sido o pioneiro no tratamento
matemático dos fenômenos econômicos. Suas ideias foram publicadas em
“Exposition de la théorie des chances et des probabilités”.
Na segunda metade do século XIX, a Teoria das Probabilidades atingiu um

dos pontos mais altos com os trabalhos da escola russa fundada por Pafnuty Lvovich
Chebyshev (1821-1894), que contou com representantes como Andrei Andreyevich
Markov (1856-1922) e Aleksandr Mikhailovich Lyapunov (1857-1918).
Contudo, o seu maior expoente foi Andrey Nikolayevich Kolmogorov (1903-

1987), a quem se deve um estudo indispensável sobre os fundamentos da Teoria
das Probabilidades, denominado “Grundbegrife der Warscheinlichkeitrechnung”,
publicado em 1933. Em 1950, foi traduzido para o Inglês sob o título “Foundations
of Probability”.
FONTE: Disponível em: <http://www.ufrgs.br/mat/graduacao/estatistica/historia-da-estatistica>.

Acesso em: 19 abr. 2015.
11
RESUMO DO TÓPICO 1
Neste tópico você viu que:
• A estatística tem como definição: a ciência de coletar, organizar, apresentar,

analisar e interpretar dados numéricos com o objetivo de tomar melhores
decisões.
• Estatística Descritiva como sendo: os procedimentos usados para organizar,

resumir e apresentar dados numéricos.
• Estatística Indutiva ou Inferencial como a coleção de métodos e técnicas

utilizados para se estudar uma população baseados em amostras probabilísticas
desta mesma população.
• Bioestatística é voltada ao planejamento, à avaliação e interpretação de dados

biológicos.
12
AUTOATIVIDADE
1 Qual é a definição de bioestatística? E de que forma ela pode se apresentar?
2 Com relação à leitura complementar, faça um resumo cronológico sobre a

estatística.
13
14
UNIDADE 1
TÓPICO 2
MÉTODOS ESTATÍSTICOS
1 INTRODUÇÃO
Neste tópico, você irá perceber que estatística não é um cálculo fixo,
dependendo do que você realizará, ou a forma que conduzirá seu experimento,
irá também alterar o curso de seus cálculos.
Você irá ver que os dados possuem denominações dentro da estatística, e

conforme você conduz seu experimento, irá ver que o tamanho amostral pode ser
verificado em formas diferentes para ter o valor.
2 MÉTODOS
Quando você se prepara para viajar, você se organiza, coloca a roupa na
mala e, sem querer, está seguindo um método para que não se esqueça de nada.
A estatística funciona assim também, isto é, você possui um conjunto de

dados pertinentes para chegar a um determinado resultado, os quais podem ser
experimentais e estatísticos.
2.1 MÉTODO EXPERIMENTAL

O próprio nome já diz: é um método que consiste, através da
experimentação, manter constante todas as causas (fatores), menos uma,
variando-a de modo que se possa descobrir seus efeitos, caso existam. Esse
método passa por várias etapas: observação, hipótese, experimentação e teoria.
A pesquisa experimental procura entender de que modo ou por quais causas
o fenômeno é produzido, sendo utilizada nos diversos campos da atividade
humana, bem como nas disciplinas de física, química, biologia, entre outras.
Vantagens e desvantagens: possibilita conhecimento mediante

procedimentos experimentais, porém, por exigir previsão e controle, torna-se, às
vezes, inviável para objetos sociais. A pesquisa experimental exige um plano ou
protocolo do experimento com passos bem definidos.
15
2.2. MÉTODO ESTATÍSTICO

Com certa frequência, torna-se impossível fazer uso do método
experimental, isso se deve porque não é possível manter constantes todos os
fatores que envolvem um determinado fenômeno de estudo, pois cada variação
que ocorrer você deve registrar e procurar determinar, no resultado final, que
influências cabem a cada uma delas, ou seja, é muito importante controlar as
variáveis que podem interferir em seu experimento.
2.3 IMPORTÂNCIA DA ESCOLHA DO MÉTODO

Quando você realizar um experimento, deve se ater ao que você deseja
como resultado final, ou seja, o que você pretende com esta pesquisa, que tipo
de conclusões quer tirar do estudo que se propôs a fazer, por isso é importante
a escolha do método, lembrando que, na estatística descritiva, a coleta, a
organização, a descrição dos dados, o cálculo e a interpretação de coeficientes
pertencem a este método, enquanto que a análise e a interpretação dos dados,
associadas a uma margem de incerteza, ficam a cargo do método estatístico.
3 ETAPAS DO TRABALHO ESTATÍSTICO
3.1 PLANEJAMENTO – DEFINIÇÃO DO PROBLEMA

Uma vez definido o problema que se deseja resolver, você irá trazer as
observações (informações) colhidas de uma determinada população.
Exemplo: numa determinada região, há o crescimento excessivo de

uma alga que está prejudicando o ambiente local. E isto chamou sua atenção.
Você, em campo, observa como o ambiente se apresenta; tenta verificar qual
a origem dessa explosão populacional; verifica se há apenas uma espécie
ou mais nesta área, estuda as condições ambientais (temperatura, umidade,
pluviosidade, entre outras) etc.
Você faz todo o estudo, verificando quais informações são as mais

relevantes para o caso.
3.2 COLETA DE DADOS

Eles podem ser:
• Direta: quando feita sobre elementos informativos de registro obrigatório ou

coletados pelo próprio pesquisador. Essa coleta pode ser contínua, periódica
ou ocasional.
16
TÓPICO 2 | MÉTODOS ESTATÍSTICOS
• Indireta: quando é feita com base em elementos já pesquisados (revista, jornal,

livros etc.)
Na coleta de dados, podemos ter:
• Dados discretos - resultam de contagens de eventos. Exemplo: número de

filhos, número de batimentos cardíacos por minuto.
• Dados contínuos - estes dados são obtidos de algum tipo de medição: altura,
peso, pressão arterial, temperatura corporal.
• Rankings ou postos – ocasionalmente, os dados representam a posição relativa

dos membros de um grupo com relação a algum ranking. A posição de um
indivíduo neste ranking é chamada de posto.
• Porcentagens - é necessário ter cuidado quando os dados com os quais se

trabalha são porcentagens observadas.
• Escores - são usados quando não é possível fazer medições diretas. Em sua
forma mais simples, estes sistemas numéricos classificam uma característica
em diversas categorias segundo a opinião de um indivíduo. Por exemplo, a
dor de um ferimento pode ser classificada como leve, moderada ou severa,
podendo ser designado um valor numérico a cada categoria. Deve ser notado
que estas escalas são subjetivas.
• Dados censurados - uma observação é chamada censurada se não pode

ser medida de forma precisa, mas sabe-se que está além, ou aquém, de um
limite. Por exemplo, em alguns experimentos existe um período fixo de
acompanhamento, sendo a variável de interesse o tempo para aparecer um
sintoma ou desaparecer alguma condição específica.
3.3 TAMANHO AMOSTRAL

Essa é sempre a maior dúvida dos pesquisadores: qual deve ser o
tamanho de minha amostra? Esse é um ponto importante na pesquisa e, para
realizar o cálculo do tamanho da amostra, segundo Motta e Wagner (2003), deve-
se entender que o procedimento é totalmente baseado em pressuposições que o
pesquisador faz em relação aos dados que irá encontrar. Nesse contexto, há dois
tipos de estimativas para o tamanho amostral: cálculo para estudos analíticos e
cálculo para estudos descritivos.
17
3.3.1 Estudos analíticos

Segundo Motta e Wagner (2003, p. 171), “[...] o primeiro passo é estabelecer
a sua hipótese de pesquisa, para que possam identificar o tipo de variável
envolvida e o tipo de teste estatístico para a qual há fórmula disponível, fixando
os níveis máximos de erro do tipo I (α) e do tipo II (β) o tamanho amostral é
facilmente calculado [...]”.
Ainda segundo os autores, dentro do estudo analítico temos a variável

quantitativa e a variável qualitativa.
Na variável quantitativa, você deve comparar dois grupos, devendo-se

estimar:
Média esperada no grupo 1.

Média esperada no grupo 2.
Dispersão da variável nos dois grupos (usar desvio-padrão).
Com a diferença das médias, pode-se saber qual o efeito mínimo a ser
detectado pelo estudo.
Eis a fórmula:
Sendo:
Zα: valor de Z na curva normal segundo α (geralmente bicaudal).
Zβ: valor de Z na curva normal segundo β (sempre unicaudal).
Sa: desvio-padrão no grupo a.
Sb: desvio-padrão no grupo b.
Xa − Xb : diferença mínima a ser detectada no estudo.
Esta fórmula apresenta o tamanho amostral mínimo necessário por grupo,

supondo grupos de tamanhos iguais e que corriqueiramente são utilizados α
(0,05) e β (0,10) (MOTTA; WAGNER, 2003).
A variável qualitativa, de acordo com Motta e Wagner (2003), relata que,

no caso de proporções, tudo que se precisa são os valores das proporções a serem
testados. Eis a fórmula a seguir:
Z pa qa pb qb Z 2 p0 q0
n
p
2
a
pb
18
TÓPICO 2 | MÉTODOS ESTATÍSTICOS
Onde:

Zβ: valor de Z na curva normal segundo β (sempre unicaudal).
pa: proporção no grupo a.
qa: complemento do pa, ou seja, (1-pa).
pb: proporção no grupo b.
qb: complemento do pb, ou seja, (1-pb).
p0: proporção ponderada; p0=(xa+xb)/(na+nb), onde x é o nº de eventos
observados.
qb= complemento de p0, ou seja, (1-p0).
pa-pb= diferença mínima a ser detectada no estudo.
Assim, como na fórmula anterior, a fórmula apresenta n mínimo por grupo

para testagem de um efeito; em proporções, os valores mais corriqueiramente
utilizados para α é 0,05 e para β é 0,20 (MOTTA; WAGNER, 2003).
3.3.2 Estudos descritivos

De acordo com Motta e Wagner (2003),
em estudos descritivos, ou seja, estimativa de parâmetros quantitativos

(μ) ou qualitativos (π) a estimativa do tamanho amostral baseia-se
essencialmente na margem do erro que será aceita no intervalo de
confiança do parâmetro, usando-se o α, mas sem necessidade de fixar
β e efeito mínimo a testar.
Ainda segundo os autores, dentro do estudo descritivos temos a variável

quantitativa e a variável qualitativa.
A variável quantitativa, após fixar o α, determina o valor esperado para

o desvio padrão da variável e qual sua margem de erro máxima tolerável, ou
seja, qual a diferença máxima (para cima ou para baixo) que será aceitável pelo
pesquisador errar em relação ao parâmetro.
4 Z2 S2
Eis a fórmula: n
2 ME
2
Onde:
S: desvio-padrão da variável.
ME: margem de erro máximo tolerável em relação ao parâmetro.
19
Já com a variável qualitativa, estima-se em que faixa de valor se espera

que seja o parâmetro (p. e 0,10; 0,50 ou 0,80) e, em seguida, qual a margem de erro
máxima tolerável.
4Z2 pq
p
Segue a fórmula: n
2 ME
2
Onde:
p: estimativa inicial da proporção.
q: complemento de p, ou seja, (1-p).
ME: margem de erro máximo tolerável em relação ao parâmetro.
20
RESUMO DO TÓPICO 2
• Método experimental é um método que, através da experimentação, mantém

constante todas as causas (fatores), menos uma, variando-a de modo que se
possa descobrir seus efeitos, caso existam. Esse método passa por várias etapas:
observação, hipótese, experimentação e teoria.
• No método estatístico é muito importante controlar as variáveis que podem

interferir em seu experimento.
• A coleta de dados pode ser direta, ou seja, quando feita sobre elementos
informativos de registro obrigatório ou coletados pelo próprio pesquisador,
podendo ser contínua, periódica ou ocasional; e indireta, ou seja, quando é
feita com base em elementos já pesquisados (revista, jornal, livros etc.).

• Dependendo da estatística que você irá aplicar, o tamanho amostral vai variar
entre o analítico e o descritivo.
21
AUTOATIVIDADE
1 Descreva as diferenças entre o método estatístico e o experimental.
2 A coleta de dados pode ser:
3 Os dados podem se apresentar de que forma?
4 Em relação ao tamanho amostral, descreva as diferenças do cálculo para

estudos analíticos e do cálculo para estudos descritivos.
22
UNIDADE 1
TÓPICO 3
APRESENTAÇÃO DE DADOS
1 INTRODUÇÃO
Gráficos, como equações e tabelas, mostram como se relacionam duas ou
mais grandezas físicas. Como investigar quais são as relações existentes entre as
grandezas constitui grande parte do trabalho, tanto experimental como teórico,
em física; equações, tabelas e gráficos são importantes ferramentas.
Assim, uma boa forma de analisar um conjunto de dados experimentais

e resumir os resultados é colocá-los em um gráfico. É importante fornecer, no
gráfico, toda a informação necessária que permita sua leitura correta e simples.
Neste tópico, você irá ver como se monta uma tabela de dados, bem como
as diversas formas que se apresentam os gráficos.
2 TABELAS ESTATÍSTICAS
De acordo com Almeida, Araújo e Ramos (2009), a apresentação tabular é
uma apresentação numérica dos dados. Consiste em dispor os dados em linhas
e colunas distribuídos de modo ordenado, segundo algumas regras práticas
adotadas pelos diversos sistemas estatísticos. As regras que prevalecem no Brasil
foram fixadas pelo Conselho Nacional de Estatística.
Tabela: é uma maneira de apresentar de forma resumida um conjunto

de observações (dados). As tabelas têm a vantagem de conseguir expor
organizadamente, em um só local, os resultados sobre determinado assunto, de
modo a se obter uma visão global mais rápida daquilo que se pretende analisar
(ALMEIDA; ARAÚJO; RAMOS, 2009).
Uma tabela compõe-se de: título, corpo (cabeçalho, colunas (indicadoras

e numéricas)) e rodapé.
23
FIGURA 3 - PRINCIPAIS ELEMENTOS DA TABELA
Título: o que? Quando? Onde?

cabeçalho
Corpo
da O cruzamento de linha com
tabela Coluna indicadora Coluna numérica
coluna chama-se casa ou célula
Rodapé: fontes, notas, observações
FONTE: Almeida, Araújo e Ramos (2009)
Principais elementos da tabela, de acordo dom Almeida, Araújo e Ramos

(2009):
• Título da tabela: localizado no topo, deve conter as informações mais completas

possíveis, além de conter a palavra “TABELA” e com sua respectiva numeração.
• Corpo da tabela: é o conjunto de linhas e colunas que contém informações sobre

a variável de estudo; observando que:
- Na parte superior da tabela há o cabeçalho da coluna, que especifica o

conteúdo da coluna.
- Verticalmente, tem-se as colunas (indicadora e numérica), onde a coluna

indicadora é aquela que especifica o conteúdo das linhas e, na coluna
numérica, os valores numéricos destas linhas.
• Rodapé: localizado na parte inferior da tabela, e contém informações sobre o

responsável (fonte). Algum texto esclarecedor do conteúdo da tabela (nota) e
algum símbolo remissível atribuído a algum elemento que necessite de uma
nota (chamada).
E
IMPORTANT
Não se delimita, ou seja, fechar as laterais da tabela. Usa-se um traço horizontal

(-) quando o dado for nulo; usa-se [...] quando não se dispuser de dados, embora ele possa
ser quantificado; e usa-se zero (0) quando o valor é muito pequeno para ser expresso pela
unidade utilizada; também usa-se (?) quando temos dúvidas na unidade.
Adotar as configurações de tamanho do título, bem como o tamanho da fonte e demais
informações conforme as configuração das normas brasileiras - NBR 14724/2011.
24
TÓPICO 3 | APRESENTAÇÃO DE DADOS
Séries estatísticas: é um conjunto de dados estatísticos referenciados a

seguintes fatores: tempo, local e fenômeno.
A seguir, alguns exemplos fictícios:
1º) Série temporal ou cronológica: nesta série, o elemento de variação é o tempo

(dia, mês, ano etc.)
TABELA 1- QUANTIDADE DE SCHINUS TEREBINTHIFOLIUS (AROEIRA), ENCONTRADA

NA ÁREA DE PRESERVAÇÃO PERMANENTE DA LOCALIDADE DE TIJUCA, NUM
PERÍODO DE 2012 A 2014.
Anos Quantidade
2012 14
2013 20
2014 05
FONTE: O autor
2º) Série geográfica: o elemento de variação é o lugar (município, bairro, país,

escola etc).
TABELA 2 - A ESPÉCIE PASSER DOMESTICUS (PARDAL), CATALOGADOS PARA COLETA

DE SANGUE E MAPEAMENTO GENÉTICO EM TRÊS ESTADOS BRASILEIROS
Estados Quantidade
Pará 2.458
São Paulo 3.587
Minas Gerais 7.598
FONTE: O autor
3º) Série especificativa: o elemento de variação é a espécie (material escolar,

remédios, fauna, flora, produto de uma fábrica etc.).
TABELA 3 - QUANTIDADE DE CADA ESPÉCIE ENCONTRADA NO ESTADO DE

SANTA CATARINA NO ANO DE 2013
Espécies Quantidade
Cedrela fissilis 2.458
Ocotea porosa 3.587
Nectandra lanceolata 7.598
FONTE: O autor
25
4º) Série mista: é a junção de duas ou mais séries simples (geográfica, especificativa
ou temporal)
TABELA 4 - CASOS DE DENGUE REGISTRADOS NUM PERÍODO DE 4 ANOS, EM 4 MUNICÍPIOS

ESCOLHIDOS ALEATORIAMENTE
Anos
Municípios
2011 2012 2012 2014
Florianópolis 4 - 14 5
Blumenau 8 14 11 -
Tijucas 7 13 8 4
Lajes - 5 12 3
FONTE: O autor (2015)
3 DISTRIBUIÇÃO POR FREQUÊNCIA

Por constituir-se um tipo de tabela importante para a Estatística Descritiva,
faremos um estudo com toda distribuição de frequências. Uma distribuição
de frequências condensa um grande número de dados numa tabela, de modo
que 100, 200, 500 ou um número qualquer de valores pode ser representado em
poucas linhas. É uma série estatística específica em que os dados encontram-se
dispostos em classes ou categorias junto às suas frequências correspondentes.
Neste caso, todos os elementos são fixos (época, local, fenômeno). A distribuição
de frequência pode ser por intervalo ou por pontos, sendo que isto depende muito
da quantidade de informações que você tiver ou do tipo da variável.
3.1 DISTRIBUIÇÃO DE FREQUÊNCIA POR PONTOS

É uma série estatística na qual a variável observada está dividida em
subintervalos do intervalo total observado, e o tempo, a espécie e a região
permanecem fixos.
Usada para variáveis qualitativas ou quantitativas discretas com poucos

valores diferentes. As observações são representadas em uma tabela de frequências,
não agrupadas em classes. Exemplos: número de acidentes de trabalho na
Empresa X; quantidade de livros de estatística na biblioteca da UNIASSELVI. Eis
um exemplo de distribuição de frequências para variável discreta:
26
TABELA 5 - NÚMERO DE ACIDENTES DE TRABALHO EM PEQUENAS EMPRESAS

DA CIDADE DE PORTO ALEGRE (2013)
Número de Empresas
Nº de acidentes (Xi)
(fi)
0 35
1 20
2 14
3 18
4 06
5 ou mais 38
Total 131
FONTE: O autor (2015)
Xi = identifica as categorias em que o fato se subdivide.

fi = corresponde à frequência absoluta, isto é, o número de vezes que cada
uma das categorias ocorre.
N = soma dos fi = total de elementos observados na população.
n = soma dos fi
3.2. DISTRIBUIÇÃO DE FREQUÊNCIA POR INTERVALOS

Usada para variáveis quantitativas contínuas ou discretas com muitos
valores diferentes, sendo as variáveis observadas representadas sob a forma de
intervalos. Geralmente, esta variável provém de medições.
Vamos ao exemplo:
X = Notas finais de 50 estudantes da disciplina de estatística

22 46 9 40 57 22 22 13 50 42
35 2 15 41 34 52 32 75 69 44
26 42 60 56 30 3 17 79 45 37
0 12 62 50 45 41 59 11 66 39
43 33 70 50 47 20 36 40 67 29
Então, a distribuição de frequência será expressa pela tabela:
27
TABELA 6 – NOTAS FINAIS DOS ESTUDANTES DA DISCIPLINA DE

ESTATÍSTICA –2009/1
Notas fi
0 I--- 10 4
10 I--- 20 5
20 I--- 30 6
30 I--- 40 8
40 I--- 50 12
50 I--- 60 7
60 I--- 70 5
70 I--- 80 3
Total 50
FONTE: Fioreze e Marques (2015)
NOTA
fi é a frequência absoluta das classes, ou seja, quantas vezes ele aparece dentro
dessa classe.
A seguir, o passo a passo para a tabela de frequências (FIOREZE;

MARQUES, 2015).
1. Dados Brutos: são os dados originais conforme eles foram coletados,

não estando, portanto, numericamente organizados ou tabelados. Como exemplo
tem-se as 50 notas dos alunos.
2. Rol : é uma lista, onde os valores são dispostos em ordem crescente ou

decrescente. No exemplo das notas, o rol é:
0 2 3 9 11 12 13 15 17 20
22 22 22 26 29 30 32 33 34 35
36 37 39 40 40 41 41 42 42 43
44 45 45 46 47 50 50 50 52 56
57 9 60 62 66 67 69 70 75 79
3. Amplitude Total (H): é a diferença entre o maior valor e o menor valor

observado da variável em estudo.
28
H = Xmáx -Xmín
No nosso caso, a nota maior é 79 é a menor é 0; logo, nossa amplitude total

é H = 79 -0 = 79.
Cumpre observar que, quando não dispusermos dos dados, o cálculo da

amplitude se fará levando-se em consideração a diferença entre o limite superior
da última classe e o limite inferior da primeira classe.
4. Limites de Classe: são os números extremos de cada intervalo: sendo

assim, temos um limite inferior e um superior. Se a primeira classe tiver um
intervalo de notas de 0 até 10, o 0 será o limite inferior enquanto que o 10 será o
limite superior desta classe.
5. Classe: é cada um dos intervalos em que os dados são agrupados.

Existem várias maneiras de apresentarmos o intervalo de classes: iguais ou
diferentes entre si. Porém, sempre que possível, deveremos optar por intervalos
iguais, o que facilitará os cálculos posteriores. Mesmo com intervalos iguais, as
distribuições poderão apresentar-se da seguinte forma:
I--- inclui à esquerda e exclui à direita

---I exclui à esquerda e inclui à direita
--- exclui ambos
I---I inclui ambos
Como optaremos por este último tipo (0 - 10), poderemos definir como
intervalo de classe a diferença entre o limite superior e o limite inferior da classe.
Portanto, no exemplo, 10 – 0 = 10 é o intervalo ou amplitude da classe que será
representado pela letra h.
6. Ponto médio das classes (Xi): É a média aritmética entre o limite superior
e o limite inferior da classe. Assim, se a classe for 0 - 10, teremos 0 + 10 / 2 = 5, que
será o ponto médio da classe.
7. Número de Classes: Quantas classes serão necessárias para representar

o fato? Existem vários critérios que podem ser utilizados a fim de determinar o
número de classes, porém tais critérios servirão apenas como indicação e nunca
como regra fixa, pois caberá sempre ao pesquisador estabelecer o melhor número,
levando-se em conta o intervalo de classe e a facilidade para os posteriores cálculos
numéricos. Neste estudo, destacaremos a Fórmula de Sturges, que estabelece que
o número de classes K é calculado por:
29
K = 1 + 3,3 log n
Onde n = número de elementos observados.

Para o nosso exemplo teríamos:
K = 1 + 3,3 log n
K = 1 + 3,3 log 50
K = 1 + 3,3(1,69897)
K = 1 + 5,6 = 6,6
ou arredondando: 7 classes.
8. Amplitude das Classes (h)

h = H/ k
No exemplo anterior, a amplitude de cada classe será:
h = amplitude total/ número de classes
h = 79/7 = 11, 29 = 12
Obs. 1: Na amplitude das classes (h), observe que aumentamos uma

unidade, não seguindo, portanto, as regras de arredondamento. Esta é uma regra
que deve ser sempre seguida no cálculo da amplitude da classe.
Obs. 2: Deve-se conservar o número de casas decimais dos dados

observados. Por exemplo, se os dados se referem à massa de indivíduos em kg
e forem expressos com uma casa após a vírgula (por exemplo, 60,5 kg), então a
amplitude deverá ter uma casa após a vírgula.
Obs. 3: Usando o bom senso e a experiência, poderá ser conveniente,

quando possível, a utilização da amplitude de um intervalo de classe igual a 10
ou 5, facilitando as operações posteriores.
9. Frequência acumulada (Fi): Corresponde à soma das frequências de

determinada classe com as anteriores.
No exemplo, quero saber a frequência acumulada da 4a classe será: f1 +

f2 + f3 + f4 = 4 + 5 + 6 + 8 = 23. Então, na quarta classe, a frequência acumulada
é 23.
Observação: cada f é o valor de uma classe.
10. Frequência relativa (fri): Corresponde ao quociente entre a frequência

absoluta da classe e o total de elementos.
No exemplo, a frequência relativa da 7a classe é:
5
fri fr
= = /n = 0,1
50
30
4 GRÁFICOS
O gráfico estatístico é uma forma de apresentação, cujo objetivo é
reproduzir, no pesquisador, ou no público em geral, uma impressão mais rápida
e viva do fenômeno em estudo, já que, visualmente, os gráficos tendem a ser mais
rápidos na compreensão do que as tabelas.
Para que os seus dados tenham uma representação gráfica, eles deverão
ter alguns requisitos fundamentais, sendo eles:
• Simplicidade: como o próprio nome diz, deve ser simples, os detalhes de

importância secundária devem ser retirados, assim como os traços desnecessários
que possam levar o observador a uma análise morosa ou com erros.
• Clareza: o gráfico deve mostrar um correta interpretação dos valores

representativos do fenômeno em estudo.
• Veracidade: deve expressar a verdade sobre o fenômeno em estudo.
4.1 TIPOS DE GRÁFICOS
4.1.1 Gráfico em linha ou curva

Este tipo de gráfico utiliza a linha poligonal para representar a série
estatística. É muito utilizado para representar uma série temporal. O gráfico em linha
constitui uma aplicação do processo de representação das funções num sistema de
coordenadas cartesianas. Neste sistema faz-se uso de duas retas perpendiculares; as
retas são os eixos coordenados e o ponto de intersecção, a origem. O eixo horizontal
é denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo das ordenadas (ou
eixo dos y) ( ALMEIDA; ARAÚJO; RAMOS, 2009).
FIGURA 4 - GRÁFICO EM LINHA

40
30
quantidade
20
10
0
2006 2007 2008
anos
31
4.1.2 Gráfico em coluna ou em barras

É a representação de uma série por meio de retângulos, dispostos
verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas,
os retângulos têm a mesma base e as alturas são proporcionais aos respectivos
dados. E quando em barras, os retângulos têm a mesma altura e os comprimentos
são proporcionais aos respectivos dados (ALMEIDA; ARAÚJO; RAMOS, 2009).
FIGURA 5 - GRÁFICO EM BARRAS – CASOS DE RAIVA REGISTRADOS NO PERÍODO DE 2006

A 2008
40
30
quantidade
20
10
0
2006 2007 2008
4.1.3 Gráfico em barras

Geralmente utilizado para representar uma série geográfica ou
especificativa, sempre que os dizeres a serem inscritos forem extensos, deve-se
dar preferência ao gráfico em barra (séries geográficas e específicas). Se ainda
assim preferir o gráfico em coluna, os dizeres deverão ser dispostos de baixo
para cima, nunca ao contrário. A ordem a ser observada é a cronológica, se a
série for temporal, e a decrescente, se for geográfica ou categórica (especificativa).
A distância entre as colunas (ou barras), por questões estéticas, não deverá ser
menor que a metade nem maior que os dois terços da largura (ou da altura) dos
retângulos (ALMEIDA; ARAÚJO; RAMOS, 2009).
32
FIGURA 6 - GRÁFICO EM BARRAS – CASOS REGISTRADOS DE RAIVA POR BAIRRO EM BELÉM NO

ANO DE 2008
Jurunas
Pedreira
Bairro
Guamá
Marco
0 2 4 6 8
Quantidade
4.1.4 Gráfico em coluna ou em barras múltiplas

Este tipo de gráfico é, geralmente, empregado quando se deseja representar,
simultaneamente, dois ou mais fenômenos estudados com o propósito de
comparação (ALMEIDA; ARAÚJO; RAMOS, 2009).
FIGURA 7 - GRÁFICO EM BARRAS MÚLTIPLAS – CASOS DE MALÁRIA POR MUNICÍPIO NO PERÍODO

DE 2005 A 2008
Gráfico em Barras Multiplas
Cameta 2008
2007
2006
2005
Belém
Município
Barcarena
Abaetetuba
0 1 2 3 4
Quantidade
33
FIGURA 8 - GRÁFICO EM COLUNAS MÚLTIPLAS – CASOS DE MALÁRIA POR MUNICÍPIO NO

PERÍODO DE 2005 A 2008
Gráfico em colunas Multiplas
4
Município
Abaetetuba
Barcarena
3 Belém
Cameta
Quantidade
0
2005 2006 2007 2008
Anos
4.1.5 Gráfico em setores

Este gráfico é construído com base em um círculo, e é empregado sempre
que se deseja ressaltar a participação do dado no total (ALMEIDA; ARAÚJO;
RAMOS, 2009); é utilizado na ilustração de dados qualitativos, não devendo ser
utilizado quando a variável descrita apresentar mais de seis categorias (MOTTA;
WAGNER, 2003).
Veja o exemplo a seguir:
TABELA 7 - CASOS REGISTRADOS DE RAIVA POR BAIRRO EM BELÉM NO ANO

DE 2008
Bairro Quantidade %
Guamá 6 30
Pedreira 4 20
Marco 7 35
Juruna 3 15
Total 20 100
FONTE: Adaptado de Almeida, Araújo e Ramos (2009)
34
Para fazermos de modo manual o gráfico, calcularemos a percentagem,

fazendo uma simples regra de 3:
Assim, temos: 20 360

= 6 x 360 / 20 180°
�1
06 X₁
Dessa forma você deverá fazer com todos os dados. Posteriormente,

marca-se com um transferidor os arcos correspondentes, obtendo o gráfico, ou
usando o Excel, utilizando a coluna de %.
FIGURA 9 - GRÁFICO EM SETORES – PERCENTUAL DE REGISTROS DE RAIVA POR

BAIRRO EM BELÉM NO ANO DE 2008
4.2 GRÁFICOS ESPECIAIS DE UMA DISTRIBUIÇÃO DE

FREQUÊNCIA POR INTERVALOS
4.2.1 Histograma
É a representação gráfica de uma distribuição de frequência por meio de
retângulos justapostos, cujas alturas são proporcionais às frequências absolutas
e cujas bases correspondem ao intervalo de classe da distribuição (FIOREZE;
MARQUES, 2015).
35
FIGURA 10 - HISTOGRAMA
4.2.2 Polígono de frequências

É um gráfico em linhas formado por segmentos de retas; os pontos
extremos dos segmentos correspondem ao par ordenado formado pelo ponto
médio de cada classe da distribuição (eixo x) e pela frequência absoluta (eixo y)
(FIOREZE; MARQUES, 2015)
FIGURA 11 - POLÍGONO DE FREQUÊNCIAS
36
4.2.3 Ogiva
É um gráfico em linhas formado por segmentos de retas; os pontos
extremos dos segmentos correspondem ao par ordenado formado pelo limite
inferior de cada classe (eixo x) e pela frequência acumulada (eixo y) (FIOREZE;
MARQUES, 2015).
FIGURA 12 - OGIVA
37
RESUMO DO TÓPICO 3
Nesse tópico você viu que:
• Tabela é uma maneira de apresentar de forma resumida um conjunto de

observações (os dados compõem-se de: título, corpo e rodapé).
• Séries estatísticas: é um conjunto de dados estatísticos referenciados e são

classificados em: série temporal; geográfico; específico e mista.
• Distribuição por frequência é uma série estatística específica em que os dados

encontram-se dispostos em classes ou categorias junto às suas frequências
correspondentes.
• O gráfico estatístico é uma forma de apresentação, cujo objetivo é o de reproduzir,

no pesquisador, ou no público em geral, uma impressão mais rápida e viva do
fenômeno em estudo, e sempre deve conter simplicidade, clareza e veracidade,
e que, em geral, usam-se 5 gráficos – em linha ou curva, coluna, barra, em coluna
ou barras múltiplas e em setores, conhecido também como gráfico pizza).

• Dentro da série de gráficos, há os considerados espécies, que seriam: histograma,
polígono de frequências e ogiva.
38
AUTOATIVIDADE
As atividades a seguir são necessárias para que você fixe bem o

conteúdo estudado neste tópico:
1 De que maneira deve-se apresentar uma tabela e quais são seus elementos?
2 Baseado em seus estudos neste tópico, monte a seguinte tabela e calcule a

distribuição de frequência:
- X = Análise de 16 peixes de uma mesma espécie, levando em consideração

seu comprimento em cm.
10 12 15 4
12 14 9 18
20 6 23 14
17 18 25 7
Calcule: o rol de valores; Amplitude Total (H); Ponto médio das classes (Xi);
Número de Classes; Amplitude das Classes (h); Frequência acumulada (Fi) de
todas as classes; Frequência relativa (fri) também de todas as classes.
3 Com base na frequência relativa (fi), monte um gráfico que melhor

represente os seus dados.
39
40
UNIDADE 1
TÓPICO 4
MÉTODOS DE AMOSTRAGEM
1 INTRODUÇÃO
Nesse tópico você irá ter uma noção em relação à amostragem. Para serem
conhecidas algumas características de uma população, é comum observar apenas
uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter
estimativas para as características de interesse da população.
Neste caso, a seleção dos elementos que irão compor a amostra deve ser feita
por uma metodologia adequada, de tal forma que ela seja representativa, de modo
que os resultados sejam confiáveis para avaliar as características da população.
Segundo Motta e Wagner (2003, p. 27), ”[...] em virtude de se estudar

as populações em sua totalidade, geralmente trabalha-se com amostras, sendo
que está, deve ser representativa da população extraída, e sendo o mais
parecido possível [...]”.
Vamos aos estudos?
2 MÉTODOS DE AMOSTRAGEM
Amostragem é a técnica especial de escolher amostras que garantam
o acaso na escolha. Assim, cada elemento da população tem a mesma chance
de ser escolhido, o que garante à amostra um caráter de representatividade da
população.Além disso, as amostras devem ser:
• Seleção da Amostra – as amostras devem ser escolhidas de modo a poder

aplicar a elas os cálculos de probabilidades.
• Amostra Representativa – é aquela que tem as mesmas características da

população de onde foi retirada.
• Amostra Probabilística – é aquela cujo processo de amostragem permite atribuir

a cada elemento da amostra uma probabilidade semelhante à da população.
• Amostragem Aleatória – é aquela em que cada um dos elementos da população

tem a mesma chance de ser selecionado no levantamento dos dados.
A seguir são apresentados os tipos de amostragem.
41
2.1 AMOSTRA DE CONVENIÊNCIAS

Segundo Motta e Wagner (2003), a amostragem por conveniência é
um procedimento não probabilístico, ou seja, é formada por elementos que o
pesquisador reuniu simplesmente porque dispunha deles. Esta amostragem
é adequada e frequentemente utilizada para geração de ideias em pesquisas
exploratórias.
Franchi (2015, p. 8) ressalva que “os estatísticos têm muitas restrições

ao uso de amostras de conveniência, [...] o pesquisador que utiliza amostras de
conveniência precisa de muito senso crítico, e os dados podem ser tendenciosos”.
Alguns exemplos:
• Solicitar a pessoas que, voluntariamente, testem um produto e que, em seguida,

respondam a uma entrevista.
• Parar pessoas no supermercado e colher suas opiniões.
• Colocar linhas de telefone adaptadas para que durante um programa de

televisão os telespectadores possam dar suas opiniões.
2.2 AMOSTRAGEM ALEATÓRIA SIMPLES

Uma amostra escolhida de tal forma que cada item ou pessoa na população
tem a mesma probabilidade de ser incluída. Se a população tem um tamanho N,
cada pessoa desta população tem a mesma probabilidade igual a 1/N de entrar
na amostra. Utilizamos uma tabela de números aleatórios para sortear (com a
mesma probabilidade) os elementos da amostra. Também pode ser utilizada uma
função randômica. Ou seja:
�
1
p=
n
Onde:
n = número de elementos que irão compor a amostra.

p= probabilidade de um elemento da população ser selecionado para
compor a amostra.
Exemplo 1: Vamos obter uma amostra de 10%, representativa para a

pesquisa da estatura de 90 alunos de uma escola:
1º - Numeramos os alunos de 1 a 90.
2º - Escrevemos os números dos alunos de 1 a 90, em pedaços iguais de

papel, colocamos na urna, misturamos e retiramos, um a um, nove números que
formarão a amostra.
42
TÓPICO 4 | MÉTODOS DE AMOSTRAGEM
Exemplo 2: Suponha uma população com 300 elementos, que numeramos

de 000 a 299 para selecionar uma amostra aleatória de n=15 elementos. O processo
termina quando for sorteado o elemento 15. A probabilidade de cada elemento
ser selecionado é p=1/15.
2.3 AMOSTRAGEM SISTEMÁTICA

Quando os elementos da população já se acham ordenados, não há
necessidade de construir o sistema de referência. São exemplos os prontuários
médicos de um hospital, os prédios de uma rua etc. Nestes casos, a seleção dos
elementos que constituirão a amostra pode ser feita por um sistema imposto pelo
pesquisador.
N
Eis a fórmula: K =
n
Onde: N: números de elementos da população
n: número de elementos da amostra
Depois determinar o ponto de partida (a1): sorteio aleatório simples.
Em seguida, determinar os elementos da amostra através de uma

progressão aritmética (PA)
an a�1 K
Exemplo: Num viveiro florestal, produz-se, em média, 100 espécies diferentes

de plantas arbóreas por dia. Chega-se à conclusão de que é necessário avaliar no
controle de qualidade 20 dessas espécies. Determine quais espécies poderiam compor
a amostra de modo que esta seja representativa da produção diária.
Vamos à solução:
100
�
K
1. Define-se K →= = 5
20
2. Ponto de partida: dentre 1 a 5, sorteia-se aleatoriamente um número.
Sorteio a1= 2
3. Determinam-se os elementos da amostra (A) através da PA:
an a1 K 2 5 7
Resultado: A= {2; 7; 14; 21; 28; 35; 42; 49; 56; 63; 70; 77; 84; 91;98}
43
2.4 AMOSTRAGEM ALEATÓRIA ESTRATIFICADA

Quando a população se divide em estratos (subpopulações), convém
que o sorteio dos elementos da amostra leve em consideração tais estratos, daí
obtemos os elementos da amostra proporcional ao número de elementos desses
estratos, como sexo, idade ou condição econômica (MOTTA; WAGNER, 2003).
Suponhamos que a população é subdividida em k estratos. Sejam:

N = o número de indivíduos na população
n = o número de indivíduos na amostra
Ni = o número de indivíduos contidos no i-ésimo estrato da população
ni = o número de indivíduos contidos no i-ésimo estrato na amostra
Ni
ni = nx i = 1,2,...k.
N

Os estratos devem ser os mais homogêneos possíveis com relação às
características relevantes da pesquisa (variáveis que se correlacionam fortemente
com a variável estudada). Para um mesmo tamanho amostral, a amostragem
aleatória estratificada com repartição proporcional é mais precisa (menor
variância do estimador) do que a amostragem aleatória simples.
2.5 AMOSTRAGEM POR CONGLOMERADOS

Motta e Wagner (2003) descrevem que é feita uma amostragem aleatória
entre agrupamentos (conglomerados) que ocorrem naturalmente na população.
Em seguida, os indivíduos que compõem o conglomerado podem ser selecionados
por outro sorteio para incluir na amostra final. Um exemplo típico, o emprego de
escolas como conglomerados para o estudo de populações infantis.
2.6 AMOSTRAGEM POR ESTÁGIOS MÚLTIPLOS

Motta e Wagner (2003) descrevem que esta amostragem é uma modificação
da amostragem por conglomerados. É bastante usada para reduzir os custos de
grandes pesquisas. Envolve o estabelecimento de um conglomerado chamado
unidade primária de amostragem, que pode ser uma escola, um bairro etc.
Numa segunda etapa são extraídas por sorteio as unidades secundárias, que vão
constituir a amostra propriamente dita.
44
RESUMO DO TÓPICO 4
• Amostragem é a técnica especial de escolher amostras que garantam o acaso

na escolha, sendo que as amostras devem ser: representativas, probabilísticas e
aleatória.
• Amostragem por conveniência é a quantidade de elementos que o pesquisador

reuniu simplesmente porque dispunha deles.
• Amostragem aleatória simples, quando uma amostra é escolhida de tal forma

que cada item ou pessoa na população tem a mesma probabilidade de ser
incluída.
• Amostragem sistemática, quando os elementos da população já se acham

ordenados, não havendo necessidade de um sistema.
• Amostragem aleatória estratificada, quando a população se divide em estratos

(subpopulações).
• Amostragem por conglomerados, quando é realizada uma amostragem

aleatória entre agrupamentos (conglomerados) que ocorrem naturalmente na
população.

• Amostragem por estágios múltiplos envolve o estabelecimento de um
conglomerado chamado unidade primária de amostragem, e numa segunda
etapa são extraídas por sorteio as unidades secundárias que vão constituir a
amostra propriamente dita.
45
AUTOATIVIDADE
1 Descreva as diferenças entre os métodos de amostragem.
46
UNIDADE 1
TÓPICO 5
DISTRIBUIÇÃO DE PROBABILIDADES
1 INTRODUÇÃO
Nesta unidade, vocês irão verificar que, dependendo do tamanho de suas
amostras e de seus dados, a estatística da probabilidade leva em consideração
valores diferentes, como média e desvio-padrão.
A distribuição de probabilidades lida com um grande volume de dados,

os quais estão sujeitos a variações.
Neste capítulo iremos ver as seguintes distribuições: distribuição binomial;

de Poisson; exponencial; norma; e de Student.
2 DISTRIBUIÇÃO DE PROBABILIDADES
Reboita (2005) transcreve que a distribuição de probabilidade pode ser
útil quando os dados apresentam:
• Compacidade: representação de um grande volume de dados.
• Alisamento e interpolação: os dados reais estão sujeitos a variações na

amostragem, que podem levar à falha de dados ou a dados errôneos nas
distribuições empíricas. Logo, pode-se verificar se um dado é real e se pode
ocorrer ou não, para tanto, podemos calcular a probabilidade de ocorrência.
• Extrapolação: estimar a probabilidade de eventos extremos à variação de um

conjunto de dados particular exige a suposição de eventos ainda não observados.
Isso pode ser realizado com a imposição de um modelo de probabilidade (isto
é, uma distribuição teórica) ajustado à série de dados.
Ainda segundo Reboita (2005), a distribuição de probabilidades apresenta-

se da seguinte forma:
• Distribuição discreta descreve quantidades aleatórias (dados de interesse) que

podem assumir valores particulares e os valores são finitos. Por exemplo, a
ocorrência de tempestades com granizo.
47
• A distribuição contínua representa quantidades aleatórias contínuas que

podem tomar um número infinito de valores. Por exemplo: temperatura,
pressão, precipitação, ou qualquer elemento medido numa escala contínua, é
uma variável aleatória contínua.
2.1 DISTRIBUIÇÃO BINOMINAL

Uma das distribuições mais comuns em estatística. Deriva de um processo
conhecido como teste de Bernoulli, em que cada tentativa tem duas possibilidades
excludentes de ocorrência chamada de sucesso e falha.
Um experimento aleatório é chamado binomial se em n repetições os

ensaios são independentes; cada resultado do ensaio pode assumir somente uma
de duas possibilidades: sucesso ou fracasso; a probabilidade de sucesso em cada
ensaio, denotado por ( p ), permanece constante, e a probabilidade de fracasso,1-p,
é designada por (q) (MOTTA; WAGNER, 2003).
Ainda segundo Motta e Wagner (2003), na distribuição binomial, a média

é igual ao número de eventos estudados vezes a probabilidade de ocorrência do
evento, ou seja, μ=np, e que o desvio padrão é igual à raiz quadrada do produto:
n x p x q; sendo expresso pela fórmula σ npq .
Eis a fórmula da distribuição binomial:
!
! !
Onde:
n: é o número de tentativas ou repetições do experimento.
r: é o número/proporção/frequência desejada de sucesso.
n-r: é o número/proporção/frequência desejada de fracassos.
P: é a probabilidade/proporção/frequência de sucessos.
q = 1-p: é a probabilidade/proporção/frequência de fracassos.
NOTA
O símbolo ! indica o fatorial de um número inteiro; o “fatorial de n” é definido

como n!=n x (n-1) x (n-2) x ...x 1. Por definição, 0!=1. Outro exemplo: 4!=4x3x2x1=24 (MOTTA;
WAGNER, 2003).
48
TÓPICO 5 | DISTRIBUIÇÃO DE PROBABILIDADES
Ainda segundo Motta e Wagner (2003), a fórmula dada acima é

determinada pelo número n de tentativas, e a probabilidade p de sucesso numa
tentativa isolada, os símbolos n e p são denominados parâmetros da distribuição.
Vamos aos exemplos, de acordo com Motta e Wagner (2003).
Exemplo: Admite-se que a probabilidade de nascimento de um menino,

como também de uma menina, é igual a ½. Quais são as probabilidades em uma
família de 6 filhos de ter: 0,1,2,3,4,5,6 crianças do sexo masculino? (M=masculino;
F=feminino).
!
! !
0 6 0
6! 1 1 1
P r , 56% pa
0 , 0156 ou 11,56%
0,0156 ra 66M
para M ee00F
F
0 ! 6 0 ! 2 2 64
1 6 1
6! 1 1 1
P r 0 , 0937 ou 99,37%
0,0937 , 37% para
parra5M
5Mee1F
1F
1! 6 1 ! 2 2 64
2 62
6! 1 1 15
P r 0,2343 ou
ou23,43%
23,43% para
para4M
4Mee2F
2F
2 ! 6 2 ! 2 2 64
3 63
6! 1 1 20
P r 0,3125 ou 31,25% para 3M e 3F
3 ! 6 3 ! 2 2 64
4 64
6! 1 1 15
P r 0,2343 ou 23,43% para 2M e 4F
4 ! 6 4 ! 2 2 64
5 65
6! 1 1 6
P r 0,0937 ou 9,37% para 1M e 5F
5 ! 6 5 ! 2 2 64
6 6 6
6! 1 1 1
P r 0,0156 ou 1,56% para 0M e 6F
6 ! 6 6 ! 2 2 64
49
 A probabilidade de que, numa família de 6 filhos, 5 ou mais sejam do

sexo masculino é a soma das probabilidades de 5 e 6 filhos do sexo masculino,
isto é, 0,0937+0,0156=0,1093, então, cerca de 10% das famílias de 6 filhos têm 5 ou
mais meninos.
Parâmetros Binomiais: de acordo com Motta e Wagner (2003), a

distribuição binomial tem dois parâmetros: n e p. A média e a variância da
distribuição binomial são: μ=np e σ2=np(1-p), respetivamente.
Para o exemplo acima, tais dados ficam:
1
6 3
2
1 1
desvio padrão √11,5
2 6 1, 5 desvio , 5 1, 22
2 2
2.2 DISTRIBUIÇÃO DE POISSON

Segundo Motta e Wagner (2003), é uma distribuição discreta de
probabilidade, ela descreve a probabilidade dos números de ocorrências, num
campo ou intervalo contínuo (normalmente tempo e espaço), de eventos bem
raros. Eis a fórmula:
r e
P r
r !�
Onde:
r: frequência relativa ou probabilidade de um sucesso que pode tomar os

valores 0,1,2,3...
e: base dos logaritmos neperianos, o número irracional 2,7183.
λ: é o número médio de sucessos por amostra (λ=np) em um determinado
intervalo de tempo e espaço. A média λ é o único parâmetro dessa distribuição. A
variância é idêntica ao valor médio λ (letra grega lambda). A média e a variância,
geralmente, são menores que 5 (MOTTA; WAGNER, 2003).
Exemplo: Uma determinada espécie possui um erro inato no metabolismo

com uma incidência de 0,6 por mil espécies. Qual a probabilidade de encontrar 3
casos dessa anomalia numa amostra de mil espécies durante o ano de 2015?
p r 3
0, 06 2, 7183 0, 216 x 00,, 548812 0, 0197 ou 11,97%
3 0 ,6
, 97%
3! 6
50
Então, há uma probabilidade de 1,97% de se encontrar 3 casos com a

anomalia.
2.3 DISTRIBUIÇÃO EXPONENCIAL

A distribuição exponencial é aplicada nos casos que queremos analisar o
espaço ou intervalo de acontecimentos de um evento.
A variável X, que é igual à distância entre contagens sucessivas de um

processo de Poisson, com média λ > 0, tem uma distribuição exponencial com
parâmetro λ. A função densidade de probabilidade de X (pdf) é:
F x λ
.e .x
Para 0 ≤ x ≤ ∞
Onde:
λ: é a taxa de ocorrência por intervalo
Exemplo: Em uma grande rede corporativa de computadores, as conexões

dos usuários ao sistema podem ser modeladas como um processo de Poisson,
com média de 25 conexões por hora. Qual a probabilidade de não haver conexões
em um intervalo de 6 minutos?
F x λ
.e .x

P X 0 , 1 25.e 25.x .dx e 25. e 25.0 ,1 e 25.0 ,1 0 , 082

0 ,1
2.4 DISTRIBUIÇÃO NORMAL

Motta e Wagner (2003) descrevem que a curva normal tem forma de sino,
ou seja, é unimodal e simétrica, e o seu valor de máxima frequência, a moda,
coincide com o valor da média e da mediana. A média (μ) é o centro da curva e
σ é o desvio-padrão da população, os valores da variável X são representados no
eixo horizontal; a média de X é a projeção sobre o eixo do ponto de frequência
máxima da curva.
51
FIGURA 13 - CURVA NORMAL TÍPICA, EM FORMATO DE SINO
f(X)
média
desvio padrão
FONTE: Conti (2009)
A distribuição normal padronizada é aquela na qual a média é (μ)=0 e

o desvio padrão é (σ)=1, dessa forma, qualquer distribuição normal com média
diferente de zero e desvio-padrão diferente de 1,0, pode ser transformada na
normal padronizada (MOTTA; WAGNER, 2003). Ainda segundo os autores, o
resultado da transformação aplicada a cada valor de X é a obtenção de uma nova
variável – denominada z –, que mede o afastamento do valor x em relação à média.
O cálculo de Z é: z
X

Onde:
z: afastamento dos valores de X em relação à média em número de desvios-

padrão.
x: valor qualquer da variável aleatória.
μ: média da distribuição.
σ: desvio-padrão da distribuição.
E
IMPORTANT
Com os valores que você obteve com a fórmula Z, você irá na tabela (em anexo)
verificar em qual ela se encaixa. Ex.: intervalo Z:0 e o Z: 1,7, então, na tabela, você irá verificar
a coluna Z e encontrará o valor de 0,4641.
52
Vamos ao exemplo, segundo Motta e Wagner (2003):
Exemplo 1: Em uma distribuição de valores de glicose plasmática em

jejum em homens normais entre 30 e 39 anos de idade, apresenta a média de
μ=100 mg/dL e desvio-padrão σ=15 mg/dL. Qual a proporção de pessoas com
glicose plasmática entre 100 e 120 mg/dL?
1º Passo:
z
X = z
120 100 20
1, 33
15 15
2º Passo:
Na tabela você irá cruzar o intervalo de z=0 e z=1,33, e o valor que você
irá obter é 0,4082, ou 40,82%. Então, a proporção de pessoas com concentração de
glicose plasmática entre 100 e 200 mg/dL é de 0,4082, ou em torno de 41%.
FIGURA 14 - GRÁFICO EM RELAÇÃO AO EXEMPLO 1
A
0,5000
0,4082
B
Valores 100 120
Z 0 1.33
FONTE: Motta e Wagner (2003)
Exemplo 2: Com os mesmos dados do exemplo anterior, qual a proporção

de pessoas com teor de glicose plasmática acima de 120 mg/dL?
1. A fórmula para o cálculo de z é a mesma do exercício anterior z=1,33.

2. A área à esquerda de z=0 é 0,50.
3. A área entre z=0 e z=1,33 é 0,4082.
Levando todos estes dados em consideração, obtemos além de z=1,33, temos:

0,500 – 0,4082 = 0,0918
Assim, a resposta que temos é que 9% de pessoas têm glicose plasmática

acima de 120 mg/dL.
53
A 0,0918 =
0,5000 - 0,4082
0,5000 0,4082
B
Valores 100 120
Z 0 1.33
Exemplo 3: Com os mesmos dados do exemplo 1, pergunta-se: qual a

proporção de pessoas com teor de glicose plasmática entre 80 e 120 mg/dL?
1. Como a curva é simétrica, ou seja, z=-1,33 e z=1,33.

2. Então, para o cálculo, usando a simetria, simplesmente duplicamos a área entre
o z=0 e 1,33.
3. Ficando desta forma: 2(0,4082) = 0,8164 ou 82%.
Em resposta ao exercício, temos 82% das pessoas que possuem níveis de

glicose entre 80 e 120mg/dL.
A A
0,4082 0,4082
B B
Valores 80 100 120
Z -1.33 0 1.33
54
2.5 DISTRIBUIÇÃO DE T DE STUDENT

O valor de t é a medida do desvio padrão (σ) entre a média ( �
X ), estimada a
partir de uma amostra aleatória de tamanho n, e a média (μ) da população, usando
o erro-padrão da média (EP) como unidade de medida (MOTTA; WAGNER, 2003).
x
Temos a seguinte fórmula: t
s �/ n
Ainda segundo Motta e Wagner (2003), as propriedades da distribuição t
de Student são:
 A média é igual a zero.
 As curvas t são simétricas em torno da média, tem forma de sino, porém mais
achatadas.
 O intervalo da variável t é: (-∞ ) a (+∞).
 A distribuição de t não é descrita por uma única distribuição, mas por uma
família de distribuições. Há uma curva t diferente para cada número de graus
de liberdade da amostra (n-1).
 A variação de t é maior com amostras pequenas do que com as amostras grandes,

quando n tende para o infinito (∞), o desvio-padrão (s) tenderá para o σ.

 A distribuição t tem como principais aplicações: a comparação de duas médias
pelo teste t e estimação dos intervalos de confiança para média populacional.
A seguir, um exemplo de como aplicar essas distribuições.
POLUIÇÃO ATMOSFÉRICA E ATENDIMENTOS POR PNEUMONIA E

GRIPE EM SÃO PAULO
Objetivo: Investigar os efeitos causados pela poluição atmosférica na

morbidade por pneumonia e por gripe em idosos entre 1996 e 1998.
Métodos: Foram obtidos dados diários de atendimentos por pneumonia e

gripe para idosos em pronto-socorro médico de um hospital-escola de referência
no município de São Paulo, SP, Brasil. Os níveis diários de CO, O3, SO2, NO2 e
PM10 foram obtidos na Companhia de Tecnologia de Saneamento Ambiental,
e os dados diários de temperatura e umidade relativa do ar foram obtidos no
Instituto Astronômico e Geofísico da USP. Para verificar a relação existente
entre pneumonia e gripe e poluição atmosférica, utilizou-se o modelo aditivo
55
generalizado de regressão de Poisson, tendo como variável dependente o número

diário de atendimentos por pneumonia e gripe e como variáveis independentes
as concentrações médias diárias dos poluentes atmosféricos. A análise foi
ajustada para sazonalidade de longa duração (número de dias transcorridos),
sazonalidade de curta duração (dias da semana), temperatura mínima, umidade
média, períodos de rodízio e os atendimentos por doenças não respiratórias
em idosos. Resultados O3 e SO2 estão diretamente associados à pneumonia e à
gripe, independentemente das variáveis de controle. Porém, na análise conjunta,
eles perdem sua significância estatística. Pôde-se observar que um aumento
interquartil (25%-75%) para o O3 (38,80 µg/m3) e SO2 (15,05 µg/m3) levou a um
acréscimo de 8,07% e 14,51%, respectivamente, no número de atendimentos por
pneumonia e gripe em idosos.
Conclusões: Os resultados sugerem que a poluição atmosférica promove

efeitos adversos para a saúde de idosos.
ANEXO
Anexo A. Áreas sob curva normal padronizada. Para valores negativos de z, as

áreas são obtidas por simetria
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
56
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
FONTE: MARTINS, Lourdes Conceição et al. Poluição atmosférica e atendimentos por pneumonia

e gripe em São Paulo, Brasil. Rev. Saúde Pública, 2002, v. 36, n.1, p. 88-94.
57
RESUMO DO TÓPICO 5
• A distribuição de probabilidade pode ser útil quando dados apresentarem:

compacidade, interpolação e extrapolação.
• Na distribuição binomial, ela deriva de um processo conhecido como teste

de Bernoulli, em que cada tentativa tem duas possibilidades excludentes de
ocorrência chamada de sucesso e falha.
• A distribuição de Poisson descreve a probabilidade dos números de ocorrências,

num campo ou intervalo contínuo.
• A exponencial é aplicada nos casos que queremos analisar o espaço ou intervalo

de acontecimentos de um evento.
• Na distribuição normal mede-se o afastamento do valor x em relação à média.

• A distribuição de Student tem como principais aplicações: a comparação de
duas médias pelo teste t e estimação dos intervalos de confiança para média
populacional.
58
AUTOATIVIDADE
1 Qual é a diferença entre as distribuições de Poisson e Binomial?
2 Sob que condições pode a distribuição de Poisson ser usada como uma
aproximação da distribuição Binmial? Por que isto pode ser útil?
59
60
UNIDADE 1
TÓPICO 6
INFERÊNCIAS ESTATÍSTICAS
1 INTRODUÇÃO
Muitas são as interferências que um pesquisador sofre no decorrer de seu
estudo. Há variáveis que você, por exemplo, deve levar em consideração quando
for a campo para levantar uma determinada espécie.
Nesses dados devem ser observados se não há vícios que o responsável da

pesquisa pode ter, bem como aparelhos utilizados nos levantamentos de dados.
Há detalhes que você deve levar em consideração quando for começar

seus estudos. A seguir, você, acadêmico(a), irá compreender que pequenos
detalhes fazem a grande diferença no final de sua análise estatística.
2 DISTRIBUIÇÃO DE PROBABILIDADES
Variável é a característica de interesse que é medida em cada elemento da
amostra ou população. Como o nome diz, seus valores variam de elemento para
elemento. As variáveis podem ter valores quantitativos ou qualitativos. (Fonte:
Disponível em: <http://avale.iat.educacao.ba.gov.br/index.php?option=com_
content&view=article&id=76&Itemid=110>).
2.1 VARIÁVEIS QUANTITATIVAS

As variáveis quantitativas são características que podem ser descritas por
números, sendo classificadas entre contínuas e discretas (MOTTA; WAGNER, 2003).
- Variáveis discretas: a variável é avaliada em números que são resultados de

contagens e, por isso, somente fazem sentido números inteiros. Exemplos:
número de filhos, número de bactérias por litro de leite, número de cigarros
fumados por dia.
- Variáveis contínuas: a variável é avaliada em números que são resultados de

medições e, por isso, podem assumir valores com casas decimais e devem ser
medidas por meio de algum instrumento. Exemplos: massa (balança), altura
(régua), tempo (relógio), pressão arterial, idade.
61
2.2 VARIÁVEIS QUALITATIVAS

As variáveis qualitativas (ou categóricas) são as características que não
possuem valores quantitativos, representam uma classificação dos indivíduos.
Podem ser nominais ou ordinais, de acordo com Motta e Wagner (2003).
- Variáveis nominais: não existe ordenação entre as categorias. Exemplos: sexo,

cor dos olhos, fumante/não fumante, doente/sadio.
- Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos:

escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário,
terminal), mês de observação (janeiro, fevereiro, …, dezembro).
Entretanto, as distinções são menos rígidas do que essa descrição insinua.

Uma variável originalmente quantitativa pode ser coletada de forma qualitativa.
Por exemplo, a variável idade, medida em anos completos, é quantitativa

(contínua); mas, se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos
etc.), é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe, uma
variável quantitativa (contínua) se trabalharmos com o valor obtido na balança,
mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena,
peso-leve, peso-pesado etc.).
FIGURA 17 - CLASSIFICAÇÃO DAS VARIÁVEIS ESTATÍSTICAS DE ACORDO COM SUA NATUREZA
Variáveis
Qualitativa Quantitativa
(categorias) (números)
Nominal (não Ordinal (existe

Discreta (resultado Contínua (resultado
existe ordem nas ordem nas
de contagem) de meensuração)
categorias) categorias)
FONTE: Disponível em: <http://avale.iat.educacao.ba.gov.br/index.php?option=com_content&

view=article&id=76&Itemid=110>. Acesso em: 22 mar. 2015.
62
TÓPICO 6 | INFERÊNCIAS ESTATÍSTICAS
3 ESCALAS ESTATÍSTICAS
Os valores associados a cada variável podem ser classificados em escalas
de medida, expressando a qualidade ou quantidade dos dados.
• A escala nominal atribui números às categorias apenas para identificá-las, e

eles não têm significado quantitativo, por exemplo: 1 para “Feminino” e 2 para
“Masculino”.
• A escala ordinal atribui números às categorias indicando apenas a ordem, com

o sentido de “mais que, maior que”; ou “menos que, menor que”, por exemplo:
1 para “Criança”; 2 para “Adolescente”, e 3 para “Adulto”.
• A escala intervalar tem as características de uma escala ordinal, e as distâncias

ou diferenças entre quaisquer dois números na escala têm significado. Podemos
afirmar que uma medida é igual, maior ou menor e quantificar o valor dessa
diferença. Nesse tipo de escala, a unidade de medida e a origem são arbitrárias.
Um exemplo é quando a temperatura de um indivíduo é medida na escala
Fahrenheit. A origem é 0ºF e a unidade é 1ºF, que são arbitrárias, uma vez que
se a temperatura for medida em centígrados teríamos que usar a transformação
y = 5/(9 (x-32)) (BUSSAB; MORETTIN, 2008, p. 14).
• A escala de razão tem todas as características da escala intervalar e tem

ponto zero verdadeiro. Neste tipo de escala, a razão entre quaisquer dois
pontos independe da unidade de medida. As grandezas, tais como massa,
comprimento, altura podem ser medidas com a escala de razão. No caso da
altura, por exemplo, se ela for medida em centímetros (cm), 0cm é a origem e
1cm é a unidade de medida. Um indivíduo com 90cm é duas vezes mais alto do
que um indivíduo com 95cm, e esta relação contínua vale se usarmos 1m como
unidade (BUSSAB; MORETTIN, 2008, p. 14).
FIGURA 18 - CLASSIFICAÇÃO DE ACORDO COM AS ESCALAS DE MEDIDAS
Escala de
medidas
Nominal ou Ordinal ou por

Intervalar De razão
categorica pontos
FONTE: Disponível em: <http://avale.iat.educacao.ba.gov.br/index.php?option=com_content&vie

ew=article&id=76&Itemid=110>. Acesso em: 22 mar. 2015.
63
4 ERROS DE OBSERVAÇÃO
Quando esses erros estão ligados à aleatoriedade ou à incerteza
modelada pela teoria da probabilidade, eles são "erros" no sentido estatístico
(RODRIGUES, 1993).
Toda vez que repetimos uma medição com um instrumento sensível,

obtemos resultados ligeiramente diferentes. O modelo estatístico que normalmente
usamos é que o erro tem duas partes:
• Erro sistemático: aquele que sempre ocorre com o mesmo valor quando se usa
o instrumento da mesma maneira e no mesmo processo; pode ser causado por
falhas do aparelho de medida, calibração incorreta etc.
• Erro aleatório: pode variar de uma observação para outra.
O erro sistemático é, às vezes, chamado de viés estatístico. Muitas vezes

pode ser reduzido por meio de processos cuidadosamente padronizados. O uso
dos instrumentos padrão da disciplina faz parte do ensino de toda ciência.
O erro aleatório, ou variação aleatória, é devido a fatores que não

controlamos, seja porque esse controle seria muito caro, seja porque ignoramos
esses fatores. Pode até ser que tudo o que estamos tentando medir esteja mudando
com o tempo, ou seja, fundamentalmente probabilístico (como é o caso da
mecânica quântica). O erro aleatório muitas vezes ocorre quando os instrumentos
são empurrados para seus limites. Por exemplo, é comum as balanças digitais
apresentarem um erro aleatório dos seus dígitos menos significativos.
Os erros dependentes do observador podem ser diminuídos por uma

preparação; já os métodos caudados pela observação podem ser reduzidos
selecionando-se as melhores técnicas, padronizando os métodos e controlando o
funcionamento dos aparelhos (RODRIGUES, 2003).
5 ARREDONDAMENTO DE NÚMEROS
Noé (2015) descreve que, nos trabalhos relacionados à Estatística,
Matemática Financeira, entre outras situações cotidianas relacionadas ao uso
de números, usamos algumas técnicas de arredondamento. Para efetuarmos o
arredondamento de um número podemos utilizar as seguintes regras:
• Se o algarismo a ser eliminado for maior ou igual a cinco, acrescentamos uma

unidade ao primeiro algarismo que está situado à sua esquerda.
• Se o algarismo a ser eliminado for menor que cinco, devemos manter inalterado
o algarismo da esquerda.

64
TÓPICO 6 | INFERÊNCIAS ESTATÍSTICAS
Nos casos de arredondamentos sucessivos, as regras continuam valendo,

por exemplo, escrever o número decimal 2,36935 das seguintes maneiras:
• Quatro casas decimais: eliminaremos o algarismo 5 e acrescentaremos uma

unidade à casa da esquerda: 2,3694.
• Três casas decimais: eliminaremos o algarismo 4 e não modificaremos o número

da esquerda: 2,369.
• Duas casas decimais: eliminaremos o algarismo 9 e acrescentaremos uma

unidade à casa da esquerda: 2,37.
Em algumas áreas de conhecimento, como a Metrologia, ciência que

provê a utilização de técnicas que permitem que grandezas físicas e químicas
sejam quantificadas, os arredondamentos seguem uma normativa do IBGE,
pois nessa ciência qualquer valor, por menor que seja, pode provocar alterações
consideráveis (NOÉ, 2015). Veja a tabela de arredondamento de valores:
TABELA 8 – ARREDONDAMENTO DE ACORDO COM A RESOLUÇÃO Nº 886/66 DA FUNDAÇÃO

IBGE
Condições Procedimentos Exemplos
<5 O último algarismo a permanecer fica inalterado. 53,24

42,87 passa a 42,9
Aumenta-se de uma unidade o algarismo a
>5 25,08 passa a 25,1
permanecer.
53,99 passa a 54,0
2,352 passa a 2,4
Se ao 5 seguir em qualquer casa um algarismo 25,6501 passa a
=5 diferente de zero, aumenta-se uma unidade no 25,7
algarismo a permanecer. 76,250002 passa a
76,3
24,75 passa a 24,8
Se o 5 for o último algarismo ou se ao 5 só 24,65 passa a 24,6
seguirem zeros, o último algarismo a ser 24,7500 passa a
= 5
conservado só será aumentado de uma unidade 24,8
se for ímpar. 24,6500 passa a
24,6
FONTE: Disponível em: <http://www.brasilescola.com/matematica/arredondando-numeros.

htm>. Acesso em: 18 maio 2015.
65
RESUMO DO TÓPICO 6
• As variáveis quantitativas são características que podem ser descritas por

números, sendo classificadas entre contínuas e discretas.
• As variáveis qualitativas (ou categóricas) são as características que não possuem

valores quantitativos, representam uma classificação dos indivíduos. E podem
ser nominais ou ordinais.
• A escalas estatísticas expressam a qualidade ou quantidade dos dados, e podem

ser: nominal, ordinal e intercalar.
• Os erros ocasionados nos experimentos podem vir das observações ou dos

aparelhos.
66
AUTOATIVIDADE
1 Classifique o tipo de variável para os itens abaixo.
a) Marca de perfume preferida.

b) Grau de satisfação com um produto alimentício.
c) Peso de sementes advindas do Chile.
d) Renda familiar.
e) Grau de periculosidade de um reagente químico.
f) Número de cadeiras em uma sala de reunião.
2 Descreva quais são as escalas estatísticas.
3 Em relação ao arredondamento de números, faça-os com os números

abaixo:
16,89 14,32 10,7 126,892356 0,95 12,53 11,01 7,58 1.314,22 3,41568
67
68
UNIDADE 2
MEDIDAS ESTATÍSTICAS
Nessa unidade vamos:
• reconhecer terminologias, os símbolos e conceitos básicos, encontrados na

literatura da estatística;
• reconhecer em seus experimentos, a forma como organizar seus dados, de

forma concisa, e interpretando suas informações;
• ter uma maior compreenção em relação as teorias da probabilidade, e da

distribuição.
PLANO DE ESTUDOS
Essa segunda unidade de estudo está dividida em quatro tópicos. Você en-
contrará no final de cada um deles atividades que contribuirão para a com-
preensão dos conteúdos abordados. Lembramos que as unidades 1 e 2 estão
correlacionadas.
TÓPICO 1 – MEDIDAS DE POSIÇÃO E VARIAÇÃO
TÓPICO 2 – TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS
TÓPICO 3 – TESTES DE HIPÓTESES
TÓPICO 4 – TESTES NÃO PARAMÉTRICOS
69
70
UNIDADE 2
TÓPICO 1
MEDIDAS DE POSIÇÃO E VARIAÇÃO
1 INTRODUÇÃO
Quando estudados, estatisticamente, os fenômenos, Rodrigues (2002)
cita que tais estudos são traduzidos por um conjunto de dados numéricos, e essa
descrição dos conjuntos de dados torna-se mais clara quando se obtém medidas
que resumem as informações necessárias.
Ainda segundo Rodrigues (2002), as medidas representam ou resumem

todos os valores obtidos pelo grupo e, como tal, fornecem uma descrição
precisa da execução do grupo como um todo, permitindo assim o confronto
de dois ou mais grupos.
Neste capítulo iremos ver uma análise de conjunto de dados, com as

medidas de posição e as medidas de variação.
2 MEDIDAS DE POSIÇÃO
Segundo Rodrigues (2002), usam-se, em geral, três medidas de posição:
média aritmética (simples, ponderada, de dados agrupados em intervalos),
mediana e moda.
2.1 MÉDIA ARITMÉTICA SIMPLES ( X )

A média aritmética simples é a soma dos valores ou medidas divididas
pela quantidade destes, trata-se, portanto, de uma medida de posição em que
as variáveis de um conjunto são tomadas isoladamente e representadas por um
valor calculado (RODRIGUES, 2002).
£x
Eis a fórmula: X =
Onde: n
X : é a média
∑x: é a soma das variáveis
n: número de indivíduos
Exemplo: Se o peso em kg de 8 caprinos ao nascer é 23, 27, 20, 30, 14, 17,
29, 31, qual é o peso médio desse conjunto de caprinos?
71
UNIDADE 2 | MEDIDAS ESTATÍSTICAS
£x
X=
n
23 27 20 30 14 17 29 31
X
8
191
X
= = 23, 87 kg
8
Portanto, o peso médio ou a média dos pesos dos caprinos é igual a 23,87 kg.
UNI
Quando utilizamos dados de uma amostra de uma determinada população, a

média aritmética calculada será uma estimativa, pois empregamos apenas uma fração do
conjunto total (RODRIGUES, 2002).
2.2 MÉDIA ARITMÉTICA PONDERADA

Quando você tiver uma série de valores sucessivos com a respectiva
distribuição de frequência, pode-se calcular a média aritmética ponderada
(RODRIGUES, 2002).
A forma que seus dados se apresentam na distribuição de frequência:
Variáveis Frequências
X1 f1
X2 f2
X3 f3
. .
. .
. .
. .
Xn fn
72
TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO
A fórmula adotada para o cálculo, se apresenta da seguinte forma:
£ xf x1 f1 x2 f 2 xn f n
X
n f1 f 2 f n
Vamos ao exemplo (RODRIGUES, 2002):
Idade (anos) Frequência

2 10
3 8
4 6
5 5
6 5
7 5
8 7
9 4
Sendo a fórmula:
£ xf x1 f1 x2 f 2 xn f n
X
n f1 f 2 f n
Aplicando a fórmula:
2 x10 3x8 4 x6 5 x5 6 x5 7 x5

X
8 x7 9 x 4
250
5
10 8 6 5 5 5 7 4 50
Logo, a idade média das crianças dessa escola é de cinco anos.
73
2.3. MÉDIA ARITMÉTICA DE DADOS AGRUPADOS EM

INTERVALOS
Segundo Rodrigues (2002, p. 61),
... há vezes em que os dados não se apresentam com seu verdadeiro

valor individual, mas são representados por uma classe que pode ter
um determinado intervalo, neste caso, operamos da mesma maneira
do caso anterior, considerando que o intervalo não tem valor definido
e sim um conjunto de valores, utilizamos como representante o ponto
médio de cada intervalo...
Vamos ao exemplo (RODRIGUES, 2002), se tivéssemos a distribuição de

frequência a seguir, procederíamos da seguinte forma:
Idade (anos) Frequência

0 I--- 5 4
5 I--- 10 2
10 I--- 15 3
15 I--- 20 1
Usaríamos a base de cálculos do exemplo anterior, ficando desta forma:
Idade (anos) Valor posição (X) Frequência X.f

0 5 2,5 4 10
5 10 7,5 2 15
10 15 12,5 3 37,5
15 20 17,5 1 17,5
Total --- 10 80
Então para calcularmos a coluna de valor de posição adotamos a seguinte

fórmula:
5/2 = 2,5 ; 5+10/2= 7,5 e assim por diante.
Para calcularmos a coluna de X.f, adotamos os seguintes:

2,5 x 4 = 10; 7,5 x 2= 15 e assim por diante.
Adotando a fórmula anterior, ficando:
74
£ xf 80
X
= = = 8 anos
anos
n 10
Logo, a idade média é de 8 anos.
Ainda segundo Rodrigues (2002), quando os dados apresentam certa

homogeneidade, é possível o uso da média aritmética, que tem como:
• Vantagens: ser fácil de calcular e entender; unir em um valor todas as observações

do conjunto.
• Desvantagens: não servir para séries variáveis assimétricas; não expressar

variações dentro da distribuição de dados.
2.4 MEDIANA (ME)

A mediana é um valor situado no centro da distribuição de frequências e
tem como objetivo encontrar um valor que permita conter 50% dos dados acima
deste valor e 50% abaixo, sua utilidade é especialmente útil quando se trata de
séries assimétricas, isto é, quando alguns valores são exageradamente baixos ou
altos (RODRIGUES, 2002).
Ainda segundo Rodrigues (2002), a mediana não é influenciada pela

magnitude de cada uma dessas séries. Para o cálculo da mediana:
1. Ordenamos todos os valores.

2. Determinamos o total de valores (n).
3. Localizamos o valor central mediante a fórmula:
n +1 , quando o número de observações é ímpar;

2
n n
� e � + 1, quando o número de observações é par, o que corresponde à
2 2
média de valores centrais.
Vamos ao exemplo (RODRIGUES, 2002, p. 52):
A) No município de Cordeiro foram selecionados oito estabelecimentos de ensino

que apresentaram quanto ao número de alunos:
75
Estabelecimentos Nº de alunos
A 150
B 180
C 230
D 2.500
E 200
F 160
G 250
H 170
Primeiro passo: ordenar os valores:
150, 160,170,180,200, 230, 250 e 2.500.

Então os valores centrais são: 180 e 200, portanto, levando em consideração
as observações pares ou ímpares, temos o valor médio igual a 190, que
corresponde à mediana. Me=190.
B) Um tipo de operação cirúrgica foi realizado por cinco médicos, cada um nos
seguintes tempos:
Médicos Minutos
A 48
B 42
C 52
D 95
E 46
Primeiro passo: ordenar as variáveis:

42, 46, 48, 52, 95
Então o valor central correspondente a 48, valor da mediana. Me = 48

minutos.
Segundo Rodrigues (2002), quando os dados se apresentam agrupados

através de uma distribuição de frequência, podemos calcular a mediana pela
seguinte fórmula:
76
n
Fa
Me Li 2
2 .hMe
FMe
Onde:
Li: limite inferior da classe que contém a mediana;
n: número de observações do conjunto;
Fa: soma das frequências das classes anteriores à classe da mediana;
hMe: amplitude da classe que contém a mediana;
fMe: frequência simples da classe da mediana.
Exemplo: Distribuição de frequências (RODRIGUES, 2002, p. 64).
Frequência
Classes
Simples Acumulada
10 I--- 20 10 10
20 I--- 30 15 25
30 I---40 20 45
40 I--- 50 15 60
50 I--- 60 8 68
60 I--- 70 2 70
Total 70 ---
Classe mediana: 30 -40

Limite inferior: 30
Número de observações: 70
Frequência acumulada anterior à classe mediana: 25
Frequência simples da classe mediana: 20
Amplitude da classe: 10
Desta forma ficaria:
77
n
Fa
Me Li 2
2 .hMe
FMe
70
25
22 35 25 10
Me 30 .10 30 .10 30 .10
20 20 20
100
Me 30 35
20
2.5 MODA (MO)

Segundo Rodrigues (2002), quando temos uma pequena amostra, a moda
corresponde ao valor mais frequente no conjunto de variáveis, já para dados
agrupados, em que se utiliza uma distribuição de frequências é calculada através
da seguinte fórmula:
d1
Mo Li .h
d1 d 2
Onde:
Li: limite inferior da classe modal
d1: diferença entre a frequência da classe da moda e da classe inferior
d2: diferença entre a frequência da classe da moda e da classe posterior
h: amplitude das classes
Exemplo (RODRIGUES, 2002, p. 65):

Distribuição de frequências.
Frequência
Classes
Simples Acumulada
10 I--- 20 10 10
20 I--- 30 15 25
30 I---40 20 45
40 I--- 50 15 60
50 I--- 60 8 68
60 I--- 70 2 70
Total 70 ---
78
Classe da moda: 30 - 40
Limite inferior da classe modal: 30
d1: 20 – 15 = 5
d2: 20-15 = 5
h = 10
Temos:
d1
Mo Li .h
d1 d 2
5 5 50
Mo 30 .10 30 .10 30
55 10 10
Mo 30 5 35
3 MEDIDAS DE VARIAÇÃO
Segundo Rodrigues (2002), usa-se em geral: desvio médio, devio-padrão,
variância ou quadrado médio, coeficiente de variação, erro padrão da média, erro
padrão de percentagem e separatrizes.
3.1 DESVIO-MÉDIO (D.M.)

Considerando que num conjunto de dados, cada valor apresenta em
relação à média aritmética um afastamento, o desvio-médio será a média
aritmética dos afastamentos da média, levando em conta os valores absolutos
desses desvios (RODRIGUES, 2002).
Exemplo:
Para um conjunto de dados: 2,8,10,15,17,20.
2 8 10 15 17 20 72
Primeiro passo: X 12
6 6
79
Cálculo:
2 12 8 12 10 12 15 12 17 12 20 12
D.M .
6
10 4 2 3 5 8
D.M.
6
32
D.M=. = 5, 3
6
O desvio-médio deste conjunto é 5,3.
3.2 DESVIO-PADRÃO
O desvio-padrão é o afastamento médio em relação à média aritmética de
um conjunto de valores (RODRIGUES, 2002).
Em série simples, eis a fórmula:
X
²�
�
X ²

S n
n
Onde:
X: valor do conjunto
∑: somatório
n: número de observações
Exemplo (RODRIGUES, 2002), calcular o desvio-padrão de: 2,5,9,11,14 e 25.
Primeiramente:
∑X= 2+5+9+11+14+25 = 66
∑X2=22+52+92+112+142+252=4+25+81+121+196+625=1.052
n=6
Inserindo dados na fórmula:
X2 66 2 4.356
X2 1.052 1.052
S n 6 6 1.052 726
n1 6 1 5 5
326
=�
S = 65 , 20 = 8 , 07
5
80
Observa-se que no cálculo do desvio-padrão utilizamos o denominador (n-

1), ou seja, 6 -1. Devemos considerar para casos em que n for menor que 30, este será
o procedimento, por causa do pequeno número de observações, já para os casos onde
o n é maior que 30, usa-se apenas o n no denominador (RODRIGUES, 2002).
No segundo exemplo, trata-se de uma série de dados agrupados, isto é,

uma série de valores que se repetem, e por conseguinte são representados pela
sua frequência (RODRIGUES, 2002).
X F FX
2 2 4
3 2 6
4 4 16
5 4 20
6 2 12
Total 14 58
Temos, portanto, um total de 14 valores agrupados em cinco categorias.
X F fX fX2
2 2 4 8
3 2 6 18
4 4 16 64
5 4 20 100
6 2 12 72
Total 14 58 262
Observando que para o cálculo da coluna fX, utilizamos (2x2=4 e assim

por diante), e bem como para a coluna de fx2 utilizamos o seguinte procedimento
(42=8, e assim por diante).
Seguindo o raciocínio, temos o cálculo para o desvio-padrão desta

distribuição, utilizamos a seguinte expressão:
£ fX 2 £ fX
2
s
n n
81
2
262 58
�
S 18 , 71 4 , 12 18 , 71 16 , 81 1, 90 1, 4
14 14
Logo, o desvio-padrão desse conjunto de dados é 1,4, ou seja, esse é o

valor que os números se afastam da média aritmética.
O terceiro exemplo são dados de uma série grupada onde apresentam as

classes em intervalos, este problema é solucionado representando-se cada um dos
intervalos pelo valor médio (RODRIGUES, 2002, p. 68).
VALOR MÉDIO DO
INTERVALO (X) F
INTERVALO (X)
1I--- 5 4 3
6 I--- 10 15 8
10 I--- 15 81 13
16 I--- 20 90 18
Total 190 ---
Para este procedimento restante é igual ao verificado no exemplo anterior,

ficando desta forma:
Primeiro passo: calcular a coluna fX (4x3 = 12)
Segundo passo: calcular a coluna fX2 (122=144), ficando desta forma:
Valor médio
Intervalo (X) f do intervalo fX fx2
(X)
1I--- 5 4 3 12 144
6 I--- 10 15 8 120 14.400
10 I--- 15 81 13 1.053 1.108.809
16 I--- 20 90 18 1.620 2.624.400
Total 190 --- 2.805 3.747.753
82
Seguindo a fórmula:
£ fX 2 £ fX
2
s
n n
2
3.747.753 2.805 2
�
S 19.725 14 , 76 19.725 217 , 85
190 190
=�
S 19.507 139 , 67
=
UNI
Desvio-padrão – POPULACIONAL, representada letra grega σ = σ2

Desvio-padrão – AMOSTRAL, representada por s = s2
3.3 VARIÂNCIA OU QUADRADO MÉDIO

Quantitativamente, o seu valor corresponde ao desvio-padrão elevado ao
quadrado, (RODRIGUES, 2002).
Segue a fórmula, seguindo o parâmetro do n.
N ≤ 30 N > 30
£ X £X
2 2
£X 2
£X 2

S n n
S
2 2
n 1 n
83
3.4 COEFICIENTE DE VARIAÇÃO (C.V.)
Segundo Rodrigues (2002), em trabalhos experimentais, através deste

parâmetro, comprovamos a precisão alcançada, seu coeficiente é expresso em %,
sendo muito utilizado em trabalhos científicos.
Eis a fórmula:
S
C.V . = .100
X
Onde:
S: desvio-padrão
X : média aritmética
Ainda segundo Rodrigues (2002), há uma relação existente entre desvio-

padrão e a média aritmética, quanto maior for a dispersão no conjunto de
observações, maior será o seu valor.
 Até 10% - ótimo

 De 11% a 20% - bom
 De 21% a 30% - regular
3.5 ERRO-PADRÃO DA MÉDIA – sX
Quando realizamos um experimento científico em que utilizamos dados

de uma fração representativa de uma população (amostra), a média aritmética
determinada representará, em relação a média populacional, e as outras amostras
fossem retiradas da população apresentariam médias aritméticas que teriam
outros afastamentos em relação à média, e para determinar a média destes
afastamentos utilizamos o erro-padrão da média (RODRIGUES, 2002).
Eis a fórmula:
S
SX
n
Onde:
S: desvio-padrão
n: nº de observações
Vamos a um exemplo:
84
Em uma determinada amostra com 150 observações em que o desvio-

padrão é igual a 5, o erro padrão da amostra será:
S
SX
5 5
0, 41
n 150 12, 25
Logo, 0,41 é o afastamento médio com que as médias amostrais se

apresentam em relação a média aritmética da população.
3.6 ERRO-PADRÃO DE PERCENTAGEN – S (P)

De acordo com Rodrigues (2002), nos experimentos cuja população
procuramos estudar a frequência com que certo fenômeno ocorre, utilizam-se
comumente amostras para tal fim, e a percentagem de ocorrência do fenômeno
na amostra deve apresentar diferença em relação à percentagem na população.
Assim, o erro-padrão de percentagem seria o erro médio com que estaríamos
afastados do percentual da população.
Eis a fórmula:
p.q
S p
n
Onde:
p: percentual da amostra
q: 100-p
n: nº de observações
Vamos ao exemplo:
p= 20%
Valores:
q= 100- p = 100-20=80%
n= 400
p.q 20 x80 1600

S p 1, 63%
n 600 600
Logo, o erro-padrão da percentagem é de 1,63%
85
3.7 SEPARATRIZES
Como já vimos, algumas medidas de posição, tal como a mediana, que divide
a distribuição dos dados em duas partes com um número igual de observações.
Agora vamos ver medidas semelhantes, mas que dividem a distribuição de dados
de acordo com o número de elementos (RODRIGUES, 2002).
Estes elementos seriam:
• Quartis: quatro partes iguais
• Decis: dez partes iguais
• Centis: cem partes iguais
3.7.1 Quartis
Para dividirmos um conjunto de dados em quatro partes iguais
necessitamos de separatrizes (quartis):
n n 3n
4 2 4
x Q₁ Q₂ Q₃ Z
FONTE: Adaptado de Rodrigues (2002)
Ainda segundo Rodrigues (2002), segue a seguinte descrição:
• Primeiro quartil: em conjunto de dados, colocados em ordem crescente de

valores, o 1º quartil (Q1) corresponderá ao valor que divide o conjunto em duas
partes tais que 25% dos valores sejam menos e 75% dos valores sejam maiores
do que o valor determinado.
• Segundo quartil: o Q2 corresponde ao valor mediano, dividindo o conjunto de

dados em duas partes iguais, ou seja, 50% de cada lado.
• Terceiro quartil: é o valor da série em que teremos 75% dos valores abaixo e
25% acima do valor determinado (Q3).
86
Há outras denominações para os quartis:
• Primeiro quartil ou quartil inferior (Qi);

• O segundo quartil ou quartil do meio é a própria mediana (Md),
• O terceiro quartil ou quartil superior (Qs)
Para o cálculo, como são medidas baseadas na ordenação dos dados,

primeiro é preciso calcular a posição dos quartis.
Posição do quartil inferior = (n + 1)/4
Posição do quartil superior = [3x(n+1)]/4
Atentem que, se o valor da posição for fracionário deve-se fazer a

média entre os dois valores que estão nas posições imediatamente anterior e
imediatamente posterior à posição calculada. Se os dados estiverem dispostos em
uma distribuição de frequências, utilizar o mesmo procedimento observando as
frequências associadas a cada valor (variável discreta) ou ponto médio de classe.
Lembrando que, n é o número total de elementos da amostra, e que com o

cálculo acima, desta forma Qj (quartil) será um elemento entre Xk e Xk+1, onde k
é o maior inteiro menor que j(n+1)/4 e será calculado da seguinte forma.
Altera em relação à posição do

quartil
Onde:
Xj: número onde se encontra a posição quartil
K: resultado da fórmula da posição quartil.
Vamos ao exemplo:
Nome Idade
Beatriz 65
Guilherme 72
Monica 70
87
Adriana 72
Glauber 60
Verusca 67
Inês 69
Gabrielle 68
Primeiro passo ordenar os números – atentem a essa ordem.

60, 65, 67, 68, 69, 70, 72, 72.
Deste modo temos que (n+1)/4 = 9/4 = 2,25 e com isso k = 2, logo
n 1
Qj X j k X k 1 X k
4
8 1
Q1 65 2 67 65
4
Q1 65 2, 25 2 67 65 65 0, 25 x 2 65 0, 5 65, 5
Também temos que 2(n+1)/4 = 18/4 = 4,5, com isso k = 4, logo
2 n 1
Q2 X 4 k X k 1 X k
4
2 8 1 18
Q2 68 4 69 68 68 4 1 68 0, 5 x1 68, 5
4 4
E, temos que 3(n+1)/4= 27/4 = 6,75, com isso k = 6, logo
3 n 1
Q3 X 6 k X k 1 X k
4
3 8 1
Q3 70 k 72 70 70 6, 75 6 2 70 0, 75 x 2 71, 5
4
88
Temos assim, o seguinte resultado dos quartis:
Q1 65,5
Q2 68,5
Q3 71,5
3.7.2 Decis
Para dividirmos um conjunto de dados em dez partes iguais são necessários
nove separatrizes (decis):
n 2n 3n 4n 5n 6n 7n 8n 9n
10 10 10 10 10 10 10 10 10
x D₁ D₂ D₃ D₄ D₅ D₆ D₇ D₈ D₉ Z
FONTE: Rodrigues (2002)
Ainda segundo Rodrigues (2002), segue a seguinte descrição:
• O primeiro decil: o 1º decil (D1) de um conjunto de dados. Colocados em ordem

crescente, corresponde ao valor que é procedido por 10% das observações e
seguido de 90% restantes.
• De forma semelhante podemos definir outros decis, vale frisar que a mediana
corresponde ao quinto decil.
Já Silva (2015) descreve que a definição dos decis obedece ao mesmo

princípio dos quartis, com a modificação da porcentagem de valores que ficam
aquém e além do decil que se pretende calcular. Deste modo precisamos de 9
decis para dividirmos uma série em 10 partes iguais.
Para fins de cálculos dos decis, utiliza-se a fórmula dos centis, veja a
representação a seguir:
89
FONTE: Disponível em: <http://www.eecis.udel.edu/~portnoi/classroom/prob_

estatistica/2007_1/lecture_slides/aula02.pdf>. Acesso em: 10 maio 2015.
3.7.3 Centis
Segundo Rodrigues (2002), divide-se o conjunto de dados, em ordem
crescente, em cem partes, para encontrar 99 separatrizes (centis).
• O primeiro centil: o 1º centil será o valor do conjunto ordenado que divide a

série em duas partes, sendo que 1% dos valores está abaixo e 99% acima, por
analogia, podemos considerar os outros centis.
x C1 C2 C3 .................. C50 ........................................ C99 Z
FONTE: Rodrigues (2002)
Eis a fórmula:
L= (k/100).n
Onde:
L: posição do percentil desejado no conjunto de dados ordenado
k: percentil desejado
n: número de valores
Vamos ao exemplo, levando em consideração todas as fórmulas acima

citadas. Com base no exemplo do Instituto de Matemática da Universidade
Federal da Bahia (2015), observe a tabela de distribuição de frequências a seguir
e encontre:
90
a) Primeiro quartil; b) Septuagésimo quinto centil; c) Nono decil
Vamos a solução:
a) Q1
Encontrar a posição do primeiro quartil:
n 80
EQ=
1= = = 20
4 4
O Q1 está localizado na 20a posição, logo se encontra na 3aclasse. Com base

nesses dados, calcularemos
Q1 da seguinte forma:
20 20 10
Q 45
�1 59 , 29
14
Interpretação: 25% dos usuários consomem até 59,59 kwh. De maneira

análoga, 75% dos usuários consomem mais de 59,59 kwh.
b) C75
Encontrar a posição do centil 75:
n 80
Ec75 75
= = 75 = 60
100 100
91
O C75 está localizado na 60ª posição, logo se encontra na 5ª classe. Com

base nesses dados, calcularemos C75 da seguinte forma:
20 60 50
C75 85 99, 29
14
Interpretação: 75% dos usuários consomem até 99,29 kwh. De maneira

análoga, 25% dos usuários consomem mais de 99,29 kwh.
c) D9
Encontrar a posição do 9o decil:
n 80
ED9 9 9 72
10 10
O D9 está localizado na 72a posição, logo se encontra na 6aclasse. Com base

nesses dados, calcularemos D9 da seguinte forma:
20 72 64
D9 105 125
8
Interpretação: 90% dos usuários consomem até 125 kwh. De maneira

análoga, 10% dos usuários consomem mais de 125 kwh.
3.8 BOX PLOT (QUANTIL)

Segundo Farias (2015), o boxplot é um gráfico construído com base no
resumo dos cinco números, constituído por: • Valor mínimo • Primeiro quartil
(Q1) • Mediana (segundo quartil Q2) • Terceiro quartil (Q3) • Valor máximo.
Ainda segundo Farias (2015), o gráfico é formado por uma caixa construída
paralelamente ao eixo da escala dos dados (pode ser horizontal ou vertical). Essa
caixa vai desde o primeiro quartil até o terceiro quartil e nela se traça uma linha
na posição da mediana. Essa caixa, que descreve os 50% centrais da distribuição,
é comum a todas as variantes do boxplot.
92
FIGURA 19 - GRÁFICO TIPO BOX-AND-WHISKER (BOX PLOT)
Valor máximo
Quartil 3
Quartil 2 (mediana)
Quartil 1
Valor mínimo
93
RESUMO DO TÓPICO 1
Neste tópico vimos que:
• Para as medidas de posição, usa-se: média aritmética (simples, ponderada, de

dados agrupados em intervalos), mediana e moda.
• Para as medidas de variação usa-se: Desvio médio, Devio-padrão, Variância ou

quadrado médio, coeficiente de variação, erro padrão da média, erro padrão de
percentagem e separatrizes.
• As separatrizes dividem a distribuição de dados de acordo com o número de

elementos, sendo elas quartis, decis e centis.
94
AUTOATIVIDADE
Numa determinada área, foram mensuradas 20 árvores, de diferentes espécies,

todas catalogadas e identificadas. Conforme a tabela a seguir:
Árvore Diâmetro
1 30
2 14
3 25
4 48
5 77
6 36
7 57
8 14
9 10
10 6
11 12,5
12 58
13 66,45
14 17,3
15 25
16 61,89
17 47
18 12
19 11
20 10
1 Calcule: a somatória – a média – mediana – moda – desvio-padrão –

variância da amostra – coeficiente de variação – erro-padrão da média.
95
2 Em relação a tabela a seguir, calcule:
A) Quartis
B) Decis
C) Centis 45 posição
Árvore Diâmetro
1 30
2 14
3 25
4 48
5 77
6 36
7 57
8 13
9 10
10 6
96
UNIDADE 2 TÓPICO 2
TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS
1 INTRODUÇÃO
Quando vamos analisar estatísticamente os nossos dados, às vezes, eles
não são normais. Para tanto confirmamos esta situação usando alguns testes para
averiguar: o teste D’Agostino-Pearson, o teste Pearson, teste Shapiro-Wilk e o
teste Kolmogorov-Smirnov. Estes últimos são os mais usados.
Depois de realizada esta análise, para dar continuidade, há os testes

estatísticos, tanto paramétricos quanto não paramétricos, ou seja, usamos os
testes paramétricos para quando o teste que você utilizou deu como resultado a
normalidade dos dados, e de forma oposta, você irá utilizar os testes paramétricos
para quando o resultado de seu teste de normalidade resultou em não normalidade.
Suchmacher e Geller, 2005, citam: “Os testes bioestatísticos são as

principais ferramentas que irão determinar o grau de probabilidade com o qual
podemos afastar a hipótese de nulidade, e se dividem em dois tipos: paramétricos
e não paramétricos”.
Neste tópico, você irá aprender os testes de normalidade, e posterior os

testes paramétricos suas diferenças com os não paramétricos, e quais os testes
paramétricos mais usados no meio científico.
2 DIFERENÇAS ENTRE DADOS PARAMÉTRICOS E NÃO

PARAMÉTRICOS
A. Testes paramétricos: de acordo com Suchmacher e Geller (2005), estes testes são
aqueles que permitem afastar H0 com maior grau de segurança e se baseiam
nos parâmetros de distribuição gaussiana (média e desvio-padrão). E seus
critérios para sua aplicabilidade são:
• A distribuição dos dados da amostra deve ser normal.
• As amostras devem ser independentes uma da outra.
• As medidas de dispersão entre as amostras comparadas devem ser

homogêneas.
• As variáveis devem ser quantitativas.
97
B. Testes não paramétricos: ainda de acordo com Suchmacher e Geller (2005),

estes testes devem ser utilizados quando os testes paramétricos não puderem
ser utilizados, tem um poder estatístico menor do que os paramétricos, e são
aplicados nas seguintes situações:
• Dados de amostra sem distribuição normal.
• Os indivíduos da amostra estudada estão sob condições diferentes.
• Variáveis qualitativas (especialmente ordinais).
• Amostras com n pequeno.
• Amostras com medidas de dispersão diferentes.
Ainda segundo Suchmacher e Geller (2005, p. 43), “...quando os critérios

para aplicabilidade de testes paramétricos forem preenchidos, ainda se poderá
tentar transformar os dados do estudo, eis alguns dados de transformação:
logarítmica, raiz cúbica dos dados e transformação angular...”.
3 TESTES DE NORMALIDADE
Estes testes de normalidade são usados para definir a normalidade ou não
normalidade dos dados, para posteriormente, você utilizar os testes paramétricos
ou não paramétricos.
Alguns dos testes de normalidade mais utilizados são: teste Shapiro-Wilk

e o teste Kolmogorov-Smirnov.
3.1. TESTE SHAPIRO-WILK

Lucambio (2008) descreve que este teste foi proposto por Shapiro & Wilk
(1965) e utilizada a seguinte fórmula:
98
TÓPICO 2 | TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS
Ainda segundo Lucambio (2008), “.... sendo m = (m1, m2, . . . , mn) > o
vetor dos valores esperados das estatísticas de ´ordem da amostra e V a matriz de
covariâncias dessas estatíticas. O p-valor deste teste é calculado exatamente para
n = 3, em outras situações utilizam-se aproximações diferentes para 4 ≤ n ≤ 11 e
para n ≥ 12”.
3.2 TESTE KOLMOGOROV-SMIRNOV

Este teste é usado para determinar se duas distribuições de probabilidade
subjacentes diferem uma da outra ou se uma das distribuições de probabilidade
subjacentes difere da distribuição em hipótese, em qualquer dos casos é com base
em amostras finitas.
O teste pode ser utilizado para avaliar as hipóteses:
H0 : Os dados seguem uma distribuição normal

H1 :Os dados não seguem uma distribuição normal.
Ou seja, se P-Value (P-valor) for maior que o nível de significância (%), os

dados apresentam distribuição normal.
A função distribuição acumulada Fn para n observações yi é definida por
1 n
1 if y1 x ,
Fn ( x)
n

i 1

0 caso contrário.
As duas estatísticas de teste Kolmogorov-Smirnov de apenas um lado são

dadas por
Dn max( Fn ( x) F( x))

Dn max( F( x) Fn ( x))
Onde:
F(x) é a distribuição em hipótese ou outra distribuição empírica.
4 TESTES PARAMÉTRICOS
Após verificarmos a normalidade dos dados, partimos, então para os
testes paramétricos, que possuem as seguintes características quanto ao cálculo
de uma amostra ou comparando as duas amostras:
99
{ {
FIGURA 20 - TESTES PARAMÉTRICOS PARA UMA E DUAS AMOSTRAS.
Média
Uma Proporção
P
a amostra Variância
r
T a
{
{
em
s é Diferença
t t Dependentes
{
de médias
e r
s i Duas
c amostras Diferença de médias
o Independetes Diferença de proporções
s
Igualdade de variâncias
FONTE: Disponível em: <http://www.pucrs.br/famat/viali/especializa/eae_fenge/

material/laminaspi/THipoteses_Par.pdf>. Acesso em: 4 maio 2015.
Nos testes paramétricos iremos ver a análise de variância conhecida como

ANOVA.
Nesta análise de 1 fator, também é conhecida como ANOVA “One Way” –

ANOVA de um fator, sendo utilizada para comparar mais de dois grupos através
de suas médias.
Ao conduzir uma ANOVA, queremos saber quanto da variabilidade

dos nossos resultados é devido ao TRATAMENTO (variância ENTRE grupos) e
quanto é devido a ERRO (variância DENTRO dos grupos).
Segundo Anjos (2015, 112), “A análise de variância baseia-se na

decomposicão da variação total da variável resposta em partes que podem ser
atribuídas aos tratamentos (variância entre) e ao erro experimental (variância
dentro). Essa variação pode ser medida por meio das somas de quadrados
definidas para cada um dos seguintes componentes:
FONTE: Anjos (2015)
100
TÓPICO 2 | TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS
Ainda segundo Anjos (2015), a SQTrat também é chamada de variação

Entre, que seria a variação existente entre os diferentes tratamentos e a SQRes é
chamada de variação Dentro que tem como função analisar diferenças existentes
entre as repetições de um mesmo tratamento.
Tais somas podem ser representadas da seguinte forma, para um resultado

de uma análise:
FIGURA 21 - REPRESENTAÇÃO DA SQTrat.
FONTE: Anjos (2015)
Em que QMTrat=SQTrat/( I-1 ) e QMRes=SQRes/( I( J-1 ) ).
Anjos (2015, p. 113), descreve que
Pode-se mostrar que o quociente QMTrat/QMRes tem distribuição F

com ( I − 1 ) e I ( J − 1) graus de liberdade, supondo que, yij são variáveis
aleatórias independentes, todos os tratamentos tem variâncias iguais
a σ2 e Yij ∼ N( µi, σ2 ). Por esses motivos, os pressupostos da ANOVA
devem ser testados ou avaliados em qualquer análise S e Fcalculado>
Ftabelado, rejeitamos a hipótese tese de nulidade H0, ou seja, existem
evidências de diferença significativa entre pelo menos um par de
médias de tratamentos, ao nível α de significância escolhido. Caso
contrário, não rejeitamos a hipótese de nulidade H0 , ou seja, não há
evidências de diferença significativa entre tratamentos, ao nível α
de significância escolhido. Outra maneira de avaliar a significância
da estatística F é utilizando o p-valor. S e o p-valor< α, rejeitamos a
hipótese de nulidade H0. Caso contrário, se não rejeitamos a hipótese
de nulidade H0, ou seja, não há evidências de diferenças significativas
entre os tratamentos, ao nível α de significância escolhido.
101
RESUMO DO TÓPICO 2
Neste tópico vimos:
• Que os dados paramétricos possuem determinadas caraterísticas: a distribuição

dos dados da amostra deve ser normal; as amostras devem ser independentes
uma da outra; medidas de dispersão entre as amostras comparadas devem ser
homogêneas; as variáveis devem ser quantitativas.
• E os dados não paramétricos: os dados da amostra não possuem distribuição

normal; os indivíduos da amostra estudada estão sob condições diferentes e as
variáveis qualitativas (especialmente ordinais).
• Que os testes de normalidade são usados para definir a normalidade ou

não normalidade dos dados, para posteriormente, você utilizar os testes
paramétricos ou não paramétricos.
102
AUTOATIVIDADE
Quando devemos usar os dados para os testes paramétricos e para os

testes não paramétricos?
103
ANEXOS
TABELA 1 – TESTE DE SHAPIRO-WILK
Nível de significância α
0.01 0.02 0.05 0.10 0.50 0.90 0.95 0.98 0.99
3 0,753 0,756 0,767 0,789 0,959 0,998 0,999 1,000 1,000
4 0,687 0,707 0,748 0,792 0,935 0,987 0,992 0,996 0,997
5 0,686 0,715 0,762 0,806 0,927 0,979 0,985 0,991 0,993
6 0,713 0,743 0,788 0,826 0,927 0,974 0,981 0,986 0,989

7 0,730 0,760 0,803 0,838 0,928 0,972 0,979 0,985 0,988
8 0,749 0,778 0,818 0,851 0,932 0,972 0,978 0,984 0,987
9 0,764 0,791 0,829 0,859 0,935 0,972 0,978 0,984 0,986
10 0,781 0,805 0,842 0,869 0,938 0,972 0,978 0,983 0,986
11 0,792 0,817 0,850 0,876 0,940 0,973 0,979 0,984 0,986

12 0,805 0,828 0,859 0,883 0,943 0,973 0,979 0,984 0,986
13 0,814 0,837 0,866 0,889 0,945 0,974 0,979 0,984 0,986
Tamanho da amosra, N
14 0,825 0,846 0,874 0,895 0,947 0,975 0,980 0,984 0,986

15 0,835 0,855 0,881 0,901 0,950 0,975 0,980 0,984 0,987
16 0,844 0,863 0,887 0,906 0,952 0,976 0,981 0,985 0,987

17 0,851 0,869 0,892 0,910 0,954 0,977 0,981 0,985 0,987
18 0,858 0,874 0,897 0,914 0,956 0,978 0,982 0,986 0,988
19 0,863 0,879 0,901 0,917 0,957 0,978 0,982 0,986 0,988
20 0,868 0,884 0,905 0,920 0,959 0,979 0,983 0,985 0,988
21 0,873 0,888 0,908 0,923 0,960 0,980 0,983 0,987 0,989

22 0,878 0,892 0,911 0,926 0,961 0,980 0,984 0,987 0,989
23 0,881 0,895 0,914 0,928 0,962 0,981 0,984 0,987 0,989
24 0,884 0,898 0,916 0,930 0,963 0,981 0,984 0,987 0,989
25 0,888 0,901 0,918 0,931 0,964 0,981 0,985 0,988 0,989
26 0,891 0,904 0,920 0,933 0,965 0,982 0,985 0,988 0,989

27 0,894 0,906 0,923 0,935 0,965 0,982 0,985 0,988 0,990
28 0,896 0,908 0,924 0,936 0,966 0,982 0,985 0,988 0,990
29 0,898 0,910 0,926 0,937 0,966 0,982 0,985 0,988 0,990
30 0,900 0,912 0,927 0,939 0,967 0,983 0,985 0,988 0,990
FONTE: Disponível em: <http://docentes.esa.ipcb.pt/estatistica/apontamentos/Testes_Ajustamen

to.pdf>. Acesso em: 20 maio 2015.
104
Tabela 2 do anexo: Smirnov --Kolmogorov
Tamanho Níve de Significância (α)

da
Amostra 0,20 0,10 0,05 0,01
(N)
1 0,900 0,950 0,975 0,995
2 0,684 0,776 0,842 0,929
3 0,565 0,642 0,708 0,829
4 0,494 0,564 0,624 0,734
5 0,446 0,510 0,563 0,669
6 0,410 0,470 0,521 0,618
7 0,381 0,438 0,486 0,577
8 0,358 0,411 0,459 0,543
9 0,339 0,388 0,432 0,514
10 0,322 0,368 0,409 0,486
15 0,268 0,304 0,338 0,404
20 0,231 0,264 0,294 0,352
25 0,210 0,240 0,264 0,320
30 0,190 0,220 0,242 0,290
40 - - 0,210 0,250
50 - - 0,190 0,230
N>50 1,07 1,22 1,36 1,63

√N √N √N √N
FONTE: Disponível em: < http://www.deg.ufla.br/site/_adm/upload/file/Hidrologia%20I/

Tabelas_Hidrologia.pdf >. Acesso em: 20 maio 2015.
105
106
UNIDADE 2 TÓPICO 3
TESTES DE HIPÓTESE
1 INTRODUÇÃO
Neste tópico iremos ver alguns testes de hipótese que você irá utilizar em
seus cálculos estatísticos, atestando seus dados coletados em campo.
2 HIPÓTESE ESTATÍSTICA
Kato (2015) descreve que “Hipótese, em estatística, é uma suposição
formulada a respeito dos parâmetros de uma distribuição de probabilidade de
uma ou mais populações”.
Ainda segundo Kato (2015),
o nível de significância de um teste é a probabilidade máxima de

rejeitar Ho. Se, por exemplo, utilizarmos o nível de significância de
5%, a hipótese nula (Ho) será rejeitada somente se o resultado da
amostra for tão diferente do valor suposto que uma diferença igual ou
maior ocorreria com uma probabilidade máxima de 0,05. Na prática,
o valor de α é fixo. (Geralmente α = 0,01 ou 0,05 ou 0,10.) No exemplo,
fixado α = 0,05, levaria à rejeição de Ho, pois 0,0062 < 0,05. Uma outra
maneira de tomar-se uma decisão é comparar o valor tabelado com a
estatística do teste.
Kato (2015) ainda descreve:
A REGIÃO CRÍTICA de um teste é onde os valores da estatística do

teste levam à rejeição da hipótese nula. A sua área é igual ao nível de significância,
e sua direção é a mesma da hipótese alternativa.
107
α/2 α/2
FONTE: Disponível em: <http://www.pucrs.br/famat/sergio/Estatistica_Basica_T126/Teste_de_

hipotese.pdf>. Acesso em: 25 jun. 2015.
• REGRA DE DECISÃO: Se o valor da estatística do teste cair dentro da região

crítica, rejeita-se H0. Ao rejeitar a hipótese nula (H0) existe uma forte evidência
de sua falsidade. Ao contrário, quando aceitamos, dizemos que não houve
evidência amostral significativa no sentido de permitir a rejeição de Ho.
• TIPOS DE ERROS: Pelo fato de usarmos resultados amostrais para fazer

inferência sobre a população, estamos sujeitos a erros. Digamos que existe uma
probabilidade α de que mesmo sendo Ho verdadeiro, � X assuma um valor que
leva Zcalc à rejeição de Ho. As probabilidades desses erros são chamadas α e β
respectivamente.
α = P(erro tipo I) = P(rejeitar H₀/H₀ é verdadeiro)
β = P(erro tipo II) = O(aceitar H₀/H₀ é falso)
REALIDADE
DECISÃO
H₀ verdadeira H₀ falsa
Aceitar H₀ Decisão correta (1-α) Erro tipo II (β)
Rejeitar H₀ Erro tipo I (α) Decisão correta (1-β)
FONTE: Disponível em: <http://www.pucrs.br/famat/sergio/Estatistica_Basica_T126/Teste_de_

hipotese.pdf>. Acesso em: 25 jun. 2015.
3 QUI-QUADRADO (TESTE DE ADERÊNCIA)

� 2
Rodrigues (1993) descreve que o teste não paramétrico de χ (quiquadrado)
�
foi desenvolvido por Pearson e ele designado pela letra minúscula grega χ
seguida do expoente 2, sendo muito aplicado nas pesquisas biológicas, este teste
mede a variação quando temos amostras com frequências observadas, e baseadas
na teoria, podemos calcular as frequências esperadas.
108
TÓPICO 3 | TESTES DE HIPÓTESE
A fórmula expressa é:
£ f0 fe
2

2
fe
GL= nº de classes – 1
Onde:
f0: frequência observada
fe: frequência esperada
Vamos ao exemplo:
Quando lançamos uma moeda, esperamos que ela seja de cara ou coroa,
não é?!
Mas, se lançarmos esta mesma moeda 350 vezes, esperamos que a metade
delas seja cara, e a outra metade consequentemente coroa. Portanto, a frequência
esperada é 175, igual para cada uma.
Porém, quando realizamos o experimento, observamos que há uma

discrepância entre os números de caras e os números de coroas. Tendo como o
número de caras 160 e o número de coroas igual a 190. Os desvios são iguais a +
15 para caras e para coroa é -15.
Então o teste de quiquadrado será aplicado visando verificar a significância

nos desvios que ocorrem (RODRIGUES, 1993, p. 80).
Usando a fórmula:
£ f0 fe
2

2
fe
Lembrando que o desvio é elevado ao quadrado e dividido pela frequência

esperada.
Com os dados anteriores:
109
f0: 160 e 190

fe: 175
190 175
2
152
2
1 1, 28
175 175
160 175 15

2 2
2
2 1, 28
175 175
2
Somando-se os valores de χ1 e χ 2 , tem –se:
2
χ12 + χ 22 = 1,28+1,28 = 2,56 n.s.*
*n.s. = não significativo
Em seguida, confrontamos este valor com o valor tabela.
Valor da tabela= 2-1=1 --> São duas classes
Então verifica-se que o valor obtido, igual a 2,56, é menor do que

2
encontrado na tabela, portanto, χ é considerado não significativo, os desvios
observados na amostra podem ser atribuídos ao acaso.
4 TESTE T – (STUDENT)
Rodrigues (1993) descreve que se trata de um teste de larga aplicação
utilizado para a verificação de diferenças significativas entre médias, quando
temos apenas dois tratamentos, ou seja, duas médias.
Ainda segundo Rodrigues (1993), há três formas distintas de sua aplicação:
• Amostras ou dados independentes – comparação das médias.
• Dados dependentes – comparação de médias, antes e após determinado

tratamento.
• Estimativa de parâmetros – quando de uma população retiramos uma amostra

e testamos se a média desta representa bem a média da população.
110
O teste t é indicado segundo Rodrigues (1993), para amostras que

apresentam pequeno número de elementos (pequenas amostras), também
podendo ser empregado para compararmos médias de amostras independentes
quando o número de elementos nos dois grupos é diferente.
Vamos aos exemplos:
a. Amostras independentes – variâncias conhecidas (σ2)
Comparando o peso, aos 60 dias de vida, de 26 caprinos da raça A e 26 da

raça B, segundo Rodrigues (1993) obtivemos os seguintes dados:
Raça A Raça B
X 1 = 38 Kg X 2 = 33,5 Kg
s1 = 5 Kg s2 = 6 Kg
n1 = 26 n2 = 26
Para a determinação do valor t, para a verificação das médias se apresentam

diferenças significativas e aplica-se a seguinte fórmula:
x1 x2
t
s12 s22

n1 n2
Em que:
X 1 e X 2 : média das amostras

s1 e s2 : desvios padrões das amostras
n1 e n2 : número de observações das amostras
x1 x2 38 33, 5 4, 50
t 2, 94
s12 s22 52 6 2 1, 86

n1 n2 26 26
Recorrendo a tabela t, e lembrando que:
111
GL= n1+n2 -2, observando os valores t no nível de 5% e 1% de

probabilidade na tabela; e que se o valor encontrado for menor que os 2 valores
da tabela e correspondente àqueles graus de liberdade, o valor de t então, não
será significativo, implicando, concluir que a diferença entre as médias não foi
significativa (RODRIGUES, 1993).
Voltando ao nosso exemplo, temos como valor de t = 2,96, para 50 graus,

pois 26 +26-2 = 50.
Conclusão: Consideramos significativo, no nível de 1% de probabilidade

(P<0,01), por ter ultrapassado os valores da tabela; 2,01 a 5% e 2,68 a 1%. Dessa forma,
concluímos que há 99% de probabilidade que os caprinos da raça A, aos 60 dias de
vida, devam representar peso médio mais elevado do que os caprinos da raça B.
b. Amostras independentes – variâncias desconhecidas ( σ2)
O exemplo a seguir (RODRIGUES, 1993) possui duas amostras de

indivíduos, que são submetidas a um determinado tratamento, obtendo-se de
cada grupo os dados relativos à pressão arterial sistólica (PAS):
Grupo A Grupo B
X 1 = 175 X 2 = 169
s1 = 10 s2 = 11
n1= 20 n2= 32
Para a determinação do t, a fim de testar a diferença entre as médias

aritméticas, temos:
x A xB
t
1 1
s x A xB .
nA nB
Sendo que:
x A e x B : médias aritméticas dos grupos
n1 e n2 : número de observações
Primeiramente vamos a estes cálculos:
112
sA2 . nA 1 sB2 nB 1
s 2
x A xB
nA nB 2
sA2 . nA 1 sB2 nB 1 19 x100 31x121

s 2
x A xB
nA nB 2 20 32 2
1900 3751 5651

sx2A xB 113, 02
50 50
sxA xB 113, 02 10, 63
Depois, iremos ao teste t:
x A xB
t
1 1
s x A xB .
nA nB
175 169 6 6
t 1, 98
1 1 10, 63. 0, 285 3, 03
10, 63.
20 32
Conclusão: t = 1,98 n.s. (P>0,05)
O valor de t foi considerado não significativo, portanto, a diferença entra

as médias não foi significativa.
4.1 DADOS DEPENDENTES

Como já foi dito antes, a amostra é observada antes e após certo tratamento
(RODRIGUES, 1993).
Vamos ao exemplo (RODRIGUES, 1993, p. 85).
Considerando uma amostra de 10 crianças, de 8 a 12 anos de idade, as

quais teriam o seu índice CPOD determinado antes e após a aplicação de flúor.
113
Aplicação de flúor
Nº de crianças Diferença
Antes Após
1 5,7 4,7 1,0
2 5,2 4,8 0,4
3 6,4 6,0 0,4
4 5,9 5,3 0,6
5 5,8 5,2 0,6
6 7,0 5,0 2,0
7 6,4 5,6 0,8
8 6,0 5,2 0,8
9 5,8 5,0 0,8
10 5,2 4,6 0,9
Para se verificar a diferença entre as médias, e se estas são significativas,

utiliza-se a seguinte fórmula:
xantes � x� após
t �
s
n
GL = n -1
Onde:
Numerador apresenta diferença entre as médias.
No denominador, s, é o desvio-padrão da diferença entre os valores
antes e após.
E n corresponde ao número de elementos da amostra.
E n corresponde ao número de elementos da amostra.
Dessa forma:
x antes= 5,94
x depois = 5,14
sdif = 0,46
n = 10
114
Usando a fórmula temos:
xantes
– xapós
após 5, 94 5,14 0, 80
t 5, 49
s 0, 46 0, 46
n 10 3,13
Conclusão:
Olhando na tabela GL = 10-1=9

O t calculado é 5,49
Então, olhando para a tabela para 9 graus de liberdade, temos 2,26 (5%) e
3,25 (1%).
Conclui-se então que, t = 5,49 e considerado significativo no nível de 1%
de probabilidade (P<0,01), logo, a ação do flúor foi eficiente sobre a queda do
índice de cárie.
4.2 DIFERENÇA ENTRA A MÉDIA AMOSTRAL E O PARÂMETRO

POPULACIONAL
Segundo Rodrigues (1993), neste caso, é conhecida a média da característica
ao estudar a população e, ao determinarmos a amostra, desejamos verificar se ela
representa a população de onde foi retirada.
Eis a fórmula:
X
t
s
n
Onde:
X = média amostral
μ = parâmetro populacional
s = desvio-padrão da amostra
n = número de elementos da amostra
Vamos ao exemplo Rodrigues (1993).
Verificamos que uma população bovina seja constituída de 10.000 animais,

cuja média de peso seja igual a 420 kg. Retiramos dessa população uma amostra
de 400 animais cujas observações sobre a média de peso apresentaram valor igual
a 375 kg e desvio padrão de 23 kg. Observamos estes fatos, e neste experimento,
queremos saber se a amostra representa bem a população, ou melhor, se haverá
diferença significativa entre a média da amostra e da população.
115
X 375 420 45 900

t 39,13
s 23 23 23
n 400 20
t = -39,13 (P<0,01)
Este valor acima, confrontado com os valores da tabela, para n=1 grau de
liberdade, com 1,96 (5%) e 2,58 (1%), possibilita concluirmos que o valor calculado
é significativo no nível de 1%nde probabilidade (P<0,01), sendo assim, a amostra
não representa bem a população, pois a média aritmética se diferencia da média
populacional (RODRIGUES, 1993).
5 COMPARAÇÃO DE DUAS PROPORÇÕES

“Quando desejamos comparar duas proporções, podemos testar uma
hipótese nula de diferença estatística não significativa contra uma hipótese
alternativa de diferença estatística entre eles” (RODRIGUES, 1993, 1993).
Para isso, utilizamos o valor de Z, em que:
p1 p2
Z
p1q1 p2 q2

n1 n2
Onde:
p1 e p2 = frequências relativas das duas amostras comparadas, e nestas
condições elas devem ser independentes.
n1 e n2 = número de observações em cada amostra
q1 = 1 – p1
q2 = 1 – p 2
Vamos ao exemplo (RODRIGUES, 1993):
Numa pesquisa de laboratório demonstrou que a droga A administrada a

50 animais provocou a morte de 26 deles, enquanto a droga B dada a 80 animais
permitiu que 48 animais sobrevivessem.
Pergunto:
Há diferença significativa entre as duas drogas?
H0;p1 = p2; Ha:p1≠p2
116
Então temos:
26
p1
= = 0, 52
50
q1 1 0, 52 0, 48
n1 = 50
32
p=
2 = 0, 40
80
q1 1 0, 40 0, 60
n2= 80
E, portanto, com a fórmula de Z, temos:
p1 p2 0, 52 0, 40 0,12 0,12
Z 1, 34
p1q1 p2 q2
0, 52 0, 48 0, 40 0, 60 0, 00799 0, 089
n1 n2 50 80
Z = 1,34
Com este resultado conclui-se que não houve diferença estatística

significativa entre as duas drogas. Aceita-se H0, pois o valor de Z encontra-se na
área de aceitação (RODRIGUES, 1993).
117
RESUMO DO TÓPICO 3
Neste tópico vimos:
• Hipótese é uma suposição formulada a respeito dos parâmetros de uma

distribuição de probabilidade de uma ou mais populações.
• Vimos os testes de quiquadrado, teste t e comparação de duas proporções,

sendo estes os mais usados.
• O teste quiquadrado mede a variação quando temos amostras com frequências

observadas, e baseadas na teoria, podemos calcular as frequências esperadas.
• O teste t, serve para a verificação de diferenças significativas entre médias,

quando temos apenas dois tratamentos.
• Para verificar a comparação de duas proporções, podemos testar uma hipótese

nula de diferença estatística não significativa contra uma hipótese alternativa
de diferença estatística entre eles.
118
AUTOATIVIDADE
1 Vamos reforçar os conhecimentos.
Como já vimos, a hipótese é uma suposição formulada a respeito dos

parâmetros de uma distribuição de probabilidade de uma ou mais populações,
certo, de acordo com as amostras coletadas abaixo, respondam se entre elas há
diferenças estatísticas.
Nº de coletas AMOSTRA 01 (ml) AMOSTRA 02 (ml) AMOSTRA 03 (ml)
1 456 356 608
2 235 535 407
3 801 614 504
4 145 234 401
5 239 335 327
6 112 485 366
7 298 234 715
8 203 555 617
9 314 399 802
10 158 222 433
11 203 409 344
119
ANEXOS
Nível do Significância para
D – máx|F₀ (x) – Sn (x)|
0,20 0,15 0,10 0,05 0,01
1 0,900 0,925 0,950 0,975 0,995
2 0,684 0,726 0,776 0,842 0,929
3 0,565 0,597 0,642 0,708 0,828
4 0,494 0,525 0,564 0,624 0,733
5 0,446 0,474 0,510 0,565 0,669
6 0,410 0,436 0,470 0,521 0,618

7 0,381 0,405 0,438 0,486 0,577
8 0,358 0,381 0,411 0,457 0,543
9 0,339 0,360 0,388 0,432 0,514
10 0,332 0,342 0,368 0,410 0,490
11 0,307 0,326 0,352 0,391 0,468

12 0,295 0,313 0,338 0,375 0,450
13 0,284 0,302 0,325 0,361 0,433
14 0,274 0,392 0,314 0,349 0,418
15 0,266 0,283 0,304 0,338 0,404
16 0,258 0,274 0,295 0,328 0,392

17 0,250 0,266 0,286 0,318 0,381
18 0,244 0,259 0,278 0,309 0,371
19 0,237 0,252 0,272 0,301 0,363
20 0,231 0,246 0,264 0,294 0,356
25 0,21 0,22 0,24 0,27 0,32

30 0,19 0,20 0,22 0,24 0,29
35 0,18 0,19 0,21 0,23 0,27
1,65 1,14 1,22 1,36 0,63
Mais de 35 √N √N √N √N √N
FONTE: Disponível em: <http://www.amendes.uac.pt/monograf/monograf01estatNpa

ramt.pdf>. Acesso em: 10 maio 2015.
120
Tabela Qui-quadrado
0,20
Distribuição de Qui-Quadrado 0,15
Valores da Função de Distribuição
0,10
n ϰ(n-2) 2 -1 Se X - ϰ² então P (X ≤ ϰ) = 1 - α
e
F(ϰ) = ∫ 2 0,05
Se X - ϰ² então P (X ≤ 11,07) = 0,95
0 2n 2 (n )
2
(5)
ϰ²₀,₉₅ = 11,07
(5) 0,00
0 5 10 15 20 25
1–α
n/F
0,005 0,010 0,025 0,050 0,100 0,250 0,500 0,750 0,900 0,950 0,975 0,990 0,995
1 0,000 0,000 0,001 0,004 0,016 0,102 0,455 1,323 2,705 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,850
5 0,412 0,554 0,831 1,145 1,610 2,575 4,351 6,625 9,235 11,070 12,833 15,085 16,750
6 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278
8 1,344 1,645 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,665 23,589
10 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 27,725 26,757
12 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,300
13 3,555 4,107 5,009 5,892 7,042 9,299 12,340 15,984 19,812 22,352 24,736 27,668 29,819
14 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 11,037 14,339 18,245 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 11,912 15,338 19,369 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,554 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 35,191 38,582
20 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,565 39,997
21 8,034 8,897 10,283 11,951 13,240 16,344 20,337 24,935 29,615 32,671 35,479 39,932 41,401
22 8,643 9,542 10,982 12,338 14,041 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796
23 9,260 10,195 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181
24 9,886 10,855 12,401 13,848 15,659 19,037 23,337 28,241 33,195 36,415 39,364 42,980 45,559
25 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 20,843 25,336 30,435 35,563 38,885 41,923 45,642 48,290
27 11,808 12,879 14,573 16,151 18,114 21,749 26,336 31,528 36,741 40,113 43,195 46,963 49,645
28 12,451 13,565 15,308 16,928 18,939 22,657 27,336 32,620 37,916 41,337 44,461 48,278 50,993
29 13,121 14,256 16,047 17,708 19,768 23,567 28,336 33,711 39,087 42,557 45,722 49,588 52,336
30 13,787 14,953 16,791 18,493 20,599 24,478 29,336 34,800 40,256 43,773 46,979 50,892 53,672
31 14,458 15,655 17,539 19,281 21,434 25,390 30,336 35,887 41,422 44,985 48,232 52,191 55,003
32 15,134 16,362 18,291 20,072 22,271 26,304 31,336 36,973 42,585 46,194 49,480 53,485 56,328
33 15,815 17,074 19,047 20,867 23,110 27,216 32,336 38,058 43,745 47,400 50,725 54,776 57,648
34 16,501 17,789 19,806 21,664 23,952 28,136 33,336 39,141 44,903 48,602 51,956 56,061 58,964
35 17,192 18,509 20,569 22,455 24,797 29,054 34,336 40,223 46,059 49,802 53,203 57,342 60,275
36 17,887 19,233 21,336 23,259 25,643 29,973 35,336 41,304 47,212 50,998 54,437 58,619 61,581
37 18,586 19,960 22,106 24,075 26,492 30,893 36,336 42,383 48,363 52,192 55,668 59,893 62,883
38 19,289 20,691 22,878 24,884 27,343 31,815 37,335 43,462 49,513 53,384 56,896 61,162 64,181
39 19,996 21,426 23,654 25,695 28,195 32,737 38,335 44,539 50,660 54,572 58,120 62,482 65,476
40 20,707 22,146 24,433 29,051 29,051 33,660 39,335 45,616 51,805 55,758 59,342 63,691 66,766
41 21,421 22,905 25,215 27,326 29,907 34,585 40,335 46,692 52,949 56,942 60,561 64,950 68,053
42 22,138 23,650 25,999 28,144 30,765 35,510 41,335 47,766 54,090 58,124 61,777 66,205 69,336
43 22,859 24,398 26,785 28,955 31,625 36,436 42,335 48,840 55,230 59,304 62,990 67,549 70,616
44 23,584 25,148 27,575 29,787 32,487 37,363 43,335 49,913 56,369 60,481 64,201 68,710 71,893
45 24,311 25,901 28,356 30,612 33,350 38,291 44,335 50,985 57,505 61,656 65,410 69,957 73,166
46 25,041 26,657 29,160 31,439 34,215 39,220 45,335 52,056 58,641 62,830 66,617 71,201 74,437
47 25,775 27,416 29,956 32,268 35,081 40,149 46,335 53,127 59,774 64,001 67,821 72,443 75,704
48 26,511 28,117 30,755 33,098 35,949 41,079 47,335 54,196 60,907 65,171 69,023 73,683 76,959
49 27,249 28,941 31,555 33,930 36,818 42,010 48,335 55,265 62,038 66,339 70,222 74,919 78,231
50 27,991 29,707 32,357 34,764 37,689 42,942 49,335 56,334 63,167 67,505 71,420 76,154 79,490
51 28,735 30,475 33,162 35,600 38,560 43,874 50,335 57,401 64,295 68,669 72,616 77,385 80,747
52 29,481 31,245 33,958 36,437 39,433 44,808 51,335 58,458 65,422 69,832 73,810 78,616 82,001
53 30,230 32,018 34,776 37,276 40,308 45,741 52,335 59,534 66,548 70,993 75,002 79,843 83,253
54 30,981 32,793 35,586 38,116 41,183 46,676 53,335 60,600 67,673 72,153 76,192 81,069 84,502
55 31,735 33,570 35,398 38,958 42,060 47,610 54,335 61,665 68,795 73,311 77,380 82,292 85,749
56 32,490 34,350 37,212 39,801 42,937 48,546 55,335 62,726 69,919 74,468 78,567 83,513 86,994
FONTE: Disponível em: <http://pt.slideshare.net/pcasquilho/tabela-qui-quadrado-2012>.Acesso

em: 10 maio 2015.
121
Tabela T
FONTE: Disponível em: <http://paginapessoal.utfpr.edu.br/lcandido/tabelas-estatistica/t_student.

pdf/at_download/file> Acesso em: 15 jun. 2015.
122
Tabela Z
Áreas sob a curva normal padrão. Para os valores negativos de z as áreas

são obtidas por simetrias.
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0 0,004 0,008 0,012 0,016 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,091 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,148 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,17 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,195 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,219 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,258 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,291 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,334 0,3365 0,3389
1 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,377 0,379 0,381 0,383
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,398 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,437 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,475 0,4756 0,4761 0,4767
2 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,483 0,4834 0,4838 0,4842 0,4846 0,485 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,489
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,492 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
123
2,5 0,4938 0,494 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,496 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4965 0,4967 0,4968 0,4969 0,497 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,498 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4983 0,4984 0,4985 0,4985 0,4986 0,4986
3 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,499 0,499
3,1 0,499 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,49 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5
FONTE: Disponível em: <http://www.cultura.ufpa.br/dicas/biome/biotaz.htm>. Acesso em: 15

jun. 2015.
124
UNIDADE 2
TÓPICO 4
TESTES NÃO PARAMÉTRICOS
1 INTRODUÇÃO
Neste tópico você irá ver alguns testes não paramétricos adotados no
meio científico. Tais testes são utilizados quando não há uma normalidade dos
dados que foram levantados no experimento.
Viali (2008, p. 4) ainda cita que: “Em geral, as probabilidades das afirmativas
obtidas na maioria dos testes não paramétricos são exatas, salvo quando se usam
aproximações para grandes amostras. Independem da forma da população da
qual a amostra foi obtida. São, em geral, de mais fácil aplicação, e exigem, quase
sempre, menor volume de cálculos. Existem testes não paramétricos que nos
permitem trabalhar com dados de diferentes populações, o que não é possível
com os paramétricos. São úteis nos casos em que é difícil estabelecer uma escala
de valores quantitativos para os dados. O pesquisador pode apenas dizer que
um dado tem mais ou menos da característica que está sendo analisada, sem
poder precisar ou quantificar as diferenças. Os dados se encontram numa certa
ordem de classificação: mais ou menos; melhor ou pior; maior ou menor etc. São
mais eficientes do que os paramétricos, quando os dados da população não têm
uma distribuição normal. E quando a população é normalmente distribuída, sua
eficiência, em alguns casos, é levemente inferior à dos concorrentes”.
2 TESTE U MANN-WHITEY
Este teste corresponde a uma alternativa para a comparação de duas
amostras, os números naturais são classificados num conjunto de valores
observados. Assim, o posto de um valor de um conjunto de n valores corresponde
a um número natural que indicará a sua posição no conjunto anteriormente
ordenado, quando ocorre a presença de valores iguais no conjunto, nós
consideramos um ponto médio, não afetando assim o posto seguinte. Um
exemplo, num conjunto de seis valores já ordenados 7 – 12 – 18 – 18 – 19 – 23, os
postos serão 1 – 2 – 3,5 – 3,5 – 5 e 6, respectivamente (RODRIGUES, 2002).
125
A aplicação do teste baseia-se na aplicação no cálculo de V1 eV2:
n1 n1 1
U1 n1.n2 T1
2
n2 n2 1
U 2 n1.n2 T2
2
Onde:
n1 e n2 = os tamanhos das duas amostras de T1 e T2
T1 e T2 = correspondem às somas dos pontos atribuídos aos valores das
duas amostras.
ATENCAO
Nas fórmulas, vocês irão observar que em algumas expressões; o sinal ponto (.),
outras vezes o X (xis), e algumas não há nenhum sinal atribuído a multiplicação, atendem a isso.
Para comparação de amostras com n1 e n2 maiores que sete, o teste pode

ser aplicado por aproximação normal (RODRIGUES, 2002).
Tendo as seguintes fórmulas:
n1.n2
u u
2
n1.n2 n1 n2 1
u
12
Neste caso, a expressão do teste será:
U1 u u
Z
u
126
TÓPICO 4 | TESTES NÃO PARAMÉTRICOS
Num determinado experimento, vamos verificar se os dados das duas

amostras apresentam diferenças significativas.
Amostra A Amostra B
Dados Postos Dados Postos
2,6 (9,5) 2,3 (5)
2,9 (13) 2,8 (12)
2,5 (8) 2,0 (2)
2,7 (11) 1,8 (1)
3,2 (14) 2,4 (7)
2,6 (9,5) 2,3 (5)
2,3 (5) 2,2 (3)
3,3 (15)
T1=85,0 T2=35,0
Primeiro Passo: ordenação dos valores para a obtenção dos seus postos e
posterior somatório, já demostrado no quadro acima.
Temos então:
n1 = 8
n2= 7
T1= 85
T2= 35
Após isso, primeiramente iremos calcular os seguintes valores:
n1.n2 8 .. 77
u u 28
2 2
n1.n2 n1 n2 1 8 ..77.. 16
16 896
896
u 74, 66 8, 63
12 12 12
12
127
O teste pode ser aplicado tanto para U1 ou U2, pois ambos são simétricos
em relação à média 28 (RODRIGUES, 2002).
Então:
n1 n1 1 8 .. 99
U1 n1.n2 T1 8..77 85 7
2 2
Sendo assim, o valor de Z será:
U1 u u 7 28
Z 2, 43
u 8, 63
Como o valor de | Z | absoluto é maior do que Zα, quando α=0,05, ou seja,

o valor de 1,96, rejeitamos H0. Como conclusão final, as amostras diferem entre si
no nível de 5% de significância (RODRIGUES, 2002).
3 TESTE T DE WILCOXON
Este teste avalia a grandeza das diferenças observadas quando comparados
postos de observação, quando isto ocorre, atribui-se maior valor para a maior
diferença encontrada, diminuindo este valor de acordo com as menores diferenças
existentes (RODRIGUES, 2002).
Ainda segundo Rodrigues (2002), como os demais testes não paramétricos,

são utilizados os números naturais 1,2,3...n para representar os valores decorrentes
das diferenças observadas, para este teste se tivermos um conjunto de diferenças
do tipo: 7,4,2,9,13; estes receberão uma numeração de acordo com sua grandeza:
7(3),4(2),2(1),9(4),13(5). Observando que os números entre parênteses são os
números naturais, e que esta é a forma ponderada comumente utilizada nos
testes não paramétricos.
Por exemplo, se tivermos um experimento em que pares de indivíduos

são comparados, vamos utilizar o seguinte procedimento (RODRIGUES, 2002):
128
Tratamento
A B Diferenças
12 9 3 (3,5)
8 4 4 (5)
7 5 2 (2)
6 6 0 (1)
9 6 3 (3,5)
10 5 5 (6)
9 3 6 (7)
Ainda, segundo Rodrigues (2002, p. 124), “na ordenação dos valores

de diferenças observa-se o uso da ponderação, ou seja, menores valores com
números mais baixos e, consequentemente, os valores mais altos com numeração
mais alta. Percebe-se que há sete diferenças, sendo utilizados os primeiros sete
números naturais. Em dois valores de diferenças, com igual grandeza, os mesmos
receberam pontuação igual”.
3.1 PEQUENAS AMOSTRAS

Segundo Rodrigues (2002), a aplicação deste teste se dá quando as duas
amostras sejam casualizadas e independentes, e que as variáveis em confronto
sejam contínuas.
Ainda segundo Rodrigues 2002, sua metodologia consiste em proceder

à ordenação dos valores das amostras, depois, atribuir aos mesmos a pontuação
dos números naturais, em seguida, obter o somatório dos números naturais,
atribuídos aos valores da amostra de menor tamanho, consultando a tabela do
referido teste.
Vamos ao exemplo Rodrigues (2002, p. 125).
Em um laboratório foi realizado um ensaio clínico em que foram utilizadas

duas drogas A e B. Com a droga A foram tratados oito pacientes e com a droga B,
cinco. Os níveis de anticorpos correspondem a:
129
Grupo A Grupo B
7,4 – 12,3 – 11,8 – 16,4 – 1,9 – 3,0 – 6,8 –
9,1 – 0,7 – 19,2 – 2,4 – 17,5
20,4
Levando em consideração a explicação acima, primeiramente vamos

ordenar todos os valores para então proceder à classificação conjunta, atribuindo-
se os valores naturais a cada um (RODRIGUES, 2002).
Temos assim:
0,7 1,9 2,4 3,0 6,8 7,4 9,1 11,8 12,3 16,4 17,5 19,2 20,4
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13)
Observa-se que alguns valores estão sublinhados, estes correspondem aos

elementos da menor amostra. Se somarmos os valores naturais atribuídos a estes
valores temos: 1+3+7+11+12=34. (RODRIGUES, 2002).
Quando consultamos a Tabela de Wilcoxon, e de acordo com o resultado

obtido W=34, verifica-se que P(W=34)=0,473.
Podemos assim afirmar que aceitamos H0, que o valores referentes às

drogas A e B, apresentam diferenças não significativas. Concluindo assim, que
os níveis de anticorpos em relação aos dois tipos de drogas se comportaram de
forma semelhante (RODRIGO, 2002).
3.2 GRANDES AMOSTRAS

Nesses casos, estas amostras apresentam valores com distribuição normal
e portanto, a comparação das medidas será realizada através de determinação de
um valor W (RODRIGUES, 2002).
Ainda, segundo Rodrigues (2002, p. 126), “são enunciadas naturalmente

as hipóteses nula e alternativa. Será rejeitada a hipótese nula se o valor de Wx for
maior ou igual a Zα, onde Zα é o limite superior da distribuição normal no nível
de α de significância, sendo = 1,96% para 5% e Z= 2,58 para 1%...”.
A fórmula utilizada é:
n m n 1
W
W* 2
m.n m n 1
12
130
Em que:
W= somatório de pontos atribuídos aos valores da menor amostra
n= número de elementos da menor amostra
m= número de elementos da maior amostra
Vamos ao exemplo (RODRIGUES, 2002).
Num experimento, uma dieta é aplicada a 23 atletas durante um período

experimental. Posteriormente são formados dois grupos, sendo que um deles
permanece com a mesma dieta. Verificando o ganho de peso ao final do ensaio,
observam-se os seguintes dados:
Grupo Dieta Total (m=12) Grupo dieta Parcial (n=11)

6,0 (22) 0,2 (1)
0,8 (4) 0,9 (5)
5,4 (21) 2,3 (14)
5,3 (20) 2,9 (16)
4,9 (19) 3,0 (17)
0,4 (2) 1,9 (11)
7,3 (23) 1,7 (10)
2,4 (15) 1,0 (6)
3,7 (18) 1,2 (8)
1,4 (9) 2,0 (12)
1,1 (7) 2,2 (13) W=113
Primeiramente inicia-se uma análise fazendo-se a classificação conjunta

dos 23 elementos, utilizando os números naturais, conforme exposto acima.
Segundo, obtém-se o somatório de pontos atribuídos aos valores da menor

amostra (dieta parcial), o que corresponde a W=113.
n=11
m=12
Vamos ao cálculo:
131
n m n 1 1112 11 1
W 113
W* 2 2
m.n m n 1 11..12
12 .. 24
24
12 12
11 .. 24
11 24
113
W* 2 113 132 19 1,17
264 16, 2 16, 2
W* = -1,17
Considerando que o valor de W*=-1,17 é menor do que o valor de Z5%=1,96,

aceitamos H0, concluindo assim, que os valores dos dois conjuntos apresentam
diferença não significativa.
4 TESTE DE KRUSKAL-WALLIS
Segundo Rodrigues (2002), este teste é utilizado para que se verifique o
contraste entre k amostras independentes, os valores obtidos nas diversas amostras
diferem entre si, e portanto, será uma maneira de verificar se estas diferenças são
devidas ao acaso ou se amostras provêm de populações diferentes. Neste teste,
todas as N observações recebem uma pontuação através dos números naturais
1,2,3...n, assim, ao menor valor se dará pelo número 1, e assim sucessivamente até
o maior valor, que receberá a maior pontuação. Serão consideradas as hipóteses
nula (H0) e alternativa (Ha).
Eis a fórmula adotada:
K
12 R2
H . i 3 N 1
N N 1 i 1 ni
Onde:
Ri : é a soma das ordens atribuídas ao tratamento i.
K: corresponde ao número de tratamentos a comparar.
ni:o número de observações em cada tratamento K.
N: o total de observações em todos os tratamentos K.
132
Ainda, segundo Rodrigues (2002), na ordenação global que se faz para

atribuição dos pontos, considera-se que nos casos de empate entre duas ou mais
observações será procedida à média das ordens que seriam atribuídas a elas se
não houvesse o empate. Para a verificação de significância, quanto as diferenças
observadas entre tratamentos K, Rodrigues (2002) cita que se considere que o teste
tem uma distribuição aproximada de χ2(quiquadrado) com K-1 graus de liberdade.
Num experimento, vamos analisar o tempo de sobrevida, em meses, de

pacientes atendidos na clínica de abdômen do hospital X, na cidade de Cabrobó.
Radioterapia (n=7) Quimioterapia (n=8) Cirurgia (n=8)
17 (11)0 20 (12) 32 (17)
14 (9) 5 (3) 35 (20)
4 (2) 9 (6) 26 (15)
8 (5) 13 (8) 34 (18,5)
29 (16) 34 (18,5) 21 (13)
6 (4) 2 (1) 45 (21)
15 (10) 11 (7) 50 (23)
22 (14) 47 (22)
Vamos aos questionamentos.
Há diferença significativa entre os tempos de sobrevida? Qual é o

tratamento recomendado baseado no tempo de sobrevida?
Primeiro passo: identificar os somatórios dos pontos em cada tratamento,

dessa forma temos:
R1= 57,0
R2= 69,5
R3= 149,5
Então, com todos os dados em mãos, vamos à fórmula:
133
12 K
R2 12 57 2 69, 52 149, 52
H . i 3 N 1 . 3 23 1
N N 1 i 1 ni 23 23 1 7 8 8
12 3249 4830.25 22350, 25

H . 3 x 24
23 x 24 7 8 8
12 1
H . 464,14 603, 78 2793, 78 3 x 24 .3.861, 70 72 83,995 72
46 46
H = 11, 95
O teste de Kruskal-Wallis segue a distribuição do teste de quiquadrado

(RODRIGUES, 2002).
G.L= k-1=3-1=2
Os valores da tabela de X2 correspondem:
g.l. 5% 1%
2 5,99 9,21
Observando que o valor de H=11,95, e este é maior do que os valores da

tabela, concluímos pela rejeição de H0 e, consequentemente, pela indicação de
que o tratamento cirúrgico se destaca dos demais, pois apresenta maiores valores
quanto ao tempo de sobrevida (RODRIGUES, 2002).
5 TESTE EXATO DE FISHER

Quando seus dados no seu experimento apresentarem uma tabela
de contingência com formato 2x2, com pequeno número de observações, e
consequentemente, com frequências observadas em cada casa muito baixa, a
literatura apresenta a utilização do teste exato de Fisher, no qual estimamos a
partir da menor frequência contida da tabela, a probabilidade de ocorrência desse

n
valor e de uma frequência menor ainda, fazendo-se a comparação p i
pi ,
0
em que n é a menor frequência verificada na tabela (RODRIGUES, 2002.)
De acordo com Rodrigues (2002, p. 123), “Numa tabela de contingência

de 2x2, com totais marginais fixos, as frequências observadas têm distribuição
hipergeométrica considerando a seguinte tabela:
134
Fator I II Total
A a b a+b
B c d c+d
Total a+c b+d N
A probabilidade de ocorrência de observações na classe (B,II), é dada por:
Px d
a b ! c d ! b d !
N !a !b !c !d !
Vamos ao exemplo de Rodrigues (2002).
Realizamos um experimento onde há dois tratamentos contra o vírus da

AIDS versus a mortalidade.
Tipo de Mortalidade
Total
tratamento Sim Não
A 7 5 12
B 1 9 10
Total 8 14 22

n
p i
pi , sendo que para o cálculo de p, com i variando de 0 a 1, temos:
0
p=1.
P1
a b ! c d ! b d ! 12!10!8!14! 0, 024
N !a !b !c !d ! 22 !7 !5!1!9 !
Agora modificando o p=0, temos outra tabela:
Tipo de Mortalidade
Total
tratamento Sim Não
A 8 4 12
B 0 10 10
Total 8 14 22
135
P0
a b ! c d ! b d ! 12 !10 !8!14 !
0, 0015
N !a !b !c !d ! 22 !0 !10 !8!4 !
Resolução:
O valor de p será 0,024 + 0,0015 = 0,0255
Como este p é menor que o nível de significância, para α=0,05 a decisão correta
será rejeitar H0 e aceitar Ha. Conclui-se então que há diferença quanto à mortalidade
em relação ao tipo de tratamento, sendo B mais eficaz (RODRIGUES, 2002).
6 TESTE DE FRIEDMAN
Segundo Motta e Wagner (2003, p. 180), (teste de Friedman, ou também
chamado de prova de Friedman), “... a dupla análise de variância por postos
2
– o χ de Friedman ( χ p ) – é a aproximação não paramétrica que permite a
2
comparação de dados resultantes numa mesma amostra, em dois momentos

distintos (na forma antes e depois)”.
Eis a fórmula:
12
p2 £ £ R1 3 N K 1
2
NK K 1
Onde:
K= número de tratamentos (número de condições em que foram realizadas
as mensurações)
N= tamanho da amostra
∑R1= soma dos postos relativos a um particular tratamento
Ainda, segundo Motta e Wagner (2003), o emprego da dupla análise da

variância dos postos, necessita que os seguintes requisitos sejam satisfeitos:
• Comparação de dados de uma mesma amostra mensurada sob duas ou mais

condições (ou, então, que os membros de duas ou mais amostras tenham sido
aglutinados em função de variáveis específicas);
• Dados ordinais - para que aos dados possam ser atribuídos postos;
• O tamanho da amostra não deve ser pequeno. O tamanho mínimo de N depende

do número de tratamentos (K) aos quais a amostra é exposta. Por exemplo: N
deve ser igual ou maior que 10 quando K=3; já com K=4, N≥5.
136
Vamos ao exemplo de Rodrigues (2002, p. 132):
Num experimento são prescritos quatro procedimentos técnicos para

a determinação de certa variável. Foram formados cinco blocos e obtidos os
seguintes valores:
TRATAMENTOS
A B C D
12,00 (2) 13,00 (3) 16,00 (4) 07,00 (1)
08,00 (2) 09,00 (3) 12,00 (4) 05,00 (1)
14,00 (2) 20,00 (3) 22,00 (4) 06,00 (1)
17,00 (3) 16,00 (2) 21,00 (4) 11,00 (1)
12,00 (2) 15,00 (3) 16,00 (4) 10,00 (1)
Primeiramente procede-se à ordenação dos valores, em cada bloco, para a

obtenção dos valores de Ri:
R1= 11,00
R2=14,00
R3=20,00
R4= 5
Colocando os valores na fórmula, fica:
12
p2 £ £ R1 3 N K 1
2
NK K 1
12
p2 112 142 202 52 3.5 4 1
5.4 4 1
12 12
p2 121 196 400 25 3.5.5 742 75 89, 04 75 14, 04
100 100
Como o valor de graus de liberdade é igual a K-1 graus de liberdade e

sendo K=4, tem-se três graus de liberdade> Para três graus de liberdade os valores
2
do teste χ correspondem a:
137
Graus de liberdades 5% 1%
. . .
. . .
. . .
3 7,82 11,34
Concluindo: sendo o valor encontrado na análise igual a 14,04, maior do

2
que os valores da tabela de χ , verifica-se que há diferença significativa entre as
medidas dos tratamentos, rejeitando H0 e optando-se pela hipótese alterantiva
(Ha). Então, o tratamento C apresentou melhores resultados em relação aos
demais grupos (RODRIGUES, 2002).
7 TESTE DE MCNEMAR
De acordo com Motta e Wagner (2003), este teste é uma alternativa para
o teste quiquadrado para amostras dependentes (pareadas). Sendo empregado
quando é realizado um pareamento indivíduo a indivíduo entre os membros de
duas amostras ou quando o indivíduo é controle de si mesmo.
Eis a fórmula:
b c 1
2
c , Mc Nemar
McNemar
bc
Vamos ao exemplo (VIALI, 2008, p. 13).
Um psicólogo infantil está interessado em observar a iniciação de contatos

sociais em crianças. Ele observou que crianças que são novas em uma escola
maternal estabelecem contatos interpessoais com adultos ao invés de com outras
crianças. Ele prevê que à medida que se familiarizam com o ambiente as crianças
estabelecem contatos interpessoais com outras crianças ao invés de com adultos.
Para testar esta hipótese ele observa 25 crianças nos seus primeiros dias em uma
escola maternal e então categoriza suas primeiras iniciações de contatos sociais
em: se foi dirigido a um adulto ou se foi dirigido a outra criança. Ele, então,
observa cada uma das 25 crianças depois de elas estarem na escola por um mês,
fazendo a mesma classificação.
138
FONTE: VIALI (2008, p. 13).
Hipóteses:
• Ho: Para aquelas crianças que mudam, a probabilidade de que uma criança
mude o seu objeto de iniciação de um adulto para criança (isto é, PA) é igual
a probabilidade que ela mude seu objeto de iniciação de criança para adulto
(isto é, PB) e é igual a 50%, ou seja: PA = PB = 1/2.
• H1: PA > PB Prova Estatística. Prova de McNemar para a significância de

mudanças porque o estudo utiliza duas amostras relacionadas e utiliza
mensuração nominal.
• Nível de significância. Sejam α = 0,05 e n = 25, o número de crianças observadas

no primeiro e no trigésimo dia na escola maternal. Distribuição amostral.
• Quiquadrado com 1 grau de liberdade. Região de Rejeição. Consiste de todos

os valores da distribuição χ2 obtidos dos dados tal que a probabilidade de
ocorrência de um valor mais extremo é menor que 0,05. Decisão. Os dados
hipotéticos do exemplo estão mostrados na tabela acima. De acordo com eles
o valor de quiquadrado calculado é:
b c 1
2
c , Mc Nemar
McNemar
bc
14 4 1
2
c , Mc Nemar
McNemar 4, 50
14 4
Uma consulta à tabela mostra que o valor da distribuição quiquadrado

com “um” grau de liberdade e com probabilidade de 5% é 3,84. Como o valor
calculado é maior do que o valor tabelado rejeita-se H0, isto é, pode-se afirmar
que as crianças apresentam tendência significativa para mudar o objeto de
seu interesse, de adulto para outra criança, após 30 dias de frequência à escola
maternal. (VIALI, p. 13, 2008).
139
8 COEFICIENTE DE CORRELAÇÃO DE SPEARMAN (Rs)

Motta e Wagner (2003) descrevem que este teste é o substituto do
coeficiente de Pearson e é empregado sempre que as variáveis quantitativas não
satisfizerem as exigências (distribuição bivariada normal e homocedascidade –
igual (homo) dispersão (scedasticidade).
Eis a fórmula:
£d 2
6∑
rs 1 3
n n
Ainda segundo Motta e Wagner (2003, p. 179), “a magnitude do coeficiente

de Spearman, indica correlação entre postos e não entre valores medidos e varia
entre -1 (correlação perfeita negativa e +1 (correlação perfeita positiva), passando
pelo valor 0 (ausência de correlação) sendo interpretada, portanto, do mesmo
modo que o coeficiente de correlação de Pearson (r).
Vamos ao exemplo (VIALI, 2008):
Em um estudo sobre o efeito das pressões grupais sobre um indivíduo

para uma atitude conformista em uma situação que envolva risco monetário, os
pesquisadores aplicaram a 12 estudantes universitários a escala F (medida de
autoritarismo) e uma escala destinada a medir as aspirações de status social.
Desejava-se uma informação sobre a correlação entre os escores relativos
ao autoritarismo e os escores referentes às aspirações de status social. (Tais
aspirações foram definidas de acordo com os pontos de vista “O indivíduo não
deve casar-se com pessoa de nível social inferior ao seu”, ou “Para um encontro,
é melhor uma demonstração equestre do que um jogo de baseball”, ou ainda, “É
interessante verificar sua genealogia”. A tabela 9 fornece os escores de cada um
dos 12 estudantes nas duas escalas.
140
FONTE: VIALI (2008, p. 37)
Para calcular o coeficiente de correlação por postos, de Spearman, para

estes dois conjuntos de valores é necessário colocá-los, inicialmente em duas
séries de postos. Estes postos são apresentados na tabela 10, juntamente com as
diferenças entre eles e as diferenças ao quadrado. Através destes dados então,
pode-se calcular o coeficiente de correlação rs, através da expressão mostrada
acima. Assim:
FONTE: VIALI (2008, p. 37)
141
Através destes dados, então, pode-se calcular o coeficiente de correlação

rs, através da expressão mostrada acima. Assim:
6£∑d 2
rs 1
n3 n
£d 2
6∑ 6.52
rs 1 1 3 0, 82
n n
3
12 12
142
RESUMO DO TÓPICO 4
• O teste de U Mann-Whitey corresponde a uma alternativa para a comparação

de duas amostras, os números naturais são classificados num conjunto de
valores observados. Assim, o posto de um valor de um conjunto de n valores
corresponde a um número natural que indicará a sua posição no conjunto
anteriormente ordenado.
• Teste de T Wilcoxon, avalia a grandeza das diferenças observadas quando

comparados postos de observação.
• Teste de Kruskal-Wallis, é utilizado para que se verifique o contraste entre k

amostras independentes.
• Teste exato de Fisher, no qual estimamos a partir da menor frequência contida

da tabela, a probabilidade de ocorrência desse valor e de uma frequência menor
ainda, fazendo-se a comparação.
• Teste de Fridman, é a dupla análise de variância por postos, que permite a

comparação de dados resultantes numa mesma amostra, em dois momentos
distintos.
• Teste de McNemar, empregado quando é realizado um pareamento indivíduo

a indivíduo entre os membros de duas amostras ou quando o indivíduo é
controle de si mesmo.
• Coeficiente de correlação de Spermann é empregado sempre que as variáveis

quantitativas não satisfizerem as exigências.
143
AUTOATIVIDADE
Num experimento, com 4 tratamentos, obtivemos os seguintes dados:
Rep T1 T2 T3 T4
1 8 11 15 18
2 46 40 37 47
3 6 7 5 2
4 14 45 36 25
5 1 9 4 13
6 3 0 20 10
Calcule com estes dados:
a) O teste U Mann-whitey, reponda:
- Os dois primeiros tratamentos diferem entre sim?

- O terceiro tratamento com primeiro?
b) Levando em consideração oTeste de Kruskal-Wallis, essas amostras provêm

de uma mesma população?
0 1 2 3 4 5 6 7 8 9 10 11 13 14 15 18 20 25 36 37 40 45 46 47
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Levando os dados para a tabela
Rep T1 Postos T2 Postos T3 Postos T4 Postos
1 8 9 11 12 15 15 18 16
2 46 23 40 21 37 20 47 24
3 6 5 7 8 5 6 2 3
4 14 14 45 22 36 19 25 18
5 1 2 9 10 4 5 13 13
6 3 4 0 1 20 17 10 11
Total
T1 57 T2 74 T3 82 T3 85
postos
144
a)
• Os primeiros tratamentos não são diferentes estatísticamente.

H0: As amostras têm distribuições idênticas
Ao nível de 5% de probabilidade
U = 15 P(U) = 0.350
p-valor > 0.05 H0 não rejeitada
As amostras não são diferentes
Para o caso n2 < 9 com n2 >= n1 U' = 21
• Para a terceira e primeira amostras

H0: As amostras têm distribuições idênticas
U = 12 P(U) = 0.197
As amostras não são diferentes
Para o caso n2 < 9 com n2 >= n1 U' = 24
b) Testes de Kruskal-Wallis
Hipótese nula (H0):
Os tratamentos provêm de uma mesma população
H = 1.3533 H-crit = 7,8147
H = 1.3533 H-crit = 11,3449
145
ANEXOS
FONTE: Disponível em: <http://www.amendes.uac.pt/monograf/

monograf01estatNparamt.pdf>. Acesso em: 15 jun. 2015.
146
FONTE: Disponível em: <http://www.amendes.uac.pt/monograf/monograf01esta
tNparamt.pdf>. Acesso em: 15 jun. 2015.
147
Valores Críticos de rS, coeficiente de correlação de Spearman
Nível de significância
N (unilateral)
0,05 0,01
4 1,000
5 0,900 1,000
6 0,829 0,943
7 0,714 0,893
8 0,643 0,833
9 0,600 0,783
10 0,564 0,746
12 0,506 0,712
14 0,456 0,645
16 0,425 0,601
18 0,399 0,564
20 0,977 0,534
22 0,359 0,508
24 0,343 0,485
26 0,329 0,465
28 0,317 0,448
30 0,306 0,432
FONTE: Disponível em: <http://www.amendes.uac.pt/monograf/
monograf01estatNparamt.pdf>. Acesso em: 15 jun. 2015.
148
UNIDADE 3
ÍNDICES ECOLÓGICOS
UTILIZADOS COMO INDICADORES
DE QUALIDADE AMBIENTAL
A partir desta unidade você será capaz de:
• reconhecer os principais métodos e índices ecológicos para tomada de de-

cisão no que tange a resolução de problemas ecológicos;
• estudar os principais ecólogos e cientistas responsáveis pela criação dos

índices ecológicos e ambientais;
• identificar os principais problemas associados à exploração dos recursos

naturais utilizando índices ecológicos;
• capacitar-se tecnicamente para estudos ecológicos e de impacto ambiental;
• compreender as definições básicas dos processos de avaliação e gestão dos

recursos naturais;
• entender que a utilização de índices ecológicos possui alguma instabilida-

de, e reconhecer essa fragilidade para proposição da adequada recupera-
ção ambiental;
• utilizar softwares que permitem o cálculo dos índices propostos;
• interpretar resultados de relatórios ambientais.
PLANO DE ESTUDOS
Esta unidade está dividida em dois tópicos, sendo que ao final de cada um
deles, você encontrará atividades que lhe auxiliarão na apropriação dos co-
nhecimentos.
TÓPICO 1 – AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES

ECOLÓGICOS
TÓPICO 2 – ÍNDICES ECOLÓGICOS
149
150
UNIDADE 3
TÓPICO 1
AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES

ECOLÓGICOS
1 INTRODUÇÃO
Até o momento vimos diversas técnicas estatísticas para serem utilizadas
em estudos ambientais. Sabe-se que o bom gestor ambiental utiliza essas técnicas
para tomar decisão sobre a proteção de determinado recurso natural. Toda a
decisão amparada pelo “achismo” pode ter graves consequências ambientais, e
você, como partícipe de um movimento que visa à sustentabilidade deve estar
muito atento a isso. No caso dos indicadores ambientais, eles serão fundamentais
para que você decida sobre a saúde de um determinado ecossistema, e assim,
ajude a preservá-lo.
A seguir veremos alguns aspectos ecológicos que derivam dos problemas

ambientais enfrentados atualmente, e que estão fora da linha que vai ao encontro
do desenvolvimento sustentável, onde visamos a integração das partes social,
econômica e ambiental. Desta forma, esperamos sensibilizar todos vocês da
importância de utilizarmos as ferramentas estatísticas e os indicadores ambientais
para gerenciamento dos nossos recursos.
2 POR QUE UTILIZAR ÍNDICES DE QUALIDADE AMBIENTAL?

Ao nos depararmos com ambientes completamente degradados, colocamos
em questão qual ou quais ferramentas poderíamos dispor para gerenciar esses
problemas. Não importa qual bioma (mata atlântica, cerrado, restinga ou caatinga),
e ainda em qual ambiente, se no mar, na terra, ou florestas. As ferramentas que
dispomos para reconhecer um ambiente degradado são amplas e bem robustas.
Assim, podemos adequar nossas decisões naquilo que é mais pertinente, e também
aqueles métodos que nos trazem mais confiabilidade dos resultados.
Você já ouviu falar em índices de diversidade? E índices de riqueza e

equitatividade? Acha que diversidade biológica é a mesma coisa que riqueza
de espécies? E a similaridade, ouviu falar? Quando por exemplo comparamos
uma área de proteção integral com outra. Lembram da disciplina de Gestão em
Unidades de Conservação? Normalmente, os resultados gerados por todos esses
índices nos mostram o quanto uma determinada área está degradada ou ainda se
151
UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL
está saudável do ponto de vista biológico. Como exemplo, podemos pegar uma
Reserva Particular do Patrimônio Natural (RPPN). Como o gestor ambiental dessa
área poderá tomar uma decisão com relação à ocupação dessa área e apresentar
para os órgãos ambientais como IBAMA e ICMBio? Naturalmente se os gestores
dessa área optarem por lidar com as ferramentas que serão apresentadas nessa
disciplina, tudo fica mais claro, e as proposições das medidas a serem tomadas,
melhor geridas.
Em um primeiro momento, toda a parte estatística apresentada nas

Unidades I e II embasam o gestor ambiental no delineamento do seu esforço
amostral, assim como no cálculo das estatísticas pertinentes. Assim, os relatórios
poderão ser apresentados com robustez e principalmente confiabilidade.
E para os índices de qualidade ambiental? O que fazer? Bom, voltando

as perguntas anteriores, sobre diversidade, riqueza e equitatividade de espécies,
por exemplo, podemos imaginar que um ambiente degradado não apresenta um
índice de diversidade elevado. Mas em relação à riqueza de espécies, quando
esta estiver acentuada, será que haveria um indicativo de problemas ambientais
associados? Normalmente, na mídia, muitos especialistas confundem-se ao
abordar esses dois conceitos como sendo a mesma coisa. Mas não são!
UNI
Para lembrá-lo: Segundo o IBGE, Bioma é um conjunto de vida (vegetal e animal)

constituído pelo agrupamento de tipos de vegetação contíguos e identificáveis em escala
regional, com condições geoclimáticas similares e história compartilhada de mudanças, o
que resulta em uma diversidade biológica própria. O Brasil abriga seis biomas continentais.
São eles: Amazônia, Cerrado, Mata Atlântica, Caatinga, Pampa e o Pantanal.
FONTE:<http://www.florestal.gov.br/snif/recursos-florestais/os-biomas-e-suas-florestas>.
152
TÓPICO 1 | AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS
FIGURA 22 – BIOMAS DO BRASIL
FONTE: IBGE e MMA (2004)
Quando falamos que um ambiente é diverso em número de espécies, ou

ainda, que tem alta diversidade, queremos dizer que existem muitas espécies
(vegetais e animais) coexistindo, e/ou residentes em um determinado ambiente.
Uma característica muito importante aqui é que o número de exemplares ou
indivíduos não difere muito entre cada uma das espécies observadas. Obviamente
que temos espécies com populações maiores e menores, mas geralmente seu
número apresenta certa homogeneidade. Mas a riqueza?
Quando falamos em um ecossistema rico em espécies, isso quer dizer

que determinado bioma favorece a predominância de uma ou poucas espécies.
Ou seja, de todas as espécies residentes em uma determinada área, por exemplo,
duas delas podem ter suas populações com o número de indivíduos muito
acentuado, muito acima da média das demais espécies. Ficou claro? Assim sendo,
qual diagnóstico que você, como gestor ambiental, poderia ter desta área? Na
sua opinião, qual ambiente, independente do bioma, do ponto de vista ecológico,
poderia ser considerado o mais estável e/ou saudável, um ambiente rico ou um
ambiente diverso?
153
Se pegarmos por exemplo, fragmentos florestais de Mata Atlântica,

podemos observar que esse ambiente é composto por uma enorme heterogeneidade
de condições ambientais, que oscilam em função da latitude e ainda da maior ou
menor proximidade com o mar, onde já pode ser denominada de restinga. Desta
forma, fica fácil imaginarmos que em um local com oscilação de temperatura,
umidade, vento, insolação, latitude e composição de solo, é esperada uma
grande diversidade, tanto animal quanto vegetal. Fica evidente, que quanto mais
diverso o ambiente em suas condições físicas e químicas, mais espécies esse local
pode abrigar, ou seja, maior número de indivíduos se pode encontrar em seus
respectivos nichos ecológicos. Olhando para a integridade deste ecossistema,
esse estaria mais conservado do que um outro fragmento desta floresta onde o
mesmo número de espécies não fosse observado.
Com a diversidade desse fragmento reduzida, o que falar sobre a riqueza

de indivíduos, ou ainda, se somente uma ou duas espécies predominassem
nesse ambiente. Certamente, que as condições de sobrevivência nesse ambiente
seriam mais restritas, ou ainda, favoreceriam o crescimento de poucas espécies,
e essas por sua vez, encontrariam nesse tipo de ambiente, condições para se
reproduzirem em número muito acentuado. Assim, ficaria claro que esse
ambiente não estaria em uma condição normal. Alguns ambientes, claro, são
mais restritivos em relação ao número de espécies que suportam, mas de maneira
geral, em ambientes degradados, é onde iremos verificar menor diversidade
com algumas espécies predominando em número de indivíduos sobre outras.
Essa característica também pode ser observada em baixas latitudes, onde as
condições do ambiente favorecem o crescimento em número de organismos de
algumas espécies, mas deve ficar claro que esse ambiente não necessariamente
está degradado. Dependendo da situação, e dependendo do ambiente, caso esse
naturalmente ofereça condições propícias para o desenvolvimento de apenas
alguns organismos, que assim seja. Esses irão encontrar condições físico-
químicas determinantes para o crescimento exponencial de suas populações. Já
regiões tropicais e subtropicais possuem elevada diversidade animal e vegetal,
em função da amplitude de condições ambientais observadas nesse ambiente.
Nesses casos, naturalmente encontramos elevada diversidade, e qualquer
diminuição nessa característica poderia indicar sérios problemas ambientais.
Como exemplo disso temos a Mata Atlântica.
154
FIGURA 23 – PROCESSO DE REDUÇÃO DA MATA ATLÂNTICA NO BRASIL
FONTE: Disponível em: <http://www1.folha.uol.com.br/ambiente/2013/06/1289500-desmatamen

to-na-mata-atlantica-e-o-maior-desde-2008.shtml>. Acesso em: 20 abr. 2015.
Como observado na figura acima, a redução da Mata Atlântica tem

causado inúmeros problemas ambientais em função da redução da sua cobertura
vegetal, e também devido à fragmentação de hábitats. Esse processo torna os
biomas particularmente sensíveis devido à limitação de conectividade entre
os fragmentos. As espécies vegetais e animais que ali residem sofrem com o
deslocamento, na busca de alimentos ou ainda por indivíduos a fim de completar
o seu ciclo reprodutivo. Desta forma inúmeros problemas podem ser observados,
como a redução de fluxo gênico entre indivíduos reprodutores o que acarreta
na sobrevivência desses organismos devido à falta de resposta adaptativa,
principalmente em função da geração de indivíduos consanguíneos. Outro
problema grave que pode ser observado nesses fragmentos isolados é o chamado
“Efeito de Borda”. Você sabe o que isso significa? Imagine uma área de floresta
nativa do tamanho de um campo de futebol. Nas bordas desse campo, todas as
condições físicas e químicas serão distintas daquelas observadas no interior desse
campo imaginário. Por quê? Fica fácil entender quando observamos que todas as
condições ecológicas como temperatura, umidade, insolação, vulnerabilidade as
chuvas, escoamento superficial de água, erosão, minerais no solo entre muitas
outras características alteram-se com facilidade por estarem mais expostas, certo?
155
E a mesma coisa ocorre com a variação do número de espécies que se

adaptam a essas novas condições. Diferente do centro do campo de futebol,
onde as condições são mais homogêneas, percebe-se que a diversidade antes
observada no fragmento intacto é maior e mais homogênea, diferente daquela
comunidade animal ou vegetal da borda desse fragmento. Nesses locais mais
vulneráveis vamos observar que poucas espécies conseguem se adaptar e
normalmente suas populações apresentam grande número de indivíduos
ocasionando em elevada riqueza.
FIGURA 24 – FRAGMENTAÇÃO DE HÁBITATS NAS REGIÕES DO CERRADO NO ESTADO

DA BAHIA
FONTE: Google Earth (2015)
A figura circular no centro do fragmento (A) representa o ambiente com

as condições mais homogêneas e alta diversidade vegetal e animal, enquanto que
a figura retangular (B) a região de borda desse mesmo fragmento, onde maior
riqueza será observada.
Voltando aos índices ecológicos, são justamente essas características que

os especialistas em recuperação ambiental levam em consideração na tomada de
decisão a medidas de manejo para um determinado local.
Na figura Processo de redução da mata atlântica no Brasil, fica claro que

a cobertura vegetal do bioma Mata Atlântica ficou reduzida a uma área muito
menor daquela observada há aproximadamente 30 anos. A supressão de vegetação
que ocorreu em função da exploração de madeira e também para contrução civil
foi implacável para acelerar o processo de degradação desse importante bioma
no Brasil. Além do problema da fragmentação florestal, não foi dada a devida
atenção para a importância dos corredores biológicos, que na prática permitiriam
maior conectividade entre os fragmentos remanescentes.
156
UNI
Conceito técnico:
Para lembrá-lo: O efeito de borda ocorre porque a maioria dos fragmentos apresenta uma
transição abrupta entre as bordas e as matrizes. Dessa forma, a borda do fragmento fica mais
vulnerável às ações externas, como invasões biológicas, penetração de vento e radiações
solares. Estes fatores propiciam uma diferenciação entre as condições físicas e bióticas na
borda e no interior do fragmento, alterando a estrutura, a composição e/ou a abundância
relativa de espécies na parte marginal de um fragmento. Além disso, quanto maior o contraste
entre a estrutura dos fragmentos e da matriz, maior a intensidade destes efeitos na periferia do
fragmento, tanto sobre a flora quanto fauna. O efeito de borda, como é chamada tal alteração,
é mais intenso em fragmentos pequenos e isolados. Esta alteração da estrutura acarreta em
uma mudança local, e, muitas vezes, pode atingir até 500 metros. Dessa forma, estudos
sugerem que a relação perímetro X área deve ser considerada na escolha de fragmentos a
serem protegidos.
FONTE:<http://www.portaleducacao.com.br/biologia/artigos/25316/efeito-de-borda>.
Os sistemas naturais, devido à sua estrutura e complexidade, são ambientes

vulneráveis, e que durante o processo de exploração podem ser profundamente
afetados. Assim, sua recuperação torna-se lenta, podendo não sustentar os níveis de
uso atual, contrastando com as metas de produção para a atual sociedade. Assim,
planos de manejo adequado embasados por técnicas de gerenciamento corretas são
imprescindíveis para a manutenção da biodiversidade. (RICKLEFS, 2003).
Uma alternativa para o processo de exploração dos biomas brasileiros,

principalmente no que tange ao desmatamento e a fragmentação dos hábitats,
seria a manutenção de corredores biológicos. Resumidamente esta estratégia
de conservação permitiria que os maiores fragmentos de floresta ficassem
conectados entre si através de menores parcelas, funcionando como um tipo de
corredor de flora e fauna.
157
UNI
Conceito técnico
Como instrumento de gestão territorial, os Corredores Ecológicos atuam com o objetivo

específico de promover a conectividade entre fragmentos de áreas naturais. Eles são definidos
no SNUC como porções de ecossistemas naturais ou seminaturais, ligando unidades de
conservação, que possibilitam entre elas o fluxo de genes e o movimento da biota, facilitando
a dispersão de espécies e a recolonização de áreas degradadas, bem como a manutenção
de populações que demandam para sua sobrevivência áreas com extensão maior do que
aquelas das unidades individuais.
Os Corredores Ecológicos visam mitigar os efeitos da fragmentação dos ecossistemas

promovendo a ligação entre diferentes áreas, com o objetivo de proporcionar o deslocamento
de animais, a dispersão de sementes, aumento da cobertura vegetal. São instituídos com base
em informações como estudos sobre o deslocamento de espécies, sua área de vida (área
necessária para o suprimento de suas necessidades vitais e reprodutivas) e a distribuição de
suas populações. A partir destas informações são estabelecidas as regras de utilização destas
áreas, com vistas a possibilitar a manutenção do fluxo de espécies entre fragmentos naturais
e, com isso, a conservação dos recursos naturais e da biodiversidade. São, portanto, uma
estratégia para amenizar os impactos das atividades humanas sob o meio ambiente e uma
busca ao ordenamento da ocupação humana para a manutenção das funções ecológicas no
mesmo território.
As regras de utilização e ocupação dos corredores e seu planejamento são determinadas no

plano de manejo da Unidade de Conservação à qual estiver associado, incluindo medidas
com o fim de promover sua integração à vida econômica e social das comunidades vizinhas.
Os Corredores Ecológicos são criados por ato do Ministério do Meio Ambiente. Até o
momento foram reconhecidos dois corredores ecológicos:
 Corredor Capivara-Confusões
 Corredor Caatinga
Para saber mais sobre esses corredores acesse:
• Portaria nº 76 de 11 de março de 2005, reconhece o Corredor Capivara-Confusões.

• Portaria nº131 de 4 de maio de 2006, reconhece o Corredor Ecológico da Caatinga.
FONTE: Disponívelem: <http://www.mma.gov.br/areas-protegidas/acoes-e-iniciativas/gestao

-territorial-para-a-conservacao/corredores-ecologicos>. Acesso em: 25 abr. 2015.
Para compreendermos a importância dos ecossistemas e sua fragilidade, o

ecólogo Odum (1988) destaca que o ambiente é composto de:
• Ecossistemas de início de sucessão

• Ecossistemas maduros ou clímax
• Sistemas aquáticos
158
Os ecossistemas em início de sucessão são aqueles que estão no início do

seu desenvolvimento. E esse fenômeno ocorre por diferentes razões. Se usarmos
como exemplo um bioma qualquer, por exemplo o cerrado, podemos imaginar
duas situações. A primeira que este bioma ainda não ocupou determinada área,
ou ainda não se desenvolveu ao longo deste novo espaço, e assim, gradualmente
passa a ocupar um novo local e, portanto, dizemos que ele está em início do seu
estágio sucessional. Na segunda situação, o cerrado encontra-se completamente
desenvolvido. Na ecologia falamos em clímax, e, portanto, uma vegetação com
maior maturidade. Aqui, para que esse ecossistema volte para a sua condição
original, somente se alguma perturbação de ordem natural ou não degradar parte
da mata. Pode-se imaginar aqui diversas situações. Uma queimada provocada
por um raio. Ou ainda, um desmatamento, com posterior mobilização do solo
preparando-o para a agricultura. Nos dois exemplos, levamos o ecossistema
cerrado para uma fase inicial do seu desenvolvimento. Ou seja, não mais
encontramos todas as espécies animais e vegetais que antes ali cresciam e viviam.
Imagine agora que o solo está completamente descoberto, a céu aberto.
Se optarmos por recuperar essa área, devastada pelo fogo (ordem natural),
ou mesmo pelo homem (supressão de vegetação de ordem antropogênica),
devemos deixar essa área sem qualquer tipo de interferência pelos próximos anos.
Algumas técnicas de revegetação e que aceleram esse processo de recuperação
poderão ser utilizadas. Mas, de forma geral, esse bioma entrará gradualmente em
processo de sucessão, onde a comunidade de fauna e flora sofrerão alteração ao
longo dos anos. No início, muitas espécies pioneiras, que se adaptam facilmente
às condições mais expostas – similar às condições de borda de floresta, e menor
diversidade será observada, com maior número de indivíduos de uma mesma
espécie, ou seja, grande riqueza. Posteriormente, conforme vamos avançando no
tempo, essa condição vai alternando. A vegetação começa a crescer, árvores de
maior porte começam a ser observadas, e, portanto, maior sombreamento incide
sobre o solo. Dessa forma, uma nova condição se instala, e espécies rasteiras e de
solo, não mais conseguem sobreviver a esta condição. Dizemos que a vegetação
está em um processo secundário de desenvolvimento, indo em direção ao seu
clímax, ou seja, seu estágio final de desenvolvimento, onde maior biodiversidade
e equitabilidade de fauna e flora será encontrada.
159
UNI
conceitos
Para você não ter dúvidas sobre a sucessão ecológica
Processo ordenado da instalação e desenvolvimento de uma comunidade de fauna ou flora.

Ocorre com o tempo e termina quando se estabelece na área uma comunidade estável.
Vamos tomar como exemplo uma região completamente desabitada, como uma rocha
nua. O conjunto de condições para que plantas e animais sobrevivam ou se instalem nesse
ambiente são muito desfavoráveis:
• Iluminação direta causa altas temperaturas.

• A ausência de solo dificulta a fixação de vegetais.
• A água das chuvas não se fixa e rapidamente evapora.
Os seres vivos capazes de se instalar em tal ambiente devem ser bem adaptados e pouco
exigentes. Estes são os liquens (associação de cianobactérias com fungos), que conseguem
sobreviver apenas com água, luz e pouca quantidade de sais minerais. Isso caracteriza a
formação de uma comunidade pioneira. Os liquens, por serem os primeiros seres a se instalarem,
são chamados de “organismos pioneiros”. A atividade metabólica dos liquens vai lentamente
modificando as condições iniciais da região. Os liquens produzem ácidos orgânicos que
corroem gradativamente a rocha, formando através da erosão as primeiras camadas de solo.
Camada sobre camada de líquen, vão formando um tapete orgânico, que enriquece o solo,
deixando o mesmo úmido e rico em sais minerais. A partir de então as condições, já não
tão desfavoráveis, permitem o aparecimento de plantas de pequeno porte, como briófitas
(musgos), que necessitam de pequena quantidade de nutrientes para se desenvolverem e
atingirem o estágio de reprodução. Novas e constantes modificações se sucedem permitindo
o aparecimento de plantas de maior porte como samambaias e arbustos. Também começam
a aparecer os pequenos animais como insetos e moluscos.
Dessa forma, etapa após etapa a comunidade pioneira evolui, até que a velocidade do
processo começa a diminuir gradativamente, chegando a um ponto de equilíbrio, no qual
a sucessão ecológica atinge seu desenvolvimento máximo compatível com as condições
físicas do local (solo, clima etc.). Essa comunidade é a etapa final do processo de sucessão,
conhecida como comunidade clímax. Cada etapa intermediária entre a comunidade pioneira
e o clímax é chamada sere.
FONTE: Disponível em: <http://www.sobiologia.com.br/conteudos/bio_ecologia/ecologia23.
php>. Acesso em: 25 abr. 2015.
160
3 OS ÍNDICES ECOLÓGICOS SÃO CONFIÁVEIS?

No ambiente, se formos medir índices de diversidade, riqueza,
equitatividade ou similaridade, nos primeiros estágios do processo de sucessão
ecológica provavelmente serão observadas muitas espécies pioneiras ou R
estrategistas. Essas têm um ciclo de vida muito curto (nascem, se desenvolvem
e morrem) em um período muito curto, adaptadas a locais com grande variação
das condições ambientais. Para que a ocupação ocorra, apenas algumas espécies
conseguem encontrar ali seu espaço para viver, adaptando-se à variabilidade
do ambiente. Ao mesmo tempo em que somente alguns táxons conseguem, e
por terem ciclo de vida muito curto, para compensar essas características, essas
poucas espécies geram muitos descentes que ocupam gradativamente a área
degradada ou intocada.
Espera-se, portanto, que o índice de riqueza observado para a área

em início de processo de sucessão e/ou recuperação seja mais acentuada. Na
contramão, menores índices de diversidade e equitatividade serão observados
nesses mesmos locais no início do processo de sucessão ou recuperação. O
processo inverso ocorre quando temos uma área cuja floresta se encontra em
estágio de clímax ou totalmente desenvolvida. Nessas condições é esperada alta
diversidade de flora e fauna, assim como elevada equitatividade. Então, quando a
diversidade aumenta, podemos observar no ambiente muitos táxons e o número
de indivíduos dentro das populações é equivalente. Desta forma, pode-se dizer
que o ambiente está equilibrado, diverso e equitativo, sem a predominância de
alguma espécie específica, que acarretaria aumento da riqueza.
FIGURA 11: AS CARACTERÍSTICAS DE UMA COMUNIDADE CLÍMAX
EM
ATRIBUTOS DO ECOSSISTEMA CLÍMAX
DESENVOLVIMENTO
Constante ou
CONDIÇÕES AMBIENTAIS Variável e imprevisível previsivelmente
variável
POPULAÇÕES
Abióticos,
Mecanismos de determinação de Bióticos, dependentes
independentes de
tamanho populacional de densidade
densidade
Tamanho do indivíduo Pequeno Grande
Ciclo de vida Curto/simples Longo/complexo
Lento, maior
Rápido, alta capacidade de
Crescimento
mortalidade sobrevivência
competitiva
Produção Quantidade Qualidade
Flutuações Mais pronunciadas Menos pronunciadas
161
ESTRUTURA DA COMUNIDADE
Estratificação (heterogeneidade espacial) Pouca Muita
Diversidade de espécies (riqueza) Baixa Alta
Diversidade de espécies (equitatividade) Baixa Alta
Diversidade bioquímica Baixa Alta
Matéria orgânica total Pouca Muita
ENERGÉTICA DA COMUNIDADE
PPB/R >1 =1
PPB/B Alta Baixa
PPL Alta Baixa
Cadeia alimentar Linear (simples) Em rede (complexa)
NUTRIENTES
Ciclo de minerais Aberto Fechado
Nutrientes inorgânicos Extrabióticos Intrabióticos
Troca de nutrientes entre organismos e
Rápida Lenta
ambiente
Papel dos detritos na regeneração de
Não importante Importante
nutrientes
POSSIBILIDADE DE EXPLORAÇÃO
PELO HOMEM
Produção potencial Alta Baixa
Capacidade de resistir à exploração Grande Pequena
FONTE: Disponível em: <http://www.sobiologia.com.br/conteudos/bio_ecologia/ecologia23.php>.

4 ESPÉCIES R E K ESTRATEGISTAS
Em 1837, o matemático Pierre F. Verhulst propôs um modelo que
define o limite máximo de crescimento de uma população, e que em seguida
tende a se estabilizar. O seu modelo proposto foi definido por uma equação, a
chamada Equação de Verhulst, e que determina uma condição onde a taxa de
crescimento de uma população varia ao longo do tempo.
É um modelo que difere do modelo de crescimento exponencial,

em que define que a taxa de crescimento é constante e não há limites para
o tamanho da população. Para espécies animais de vida livre, por exemplo,
a disponibilidade de alimento, abrigo e água é um fator limitante para o
crescimento populacional. Esse limite máximo sustentável é denominado
capacidade de suporte (K) em Ecologia.
162
FIGURA 25 – VERHULST / MATEMÁTICO QUE CRIOU A EQUAÇÃO

LOGÍSTICA
FONTE: Disponível em: <http://www.euquerobiologia.com.br/2013

/01/especies-k-e-r-estrategistas.html>. Acesso em: 25 abr. 2015.
Assim, para uma população de tamanho (N), com taxa de crescimento “r”,

o modelo de crescimento logístico contínuo pode ser representado pela equação:
dN N
1
rN �
dt K
Pode-se observar, na equação acima, que quando a população tende

à capacidade de suporte, tem-se que dN/dt = 0, e o tamanho da população
permanece estável. O que se espera que ocorra é que haja ou uma elevação da
taxa de mortalidade devido à competição por alimento e abrigo ou uma redução
da taxa de natalidade.
Com base nos parâmetros K e r da equação do modelo logístico, surgiram

duas definições usadas em Ecologia: a de populações K e r estrategistas.
Uma população K estrategista seria uma população para a qual a capacidade
de suporte do meio é um fator restritivo. Por conseguinte, os indivíduos de
uma população K estrategista tendem a preparar a prole para a competição
por alimento, e a apresentar um tempo de vida mais longo em comparação a
indivíduos de espécies r estrategistas. As espécies com estratégia demográfica de
tipo seleção K são tipicamente competidoras com outras espécies, em nichos já
bem preenchidos, investindo mais numa descendência menos prolífica, com cada
descendente tendo uma maior probabilidade de sobreviver até à idade adulta.
163
Apresentam comumente comportamentos de cuidados parentais, já

que investem principalmente na sobrevivência e longevidade da prole. Podem
também ser chamadas de espécies k estrategistas. Como exemplo de espécie K
estrategista pode-se citar mamíferos de grande e médio porte como onças, antas,
grandes aves, répteis em geral e qualquer animal que tenha que cumprir todo o
seu ciclo de vida em pelo menos alguns anos.
Para as espécies r estrategistas, por outro lado, a capacidade de suporte não

é um fator restritivo, com indivíduos com tempo de vida mais curto, e que tendem
a não apresentar cuidado com a prole. Em termos gerais, as espécies com estratégia
demográfica de tipo seleção (r) exploram nichos ecológicos vazios, e produzem um
elevado número de descendentes a cada ciclo reprodutivo, ainda que cada um tenha
poucas hipóteses individuais de sobreviver até à idade adulta. Podem apresentar
picos populacionais. Podem também ser chamadas de espécies r estrategistas.
Um exemplo seriam mosquitos que proliferam em áreas próximas a rios ou lagos,
organismos planctônicos, micro-organismos de forma geral, algumas espécies de
peixes como as sardinhas, assim como as lulas, moluscos que cumprem todo o seu
ciclo de vida, ou seja, nascem, se reproduzem e morrem em apenas um ano.
FONTE: Disponível em: <http://www.euquerobiologia.com.br/2013/01/especies-k-e-r-estrategistas.

html>. Acesso em: 25 abr. 2015.
UNI
Indicação de leitura
“Eu entendo que pode haver uma crise de biodiversidade, mas como isso me afeta?”
Boa pergunta! Funciona assim...
A diversidade biológica é o recurso do qual dependem famílias, comunidades, nações e

gerações futuras. É o elo entre todos os organismos existentes na terra, que liga cada um
deles a um ecossistema interdependente, em que cada espécie desempenha sua função. É
uma verdadeira teia da vida. O patrimônio natural da Terra é composto por plantas, animais,
terra, água, atmosfera e os seres humanos! Juntos, fazemos parte dos ecossistemas do
planeta, o que equivale a dizer que, se houver uma crise de biodiversidade, nossa saúde e
meios de subsistência também entram em risco. Porém, atualmente estamos usando 25%
mais recursos naturais do que o planeta é capaz de fornecer. O resultado é que espécies,
habitats e comunidades locais estão sofrendo pressões ou ameaças diretas. Um exemplo de
ameaça que já atinge seres humanos é a perda de acesso à água doce. A biodiversidade é a
base da saúde do planeta e tem um impacto direto sobre a vida de todos nós. Indo direto
ao ponto: a redução da biodiversidade significa que milhões de pessoas estão diante de um
futuro em que os estoques de alimentos serão mais vulneráveis a pragas e doenças e a oferta
de água doce será irregular ou escassa. Para os seres humanos, isso é preocupante. Muito
preocupante mesmo!
FONTE: Disponível em: <http://www.wwf.org.br/natureza_brasileira/especiais/biodiversidade/

consequencias_perda_biodiversidade/>. Acesso em: 25 abr. 2015.
164
5 CONSERVAÇÃO AMBIENTAL X DIVERSIDADE BIOLÓGICA

Até que ponto a diversidade biológica é indicativo de qualidade dos
ecossistemas e poderia ser utilizada para o manejo de áreas degradadas? Essa
é uma pergunta que muitos ecologistas atuais tentam responder, e estão cada
vez mais convencidos de que existe correlação entre essas duas variáveis. Dada
a vulnerabilidade dos ecossistemas naturais e dos organismos que o habitam,
dois aspectos são de fundamental importância dentro do funcionamento no
meio ambiente natural: o direcionamento da energia e a reciclagem contínua de
materiais. Em outras palavras, em que prazo teremos a renovação de um recurso
explorado, seja ele de fauna ou flora?
Nos sistemas naturais, a fonte primária de energia é a luz do Sol. A

sua reciclagem é realizada por alguns processos regenerativos, seja de origem
física, química ou biológica. Qualquer desequilíbrio que leve à acumulação ou
à depressão de algum componente no ecossistema é normalmente corrigido por
processos dinâmicos de automanutenção do ecossistema. Basta lembrarmos aqui
dos processos sucessionais descritos anteriormente, que visam estabelecer as
condições originais do ambiente perturbado.
Só para você entender melhor, vamos exemplificar: quando a matéria

orgânica morta se acumula num sistema, o número de organismos detritívoros
aumenta para consumir o excesso de detrito. Dos componentes da atmosfera até
plantas, animais e micro-organismos modificam a condição dos ecossistemas
terrestres e são responsáveis pela manutenção de sua qualidade. Quando os
processos naturais são rompidos, os ecossistemas podem não ser mais capazes de
manterem a si próprios. Podemos notar isso nas mudanças que ocorrem nos solos
e nas correntes de água após o desmatamento de uma floresta.
Como ocorre com qualquer organismo dentro de um sistema, todas

as atividades humanas trazem consequências para o ambiente. Porém, como
fazemos parte da espécie que mais interfere e ameaça os processos ecológicos,
a seguir, Ricklefs (2003) nos dá alguns exemplos de efeitos tanto diretos quanto
indiretos da espécie humana nestes processos:
• Sobre-exploração – a pesca, a caça, a pastagem, a coleta de madeira para

combustível, a retirada de madeira e afins são as interações clássicas consumidor-
recurso. Na maioria dos sistemas naturais essas interações atingem estados
estacionários porque à medida que um recurso se torna escasso, a eficiência
da exploração e também de sobrevivência cai. Onde a fertilidade da terra for
exaurida, a população humana pode perder a base dos recursos de que necessita
para se sustentar. Ainda, nos casos em que a população não pode mais se
mover para outras áreas, ou trocar suas fontes de alimentos, a perspectiva do
controle populacional pela fome e doenças associadas, além do conflito social,
pode ser uma realidade. Para resolvermos este problema, devemos limitar a
exploração das populações e recursos às produtividades máximas sustentáveis,
165
considerando usos sustentáveis alternativos da terra; aumentar a intensidade

da agricultura em terras capazes de sustentá-la; e aprimorar a distribuição de
alimentos entre as áreas de produção e as áreas de consumo.
• Introdução de espécies exóticas – intencionalmente ou não intencionalmente,

os humanos têm levado outras espécies para toda parte que viajam. Estas
incluem: plantas comestíveis, plantas para horticulturas e suas pragas, árvores
de valor comercial, animais domésticos para trabalho ou alimento, aves,
mamíferos para esporte de caça, organismos patogênicos e frequentadores de
habitações humanas como baratas e aranhas. O resultado deste movimento
de espécies entre os continentes é a distribuição global de espécies da flora e
da fauna, podendo em alguns casos, resultar na eliminação ou expulsão das
espécies locais (nativas) devido à desvantagem competitiva destas últimas.
• Conversão de habitat – alterar a natureza básica de um habitat como a estrutura

física, muitas vezes, perturba os processos naturais de regeneração e controle.
Exemplo: derrubada de florestas de manguezal, que controlam o regime de
inundação, as migrações de peixes, o transporte de sedimentos, entre outros,
para construções humanas.
• Eutrofização – os fertilizantes aplicados na agricultura para aumentar a

produção acabam alcançando o subsolo e de lá os rios, lagos e, por fim, oceanos.
Os nitratos, fosfatos e outros fertilizantes inorgânicos presentes nas águas têm
o mesmo efeito que na produção em terras cultivadas: o aumento da produção
biológica. A sobreprodução como uma consequência dessa fertilização artificial,
frequentemente chamada eutrofização, pode originar águas turvas, acumular
material orgânico, aumentar as taxas de decomposição bacteriana e provocar a
desoxigenação da água, matando peixes e outros organismos. Problema ainda
maior para a qualidade das águas é a entrada direta de resíduos orgânicos, como
o esgoto e o escoamento diário de alimentos. Materiais orgânicos suspensos
ou dissolvidos na água criam o que é conhecido como demanda biológica
de oxigênio, significando que a decomposição desses materiais por bactérias
consome o oxigênio presente na água. Uma das alternativas para o controle
da eutrofização está em cortar as fontes externas de nutrientes orgânicos, seja
desviando as entradas para corpos de água maiores, que possam absorvê-los,
seja por tratamento de esgoto.
• Acumulação de toxinas – ocorre pela acidificação de solos e águas, principalmente

pela mineração do carvão, composto por enxofre e nitrogênio. Estes, quando
liberados na atmosfera, produzem a chuva ácida e trazem consequências como
a diminuição do pH do solo, aumento da lixiviação dos nutrientes do solo e
dificuldade de assimilação de nutrientes pelas raízes das plantas. A liberação
de metais pesados e compostos orgânicos na queima de combustíveis e nos
pesticidas de plantações, também são exemplos de outras toxinas derivadas
das atividades humanas que podem se acumular em sistemas biológicos.
166
• Destruição da camada de ozônio – vários poluentes aerossóis, especialmente

os clorofluorcarbonados (CFCs), reduzem as concentrações de ozônio (O3) na
atmosfera superior.
• Efeito estufa – o dióxido de carbono (CO2) ocorre naturalmente na atmosfera

onde absorve a radiação infravermelha de comprimento longo de onda,
evitando a perda de calor ao mesmo tempo em que permite a passagem da
luz solar visível e da radiação ultravioleta (ondas curtas). Os níveis crescentes
de dióxido de carbono na atmosfera, produzidos pela queima de combustíveis
fósseis e pelo desmatamento e queima de florestas, ameaçam aumentar
a temperatura média da Terra em torno de 2oC a 6oC, com consequências
potencialmente adversas para os ecossistemas naturais e para a agricultura.
Além disso, o derretimento das calotas polares de gelo e a expansão das águas
oceânicas aquecidas ocasionarão a elevação do nível dos mares.
a. Conservação dos Recursos Naturais
Em um primeiro momento, a resolução da crise ambiental pela qual

estamos passando parece fácil. Mas será que é mesmo assim? Uma coisa é certa:
esta crise não pode ser totalmente resolvida até que o crescimento populacional
humano seja interrompido, o consumo da energia decline e o desenvolvimento
econômico leve os valores ecológicos em consideração.
Além da diminuição do consumo de recursos naturais, é de preocupação

imediata a preservação da biodiversidade (principalmente as espécies endêmicas),
que abrange toda a variedade dos seres vivos na Terra e que responde pela
manutenção do equilíbrio da natureza, que é de onde retiramos nossos produtos.
O valor de cada espécie está baseado em considerações morais gerais, na estética,
na economia e nos seus benefícios recreacionais que nós usufruímos, bem como,
no seu papel como indicadora de qualidade ambiental (a presença ou a ausência
de certas espécies pode dizer se determinado ambiente é mais degradado ou
conservado). A diversidade de espécies em sistemas ecológicos pode ter um
valor intrínseco de estabilizar a função do ecossistema. Um número crescente de
estudos está mostrando que sistemas diversos são mais capazes de manter a alta
produtividade em face de variações ambientais.
Com esse panorama evidenciado e sabendo que hoje a conservação

ambiental é prioridade, temos que pensar em todas as metodologias possíveis
para tentarmos visualizar nossos impactos no ambiente natural e claro, no que
podemos fazer para diminuir esse impacto. A seguir vamos conhecer o conceito
de Pegada Ecológica, e o que quantifica nosso impacto sobre o meio ambiente.
167
RESUMO DO TÓPICO 1
Neste tópico, você viu:
• Os principais motivos que levam os gestores ambientais a utilizarem os

indicadores ecológicos para proporem medidas de recuperação ambiental.
• Os problemas atuais da fragmentação de hábitat e a redução dos biomas.
• Diminuição da diversidade biológica como fator que compromete o equilíbrio

dos ecossistemas.
• O efeito de borda e os problemas relacionados à conectividade entre os

ambientes degradados.

• Principais problemas relacionados à degradação do meio ambiente.
168
AUTOATIVIDADE
Para exercitar seus conhecimentos adquiridos, resolva as questões a seguir.
1 Relacione a segunda coluna com a primeira, de acordo com as definições:
a) Fragmentação de hábitat.
b) Efeito de borda.
c) Diversidade biológica.
(c) Diferente da riqueza de espécies, que aponta a quantidade de indivíduos

por espécie, esse conceito nos informa a quantidade de espécies, seja ela de
fauna ou flora.
(b) Está relacionada com a diminuição de diversidade biológica em função das

alterações físicas e químicas do ambiente, quando este se torna exposto em
função de supressão de vegetação.
(a) Compromete a rede de conexões entre diferentes biomas e/ou hábitats,

afetando o fluxo gênico das espécies residentes e consequentemente
diminuição da diversidade biológica.
Agora assinale a alternativa CORRETA:
( ) c – b – a.
( ) c – a – b.
( ) a – b – c.
( ) b – a – a.
2 Atividade de Estudo: Para você refletir e pesquisar, explique a frase “A

diminuição da diversidade biológica é fundamental para a manutenção do
equilíbrio do planeta”.
169
170
UNIDADE 3
TÓPICO 2
ÍNDICES ECOLÓGICOS
1 INTRODUÇÃO
Prezado acadêmico(a)! A partir desse tópico veremos os principais índices
ecológicos utilizados para medidas de diversidade, riqueza e equitatividade. Este
tópico busca fazer o entendimento entre conceitos utilizados anteriormente para
proteção dos recursos naturais e a aplicabilidade dos índices ecológicos para o
gerenciamento do meio ambiente. Desta forma, o entendimento do que são, para
que servem, e como podem ser estimados é o foco a partir de agora.
2 ÍNDICES DE DIVERSIDADE
Medidas de diversidade são para ecologistas e gestores ambientais um
dos principais objetivos a serem alcançados. O número de espécies de um local,
nicho ou assembleia significa, como já discutido anteriormente, uma maneira
intuitiva de observar a estrutura de uma comunidade biológica, e muitas vezes
pode representar o último indicativo na luta da conservação e restauração de
ambientes degradados (MAGURRAN; McGILL, 2011).
Dos índices de diversidade mais comumente utilizados, encontramos o de

Simpson e Shannon. Destes dois, o mais conhecido para o cálculo de diversidade
biológica é o Índice de Shannon-Weaver (H´), ou comumente conhecido como
Índice de Shannon. Todos esses índices possuem algumas limitações em relação ao
seu uso, no entanto, não é o objetivo desse caderno aprofundarmos esses aspectos.
UNI
Para os acadêmicos que desejam aprofundar a compreensão da utilização

dessas ferramentas ecológicas, assim como suas limitações, recomenda-se a leitura do livro
“Biological Diversity: Frontiers in Measurement and Assessment” ou “Diversidade Biológica:
Fronteiras para as Avalições e Cálculos”, dos autores Anne Magurran e Brian McGill, do ano
de 2011. Este livro traz de forma muito aprofundada todos os assuntos relativos aos índices
ecológicos.
171
Voltando ao Índice de Shannon, uma de suas maiores limitações é atribuir

em seus cálculos o mesmo peso para as espécies raras e abundantes. O que significa
isso? Uma espécie rara é aquela que em um determinado ambiente, encontramos
em abundância muito baixa. E normalmente esta tem um papel fundamental para
a estrutura daquela comunidade. Desta forma, no Shannon, a premissa para seus
cálculos é de que todas as espécies teriam um papel fundamental, ou que todas teriam
o mesmo “peso” ou “valor” para o equilíbrio do ecossistema. Isso também é verdade,
e por isso, essa fragilidade não desqualifica o índice. De qualquer forma, é sugerido
que algum processo antrópico possa causar algum tipo de distúrbio quando espécies
de flora e/ou fauna, são observadas em menores abundâncias no ambiente.
De acordo com a fórmula do Índice de Shannon, temos que:
Onde:
H´= Índice de Shannon.

Ni = Número de indivíduos amostrados da i-ésima espécie.
N = Número total de indivíduos amostrados.
S = Número total de espécies amostradas.
ln = Logaritmo de base neperiana.
Desta forma, quanto maior for o valor de H´, maior será a diversidade
de espécies da comunidade. No entanto, é necessário que se façam mais réplicas
para essa comunidade, como veremos adiante, e posteriormente, compararmos
os valores encontrados, por exemplo, entre uma e outra comunidade, ou ainda,
entre um ambiente preservado e outro degradado. Só assim, será possível
entender os resultados.
De qualquer forma, o primeiro passo é fazer uma amostragem que de

fato seja significativa (Obs.: ver na Unidade 1 deste caderno procedimentos
para um “n” amostral adequado). Isso significa que devemos nos deslocar até o
local, preservado ou não, e fazer o levantamento de espécies. Como não somos
especialistas em classificação, esse tipo de trabalho faz mais sentido se tivermos o
apoio de um profissional especialista em levantamento florístico, por exemplo, ou
ainda um ornitólogo, para o registro das espécies de aves, e assim por diante. Caso
tenhamos a nossa disposição guias para classificação de fauna ou flora, ou ainda
as chaves de classificação, nada impede de nós mesmos fazermos o levantamento.
É claro que o tempo empregado pode aumentar consideravelmente, mas é uma
forma de nos tornarmos gestores ambientais mais completos.
172
TÓPICO 2 | ÍNDICES ECOLÓGICOS
Uma vez que determinamos qual grupo iremos amostrar, é hora de

partirmos para o levantamento. Vamos imaginar que iremos determinar a
diversidade de vegetação de uma área recém-degradada, em início de processo
de sucessão. Para que tenhamos êxito em nossa amostragem, precisamos definir
alguns procedimentos metodológicos. O primeiro deles, é determinar o tamanho
do meu amostrador dentro da área a ser amostrada. Esse amostrador pode ser
compreendido por um “quadrado” de dimensões definidas, como por exemplo,
de 2 por 2 metros. Por exemplo, podemos fazer isso com uma corda colorida,
cercando dentro da mata, uma área de dois metros quadrados, amarrando suas
extremidades com estacas. Feito isso, dentro desse “quadrado” ou “quadrat”,
vamos registrar o número de espécies, e também, o número de indivíduos
para cada uma destas. Vamos imaginar que nessa primeira área amostrada
identificamos quatro espécies de árvores, A, B, C e D. Assim, para cada uma
delas foi registrado o número de indivíduos (árvores) presentes nessa área de
dois metros quadrados, conforme tabela a seguir, compreendida como réplica 1:
Réplica 1
Espécies N de indivíduos
A N = 10
B N = 11
C N = 22
D N = 15
Posteriormente, é recomendado que esse mesmo experimento seja

repetido, caracterizando uma réplica. Podemos assim, caminhar aleatoriamente
pela floresta, distanciando-se da área amostrada anteriormente. Novamente
delimito a minha área a ser amostrada com o meu quadrat, com a utilização de
cordas coloridas por exemplo, indentificando as espécies e contanto o número
de exemplares dentro da área definida. Isso se faz necessário para diminuirmos
o erro estatístico amostral, ou seja, depois que realizarmos os cálculos para a
diversidade, a chance de encontrarmos algum erro é reduzido em função da
repetição do experimento.
Desta forma, o número de réplicas que posso fazer depende do meu

objetivo, do tamanho da área que estou analisando, do tempo e do dinheiro que
tenho disponível dentro do projeto e assim por diante. Sugere-se no mínimo três
réplicas para uma determinada área. Caso esta seja muito reduzida, uma ideia
é diminuir o tamanho do quadrat. Se antes trabalhávamos com distanciamento
de dois metros quadrados, podemos fazer com um metro, ou ainda 0,5 metros
quadrados, caso estejamos trabalhando com espécies colonizadoras, como
pequenas plantas ou gramíneas.
173
Para ilustrar melhor o cálculo de diversidade, vamos trabalhar com uma

situação real. Para isso, vamos pegar os registros feitos para espécies de aves
marinhas que foram observadas em ilhas oceânicas. A identificação das espécies
de aves foi feita com a utilização de guias de identificação específicos para esse
tipo de trabalho, e a contagem das aves foi feita com a utilização de binóculos,
por contagem direta, ou seja, quando o indivíduo era observado, seguia com o
registro. Um pouco diferente do que fazer a contagem de plantas ou árvores, ao
trabalharmos com aves, o nosso quadrat é referenciado por um ponto fixo, pois
não temos como delimitar uma área na terra para contar as aves pousadas, assim
como não é possível demarcar com fitas e cordas o céu, quando esses animais
encontram-se voando. No entanto, o princípio é o mesmo, ou seja, dentro de uma
área definida por um ponto fixo, contabilizar o número de espécies e respectivo
número de indivíduos para toda a ilha, conforme tabela a seguir:
TABELA 1 – A TABELA REPRESENTA UM EXEMPLO PRÁTICO DA CONTAGEM DO NÚMERO DE

INDIVÍDUOS POR ESPÉCIE DE AVES. AS RÉPLICAS REPRESENTAM O NÚMERO DE VEZES QUE
FORAM FEITAS AS CONTAGENS DE INDIVÍDUOS, PARA CADA UMA DAS ESPÉCIES.
FONTE: Os autores
Como podemos observar, nessa ilha, denominada de Moleques do Sul, foram

realizados quatro censos visuais, ou réplicas, onde foram registradas 15 espécies.
Reparem a importância da repetição dos censos ou réplicas. Por exemplo, a espécie
Thalassarche melannophris, foi observada apenas na primeira réplica, enquanto
que o Sula sula somente na terceira réplica e assim por diante. Por isso, existe a
necessidade de “replicarmos” o experimento como comentado anteriormente. Pois
quando estamos em atividade de campo, muitas vezes nas primeiras observações,
determinada espécie, seja ela de flora ou fauna, pode não aparecer, e se fôssemos
confiar apenas nos resultados da primeira observação, certamente em nossos
relatórios destacaríamos que determinada espécie não é encontrada naquela região,
ou neste caso, para esta ilha, estaríamos negligenciando a existência de uma ave
que poderia ser importante para o equilíbrio daquele ecossistema.
174
Outras observações já podem ser feitas de acordo com os resultados

da tabela, sem calcularmos o índice. Por exemplo, algumas espécies possuem
o número de indivíduos mais elevado do que outras. Esses padrões podem
influenciar diretamente sobre a riqueza de espécies neste ambiente. Ou ainda,
aumentar a competição interespecífica, ou seja, entre espécies diferentes,
onde aquelas que conseguem se destacar, ocupam maior extensão territorial e
consomem mais recursos do que aquelas que estão em menor número. Mas isso
faz parte dos processos ecológicos, inerentes a qualquer ecossistema, e é função
do gestor ambiental compreendê-las e através de ferramentas como os índices
ecológicos, propor soluções para mitigar os problemas.
De qualquer forma, mesmo que um resultado aparente, existe a necessidade

de executar os cálculos. Desta forma, como proceder com o cálculo de diversidade
para a amostragem de aves na ilha Moleques do Sul? O primeiro passo é realizarmos
a soma do número de indivíduos por espécie, para cada uma das réplicas, conforme
mostra a continuação da tabela, onde estão registrados os dados:
TABELA 13 – ESTA TABELA APRESENTA O NÚMERO DE AVES OBSERVADAS POR ESPÉCIE. O

NÚMERO DE RÉPLICAS REPRESENTA A QUANTIDADE DE VEZES QUE CADA CONTAGEM FOI
REALIZADA. A ÚLTIMA COLUNA DESTA TABELA APRESENTA A SOMA DOS INDIVÍDUOS DE UMA
ESPÉCIE PARA AS QUATRO RÉPLICAS.
FONTE: Os autores
No software excel, do pacote office da Microsoft, através de um comando

simples, essa tarefa pode ser executada. Pegamos a espécie Larus dominicanus, na
mesma linha onde estão inseridos os dados de sua abundância, na célula de excel
seguinte inserimos o comando “=soma (seleciona todos os valores da linha com o
mouse)” + enter. Automaticamente o programa irá contabilizar 132 + 125 +178 + 132 +
567 = 567. Feito isso, é necessário para as demais espécies realizar a mesma somatória.
175
O passo seguinte, é realizarmos uma soma dos valores totais de indivíduos

por espécie, ou seja, a soma das “somas”. Assim, o valor obtido será:
Lembrem-se da fórmula de riqueza destacada anteriormente. Apenas

estamos fazendo por partes, em uma planilha do excel, o que a fórmula de
diversidade de Shannon preconiza, ok? O próximo passo é calcularmos o “pi” ou
conforme a fórmula descrita, o “ni”. No excel, nomeamos uma nova coluna (G3
por exemplo), onde faremos a divisão do primeiro valor de soma do número de
indivíduos de uma das espécies pelo número total calculado. Na prática, para
Larus dominicanus, iremos dividir o valor 567 por 1431 = 0,396226415. No excel,
supondo que os meus valores estejam respectivamente nas células F3 e F19, na
célula G3 (célula de destino para cálculo do “pi”) basta inserimos o seguinte
comando: “=F3 / F19” + Enter. Posteriormente, calcula-se para todas as demais
espécies. Quando você for arrastar a célula para proceder com os demais cálculos,
para todas as espécies, lembre-se que o valor total (1431), está em uma célula de
excel qualquer, onde você procedeu com o cálculo, ok? No nosso caso, este valor
está na célula F19. Assim, ao dar o comando para o cálculo das demais espécies,
você precisa travar esse valor, ou seja, ele é fixo no cálculo para todas as espécies.
Como travamos um valor no excel? É muito simples. Colocamos o símbolo de
cifrão “$” na frente da letra da célula e também na frente da numeração desta
mesma célula. Ou seja, se o nosso valor total (1431) estiver calculado na célula
F19, precisamos clicar na célula, e em cima da tela do excel, onde aparece a barra
de cálculos do programa, inserir o cifrão, conforme o exemplo a seguir.
176
FIGURA 26 – A FIGURA APRESENTA DE FORMA AMPLIADA E CIRCULADA COMO

PROCEDER NO SOFTWARE EXCEL PARA “TRAVARMOS” UM VALOR OU FÓRMULA,
COM A APLICAÇÃO DO CIFRÃO “$”.
FONTE: Os autores
Feito isso, partimos para os próximos cálculos. Observando a fórmula

descrita por Shannon, veremos que a próxima etapa consiste em calcularmos o
logaritmo natural dos valores encontrados para o “pi” ou “ni”. Para isso, o destino
desses valores será uma nova célula, por exemplo, a “H3”. Assim, na célula de
destino, basta darmos o comando “=LN(G3) + enter”, e os valores serão calculados
para esta célula, conforme a figura a seguir, coluna H3:
FIGURA 27 – A FIGURA APRESENTA COMO CALCULAR OS VALORES DE LOGARITMO

NATURAL (LN) PARA OS VALORES DE PI. A FÓRMULA, A SER DIGITADA NO EXCEL ESTÁ
CIRCULADA E EM DESTAQUE.
FONTE: Os autores
177
Posteriormente, multiplicam-se os valores de “pi” por “LN de pi”, ou

seja, um valor pelo outro, selecionando como célula de destino a “I3”. Assim,
pelo comando “=G3 * H3 + Enter” encontramos esse valor, conforme mostra a
planilha a seguir:
FIGURA 28 – A FIGURA APRESENTA COMO PROCEDER COM O CÁLCULO DA

MULTIPLICAÇÃO DOS VALORES DE PI POR LN DE PI, PARA POSTERIORMENTE
ENCONTRARMOS ATRAVÉS DA SOMA DESSES VALORES O ÍNDICE DE DIVERSIDADE. A
FÓRMULA ESTÁ EM DESTAQUE E CIRCULADA.
FONTE: Os autores
Por fim, a soma de todos os valores observados nesta última coluna, será
o valor para o índice de Shannon. Neste caso, não consideramos o sinal do valor
observado, ou seja, se encontrarmos um valor negativo, desconsideramos o sinal
de menos.
Assim, para o nosso estudo de caso, a soma de todos os valores da

última coluna foi igual a ( – 1,6534), ou desconsiderando o sinal, igual a (1,6534).
Na prática, quanto maior for o valor de diversidade calculado, maior será a
diversidade para determinada área. Podemos aplicar a mesma metodologia para
duas áreas distintas, por exemplo, uma área preservada, ou em estado de “clímax”
ou estágio final da sua sucessão, com outro em início de sucessão, e veremos
que naquele em estágio inicial irá apresentar um valor de diversidade menor se
comparado aquele ambiente maduro, ou em estágio de sucessão avançado. Isso,
se tratarmos de fragmentos florestais. No entanto, o mesmo cenário, se repete
para comunidades de fauna. Tipicamente para ambientes degradados, iremos
observar índices de diversidade menores daqueles ambientes protegidos.
178
A princípio, não existe um valor para podermos estabelecer uma

comparação. Por exemplo, em nosso estudo de caso, encontramos um valor de
1,6534. A dúvida que surge é o que esse valor significa. Normalmente, em condições
normais, os valores de diversidade irão variar entre uma escala de 1,0 a 3,0. Então,
para cada situação que realizarmos os cálculos, encontraremos diferentes valores,
e a comparação deverá ser feita para períodos de tempo diferentes (variações
sazonais dentro de uma mesma área). Jamais poderei comparar, para um mesmo
intervalo de tempo, dois biomas distintos. Por exemplo, comparar os valores de
diversidade de flora, para a mata atlântica e cerrado. Obviamente, que diferentes
ecossistemas apresentarão índices de diversidade distintos, maiores ou menores,
em função de suas características, e por isso, não podem ser comparados. Assim,
aquele que apresentar o menor índice de diversidade não poderia ser eleito
como um ambiente degradado. O mesmo diagnóstico deve ser observado para
comunidades de fauna, onde ambientes distintos não podem ser comparados.
No entanto, se fizermos uma comparação entre valores observados para

um mesmo bioma, uma diminuição do índice ao longo do tempo pode sim estar
representando decréscimo da diversidade, provavelmente influenciado pela
perda de qualidade ambiental.
Similar ao cálculo de diversidade de Shannon, temos os índices de

riqueza. Os mais conhecidos são dois: o de Margalef e o de Menhinick. É o que
iremos ver a seguir.
2.1 ÍNDICES DE RIQUEZA

Para Margalef (1974), a riqueza pode ser entendida como o número total
de espécies (S) em uma unidade amostral. Consequentemente, esta variável fica
muito dependente do tamanho amostral – quanto maior a amostra, maior o
número de espécies que poderão ser amostradas. Assim, a riqueza de espécies
diz pouco a respeito da organização da comunidade, aumentando em função da
área, mesmo sem modificação do habitat.
Um índice muito utilizado para medir a riqueza de espécies é conhecido

como Índice de Margalef. Ramón Margalef i López foi um ecólogo catalão que
trabalhou durante muitos anos no Instituto Botânico da cidade de Barcelona, e já
era conhecido pelos seus trabalhos sobre a investigação das algas de água doce e
os processos de eutrofização.
Com relação ao seu indicador, utiliza-se a fórmula:
179
onde, “S” é a riqueza de Margalef a ser encontrada, “n” é o número de espécies

presentes em determinada amostragem, e “N” é o número total de indivíduos
encontrados (pertencentes a todas as espécies). A notação “ln” denota o logaritmo
neperiano do número. Assim, para os mesmos dados já registrados para o cálculo
da diversidade, anteriormente demonstrados, os valores são: n = 15; N = 1431.
Colocando os valores na fórmula:
n1
S
lnN
15 1
S
ln1431
14
S
7 , 2661
S 1, 9267
Os mesmos cuidados e atenção devem ser dados na comparação de

comunidades de fauna e flora. Portanto, não devemos comparar por exemplo,
índices de biomas distintos. Para um mesmo ecossistema, esses valores irão
variar em função da maior ou menor suceptibilidade a alterações antrópicas,
ou ainda, de acordo com a maturidade e/ou estágio sucessional que se encontra
determinado ambiente. Como já explicado, no início do processo de sucessão,
menor diversidade deverá ser observada no início do processo sucessional, com
a predominância de algumas espécies. Essas espécies também podem causar um
efeito de dominância na comunidade, que veremos a seguir.
O índice de riqueza de Menhinick é muito semelhante ao de Margalef,

e com relação a sua interpretação ecológica, enquadra-se dentro dos mesmos
efeitos observados por outros índices de riqueza para uma comunidade, ou seja,
estão associados a processos iniciais de sucessão ou ainda degradação ambiental.
Para procedermos com os cálculos, devemos seguir a fórmula:
n
S=
Raiz de N
N
15
S=
Raiz
Raiz de 1431
S = 0 , 3965
180
Observem que os valores encontrados para os dois índices foram distintos.

De qualquer forma, a opção de escolha por um ou outro é do gestor ambiental. O
que deve ser levado em consideração é a escolha de um índice e posteriormente
fazermos a comparação entre diferentes áreas de um mesmo bioma ao longo do
tempo (por exemplo um ano), e ficarmos atentos as suas oscilações.
Existem ainda outros métodos que podem ser pesquisados na literatura,

para cálculo da riqueza de uma comunidade, como o Chao e o Jackknife, no entanto,
não é objetivo deste caderno nos aprofundarmos no estudo desses indicadores.
2.2 ÍNDICES DE DOMINÂNCIA

Quando observamos que uma, duas ou três espécies apresentam
número de indivíduos muito acima do restante das espécies registradas em
uma determinada área, significa que o ambiente, em suas condições físicas,
químicas, de espaço e oferta de alimentos está favorecendo a reprodução e
o desenvolvimento de poucas espécies em relação às demais. Isso implica um
desequilíbrio na composição da comunidade desse ambiente, ou ainda, que este
se encontre no seu estado inicial de recuperação ou estágio sucessional, como
já discutimos anteriormente. Alguns cálculos permitem observar a dominância,
como por exemplo, na fórmula a seguir:
Na
Da
Na Nb Nc Nd..Nn
Onde:
Da = Dominância da espécie “a”
Na = Número de indivíduos da espécie “a”
Nb = Número de indivíduos da espécie “b”
Nc = Número de indivíduos da espécie “c”
Nd = Número de indivíduos da espécie “d”
Assim, teremos um indicativo se determinado ecossistema está em

“equilíbrio”, ou ainda, sem a dominância de alguma espécie, favorecendo a
competição interespecífica, ou seja, a disputa por espaço e alimentos na área entre
espécies diferentes.
Obviamente que além de um estágio de degradação ou comprometimento

ambiental, a dominância de uma determinada espécie em relação a outras pode
indicar que este ambiente esteja em estágio inicial de sucessão ecológica, como já
evidenciado anteriormente.
181
Outros pesquisadores, também pensaram em outras formas de estimar

a dominância de espécies. Um deles foi Simpson. O Índice de Dominância de
Simpson (C) mede a probabilidade de 2 (dois) indivíduos, selecionados ao acaso
na amostra, pertencer à mesma espécie. Assim, uma comunidade de espécies
com maior diversidade terá uma menor dominância. O valor estimado de C varia
de 0 (zero) a 1 (um), sendo que para valores próximos de um, a diversidade é
considerada maior.
ni ni 1
D
N N 1
Em que:
D = índice de dominância de Simpson

ni = número de indivíduos amostrados da i-ésima espécie
N = número total de indivíduos amostrados.
Assim, observe os dados da tabela a seguir, para proceder com os cálculos

de Dominância de Simpson, conforme a descrição da fórmula.
TABELA 29 – A FIGURA APRESENTA COMO PROCEDER NO EXCEL COM O CÁLCULO

DO ÍNDICE DE DOMINÂNCIA. NESTE CASO ESPECÍFICO APONTA PARA O PRIMEIRO
PROCEDIMENTO PARA O CÁLCULO DE DOMINÂNCIA DA COMUNIDADE “A”. AS FÓRMULAS
A SEREM ESCRITAS ESTÃO CIRCULADAS.
FONTE: Os autores
182
Assim, inicialmente calculamos o Pi (Pi – 1) para a comunidade A. Para

isso, pega-se o valor do número de indivíduos observados para a espécie 1 (sp1),
que foi igual a nove (9) e multiplicamos pelo próprio valor, decrescido de 1
conforme consta na fórmula. A operação está em destaque na planilha acima,
circulada. Desta forma, você pode calcular no excel sem grandes dificuldades.
Ao encontrar os resultados, somam-se os valores, que na fórmula estão descritos
com o símbolo de somatório. O resultado é 92. Posteriormente é necessário
calcularmos o N (N – 1) para a comunidade A, conforme podemos visualizar na
tabela a seguir, destacado pelo círculo.
TABELA 30 – A FIGURA ILUSTRA COMO DAR SEQUÊNCIA AO CÁLCULO DE DOMINÂNCIA

ENTRE COMUNIDADES DISTINTAS. O EXEMPLO REFERE-SE A DOMINÂNCIA DA COMUNIDADE
“A”, ONDE ATRAVÉS DO SOMATÓRIO DO NÚMERO DE INDIVÍDUOS OBSERVADOS PARA CADA
ESPÉCIE (VALOR = 23), CHEGA-SE AO VALOR DE 506, REFERENCIAL PARA A DOMINÂNCIA,
INDICADO PELA SETA.
FONTE: Os autores
Observe aqui que o número 23 é a soma dos indivíduos observados para

todas as 12 espécies, e que este varia de acordo com a comunidade ou bioma
por exemplo. Na comunidade B, esse valor é de 13. Calculado este valor, basta
dividirmos a soma de Pi para a comunidade A, ou seja, o valor de 92 por 506, e
encontraremos a dominância de Simpson que é de 0,181818. Este valor também
está descrito na planilha acima. Repare que exatamente os mesmos cálculos serão
realizados para a comunidade B, onde encontramos um valor de 0,179487. Desta
forma, podemos concluir que a comunidade B apresenta menor dominância se
183
comparada à comunidade A. Como sabemos que a dominância é inversamente

proporcional da diversidade, ou seja, quanto maior a dominância, menor a
diversidade, teoricamente a comunidade B seria mais diversa, e, portanto, mais
saudável, ou com menor pressão antrópica, se comparada com a comunidade A,
de um mesmo bioma. Aparentemente, esta comunidade poderia sofrer algum
tipo de pressão externa, limitando o seu desenvolvimento, ou ainda, estaria em
início de estágio sucessional, conforme já evidenciamos anteriormente.
2.3 ÍNDICES DE EQUITATIVIDADE

Equitatividade ou equabilidade é o índice que mede o quanto as populações
das diferentes espécies que habitam uma comunidade ou bioma estão em equilíbrio.
Ou seja, se não há dominância de uma ou outra espécie. Desta forma, quanto
mais equitativo for um ecossistema, maior será a sua diversidade e vice-versa.
Geralmente varia de 0 a 1. Os valores mais próximos a 1 são aqueles mais diversos.
Quanto mais equitativo e diverso for esse ambiente, dizemos que mais saudável o
mesmo está. Como já vimos, esses índices poderiam ainda ser sugestivos de um
ambiente próximo ao clímax, nos processos finais do estágio sucessional.
Percebam que um índice complementa o outro. Os dois indicadores que

andam juntos, ou seja, quando um é elevado, o outro também tende a ser, são a
diversidade e a equitatividade, assim como riqueza e dominância. Essas observações
são importantes, pois na interpretação dos resultados numéricos, se não tivermos
uma base teórica, podemos induzir ao erro de interpretação dentro de um processo
de tomada de decisão para o gerenciamento ambiental de um ecossistema.
Em seu cálculo, compara-se o valor de diversidade calculado (Shannon)

em relação ao valor máximo teórico. Quanto maior for a diferença entre o valor
calculado e o teórico, menor será a equitatividade. O índice mais conhecido para
cálculo da equitatividade é o de Pielou, que veremos a seguir.
Onde:
J = Equabilidade de Pielou;
Hmáx= ln(S);
S = número total de espécies amostradas;
H' = índice de diversidade de Shannon-Weaver.
Para os resultados da ilha Moleques do Sul, já calculamos os valores de

diversidade e sabemos o número de espécies, fica fácil encontrar os valores de
equitabilidade. Desta forma, os valores que serão utilizados na fórmula serão:
184
J = ? – quero descobrir!
S = número total de espécies amostradas = 15;
Hmáx= ln(S) = ln(15) = 2,7080;
H' = índice de diversidade de Shannon-Weaver = 1,6534.
Desta forma, basta substituirmos os valores na fórmula e teremos o

resultado:
Esse é o valor observado para equitabilidade de Pielou, e que expressa a

homogeneidade em termos de abundância de indivíduos das espécies observadas
dentro de um ecossistema. Como nossa equitabilidade ficou pouco acima de 50%,
ou seja, com 0,61, pode-se afirmar que esse ambiente favorece a predominância de
algumas espécies. Para o nosso estudo de caso, é fácil observarmos que a espécie
Larus dominicanus ocupa o primeiro lugar em número de indivíduos registrados
na ilha. Por ser uma ave muito oportunista em relação à ocupação de hábitats,
consegue ocupar o espaço disponível para a construção de ninhos, por exemplo,
com mais eficácia do que as demais espécies de aves, assim como consegue
aproveitar melhor o alimento disponível. Essas características indicam para
um ambiente comprometido em relação a sua diversidade e saúde ambiental,
onde a tendência é de que as demais espécies deixem gradativamente a ilha para
ocuparem outros locais, onde possam cumprir seu ciclo de vida, devido à elevada
competição interespecífica.
2.4 A UTILIZAÇÃO DO SOFTWARE PAST PARA CÁLCULO

DOS ÍNDICES ECOLÓGICOS
O programa PAST é um software muito utilizado atualmente pelos mais
diversos profissionais da área de ecologia, biologia, oceanografia, engenharia
ambiental e gestão ambiental. Na prática, funciona como uma planilha de Excel,
mas que faz todos os cálculos descritos anteriormente com apenas um clique no
mouse, além de infinitos outros recursos.
Foi desenvolvido por pesquisadores como Oyvind Hammer do Museu de

História Natural e também por pesquisadores da Universidade de Oslo. De acordo
com o ecólogo Pavel Dodonov, PAST é originado do nome Palaeontological Statistics.
É disponível on-line, e constantemente atualizado, e faz boa parte das análises mais
comuns em ecologia, além de muitas outras de que nunca ouvimos falar.
Pode ser baixado em: <http://folk.uio.no/ohammer/past/>.
185
Os autores pedem que ao utilizarmos o programa para procedermos com

os cálculos, os devidos créditos sejam concedidos. Isso ocorre, pois, o download do
programa é gratuito, ou seja, não pagamos nada para utilizá-lo. Apenas baixamos
em nosso computador e os cálculos podem ser feitos. Há ainda na internet
apostilas em português sobre a utilização do PAST. Para quem tiver interesse, é
muito recomendado.
FIGURA 31 – A FIGURA APRESENTA O LAYOUT DO SOFTWARE PAST, PROGRAMA DE ECOLOGIA

QUE NOS PERMITE CALCULAR DIVERSOS ÍNDICES ECOLÓGICOS
FONTE: Os autores
Apenas para ilustrar como a utilização deste software pode ser útil, vamos
utilizar os dados da abundância de aves marinhas presentes na ilha Moleques do
Sul. Neste caso, vamos inserir na planilha do PAST os dados da soma das quatro
réplicas, conforme mostra a figura a seguir.
186
FIGURA 32 – A FIGURA APRESENTA DE QUE FORMA NO PROGRAMA PAST PODEM SER

CALCULADOS OS DIVERSOS ÍNDICES ECOLÓGICOS
FONTE: Os autores
Com os dados inseridos (567, 17, 42, 28, 299, 125...) em coluna, e selecionados,
clicamos em Diversity, ou diversidade, do inglês, e em seguida, Diversity indices.
Automaticamente todos os cálculos realizados anteriormente para diversidade,
riqueza, equitatividade e dominância aparecem na tela, como visualizamos na
figura a seguir. Repare que os dados estão muito próximos daqueles feitos por
nós ao longo da explicação da origem dos cálculos. No entanto, por ser mais
robusto, o PAST oferece maior certeza dos valores apresentados.
187
FIGURA 33 – A FIGURA APRESENTA OS RESULTADOS DOS DIFERENTES ÍNDICES ECOLÓGICOS

CALCULADOS PELO PROGRAMA PAST, COM A INSERÇÃO DE UMA COLUNA DE CONTAGEM
DE INDIVÍDUOS DE DIFERENTES ESPÉCIES. NESTE CASO ESPECÍFICO FOI UTILIZADO A SOMA
DOS VALORES DESCRITOS ANTERIORMENTE NA CONTAGEM DAS QUATRO RÉPLICAS PARA
ESPÉCIES DE AVES.
FONTE: Os autores
Bom, finalizamos os nossos estudos com relação a utilização de índices

ecológicos aqui. Desta forma, esperamos ter contribuído para que todos vocês
tenham entendido na teoria e na prática o motivo de utilizarmos índices ecológicos
para avaliar a qualidade ambiental. Certamente, todos esses cálculos serão muito
úteis para suas vidas profissionais.
UTILIZAÇÃO DE ÍNDICES ECOLÓGICOS PARA ANÁLISE DO

TRATAMENTO PAISAGÍSTICO ARBÓREO DOS PARQUES URBANOS DE
CURITIBA-PR
RESUMO
O objetivo deste trabalho foi avaliar a diversidade de espécies utilizadas

no paisagismo arbóreo dos parques urbanos de Curitiba-PR por meio de índices
ecológicos que traduzem a riqueza, dominância e equidade de espécies. Das 30
unidades de parques e bosques de Curitiba, foram sorteados aleatoriamente cinco
parques: Passeio Público, Parque General Iberê de Mattos, Parque São Lourenço,
188
Parque Municipal Barigui e Parque Municipal do Passaúna. As árvores foram

identificadas quanto à taxonomia e origem. Para a análise da diversidade de
espécies foram calculados os seguintes índices ecológicos relativos à riqueza,
dominância e equidade de espécies: Margalef, Simpson, Pielou e Jaccard. Foram
analisados 5525 indivíduos arbóreos, sendo identificados 95,9% até o nível de
espécie. As maiores proporções de espécies exclusivas foram observadas no
Passeio Público, seguido pelo Parque Passaúna, tanto para o total de espécies
amostradas, quanto para a classe de espécies adultas. As menores proporções
de espécies exclusivas foram observadas no Parque General Iberê de Mattos,
tanto para o total amostrado, quanto para as classes jovem e adulto, sendo este o
que apresentou a maior proporção de espécies na classe jovem. Dentre os cinco
parques urbanos analisados, o Passeio Público foi o que apresentou maior riqueza
de espécies e menor dominância e equidade de espécies.
PALAVRAS-CHAVE: Áreas verdes. Diversidade de espécies. Dominância

de espécies. Equidade de espécies. Riqueza de espécies.
INTRODUÇÃO
Os parques urbanos, além de importantes espaços para recreação, esportes,

lazer e cultura, promovem melhoria na qualidade de vida e apresentam potencial
para contribuir com a biodiversidade regional (KABASHIMA et al., 2011). Neste
sentido, Isernhagen et al. (2009) afirmam que a conservação da diversidade
biológica é reconhecida como uma necessidade mundial, sendo preciso estender
as estratégias de conservação para dentro do planejamento das áreas verdes das
cidades. Biondi & Muller (2013) afirmam que atualmente, a conservação dos
ecossistemas locais e/ou nacionais está diretamente associada com a qualidade
da vegetação no tratamento paisagístico dos parques urbanos, independente da
época de criação e estilo do projeto.
Com isto deve gerar maiores cuidados por parte dos paisagistas,
pesquisadores e a municipalidade que é responsável pela gestão das áreas verdes
urbanas. O conhecimento da flora urbana faz parte de um programa de estudos
que toda cidade deveria se preocupar em desenvolver, visando a um plano de
arborização que valorize os aspectos paisagísticos e ecológicos com a utilização,
principalmente, de espécies nativas. Com isto, pode-se salvaguardar a identidade
biológica da região, preservando ou cultivando as espécies vegetais que ocorrem
em cada região específica (KRAMER & KRUPEK, 2012). Para Biondi & Leal
(2008) a preocupação atual é grande com a biodiversidade nas áreas urbanas e
isto se reflete na diversificação do número de espécies produzidas em viveiro;
no entanto, esta preocupação com a diversificação de espécies é problemática,
pois muitas vezes não há tempo suficiente para realizar pesquisas sobre as
espécies introduzidas e desta forma ocorre a produção e a utilização de espécies
indesejáveis para o ambiente e para o homem, tais como as plantas tóxicas e as
plantas exóticas invasoras.
189
Ainda é muito incipiente o número de pesquisas que avaliam os índices

ecológicos da vegetação introduzida no paisagismo dos parques urbanos. Para
o uso de tais índices é necessário a clara distinção entre os significados de
“diversidade” e “diversidade de espécies”. Melo (2008) considera “diversidade”
no sentido mais restrito de “diversidade de espécies”, expressão que ainda é
ampla e pode ser interpretada de diversas formas. No contexto de índices de
diversidade, o mesmo autor afirma que “diversidade de espécies” poderá
englobar riqueza de espécies ou riqueza de espécies e equabilidade. Rodrigues
(2014) conceitua os termos de maneira mais prática e direta, assim sendo:
diversidade de espécies refere-se à variedade de espécies de organismos vivos
de uma determinada comunidade, habitat ou região; riqueza de espécies -
refere-se à abundância numérica de uma determinada área geográfica, região ou
comunidade; equidade, equitabilidade, igualdade - padrão de distribuição de
indivíduos entre as espécies, sendo proporcional a diversidade, exceto se houver
codominância de espécie; e dominância como o próprio nome já diz, refere-se a
dominância de uma ou mais espécies numa determinada comunidade, habitat
ou região. E quanto à biodiversidade refere-se tanto ao número (riqueza) de
diferentes categorias biológicas quanto à abundância relativa (equitabilidade)
dessas categorias.
O conhecimento da diversidade de espécies em uma área é essencial para

o gerenciamento desta, em relação às atividades impactantes, aos interesses e
necessidades de conservação de recursos naturais ou à necessidade de recuperação
de áreas degradadas (MELO, 2008). Os índices de riqueza e diversidade são
indicadores da diversidade de espécies e podem ser usados como ferramenta do
manejo e do plano diretor da arborização urbana (BOBROWSKI, 2011). Tanto no
planejamento como na manutenção das áreas urbanas ainda não existe, por parte
da municipalidade, o cuidado de se analisar a proporção de espécies que compõe
o paisagismo arbóreo das áreas verdes que mais são próximas à população
usuária. Isto provavelmente ajudaria não só a conservação de espécies como seria
um instrumento de popularização e educação ambiental.
Para iniciar esse processo e contribuir para futuras comparações entre

áreas verdes e/ou entre cidades, o objetivo deste trabalho foi avaliar a diversidade
de espécies utilizadas no paisagismo arbóreo dos parques urbanos de Curitiba-
PR por meio de índices ecológicos que traduzem a riqueza, dominância e
equidade de espécies.
MATERIAL E MÉTODOS
No ano 2000 o município de Curitiba contava com 30 unidades de

parques e bosques, 11 núcleos ambientais, 5 jardins ambientais, 54 largos, 15
eixos de animação, 330 jardinetes e 453 praças (SMMA, 2006; IPPUC, 2011). Das
30 unidades de parques e bosques de Curitiba, foram sorteados aleatoriamente
cinco parques, representando 16,67% do total. São eles: Passeio Público, Parque
190
General Iberê de Mattos (Bacacheri), Parque São Lourenço, Parque Barigui e

Parque Municipal do Passaúna. O Passeio Público, inaugurado em 1886, foi o
primeiro parque de Curitiba e apresentava cerca de 70 mil m² de vegetação nativa
nas margens do rio Belém. Ainda naquele século foi, por algum tempo, utilizado
como Jardim Botânico de Curitiba e depois como o primeiro zoológico, sendo
que até hoje possui alguns animais em cativeiro, além de um aquário (PARQUES,
2012). O Parque General Iberê de Mattos, mais conhecido por Parque Bacacheri,
foi inaugurado em 1988, com uma área de 152 mil m². Possui canchas de futebol
e de vôlei de areia, churrasqueiras, playground, lago artificial (PARQUES, 2012)
e bosque de vegetação nativa. O Parque São Lourenço foi inaugurado em 1972 e
possui uma área total igual a 204 mil m², onde existem diversos equipamentos de
lazer (PARQUES, 2012) e bosques nativos com araucárias.
O Parque Municipal Barigui, criado em 1972, possui uma área de 1,4

milhão m². É um dos maiores e o mais frequentado de Curitiba e possui diversos
equipamentos de lazer, Museu do Automóvel, parque de exposições, heliporto,
pista de bicicross e aeromodelismo (PARQUES, 2012) e remanescentes florestais.
O Parque Municipal do Passaúna, inaugurado em 1991, possui uma área de 6,5
milhões m². Aproximadamente a metade dessa área foi recoberta pelo lago da
represa da Estação de Abastecimento de Água do Passaúna, que abastece parte
da cidade de Curitiba. Por isso, é considerada, por lei estadual e municipal,
uma Área de Proteção Ambiental (APA). Possui uma trilha ecológica de 3,5 km
beirando o lago, Estação Biológica, diversos equipamentos de lazer e um mirante
de 60 m de altura (PARQUES, 2012).
A coleta foi realizada no período de agosto de 2009 a junho de 2010. Em

cada área verde foi utilizada uma planilha para a coleta de campo com os seguintes
dados: código da espécie; número de referência da espécie para identificação
(exsicata); estágio de desenvolvimento (adulta ou jovem) e o número de indivíduos
de cada espécie arbórea. Todas as áreas verdes analisadas nesta pesquisa possuem
um ou mais fragmentos de vegetação remanescente de Floresta Ombrófila Mista,
além das árvores introduzidas no tratamento paisagístico. Somente as árvores
introduzidas no tratamento paisagístico foram contempladas no levantamento
florístico, sendo adotados os seguintes critérios de inclusão: (a) árvore isolada
ou em agrupamentos fora das áreas do remanescente florestal, fazendo parte de
uma composição com outras plantas ou complementando áreas específicas do
parque, tais como estacionamento, playground, áreas com churrasqueiras, bordas
de caminhos e outros; (b) mudas arbóreas com tronco sem ramificação na base
(padrão para arborização de ruas de mudas produzidas no Horto Municipal da
Barreirinha, Curitiba); (c) mudas arbóreas com presença de tutor (material utilizado
pela prefeitura para apoiar ou sustentar a muda ereta), sendo que, em caso de
dúvida, buscaram-se informações sobre o seu plantio com os funcionários do local.
191
Foi coletado, quando existente, material vegetal fértil (com flor e/ou fruto),
para elaboração de exsicata e posterior identificação de espécies que não foram
identificadas durante as coletas de campo. As exsicatas foram identificadas no
Herbário do Curso de Engenharia Florestal da UFPR. Os nomes científicos e a
autoria dos epítetos específicos foram conferidos pelo banco eletrônico do Jardim
Botânico de Missouri (MISSOURI BOTANICAL GARDEN, 2012) e pela lista de
espécies da flora do Brasil (MUSEU BOTÂNICO DO RIO DE JANEIRO, 2012).
Para a análise da diversidade de espécies foram calculados, em cada parque
selecionado, os seguintes índices ecológicos relativos à riqueza, dominância e
equidade de espécies:
a) Índice de Margalef - expressa a riqueza de espécies, considerando o número de

espécies (S-1) e o logaritmo (base 10 ou natural) do número total de indivíduos.
É estimado por meio da seguinte equação (MAGURRAN, 2011): Dmg = (S –
1) / ln N; Onde: S = número de espécies amostradas; N = número total de
indivíduos em todas as espécies.
b) Índice de Simpson – expressa a dominância de espécies e a probabilidade de

dois indivíduos selecionados ao acaso serem da mesma espécie. Varia de 0 a 1 e
quanto mais alto for, maior a probabilidade de os indivíduos serem da mesma
espécie, ou seja, maior a dominância e menor a diversidade (URAMOTO et
al., 2005). Possui uma vantagem em relação aos índices de Margalef, Gleason
e Menhinick, pois não somente considera o número de espécies (s) e o total de
números de indivíduos (N), mas também a proporção do total de ocorrência
de cada espécie. A dominância de Simpson é estimada por meio da equação
(MAGURRAN, 2011): λ = Σpi2; Onde: pi = proporção de cada espécie, para i
variando de 1 a S.
c) Índice de Pielou – exprime a análise da equitabilidade, o qual refere-se ao padrão

de distribuição dos indivíduos entre as espécies, com valores variando entre
0 e 1, para um mínimo e máximo de uniformidade (MOÇO et al., 2005; RODE
et al., 2009). Segundo Kanieski et al. (2010) este índice mede a proporção da
diversidade observada em relação à máxima diversidade esperada. De acordo
com Magurran (2011) o índice de Pielou é obtido pela equação: J’= H’ / Hmax;
Onde: H’ = índice de diversidade de Shannon-Wiener; Hmax = ln do número
total de espécies (S).
d) Índice de Jaccard – utilizado para a análise da similaridade de espécies entre as

parcelas (parques). Este coeficiente é utilizado para estudar a coexistência de
espécies ou a similaridade entre unidades amostrais (REAL & VARGAS, 1996),
sendo uma medida de correlação que varia entre 0 e 1 (RODE et al., 2009).
Segundo Real & Vargas (1996) pode ser descrito pela equação: J = C / A+B+C;
Onde: A = número de espécies presentes na parcela A e ausentes na parcela
B; B = número de espécies presentes na parcela B e ausentes na parcela A; C =
número de espécies comuns entre as parcelas A e B. A quantidade de espécies
classificadas nas classes total, adulta e jovem foi comparada, aos pares, por
meio do teste de quiquadrado ao nível de 1% de probabilidade.
192
RESULTADOS E DISCUSSÃO
Do total de espécies arbóreas identificadas nos parques avaliados (149

espécies), metade das espécies (75 espécies) ocorre em apenas um parque e 12%
delas (18 espécies) ocorrem simultaneamente em todos eles. O maior número de
espécies foi encontrado no Passeio Público (81 espécies), seguido pelos parques
São Lourenço (69 espécies) e Passaúna (57 espécies). O maior número de famílias
foi encontrado no Parque São Lourenço (37 famílias), seguido do Passeio Público
(32 famílias) e do Parque Municipal do Passaúna (30 famílias). O número total de
indivíduos arbóreos amostrados foi igual a 5.525.
A partir dos dados apresentados na Tabela 1 constatou-se que houve

diferença estatisticamente significativa (p < 0,01) entre a quantidade de espécies
observadas nos grupos Total e Classe Jovem (χ² = 87,61; GL = 4) e entre os grupos
Classe Jovem e Classe Adulto (χ² = 101,19; GL = 4). As maiores proporções de
espécies exclusivas foram observadas no Passeio Público, seguido pelo Parque
Municipal Passaúna, tanto para o total de espécies amostradas (15,44% e 12,08%
respectivamente), quanto para a classe de espécies adultas (14,77% e 12,08%
respectivamente). Para o Parque Municipal Passaúna foi observada a maior
proporção de espécies como indivíduos da classe adulta (98,36%), bem como a
maior proporção de espécimes com indivíduos da classe adulta (89,82%). Isso
reflete duas situações relacionadas à composição do tratamento paisagístico
arbóreo do parque: a implantação de espécies florestais se deu há algum
tempo, não sendo verificados plantios expressivos dada a baixa quantidade de
árvores jovens, e a composição observada se dá essencialmente com espécies
provenientes da regeneração natural da área, já que este é o parque municipal
mais naturalmente preservado.
193
As menores proporções de espécies exclusivas foram observadas para o

Parque Bacacheri, tanto para o total amostrado (2,01%) quanto para as classes jovem
(2,44%) e adulto (1,34%), sendo este o parque que apresentou a maior proporção
de espécies na classe jovem (91,11%). Por outro lado, o Parque São Lourenço, que
apresentou a segunda maior proporção de espécies na classe jovem (84,0%), foi
a área verde amostrada onde se observou a maior proporção de espécimes como
indivíduos enquadrados na classe jovem (81,29%). As menores proporções de
espécies classificadas na classe jovem foram observadas para os parques Passeio
Público e Passaúna (37,80% e 19,67% respectivamente) e as menores proporções
de espécimes enquadrados na classe jovem foram observadas nos parques Barigui
e Passaúna (18,03% e 10,18% respectivamente).
Com relação aos índices de diversidade analisados constatou-se que a

maior riqueza específica, expressa pelo índice de Margalef, foi observada para
o Passeio Público, tanto para o total amostrado quanto para a classe de árvores
adultas; ao passo que o menor valor deste índice ocorreu para o Parque Bacacheri,
também para o total amostrado e para a classe de árvores adultas. Para a classe
de árvores jovens a maior riqueza específica foi observada no Parque São
Lourenço e a menor delas para o Parque Municipal Passaúna, sendo que para
o primeiro parque foi constatada a maior quantidade de espécies exclusivas e
para o segundo parque a menor delas. Em análise da composição arbórea de
194
sete parques urbanos em Recife-PE, SILVA et al. (2007) encontraram valores de

riqueza específica, expresso pelo índice de Margalef, variando entre 3,54 a 10,07.
Os valores de riqueza específica encontrados no tratamento arbóreo paisagístico
dos parques analisados em Curitiba, Paraná, em relação ao total de indivíduos,
também apresentaram valores altos de diversidade, mas com menor amplitude.
A análise comparativa dos valores deste trabalho com os valores do

trabalho de SILVA et al. (2007) não deve ser utilizada como parâmetro de qual
situação apresenta a melhor diversidade de espécies na composição paisagística,
pois de acordo com MAGURRAN (2011) a análise comparativa de índices de
diversidade deve levar em consideração as respectivas áreas de amostragem e
suas equivalências, caso contrário deve-se adotar a rarefação dos dados para
poder realizar uma análise comparativa apropriada. RICHTER et al. (2012),
em análise da arborização de vias públicas e dos parques urbanos na cidade de
Mata-RS, consideraram como baixa diversidade os valores do índice de riqueza
específica de Margalef menores que 2,0 e como alta diversidade os valores do
índice maiores que 5,0. Se adotado esse critério na análise do levantamento
florístico dos parques verifica-se que houve elevada diversidade para o total
amostrado em cada parque, mas baixa diversidade de espécies na classe jovem,
para o Parque Municipal Passaúna.
Deve-se observar que no Parque São Lourenço houve a maior introdução

de novas espécies (39 espécies), representado pela maior quantidade da diferença
entre os valores da classe adulto e os valores do total amostrado, e que no Parque
Municipal Passaúna houve a menor introdução de novas espécies (apenas
uma). Apesar de não existirem referências ou uma padronização técnica de
composição do tratamento paisagístico arbóreo de parques urbanos, em termos
de diversificação, ISERNHAGEN et al. (2009) afirmam que altos valores de índices
de diversidade podem mascarar a presença de espécies exóticas e principalmente
das exóticas invasoras, não indicando de forma confiável a boa qualidade
ambiental da arborização implantada.
Neste sentido, Sjömana et al. (2012) atestam que ainda não há conhecimento
apropriado sobre níveis de diversidade sustentáveis para uma população de
árvores urbanas. Sendo assim, os resultados obtidos na análise de diversidade
do Passeio Público é um exemplo de que o maior valor da diversidade pode
não representar uma qualidade ambiental no momento. Segundo Biondi &
Muller (2013) quando estudaram os mesmos parques urbanos desta pesquisa,
constataram que o Passeio Público foi o parque que apresentou maior número de
espécies exóticas (13 espécies) e exóticas invasoras (10 espécies). Por ser o primeiro
parque de Curitiba, inaugurado em 1886, a utilização de espécies exóticas nas
áreas verdes no século 19 tinha forte influência europeia. Além disso, a utilização
de espécies exóticas pode também ser justificada pela função primitiva do parque.
Segundo NOGUEIRA (2010), durante o século 19, essa área verde foi, por um
tempo, o primeiro Jardim Botânico de Curitiba, e depois o primeiro zoológico de
Curitiba, até 1982. Quando uma área verde funciona como Jardim Botânico ela
necessita de uma grande variedade de espécies nativas e exóticas para compor
195
uma coleção de espécies exsitu, que, de acordo com o PLANO DE AÇÃO PARA
OS JARDINS BOTÂNICOS BRASILEIROS (2004), é requisito para a conservação
da diversidade biológica dos jardins botânicos nacionais. A análise dos índices
de diversidade utilizados demonstra que quanto maior a riqueza específica
encontrada, menores tendem a ser os valores de dominância e de equidade na
composição da diversidade de espécies do tratamento paisagístico arbóreo dos
parques. O comportamento contraditório entre os índices de Margalef e Simpson
é um fato esperado, tendo em vista que quanto maior a riqueza de espécies de
uma comunidade vegetal menor tende a ser a dominância de uma espécie em
específico (KANIESKI et al., 2010).
A reduzida equidade observada na amostragem da composição paisagística

arbórea dos parques revela que as espécies não são plantadas de maneira uniforme,
atendendo a uma mesma proporção de composição por espécie. A maior dominância
constatada para a classe de indivíduos adultos no Parque Bacacheri se deve ao
predomínio da espécie Handroanthus chrysotrichus (Mart. ex A.DC.) Mattos (ipê-
amarelo-miúdo), da qual foram amostrados 64 indivíduos (35,75% do total). Para
o Parque Municipal Passaúna, a maior dominância constatada na classe jovem se
deve ao predomínio de plantio de indivíduos de Lafoensia pacari St.-Hil (dedaleiro),
da qual foram amostrados 42 indivíduos (27,81% do total). Esse fato é reforçado
pela constatação da menor variabilidade de indivíduos por espécie expressa pelo
menor coeficiente de variação para o parque (Tabela 2), que apresentou a menor
quantidade de espécies com indivíduos na classe jovem (Tabela 1).
A variabilidade dos resultados do índice de equidade de Pielou (Tabela 1)

apresentou correspondências interessantes com os dados da estatística descritiva
apresentados na Tabela 2. Para a classe jovem, o maior valor de equidade obtido
com o Parque Municipal Passaúna (0,22) está relacionado ao menor coeficiente
de variação da quantidade de indivíduos por espécie (107,24%), porém o menor
valor observado para este índice, com o Parque São Lourenço (0,07), na classe
jovem, não corresponde ao maior valor de coeficiente de variação.
196
Para a classe adulta, o maior valor de equidade verificado no Parque

Bacacheri (0,14) corresponde ao maior coeficiente de variação (225,70%); o menor
valor de equidade verificado para o Passeio Público (0,05) corresponde ao menor
valor do coeficiente de variação para a classe (136,43%). Com base nisso, constata-
se que o uso de informações básicas da estatística descritiva não consegue explicar
satisfatoriamente a equidade na composição da diversidade de espécies. Em
termos de similaridade de composição, os dados foram analisados por meio do
índice de Jaccard e estão apresentados na Tabela 3.
Verifica-se que a maior similaridade de composição paisagística arbórea

para a classe jovem, referente ao plantio de novas mudas e espécies, ocorreu entre os
parques Bacacheri e Passaúna (0,91), demonstrando que as espécies introduzidas
são essencialmente as mesmas, porém com predomínios (dominância) diferentes.
Para a classe adultos e para o total amostrado a maior similaridade de composição
de espécies foi encontrada entre os parques Bacacheri e Barigui.
CONCLUSÕES
Com os resultados obtidos foi possível concluir que dentre os cinco

parques urbanos analisados, o Passeio Público foi o que apresentou maior riqueza
de espécies e menor dominância e equidade de espécies. O índice de Jaccard
mostrou-se uma ferramenta útil para a análise comparativa da composição
florística entre tratamentos paisagísticos nos parques urbanos. O uso dos índices
ecológicos para descrição da diversidade de espécies em parques urbanos deve
sempre ser feito mediante considerações acerca da origem das espécies florestais
avaliadas, a fim de demonstrar a participação das espécies exóticas invasoras e de
pautar ações de substituição, priorizando aquelas nativas do ecossistema local.
FONTE: Disponível em: < http://www.conhecer.org.br/enciclop/2014a/AGRARIAS/utilizacao%20

de%20indices.pdf>. Acesso em: 30 jun. 2015.
197
RESUMO DO TÓPICO 2
Neste tópico, você viu:
• O que são índices ecológicos.
• Para que utilizarmos indicadores ambientais visando prever o comportamento

de um ecossistema.
• Os índices de diversidade e de equitatividade sempre possuem uma correlação

positiva.
• Sempre que índices de riqueza forem elevados, os de dominância também

serão.
• Elevados índices de diversidade biológica e equitabilidade sugerem que um

ecossistema esteja com seu estágio de sucessão concluído, ou ainda, que este
ambiente esteja saudável, sem a interferência de ações antrópicas.

• Utilização do software PAST para cálculo de índices ecológicos.
198
AUTOATIVIDADE
Para exercitar seus conhecimentos adquiridos, resolva a questão a

seguir.
Para esta atividade de estudo, sugerimos que com o apoio do tutor

externo, vocês façam uma saída de campo, buscando por uma área com
cobertura vegetal. Assim, podem proceder com os cálculos dos índices vistos
anteriormente. Vocês podem, por exemplo, comparar o interior desta floresta,
com sua região de borda, no que tange à diversidade vegetal. Não precisamos
chegar a ponto de classificar as espécies. Apenas vamos classificá-las como
A, B, C, D e assim por diante, e contar o número de indivíduos presentes
dentro de um quadrat. Este pode ter por exemplo, 2 X 2, ou se estivermos
trabalhando dentro de uma área com árvores de maior porte, pode-se ampliar
o tamanho do quadrat. Podemos trabalhar com no mínimo três réplicas para
cada área, ou seja, três quadrats no interior da mata, e três fora, na região
de borda. Posteriormente anotamos todos os dados em planilhas de excel e
procedemos com os cálculos, fazendo a comparação dos dados obtidos.
199
200
REFERÊNCIAS
MAGURRAN, A. E.; MCGILL, B. J. Biological Diversity: Frontiers in
Measurement and Assessment. Estados Unidos: Oxford University Press, 2011.
Margalef, R. Ecología. Barcelona: Editora Omega, 1974.
ODUM, E.P. Ecologia. Guanabara Koogan: Rio de Janeiro, 1988.
PARTIDÁRIO, M. do R.; JESUS, J. de. Avaliação do impacte ambiental:

conceitos, procedimentos e aplicações. Portugal: CEPGA, 1999.
RICKLEFS, R.E. A economia da natureza. 5. ed. Guanabara Koogan: Rio de

Janeiro, 2003.
201
ANOTAÇÕES
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
202
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
203
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
204

Estatística e Indicadores Ambientais

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística e Indicadores Ambientais

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística e Indicadores

Revisão, Diagramação e Produção:

Ficha catalográfica elaborada na fonte pela Biblioteca Dante Alighieri

A estatística pode ser adotada em vários campos de estudos, e nas

Contudo, todo experimento começa com uma hipótese, uma pergunta.

Para tanto, na primeira unidade deste Caderno de Estudos, vamos ver

Vamos aos estudos!

Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é

Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente,

Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de

TÓPICO 1 – CONCEITOS APLICADOS À ESTATÍSTICA ......................................................... 3

TÓPICO 2 – MÉTODOS ESTATÍSTICOS ....................................................................................... 15

TÓPICO 3 – APRESENTAÇÃO DE DADOS .................................................................................. 23

TÓPICO 4 – MÉTODOS DE AMOSTRAGEM ............................................................................... 41

TÓPICO 5 – DISTRIBUIÇÃO DE PROBABILIDADES ............................................................... 47

TÓPICO 6 – INFERÊNCIAS ESTATÍSTICAS ................................................................................. 61

UNIDADE 2 – MEDIDAS ESTATÍSTICAS ..................................................................................... 69

TÓPICO 1 – MEDIDAS DE POSIÇÃO E VARIAÇÃO ................................................................. 71

TÓPICO 2 – TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS ................................ 97

TÓPICO 3 – TESTES DE HIPÓTESE ................................................................................................ 107

TÓPICO 4 – TESTES NÃO PARAMÉTRICOS ............................................................................... 125

UNIDADE 3 – ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE

TÓPICO 1 – AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES

TÓPICO 2 – ÍNDICES ECOLÓGICOS ............................................................................................. 171

O MÉTODO ESTATÍSTICO E SUA

• reconhecer terminologias, símbolos e conceitos básicos encontrados na li-

• reconhecer, em seus experimentos, a forma como organizar seus dados, de

• ter maior compreensão em relação às teorias da probabilidade e da distri-

TÓPICO 1 – CONCEITOS APLICADOS À ESTATÍSTICA

TÓPICO 2 – OS MÉTODOS ESTATÍSTICOS

TÓPICO 3 – APRESENTAÇÃO DE DADOS

TÓPICO 4 – MÉTODOS DE AMOSTRAGEM

TÓPICO 5 – DISTRIBUIÇÃO DE PROBABILIDADE

TÓPICO 6 – INFERÊNCIAS ESTATÍSTICAS

CONCEITOS APLICADOS À ESTATÍSTICA

A estatística possui uma importância relevante nas pesquisas, pois

2 DEFINIÇÃO DE ESTATÍSTICA E BIOESTATÍSTICA

Afinal, o que é essa tal de estatística?

Etimologicamente, a palavra estatística vem de “status” (estado), expressão

Segundo Padovani (2012, p. 16), a estatística constitui-se em uma ciência

I. Decidir o melhor plano (experimental ou observacional) para a

Padovani (2012, p. 16) menciona ainda que “[...] os métodos da estatística

Portanto, você poderá aplicar a estatística em qualquer experimento que

De acordo com Motta e Wagner (2003, p. 15), a estatística se apresenta em

• Estatística descritiva: é aquela que você como o próprio nome diz,

FIGURA 1 - VISUALIZAÇÃO DA INTERAÇÃO DA ESTATÍSTICA DESCRITIVA

FONTE: Adaptado de Battisti e Battisti (2008)

Na estatística, há várias formas de se obter o resultado da análise de

Já a Bioestatística, de acordo com Padovani (2012, p. 15), “[...] é a

A bioestatística pode ser aplicada, também, à medicina e às ciências

Portanto, a estatística tem como objetivo principal tirar conclusões com

“[...] As aplicações na área de biometria (medicina, biologia, agronomia, psicologia

3 CONCEITOS APLICADOS À ESTATÍSTICA

• População: é qualquer conjunto de informações que tenham entre si uma

• Amostras: são subconjuntos representativos de uma dada população (DORIA

• Hipótese: Segundo Kato (2015, p. 01), “em estatística, é uma suposição

• Nível de significância de um teste (α): é a probabilidade máxima de rejeitar

• Variável aleatória: De acordo com Battisti e Battisti (2008), são as características

- As variáveis qualitativas têm seus valores (respostas para cada questão do

- As variáveis quantitativas são subdivididas em discretas e contínuas. Motta e

FIGURA 2 - RESUMO DAS VARIÁVEIS ALEATÓRIAS

FONTE: Adaptado de Battisti e Battisti (2008)

• Dados primários e dados secundários: De acordo com Battisti e Battisti (2008),

O texto a seguir foi retirado, na íntegra, do site do Instituto de Matemática da