Você está na página 1de 59

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/349179823

NOÇÕES BÁSICAS DE BIOESTATÍSTICA E ANÁLISES ECOLÓGICAS

Technical Report · February 2021

CITATIONS READS

0 474

1 author:

Jorge "Magoo" Fortuna


Universidade Estadual da Bahia (UNEB)
45 PUBLICATIONS 114 CITATIONS

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Projeto Fungus Extremus View project

All content following this page was uploaded by Jorge "Magoo" Fortuna on 03 March 2021.

The user has requested enhancement of the downloaded file.


UNIVERSIDADE DO ESTADO DA BAHIA (UNEB)
DEPARTAMENTO DE EDUCAÇÃO
CAMPUS X – TEIXEIRA DE FREITAS
CIÊNCIAS BIOLÓGICAS (LICENCIATURA)

NOÇÕES BÁSICAS DE
BIOESTATÍSTICA
E ANÁLISES ECOLÓGICAS
PROF. DR. JORGE LUIZ FORTUNA
Professor Adjunto da área de Microbiologia do curso de Ciências Biológicas da
Universidade do Estado da Bahia (UNEB), Campus X, Teixeira de Freitas-BA
jfortuna@uneb.br

Teixeira de Freitas-BA
2021
Para citar esta apostila:

FORTUNA, J. L. Noções Básicas de Bioestatística e Análises Ecológicas. Teixeira de Freitas: UNEB,


Campus X. 2021, 57 p.

Fortuna, Jorge Luiz

Noções Básicas de Bioestatística e Análises Ecológicas / Jorge Luiz Fortuna –


Teixeira de Freitas-BA, 2021.
57 p.

Organizador: Jorge Luiz Fortuna.


Apostila (Ciências Biológicas) – Universidade do Estado da Bahia,
Departamento de Educação – Campus X, 2021.

1. Bioestatística. 2. Análises. 3. Ecologia. 4. Estatística. 5. Apostila. I. Fortuna,


Jorge Luiz. II. Título.
SUMÁRIO

I. MÉTODO, p. 4
1. DEFINIÇÃO, p. 4
2. PRINCIPAIS TIPOS DE MÉTODOS, p. 4

II. ESTATÍSTICA, p. 6
1. DEFINIÇÃO, p. 6
2. PRINCIPAIS CONCEITOS, p. 6

III. ESTATÍSTICA DESCRITIVA, p. 7


1. DEFINIÇÃO, p. 7
2. VARIÁVEIS E APRESENTAÇÃO DE DADOS, p. 7
3. MEDIDAS DE POSIÇÃO E DISPERSÃO, p. 8
4. DISTRIBUIÇÃO DE FREQUÊNCIAS, p. 12
5. APRESENTAÇÃO DA DISTRIBUIÇÃO DE FREQUÊNCIAS, p. 13

IV. AMOSTRAGEM, p. 14
1. DEFINIÇÃO, p. 14
2. TIPOS DE AMOSTRAS, p. 14
3. AMOSTRA PROBABILÍSTICA OU ALEATÓRIA OU CASUAL, p. 14
4. AMOSTRA SEMI-PROBABILÍSTICA, p. 14
5. AMOSTRA NÃO-PROBABILÍSTICA OU DE CONVENIÊNCIA, p. 15
6. CÁLCULO DA AMOSTRAGEM, p. 16

V. NOÇÕES BÁSICAS DE PROBABILIDADE, p. 18


1. DEFINIÇÃO, p. 18
2. CÁLCULO DE PROBABILIDADE, p. 18
3. PROBABILIDADE EM EVENTOS INDEPENDENTES, p. 19
4. PROBABILIDADE CONDICIONAL (EVENTOS DEPENDENTES), p. 20

VI. ESTATÍSTICA INFERENCIAL, p. 21


1. TESTES DE HIPÓTESES, p. 21
2. TESTE DE STUDENT, p. 22
3. TESTE DE FISHER, p. 23
4. TESTE DO QUI-QUADRADO, p. 23
5. TESTE DE TUKEY, p. 24
6. ANÁLISE DE VARIÂNCIA, p. 24
7. CORRELAÇÃO, p. 25
8. REGRESSÃO, p. 26

VII. ANÁLISES ECOLÓGICAS, p. 29


1. RIQUEZA DE ESPÉCIE, p. 29
2. ABUNDÂNCIA RELATIVA, p. 29
3. DOMINÂNCIA, p. 29
4. DENSIDADE RELATIVA, p. 30
5. FREQUÊNCIA OBSERVADA, p. 30
6. CONSTÂNCIA, p. 30
7. ÍNDICE DE DIVERSIDADE, p. 30
8. ÍNDICE DE SIMILARIDADE, p. 31
9. MEDIDAS DE DIVERSIDADE, p. 32

REFERÊNCIAS, p. 39

EXERCÍCIOS, p. 41

TABELAS ESTATÍSTICAS, p. 49
4

I. MÉTODO
1. DEFINIÇÃO
A palavra “método” apresenta duas origens, grega e latina.
Na origem grega “methodos” (“meta” + “hodos” ou “odou”), onde o prefixo “meta” tem dois
significados: “depois” e “com” ou um sentido de mudança, sucessão, posterioridade, “ir além” ou
“movimento de um lugar para outro” e o sufixo “hodos” ou “odou” significa caminho. Assim, o significado
mais correto para a palavra método de origem grega seria “com caminho”.
Já na origem latina, a palavra “methodus” indica um caminho para chegar a um fim, ou mesmo a um
determinado resultado.
O método é o conjunto das atividades sistemáticas e racionais que, com maior segurança e economia,
permite alcançar o objetivo (conhecimentos válidos e verdadeiros) traçando o caminho a ser seguido,
detectando erros e auxiliando as decisões do cientista.
Também pode ser definido por um conjunto de etapas, que quando executadas de forma sistemática,
facilitam a obtenção de conhecimentos sobre fenômenos físicos, químicos e biológicos, ou o
desenvolvimento de novos produtos ou processos.
Destacam-se as principais etapas:
 Criação de um Problema: questionamentos; indagações; curiosidades.
 Indicação de uma Hipótese: possível resposta ao problema.
 Experimentação: testes para chegar a uma resposta.
 Coleta de Dados: busca de dados que confirmem ou não a hipótese.
 Análise da Resposta: verificação da viabilidade da hipótese encontrada.
 Conclusão: aceitação ou refutação da hipótese.

2. PRINCIPAIS TIPOS DE MÉTODOS


 Método Indutivo:
 Parte das observações particulares para chegar a conclusões gerais. A constância e a
regularidade dos fenômenos produzem uma generalização, querem levar a uma lei geral e
universal. Induzir é chegar a uma conclusão a partir de dados particulares.
 O método indutivo é o método proposto por autores empiristas como Hume, Locke,
Bacon e Hobbes. Para eles o conhecimento está fundamentado apenas na experiência e
não deve partir de princípios preestabelecidos (dedutivos). A conclusão indutiva é
provável e não necessariamente verdadeira.
 Nesse método, parte-se da observação de fatos ou fenômenos cujas causas se deseja
conhecer. A seguir, procura-se compará-los com a finalidade de descobrir as relações
existentes entre eles. Por fim, procede-se à generalização, com base na relação verificada
entre os fatos ou fenômenos.

 Método Dedutivo:
 Ao contrário do anterior, parte da generalização e quer confirmá-la na particularidade.
 A dedução é um método proposto por autores clássicos como Descartes, Spinoza e
Leibniz. Sua utilização é maior em campos como a Física e a Matemática.
 O protótipo do raciocínio dedutivo é o silogismo, que consiste numa construção lógica
que, a partir de duas preposições chamadas premissas, retira uma terceira, nelas
logicamente implicadas, denominada conclusão.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
5

 Método Indutivo-Dedutivo:
 Combina os dois anteriores. Parte da observação para a indução faz a dedução e volta à
observação.
 Aristóteles foi quem propôs esse método.
 Stuart Mill fala dos três passos que o constituem: a indução, a dedução (raciocínio) e a
experimentação.
 Outro autor que consagrou esse método foi Isaac Newton chamando-o de “análise e
síntese”. A análise para Newton é o momento de observações e experimentações. Já a
síntese é o momento de fazer as conclusões gerais, as descobertas, as causas, as exceções
e os princípios, a partir da indução, que explicam os fenômenos.

 Método Hipotético-Dedutivo:
 Nasceu da percepção de que não é necessário sempre se partir dos fenômenos, da
observação deles e, então, por indução, produzir uma hipótese. É possível que já exista a
hipótese, nascida da imaginação, do senso comum ou da intuição.
 A partir da hipótese, o pesquisador, por dedução, deve verificar se ela realmente se
confirma ou não.
 O esquema é o seguinte: hipótese – dedução – fenômenos.
 Há um problema, proposto como hipótese, formula-se uma solução dedutiva e se realiza
experimentos, testes, análises para refutar ou confirmar a hipótese.
 Em linhas gerais, no método hipotético-dedutivo há os seguintes elementos:
 Observação e enunciado de um PROBLEMA que questione e que não foi
compreendido e/ou explicado satisfatoriamente;
 Formulação de uma HIPÓTESE, a partir da observação ou da intuição do
pesquisador a ser avaliada, analisada, interpretada, testada, refutada, como solução
ao problema observado e/ou enunciado;
 Testes, EXPERIMENTOS, análises, interpretações e argumentações, controladas
por pessoas que se dedicam àquela área da ciência, que buscam responder à hipótese
formulada;
 CONCLUSÃO sobre os testes, experimentações, análises e interpretações,
confirmando, refutando ou corrigindo a hipótese testada ou analisada.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
6

II. ESTATÍSTICA
1. DEFINIÇÃO
Ciência que envolve coleta, organização, resumo, tratamento, análise e interpretação de dados.
Pode ser classificada em dois tipos: Estatística Descritiva e Estatística Inferencial (Analítica).
 Estatística Descritiva: Objetivo de descrever dados. Compreende a obtenção, organização e
representação dos dados. Abrange o conjunto de técnicas para organizar, resumir, classificar,
descrever e comunicar dados em tabelas, gráficos ou em outros recursos visuais, além do cálculo
de estimativas de parâmetros representativos desses dados.
 Estatística Inferencial (Analítica ou Experimental): Objetivo de analisar e interpretar os
dados. É o processo de obter informações sobre uma população a partir de resultados
observados na amostra. Inclui as técnicas por meio das quais são tiradas concussões sobre uma
população, baseadas em dados obtidos em amostras. Trabalha com dados de forma a estabelecer
hipóteses em função desses dados, procede a sua comprovação e, posteriormente, elabora
conclusões científicas.

2. PRINCIPAIS CONCEITOS
 População: Conjunto de elementos portadores de pelo menos uma característica comum de
interesse para ser estudado. População é considerado o UNIVERSO ESTATÍSTICO.
 População Finita: Possui número limitado de elementos, que é passível de contagem.
 População Infinita: Possui número ilimitado de elementos, que é impossível de contar.
 Censo: Conjunto de dados estatísticos de todos os elementos da população.
 Amostra: É um subconjunto qualquer da população, selecionada para representá-la. É a parte
da população que será analisada.
 Amostragem: É o processo de retirada de informações dos "n" elementos amostrais, no qual
deve seguir um método criterioso e adequado (tipos de amostragem).
 Variável: É uma característica qualquer de interesse que é associado à população ou à amostra
para ser estudada estatisticamente. Existem as variáveis numéricas ou quantitativas (contáveis)
e as variáveis não-numéricas ou qualitativas (categóricas ou classificáveis).
 Parâmetro: Valor de uma característica da população.
 Estimador: Valor de uma característica da amostra.
 Rol: Lista dos dados numéricos da amostra ou da população analisada. É a tabela obtida após a
ordenação dos dados.
 Tratamento: É o método ou elemento ou material cujo efeito deseja medir ou comparar em
um experimento.
 Unidade Experimental: Unidade que vai receber (aplicar) o tratamento e fornecer os dados
que vão refletir os seus efeitos.
 Delineamento Experimental: É o plano utilizado na experimentação e implica na forma como
os tratamentos serão designados às unidades experimentais. Objetivo de controlar efeitos não
delineáveis. Deve ser feito antes de coletar os dados.
 Repetições: Número de observações de um experimento, tornando suas conclusões (respostas)
mais confiáveis. Repetições diminuem os efeitos do acaso.
 Casualização: Importante para que cada tratamento tenha a mesma probabilidade (chance).

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
7

III. ESTATÍSTICA DESCRITIVA


1. DEFINIÇÃO
Estatística Descritiva pode ser estudada considerando os conjuntos de valores analisados como sendo
amostras ou então populações.
O tamanho de uma população (quando finita) é representado, normalmente por “N”, enquanto que
o tamanho de amostra é representado por “n”.
Um conjunto de valores (amostra) será representada por: x1, x2, ..., xn, onde “n” é o número de
elementos do conjunto, isto é, o tamanho da amostra.
Um conjunto de dados, de qualquer tamanho, pode ser resumido de acordo com duas principais
medidas:
1. Medidas de Tendência Central ou Posição;
2. Medidas de Dispersão ou Variabilidade.

2. VARIÁVEIS E APRESENTAÇÃO DE DADOS


Variável é a característica que vai ser observada, medida ou contada nos elementos da população ou
da amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento. Não
basta identificar a variável a ser trabalhada, é necessário conhecer e distinguir os tipos de variáveis,
que podem ser classificadas quanto à Categoria (Quantitativas e Qualitativas); Continuidade
(Contínua e Descontínua); Fluxo de Resposta (Continuado e Descontinuado); Distribuição de
Frequência (Normal e Não-Normal); e quanto à Instabilidade (Pouco Instáveis e Muito Instáveis):

2.1. Classificação Quanto à Categoria:


a) Variáveis Numéricas ou Quantitativas;
b) Variáveis Não-Numéricas ou Qualitativas.
 Variáveis Numéricas ou Quantitativas: São as variáveis contáveis. As possíveis realizações
são valores numéricos. São utilizados para descrever quantidades e por isso são medidas
numericamente. Podem ser de dois tipos:
 Variável Quantitativa Discreta: Seus possíveis valores são números inteiros, ou seja,
sem casas decimais, e formam um conjunto inumerável de valores. São aqueles que
resultam de contagens. Exemplos: número de filhos; renda; número de pessoas.
 Variável Quantitativa Contínua: Seus possíveis valores pertencem a um intervalo de
valores. São aquelas que resultam de mediação. Não são necessariamente inteiros,
dependem de precisão anotada e do instrumento de medida. Exemplos: idades;
quilômetros; diâmetros; estatura; peso.
 Variáveis Não-Numéricas ou Qualitativas: São as variáveis categóricas ou classificáveis.
Apresentam como resultados uma qualidade (ou atributo) do elemento pesquisado. Podem ser
de dois tipos:
 Variável Qualitativa Ordinal: Existe certa ordem ou hierarquia entre os valores de cada
variável. Exemplos: nível socioeconômico; cargo; série.
 Variável Qualitativa Nominal: Não existe nenhuma ordenação possível nas realizações
das categorias. Exemplos: religião; raça; sexo; estado civil; etnia.

2.2. Classificação Quanto à Continuidade:


a) Variáveis Contínuas;

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
8

b) Variáveis Descontínuas ou Discretas.


 Variáveis Contínuas: Podem variar continuamente pela aferição de frações dependendo do
método de mensuração.
 Variáveis Descontínuas ou Discretas: Só podem ser expressas em valores inteiros, sem
frações.

2.3. Classificação Quanto ao Fluxo de Resposta:


a) Variáveis de Fluxo Continuado;
b) Variáveis de Fluxo Descontinuado ou Transversal.
 Variáveis de Fluxo Continuado: Podem ser obtidas pela reutilização da unidade experimental
permitindo a avaliação de respostas sob diferentes condições experimentais sequenciais.
 Variáveis de Fluxo Descontinuado ou Transversal: A resposta só poderá ser obtida uma
única vez na mesma unidade experimental.

2.4. Classificação Quanto à Distribuição de Frequência:


a) Variáveis com Distribuição Normal;
b) Variáveis com Distribuição Não-Normal.
 Variáveis com Distribuição Normal: Com maiores frequências para valores centrais
próximos à média, diminuindo simetricamente sua ocorrência à medida que a resposta se afasta
do valor central.
 Variáveis com Distribuição Não-Normal: Apresenta assimetrias diversas ou características
peculiares diferentes daquelas da distribuição normal.

2.5. Classificação Quanto à Instabilidade:


a) Variáveis Pouco Instáveis;
b) Variáveis Muito Instáveis.
 Variáveis Pouco Instáveis: Quando o intervalo de variação for pequeno (amplitude menor).
 Variáveis Muito Instáveis: Quando há uma grande variação nos valores observados
(amplitude alta).

3. MEDIDAS DE POSIÇÃO E DISPERSÃO


 Medidas de Posição: Valores que indicam posição de centralidade, ou o ponto central da
distribuição.
 Média (𝑿 ̅ ): Razão da soma total dos valores observados, pelo número total de valores.
É a medida de tendência central mais utilizada para representar o conjunto de dados. É o
valor que representa a tendência central de um resultado. É o valor mais provável de um
resultado. Pode ser de três tipos: Média aritmética simples; média aritmética ponderada e
média aritmética em dados agrupados em intervalos de classe.

Média Aritmética Simples


∑ 𝑥𝑖 𝒙𝒊 = variáveis (valores ou medidas)
𝑋̅ = n = quantidade total de variáveis
𝑛
Soma das variáveis (valores ou medidas) dividida pela
quantidade total destas variáveis.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
9

Média Aritmética Ponderada


∑ 𝑥𝑖 𝑓𝑖 𝒙𝒊 = variáveis (valores ou medidas)
𝑋̅ = 𝒇𝒊 = frequências das variáveis
∑ 𝑓𝑖
Soma das variáveis (valores ou medidas) vezes as frequências
destas dividido pelo total das frequências.

Média Aritmética em Dados Agrupados em Intervalos


∑ 𝑓𝑖 𝑋̅𝑐 𝒇𝒊 = frequências das variáveis
̅
𝑋= ̅ 𝒄 = média dos valores centrais de
𝑿
∑ 𝑓𝑖 cada intervalo de classe
Os dados não se apresentam com seu verdadeiro valor
individual, mas são representados por uma classe que pode ter
um determinado intervalo. Como o intervalo não tem um valor
definido e sim um conjunto de valores, utiliza-se o ponto médio
(média) de cada intervalo

 Mediana (Me): Medida de posição central. A mediana é o valor que ocupa a posição
central (meio) da distribuição. Usada quando a distribuição apresenta resultados extremos
muito discrepantes, pois a mediana não sofre a influência de valores extremos. Para
cálculo da mediana deve-se:
 Ordenar todas as variáveis (valores ou medidas);
 Determinar o número total das variáveis (n);
 Localizar o valor central.

Mediana (n ímpar) Mediana (n par)


𝑛 𝑛+1
𝑛+1 ( 2 )+( 2 )
Me = Me =
2 2

Mediana em Dados Agrupados em Intervalos de Classe


Li = limite inferior da classe que contém a mediana
𝑛 n = número de observações do conjunto
−∑ 𝑓𝑎
Me = Li + 2
h 𝒇𝒂 = frequência das classes anteriores à classe mediana
𝑓𝑀𝑒 h = amplitude da classe que contém a mediana
𝒇𝑴𝒆 = frequência simples da classe mediana

 Moda (Mo): Valor dominante de uma distribuição. Aquele que numa série de valores se
apresenta com a maior frequência. Um conjunto de valores pode apresentar mais de
uma moda (plurimodal). O uso da moda é mais indicado quando se deseja obter,
rapidamente, uma medida de tendência central. A valor da moda não é afetado pelos
valores extremos do conjunto de dados analisado.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
10

Moda em Dados Agrupados em Intervalos de Classe

Li = limite inferior da classe modal


d 1 = diferença entre a frequência da classe modal e da
𝑑1 classe anterior
Mo = Li + h d 2 = diferença entre a frequência da classe modal e da
𝑑1 + 𝑑2
classe posterior
h = amplitude da classe que contém a mediana

 Medidas de Dispersão: Índices que indicam o grau de concentração ou dispersão de uma


distribuição em torno da média.
 Amplitude dos Dados (AT): É a diferença entre o maior e o menor valor numérico
encontrado no rol.

Amplitude dos Dados

xmáx = maior valor do rol


AT = xmáx – xmín xmín = menor valor do rol

 Desvio Médio (DM): Média aritmética dos afastamentos (ou desvios), tomados em valor
absoluto, entre cada valor e a média aritmética. Indica o quanto, em média, os valores se
afastam do ponto central (média).

Desvio Médio
𝒙𝒊 = variáveis (valores ou medidas)
∑ |(𝑥𝑖 − 𝑋̅)| ̅ = média aritmética
𝐷𝑀 = 𝑿
𝑛 n = quantidade total de variáveis
Soma das variáveis (valores ou medidas) menos a média
aritmética, em módulo, dividido pelo total das variáveis.

 Desvio Padrão (s): Afastamento quadrático médio ou afastamento padrão. É a raiz


quadrada da variância. É o valor que gira em torno da média. É uma medida de
instabilidade. Indica os limites prováveis dentro dos quais se situam certas proporções das
observações. É a medida mais usada com medida de variabilidade, principalmente quando
a distribuição for normal.

Valores de n > 30 Valores de n ≤ 30

2 2
2 (∑ 𝑥𝑖 ) 2 (∑ 𝑥𝑖 )

s= √∑ 𝑥𝑖 − 𝑛
s= √∑ 𝑥𝑖 − 𝑛
𝑛 𝑛−1

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
11

Desvio Padrão para Dados Agrupados

∑ 𝑓𝑖 𝑥 2 ∑ 𝑓𝑖 𝑋̅𝑐 2
2
∑ 𝑓𝑖 𝑥 2 ∑ 𝑓𝑖 𝑋̅𝑐
s=√ −( ) s=√ −( )
𝑛 𝑛 𝑛 𝑛

 Variância ou Quadrado Médio (s2): Considerando-se uma amostra de dados, cada dado
isolado pode ter um desvio (dispersão) em relação à média da amostra. Mede a dispersão
dos dados de observações de uma amostra em relação à respectiva média. Essa dispersão
é a diferença entre o valor individual e a média da amostra de dados. Para se avaliar o grau
de dispersão de toda a amostra de dados utiliza-se a variância que é a soma dos quadrados
dos desvios dividido pelo tamanho da amostra, menos 1. Seu valor corresponde ao desvio
padrão elevado ao quadrado.

Valores de n > 30 Valores de n ≤ 30

2 2
(∑ 𝑥𝑖 ) (∑ 𝑥𝑖 )
∑ 𝑥𝑖2 − ∑ 𝑥𝑖2 −
s2 = 𝑛
s2 = 𝑛
𝑛 𝑛−1

 Coeficiente de Variação (CV): É uma medida de dispersão relativa definida como a


razão entre o desvio padrão e a média. A partir do coeficiente de variação pode-se avaliar
a homogeneidade do conjunto de dados e, consequentemente, se a média é uma boa
medida para representar estes dados. Avalia a instabilidade da amostra. Um coeficiente de
variação superior a 50% sugere alta dispersão o que indica heterogeneidade dos dados.
Maior o desvio, maior a variação. Quanto maior for este valor, menos representativa será
a média ou maior será a dispersão no conjunto de observações. CV ≤ 10% ótimo; 11%-
20% bom; 21%-30% regular.

Coeficiente de Variação
𝑠 s = desvio padrão
CV = .100 ̅ = média aritmética
𝑿
𝑋̅

 Variância Relativa (VR): É a razão entre a variância absoluta e o quadrado da média.

Variância Relativa

𝑠2 s2 = variância
VR =
(𝑋̅)2
.100 𝑿̅ = média aritmética

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
12

 Erro Padrão da Média (s𝑿 ̅ ): A média aritmética determinada apresenta, em relação à


média da população, um afastamento. Neste caso, se outras amostras sejam retiradas da
população, apresentariam médias aritméticas que teriam outros afastamentos em relação
à média populacional. Então, para se determinar a média destes afastamentos utiliza-se o
erro padrão da média, que é a razão entre o desvio padrão e a raiz quadrada do número
total observado de variáveis.

Erro Padrão da Média


𝑠 s = desvio padrão
s𝑋̅ = n = número de observações
√𝑛

4. DISTRIBUIÇÃO DE FREQUÊNCIAS
Para se trabalhar com grandes conjuntos de dados é necessário inicialmente agrupar estes dados. O
agrupamento é feito em tabelas, denominadas de distribuições de frequências.
Para construir uma distribuição de frequências é comum fazer a distinção entre dois tipos de variáveis:
1. Variável Discreta (valores resultados de contagem, geralmente com repetições);
2. Variável Contínua (valores resultados de uma medida, geralmente com poucas repetições).
Em geral variáveis discretas são agrupadas em distribuições por ponto ou valores e variáveis contínuas
em distribuições por classes ou intervalos.
 Distribuição por Pontos ou Valores: Representação é feita em uma distribuição de
frequências por pontos ou valores. Os valores são colocados em uma tabela em que a coluna da
esquerda é representada pelos diferentes números ordenados (pontos ou valores) e a coluna da
direita pelo número de vezes que cada valor se repetiu (frequências simples ou absolutas).
 Distribuição por Classes ou Intervalos: Neste caso é necessário construir uma tabela
denominada de “distribuição de frequências por classes ou intervalos”.
 Apresentação (Representação) dos Dados: Os dados de um rol podem e devem ser
organizados em diversas tabelas e gráficos.
 Cálculo de Número de Classes: O procedimento para construir esta distribuição envolve os
seguintes passos (algoritmo):
 Determinar a amplitude dos dados: AT = xmáx – xmín.
 Decidir sobre o número de classes “k“ a ser utilizado. Recomenda-se um número de
classes entre 5 e 15. Para que a decisão não seja totalmente arbitrária pode-se usar a raiz
quadrada do número de valores como o número de classes, ou seja, k ≅ √𝒏.
 Determinar a amplitude de cada classe (h). Sempre que possível manter todas as
amplitudes iguais. Para tanto deve-se dividir a amplitude dos dados “AT” pelo número
de classes “k”, arredondando para mais, ou seja, h ≅ AT / k.
 Contar o número de valores pertencentes a cada classe. Em geral, utiliza-se a simbologia
│── para indicar um intervalo fechado à esquerda e aberto à direita. Também poderia ser
utilizado o intervalo aberto à esquerda e fechado à direita ──│; aberto de ambos os lados
── ou ainda fechado de ambos os lados │──│.
 Frequência Simples ou Absoluta (fi): É o número de vezes que um dado aparece no rol. Os
dados devem ser organizados em categorias.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
13

 Frequência Relativa ou Percentual (fri%): É o número de cada variável dividido pelo número
total de observação. É a frequência absoluta de cada variável dividida pelo somatório das
frequências absolutas em porcentagem.

Frequência Relativa ou Percentual


𝑓𝑖 𝒇𝒊 = frequência simples
𝑓𝑟𝑖 % = .100 n = quantidade total de dados
𝑛

 Frequência Acumulada Simples ou Absoluta (Σfi): É definida como sendo a soma das
frequências simples ou absolutas até a linha “i”.

Frequência Acumulada Simples

∑ 𝑓𝑖 = f1 + f2 + f3 + ... + fi

 Frequência Acumulada Relativa ou Percentual (Σfri%): É definida como sendo a soma das
frequências relativas ou percentuais até a linha “i”.

Frequência Acumulada Relativa


∑ 𝑓𝑖 𝒇𝒊 = frequência simples
∑ 𝑓𝑟𝑖 %= .100 n = quantidade total de dados
𝑛

5. APRESENTAÇÃO DA DISTRIBUIÇÃO DE FREQUÊNCIAS


 Distribuição por Pontos ou Valores: Uma distribuição de frequências por pontos ou valores
é apresentada graficamente através de um diagrama de linhas ou colunas, onde a variável “xi” é
representada no eixo das abcissas ou abscissas (horizontal) e as frequências (que podem ser de
qualquer tipo) no eixo das ordenadas (vertical).
 Distribuição por Classes ou Intervalos: Uma distribuição de frequências por classes ou
intervalos é apresentada graficamente através de um diagrama denominado de
HISTOGRAMA. Um histograma é um gráfico de retângulos justapostos onde a base de cada
retângulo é a amplitude de cada classe e a altura é proporcional a frequência (simples ou relativa)
de modo que a área de cada retângulo seja igual a frequência considerada. Desta forma a altura
de cada retângulo será igual a: fi/h ou então fri/h. Também pode ser construído um histograma
utilizando-se as frequências acumuladas. Neste caso o diagrama resultante é denominado de
OGIVA. Se os pontos médios de cada classe de um histograma forem unidos através de
segmentos de retas teremos então um diagrama denominado de POLÍGONO DE
FREQUÊNCIAS.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
14

IV. AMOSTRAGEM
1. DEFINIÇÃO
Amostra diz respeito a um subconjunto da população, fracção ou uma parte do grupo.
A amostra deve ser representativa da população, isto é, deve conter todas as características, já que por
meio dessa amostra serão tiradas as conclusões para toda a população.
As principais razões para se trabalhar com amostras e não com toda a população são:
 Custo e demora dos censos.
 Populações muito grandes.
 Impossibilidade física de examinar toda a população.
 Comprovado valor científico das informações coletadas por meio de amostras

2. TIPOS DE AMOSTRAS
Antes de obter uma amostra, é preciso definir os critérios que serão usados para selecionar as unidades
que comporão essa amostra. De acordo com a técnica usada, tem-se um tipo de amostra, que podem
ser:
 Amostragem aleatória, ou casual, ou probabilística.
 Amostragem semi-probabilística (alguns autores ainda a consideram probabilística).
 Amostragem não-probabilística ou de conveniência.
A amostragem será probabilística se todos os elementos da população tiverem probabilidade
conhecida, e diferente de zero, de pertencer à amostra. Caso contrário, a amostragem será não-
probabilística.

3. AMOSTRA PROBABILÍSTICA OU ALEATÓRIA OU CASUAL


A amostra aleatória ou probabilística é constituída por “n” unidades retiradas ao acaso da população.
Em outras palavras, a amostra aleatória é obtida por sorteio. Logo, toda unidade da população tem
probabilidade conhecida de pertencer à amostra.
Para obter uma amostra aleatória, é preciso que a população seja conhecida e cada unidade esteja
identificada por nome ou por número. Os elementos que constituirão a amostra serão escolhidos por
sorteio.
Uma amostra aleatória pode ser Simples ou Estratificada.
 Simples: É obtida por sorteio de uma população constituída por unidades homogêneas para a
variável que será estudada.
 Estratificada: É usada quando a população é constituída por unidades heterogêneas para a
variável que será estudada. Nesse caso, as unidades da população devem ser identificadas;
depois, as unidades similares devem ser reunidas em subgrupos chamados estratos. O sorteio é
feito dentro de cada estrato.

4. AMOSTRA SEMI-PROBABILÍSTICA
A amostra semi-probabilística é constituída por “n” unidades retiradas da população por
procedimento parcialmente aleatório.
As amostras semi-probabilísticas podem ser do tipo Sistemática ou Por Conglomerados (“Cluster”) ou
Por Quotas (Cotas ou Por Áreas).

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
15

 Sistemática: É constituída por “n” unidades retiradas da população segundo um sistema pré-
estabelecido. Os elementos da população apresentam-se ordenados e são retirados
periodicamente (de cada “k” elementos, um é escolhido).

Amostragem Sistemática

𝑁 k = intervalo de amostragem
k= N = número total da população
𝑛 n = número de indivíduos da amostra

 Por Conglomerados (“Cluster”): É constituída por “n” unidades tomadas de alguns


conglomerados. O conglomerado é um conjunto de unidades que estão agrupadas, qualquer
que seja a razão.
 Por Quotas (Cotas) ou Por Áreas: É constituída por “n” unidades retiradas da população
segundo quotas ou áreas estabelecidas de acordo com a distribuição desses elementos na
população. A ideia de quota ou área é semelhante à de estrato, com uma diferença básica,
seleciona-se a amostra por julgamento (não aleatório) e depois confirma as características das
unidades amostradas.

5. AMOSTRA NÃO-PROBABILÍSTICA OU DE CONVENIÊNCIA


Na Amostragem Não-Probabilística há uma escolha deliberada dos elementos da amostra. Depende
dos critérios e julgamento do pesquisador. Neste tipo de amostragem não se conhece a probabilidade
de um elemento da população ser escolhido para participar da amostra.
As Amostragens Não-Probabilísticas podem ser utilizadas em três tipos de situações:
a) Estudos em grupos cujos elementos são difíceis de identificar e contatar.
b) Estudos com grupos específicos que por razões éticas impedem que se identifiquem todos
os elementos desses grupos, onde se entrevistam apenas voluntários.
c) Investigações em situações piloto.
As principais técnicas de amostragem não-probabilística podem ser do tipo Intencional e Não-
Intencional (ou Acidental ou De Conveniência).
 Intencional: Consiste na escolha dos elementos da amostra por um especialista no assunto,
que seleciona os elementos que julga os mais apropriados e representativos para o estudo em
questão. Composta por elementos da população selecionados intencionalmente pelo
investigador, porque este considera que esses elementos possuem características típicas ou
representativas da população. Pode ser dos seguintes tipos:
 Bola-de-Neve (“Snowball”): O entrevistador estabelece contato inicial com alguns
sujeitos previamente identificados como membros do grupo que se pretende estudar e
estes sujeitos põem o investigador em contato com outros membros desse grupo e assim
sucessivamente.
 Por Quotas (Cotas): Análogo ao método de amostragem semi-probabilística, porém sem
a possibilidade de acontecer aleatoriedade das amostras. Normalmente os indivíduos são
escolhidos por conveniência. As amostras são obtidas dividindo a população por
categorias ou estratos e selecionando um certo número (quota) de elementos de cada
categoria de modo não aleatório.
 Grupo Focal: Consiste na entrevista a um pequeno grupo de sujeitos (10 a 20 elementos)
escolhidos pelo investigador por serem representativos de uma população particular.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
16

 Casos Críticos: Casos importantes por alguma razão. Amostragem que se concentra em
casos específicos que geralmente são dramáticos ou muito importantes.
 Não-Intencional ou Acidental ou De Conveniência: Entrevistam-se indivíduos que se tem
acesso imediato e direto. Os elementos da amostra são escolhidos por serem os mais acessíveis
ou fáceis de serem avaliados. As amostras obtidas desta forma não são representativas da
população e em geral são enviesadas.

6. CÁLCULO DA AMOSTRAGEM
 Fatores que Determinam o Tamanho da Amostra:
 Nível de Confiança (Z): Quanto maior o nível de confiança, maior o tamanho da
amostra.
 Erro Máximo Permitido (e): Quanto menor o erro permitido, maior o tamanho da
amostra.
 Variabilidade: Quanto maior a variabilidade do fenômeno que está sendo investigado,
maior o tamanho da amostra.
 Cálculo Geral de Amostragem: De maneira geral, e mais simples, é possível calcular o
tamanho da amostra através da utilização de duas fórmulas.

Cálculo de Amostragem

1 𝑁.𝑛0
𝑛0 = 𝑛=
𝑒2 𝑁+𝑛0

Onde:
n0 = primeira aproximação do tamanho da amostra
e = erro amostral tolerável, precisão. Principais valores utilizados: 1% (0,01); 3% (0,03); 5% (0,05)
n = tamanho mínimo da amostra
N = tamanho da população
Observação: Quando o “N” é muito grande, não é necessário considerar o tamanho exato de “N”
da população. Nesse caso, o cálculo da primeira aproximação (“n0”) já é suficiente para o cálculo.

 Cálculo de Amostragem Utilizando Desvio Padrão:

Amostragem – População Infinita

𝑍. 𝑠 2
n=( )
𝑒

Onde:
n = tamanho mínimo da amostra
Z = grau (nível) de confiança. Geralmente são usados os seguintes valores: 90% (1,65); 95% (1,96);
99% (2,58)
s = desvio padrão populacional da variável estudada
e = erro amostral tolerável, precisão. Principais valores utilizados: 1% (0,01); 3% (0,03); 5% (0,05)
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
17

 População Infinita: Para calcular o tamanho da amostra são tomados os seguintes parâmetros:
 Grau (nível) de confiança (Z);
 Estimativa preliminar da verdadeira proporção, isto é, a frequência que se espera
encontrar ou que se conhece (p);
 Margem de erro absoluta (e), isto é, o erro máximo absoluto aceitável (define a precisão).
A determinação do tamanho mínimo da amostra, necessária para a estimativa de uma proporção,
empregando intervalo de confiança com um determinado grau de confiança (Z) e para uma margem
de erro absoluto (e) ocorre utilizando-se a seguinte fórmula:

Amostragem – População Infinita

𝑍 2 .𝑝.𝑞
n=
𝑒2

Onde:
n = amostra (tamanho mínimo da amostra)
Z = grau (nível) de confiança. Principais valores utilizados: 90% (1,65); 95% (1,96); 99% (2,58)
p = estimativa preliminar da verdadeira proporção ou frequência esperada ou frequência conhecida
q = 100-p
e = margem de erro absoluto (máximo), precisão. Principais valores: 1% (0,01); 3% (0,03); 5% (0,05)

 População Finita: Para calcular o tamanho da amostra são tomados os seguintes parâmetros:
 Grau (nível) de confiança (Z);
 Estimativa preliminar da verdadeira proporção, isto é, a frequência que se espera
encontrar ou que se conhece (p);
 Tamanho conhecido da população (N) que será estudada (pesquisada);
 Margem de erro absoluta (e), isto é, o erro máximo absoluto aceitável (define a precisão).
A determinação do tamanho mínimo da amostra, necessária para a estimativa de uma proporção,
empregando intervalo de confiança com um determinado grau de confiança (Z); para uma margem de
erro absoluto (e) em uma população finita (N) ocorre utilizando-se a seguinte fórmula:

Amostragem – População Finita

𝑍 2 .𝑝.𝑞.𝑁
n=
𝑒 2 .(𝑁−1) + 𝑍 2 .𝑝.𝑞

Onde:
n = amostra (tamanho mínimo da amostra)
Z = grau (nível) de confiança. Principais valores utilizados: 90% (1,65); 95% (1,96); 99% (2,58)
p = estimativa preliminar da verdadeira proporção ou frequência esperada ou frequência conhecida
q = 100-p
N = número da população finita conhecida
e = margem de erro absoluto (máximo), precisão. Principais valores: 1% (0,01); 3% (0,03); 5% (0,05)

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
18

V. NOÇÕES BÁSICAS DE PROBABILIDADE


1. DEFINIÇÃO
A probabilidade é um estudo matemático que visa prever a chance de determinados acontecimentos
de fato acontecerem.
Em trabalhos científicos são usadas técnicas de amostragem e testes de hipóteses que possibilitam
generalizações de origem estatística. Estes testes são baseados em determinados níveis de
probabilidade.
Estatística é uma teoria sobre a incerteza, por isso se baseia inteiramente na Teoria da Probabilidade,
isto é, da ocorrência de um fenômeno.
Sendo assim, a Probabilidade Estatística pode ser definida como afirmações sobre a possibilidade
ou a probabilidade de ocorrência de um fenômeno, desde que satisfeitas um conjunto de condições
teóricas.
 Experimento Aleatório: São ocorrências que não podem ser previstas com certeza.
 Espaço Amostral: Representado pela letra grega ômega (Ω), é o conjunto de todos os
resultados possíveis de um experimento. Casos favoráveis mais casos contrários.
 Evento: É um conjunto de resultados, sendo um subconjunto do espaço amostral.

2. CÁLCULO DE PROBABILIDADE
Considerando um acontecimento “a” ou “A”, sendo “f” o número de casos favoráveis à sua realização
e “c” o número de casos contrários (f+c=Ω), a probabilidade “p” do acontecimento “a” ou “A” é
dada pela fórmula:

Probabilidade de Acontecer

𝑓 𝑛(𝐴)
𝑝(𝑎) = 𝑝(𝐴) =
𝑓+𝑐 𝑛(𝛺)

Já a probabilidade de não acontecer pode ser definida pela fórmula:

Probabilidade de Não Acontecer

𝑐 𝑛(𝑁𝐴)
𝑝(𝑛𝑎) = 𝑝(𝑁𝐴) =
𝑓+𝑐 𝑛(𝛺)

Sendo assim:
𝑓 𝑐 𝑓+𝑐
𝑝(𝑎) + 𝑝(𝑛𝑎) = + 𝑓+𝑐 = 𝑓+𝑐
𝑓+𝑐

Portanto, a soma das probabilidades de acontecer e de não acontecer será igual a 1.

Ao denominar p(a) = p; e p(na) = q, tem-se: 𝒑 +𝒒=1

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
19

Exemplo de Cálculo de Probabilidades:

Em um sorteio entre 20 participantes de uma pesquisa, cada um recebeu um número entre 1 e 20, sem
repetição. Sabendo que cada participante teve direito a um número, responda:
a) Quais e quantos elementos formam o espaço amostral de um provável sorteio?
b) Quais e quantos elementos que descrevem o evento: “o resultado é um número par maior que
4 e menor que 20”?
c) Quantos elementos do evento que resultam em um número primo?
d) Qual a probabilidade, ao sortear um número ao acaso, que o evento seja múltiplo de 6?

3. PROBABILIDADE EM EVENTOS INDEPENDENTES


Dois ou mais eventos são independentes quando a ocorrência de um dos eventos não influencia a
probabilidade da ocorrência dos outros.

Adição de Probabilidades Multiplicação de Probabilidades

P (A ∪ B) = P (A) + P (B) P (A ∩ B) = P (A) x P (B)

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
20

Exemplo de Adição de Probabilidades:

Em um viveiro com 112 aves, sendo 46 periquitos; 35; maritacas; 17 papagaios e 14 araras, ao se
capturar, ao acaso, uma ave deste viveiro, qual será a probabilidade de que seja uma arara ou um
periquito?

Exemplos de Multiplicação de Probabilidades:

Neste mesmo viveiro, qual a chance de se capturar um papagaio e uma maritaca ao mesmo tempo?

4. PROBABILIDADE CONDICIONAL (EVENTOS DEPENDENTES)


Quando para dois eventos (A e B), a probabilidade de B acontecer depende de que A também ocorra.

Probabilidade Condicional

P (A × B) = P (A) × P (B | A)

Exemplos de Probabilidade Condicional:

Em um aquário contendo água de um rio tem 36 peixes, sendo 22 tilápias e 14 tambaquis. Qual a
probabilidade de se retirar, deste aquário, duas vezes seguidas, um tambaqui?

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
21

VI. ESTATÍSTICA INFERENCIAL


1. TESTES DE HIPÓTESES
Testes de hipóteses ou testes estatísticos ou testes de significâncias são procedimentos estatísticos que
permitem tomar uma decisão (aceitar ou rejeitar a hipótese nula H0) entre duas ou mais hipóteses
(hipótese nula H0 ou hipótese alternativa Ha ou H1), utilizando os dados observados de um
determinado experimento.
Um resultado com probabilidade de ocorrência igual ou inferior a 5% é considerado como tendo
pouca chance de acontecer. Sendo assim, a partir de um único experimento pode-se chegar a uma
conclusão em relação a casualidade ou não dos desvios entre as proporções observadas e esperadas,
economizando tempo e trabalho em diversas repetições do experimento.
Os testes de hipóteses são utilizados para determinar quais resultados de um estudo científico podem
levar à rejeição da hipótese nula H0 a um nível de significância pré-estabelecido.
Se as hipóteses dos testes de hipóteses não forem assumidas de maneira correta, o resultado será
incorreto e a informação será incoerente com a questão do estudo científico. Os tipos conceituais de
erro (erro do tipo I e erro do tipo II) e os limites paramétricos ajudam a distinguir entre a hipótese
nula H0 e a hipótese alternativa Ha.

São importantes os seguintes conceitos para os testes de hipóteses:


 Hipótese alternativa Ha ou H1: Também conhecida como hipótese explicativa. É a possível
resposta para a pergunta principal da pesquisa. É considerada quando a hipótese nula não tem
evidência estatística. É a hipótese alternativa quando se rejeita a hipótese nula (H0).
 Hipótese nula H0: Hipótese nula nega o que está na hipótese alternativa (Ha). É a hipótese
assumida como verdadeira para a construção do teste. É a teoria, o efeito ou a alternativa que
se está interessado em testar. É a hipótese que se deseja testar.
 Erro do tipo I (α): É a probabilidade de se rejeitar a hipótese nula quando ela é verdadeira.
 Erro do tipo II (β): É a probabilidade de se rejeitar a hipótese alternativa quando ela é
verdadeira.

VERDADE
DECISÃO
TOMADA Hipótese nula H0 Hipótese nula H0
é verdadeira é falsa
Hipótese nula H0
é rejeitada
Erro do tipo I Não há erro
Hipótese nula H0
é aceita
Não há erro Erro do tipo II

 Decisão:
 Rejeitar Hipóteses nula (H0): Hipótese alternativa (Ha) é a possível resposta à pergunta
da pesquisa.
 Não Rejeitar (Aceitar) Hipótese nula (H0): Hipótese alternativa (Ha) NÃO responde
a pergunta da pesquisa.

 Nível de significância (α): É a probabilidade de rejeitar a hipótese nula (H0) quando ela é
verdadeira (erro do tipo I). Em testes de hipóteses estatísticas, diz que há significância estatística
ou que o resultado é estatisticamente significante quando o p-valor observado é menor que o
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
22

nível de significância (α) definido para o estudo. O nível de significância é geralmente


determinado pelo pesquisador antes da coleta dos dados e pode ser fixado em:
 Nível de significância de 95% (α=0,05).
 Nível de significância de 99% (α=0,01).

 p-valor: Os testes de hipóteses também podem ser calculados usando p-valor. O p-valor é
uma estatística muito usada para sintetizar o resultado de um teste de hipóteses, podendo ser
definido como a probabilidade de obter-se uma estatística de teste igual ou mais extrema que
a estatística observada a partir de uma amostra de uma população assumindo-se a hipótese
nula como verdadeira (H0). O p-valor também pode ser chamado de probabilidade de
significância. Geralmente utiliza-se os seguintes valores:
 p < 0,01
 p < 0,05.

Quanto menor o valor de p calculado, maior a chance do resultado ser verdadeiro.


Se o p-valor for menor que o nível de significância (α) determinado ou se a estatística de teste
observada estiver dentro da região crítica, então a hipótese nula é rejeitada e aceita-se a hipótese
alternativa.

Há diversos métodos para realizar os testes de hipóteses, os principais são:


 Teste de Student (teste t).
 Teste de Fisher (F).
 Teste do Qui-quadrado (χ2).
 Teste de Tukey.

Os testes de hipóteses podem ser classificados em paramétricos e não-paramétricos:


 Testes Paramétricos: Servem para efetuar comparações entre dois ou mais grupos (categorias),
usando como principal elemento para a decisão os parâmetros amostrais. Os testes paramétricos
devem ser utilizados em dados que apresentem uma distribuição considerada normal ou
aproximadamente normal. São mais comuns quando se utilizam variáveis contínuas. Os testes
mais conhecidos são: Teste t de Student; Teste de Fisher; Teste de Dunnett; Teste de Tukey;
Teste de Duncan.
 Testes Não-paramétricos: São também chamados de testes de distribuição livre. Não se
apoiam na hipótese de que as populações que estão sendo analisadas possuam distribuição
normal. A eficiência costuma ser menor, mas aplicam-se estes testes quando se mostra a
inviabilidade da aplicação do teste paramétrico. Os testes não-paramétricos são empregados em
distribuição de dados não-conhecida ou que apresente variação acentuada. Os testes mais
utilizados são: Teste do Qui-quadrado; Teste de Fisher; Teste de Kruskal-Wallis; Teste de
McNemar.

2. TESTE DE STUDENT
O teste de Student (teste t) é o método paramétrico mais usado para se avaliarem as diferenças entre
as médias de dois grupos. O teste t pode ser usado mesmo que as amostras sejam pequenas (n<30).
Comparar o valor de t na tabela, além de verificar valor de p (p < 0,01 ou p < 0,05).

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
23

Teste t

𝑋̅1 − 𝑋̅2
t= ̅𝟏 / 𝑿
𝑿 ̅ 𝟐 = médias das amostras
𝑠2 𝑠2 𝒔𝟏 / 𝒔𝟐𝟐 = desvios-padrão das amostras
𝟐

√ 1+ 2 𝒏𝟏 / 𝒏𝟐 = número de observações das amostras


𝑛1 𝑛2

3. TESTE DE FISHER
O teste de Fisher (F) é um teste tanto paramétrico quanto não-paramétrico de comparação de duas
variáveis que serve para determinar se populações distintas (A e B) possuem variabilidades
semelhantes (Homocedásticas) ou se as variabilidades podem ser consideradas diferentes
(Heterocedásticas).
Comparar o valor de F na tabela, além de verificar valor de p (p < 0,01 ou p < 0,05).

4. TESTE DO QUI-QUADRADO
O teste do Qui-quadrado (χ2) é um teste não-paramétrico que foi desenvolvido por Pearson e verifica
se a proporção de indivíduos com determinado atributo, em uma dada população, é estatisticamente
diferente de proporção de indivíduos com o mesmo atributo, em outra população. Sendo muito
utilizado em pesquisas nas áreas de ciências biológicas e médicas.
Verificar valor de p (p < 0,01 ou p < 0,05).

Teste t
∑(𝑓𝑜 − 𝑓𝑒 )2 𝒇𝒐 = frequência observada
χ =2
𝒇𝒆 = frequência esperada
𝑓𝑒
Para se calcular o valor do qui-quadrado é necessário calcular os Graus de Liberdade (GL), que
corresponde ao número de classes menos a unidade (GL = nº de classes – 1).
Também pode-se verificar a associação entre as características estudadas aplicando-se a tabela de
contingência com uso do teste do qui-quadrado.
Na tabela de contingência os GL é dado pela seguinte fórmula: GL = (L – 1) x (C – 1).
A tabela pode ser organizada de vários formatos: 2x2; 2x3; 4x4; 2x5; etc.

Discriminação Característica X Característica Y Total


Característica W a b a+b
Característica Z c d c+d
Total a+c b+d (a + b + c + d) = N

Onde: a; b; c; d são frequências observadas.


O valor esperado de cada célula é dado pelo produto do total marginal da linha pelo total marginal da
coluna, dividido pelo total geral.
Para a célula da Característica X com Característica W (célula A) o valor esperado seria:

(𝐚+𝐛).(𝐚+𝐜)
a=
𝑵

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
24

5. TESTE DE TUKEY
Também chamado de teste HSD (Honestly Significant Difference) é um teste paramétrico que foi proposto
por John Tukey.
Empregado para se determinarem as diferenças significantes entre as médias de todos os grupos
analisados no teste ANOVA, tomadas duas a duas.

Teste de Tukey

𝑠 q = valor tabelado para nível 5% ou 1% de probabilidade


dms = q s = desvio-padrão de todo o conjunto
√𝑟 r = número de repetições ou parcelas em cada tratamento

6. ANÁLISE DE VARIÂNCIA
O teste ANOVA (Analysis of Variance) ou análise de variância ou F-teste (homenagem a Fisher) serve
para a comparação de três ou mais médias populacionais. Portanto, pode ser considerada uma
extensão do teste t, para o caso de mais de dois grupos ou classificações.
Análise de variância é a técnica estatística que permite avaliar afirmações sobre as médias de
populações. A análise visa, fundamentalmente, verificar se existe uma diferença significativa entre as
médias e se os fatores exercem influência em alguma variável dependente.
Análise da Variância (ANOVA) é um método para testar a igualdade de três ou mais médias
populacionais, baseado na análise das variâncias amostrais. Os dados amostrais são separados em
grupos segundo uma característica (fator). O fator (ou tratamento) é uma característica que permite
distinguir diferentes populações umas das outras. Cada fator contém dois ou mais grupos
(classificações).

Principais tipos de ANOVA (F-teste) são:


 Teste paramétricos:
 ANOVA um critério: Compara somente as variações entre os tratamentos. As amostras
podem ser desiguais ou do mesmo tamanho. Utiliza-se teste de Tukey ou teste de
Dunnett. Comparar o valor de F na tabela, além de verificar valor de p (p < 0,01 ou p <
0,05).
 ANOVA dois critérios: Compara, além da variação entre os tratamentos, a variabilidade
entre os blocos. As amostras devem ter o mesmo tamanho e os escores mensurados a
nível intercalar ou de razões. Apresenta dois valores (tratamentos e blocos). Utiliza teste
t ou teste de Tukey. Comparar o valor de F na tabela, além de verificar valor de p (p <
0,01 ou p < 0,05).
 ANOVA fatorial a x b: Quando o estudo procura saber se há interações entre os
tratamentos e os blocos. Devem ser efetuadas repetições. Os resultados são apresentados
sob a forma de três F-testes: (a) dos tratamentos; (b) dos blocos; e (c) da interação entre
tratamentos e blocos, todos com respectivos valores de p (p < 0,01 ou p < 0,05).
 ANOVA fatorial a x b x c: Inclui a combinação de vários fatores ou conjuntos de
tratamentos com as respectivas interações, tratando os fatores a, b e c testados de modo
isolados e combinados. Comparar o valor de F na tabela, além de verificar valor de p (p
< 0,01 ou p < 0,05).

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
25

 Testes não-paramétricos:
 Teste de Friedman: Para dados mensurados a nível ordinal, abrangendo três ou mais
amostras equivalendo à ANOVA dois critérios. Os dados devem ter dupla disposição,
onde as linhas representam indivíduos e as colunas representam as condições
experimentais ou tratamentos. As amostras (tratamentos) devem ter o mesmo tamanho.
Observar valor de p (p < 0,01 ou p < 0,05).
 Teste de Kruskal-Wallis: Conhecido com teste H, destina-se a comparar três ou mais
amostras independentes do mesmo tamanho ou desiguais. É comparável à ANOVA um
critério. Observar valor de p (p < 0,01 ou p < 0,05).
 Teste de Cochran: Testa várias amostras relacionadas onde os mesmos indivíduos são
observados em três ou mais etapas. Os resultados apresentam-se dicotomizados: 1 (sim
ou sucesso) ou 0 (não ou insucesso). Aplicado para três ou mais conjuntos do mesmo
tamanho. Observar valor de p (p < 0,01 ou p < 0,05).

7. CORRELAÇÃO
Pode ser utilizado o Coeficiente de Correlação de Pearson (r) e o Coeficiente de Correlação de
Spearman (r2) para verificar o grau de dependência entre os valores encontrados nas amostras
analisadas. A análise de correlação proporciona um meio de se verificar o grau de associação entre
duas ou mais variáveis.
Em pesquisas que envolvem a consideração de duas ou mais variáveis, estas são estudadas
simultaneamente, procurando-se uma possível correlação entre as variáveis, objetivando-se saber se
as alterações sofridas por uma das variáveis são acompanhadas por alterações nas outras. No caso
particular de duas variáveis X e Y, procura-se verificar se os aumentos (ou diminuições) em X,
correspondem a aumentos (ou diminuições) em Y, ou se aumentos (ou diminuições) em X são
acompanhados de diminuições (ou aumentos) em Y ou, finalmente, se os aumentos (ou diminuições)
em X não estão relacionados com as alterações em Y.

 Importante:
 A variação dos valores de X (abscissa) explicam a variação dos valores de Y (ordenada).
 A variação dos valores de X predizem sobre a variação dos valores de Y.
 Os valores de Y dependem da variação dos valores de X.

Objetiva-se no estudo da correlação medir e avaliar o grau de relação entre duas variáveis aleatórias.
O instrumento de medida da correlação linear é dado pelo coeficiente de correlação de Pearson, sendo
que o campo de variação do coeficiente r situa-se entre -1 e +1, indicando assim, se a correlação é
negativa (r<0), positiva (r>0) ou se há ausência de correlação (r=0). É importante lembrar que
correlação não implica em causa e efeito. Se duas variáveis têm correlação positiva, isto significa apenas
que as variáveis crescem no mesmo sentido. No entanto, isso não implica a ideia de que o crescimento
de uma das variáveis determina o crescimento de outra. Da mesma forma, se duas variáveis têm
correlação negativa, isto significa apenas que as variáveis crescem em sentidos opostos, isto é, à medida
que X cresce, Y, em média, decresce. Isto não significa que os acréscimos em uma das variáveis sejam
determinados pelos decréscimos na outra. O coeficiente de correlação não necessariamente mede a
relação causa-efeito entre as variáveis, apesar de que essa relação possa estar presente. Em alguns
casos, a relação causa-efeito pode ser provocada por um fator oculto, isto é, uma variável não
considerada na análise, ou por um conjunto de fatores ocultos.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
26

Deve-se acentuar que o valor de r, calculado em qualquer caso, mede o grau de relação correspondente
ao tipo de equação que é realmente admitida. Assim, se for adotada uma equação linear, e se as
expressões conduzirem a um valor de r próximo de zero, isso significa que quase não há correlação
linear entre as variáveis. Entretanto, não significa que não há nenhuma correlação, porque pode
realmente existir uma forte correlação não-linear entre as variáveis. Em outras palavras, o coeficiente
de correlação mede a excelência do ajustamento aos dados da equação realmente considerada. A
menos que haja especificação em contrário, o termo coeficiente de correlação será usado para indicar
o de correlação linear.

Coeficiente Angular

∑ 𝑥.∑ 𝑦
∑ 𝑥𝑦 −
𝑟𝑥𝑦 = ( 𝑛
𝑛−1) . 𝑠𝑥 . 𝑠𝑦

Onde:
x = variável independente ou preditora ou explicativa
y = variável dependente ou resposta
s = desvio padrão

O coeficiente de correlação de Spearman (r2) é uma prova não-paramétrica com a finalidade de


determinar o grau de associação entre duas variáveis, pelo menos, em nível ordinal e dispostas em
postos ordenados em duas séries X e Y. O coeficiente de correlação de Spearman (r2) é calculado
elevando-se ao quadrado o valor de r encontrado. A correlação de determinação indica a porcentagem
de variação dos valores de Y em função do valor de X.

8. REGRESSÃO
Com o objetivo de se determinar a dependência entre duas variáveis para se predizer o valor de uma
variável dependente (Y) a partir de uma variável independente (X) utiliza-se os testes de regressão
linear simples e regressão logística simples.
No estudo de correlação procura-se verificar a magnitude e o sentido da associação que possa existir
entre duas variáveis, sem haver qualquer grau de dependência de uma em relação à outra. No teste de
regressão a finalidade é determinar a dependência de uma variável em relação à chamada variável
independente ou preditora. A regressão linear simples é muito utilizada em pesquisas, no qual procura-
se predizer o valor de uma variável dependente (Y) a partir de uma variável independente (X) ou
preditora, pressupondo que elas assumam modelo linear. Na regressão logística simples é testada uma
variável dependente de Y e uma variável independente, sendo a variável Y binária, ou seja, assume
valores 1 (positivo) e valores 0 (negativo).
A a regressão linear é um modelo matemático usado para descrever a relação entre duas variáveis com
o objetivo de utilizar uma delas para se prever o valor da outra. A análise de regressão é uma técnica
estatística que caracteriza a relação entre duas variáveis tomando uma dada variável que se quer prever
(variável resposta ou dependente) e observando a sua variação em função de uma ou mais variáveis
(variáveis explicativas ou independentes) com as quais se quer explicar o comportamento da primeira.
Na análise de regressão objetiva-se determinar a relação existente entre o atributo de interesse
dependente e o outro atributo independente, registrada concomitantemente. Sendo assim, na análise
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
27

de regressão é originada, essencialmente, uma equação, cujas variáveis são as variáveis dependente e
independente e cujos coeficientes refletem a intensidade da relação entre cada variável explicativa
isolada e a variável resposta. A relação entre estas variáveis é expressa por uma função matemática
onde a variável dependente Y é uma função da variável independente X.

 Cálculo da Regressão Linear:


É um dos modelos de regressão muito usado nas pesquisas nas áreas de ciências biológicas e
biomédicas, no qual procura-se conhecer o valor de uma variável dependente (Y) a partir de uma
variável independente (X) ou preditora, pressupondo que elas assumam modelo linear.
Esta análise é usada quando se quer estudar a relação entre duas variáveis contínuas. Se existe uma
relação de causa e efeito entre as variáveis “x” e “y”. A variável “x” é chamada de preditora ou
independente ou explicativa. A variável “y” é chamada de dependente ou resposta. Conhecendo-se os
valores de cada variável monta-se a função linear (y = ax ± b), encontrando os valores de “a”
(coeficiente angular) e os valores de “b” (intercepto). O coeficiente angular informa qual será a
inclinação da reta (\; negativa) ou (/; positiva) ou qual será o efeito direto da variável “x” sobre a
variável “y”. O valor do intercepto será o valor de “y” quando x = 0, isto é, o ponto onde a reta toca
o eixo “y”.

Função Linear

𝑦 = 𝑎𝑥 ± 𝑏
Onde:
y = variável dependente ou resposta
a = coeficiente angular da regressão
x = variável independente ou preditora ou explicativa
b = coeficiente de regressão da variável independente sobre a resposta, intercepto

Coeficiente Angular Intercepto


∑ 𝑥.∑ 𝑦
∑ 𝑥𝑦 −
𝑎= 𝑛
(∑ 𝑥)2 𝑏 = 𝑦̅ − 𝑎. 𝑥̅
2
∑𝑥 −
𝑛

Onde:
a = coeficiente angular da regressão
x = variável independente ou preditora ou explicativa
y = variável dependente ou resposta
n = número total da amostra
b = coeficiente de regressão da variável independente sobre a resposta, intercepto
̅ = média da variável dependente ou resposta
𝒚
̅ = média da variável independente ou preditora ou explicativa
𝒙

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
28

Demonstração da formulação da Função Linear:

x y xy x2
1 2 ........ ........
3 3 ........ ........
5 8 ........ ........
4 4 ........ ........
2 3 ........ ........
Σx = ....... Σy = ....... Σxy = ....... Σx2 = .......
̅ = .......
𝒙 ̅ = .......
𝒚 ----- -----

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
29

VII. ANÁLISES ECOLÓGICAS


1. RIQUEZA DE ESPÉCIE
Riqueza de Espécie (R) é o número total de espécies presentes ou amostradas em cada área ou unidade
geográfica definida. Terá maior riqueza de espécies aquela área ou parcela ou amostra com maior
número absoluto de espécies.
Dois diferentes tipos de índice de riqueza de espécies podem ser usados: Índice de Diversidade de
Margalef (DMg) e Índice de Menhinick (DMn). Estes índices procuram compensar os efeitos de
amostragem dividindo a riqueza, isto é, o número de espécies registradas (R) pelo número total de
indivíduos na amostra (N).

Índice de Margalef (DMg)

(𝑅−1)
DMg =
𝑙𝑛𝑁

Índice de Menhinick (DMn)

𝑅
DMn =
√𝑁

2. ABUNDÂNCIA RELATIVA
Abundância Relativa (AR) é a proporção do número de indivíduos de uma espécie (n) em uma amostra
ou parcela sobre o número total de indivíduos (N) daquela amostra ou parcela. O cálculo é feito para
cada espécie.

Abundância Relativa (AR)

𝑛
AR =
𝑁

3. DOMINÂNCIA
Para o cálculo de dominância de uma espécie utiliza-se o Índice de Berger-Parker (d), que expressa a
abundância proporcional da espécie mais abundante sobre o total de indivíduos, onde Nmáx é o
número de indivíduos da espécie mais abundante e N é o número total de indivíduos de toda amostra
ou parcela.

Índice de Berger-Parker (d)

𝑁𝑚á𝑥
d=
𝑁

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
30

4. DENSIDADE RELATIVA
Densidade Relativa (DR) é o número de indivíduos de uma espécie (n) em uma amostra ou parcela
sobre o número total de indivíduos (N) daquela amostra ou parcela multiplicada por 100. O cálculo é
feito para cada espécie.

Densidade Relativa (DR)

𝑛
DR = x 100
𝑁

5. FREQUÊNCIA OBSERVADA
Frequência Observada (FO%) indica a porcentagem (ou proporção) de ocorrência de uma espécie em
uma determinada área. Calcula-se dividindo o número de parcelas ou unidades amostrais (p) com a
ocorrência de determinada espécie pelo número total de parcelas ou unidades amostrais (P).

Frequência Observada (FO%)

𝑝
FO% = x 100
𝑃

6. CONSTÂNCIA
Constância (C%) calcula-se relacionando o número de coletas em que a espécie foi registrada em cada
área ou parcela estudada, isto é, número de vezes (excursões ou coletas) que a espécie foi encontrada
na área ou parcela (p) sobre o número total de coletas realizadas (P) vezes 100. Os táxons são
classificados de acordo com as seguintes categorias de constância: C% ≤ 25% acidental; 25% < C%
≤ 50% acessória e C% > 50% constante. O cálculo é feito para cada espécie.

Constância (C%)

𝑝
C% = x 100
𝑃

7. ÍNDICE DE DIVERSIDADE
O conceito de diversidade de espécie envolve o conhecimento da riqueza e da abundância das espécies
no local. Riqueza é o número total de espécies presentes em uma comunidade ou habitat ou área ou
parcela ou amostra. Diversidade é relativa ao número de espécies e suas abundâncias em uma
comunidade ou habitat ou área ou parcela ou amostra.

 Índice de Diversidade de Shannon-Wiener (H’): Assume que os indivíduos são amostrados


de forma aleatória de uma população infinitamente grande, assumindo também que todas as
espécies estão representadas na amostra. É um índice baseado na abundância proporcional das
espécies na comunidade. Somatório de abundância (densidade) relativa ou proporção (pi) vezes
o logaritmo neperiano de pi de cada espécie encontrada.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
31

Índice de Diversidade (H’) Abundância Encontrada (pi)

𝑛
H’ = − ∑ 𝑝𝑖 x ln 𝑝𝑖 pi = 𝑁

8. ÍNDICE DE SIMILARIDADE
Para quantificar a similaridade de comunidades ou áreas ou amostras ou parcelas, podem ser utilizados
os índices de similaridade (IS), entre os quais se destacam os coeficientes de similaridade de Jaccard
(SJ); de Sorensen (SS) e de Marczewski-Steinhaus (SMS). Estes índices comparam duas comunidades
ou áreas ou amostras ou parcelas.

 Coeficiente de Jaccard (SJ): Índice de Jaccard é qualitativo, portanto, não considera o número
de indivíduos presentes na amostra e sim a presença e a ausência deles.

Coeficiente de Jaccard (SJ)

𝑎
SJ =
𝑎+𝑏+𝑐

Onde:
a = o número de espécies encontradas em ambos os locais ou áreas ou parcelas A e B;
b = o número de espécies amostradas exclusivas no local B, mas não em A;
c = o número de espécies amostradas exclusivas no local A, mas não em B.

 Coeficiente de Sorensen (SS): Índice de Similaridade de Sorensen é similar ao de Jaccard, mas


dá peso maior às espécies comuns às duas áreas que estão sendo comparadas. Pode ser calculado
utilizando duas diferentes fórmulas.

Fórmula I:

Coeficiente de Sorensen (SS)

2𝑎
SS =
2𝑎+𝑏+𝑐

Onde:
a = o número de espécies encontradas em ambos os locais ou áreas ou parcelas A e B;
b = o número de espécies amostradas exclusivas no local B, mas não em A;
c = o número de espécies amostradas exclusivas no local A, mas não em B.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
32

Fórmula II:

Coeficiente de Sorensen (SS)

2𝑐
SS = x 100
𝐴+𝐵

Onde:
A = o número total de espécies na área A;
B = o número total de espécies na área B;
c = o número de espécies em comum nas duas áreas ou parcelas A e B.

 Coeficiente de Marczewski-Steinhaus (SMS): Índice de Marczewski-Steinhaus é qualitativo,


portanto, não considera o número de indivíduos presentes na amostra e sim a presença e a
ausência deles. É uma medida de complementaridade familiar ao Índice de Similaridade de
Jaccard (SJ).

Coeficiente de Marczewski-Steinhaus (SMS)

𝑎
SMS = 1 -
𝑎+𝑏+𝑐

Onde:
a = o número de espécies encontradas em ambos os locais ou áreas ou parcelas A e B;
b = o número de espécies amostradas exclusivas no local B, mas não em A;
c = o número de espécies amostradas exclusivas no local A, mas não em B.

9. MEDIDAS DE DIVERSIDADE
Se todas as espécies ocorressem em todos os habitats dentro de uma região, as diversidades local e
regional seriam iguais. Contudo, se cada habitat tivesse uma única flora; fauna e funga, a diversidade
regional seria igual à soma das diversidades locais de todos os habitats na região.
Os ecólogos se referem à diferença, ou substituição nas espécies de um habitat para o outro como
diversidade regional ou diversidade beta (β), isto é, envolve as diferenças na composição de espécies
e suas abundâncias entre habitats. Quanto maior a diferença nas espécies entre os habitats, maior esta
diversidade.
Já a diversidade local ou diversidade alfa (α) é o número de espécies numa pequena área de habitat
homogêneo, isto é, refere-se ao número e abundância de espécies dentro de um habitat.
A maneira mais simples de medir a diversidade β entre pares de locais é pelo uso dos coeficientes de
similaridade, os mais utilizados são o Índice de Jaccard (Sj) e o Índice de Sorensen (Ss).
Além dos coeficientes de similaridade, várias medidas de diversidade β são propostas para avaliar o
quanto a composição de espécies muda ao longo de um gradiente ou transecto, dentre as quais, temos
a medida de Whittakker (βW), obtida pela equação: βW = (S/α) – 1; onde S é o número total de espécies
registrado nas amostras de um habitat, e α é a riqueza de espécies média das amostras (habitas).

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
33

Diversidade βW de Whittakker

𝑆
βw = –1
𝛼

Onde:
S = o número total de espécies registrado nas amostras de um habitat;
α = a riqueza de espécies média das amostras (habitas) que estão sendo comparadas.

OBS.: Também é possível usar a medida de Whittakker para calcular a diversidade βW total entre os
habitats como um todo. Para isso, basta calcular a relação da riqueza total pela riqueza média.

Cálculo de diversidade βW total:

Diversidade βW Total de Whittakker

𝑆
βw =
𝛼

Onde:
S = o número total de espécies registrado em todos os habitats amostradas;
α = a riqueza média de espécies de todas as amostras (habitas) que estão sendo comparadas.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
34

EXEMPLO – ANÁLISES ECOLÓGICAS:

ÁREA 1 – FRAGMENTO FLORESTAL ÁREA 2 – BORDA FLORESTAL ÁREA 3 – PASTO


ESPÉCIES p FO%
n AR DR H' n AR DR H' n AR DR H'
Agaricus dulcidulus 10 0,10989 11,0 -0,2427 3 0,075 7,5 -0,1943 --- --- --- --- 2 66,67%
Clavulina amethystina 2 0,021978 2,2 -0,0839 --- --- --- --- --- --- --- --- 1 33,33%
Coriolopsis caperata 4 0,043956 4,4 -0,1373 5 0,125 12,5 -0,2599 --- --- --- --- 2 66,67%
Fucosporina gilva 6 0,065934 6,6 -0,1793 --- --- --- --- --- --- --- --- 1 33,33%
Gymnopus montagnei 26 0,285714 28,6 -0,3579 11 0,275 27,5 -0,3550 --- --- --- --- 2 66,67%
Lentinus crinitus 8 0,087912 8,8 -0,2138 6 0,15 15,0 -0,2846 4 0,363636 36,4 -0,3679 3 100,00%
Leucocoprinus birnbaumii --- --- --- --- 4 0,1 10,0 -0,2303 --- --- --- --- 1 33,33%
Marasmiellus volvatus 14 0,153846 15,4 -0,2880 --- --- --- --- --- --- --- --- 1 33,33%
Marasmius amazonicus 5 0,054945 5,5 -0,1594 --- --- --- --- --- --- --- --- 1 33,33%
Pycnoporus sanguineus 16 0,175824 17,6 -0,3056 9 0,225 22,5 -0,3356 6 0,545455 54,5 -0,3306 3 100,00%
Trametes cingulata --- --- --- --- 2 0,050 5,0 -0,1498 1 0,090909 9,1 -0,2180 2 66,67%
TOTAL 91 1 100 1,967899797 40 1 100 1,809456348 11 1 100 0,916464886 --- ---
Total de Espécies 11 --- --- --- 11 --- --- --- 11 --- --- --- --- ---
Riqueza de Espécies 9 --- --- --- 7 --- --- --- 3 --- --- --- --- ---
% Espécies 81,8% --- --- --- 63,6% --- --- --- 27,3% --- --- --- --- ---

Total de Espécies Identificadas: 11

Riqueza de Espécies Área 1: 9 (81,8%)


Riqueza de Espécies Área 2: 7 (63,6%)
Riqueza de Espécies Área 3: 3 (27,3%)

H’ Área 1: 1,97
Índice de Diversidade de Shannon-Wiener H’ Área 2: 1,81
H’ Área 3: 0,92

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
35

Cálculos para Índice de Diversidade:

Área 1 (Fragmento Florestal):


H’ = (0,11xln0,11)+(0,02xln0,02)+(0,04xln0,04)+(0,07xln0,07)+(0,29xln0,29)+(0,09xln0,09)+(0,15xln0,15)+(0,05xln0,05)+(0,18xln0,18)
H’ = (0,11x2,2073)+(0,02x3,9120)+(0,04x3,2189)+(0,07x2,6593)+(0,29x1,2379)+(0,09x2,4079)+(0,15x1,8971)+(0,05x2,9957)+(0,18x1,7148)
H’ = 0,242803 + 0,07824 + 0,128756 + 0,186151 + 0,358991 + 0,216711 + 0,284565 + 0,149785 + 0,308664
H’ = 1,954666

Área 2 (Borda Florestal):


H’ = (0,075xln0,075)+(0,125xln0,125)+(0,275xln0,275)+(0,15xln0,15)+(0,1xln0,1)+(0,225xln0,225)+(0,05xln0,05)
H’ = (0,075x2,5903)+(0,125x2,0794)+(0,275x1,2910)+(0,15x1,8971)+(0,1x2,3026)+(0,225x1,4917)+(0,05x2,9957)
H’ = 0,1942725 + 0,259925 + 0,355025 + 0,284565 + 0,23026 + 0,3356325 + 0,149785
H’ = 1,809465

Área 3 (Pasto):
H’ = (0,364xln0,364)+(0,545xln0,545)+(0,091xln0,091)
H’ = (0,364x1,0106)+(0,545x0,6070)+(0,091x2,3969)
H’ = 0,3678584 + 0,330815 + 0,2181179
H’ = 0,9167913

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
36

Cálculos para Índices de Similaridade:

Área 1  Fragmento Florestal


Área 2  Borda Florestal
Área 3  Pasto

Área 1 X Área 2:
Número de espécies em comum (a): 5
Número de espécies exclusivas da área 1 (b): 4
Número de espécies exclusivas da área 2 (c): 2

Coeficiente de Jaccard: Coeficiente de Sorensen:


SJ = a / (a + b + c) SS = 2a / (2a + b + c)
SJ = 5 / (5 + 4 + 2) SS = 2 x 5 / (2 x 5) + 4 + 2
SJ = 5 / 11 SS = 10 / 16
SJ = 0,45 SS = 0,625

Área 2 X Área 3:
Número de espécies em comum (a): 3
Número de espécies exclusivas da área 2 (b): 4
Número de espécies exclusivas da área 3 (c): 0

Coeficiente de Jaccard: Coeficiente de Sorensen:


SJ = a / (a + b + c) SS = 2a / (2a + b + c)
SJ = 3 / (3 + 4 + 0) SS = 2 x 3 / (2 x 3) + 4 + 0
SJ = 3 / 7 SS = 6 / 10
SJ = 0,43 SS = 0,60

Área 1 X Área 3:
Número de espécies em comum (a): 2
Número de espécies exclusivas da área 1 (b): 7
Número de espécies exclusivas da área 3 (c): 1

Coeficiente de Jaccard: Coeficiente de Sorensen:


SJ = a / (a + b + c) SS = 2a / (2a + b + c)
SJ = 2 / (2 + 7 + 1) SS = 2 x 2 / (2 x 2) + 7 + 1
SJ = 2 / 10 SS = 4 / 12
SJ = 0,20 SS = 0,33

Coeficiente Coeficiente
Similaridade
de Jaccard de Sorensen
Área 1 X Área 2 0,45 0,625
Área 2 X Área 3 0,43 0,60
Área 1 X Área 3 0,20 0,33

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
37

Cálculos para Índices de Similaridade:

Utilizando outra fórmula de Sorensen:

Área 1  Fragmento Florestal


Área 2  Borda Florestal
Área 3  Pasto

Área 1 X Área 2:
Número total de espécies da área 1 (A): 9
Número total de espécies da área 2 (B): 7
Número de espécies em comum (c): 5

SS = 2c / (A + B) x 100
SS = 2 x 5 / (9 + 7) x 100
SS = 10 / 16 x 100
SS = 0,625 x 100
SS = 62,5%

Área 2 X Área 3:
Número total de espécies da área 2 (A): 7
Número total de espécies da área 3 (B): 3
Número de espécies em comum (c): 3

SS = 2c / (A + B) x 100
SS = 2 x 3 / (7 + 3) x 100
SS = 6 / 10 x 100
SS = 0,6 x 100
SS = 60,0%

Área 1 X Área 3:
Número total de espécies da área 1 (A): 9
Número total de espécies da área 3 (B): 3
Número de espécies em comum (c): 2

SS = 2c / (A + B) x 100
SS = 2 x 2 / (9 + 3) x 100
SS = 4 / 12 x 100
SS = 0,33 x 100
SS = 33,3%

Coeficiente Coeficiente Coeficiente


Similaridade
de Jaccard de Sorensen de Sorensen
Área 1 X Área 2 0,45 0,625 62,5%
Área 2 X Área 3 0,43 0,60 60,0%
Área 1 X Área 3 0,20 0,33 33,3%

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
38

Cálculos para Medidas de Diversidade:

Utilizando fórmula de Whittakker (βW):


Área 1  Fragmento Florestal
Área 2  Borda Florestal
Área 3  Pasto

Área 1 X Área 2:
S = número total de espécies das duas áreas: 11
α = riqueza de espécies média das duas áreas: (9 da área 1) + (7 da área 2) / 2 = 16/2 = 8
βW = (S/α) – 1
βW = (11 / 8) – 1
βW = 1,375 – 1
βW = 0,375

Área 2 X Área 3:
S = número total de espécies das duas áreas: 7
α = riqueza de espécies média das duas áreas: (7 da área 2) + (3 da área 3) / 2 = 10/2 = 5
βW = (S/α) – 1
βW = (7 / 5) – 1
βW = 1,40 – 1
βW = 0,40

Área 1 X Área 3:
S = número total de espécies das duas áreas: 10
α = riqueza de espécies média das duas áreas: (9 da área 1) + (3 da área 3) / 2 = 12/2 = 6
βW = (S/α) – 1
βW = (10 / 6) – 1
βW = 1,667 – 1
βW = 0,667

Diversidade (βW) Fragmento Florestal Borda Florestal Pasto


Fragmento Florestal --- 0,375 0,667
Borda Florestal 0,375 --- 0,40
Pasto 0,667 0,40 ---

OU

Diversidade (βW) Borda Florestal Pasto


Fragmento Florestal 0,375 0,667
Pasto 0,40 ---

Cálculo de diversidade βW total:


S = riqueza total de espécies de todas as áreas (habitats): 11.
α = riqueza média de todas as áreas (habitats): (9 da área 1 + 7 da área 2 + 3 da área 3) = 19/3 = 6,33.
βW = (S/α)
βW = (11 / 6,33)
βW = 1,74

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
39

REFERÊNCIAS
ARANGO, H. G. Bioestatística: Teórica e Computacional. 2 ed. Rio de Janeiro: Guanabara Koogan. 2005.

AYRES, M.; AYRES, J. R. M.; AYRES, D. L.; SANTOS, A. A. S. BioEstat 5.3 – Aplicações Estatísticas
nas Áreas das Ciências Biomédicas. Belém: Instituto Mamirauá. 2007.

BEGON, M.; TOWNSEND, C. R.; HARPER, J. L. Ecologia. De Indivíduos a Ecossistemas. 4 ed. Porto
Alegre: Artmed. 2007.

BEIGUELMAN, B. Curso Prático de Bioestatística. 5 ed. Ribeirão Preto: FUNPEC. 2002.

BERQUÓ, E. S.; SOUZA, J. M. P.; GOTLIEB, S. L. D. Bioestatística. 2 ed. São Paulo: EPU. 1981.

BROWER, J. E.; ZAR, J. H.; VON ENDE, C. A. Field and Laboratory Methods for General Ecology. 4 ed.
Dubuque: C. Brown Publishers. 1998.

CENTENO, A. J. Curso de Estatística Aplicada à Biologia. 2 ed. Goiânia: UFG. 1999.

CRAWLEY, M. J. The R Book. 2 ed. Wiley. 2013.

DAJOZ, R. Ecologia Geral. 3 ed. Petrópolis: Vozes. 1978.

FONSECA, J. S.; MARTINS, G. A. Curso de Estatística. 6 ed. São Paulo: Atlas. 1996.

FONSECA, J. S.; MARTINS, G. A.; TOLEDO, G. L. Estatística Aplicada. 2 ed. São Paulo: Atlas. 1985.

GOTELLI, N. J.; AARON, M. E. Princípios de Estatística em Ecologia. Porto Alegre: Artmed. 2011.

LAPPONI, J. C. Estatística Usando Excel. São Paulo: Lapponi. 2000.

MAGURRAN, A. E. Medindo a Diversidade Biológica. Curitiba: Editora UFPR. 2013. 261 p.

MOTTA, V. T.; WAGNER, M. B. Bioestatística. Caxias do Sul: Educs. São Paulo: Robe Editorial. 2003.

MULLER-DOMBOIS, D. Ecological measurements and microbial populations. p. 173-184. In:


WICKLOW, D. T.; CARROL, G. C. (Eds.). The Fungal Community: Its Organization and Role in the
Ecosystem. New York: Marcel Derker. 1981.

NAZARETH, H. R. S. Curso Básico de Estatística. 10 ed. São Paulo: Ática. 1998.

ODUM, E. P. Ecologia. Rio de Janeiro: Guanabara Koogan. 1988.

ODUM, E. P. Fundamentos de Ecologia. 6 ed. Lisboa: Fundação Calouste Gulbenkian. 2001.

PADOVANI, C. R. Bioestatística. São Paulo: Cultura Acadêmica USP. 2012.


Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
40

PINTO-COELHO, R. M. Fundamentos em Ecologia. Porto Alegre: Artmed. 2000.

R PROJECT: The R Project for Statistical Computing. 2020. R Foundation for Statistical Computing.
Vienna, Austria. [online]. Disponível em: <https://www.r-project.org> Acessado em 11 de maio de
2020.

RICKLEFS, R. E. A Economia da Natureza. 5 ed. Rio de Janeiro: Guanabara Koogan. 2003.

RODRIGUES, P. C. Bioestatística. 3 ed. Niterói: EdUFF. 2002.

SPIEGEL, M. R. Estatística. 3. ed. São Paulo: Makron Books. 1993.

TOLEDO, G. L.; OVALLE, I. I. Estatística Básica. 2. ed. São Paulo: Atlas. 1994.

VIEIRA, S. Introdução à Bioestatística. 5 ed. Rio de Janeiro: Elsevier, 2016.

VIEIRA, S.; HOFFMAN, R.; WADA, R. Estatística: Introdução Ilustrada. 2 ed. São Paulo: Atlas. 1992.

VIEIRA, S.; HOFFMANN, R. Elementos de Estatística. 2. ed. São Paulo: Atlas. 1995.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
41

EXERCÍCIOS
ESTATÍSTICA DESCRITIVA

1. Um pesquisador coletou 3 amostras, cuja variável investigada era a pressão arterial sistólica:
a) Amostra A: 12 estudantes do sexo feminino.
b) Amostra B: 9 alunos do sexo masculino.
c) Amostra C: 10 docentes.
Fazer a estatística descritiva a partir dos dados da tabela abaixo:
Amostra A Amostra B Amostra C
110 117 121
115 120 125
116 121 119
109 113 129
110 116 125
117 117 126
116 115 127
118 119 128
118 120 122
119 125
115
114

2. Fazer a estatística descritiva a partir dos seguintes dados da turma:


a) Idade dos(as) estudantes em meses.
b) Número de irmãos(ãs).
c) Altura em metros (m).
d) Peso em quilogramas (kg).
e) Tipo sanguíneo (ABO e/ou Rh).

3. Em 200 equinos da raça Mangalarga, a média de hematócrito apresentou um valor igual a 36,8%.
O desvio padrão foi igual a 1/20 da média. Calcule a variância e o desvio padrão.

4. em uma granja, 400 aves da raça Cornish apresentaram peso médio do ovo igual a 60 g. O erro
padrão da média foi igual a 0,5 g. Calcule o coeficiente de variação e comente.

5. Calcule a média aritmética, mediana e desvio padrão dos dados abaixo, relativos à dosagem de
hemoglobina (mg) de 12 bovinos:
15 – 14 – 13 – 11 – 13 – 14 – 13,5 – 12 – 16 – 14,5 – 12 – 9

6. Calcule o desvio padrão e o coeficiente de variação referentes ao peso (kg) de ovinos abaixo:
37 – 35 – 38 – 36 – 35 – 40 – 42 – 44 – 41 – 30 – 37

7. A média e o desvio padrão dos pesos de 100 leitões, ao nascer, foram respectivamente de 9,0 kg e
0,5 kg. Calcule o erro padrão da média e o coeficiente de variação (comente).

8. Calcule o coeficiente de variação de uma amostra de 1.000 bovinos que apresentaram uma média
de fertilidade de 1,43 e variância de 0,25.

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
42

9. Calcule o erro padrão da média de uma amostra de 900 animais que apresentam uma média de peso
de 69 kg e coeficiente de variação de 17%.

10. A partir da tabela abaixo calcule o erro padrão da média e o coeficiente de variação dos dados
relativos ao peso de ovos de 150 aves e indique a melhor amostragem em razão dos coeficientes de
variação.
Amostra A Amostra B Amostra C
X1 = 58 g X2 = 59,5 g X3 = 62 g
s1 = 2,5 g s2 = 2,8 g s3 = 2,9 g
n1 = 50 n2 = 50 n3 = 50

11. Uma amostra de 225 indivíduos de taxa de glicose no sangue apresentou os seguintes dados: média
de 95 mg e erro padrão da média de 0,8 mg. Calcule a variância e o coeficiente de variação.

12. De acordo com a tabela abaixo calcule a média aritmética, o desvio padrão e a amplitude de classe:
X Frequência
20 |─ 24 10
24 |─ 28 17
28 |─ 32 25
32 |─ 36 22
36 |─ 40 15

13. Para a distribuição de frequências da tabela abaixo, relativa ao índice de soro-proteção de vacinas
oleosas, calcule a média aritmética; o desvio padrão e o coeficiente de variação:
Índice Frequência
1,35 2
1,43 3
1,49 3
1,54 4
1,62 5
1,90 4
2,05 3
2,18 2
2,30 2

14. A partir da distribuição de frequências abaixo, referente ao peso do animal, calcule a média, o
desvio padrão e o coeficiente de variação:
Peso (kg) Frequência
< 140 8
140 |─ 160 12
160 |─ 180 15
180 |─ 200 17
200 |─ 220 14
220 |─ 240 11
> 240 9

15. Em uma rodovia a distribuição de frequências do número de acidentes por dia, durante 70 dias,
está representado abaixo. Calcule a média aritmética e o desvio padrão:
Nº acidentes: 0 1 2 3 4 5
Nº de dias: 21 16 12 9 8 4

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
43

AMOSTRAGEM

16. Em um inquérito epidemiológico para determinar a prevalência da febre aftosa em bovinos em


um município, uma pré-amostra com 240 bovinos revelou que apenas 36 animais haviam contraído a
doença. Estime o número ideal de indivíduos para a amostra definitiva com 4% de precisão e 95% de
confiança.

17. Um pesquisador resolveu realizar um trabalho inédito para determinar a prevalência de uma doença
e deseja calcular o tamanho da amostra. Levando-se em conta que se trata de um trabalho pioneiro,
estipulou um nível de confiança de 95% e uma precisão de 5%. Estime o tamanho da amostra, sendo
que N=20.000 indivíduos.

18. Registrou-se em uma cidade uma prevalência de 25% de uma doença A em estudantes do ensino
fundamental. Para uma pesquisa similar em estudantes de uma outra cidade, com um nível de
confiança de 95% e precisão de 3%, determine o tamanho da amostra, sendo N=12.000.

19. Calcule o tamanho da amostra para estimar a prevalência de leptospirose em cães, sabendo que de
400 animais examinados, 50 foram considerados positivos. A precisão desejada é de 3% com nível de
confiança de 99% e o valor de N aproximado de 4.000.

ESTATÍSTICA INFERENCIAL

Teste t

20. Foi realizada a adubação de um terreno com Nitrogênio e Potássio e foram encontrados os
seguintes dados descritos na tabela abaixo. Analise os dados obtidos:
Nitrogênio Potássio
X1 = 25 kg X2 = 20 kg
s1 = 2,4 kg s2 = 1,9 kg
n1 = 21 n2 = 21

21. A partir dos dados da tabela abaixo, verifique se a diferença entre as médias de peso de aves
submetidas a dois tipos de ração foi significativa:
RAÇÃO
A B
X1 = 22 kg X2 = 17,5 kg
s1 = 2,4 kg s2 = 3,24 kg
n1 = 21 n2 = 21

22. Analise o ganho de peso de dois lotes de ratos submetidos a dietas diferentes, uma de alto nível
de proteína e outra com baixo nível de proteína:
Alto Nível Baixo Nível
X1 = 120 g X2 = 59,7 g
s1 = 19,5 g s2 = 15,5 kg
n1 = 12 n2 = 7

23. Foram apresentadas diferentes taxas médias de anticorpos no sangue de acordo com as vias de
administração de vacinas. Faça a análise dos dados encontrados:
Via de Administração
Intramuscular Subcutânea
X1 = 18 X2 = 15,5
s1 = 1,9 s2 = 1,6
n1 = 25 n2 = 37

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
44

24. Verifique a eficiência de duas drogas para dormir que foram ministradas a dois grupos de dez
pacientes e o resultado foi medido pelas horas adicionais de sono conforme a tabela abaixo:
DROGAS
A B
1,9 4,4 0,7 3,4
0,8 5,5 1,6 0,8
1,1 1,6 0,2 0,6
0,1 4,6 1,2 2,0
0,1 3,4 0,1 3,7

25. Analise o efeito alucinógeno de duas drogas testadas em dois grupos de ratos. Os dados obtidos
estão na tabela abaixo:
DROGAS
Anfetamina Mescalina
X1 = 8 X2 = 5,6
s1 = 0,8 s2 = 0,5
n1 = 15 n2 = 15

26. Uma pesquisa sobre comprimento de filarias em cães apresentou os resultados descritos na tabela
abaixo. Analise se há diferença significativa entre as espécies.
ESPÉCIES DE FILARIAS
Dipetalonema reconditum Dirofilaria immitis
X1 = 318,5 mm X2 = 269,45 mm
s1 = 16,5 mm s2 = 13,9 mm
n1 = 15 n2 = 12

27. Foram utilizados dois tipos de solução química (A e B) para a determinação de pH. As análises de
seis amostras de solução A indicaram o pH médio de 7,52 com desvio padrão 0,24. As seis amostras
usando a solução B apresentaram pH médio de 7,49 com desvio padrão 0,32. Usando um nível de
significância de 5%, calcule se a diferença ocorrida foi devida ao acaso.

28. Foram selecionados 10 trabalhadores para determinar a eficiência de um treinamento para a


realização de uma tarefa. Foram observados os seguintes resultados descritos na tabela abaixo. Os
dados apresentados têm relação ao tempo de execução, em minutos:
Tratamento
Trabalhadores
Antes Depois
1 7 8
2 8 8
3 10 7
4 11 6
5 18 10
6 16 9
7 12 9
8 12 8
9 6 7
10 12 10

Qui-quadrado

29. Uma moeda foi lançada 100 vezes e foram observadas 44 caras como resultado. Verifique a
significância estatística deste resultado.

30. Em um acasalamento entre indivíduos cujos pares de genes são AaBb, determinaram na segunda
geração (F2) os seguintes fenótipos e frequências descritos na tabela abaixo. Teste utilizando o qui-
quadrado e analise o resultado:

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
45

Fenótipos Frequência
AB 87
Ab 30
aB 35
ab 8

31. Verifique a eficiência de certa vacina a partir dos resultados encontrados na tabela abaixo:
Indivíduos Frequência
Sadios Vacinados 24
Sadios Não-Vacinados 17
Doentes Vacinados 10
Doentes Não-Vacinados 52

32. Analise a associação entre estado de nutrição e inteligência de acordo com os resultados descritos
na tabela abaixo:
Q.I.
Nutrição Total
Alto Médio Baixo
Satisfatória 245 228 177 650
Deficiente 31 27 13 71
Total 276 255 190 721

33. Em teste a mortalidade de animais submetidos à mesma droga em diferentes temperaturas


apresentou os resultados da tabela abaixo. Analise esses resultados:
Temperaturas Sobrevida Morte Total
Ambiente 323 37 360
Hipertermia 74 47 121
Total 397 84 481

34. Analise os resultados da tabela abaixo sobre um estudo em dois grupos de crianças em relação à
difteria:
Com Difteria Vacinados Não-Vacinados Total
Sim 15 140 155
Não 45 305 350
Total 60 445 505

35. Verifique o grau de associação entre três agentes terapêuticos em determinada doença em relação
aos resultados obtidos na tabela abaixo:
Agentes Doentes
Total
Terapêuticos Curados Não-Curados
A 22 38 60
B 36 26 62
C 44 34 78
Total 102 98 200

36. Em uma pesquisa utilizando 880 soros para pesquisa de toxoplasmose em relação ao local foram
obtidos os seguintes resultados da tabela abaixo. Analise os resultados:
Sorologia
Zonas Total
Positiva Negativa
Urbana 70 380 450
Rural 40 310 350
Total 110 690 800

37. Uma universidade implantou um novo sistema de avaliação. Foi realizada uma enquete sobre este
sistema com discentes de três diferentes faculdades. Verifique se há diferença significativa entre os
estudantes das três faculdades, a partir dos resultados descritos na tabela abaixo:

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
46

Discentes
Faculdades Total
Favor Contra
X 60 70 130
Y 70 50 120
Z 65 35 100
Total 195 155 350

Correlação

38. Em uma pesquisa foram realizadas as medidas dos comprimentos (cm) e larguras (cm) de dez
folhas tiradas ao acaso de uma árvore. A partir dos resultados registrados na tabela abaixo verifique se
há correlação entre as duas características:
Comprimento Largura
Folha
(X) (Y)
1 12 10
2 12 14
3 11 9
4 16 13
5 13 10
6 12 12
7 10 8
8 9 7
9 17 13
10 15 14

39. A tabela abaixo demonstra os resultados sobre o consumo individual diário de proteínas de origem
animal (em gramas) em relação ao coeficiente de natalidade, em 15 países. Verifique se há correlação
entre as características. Estime o valor do coeficiente de regressão e a equação de regressão linear:
Consumo Coeficiente
Países
Proteínas (g) Natalidade
1 4,7 45
2 7,6 39
3 8,7 33
4 9,8 28
5 10,2 26
6 13,5 24
7 14,1 20
8 16,0 22
9 17,0 17
10 14,4 19
11 18,0 14
12 18,2 15
13 18,8 11
14 20,0 9
15 23,0 13

40. Determine o coeficiente de correlação e de regressão a partir dos resultados abaixo na tabela que
expressam a variação do pulso e temperatura num grupo de indivíduos adultos:
Temperatura
Pulso
(°C)
60 36
70 37
80 38
90 39
100 40
110 41

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
47

41. Foi verificado a pressão sanguínea de dez homens de diferentes idades. Calcule o coeficiente de
correlação, de regressão e a equação de regressão linear a partir dos resultados da tabela abaixo:
Pressão
Idade
Sanguínea
(X)
(Y)
55 145
42 124
70 160
37 118
63 145
48 126
54 150
48 148
60 154
42 140

Teste F

42. Realizou-se um trabalho experimental com ovinos, visando verificar a ação de certos
medicamentos sobre a queda do cálcio na corrente sanguínea. Escolha o melhor teste de análise de
variância (teste F) a partir dos dados obtidos e descritos no quadro abaixo e interprete estatisticamente,
além de calcular a média e o desvio padrão de cada um dos tratamentos:

Medicamento A
Medicamento B Medicamento C
(testemunha)
3,2 2,5 2,4
2,7 2,2 3,0
2,9 2,1 2,0
2,5 2,7 2,3
3,0 2,0 2,1
3,7 1,9 2,3
2,3 2,4 2,0

43. Após testar cinco diferentes rações em suínos visando o ganho de peso, em um período de 40
dias, foram descritos os seguintes resultados (veja a tabela). Aplique o melhor teste para análise de
variância e forneça a média e desvio padrão de cada uma das rações.

Ração Ração Ração Ração Ração


A B C D E
17 19 26 24 18
19 23 19 20 22
22 24 18 22 24
24 22 20 19 25
20 25 22 23 23

44. Analise um experimento onde foi determinado o número médio de ovos por aves poedeiras
durante o período total de postura, em que estas aves foram submetidas a cinco tratamentos e
dispostas em quatro blocos, conforme os dados abaixo:

Tratamento Tratamento Tratamento Tratamento Tratamento


Blocos
A B C D E
I 202,5 220,3 210,7 230,4 200,0
II 200,4 215,4 205,6 225,6 294,1
III 180,9 219,6 200,4 215,7 180,5
IV 190,3 210,5 190,8 220,1 190,0

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
48

45. Em um tratamento de uma doença foram utilizadas quatro drogas em quatro diferentes clínicas e
o número de casos de recuperação dessa doença, por indivíduos que tomaram a droga, está descrito
na tabela abaixo. Analise estatisticamente o experimento e defina qual a melhor droga para tratamento.

Droga Droga Droga Droga


Grupos
I II III IV
A 10 11 12 10
B 19 9 18 7
C 11 8 23 5
D 14 7 15 6

Desafios

46. Em uma pesquisa onde foram analisados 95 hambúrgueres, sendo 40 hambúrgueres bovinos
(carne bovina) e 55 hambúrgueres mistos (carne bovina + carne de aves), foram encontrados os
seguintes resultados: 15 hambúrgueres bovinos contaminados por Salmonella e 35 hambúrgueres
mistos contaminados por Salmonella. Utilize um teste estatístico para confirmar se há diferença
significativa entre os tipos de hambúrgueres e o que isto significa em relação a pesquisa.

47. Os resultados dos diâmetros (mm) dos halos de inibição formados a partir do óleo essencial, em
diferentes concentrações, extraído de uma planta contra as bactérias Staphylococcus aureus e Escherichia
coli estão descritos na tabela abaixo.
a) Calcule a média e o desvio padrão do diâmetro dos halos de inibição de acordo com as
concentrações do óleo para cada bactéria.
b) Escolha uma análise estatística para confirmar se há diferença significativa entre os parâmetros
analisados.

Staphylococcus aureus Escherichia coli


Concentração do Diâmetro dos Halos de Diâmetro dos Halos de
Óleo Essencial Inibição (mm) – Triplicatas Inibição (mm) – Triplicatas
1 2 3 1 2 3
100% 18 17 18 13 12 12
50% 14 12 13 10 8 8
25% 10 9 11 0 0 0
12,5% 8 7 7 0 0 0

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
49

TABELAS ESTATÍSTICAS

Tabela t – Teste de Student

Graus de Liberdade 5% de probabilidade 1% de probabilidade


(G.L.) (α = 0,05) (α = 0,01)
1 12,71 63,66
2 4,30 9,92
3 3,18 5,84
4 2,78 4,60
5 2,57 4,03
6 2,45 3,71
7 2,36 3,50
8 2,31 3,36
9 2,26 3,25
10 2,23 3,17
11 2,20 3,11
12 2,18 3,06
13 2,16 3,01
14 2,14 2,98
15 2,13 2,95
16 2,12 2,92
17 2,11 2,90
18 2,10 2,88
19 2,09 2,86
20 2,09 2,84
25 2,06 2,79
30 2,04 2,75
50 2,01 2,68
100 1,98 2,63
500 1,96 2,59
∞ 1,96 2,58

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
50

Tabela de χ2 – Qui-Quadrado

Graus de Liberdade 5% de probabilidade 1% de probabilidade


(G.L.) (α = 0,05) (α = 0,01)
1 3,84 6,64
2 5,99 9,21
3 7,82 11,34
4 9,49 13,28
5 11,07 15,09
6 12,59 16,81
7 14,07 18,48
8 15,51 20,09
9 16,92 21,67
10 18,31 23,21
11 19,68 24,72
12 21,03 26,22
13 22,36 27,69
14 23,68 29,14
15 25,00 30,58
16 26,30 32,00
17 27,59 33,41
18 28,87 34,80
19 30,14 36,19
20 31,41 37,57
21 32,67 38,98
22 33,92 40,29
23 35,17 41,64
24 36,42 42,98
25 37,65 44,31
26 38,88 45,64
27 40,11 46,96
28 41,34 48,28
29 42,30 49,60
30 43,77 50,89

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
51

Tabela de r

Graus de Liberdade 5% de probabilidade 1% de probabilidade


(G.L.) (α = 0,05) (α = 0,01)
1 1,00 1,00
2 0,95 0,99
3 0,88 0,96
4 0,81 0,92
5 0,75 0,87
6 0,72 0,83
7 0,67 0,80
8 0,63 0,76
9 0,60 0,73
10 0,58 0,71
11 0,55 0,68
12 0,53 0,66
13 0,51 0,64
14 0,50 0,62
15 0,48 0,61
16 0,47 0,59
17 0,46 0,57
18 0,44 0,56
19 0,43 0,55
20 0,42 0,54
25 0,38 0,49
30 0,35 0,45
40 0,30 0,39
50 0,27 0,35
70 0,23 0,30
100 0,19 0,25
150 0,16 0,21
200 0,14 0,18
400 0,10 0,13
1.000 0,06 0,08

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
52

Limites Unilaterais de F
Nível de 5% de Probabilidade
n1 = G.L. de tratamentos n2 = G.L. de resíduo

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
53

Limites Unilaterais de F
Nível de 1% de Probabilidade
n1 = G.L. de tratamentos n2 = G.L. de resíduo

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
54

Tabela do Teste de Tukey


Nível de 5% de Probabilidade
n = número de tratamentos n’ = número de G.L. do resíduo

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
55

Tabela do Teste de Tukey


Nível de 1% de Probabilidade
n = número de tratamentos n’ = número de G.L. do resíduo

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
56

Tabela do Teste de Duncan


Nível de 5% de Probabilidade
n = número de médias abrangidas pelo contraste n’ = número de G.L. do resíduo

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
57

Tabela do Teste de Duncan


Nível de 1% de Probabilidade
n = número de médias abrangidas pelo contraste n’ = número de G.L. do resíduo

Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna

View publication stats

Você também pode gostar