Escolar Documentos
Profissional Documentos
Cultura Documentos
net/publication/349179823
CITATIONS READS
0 474
1 author:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Jorge "Magoo" Fortuna on 03 March 2021.
NOÇÕES BÁSICAS DE
BIOESTATÍSTICA
E ANÁLISES ECOLÓGICAS
PROF. DR. JORGE LUIZ FORTUNA
Professor Adjunto da área de Microbiologia do curso de Ciências Biológicas da
Universidade do Estado da Bahia (UNEB), Campus X, Teixeira de Freitas-BA
jfortuna@uneb.br
Teixeira de Freitas-BA
2021
Para citar esta apostila:
I. MÉTODO, p. 4
1. DEFINIÇÃO, p. 4
2. PRINCIPAIS TIPOS DE MÉTODOS, p. 4
II. ESTATÍSTICA, p. 6
1. DEFINIÇÃO, p. 6
2. PRINCIPAIS CONCEITOS, p. 6
IV. AMOSTRAGEM, p. 14
1. DEFINIÇÃO, p. 14
2. TIPOS DE AMOSTRAS, p. 14
3. AMOSTRA PROBABILÍSTICA OU ALEATÓRIA OU CASUAL, p. 14
4. AMOSTRA SEMI-PROBABILÍSTICA, p. 14
5. AMOSTRA NÃO-PROBABILÍSTICA OU DE CONVENIÊNCIA, p. 15
6. CÁLCULO DA AMOSTRAGEM, p. 16
REFERÊNCIAS, p. 39
EXERCÍCIOS, p. 41
TABELAS ESTATÍSTICAS, p. 49
4
I. MÉTODO
1. DEFINIÇÃO
A palavra “método” apresenta duas origens, grega e latina.
Na origem grega “methodos” (“meta” + “hodos” ou “odou”), onde o prefixo “meta” tem dois
significados: “depois” e “com” ou um sentido de mudança, sucessão, posterioridade, “ir além” ou
“movimento de um lugar para outro” e o sufixo “hodos” ou “odou” significa caminho. Assim, o significado
mais correto para a palavra método de origem grega seria “com caminho”.
Já na origem latina, a palavra “methodus” indica um caminho para chegar a um fim, ou mesmo a um
determinado resultado.
O método é o conjunto das atividades sistemáticas e racionais que, com maior segurança e economia,
permite alcançar o objetivo (conhecimentos válidos e verdadeiros) traçando o caminho a ser seguido,
detectando erros e auxiliando as decisões do cientista.
Também pode ser definido por um conjunto de etapas, que quando executadas de forma sistemática,
facilitam a obtenção de conhecimentos sobre fenômenos físicos, químicos e biológicos, ou o
desenvolvimento de novos produtos ou processos.
Destacam-se as principais etapas:
Criação de um Problema: questionamentos; indagações; curiosidades.
Indicação de uma Hipótese: possível resposta ao problema.
Experimentação: testes para chegar a uma resposta.
Coleta de Dados: busca de dados que confirmem ou não a hipótese.
Análise da Resposta: verificação da viabilidade da hipótese encontrada.
Conclusão: aceitação ou refutação da hipótese.
Método Dedutivo:
Ao contrário do anterior, parte da generalização e quer confirmá-la na particularidade.
A dedução é um método proposto por autores clássicos como Descartes, Spinoza e
Leibniz. Sua utilização é maior em campos como a Física e a Matemática.
O protótipo do raciocínio dedutivo é o silogismo, que consiste numa construção lógica
que, a partir de duas preposições chamadas premissas, retira uma terceira, nelas
logicamente implicadas, denominada conclusão.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
5
Método Indutivo-Dedutivo:
Combina os dois anteriores. Parte da observação para a indução faz a dedução e volta à
observação.
Aristóteles foi quem propôs esse método.
Stuart Mill fala dos três passos que o constituem: a indução, a dedução (raciocínio) e a
experimentação.
Outro autor que consagrou esse método foi Isaac Newton chamando-o de “análise e
síntese”. A análise para Newton é o momento de observações e experimentações. Já a
síntese é o momento de fazer as conclusões gerais, as descobertas, as causas, as exceções
e os princípios, a partir da indução, que explicam os fenômenos.
Método Hipotético-Dedutivo:
Nasceu da percepção de que não é necessário sempre se partir dos fenômenos, da
observação deles e, então, por indução, produzir uma hipótese. É possível que já exista a
hipótese, nascida da imaginação, do senso comum ou da intuição.
A partir da hipótese, o pesquisador, por dedução, deve verificar se ela realmente se
confirma ou não.
O esquema é o seguinte: hipótese – dedução – fenômenos.
Há um problema, proposto como hipótese, formula-se uma solução dedutiva e se realiza
experimentos, testes, análises para refutar ou confirmar a hipótese.
Em linhas gerais, no método hipotético-dedutivo há os seguintes elementos:
Observação e enunciado de um PROBLEMA que questione e que não foi
compreendido e/ou explicado satisfatoriamente;
Formulação de uma HIPÓTESE, a partir da observação ou da intuição do
pesquisador a ser avaliada, analisada, interpretada, testada, refutada, como solução
ao problema observado e/ou enunciado;
Testes, EXPERIMENTOS, análises, interpretações e argumentações, controladas
por pessoas que se dedicam àquela área da ciência, que buscam responder à hipótese
formulada;
CONCLUSÃO sobre os testes, experimentações, análises e interpretações,
confirmando, refutando ou corrigindo a hipótese testada ou analisada.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
6
II. ESTATÍSTICA
1. DEFINIÇÃO
Ciência que envolve coleta, organização, resumo, tratamento, análise e interpretação de dados.
Pode ser classificada em dois tipos: Estatística Descritiva e Estatística Inferencial (Analítica).
Estatística Descritiva: Objetivo de descrever dados. Compreende a obtenção, organização e
representação dos dados. Abrange o conjunto de técnicas para organizar, resumir, classificar,
descrever e comunicar dados em tabelas, gráficos ou em outros recursos visuais, além do cálculo
de estimativas de parâmetros representativos desses dados.
Estatística Inferencial (Analítica ou Experimental): Objetivo de analisar e interpretar os
dados. É o processo de obter informações sobre uma população a partir de resultados
observados na amostra. Inclui as técnicas por meio das quais são tiradas concussões sobre uma
população, baseadas em dados obtidos em amostras. Trabalha com dados de forma a estabelecer
hipóteses em função desses dados, procede a sua comprovação e, posteriormente, elabora
conclusões científicas.
2. PRINCIPAIS CONCEITOS
População: Conjunto de elementos portadores de pelo menos uma característica comum de
interesse para ser estudado. População é considerado o UNIVERSO ESTATÍSTICO.
População Finita: Possui número limitado de elementos, que é passível de contagem.
População Infinita: Possui número ilimitado de elementos, que é impossível de contar.
Censo: Conjunto de dados estatísticos de todos os elementos da população.
Amostra: É um subconjunto qualquer da população, selecionada para representá-la. É a parte
da população que será analisada.
Amostragem: É o processo de retirada de informações dos "n" elementos amostrais, no qual
deve seguir um método criterioso e adequado (tipos de amostragem).
Variável: É uma característica qualquer de interesse que é associado à população ou à amostra
para ser estudada estatisticamente. Existem as variáveis numéricas ou quantitativas (contáveis)
e as variáveis não-numéricas ou qualitativas (categóricas ou classificáveis).
Parâmetro: Valor de uma característica da população.
Estimador: Valor de uma característica da amostra.
Rol: Lista dos dados numéricos da amostra ou da população analisada. É a tabela obtida após a
ordenação dos dados.
Tratamento: É o método ou elemento ou material cujo efeito deseja medir ou comparar em
um experimento.
Unidade Experimental: Unidade que vai receber (aplicar) o tratamento e fornecer os dados
que vão refletir os seus efeitos.
Delineamento Experimental: É o plano utilizado na experimentação e implica na forma como
os tratamentos serão designados às unidades experimentais. Objetivo de controlar efeitos não
delineáveis. Deve ser feito antes de coletar os dados.
Repetições: Número de observações de um experimento, tornando suas conclusões (respostas)
mais confiáveis. Repetições diminuem os efeitos do acaso.
Casualização: Importante para que cada tratamento tenha a mesma probabilidade (chance).
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
7
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
8
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
9
Mediana (Me): Medida de posição central. A mediana é o valor que ocupa a posição
central (meio) da distribuição. Usada quando a distribuição apresenta resultados extremos
muito discrepantes, pois a mediana não sofre a influência de valores extremos. Para
cálculo da mediana deve-se:
Ordenar todas as variáveis (valores ou medidas);
Determinar o número total das variáveis (n);
Localizar o valor central.
Moda (Mo): Valor dominante de uma distribuição. Aquele que numa série de valores se
apresenta com a maior frequência. Um conjunto de valores pode apresentar mais de
uma moda (plurimodal). O uso da moda é mais indicado quando se deseja obter,
rapidamente, uma medida de tendência central. A valor da moda não é afetado pelos
valores extremos do conjunto de dados analisado.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
10
Desvio Médio (DM): Média aritmética dos afastamentos (ou desvios), tomados em valor
absoluto, entre cada valor e a média aritmética. Indica o quanto, em média, os valores se
afastam do ponto central (média).
Desvio Médio
𝒙𝒊 = variáveis (valores ou medidas)
∑ |(𝑥𝑖 − 𝑋̅)| ̅ = média aritmética
𝐷𝑀 = 𝑿
𝑛 n = quantidade total de variáveis
Soma das variáveis (valores ou medidas) menos a média
aritmética, em módulo, dividido pelo total das variáveis.
2 2
2 (∑ 𝑥𝑖 ) 2 (∑ 𝑥𝑖 )
s= √∑ 𝑥𝑖 − 𝑛
s= √∑ 𝑥𝑖 − 𝑛
𝑛 𝑛−1
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
11
∑ 𝑓𝑖 𝑥 2 ∑ 𝑓𝑖 𝑋̅𝑐 2
2
∑ 𝑓𝑖 𝑥 2 ∑ 𝑓𝑖 𝑋̅𝑐
s=√ −( ) s=√ −( )
𝑛 𝑛 𝑛 𝑛
Variância ou Quadrado Médio (s2): Considerando-se uma amostra de dados, cada dado
isolado pode ter um desvio (dispersão) em relação à média da amostra. Mede a dispersão
dos dados de observações de uma amostra em relação à respectiva média. Essa dispersão
é a diferença entre o valor individual e a média da amostra de dados. Para se avaliar o grau
de dispersão de toda a amostra de dados utiliza-se a variância que é a soma dos quadrados
dos desvios dividido pelo tamanho da amostra, menos 1. Seu valor corresponde ao desvio
padrão elevado ao quadrado.
2 2
(∑ 𝑥𝑖 ) (∑ 𝑥𝑖 )
∑ 𝑥𝑖2 − ∑ 𝑥𝑖2 −
s2 = 𝑛
s2 = 𝑛
𝑛 𝑛−1
Coeficiente de Variação
𝑠 s = desvio padrão
CV = .100 ̅ = média aritmética
𝑿
𝑋̅
Variância Relativa
𝑠2 s2 = variância
VR =
(𝑋̅)2
.100 𝑿̅ = média aritmética
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
12
4. DISTRIBUIÇÃO DE FREQUÊNCIAS
Para se trabalhar com grandes conjuntos de dados é necessário inicialmente agrupar estes dados. O
agrupamento é feito em tabelas, denominadas de distribuições de frequências.
Para construir uma distribuição de frequências é comum fazer a distinção entre dois tipos de variáveis:
1. Variável Discreta (valores resultados de contagem, geralmente com repetições);
2. Variável Contínua (valores resultados de uma medida, geralmente com poucas repetições).
Em geral variáveis discretas são agrupadas em distribuições por ponto ou valores e variáveis contínuas
em distribuições por classes ou intervalos.
Distribuição por Pontos ou Valores: Representação é feita em uma distribuição de
frequências por pontos ou valores. Os valores são colocados em uma tabela em que a coluna da
esquerda é representada pelos diferentes números ordenados (pontos ou valores) e a coluna da
direita pelo número de vezes que cada valor se repetiu (frequências simples ou absolutas).
Distribuição por Classes ou Intervalos: Neste caso é necessário construir uma tabela
denominada de “distribuição de frequências por classes ou intervalos”.
Apresentação (Representação) dos Dados: Os dados de um rol podem e devem ser
organizados em diversas tabelas e gráficos.
Cálculo de Número de Classes: O procedimento para construir esta distribuição envolve os
seguintes passos (algoritmo):
Determinar a amplitude dos dados: AT = xmáx – xmín.
Decidir sobre o número de classes “k“ a ser utilizado. Recomenda-se um número de
classes entre 5 e 15. Para que a decisão não seja totalmente arbitrária pode-se usar a raiz
quadrada do número de valores como o número de classes, ou seja, k ≅ √𝒏.
Determinar a amplitude de cada classe (h). Sempre que possível manter todas as
amplitudes iguais. Para tanto deve-se dividir a amplitude dos dados “AT” pelo número
de classes “k”, arredondando para mais, ou seja, h ≅ AT / k.
Contar o número de valores pertencentes a cada classe. Em geral, utiliza-se a simbologia
│── para indicar um intervalo fechado à esquerda e aberto à direita. Também poderia ser
utilizado o intervalo aberto à esquerda e fechado à direita ──│; aberto de ambos os lados
── ou ainda fechado de ambos os lados │──│.
Frequência Simples ou Absoluta (fi): É o número de vezes que um dado aparece no rol. Os
dados devem ser organizados em categorias.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
13
Frequência Relativa ou Percentual (fri%): É o número de cada variável dividido pelo número
total de observação. É a frequência absoluta de cada variável dividida pelo somatório das
frequências absolutas em porcentagem.
Frequência Acumulada Simples ou Absoluta (Σfi): É definida como sendo a soma das
frequências simples ou absolutas até a linha “i”.
∑ 𝑓𝑖 = f1 + f2 + f3 + ... + fi
Frequência Acumulada Relativa ou Percentual (Σfri%): É definida como sendo a soma das
frequências relativas ou percentuais até a linha “i”.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
14
IV. AMOSTRAGEM
1. DEFINIÇÃO
Amostra diz respeito a um subconjunto da população, fracção ou uma parte do grupo.
A amostra deve ser representativa da população, isto é, deve conter todas as características, já que por
meio dessa amostra serão tiradas as conclusões para toda a população.
As principais razões para se trabalhar com amostras e não com toda a população são:
Custo e demora dos censos.
Populações muito grandes.
Impossibilidade física de examinar toda a população.
Comprovado valor científico das informações coletadas por meio de amostras
2. TIPOS DE AMOSTRAS
Antes de obter uma amostra, é preciso definir os critérios que serão usados para selecionar as unidades
que comporão essa amostra. De acordo com a técnica usada, tem-se um tipo de amostra, que podem
ser:
Amostragem aleatória, ou casual, ou probabilística.
Amostragem semi-probabilística (alguns autores ainda a consideram probabilística).
Amostragem não-probabilística ou de conveniência.
A amostragem será probabilística se todos os elementos da população tiverem probabilidade
conhecida, e diferente de zero, de pertencer à amostra. Caso contrário, a amostragem será não-
probabilística.
4. AMOSTRA SEMI-PROBABILÍSTICA
A amostra semi-probabilística é constituída por “n” unidades retiradas da população por
procedimento parcialmente aleatório.
As amostras semi-probabilísticas podem ser do tipo Sistemática ou Por Conglomerados (“Cluster”) ou
Por Quotas (Cotas ou Por Áreas).
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
15
Sistemática: É constituída por “n” unidades retiradas da população segundo um sistema pré-
estabelecido. Os elementos da população apresentam-se ordenados e são retirados
periodicamente (de cada “k” elementos, um é escolhido).
Amostragem Sistemática
𝑁 k = intervalo de amostragem
k= N = número total da população
𝑛 n = número de indivíduos da amostra
Casos Críticos: Casos importantes por alguma razão. Amostragem que se concentra em
casos específicos que geralmente são dramáticos ou muito importantes.
Não-Intencional ou Acidental ou De Conveniência: Entrevistam-se indivíduos que se tem
acesso imediato e direto. Os elementos da amostra são escolhidos por serem os mais acessíveis
ou fáceis de serem avaliados. As amostras obtidas desta forma não são representativas da
população e em geral são enviesadas.
6. CÁLCULO DA AMOSTRAGEM
Fatores que Determinam o Tamanho da Amostra:
Nível de Confiança (Z): Quanto maior o nível de confiança, maior o tamanho da
amostra.
Erro Máximo Permitido (e): Quanto menor o erro permitido, maior o tamanho da
amostra.
Variabilidade: Quanto maior a variabilidade do fenômeno que está sendo investigado,
maior o tamanho da amostra.
Cálculo Geral de Amostragem: De maneira geral, e mais simples, é possível calcular o
tamanho da amostra através da utilização de duas fórmulas.
Cálculo de Amostragem
1 𝑁.𝑛0
𝑛0 = 𝑛=
𝑒2 𝑁+𝑛0
Onde:
n0 = primeira aproximação do tamanho da amostra
e = erro amostral tolerável, precisão. Principais valores utilizados: 1% (0,01); 3% (0,03); 5% (0,05)
n = tamanho mínimo da amostra
N = tamanho da população
Observação: Quando o “N” é muito grande, não é necessário considerar o tamanho exato de “N”
da população. Nesse caso, o cálculo da primeira aproximação (“n0”) já é suficiente para o cálculo.
𝑍. 𝑠 2
n=( )
𝑒
Onde:
n = tamanho mínimo da amostra
Z = grau (nível) de confiança. Geralmente são usados os seguintes valores: 90% (1,65); 95% (1,96);
99% (2,58)
s = desvio padrão populacional da variável estudada
e = erro amostral tolerável, precisão. Principais valores utilizados: 1% (0,01); 3% (0,03); 5% (0,05)
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
17
População Infinita: Para calcular o tamanho da amostra são tomados os seguintes parâmetros:
Grau (nível) de confiança (Z);
Estimativa preliminar da verdadeira proporção, isto é, a frequência que se espera
encontrar ou que se conhece (p);
Margem de erro absoluta (e), isto é, o erro máximo absoluto aceitável (define a precisão).
A determinação do tamanho mínimo da amostra, necessária para a estimativa de uma proporção,
empregando intervalo de confiança com um determinado grau de confiança (Z) e para uma margem
de erro absoluto (e) ocorre utilizando-se a seguinte fórmula:
𝑍 2 .𝑝.𝑞
n=
𝑒2
Onde:
n = amostra (tamanho mínimo da amostra)
Z = grau (nível) de confiança. Principais valores utilizados: 90% (1,65); 95% (1,96); 99% (2,58)
p = estimativa preliminar da verdadeira proporção ou frequência esperada ou frequência conhecida
q = 100-p
e = margem de erro absoluto (máximo), precisão. Principais valores: 1% (0,01); 3% (0,03); 5% (0,05)
População Finita: Para calcular o tamanho da amostra são tomados os seguintes parâmetros:
Grau (nível) de confiança (Z);
Estimativa preliminar da verdadeira proporção, isto é, a frequência que se espera
encontrar ou que se conhece (p);
Tamanho conhecido da população (N) que será estudada (pesquisada);
Margem de erro absoluta (e), isto é, o erro máximo absoluto aceitável (define a precisão).
A determinação do tamanho mínimo da amostra, necessária para a estimativa de uma proporção,
empregando intervalo de confiança com um determinado grau de confiança (Z); para uma margem de
erro absoluto (e) em uma população finita (N) ocorre utilizando-se a seguinte fórmula:
𝑍 2 .𝑝.𝑞.𝑁
n=
𝑒 2 .(𝑁−1) + 𝑍 2 .𝑝.𝑞
Onde:
n = amostra (tamanho mínimo da amostra)
Z = grau (nível) de confiança. Principais valores utilizados: 90% (1,65); 95% (1,96); 99% (2,58)
p = estimativa preliminar da verdadeira proporção ou frequência esperada ou frequência conhecida
q = 100-p
N = número da população finita conhecida
e = margem de erro absoluto (máximo), precisão. Principais valores: 1% (0,01); 3% (0,03); 5% (0,05)
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
18
2. CÁLCULO DE PROBABILIDADE
Considerando um acontecimento “a” ou “A”, sendo “f” o número de casos favoráveis à sua realização
e “c” o número de casos contrários (f+c=Ω), a probabilidade “p” do acontecimento “a” ou “A” é
dada pela fórmula:
Probabilidade de Acontecer
𝑓 𝑛(𝐴)
𝑝(𝑎) = 𝑝(𝐴) =
𝑓+𝑐 𝑛(𝛺)
𝑐 𝑛(𝑁𝐴)
𝑝(𝑛𝑎) = 𝑝(𝑁𝐴) =
𝑓+𝑐 𝑛(𝛺)
Sendo assim:
𝑓 𝑐 𝑓+𝑐
𝑝(𝑎) + 𝑝(𝑛𝑎) = + 𝑓+𝑐 = 𝑓+𝑐
𝑓+𝑐
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
19
Em um sorteio entre 20 participantes de uma pesquisa, cada um recebeu um número entre 1 e 20, sem
repetição. Sabendo que cada participante teve direito a um número, responda:
a) Quais e quantos elementos formam o espaço amostral de um provável sorteio?
b) Quais e quantos elementos que descrevem o evento: “o resultado é um número par maior que
4 e menor que 20”?
c) Quantos elementos do evento que resultam em um número primo?
d) Qual a probabilidade, ao sortear um número ao acaso, que o evento seja múltiplo de 6?
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
20
Em um viveiro com 112 aves, sendo 46 periquitos; 35; maritacas; 17 papagaios e 14 araras, ao se
capturar, ao acaso, uma ave deste viveiro, qual será a probabilidade de que seja uma arara ou um
periquito?
Neste mesmo viveiro, qual a chance de se capturar um papagaio e uma maritaca ao mesmo tempo?
Probabilidade Condicional
P (A × B) = P (A) × P (B | A)
Em um aquário contendo água de um rio tem 36 peixes, sendo 22 tilápias e 14 tambaquis. Qual a
probabilidade de se retirar, deste aquário, duas vezes seguidas, um tambaqui?
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
21
VERDADE
DECISÃO
TOMADA Hipótese nula H0 Hipótese nula H0
é verdadeira é falsa
Hipótese nula H0
é rejeitada
Erro do tipo I Não há erro
Hipótese nula H0
é aceita
Não há erro Erro do tipo II
Decisão:
Rejeitar Hipóteses nula (H0): Hipótese alternativa (Ha) é a possível resposta à pergunta
da pesquisa.
Não Rejeitar (Aceitar) Hipótese nula (H0): Hipótese alternativa (Ha) NÃO responde
a pergunta da pesquisa.
Nível de significância (α): É a probabilidade de rejeitar a hipótese nula (H0) quando ela é
verdadeira (erro do tipo I). Em testes de hipóteses estatísticas, diz que há significância estatística
ou que o resultado é estatisticamente significante quando o p-valor observado é menor que o
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
22
p-valor: Os testes de hipóteses também podem ser calculados usando p-valor. O p-valor é
uma estatística muito usada para sintetizar o resultado de um teste de hipóteses, podendo ser
definido como a probabilidade de obter-se uma estatística de teste igual ou mais extrema que
a estatística observada a partir de uma amostra de uma população assumindo-se a hipótese
nula como verdadeira (H0). O p-valor também pode ser chamado de probabilidade de
significância. Geralmente utiliza-se os seguintes valores:
p < 0,01
p < 0,05.
2. TESTE DE STUDENT
O teste de Student (teste t) é o método paramétrico mais usado para se avaliarem as diferenças entre
as médias de dois grupos. O teste t pode ser usado mesmo que as amostras sejam pequenas (n<30).
Comparar o valor de t na tabela, além de verificar valor de p (p < 0,01 ou p < 0,05).
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
23
Teste t
𝑋̅1 − 𝑋̅2
t= ̅𝟏 / 𝑿
𝑿 ̅ 𝟐 = médias das amostras
𝑠2 𝑠2 𝒔𝟏 / 𝒔𝟐𝟐 = desvios-padrão das amostras
𝟐
3. TESTE DE FISHER
O teste de Fisher (F) é um teste tanto paramétrico quanto não-paramétrico de comparação de duas
variáveis que serve para determinar se populações distintas (A e B) possuem variabilidades
semelhantes (Homocedásticas) ou se as variabilidades podem ser consideradas diferentes
(Heterocedásticas).
Comparar o valor de F na tabela, além de verificar valor de p (p < 0,01 ou p < 0,05).
4. TESTE DO QUI-QUADRADO
O teste do Qui-quadrado (χ2) é um teste não-paramétrico que foi desenvolvido por Pearson e verifica
se a proporção de indivíduos com determinado atributo, em uma dada população, é estatisticamente
diferente de proporção de indivíduos com o mesmo atributo, em outra população. Sendo muito
utilizado em pesquisas nas áreas de ciências biológicas e médicas.
Verificar valor de p (p < 0,01 ou p < 0,05).
Teste t
∑(𝑓𝑜 − 𝑓𝑒 )2 𝒇𝒐 = frequência observada
χ =2
𝒇𝒆 = frequência esperada
𝑓𝑒
Para se calcular o valor do qui-quadrado é necessário calcular os Graus de Liberdade (GL), que
corresponde ao número de classes menos a unidade (GL = nº de classes – 1).
Também pode-se verificar a associação entre as características estudadas aplicando-se a tabela de
contingência com uso do teste do qui-quadrado.
Na tabela de contingência os GL é dado pela seguinte fórmula: GL = (L – 1) x (C – 1).
A tabela pode ser organizada de vários formatos: 2x2; 2x3; 4x4; 2x5; etc.
(𝐚+𝐛).(𝐚+𝐜)
a=
𝑵
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
24
5. TESTE DE TUKEY
Também chamado de teste HSD (Honestly Significant Difference) é um teste paramétrico que foi proposto
por John Tukey.
Empregado para se determinarem as diferenças significantes entre as médias de todos os grupos
analisados no teste ANOVA, tomadas duas a duas.
Teste de Tukey
6. ANÁLISE DE VARIÂNCIA
O teste ANOVA (Analysis of Variance) ou análise de variância ou F-teste (homenagem a Fisher) serve
para a comparação de três ou mais médias populacionais. Portanto, pode ser considerada uma
extensão do teste t, para o caso de mais de dois grupos ou classificações.
Análise de variância é a técnica estatística que permite avaliar afirmações sobre as médias de
populações. A análise visa, fundamentalmente, verificar se existe uma diferença significativa entre as
médias e se os fatores exercem influência em alguma variável dependente.
Análise da Variância (ANOVA) é um método para testar a igualdade de três ou mais médias
populacionais, baseado na análise das variâncias amostrais. Os dados amostrais são separados em
grupos segundo uma característica (fator). O fator (ou tratamento) é uma característica que permite
distinguir diferentes populações umas das outras. Cada fator contém dois ou mais grupos
(classificações).
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
25
Testes não-paramétricos:
Teste de Friedman: Para dados mensurados a nível ordinal, abrangendo três ou mais
amostras equivalendo à ANOVA dois critérios. Os dados devem ter dupla disposição,
onde as linhas representam indivíduos e as colunas representam as condições
experimentais ou tratamentos. As amostras (tratamentos) devem ter o mesmo tamanho.
Observar valor de p (p < 0,01 ou p < 0,05).
Teste de Kruskal-Wallis: Conhecido com teste H, destina-se a comparar três ou mais
amostras independentes do mesmo tamanho ou desiguais. É comparável à ANOVA um
critério. Observar valor de p (p < 0,01 ou p < 0,05).
Teste de Cochran: Testa várias amostras relacionadas onde os mesmos indivíduos são
observados em três ou mais etapas. Os resultados apresentam-se dicotomizados: 1 (sim
ou sucesso) ou 0 (não ou insucesso). Aplicado para três ou mais conjuntos do mesmo
tamanho. Observar valor de p (p < 0,01 ou p < 0,05).
7. CORRELAÇÃO
Pode ser utilizado o Coeficiente de Correlação de Pearson (r) e o Coeficiente de Correlação de
Spearman (r2) para verificar o grau de dependência entre os valores encontrados nas amostras
analisadas. A análise de correlação proporciona um meio de se verificar o grau de associação entre
duas ou mais variáveis.
Em pesquisas que envolvem a consideração de duas ou mais variáveis, estas são estudadas
simultaneamente, procurando-se uma possível correlação entre as variáveis, objetivando-se saber se
as alterações sofridas por uma das variáveis são acompanhadas por alterações nas outras. No caso
particular de duas variáveis X e Y, procura-se verificar se os aumentos (ou diminuições) em X,
correspondem a aumentos (ou diminuições) em Y, ou se aumentos (ou diminuições) em X são
acompanhados de diminuições (ou aumentos) em Y ou, finalmente, se os aumentos (ou diminuições)
em X não estão relacionados com as alterações em Y.
Importante:
A variação dos valores de X (abscissa) explicam a variação dos valores de Y (ordenada).
A variação dos valores de X predizem sobre a variação dos valores de Y.
Os valores de Y dependem da variação dos valores de X.
Objetiva-se no estudo da correlação medir e avaliar o grau de relação entre duas variáveis aleatórias.
O instrumento de medida da correlação linear é dado pelo coeficiente de correlação de Pearson, sendo
que o campo de variação do coeficiente r situa-se entre -1 e +1, indicando assim, se a correlação é
negativa (r<0), positiva (r>0) ou se há ausência de correlação (r=0). É importante lembrar que
correlação não implica em causa e efeito. Se duas variáveis têm correlação positiva, isto significa apenas
que as variáveis crescem no mesmo sentido. No entanto, isso não implica a ideia de que o crescimento
de uma das variáveis determina o crescimento de outra. Da mesma forma, se duas variáveis têm
correlação negativa, isto significa apenas que as variáveis crescem em sentidos opostos, isto é, à medida
que X cresce, Y, em média, decresce. Isto não significa que os acréscimos em uma das variáveis sejam
determinados pelos decréscimos na outra. O coeficiente de correlação não necessariamente mede a
relação causa-efeito entre as variáveis, apesar de que essa relação possa estar presente. Em alguns
casos, a relação causa-efeito pode ser provocada por um fator oculto, isto é, uma variável não
considerada na análise, ou por um conjunto de fatores ocultos.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
26
Deve-se acentuar que o valor de r, calculado em qualquer caso, mede o grau de relação correspondente
ao tipo de equação que é realmente admitida. Assim, se for adotada uma equação linear, e se as
expressões conduzirem a um valor de r próximo de zero, isso significa que quase não há correlação
linear entre as variáveis. Entretanto, não significa que não há nenhuma correlação, porque pode
realmente existir uma forte correlação não-linear entre as variáveis. Em outras palavras, o coeficiente
de correlação mede a excelência do ajustamento aos dados da equação realmente considerada. A
menos que haja especificação em contrário, o termo coeficiente de correlação será usado para indicar
o de correlação linear.
Coeficiente Angular
∑ 𝑥.∑ 𝑦
∑ 𝑥𝑦 −
𝑟𝑥𝑦 = ( 𝑛
𝑛−1) . 𝑠𝑥 . 𝑠𝑦
Onde:
x = variável independente ou preditora ou explicativa
y = variável dependente ou resposta
s = desvio padrão
8. REGRESSÃO
Com o objetivo de se determinar a dependência entre duas variáveis para se predizer o valor de uma
variável dependente (Y) a partir de uma variável independente (X) utiliza-se os testes de regressão
linear simples e regressão logística simples.
No estudo de correlação procura-se verificar a magnitude e o sentido da associação que possa existir
entre duas variáveis, sem haver qualquer grau de dependência de uma em relação à outra. No teste de
regressão a finalidade é determinar a dependência de uma variável em relação à chamada variável
independente ou preditora. A regressão linear simples é muito utilizada em pesquisas, no qual procura-
se predizer o valor de uma variável dependente (Y) a partir de uma variável independente (X) ou
preditora, pressupondo que elas assumam modelo linear. Na regressão logística simples é testada uma
variável dependente de Y e uma variável independente, sendo a variável Y binária, ou seja, assume
valores 1 (positivo) e valores 0 (negativo).
A a regressão linear é um modelo matemático usado para descrever a relação entre duas variáveis com
o objetivo de utilizar uma delas para se prever o valor da outra. A análise de regressão é uma técnica
estatística que caracteriza a relação entre duas variáveis tomando uma dada variável que se quer prever
(variável resposta ou dependente) e observando a sua variação em função de uma ou mais variáveis
(variáveis explicativas ou independentes) com as quais se quer explicar o comportamento da primeira.
Na análise de regressão objetiva-se determinar a relação existente entre o atributo de interesse
dependente e o outro atributo independente, registrada concomitantemente. Sendo assim, na análise
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
27
de regressão é originada, essencialmente, uma equação, cujas variáveis são as variáveis dependente e
independente e cujos coeficientes refletem a intensidade da relação entre cada variável explicativa
isolada e a variável resposta. A relação entre estas variáveis é expressa por uma função matemática
onde a variável dependente Y é uma função da variável independente X.
Função Linear
𝑦 = 𝑎𝑥 ± 𝑏
Onde:
y = variável dependente ou resposta
a = coeficiente angular da regressão
x = variável independente ou preditora ou explicativa
b = coeficiente de regressão da variável independente sobre a resposta, intercepto
Onde:
a = coeficiente angular da regressão
x = variável independente ou preditora ou explicativa
y = variável dependente ou resposta
n = número total da amostra
b = coeficiente de regressão da variável independente sobre a resposta, intercepto
̅ = média da variável dependente ou resposta
𝒚
̅ = média da variável independente ou preditora ou explicativa
𝒙
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
28
x y xy x2
1 2 ........ ........
3 3 ........ ........
5 8 ........ ........
4 4 ........ ........
2 3 ........ ........
Σx = ....... Σy = ....... Σxy = ....... Σx2 = .......
̅ = .......
𝒙 ̅ = .......
𝒚 ----- -----
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
29
(𝑅−1)
DMg =
𝑙𝑛𝑁
𝑅
DMn =
√𝑁
2. ABUNDÂNCIA RELATIVA
Abundância Relativa (AR) é a proporção do número de indivíduos de uma espécie (n) em uma amostra
ou parcela sobre o número total de indivíduos (N) daquela amostra ou parcela. O cálculo é feito para
cada espécie.
𝑛
AR =
𝑁
3. DOMINÂNCIA
Para o cálculo de dominância de uma espécie utiliza-se o Índice de Berger-Parker (d), que expressa a
abundância proporcional da espécie mais abundante sobre o total de indivíduos, onde Nmáx é o
número de indivíduos da espécie mais abundante e N é o número total de indivíduos de toda amostra
ou parcela.
𝑁𝑚á𝑥
d=
𝑁
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
30
4. DENSIDADE RELATIVA
Densidade Relativa (DR) é o número de indivíduos de uma espécie (n) em uma amostra ou parcela
sobre o número total de indivíduos (N) daquela amostra ou parcela multiplicada por 100. O cálculo é
feito para cada espécie.
𝑛
DR = x 100
𝑁
5. FREQUÊNCIA OBSERVADA
Frequência Observada (FO%) indica a porcentagem (ou proporção) de ocorrência de uma espécie em
uma determinada área. Calcula-se dividindo o número de parcelas ou unidades amostrais (p) com a
ocorrência de determinada espécie pelo número total de parcelas ou unidades amostrais (P).
𝑝
FO% = x 100
𝑃
6. CONSTÂNCIA
Constância (C%) calcula-se relacionando o número de coletas em que a espécie foi registrada em cada
área ou parcela estudada, isto é, número de vezes (excursões ou coletas) que a espécie foi encontrada
na área ou parcela (p) sobre o número total de coletas realizadas (P) vezes 100. Os táxons são
classificados de acordo com as seguintes categorias de constância: C% ≤ 25% acidental; 25% < C%
≤ 50% acessória e C% > 50% constante. O cálculo é feito para cada espécie.
Constância (C%)
𝑝
C% = x 100
𝑃
7. ÍNDICE DE DIVERSIDADE
O conceito de diversidade de espécie envolve o conhecimento da riqueza e da abundância das espécies
no local. Riqueza é o número total de espécies presentes em uma comunidade ou habitat ou área ou
parcela ou amostra. Diversidade é relativa ao número de espécies e suas abundâncias em uma
comunidade ou habitat ou área ou parcela ou amostra.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
31
𝑛
H’ = − ∑ 𝑝𝑖 x ln 𝑝𝑖 pi = 𝑁
8. ÍNDICE DE SIMILARIDADE
Para quantificar a similaridade de comunidades ou áreas ou amostras ou parcelas, podem ser utilizados
os índices de similaridade (IS), entre os quais se destacam os coeficientes de similaridade de Jaccard
(SJ); de Sorensen (SS) e de Marczewski-Steinhaus (SMS). Estes índices comparam duas comunidades
ou áreas ou amostras ou parcelas.
Coeficiente de Jaccard (SJ): Índice de Jaccard é qualitativo, portanto, não considera o número
de indivíduos presentes na amostra e sim a presença e a ausência deles.
𝑎
SJ =
𝑎+𝑏+𝑐
Onde:
a = o número de espécies encontradas em ambos os locais ou áreas ou parcelas A e B;
b = o número de espécies amostradas exclusivas no local B, mas não em A;
c = o número de espécies amostradas exclusivas no local A, mas não em B.
Fórmula I:
2𝑎
SS =
2𝑎+𝑏+𝑐
Onde:
a = o número de espécies encontradas em ambos os locais ou áreas ou parcelas A e B;
b = o número de espécies amostradas exclusivas no local B, mas não em A;
c = o número de espécies amostradas exclusivas no local A, mas não em B.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
32
Fórmula II:
2𝑐
SS = x 100
𝐴+𝐵
Onde:
A = o número total de espécies na área A;
B = o número total de espécies na área B;
c = o número de espécies em comum nas duas áreas ou parcelas A e B.
𝑎
SMS = 1 -
𝑎+𝑏+𝑐
Onde:
a = o número de espécies encontradas em ambos os locais ou áreas ou parcelas A e B;
b = o número de espécies amostradas exclusivas no local B, mas não em A;
c = o número de espécies amostradas exclusivas no local A, mas não em B.
9. MEDIDAS DE DIVERSIDADE
Se todas as espécies ocorressem em todos os habitats dentro de uma região, as diversidades local e
regional seriam iguais. Contudo, se cada habitat tivesse uma única flora; fauna e funga, a diversidade
regional seria igual à soma das diversidades locais de todos os habitats na região.
Os ecólogos se referem à diferença, ou substituição nas espécies de um habitat para o outro como
diversidade regional ou diversidade beta (β), isto é, envolve as diferenças na composição de espécies
e suas abundâncias entre habitats. Quanto maior a diferença nas espécies entre os habitats, maior esta
diversidade.
Já a diversidade local ou diversidade alfa (α) é o número de espécies numa pequena área de habitat
homogêneo, isto é, refere-se ao número e abundância de espécies dentro de um habitat.
A maneira mais simples de medir a diversidade β entre pares de locais é pelo uso dos coeficientes de
similaridade, os mais utilizados são o Índice de Jaccard (Sj) e o Índice de Sorensen (Ss).
Além dos coeficientes de similaridade, várias medidas de diversidade β são propostas para avaliar o
quanto a composição de espécies muda ao longo de um gradiente ou transecto, dentre as quais, temos
a medida de Whittakker (βW), obtida pela equação: βW = (S/α) – 1; onde S é o número total de espécies
registrado nas amostras de um habitat, e α é a riqueza de espécies média das amostras (habitas).
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
33
Diversidade βW de Whittakker
𝑆
βw = –1
𝛼
Onde:
S = o número total de espécies registrado nas amostras de um habitat;
α = a riqueza de espécies média das amostras (habitas) que estão sendo comparadas.
OBS.: Também é possível usar a medida de Whittakker para calcular a diversidade βW total entre os
habitats como um todo. Para isso, basta calcular a relação da riqueza total pela riqueza média.
𝑆
βw =
𝛼
Onde:
S = o número total de espécies registrado em todos os habitats amostradas;
α = a riqueza média de espécies de todas as amostras (habitas) que estão sendo comparadas.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
34
H’ Área 1: 1,97
Índice de Diversidade de Shannon-Wiener H’ Área 2: 1,81
H’ Área 3: 0,92
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
35
Área 3 (Pasto):
H’ = (0,364xln0,364)+(0,545xln0,545)+(0,091xln0,091)
H’ = (0,364x1,0106)+(0,545x0,6070)+(0,091x2,3969)
H’ = 0,3678584 + 0,330815 + 0,2181179
H’ = 0,9167913
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
36
Área 1 X Área 2:
Número de espécies em comum (a): 5
Número de espécies exclusivas da área 1 (b): 4
Número de espécies exclusivas da área 2 (c): 2
Área 2 X Área 3:
Número de espécies em comum (a): 3
Número de espécies exclusivas da área 2 (b): 4
Número de espécies exclusivas da área 3 (c): 0
Área 1 X Área 3:
Número de espécies em comum (a): 2
Número de espécies exclusivas da área 1 (b): 7
Número de espécies exclusivas da área 3 (c): 1
Coeficiente Coeficiente
Similaridade
de Jaccard de Sorensen
Área 1 X Área 2 0,45 0,625
Área 2 X Área 3 0,43 0,60
Área 1 X Área 3 0,20 0,33
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
37
Área 1 X Área 2:
Número total de espécies da área 1 (A): 9
Número total de espécies da área 2 (B): 7
Número de espécies em comum (c): 5
SS = 2c / (A + B) x 100
SS = 2 x 5 / (9 + 7) x 100
SS = 10 / 16 x 100
SS = 0,625 x 100
SS = 62,5%
Área 2 X Área 3:
Número total de espécies da área 2 (A): 7
Número total de espécies da área 3 (B): 3
Número de espécies em comum (c): 3
SS = 2c / (A + B) x 100
SS = 2 x 3 / (7 + 3) x 100
SS = 6 / 10 x 100
SS = 0,6 x 100
SS = 60,0%
Área 1 X Área 3:
Número total de espécies da área 1 (A): 9
Número total de espécies da área 3 (B): 3
Número de espécies em comum (c): 2
SS = 2c / (A + B) x 100
SS = 2 x 2 / (9 + 3) x 100
SS = 4 / 12 x 100
SS = 0,33 x 100
SS = 33,3%
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
38
Área 1 X Área 2:
S = número total de espécies das duas áreas: 11
α = riqueza de espécies média das duas áreas: (9 da área 1) + (7 da área 2) / 2 = 16/2 = 8
βW = (S/α) – 1
βW = (11 / 8) – 1
βW = 1,375 – 1
βW = 0,375
Área 2 X Área 3:
S = número total de espécies das duas áreas: 7
α = riqueza de espécies média das duas áreas: (7 da área 2) + (3 da área 3) / 2 = 10/2 = 5
βW = (S/α) – 1
βW = (7 / 5) – 1
βW = 1,40 – 1
βW = 0,40
Área 1 X Área 3:
S = número total de espécies das duas áreas: 10
α = riqueza de espécies média das duas áreas: (9 da área 1) + (3 da área 3) / 2 = 12/2 = 6
βW = (S/α) – 1
βW = (10 / 6) – 1
βW = 1,667 – 1
βW = 0,667
OU
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
39
REFERÊNCIAS
ARANGO, H. G. Bioestatística: Teórica e Computacional. 2 ed. Rio de Janeiro: Guanabara Koogan. 2005.
AYRES, M.; AYRES, J. R. M.; AYRES, D. L.; SANTOS, A. A. S. BioEstat 5.3 – Aplicações Estatísticas
nas Áreas das Ciências Biomédicas. Belém: Instituto Mamirauá. 2007.
BEGON, M.; TOWNSEND, C. R.; HARPER, J. L. Ecologia. De Indivíduos a Ecossistemas. 4 ed. Porto
Alegre: Artmed. 2007.
BERQUÓ, E. S.; SOUZA, J. M. P.; GOTLIEB, S. L. D. Bioestatística. 2 ed. São Paulo: EPU. 1981.
BROWER, J. E.; ZAR, J. H.; VON ENDE, C. A. Field and Laboratory Methods for General Ecology. 4 ed.
Dubuque: C. Brown Publishers. 1998.
FONSECA, J. S.; MARTINS, G. A. Curso de Estatística. 6 ed. São Paulo: Atlas. 1996.
FONSECA, J. S.; MARTINS, G. A.; TOLEDO, G. L. Estatística Aplicada. 2 ed. São Paulo: Atlas. 1985.
GOTELLI, N. J.; AARON, M. E. Princípios de Estatística em Ecologia. Porto Alegre: Artmed. 2011.
MOTTA, V. T.; WAGNER, M. B. Bioestatística. Caxias do Sul: Educs. São Paulo: Robe Editorial. 2003.
R PROJECT: The R Project for Statistical Computing. 2020. R Foundation for Statistical Computing.
Vienna, Austria. [online]. Disponível em: <https://www.r-project.org> Acessado em 11 de maio de
2020.
TOLEDO, G. L.; OVALLE, I. I. Estatística Básica. 2. ed. São Paulo: Atlas. 1994.
VIEIRA, S.; HOFFMAN, R.; WADA, R. Estatística: Introdução Ilustrada. 2 ed. São Paulo: Atlas. 1992.
VIEIRA, S.; HOFFMANN, R. Elementos de Estatística. 2. ed. São Paulo: Atlas. 1995.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
41
EXERCÍCIOS
ESTATÍSTICA DESCRITIVA
1. Um pesquisador coletou 3 amostras, cuja variável investigada era a pressão arterial sistólica:
a) Amostra A: 12 estudantes do sexo feminino.
b) Amostra B: 9 alunos do sexo masculino.
c) Amostra C: 10 docentes.
Fazer a estatística descritiva a partir dos dados da tabela abaixo:
Amostra A Amostra B Amostra C
110 117 121
115 120 125
116 121 119
109 113 129
110 116 125
117 117 126
116 115 127
118 119 128
118 120 122
119 125
115
114
3. Em 200 equinos da raça Mangalarga, a média de hematócrito apresentou um valor igual a 36,8%.
O desvio padrão foi igual a 1/20 da média. Calcule a variância e o desvio padrão.
4. em uma granja, 400 aves da raça Cornish apresentaram peso médio do ovo igual a 60 g. O erro
padrão da média foi igual a 0,5 g. Calcule o coeficiente de variação e comente.
5. Calcule a média aritmética, mediana e desvio padrão dos dados abaixo, relativos à dosagem de
hemoglobina (mg) de 12 bovinos:
15 – 14 – 13 – 11 – 13 – 14 – 13,5 – 12 – 16 – 14,5 – 12 – 9
6. Calcule o desvio padrão e o coeficiente de variação referentes ao peso (kg) de ovinos abaixo:
37 – 35 – 38 – 36 – 35 – 40 – 42 – 44 – 41 – 30 – 37
7. A média e o desvio padrão dos pesos de 100 leitões, ao nascer, foram respectivamente de 9,0 kg e
0,5 kg. Calcule o erro padrão da média e o coeficiente de variação (comente).
8. Calcule o coeficiente de variação de uma amostra de 1.000 bovinos que apresentaram uma média
de fertilidade de 1,43 e variância de 0,25.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
42
9. Calcule o erro padrão da média de uma amostra de 900 animais que apresentam uma média de peso
de 69 kg e coeficiente de variação de 17%.
10. A partir da tabela abaixo calcule o erro padrão da média e o coeficiente de variação dos dados
relativos ao peso de ovos de 150 aves e indique a melhor amostragem em razão dos coeficientes de
variação.
Amostra A Amostra B Amostra C
X1 = 58 g X2 = 59,5 g X3 = 62 g
s1 = 2,5 g s2 = 2,8 g s3 = 2,9 g
n1 = 50 n2 = 50 n3 = 50
11. Uma amostra de 225 indivíduos de taxa de glicose no sangue apresentou os seguintes dados: média
de 95 mg e erro padrão da média de 0,8 mg. Calcule a variância e o coeficiente de variação.
12. De acordo com a tabela abaixo calcule a média aritmética, o desvio padrão e a amplitude de classe:
X Frequência
20 |─ 24 10
24 |─ 28 17
28 |─ 32 25
32 |─ 36 22
36 |─ 40 15
13. Para a distribuição de frequências da tabela abaixo, relativa ao índice de soro-proteção de vacinas
oleosas, calcule a média aritmética; o desvio padrão e o coeficiente de variação:
Índice Frequência
1,35 2
1,43 3
1,49 3
1,54 4
1,62 5
1,90 4
2,05 3
2,18 2
2,30 2
14. A partir da distribuição de frequências abaixo, referente ao peso do animal, calcule a média, o
desvio padrão e o coeficiente de variação:
Peso (kg) Frequência
< 140 8
140 |─ 160 12
160 |─ 180 15
180 |─ 200 17
200 |─ 220 14
220 |─ 240 11
> 240 9
15. Em uma rodovia a distribuição de frequências do número de acidentes por dia, durante 70 dias,
está representado abaixo. Calcule a média aritmética e o desvio padrão:
Nº acidentes: 0 1 2 3 4 5
Nº de dias: 21 16 12 9 8 4
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
43
AMOSTRAGEM
17. Um pesquisador resolveu realizar um trabalho inédito para determinar a prevalência de uma doença
e deseja calcular o tamanho da amostra. Levando-se em conta que se trata de um trabalho pioneiro,
estipulou um nível de confiança de 95% e uma precisão de 5%. Estime o tamanho da amostra, sendo
que N=20.000 indivíduos.
18. Registrou-se em uma cidade uma prevalência de 25% de uma doença A em estudantes do ensino
fundamental. Para uma pesquisa similar em estudantes de uma outra cidade, com um nível de
confiança de 95% e precisão de 3%, determine o tamanho da amostra, sendo N=12.000.
19. Calcule o tamanho da amostra para estimar a prevalência de leptospirose em cães, sabendo que de
400 animais examinados, 50 foram considerados positivos. A precisão desejada é de 3% com nível de
confiança de 99% e o valor de N aproximado de 4.000.
ESTATÍSTICA INFERENCIAL
Teste t
20. Foi realizada a adubação de um terreno com Nitrogênio e Potássio e foram encontrados os
seguintes dados descritos na tabela abaixo. Analise os dados obtidos:
Nitrogênio Potássio
X1 = 25 kg X2 = 20 kg
s1 = 2,4 kg s2 = 1,9 kg
n1 = 21 n2 = 21
21. A partir dos dados da tabela abaixo, verifique se a diferença entre as médias de peso de aves
submetidas a dois tipos de ração foi significativa:
RAÇÃO
A B
X1 = 22 kg X2 = 17,5 kg
s1 = 2,4 kg s2 = 3,24 kg
n1 = 21 n2 = 21
22. Analise o ganho de peso de dois lotes de ratos submetidos a dietas diferentes, uma de alto nível
de proteína e outra com baixo nível de proteína:
Alto Nível Baixo Nível
X1 = 120 g X2 = 59,7 g
s1 = 19,5 g s2 = 15,5 kg
n1 = 12 n2 = 7
23. Foram apresentadas diferentes taxas médias de anticorpos no sangue de acordo com as vias de
administração de vacinas. Faça a análise dos dados encontrados:
Via de Administração
Intramuscular Subcutânea
X1 = 18 X2 = 15,5
s1 = 1,9 s2 = 1,6
n1 = 25 n2 = 37
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
44
24. Verifique a eficiência de duas drogas para dormir que foram ministradas a dois grupos de dez
pacientes e o resultado foi medido pelas horas adicionais de sono conforme a tabela abaixo:
DROGAS
A B
1,9 4,4 0,7 3,4
0,8 5,5 1,6 0,8
1,1 1,6 0,2 0,6
0,1 4,6 1,2 2,0
0,1 3,4 0,1 3,7
25. Analise o efeito alucinógeno de duas drogas testadas em dois grupos de ratos. Os dados obtidos
estão na tabela abaixo:
DROGAS
Anfetamina Mescalina
X1 = 8 X2 = 5,6
s1 = 0,8 s2 = 0,5
n1 = 15 n2 = 15
26. Uma pesquisa sobre comprimento de filarias em cães apresentou os resultados descritos na tabela
abaixo. Analise se há diferença significativa entre as espécies.
ESPÉCIES DE FILARIAS
Dipetalonema reconditum Dirofilaria immitis
X1 = 318,5 mm X2 = 269,45 mm
s1 = 16,5 mm s2 = 13,9 mm
n1 = 15 n2 = 12
27. Foram utilizados dois tipos de solução química (A e B) para a determinação de pH. As análises de
seis amostras de solução A indicaram o pH médio de 7,52 com desvio padrão 0,24. As seis amostras
usando a solução B apresentaram pH médio de 7,49 com desvio padrão 0,32. Usando um nível de
significância de 5%, calcule se a diferença ocorrida foi devida ao acaso.
Qui-quadrado
29. Uma moeda foi lançada 100 vezes e foram observadas 44 caras como resultado. Verifique a
significância estatística deste resultado.
30. Em um acasalamento entre indivíduos cujos pares de genes são AaBb, determinaram na segunda
geração (F2) os seguintes fenótipos e frequências descritos na tabela abaixo. Teste utilizando o qui-
quadrado e analise o resultado:
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
45
Fenótipos Frequência
AB 87
Ab 30
aB 35
ab 8
31. Verifique a eficiência de certa vacina a partir dos resultados encontrados na tabela abaixo:
Indivíduos Frequência
Sadios Vacinados 24
Sadios Não-Vacinados 17
Doentes Vacinados 10
Doentes Não-Vacinados 52
32. Analise a associação entre estado de nutrição e inteligência de acordo com os resultados descritos
na tabela abaixo:
Q.I.
Nutrição Total
Alto Médio Baixo
Satisfatória 245 228 177 650
Deficiente 31 27 13 71
Total 276 255 190 721
34. Analise os resultados da tabela abaixo sobre um estudo em dois grupos de crianças em relação à
difteria:
Com Difteria Vacinados Não-Vacinados Total
Sim 15 140 155
Não 45 305 350
Total 60 445 505
35. Verifique o grau de associação entre três agentes terapêuticos em determinada doença em relação
aos resultados obtidos na tabela abaixo:
Agentes Doentes
Total
Terapêuticos Curados Não-Curados
A 22 38 60
B 36 26 62
C 44 34 78
Total 102 98 200
36. Em uma pesquisa utilizando 880 soros para pesquisa de toxoplasmose em relação ao local foram
obtidos os seguintes resultados da tabela abaixo. Analise os resultados:
Sorologia
Zonas Total
Positiva Negativa
Urbana 70 380 450
Rural 40 310 350
Total 110 690 800
37. Uma universidade implantou um novo sistema de avaliação. Foi realizada uma enquete sobre este
sistema com discentes de três diferentes faculdades. Verifique se há diferença significativa entre os
estudantes das três faculdades, a partir dos resultados descritos na tabela abaixo:
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
46
Discentes
Faculdades Total
Favor Contra
X 60 70 130
Y 70 50 120
Z 65 35 100
Total 195 155 350
Correlação
38. Em uma pesquisa foram realizadas as medidas dos comprimentos (cm) e larguras (cm) de dez
folhas tiradas ao acaso de uma árvore. A partir dos resultados registrados na tabela abaixo verifique se
há correlação entre as duas características:
Comprimento Largura
Folha
(X) (Y)
1 12 10
2 12 14
3 11 9
4 16 13
5 13 10
6 12 12
7 10 8
8 9 7
9 17 13
10 15 14
39. A tabela abaixo demonstra os resultados sobre o consumo individual diário de proteínas de origem
animal (em gramas) em relação ao coeficiente de natalidade, em 15 países. Verifique se há correlação
entre as características. Estime o valor do coeficiente de regressão e a equação de regressão linear:
Consumo Coeficiente
Países
Proteínas (g) Natalidade
1 4,7 45
2 7,6 39
3 8,7 33
4 9,8 28
5 10,2 26
6 13,5 24
7 14,1 20
8 16,0 22
9 17,0 17
10 14,4 19
11 18,0 14
12 18,2 15
13 18,8 11
14 20,0 9
15 23,0 13
40. Determine o coeficiente de correlação e de regressão a partir dos resultados abaixo na tabela que
expressam a variação do pulso e temperatura num grupo de indivíduos adultos:
Temperatura
Pulso
(°C)
60 36
70 37
80 38
90 39
100 40
110 41
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
47
41. Foi verificado a pressão sanguínea de dez homens de diferentes idades. Calcule o coeficiente de
correlação, de regressão e a equação de regressão linear a partir dos resultados da tabela abaixo:
Pressão
Idade
Sanguínea
(X)
(Y)
55 145
42 124
70 160
37 118
63 145
48 126
54 150
48 148
60 154
42 140
Teste F
42. Realizou-se um trabalho experimental com ovinos, visando verificar a ação de certos
medicamentos sobre a queda do cálcio na corrente sanguínea. Escolha o melhor teste de análise de
variância (teste F) a partir dos dados obtidos e descritos no quadro abaixo e interprete estatisticamente,
além de calcular a média e o desvio padrão de cada um dos tratamentos:
Medicamento A
Medicamento B Medicamento C
(testemunha)
3,2 2,5 2,4
2,7 2,2 3,0
2,9 2,1 2,0
2,5 2,7 2,3
3,0 2,0 2,1
3,7 1,9 2,3
2,3 2,4 2,0
43. Após testar cinco diferentes rações em suínos visando o ganho de peso, em um período de 40
dias, foram descritos os seguintes resultados (veja a tabela). Aplique o melhor teste para análise de
variância e forneça a média e desvio padrão de cada uma das rações.
44. Analise um experimento onde foi determinado o número médio de ovos por aves poedeiras
durante o período total de postura, em que estas aves foram submetidas a cinco tratamentos e
dispostas em quatro blocos, conforme os dados abaixo:
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
48
45. Em um tratamento de uma doença foram utilizadas quatro drogas em quatro diferentes clínicas e
o número de casos de recuperação dessa doença, por indivíduos que tomaram a droga, está descrito
na tabela abaixo. Analise estatisticamente o experimento e defina qual a melhor droga para tratamento.
Desafios
46. Em uma pesquisa onde foram analisados 95 hambúrgueres, sendo 40 hambúrgueres bovinos
(carne bovina) e 55 hambúrgueres mistos (carne bovina + carne de aves), foram encontrados os
seguintes resultados: 15 hambúrgueres bovinos contaminados por Salmonella e 35 hambúrgueres
mistos contaminados por Salmonella. Utilize um teste estatístico para confirmar se há diferença
significativa entre os tipos de hambúrgueres e o que isto significa em relação a pesquisa.
47. Os resultados dos diâmetros (mm) dos halos de inibição formados a partir do óleo essencial, em
diferentes concentrações, extraído de uma planta contra as bactérias Staphylococcus aureus e Escherichia
coli estão descritos na tabela abaixo.
a) Calcule a média e o desvio padrão do diâmetro dos halos de inibição de acordo com as
concentrações do óleo para cada bactéria.
b) Escolha uma análise estatística para confirmar se há diferença significativa entre os parâmetros
analisados.
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
49
TABELAS ESTATÍSTICAS
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
50
Tabela de χ2 – Qui-Quadrado
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
51
Tabela de r
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
52
Limites Unilaterais de F
Nível de 5% de Probabilidade
n1 = G.L. de tratamentos n2 = G.L. de resíduo
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
53
Limites Unilaterais de F
Nível de 1% de Probabilidade
n1 = G.L. de tratamentos n2 = G.L. de resíduo
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
54
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
55
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
56
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna
57
Noções Básicas de Bioestatística – UNEB – Campus X – Ciências Biológicas – Prof. Dr. Jorge Luiz Fortuna