Você está na página 1de 73

UNIVERSIDADE FEDERAL DA BAHIA

Instituto de Ciências da Saúde – ICS/UFBA


Instituto de Biologia – IBIO/UFBA
Programa de Pós-Graduação em Biotecnologia - PPGBiotec
Programa de Pós-Graduação em Microbiologia - PPGMicro
Disciplinas:
ICSE71 - Bioestatística e Planejamento Experimental
BIOD20 - Bioestatística

Introdução à Bioestatística

Prof. Dr. Gilson Correia de Carvalho


Departamento Biointeração – ICS/UFBA
PPGEAGeA – Mestrado Profissional em Ecologia Aplicada à Gestão Ambiental
PPGEcoBio – Ecologia e Biomonitoramento – IBIO/UFBA
gilson@ufba.br
biogilson@gmail.com
Objetivos da Aula

Conceituar a estatística e a bioestatística, discutir a conexão


da bioestatística com a produção de conhecimento
científico em biotecnologia e micro biologia, discutir um
modelo conceitual de utilização da bioestatística.
Conceituação da estatística

Origem da palavra – Statum (Estado)

Estatística é a ciência que se ocupa de coletar, organizar,


analisar e interpretar dados a fim de tomar decisões -
Renata Souza (UFPE)

A estatística utiliza-se das teorias probabilísticas para


explicar a freqüência da ocorrência de eventos, tanto
em estudos observacionais quanto em experimento. Visa
modelar a aleatoriedade e a incerteza de forma
a estimar ou possibilitar a previsão de fenômenos futuros -
Wikipedia, 2017
Dados não são informação !

100 observações de
valores de colesterol
(mg/dl) amostrados
de uma população
de crianças com
idades entre 5 e 8
anos filhas de pais
separados nascidas
em Salvador – Bahia.
Estatística extrai informação de dados !
Utilização da estatística em pesquisa

Existe uma diversidade enorme de questões científicas !!!!!

Realizar uma estimativa de uma, ou


mais, variáveis de interesse e estimar
a incerteza associada;

Avaliar a existência de relação entre


? duas, ou mais, variáveis de interesse.

Comparar grupos em relação a uma,


ou mais, variáveis de interesse;
Utilização da estatística em pesquisa

Existe uma diversidade enorme de questões científicas !!!!!

Realizar uma estimativa de uma, ou


mais, variáveis de interesse e estimar
a incerteza associada;

Avaliar a existência de relação entre


? duas, ou mais, variáveis de interesse.

Comparar grupos em relação a uma,


ou mais, variáveis de interesse;
?
1. Limites 2. O que medir ? 3. Amostragem
da população ?

5. Relevância estatística = 4. Inferência estatística


Relevância Biológica ?
Tipos de Variáveis

Nominal
Binária
Ordinal

Qualitativa
Nominal
Multi-estado
Ordinal

Intervalar

Discreta
Razão

Quantitativa
Intervalar

Contínua
Razão
Tipos de estudos estatísticos

Estudos Observacionais

Fonte: http://researchhubs.com/uploads/duke%20data%20science%20-%20data%203.png
Tipos de estudos estatísticos

Experimentos Controlados

Fonte: https://scienceornot.files.wordpress.com/2012/01/controlled-expt2.jpg
Tipos de estudos estatísticos

Ensaios de Controle Aleatorizado

Fronte:https://scienceornot.files.wordpress.com/2012/01/rct.jpg
Tipos de amostragem

Aleatória Simples

Sistemática

Estratificada

Por conglomerados
Tipos de amostragem

Amostragem Aleatória Simples

1. Lista de TODOS os integrantes da


população alvo

2. Método aleatório de seleção


(Caixa, Tabela de números
aleatórios, simulações
computacionais)

3. 1/N Com reposição

1/N-1 Sem-reposição
http://researchhubs.com/uploads/duke%20data%20science%20-%20sampling%201.png
Tipos de amostragem
Amostragem “Haphazard” ou “à
esmo”

1. Virtualmente impossível ter uma


lista de TODOS os integrantes da
população alvo

2. Método pseudo-aleatório de
seleção (olhos fechados,
pensando em nada, etc...)

3. Impossível garantir que todos os


indivíduos tiveram a mesma
chance de entrar na amostra
Tipos de amostragem

Amostragem Sistemática

k k k
1...k ...N

População

Amostra

1 n
Tipos de amostragem

Amostragem Estratificada

População HETEROGÊNEA em
relação à variável sob estudo.

Homogeneidade DENTRO de cada


estrato.

Escolha dos elementos dos estratos:


aleatória simples ou sistemática.

TODOS os estratos precisam ser


representados na amostra!

Sorteio não viciado


http://researchhubs.com/uploads/duke%20data%20science%20-%20sampling%202.png
Tipos de amostragem

Amostragem por Conglomerados

População HOMOGÊNEA em relação à variável sob estudo. Entretanto


os objetos sendo estudados estão organizados em numerosos grupos.

http://www.education-savvy.blogspot.com/
http://researchhubs.com/uploads/duke%20data%20science%20-%20sampling%203.png
Tipos de amostragem

Universo de InteresseUniverso Amostral


Tipos de amostragem

Universo de InteresseUniverso Amostral


Tabelas

Tabela de Dados Brutos – Banco de Dados


Tabelas

Tabela de Frequências
Tabelas
Tabela de Contingência 2 x 2

Qualitativas

Quantitativa e Qualitativa
Gráficos

Chave simplificada para escolha de gráficos

Variável única Gráfico

Gráfico de Barras Simples


Qualitativa (Binária ou Multi-estado)
ou Setores

Quantitativa (Discreta ou Contínua) Histograma

Modificado de material do professor Thierry R. Gasnier


Gráficos

1 variável Qualitativa (Binária ou Multi-estado) – Gráfico de barras simples

Estado Freq.
Pessoa Idade Sexo Estado Salario BA 3
1 25 M BA 25 RJ 5
2 28 F RJ 36 SP 4

3 31 M SP 44

4 35 F SP 38
Freqüência por Estado
5 36 M RJ 56
6
6 38 F SP 68
5
7 42 M RJ 79 4

8 51 F BA 64 3

2
9 55 M RJ 88
1
10 61 F BA 71
0
11 62 M RJ 92 BA RJ SP

12 65 F SP 54
Gráficos

1 variável Qualitativa (Binária ou Multi-estado) – Setores

Estado Freq.
BA 3
Freqüência por Estado
RJ 5

SP 4

3; 25% BA
4; 33%
RJ
SP

5; 42%
Gráficos

1 variável Quantitativa (Discreta ou Contínua) – Histograma


Gráficos

Chave simplificada para escolha de gráficos


“Variável Independente” “Variável Dependente”

Qualitativa Qualitativa Gráfico de Barras Composto


(Binária ou Multi-estado) (Binária ou Multi-estado) (Vertical ou Horizontal)

Qualitativa Quantitativa Gráfico de densidade de pontos


(Binária ou Multi-estado) (Discreta ou Contínua) ou Barras ou Linha ou Box-Plot

Quantitativa Quantitativa
Dispersão
(Discreta ou Contínua) (Discreta ou Contínua)

Quantitativa Qualitativa
Gráfico de densidade de pontos transposto
(Discreta ou Contínua) (Binária ou Multi-estado)

Modificado de material do professor Thierry R. Gasnier


Gráficos

2 variáveis Qualitativas – Gráfico de Barras Composto


Gráficos
Variável Independente Qualitativa e Variável Dependente Quantitativa
Gráfico de densidade de pontos ou Barras ou Linha
Gráficos
Variável Independente Qualitativa e Variável Dependente Quantitativa
Gráfico de densidade de pontos ou Barras ou Linha
Gráficos
Variável Independente Quantitativa e Variável Dependente Quantitativa
Gráfico de dispersão
Gráficos
Variável Independente Quantitativa e Variável Dependente Qualitativa
Gráfico de dispersão
Número de Indivíduos (Quantitativa, Discreta, Razão)
Biodiversidade (Qualitativa, Binária, Ordinal)

Como representar o conjunto?

1 – Medidas de Posição (Quantitativa)


2 – Medidas de Posição (Qualitativa)
Como representar o conjunto?

1 – Média Aritmética Simples (Quantitativa)

Número de árvores

Parcelas
Como representar o conjunto?
2 – Mediana (Quantitativa)

Número de árvores

Mediana

Parcelas
Como representar o conjunto?

3 – Mediana (Qualitativa Ordinal)

Mediana = Alta

Alta

Alta

Alta

Baixa

Baixa

Biodiversidade
Como representar o conjunto?

4 – Moda (Quantitativa)

Moda = Não existe moda !!!!


Número de árvores

Parcelas
Como representar o conjunto?

5 – Moda (Qualitativa)

Moda = Alta

Alta
alta = 3
baixa = 2
Alta

Alta

Baixa

Baixa

Biodiversidade
Como representar o conjunto?

6 – Proporção (Qualitativa)

P(alta) = 0,6
P(baixa) = 0,4
Alta
alta = 3/5 = 0,6
baixa = 2/5 = 0,4
Alta

Alta

Baixa

Baixa

Biodiversidade
Como medir variabilidade ?

1 – Amplitude (r) (Quantitativa)

Problemas:
Número de árvores

Só leva em consideração 2
valores da distribuição.

Mais informativo dizer máximo


e mínimo.

Parcelas
Como medir variabilidade ?

E se.... Médias dos desvios em relação à média?

X5 – Média = 2
Número de árvores

X4 – Média = 1

X3 – Média = 0

X2 – Média = - 1

X1 – Média = - 2

Parcelas
Como medir variabilidade ?

E se.... Médias dos desvios em relação à média?

2 + 1 + 0 + (-1) + (-2) = 0 !!!!!!!!!! Sempre !

X5 – Média = 2
Número de árvores

X4 – Média = 1

X3 – Média = 0

X2 – Média = - 1

X1 – Média = - 2

Parcelas
Como medir variabilidade ?

2 – Desvio Médio Absoluto (Módulo) (DMA) (Quantitativa)

l2l + l1l + l0l + l(-1)l + l(-2)l = 6/5 = 1,2 árvores

X5 – Média = 2
Número de árvores

X4 – Média = 1

X3 – Média = 0

X2 – Média = - 1

Vantagens/Desvantagens:
X1 – Média = - 2
Mesma escala da variável
Características ruins para inferência

Parcelas
Como medir variabilidade ?

3 – Variância (Quadrado) (s2) (Quantitativa)

(2)2 + (1)2 + (0)2 + (-1)2 + (-2)2 = 10/5 = 2 árvores2

X5 – Média = 2
Número de árvores

X4 – Média = 1

X3 – Média = 0

X2 – Média = - 1

Vantagens/Desvantagens:
X1 – Média = - 2
Escala quadrática ????????
Características boas para inferência

Parcelas
Como medir variabilidade ?

4 – Desvio Padrão (Raiz Quadrada da Variância) (s) (Quantitativa)

Raiz((2)2 + (1)2 + (0)2 + (-1)2 + (-2)2 / n) = 10/5 = 1,41 árvores

X5 – Média = 2
Número de árvores

X4 – Média = 1

X3 – Média = 0

X2 – Média = - 1

Vantagens/Desvantagens:
X1 – Média = - 2
Mesma escala da variável
Características boas para inferência

Parcelas
Como medir variabilidade ?

5 – Coeficiente de Variação (c.v.) (Quantitativa)


s / média = 1,41 árvores / 3 árvores = 47,14 %

X5 – Média = 2
Número de árvores

X4 – Média = 1

X3 – Média = 0

X2 – Média = - 1

Vantagens/Desvantagens:
X1 – Média = - 2
Independente da média
Bom para comparar variáveis com médias diferentes

Parcelas
Como medir variabilidade e simetria ?

1 – Quantis (qr) (Quantitativa e Qualitativa)

5
(4 + 5)/2 = 4,5
Número de árvores

3º Quartil Mediana
4 dos valores acima
da mediana

Mediana 3

2
(1 + 2)/2 = 1,5
1º Quartil Mediana
1 dos valores abaixo
da mediana

Parcelas
Como medir variabilidade e simetria ?

2 – Intervalo Interquartílico (IQR) (Quantitativa e Qualitativa)

IQR = 4,5 - 1,5 = 3

5
(4 + 5)/2 = 4,5
Número de árvores

3º Quartil Mediana
4 dos valores acima
da mediana

Mediana 3

2
(1 + 2)/2 = 1,5
1º Quartil Mediana
1 dos valores abaixo
da mediana

Parcelas
Distribuição Amostral e Erro Padrão da Média
DISTRIBUIÇÃO AMOSTRAL

Distribuição de frequências das


médias de todas as amostras
possíveis de tamanho amostral (n)
de uma mesma população. Está
centrada no mesmo valor que a
média da população.

Distribuição
Amostral
da média
Por que este procedimento funciona?

Isto está associado ao conceito de distribuição amostral da média

Suponha uma população...


B C

A variável aleatória, X,
é a idade dos indivíduos

Os valores de X: 18, 20, 22, 24


medidos em anos.
D
TODOS os indivíduos apresentam
alguma destas idades

A
Características da População
Medidas descritivas Distribuição da população
N

X i
 i 1 P(X)
N
.3
18  20  22  24 .2
  21
4
.1

N
0 X
 X   A B C D
2
i
  i 1
 2.236 (18) (20) (22) (24)
N

Distribuição Uniforme
Amostras possíveis de tamanho
n=2
1st 2nd Obs
Obs 18 20 22 24 16 médias amostrais
18 18,18 18,20 18,22 18,24 1st 2nd Obs
20 20,18 20,20 20,22 20,24 Obs 18 20 22 24
22 22,18 22,20 22,22 22,24 18 18 19 20 21
24 24,18 24,20 24,22 24,24 20 19 20 21 22
16 amostras 22 20 21 22 23
Amostras tomadas com 24 21 22 23 24
reposição
Distribuição Amostral de
todas as médias Amostrais
16 médias amostrais Distribuição das
1st 2nd Observation médias amostrais
Obs 18 20 22 24 P(X)
18 18 19 20 21 .3

20 19 20 21 22 .2

22 20 21 22 23 .1
_
24 21 22 23 24 0
18 19 20 21 22 23 24 X

n na amostra = 2, n na distribuição amostral = 16


Medidas importantes para
distribuição amostral
N

X i
18  19  19    24
x  i 1
  21
N 16

 X  x 
N
2
i
x  i 1
N


18  21  19  21
2 2
   24  21
2
 1.58
16
Comparando a distribuição populacional
com a distribuição amostral
População Distribuição amostral da média
n=2
= 21,  = 2.236  x  21  x  1.58
P(X) P(X)
.3 .3

.2 .2
.1 .1

0 0 _
A B C D X 18 19 20 21 22 23 24 X
(18) (20) (22) (24)
Resultados para outros tamanhos
amostrais
Tamanho Desvio
Média Variância
Amostral padrão
1 21 5,00 2,24
2 21 2,50 1,58
3 21 1,67 1,29
4 21 1,25 1,12
Trabalhando com probabilidades
Trabalhando com probabilidades

y = -ax2+bx+c
Trabalhando com probabilidades
Distribuições contínuas

A área total abaixo da curva é considerada como 100%. Isto é,


a área total abaixo da curva é 1.

área=1

área=0,5 área=0,5
Distribuições contínuas
Percentuais da distribuição Normal:
Distribuições contínuas
Percentuais da distribuição Normal:
Estimativa do Intervalo de Confiança
Baseado na Curva Normal
(Variável Quantitativa)
Erro Padrão
da Média
Média Amostral

I.C. = X +_ Z* s(X)

Intervalo de
confiança 95% - 1,96
s(X) = s
99% - 2,58
√n

+_ s
I.C. = X Z*
√n
Estimativa do Intervalo de Confiança
Baseado na Curva Normal
(Proporção - Variável Qualitativa)

Proporção Amostral

p.(1  p )
p p  p  Z .
2 n
95% - 1,96
Intervalo de
confiança 99% - 2,58
Amostras pequenas (< 30)
𝑠𝑥
𝐼𝐶95% = 𝑋 ± 𝑡𝛼 2,𝑛−1
𝑛
Amostras pequenas (< 30)
Amostras pequenas (< 30)
Distribuições Assimétricas
Intervalo de Confiança utilizando Bootstrap

Você também pode gostar