Escolar Documentos
Profissional Documentos
Cultura Documentos
Introdução à Bioestatística
100 observações de
valores de colesterol
(mg/dl) amostrados
de uma população
de crianças com
idades entre 5 e 8
anos filhas de pais
separados nascidas
em Salvador – Bahia.
Estatística extrai informação de dados !
Utilização da estatística em pesquisa
Nominal
Binária
Ordinal
Qualitativa
Nominal
Multi-estado
Ordinal
Intervalar
Discreta
Razão
Quantitativa
Intervalar
Contínua
Razão
Tipos de estudos estatísticos
Estudos Observacionais
Fonte: http://researchhubs.com/uploads/duke%20data%20science%20-%20data%203.png
Tipos de estudos estatísticos
Experimentos Controlados
Fonte: https://scienceornot.files.wordpress.com/2012/01/controlled-expt2.jpg
Tipos de estudos estatísticos
Fronte:https://scienceornot.files.wordpress.com/2012/01/rct.jpg
Tipos de amostragem
Aleatória Simples
Sistemática
Estratificada
Por conglomerados
Tipos de amostragem
1/N-1 Sem-reposição
http://researchhubs.com/uploads/duke%20data%20science%20-%20sampling%201.png
Tipos de amostragem
Amostragem “Haphazard” ou “à
esmo”
2. Método pseudo-aleatório de
seleção (olhos fechados,
pensando em nada, etc...)
Amostragem Sistemática
k k k
1...k ...N
População
Amostra
1 n
Tipos de amostragem
Amostragem Estratificada
População HETEROGÊNEA em
relação à variável sob estudo.
http://www.education-savvy.blogspot.com/
http://researchhubs.com/uploads/duke%20data%20science%20-%20sampling%203.png
Tipos de amostragem
Tabela de Frequências
Tabelas
Tabela de Contingência 2 x 2
Qualitativas
Quantitativa e Qualitativa
Gráficos
Estado Freq.
Pessoa Idade Sexo Estado Salario BA 3
1 25 M BA 25 RJ 5
2 28 F RJ 36 SP 4
3 31 M SP 44
4 35 F SP 38
Freqüência por Estado
5 36 M RJ 56
6
6 38 F SP 68
5
7 42 M RJ 79 4
8 51 F BA 64 3
2
9 55 M RJ 88
1
10 61 F BA 71
0
11 62 M RJ 92 BA RJ SP
12 65 F SP 54
Gráficos
Estado Freq.
BA 3
Freqüência por Estado
RJ 5
SP 4
3; 25% BA
4; 33%
RJ
SP
5; 42%
Gráficos
Quantitativa Quantitativa
Dispersão
(Discreta ou Contínua) (Discreta ou Contínua)
Quantitativa Qualitativa
Gráfico de densidade de pontos transposto
(Discreta ou Contínua) (Binária ou Multi-estado)
Número de árvores
Parcelas
Como representar o conjunto?
2 – Mediana (Quantitativa)
Número de árvores
Mediana
Parcelas
Como representar o conjunto?
Mediana = Alta
Alta
Alta
Alta
Baixa
Baixa
Biodiversidade
Como representar o conjunto?
4 – Moda (Quantitativa)
Parcelas
Como representar o conjunto?
5 – Moda (Qualitativa)
Moda = Alta
Alta
alta = 3
baixa = 2
Alta
Alta
Baixa
Baixa
Biodiversidade
Como representar o conjunto?
6 – Proporção (Qualitativa)
P(alta) = 0,6
P(baixa) = 0,4
Alta
alta = 3/5 = 0,6
baixa = 2/5 = 0,4
Alta
Alta
Baixa
Baixa
Biodiversidade
Como medir variabilidade ?
Problemas:
Número de árvores
Só leva em consideração 2
valores da distribuição.
Parcelas
Como medir variabilidade ?
X5 – Média = 2
Número de árvores
X4 – Média = 1
X3 – Média = 0
X2 – Média = - 1
X1 – Média = - 2
Parcelas
Como medir variabilidade ?
X5 – Média = 2
Número de árvores
X4 – Média = 1
X3 – Média = 0
X2 – Média = - 1
X1 – Média = - 2
Parcelas
Como medir variabilidade ?
X5 – Média = 2
Número de árvores
X4 – Média = 1
X3 – Média = 0
X2 – Média = - 1
Vantagens/Desvantagens:
X1 – Média = - 2
Mesma escala da variável
Características ruins para inferência
Parcelas
Como medir variabilidade ?
X5 – Média = 2
Número de árvores
X4 – Média = 1
X3 – Média = 0
X2 – Média = - 1
Vantagens/Desvantagens:
X1 – Média = - 2
Escala quadrática ????????
Características boas para inferência
Parcelas
Como medir variabilidade ?
X5 – Média = 2
Número de árvores
X4 – Média = 1
X3 – Média = 0
X2 – Média = - 1
Vantagens/Desvantagens:
X1 – Média = - 2
Mesma escala da variável
Características boas para inferência
Parcelas
Como medir variabilidade ?
X5 – Média = 2
Número de árvores
X4 – Média = 1
X3 – Média = 0
X2 – Média = - 1
Vantagens/Desvantagens:
X1 – Média = - 2
Independente da média
Bom para comparar variáveis com médias diferentes
Parcelas
Como medir variabilidade e simetria ?
5
(4 + 5)/2 = 4,5
Número de árvores
3º Quartil Mediana
4 dos valores acima
da mediana
Mediana 3
2
(1 + 2)/2 = 1,5
1º Quartil Mediana
1 dos valores abaixo
da mediana
Parcelas
Como medir variabilidade e simetria ?
5
(4 + 5)/2 = 4,5
Número de árvores
3º Quartil Mediana
4 dos valores acima
da mediana
Mediana 3
2
(1 + 2)/2 = 1,5
1º Quartil Mediana
1 dos valores abaixo
da mediana
Parcelas
Distribuição Amostral e Erro Padrão da Média
DISTRIBUIÇÃO AMOSTRAL
Distribuição
Amostral
da média
Por que este procedimento funciona?
A variável aleatória, X,
é a idade dos indivíduos
A
Características da População
Medidas descritivas Distribuição da população
N
X i
i 1 P(X)
N
.3
18 20 22 24 .2
21
4
.1
N
0 X
X A B C D
2
i
i 1
2.236 (18) (20) (22) (24)
N
Distribuição Uniforme
Amostras possíveis de tamanho
n=2
1st 2nd Obs
Obs 18 20 22 24 16 médias amostrais
18 18,18 18,20 18,22 18,24 1st 2nd Obs
20 20,18 20,20 20,22 20,24 Obs 18 20 22 24
22 22,18 22,20 22,22 22,24 18 18 19 20 21
24 24,18 24,20 24,22 24,24 20 19 20 21 22
16 amostras 22 20 21 22 23
Amostras tomadas com 24 21 22 23 24
reposição
Distribuição Amostral de
todas as médias Amostrais
16 médias amostrais Distribuição das
1st 2nd Observation médias amostrais
Obs 18 20 22 24 P(X)
18 18 19 20 21 .3
20 19 20 21 22 .2
22 20 21 22 23 .1
_
24 21 22 23 24 0
18 19 20 21 22 23 24 X
X i
18 19 19 24
x i 1
21
N 16
X x
N
2
i
x i 1
N
18 21 19 21
2 2
24 21
2
1.58
16
Comparando a distribuição populacional
com a distribuição amostral
População Distribuição amostral da média
n=2
= 21, = 2.236 x 21 x 1.58
P(X) P(X)
.3 .3
.2 .2
.1 .1
0 0 _
A B C D X 18 19 20 21 22 23 24 X
(18) (20) (22) (24)
Resultados para outros tamanhos
amostrais
Tamanho Desvio
Média Variância
Amostral padrão
1 21 5,00 2,24
2 21 2,50 1,58
3 21 1,67 1,29
4 21 1,25 1,12
Trabalhando com probabilidades
Trabalhando com probabilidades
y = -ax2+bx+c
Trabalhando com probabilidades
Distribuições contínuas
área=1
área=0,5 área=0,5
Distribuições contínuas
Percentuais da distribuição Normal:
Distribuições contínuas
Percentuais da distribuição Normal:
Estimativa do Intervalo de Confiança
Baseado na Curva Normal
(Variável Quantitativa)
Erro Padrão
da Média
Média Amostral
I.C. = X +_ Z* s(X)
Intervalo de
confiança 95% - 1,96
s(X) = s
99% - 2,58
√n
+_ s
I.C. = X Z*
√n
Estimativa do Intervalo de Confiança
Baseado na Curva Normal
(Proporção - Variável Qualitativa)
Proporção Amostral
p.(1 p )
p p p Z .
2 n
95% - 1,96
Intervalo de
confiança 99% - 2,58
Amostras pequenas (< 30)
𝑠𝑥
𝐼𝐶95% = 𝑋 ± 𝑡𝛼 2,𝑛−1
𝑛
Amostras pequenas (< 30)
Amostras pequenas (< 30)
Distribuições Assimétricas
Intervalo de Confiança utilizando Bootstrap