Escolar Documentos
Profissional Documentos
Cultura Documentos
FACULDADE DE VETERINÁRIA
LICENCIATURA EM CIÊNCIAS E TECNOLOGIA DE ALIMENTOS
Disciplina: Bioestatística
Docentes:
dr Leonel Nhambi & dra. Nelsa Combo
Tópicos
• Considerações Iniciais: a bioestatística ira
Medidas de posição e variabilidade
desempenha um papel fundamental na análise
de dados coletados no contesto de testes
Distribuição Normal
químicos e ensaios biológicos, bem como em
estudos de outras áreas como epidemiologia,
Estimação e Teste de Hipótese
política sanitária, saúde pública e familiar entre
outras
Analise de Variância (ANOVA)
Conceitos Preliminares
Distribuição qui quadrado
Planeamento da Pesquisa e as Técnicas de
Amostragem Coeficiente de Correlação entre duas
variáveis.
Organização e apresentação de dados
Correlação e regressão linear simples
Distribuição de Frequência
Apresentação Gráfica.
Conceitos
Estatística
Estatística descritiva ou Análise exploratória de dados
Estatística Indutiva e Inferencial
Probabilidade
População e amostra
Parâmetro e estatística
Dados primários e secundários
Censo
Variável
Conceitos
• Estatística: é a ciência que tem por objetivo planejar, coletar, tabular,
analisar e interpretar informações e delas extrair conclusões que
permitam a tomada de decisões acertadas mediante incertezas.
• Áreas: Estatística Descritiva e Estatística Inferencial ou Indutiva e
Probabilidade;
• Bioestatística – é um ramo da estatística que tem como objetivo
aplicar métodos e técnicas estatísticas para solucionar problemas da
área de biologia, epidemiologia, saúde publica, medicina, agricultura,
produção alimentar, etc.
Conceitos
População: é o conjunto de elementos (valores, pessoas, medidas
etc.) que tem pelos menos uma característica em comum.
Amostra: é um subconjunto de elementos extraídos de uma
população
Parâmetro: é uma medida numérica que descreve uma característica
de uma população.
Estatística: é uma medida numérica que descreve uma característica
da amostra.
Dados primários: dados coletados pelo próprio pesquisador e sua
equipe.
Dados secundários: não foram obtidos pelo pesquisador e sua
equipe (diversas fontes como artigos em periódicos, institutos de
pesquisa, INE, INS, OMS).
Conceitos
• Censo: é uma coleção de dados relativos a todos os elementos de
uma população.
• Variável: é a característica de interesse que é medida em cada
elemento da amostra ou população, podendo ter resultados
numéricos ou não. Seus valores variam de elemento a elemento.
Conceitos
• Censo: é uma coleção de dados relativos a todos os elementos de
uma população.
• Variável: é a característica de interesse que é medida em cada
elemento da amostra ou população, podendo ter resultados
numéricos ou não. Seus valores variam de elemento a elemento.
Variáveis - Classificação
Tipos de estudo
• Estudo observacional: verificamos e medimos características
específicas, mas não tentamos manipular ou modificar os elementos
a serem estudados.
• Estudo transversal: dados são observados, medidos e coletados em
um ponto no tempo.
• Estudo retrospectivo ou de caso controle: os dados são coletados do
passado, voltando-se no tempo.
• Estudo prospectivo ou longitudinal ou de coorte: os dados são
coletados no decorrer do tempo, de grupos (coortes) que
compartilham fatores comuns.
Tipos de estudo
• Estudo observacional: verificamos e medimos características
específicas, mas não tentamos manipular ou modificar os elementos
a serem estudados.
• Estudo transversal: dados são observados, medidos e coletados em
um ponto no tempo.
• Estudo retrospectivo ou de caso controle: os dados são coletados do
passado, voltando-se no tempo.
• Estudo prospectivo ou longitudinal ou de coorte: os dados são
coletados no decorrer do tempo, de grupos (coortes) que
compartilham fatores comuns.
Experimentos
Controlando os efeitos das variáveis
• Experimentos cegos: o sujeito não sabe se está recebendo o tratamento ou
o placebo.
• Blocos: para testar a eficácia de um ou mais tratamentos é importante
colocar os sujeitos em grupos diferentes (ou blocos) de tal modo que os
grupos sejam muito semelhantes.
• Planejamento experimental completamente aleatorizado: os sujeitos são
colocados nos blocos através de um processo de seleção aleatória.
• Planejamento rigorosamente controlado: sujeitos são escolhidos
cuidadosamente de modo que em cada bloco sejam similares.
Tipos de estudos
Levantamento de dados
Problemas usuais - Representatividade
• Fator associado à forma de amostragem.
• Na seleção da amostra procura-se reproduzir as características
observáveis da população - uso do critério de proporcionalidade.
• Em caso de desconhecimento da composição da população deve-se
utilizar algum critério de aleatoriedade (sorteio).
• Amostra tendenciosa – conclusões sem consistência.
Levantamento de dados
Problemas usuais – Fidedignidade
Relacionada à precisão ou qualidade dos dados.
Motivos da falta de precisão:
Falhas nos instrumentos de aferição;
Problemas nos questionários empregados na obtenção dos dados;
Falha humana.
Levantamento de dados
A importância da coleta de dados
Bom Questionário;
Perguntas abertas e fechadas;
Amplitude total ou “Range” é a diferença entre o maior valor e o menor da série estatística, ou é a
diferença entre os extremos do rol. At = Xmax - Xmin
Consideremos a seguinte tabela que representa as alturas de 50 indivíduos medidos até aos centímetros
162.188 173 168 179 183 167 186 177 187 174 164 174 159 177 173 163
180.196 171 184 179 190 181 166 181 182 176 169 172 162 175 192 178
177 200 191 188 168 165 193 175 160 180 187 176 170 156 174 179
Desta forma e atendendo que o número de observações é grande, vamos fazer um agrupamento das
unidades estatísticas em classes. A escolha do número de classes é variável consoante a conveniência e o
número de casos observados.
Distribuições de Frequências
Passos Para fazer tabela de frequências em classes: Exemplo
22%
33%
44%
Gráficos
Gráfico de barras: consiste em construir retângulos ou barras, em que uma das
dimensões é proporcional a magnitude a ser representada (fi). Estas barras são
dispostas paralelamente umas das outras, horizontalmente ou verticalmente
100
90
90
80
70
70
60
50 45
40
30 24
20
12
10
0
1a Classe 2a Classe 3a Classe 4a Classe 5a Classe
50
Frequencias Acumuladas (Fi)
40
30
20
10
0
159.15 165.45 171.75 178.05 184.35 190.65 196.95
x1 x 2 x3 ... x n x i
Simples: X i 1
n n
n
xˆ1 f 1 xˆ 2 f 2 xˆ 3 f 3 ... xˆ n f n xˆ i fi
Ponderada: X i 1
f 1 f 2 f 3 ... f n n
f
i 1
i
Medidas de tendência central
A Moda (Mo) define-se como o valor da variável que ocorre com mais frequência. Para casos em que o número das
observações não é muito elevado esta medida pode ser lida no rol. De acordo com as frequências de cada valor
observado, é possível não ter uma moda (distribuição amodal), ter uma (unimodal), duas (bimodal), três (trimodal), etc.
f mo f a
Mo xi i
2 f mo ( f a f p )
Onde:
xi – Limite inferior da classe modal
fmo – frequência da classe modal
fa – frequência da classe anterior a classe modal
fp – frequência da classe posterior a classe modal
i – intervalo de classe da classe modal
Medidas de tendência central
A Mediana (Me) –é uma separatriz que divide a distribuição ou conjunto de dados em duas partes iguais.
Para dados não agrupados, a mediana é o valor que está na posição mediana para n ímpar e é a média aritmética dos dois
valores centrais para n par.
Para dados agrupados em classe, a mediana é determinada por aproximação. A determinação da classe mediana passa pelo
cálculo das frequências acumuladas.
n
Fa
Me xi 2 i
f me
Onde:
xi –limite inferior da classe mediana
fme – frequência da classe mediana
Fa – frequência acumulada da classe anterior a classe mediana
i – intervalo de classe da classe mediana.
Medidas de tendência central
Exemplo: A partir da tabela apresentada, determine a média, moda e mediana da distribuição.
i Classes fi xi Xi*fi Fi
1 10 – 20 10 15 150 10 Media:
2 20 - 30 20 25 500 30 7
3 30 – 40 35 35 1225 65
xˆ i fi
6400
X i 1
7
42.67
4 40 – 50 40 45 1800 105 150
f i
5 50 – 60 25 55 1375 130 i 1
6 60 – 70 15 65 975 145
7 70 – 80 5 75 375 150
Somatório - 150 - 6400 -
f mo f a 40 35
Moda: Mo xi i 40 10 42.5
2 f mo ( f a f p ) 2 40 (35 25)
n 150
Fa 65
Mediana: Me xi 2 i 40 2 10 42.5
f me 40
Medidas de Posição: Quartís, Decís e Percentís
Como foi referido, para além da média, os quartís, decís e percentís são outros separatrizes utilizados como medidas de
posição.
Onde:
nc c- é a ordem do quartil
Fa liqc –limite inferior da classe onde existe o
Qc liqc 4 i c 1,2,3 quartil
f qc Fa –Frequência acumulada até a classe onde
existe o quartil.
fqc – frequência absoluta da classe onde existe
o quartil.
Medidas de Posição: Quartís, Decís e Percentís
Os Decis dividem o conjunto de dados ou distribuição de frequências em dez partes iguais.
Onde:
nc c- é a ordem do decil
Fa lidc –limite inferior da classe onde existe o
Dc lidc 10 i c 1,2,3,...,9 decil
f dc Fa –Frequência acumulada até a classe onde
existe o decil.
fqc – frequência absoluta da classe onde existe
o decil.
Medidas de Posição: Quartís, Decís e Percentís
Os Percentis dividem o conjunto de dados ou distribuição de frequências em cem partes iguais.
Onde:
c- é a ordem do percentil
lidc –limite inferior da classe onde existe o
percentil.
Fa –Frequência acumulada até a classe onde
existe o percentil.
fqc – frequência absoluta da classe onde existe
o percentil.
Medidas de Posição: Quartís, Decís e Percentís
Exemplos: Registaram-se as alturas de 100 estudantes de uma faculdade, tendo-se obtido a seguinte tabela de
distribuição de frequências:
i classes fi Fi Mediana:
1 1.40 – 1.46 7 7 n
Fa
2 1.46 – 1.52 9 16 2 50 33
Me li i 1.64 0.06 1.68
3 1.52 – 1.52 5 21 f me 26
4 1.58 – 1.64 12 33
5 1.64 – 1.70 26 59
Quartil 1:
6 1.70 – 1.76 20 79
7 1.76 – 1.82 11 90 n 1
Fa
8 1.82 – 1.88 10 100 4 25 21
Q1 l iq1 i 1.58 0.06 1.60
– 100 – f q1 12
Onde:
c- é a ordem do percentil
lidc –limite inferior da classe onde existe o
percentil.
Fa –Frequência acumulada até a classe onde
existe o percentil.
fqc – frequência absoluta da classe onde existe
o percentil.
Posições relativas entre a media aritmética, moda e mediana
Para curvas de distribuições de frequências unimodais com um grande número de
observações verificam-se as seguintes relações:
a)Distribuições simétricas: Media=Mediana=Moda
b)Distribuições com assimetria positiva: Media> Mediana> Moda
c)Distribuições com assimetria negativa: Media<Mediana<Moda
Medidas de Dispersão
Para medir o grau de variabilidade ou dispersão de um conjunto de valores são calculadas outras medidas estatísticas
denominadas medidas de dispersão.
As medidas de dispersão permitem verificar as flutuações das observações face as medidas de tendência central. Elas
proporcionam um conhecimento mais completo do fenómeno a ser analisado em termos de conjuntos absolutos bem como
relativos, estabelecendo comparações entre fenómenos de mesma natureza e mostrando até que ponto os valores se
distribuem acima e abaixo da medida de tendência central.
Variância ou dispersão(2) de um conjunto de números, é a média aritmética dos quadrados dos desvios absolutos desses
números em relação a sua média aritmética.
n n
( xi x ) 2
(x i x)2 fi
Para Dados em classes:
2 i 1
Para Dados simples:
2 i 1 n
n 1 f
i 1
i
Medidas de Dispersão
O Desvio padrão () é a medida de dispersão mais usada. O desvio padrão é a raiz quadrada positiva da média aritmética
dos quadrados dos desvios dos valores observados em relação a grandeza média.
(x
n
i x) 2
(x i x)2 fi
i 1
Para Dados simples: i 1 Para Dados em classes: n
n 1 f
i 1
i
Os coeficientes de variação são medidas de variação relativas que muitas vezes são expressas em percentagem, eles
resultam do quociente entre uma medida de dispersão absoluta e um promédio.
Coeficiente de variação. Quando a dispersão absoluta é igual ao desvio padrão e o promédio é a média aritmética, a
dispersão real é denominada coeficiente de variação de Pearson. Este é o coeficiente mais vulgar e é o mais utilizado
designando-se coeficiente de variação ou coeficiente de dispersão, seu valor é expresso muitas vezes em percentagem
Cv
x ou C v
x
100%
Posições relativas entre a media aritmética, moda e mediana
Duma maneira geral, quando comparamos dispersões podem ocorrer três situações:
As observações vêm expressas na mesma unidade de medida, e as médias são iguais ou
muito próximas, é conveniente comparar com os valores de desvio padrão.
As observações vem expressas na mesma unidade de medida e as médias são
significativamente diferentes, é conveniente comparar com as medidas de dispersão
relativa como o coeficiente de variação de Pearson.
As observações vêm expressas em unidades de medida diferentes, é totalmente
conveniente neste caso comparar com as medidas de dispersão relativa como o
coeficiente de variação de Pearson.
Posições relativas entre a media aritmética, moda e mediana
Exemplo: Calcular a variância e o respectivo desvio padrão das notas obtidas num teste
realizado para 50 estudantes Media:
7
i xi fi xifi xi x ( xi x ) 2 f i x i fi
532
1 8 7 56 -2.64 48.7872 x i 1
10.64
50 50
2 7 8 72 -1.64 21.5168
Variância:
3 10 9 90 -0.64 3.6864
4 11 10 110 0.36 1.2960
5 12 8 96 1.36 14.7968
6 13 4 52 2.36 22.2784
Desvio Padrão:
7 14 4 56 3.36 45.1584
– 50 532 – 157.5200 ∑ 𝑥 − 𝑥̄ ⋅ 𝑓 157.52
s= = = 3.21 = 1.79
𝑛−1 50 − 1
Introdução a Probabilidades
47
Eventos certo, impossível e mutuamente
exclusivos
48
Exemplos:
49
Exemplos:
B=
50
Exemplos:
C = 2, 4, 6
51
Exemplos:
53
PROBABILIDADE DE OCORRER UM EVENTO
número de elementos de A n( A)
P( A) P( A)
número de elementos de n()
54
Exemplos
55
Exemplos:
n( A) 2 1
P( A) P ( A) P ( A)
n() 6 3
Exemplos:
C = cara K = coroa
= CCC, CCK, CKC, CKK, KCC, KCK, KKC, KKK
n() = 8
A = CCC, CCK, CKC, KCC n(A) = 4
Exemplos:
3
P ( B ) 0,375 37,5
8
Exemplos:
Ex.: 4 Vamos formar todos os números de 3 algarismos
distintos, permutando os dígitos 7, 8 e 9. Qual é a
probabilidade de, escolhendo um número desses ao
acaso, ele ser:
a) ímpar b) par? c) múltiplo de 6? d)
múltiplo de 4? e) maior que 780?
2 1
P( B) 0,33 33%
6 3
Exemplos:
c) Evento C: ser múltiplo de 6 C = 798, 978
2
P(C ) 0,33 33%
6
d) Evento D: ser múltiplo de 4 D= n(D) = 0
n( D ) 0
P( D) 0 0%
n( ) 6
e) Evento E: ser maior que 780 E = n(E) = 6
n( E ) 6
P( E ) 1 100%
n ( ) 6
61
Exemplos:
Ex.: 5: Consideremos todos os números naturais de 4 algarismos distintos que
se podem formar com os algarismos 1, 3, 4, 7, 8 e 9. Escolhendo um deles ao
acaso, qual é a probabilidade de sair um número que comece por 3 e termine
por 7?
6! 6! 6.5.4.3.2!
___ ___ ___ ___ n() A6, 4 360
(6 4)! 2! 2!
4! 4.3.2!
n( A) A4, 2 12
3 ___ ___ 7 (4 2)! 2!
n( A) 12 1
P ( A) 0,033 3,33%
n() 360 30
62
Exemplos:
63
Exemplos:
M
6 8
E
9
16
14
6
L 11
n() = 75
gostam de música: 6 + 8 + 16 + 14 = 44
não gostam de nenhuma dessas atividades:
75 – (6 + 9 + 5 + 8 + 6 + 14 + 16) = 75 – 64 = 11
64
Exemplos:
a) a probabilidade de gostar de música:
n ( A) 44
P ( A) 58 %
n ( ) 75
b) probabilidade de não gostar de nenhuma dessas
atividades:
n ( B ) 11
P(B) 14 %
n ( ) 75
65
Eventos complementares
A probabilidade de se obter sucesso em um evento é
dado por p.
Então p + q = 1 (100%)
67
Eventos mutuamente exclusivos
68
Eventos mutuamente exclusivos
P = P1 + P2
69
Eventos mutuamente exclusivos
70
PROBABILIDADE DA UNIÃO DE DOIS EVENTOS
n( A B ) n( A) n( B ) n( A B )
n( A B ) n( A) n( B ) n( A B )
n ( ) n ( ) n ( ) n ( )
P ( A B ) P ( A) P ( B ) P ( A B ) 71
Exemplos:
72
Exemplos:
1 3 1
P(A B) =
6 6 6
P(A B) = 3
6
Exemplos:
P ( A B) P ( A) P ( B) P ( A B)
74
Exemplos:
26 4 2
P( A B)
52 52 52
28
P( A B)
52
7
P( A B ) 53,8%
13
75
PROBABILIDADE DO EVENTO COMPLEMENTAR
A probabilidade de não ocorrer o evento A é a
probabilidade de ocorrer o evento complementar de
A, representado por .
Nessas condições, temos :
Então, A A e A A
P ( ) P ( A A)
1 P( A) P( A) P ( A) 1 P ( A)
Exemplos:
Exemplo 9: No lançamento simultâneo de dois dados perfeitos distinguíveis, vamos
calcular a probabilidade de NÃO sair soma 5.
Resultados possíveis no
lançamento de 2 dados:
= {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6),
1 2 3 4 5 6
(2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1),
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2),
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3),
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4),
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (6,5), (6,6)}. n() = 36.
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) Seja A o evento “sair soma 5”. Então:
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
A = {(1,4), (2,3), (3,2), (4,1)} n(A) = 4
77
Exemplos:
n( A) 4 1
P( A)
n() 36 9
1
P ( A) 1 P( A) P( A) 1
9
8
P( A)
9
Variáveis Aleatórias
Variáveis Aleatórias
x 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8
E ( X ) [ X .P( X )]
onde (letra grega, mi) representa a média (ou valor esperado) e P(X) é a probabilidade dos vários
resultados de X.
Variância e o Desvio Padrão de uma Distribuição de
Probabilidade Discreta
A variância mede a quantidade de dispersão ou variabilidade de uma distribuição. Ela é denotada pela
letra grega (sigma ao quadrado).
2
[(X ) P( X )]
2 2
O desvio padrão é: 2
Variáveis Aleatórias Contínuas
Diferentemente de uma variável aleatória discreta, para uma variável aleatória
contínua não podemos definir uma função de distribuição de probabilidade (f.d.p.). No
entanto, podemos definir o que se chama de uma função densidade de probabilidade
para as variáveis aleatórias contínuas.
• se integrarmos esta função no intervalo o valor desta integral definida será igual a 1.
Variáveis Aleatórias Contínuas - Valor Esperado (média) e
variância
A média (ou valor esperado) de uma variável aleatória
contínua é dada pela expressão:
E[ X ]
Xf ( X )dx
A variância de uma variável aleatória contínua é dada pela
expressão:
V[ X ] (X E[ X ])2 f (X )dx
Função de Distribuição Acumulada
• A função de distribuição acumulada de uma variável aleatória X é a
função FX: RR definida por
FX(x) = P(X ≤ x)
Função de Distribuição Acumulada
• Exemplo: x 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8
1
7/8
1/2
1/8
1 2 3
Se x < 0: P(X≤x) = 0
Se 0 ≤ x <1: P(X≤x) = P(X=0) = 1/8
Se 1 ≤ x <2: P(X≤x) = P(X=0 ou X=1) = 1/8 + 3/8 = 1/2
Variáveis Aleatórias
Distribuições teóricas de probabilidade
Probabilidade Total Distribuição Binomial
Teorema de Bayes Distribuição de Poisson
Prática de Probabilidades Distribuição Normal
Aula Pratica de distribuições
Função de Distribuição Acumulada
• Exemplo: x 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8
1
7/8
1/2
1/8
1 2 3
Se x < 0: P(X≤x) = 0
Se 0 ≤ x <1: P(X≤x) = P(X=0) = 1/8
Se 1 ≤ x <2: P(X≤x) = P(X=0 ou X=1) = 1/8 + 3/8 = 1/2