Você está na página 1de 59

Introdução a Bioestatística

Aula remota (01/06/2021)


● Estatística - é a ciência que tem por objetivo coletar dados, tabular, analisar e
interpretar informações e delas extrair conclusões válidas para a tomar
decisões.
● Estatística descritiva- ramo da estatística que aplica várias técnicas (baseada
na matemática) para descrever e sumarizar um conjunto de dados.
● Estatística inferencial- aplica várias técnicas (baseada na matemática), a partir
de uma amostra, para tirar conclusões sobre uma população.
● Bioestatística - aplicação da estatística nos campos relacionados a Saúde,
Biologia, Biotecnologia, entre outros.
● População-conjunto de quaisquer elementos (valores, pessoas, objetos, etc...
.).
● Amostra- é um subconjunto de uma população.
● Amostra aleatória- os elementos da população são escolhidos de tal forma
que cada um deles tenha igual chance de fazer parte da amostra.
● Amostra Aleatória Simples de n elementos – escolhe-se, de maneira que toda
a amostra de tamanho n possível tenha a mesma chance de ser escolhida.
● Média aritmética, variância e desvio padrão.
Ex: 1,2, e 3; 𝑁𝑜𝑡𝑎çã𝑜: 𝑁 = 3 (𝑃𝑜𝑝𝑢𝑙𝑎çã𝑜); 𝑛 = 3 (𝐴𝑚𝑜𝑠𝑡𝑟𝑎)
∑𝑁
𝑖 𝑋𝑖 𝑋1 +𝑋2 +𝑋3 1+2+3
Média: = = = 2 (População);
𝑁 𝑁 3
∑𝑛
𝑖 𝑋𝑖 𝑋1 +𝑋2 +𝑋3 1+2+3
Média: = = = 2 (Amostra).
𝑛 𝑛 3

Variância: média das distâncias de cada valor da série em relação à média do


grupo.
∑𝑁
𝑖=1(𝑋𝑖 −2)
2 (1−2)2 +(2−2)2 +(3−2)2
Variância: = = 0,67;
𝑁 3

∑𝑁
𝑖=1(𝑋𝑖 −µ)
2
Desvio padrão: √ = √0,67=0,82.
𝑁

Notação
∑𝑁
𝑖=1(𝑋𝑖 −µ)
2 ∑𝑁
𝑖=1 𝑋𝑖
2
Variância populacional: 𝜎 2 = = − µ2 ;
𝑁 𝑁
2
(∑𝑛
𝑖=1 𝑋𝑖 )
∑𝑛 ̅ 2 ∑𝑁 2
𝑖=1 𝑋𝑖 −
𝑖=1(𝑋𝑖 −𝑋 )
Variância Amostral: 𝑆 2 = = 𝑛
.
𝑛−1 𝑛−1

Desvio padrão: raiz quadrada da variância.

∑𝑁 2 ∑𝑁 2
𝑖=1(𝑋𝑖 −µ) 𝑖=1 𝑋𝑖
Desvio Padrão Populacional: 𝜎 = √ =√ − µ2 ;
𝑁 𝑁

2
(∑𝑛
𝑖=1 𝑋𝑖 )
∑𝑁 2
∑𝑛 ̅ 2
𝑖=1(𝑋𝑖 −𝑋 ) √ 𝑖=1 𝑋𝑖 −
Desvio Padrão Amostral: 𝑆 = √ = 𝑛
.
𝑛−1 𝑛−1

Exercício de interpretação 1: Interpretar os resultados da pressão arterial


sistólica e diastólica de 2 de dois grupos de atletas (A e B) após uma mesma
prova de esforço.
A: médias 12/8 e variâncias: 0,005/0,004
B: médias 12/8 e variâncias: 17,08/ 15,09
Exercício 2: Determinar o peso médio, a variância e o desvio padrão de uma
amostra aleatória de 10 recém-nascidos, em uma maternidade. Pesos em
quilogramas, como mostrado a seguir:
3,95 3,30 4,40 3,78 3,45 3,88 4,36 3,85 3,75 4,18
∑𝑁
𝑖 𝑋𝑖 𝑋1 +𝑋2 +𝑋3 +𝑋4 +𝑋5 +𝑋6 +𝑋7 +𝑋8 +𝑋9 +𝑋10
Média: = =
𝑛 𝑛
3,95+3,30+4,40+3,78+3,45+3,88+4,36+3,85+3,75+4,18
= 3,89
10
2
(∑𝑛
𝑖=1 𝑋𝑖 ) (38,90)2
∑𝑛 ̅ 2 ∑𝑁 2
𝑖=1 𝑋𝑖 − 152,46−
𝑖=1(𝑋𝑖 −𝑋 )
𝑆2 = = 𝑛
= 10
= 0,13
𝑛−1 𝑛−1 9
2
(∑𝑛
𝑖=1 𝑋𝑖 ) (38,90)2
∑𝑛 ̅ 2
𝑖=1(𝑋𝑖 −𝑋) √∑𝑁𝑖=1 𝑋𝑖2 − 152,46−
S=√ = 𝑛
=√ 10
= 0,36
𝑛−1 𝑛−1 9

Usando o BioEstat: Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna
usando o ponto no lugar da vírgula-marcar dados) ► clicar em Estatísticas ►clicar em
Estatística Descritiva ►clicar em Dados Quantitativos ►Abre quadro (Seleção de
amostra para estatísticas Descritivas-Colunas disponíveis 1 #1) ►clicar em >> ►clicar
em Executar Estatística (abre quadro com as Estatísticas) ►Editar ►Copiar resultados.
- 1-
Tamanho da amostra = 10
Mínimo 3.3000
Máximo 4.4000
Amplitude Total 1.1000
Mediana 3.8650
Primeiro Quartil (25%) 3.7575
Terceiro Quartil (75%) 4.1225
Desvio Interquartílico 0.3650
Média Aritmética 3.8900
Variância 0.1271
Desvio Padrão 0.3565
Erro Padrão 0.1127
Coeficiente de Variação 9.16%
Assimetria (g1) -0.1031
Curtose (g2) -0.5189
Média Harmônica = 3.8601
N (média harmônica) = 10
Média Geométrica = 3.8751
N (média geométrica) = 10
Variância (geom.) = 1.0037
Desvio Padrão (geom.) = 1.0970
Exercício 3: Dado o seguinte conjunto de tempos de reação (em segundos) de
seis indivíduos a um estímulo, 4 2 3 3 6 3. Calcular a média, mediana, moda, a
variância e o desvio padrão.
Aula remota (08/06/2021)
●Estudo observacional- verificamos e medimos características específicas, não
tentamos modificar os elementos a serem estudados.
Ex 1: Local da floresta onde os pássaros se alimentam.
Estação do Árvores Arbusto Chão Total
ano
Primavera 30 20 9 59
Outono 13 22 26 61
Total 43 42 35 120

Perguntas:
Dado que estamos na primavera, qual a proporção dos que se alimentam no
chão?
Dado que os pássaros se alimentam no arbusto, qual a proporção na primavera?

●Estudo experimental- aplicamos determinado tratamento e passamos, então


a observar seus efeitos sobre a variável dos elementos a serem estudados.
Ex2: Comparação da eficácia de 4 variedades (tratamentos) de um medicamento
A B C D
31 24 59 54
23 19 74 46
22 42 43 61
45 33 42 37
49 33 57 52
Perguntas:
Neste caso, quais são as unidades amostrais?
Quais seriam algumas variáveis de interesse?

● Tipos de variáveis
Qualitativa Quantitativa (númerica)
(classificação-
categorica)
Nominal: sexo, estado Discreta: número de
civil, tipo sanguíneo, pessoas doentes,
etc... . número de filhos, nºde
pessoas que usam
ortodôntico, etc... .
Ordinal: nível de Contínua: peso de uma
escolaridade, pessoa, estatura, idade,
intensidade do exercício etc,... .
físico, estágio de uma
doença, etc.. .

● Tabulação:
Variável qualitativa: Distribuição do sexo com relação ao habito de fumar
Sexo Fumantes Não Ex-fumantes Total
fumantes
Masculino 60 (60%) 40 (40%) 50 (50%) 150 (50%)
Feminino 40 (40%) 60 (60%) 50 (50%) 150 (50%)
Total 100 100 100 300
Tipo de gráficos: colunas, barras e setores.
Perguntas:
Considerando o grupo Masculino, qual o percentual de não fumantes?
Qual o percentual de fumantes do sexo Feminino?
Exercício 1: Construir gráficos para representar a tabela de dupla entrada acima.
Variável quantitativa discreta: Nº de filhos por família em 25 domicílios de certa
localidade
Nº de Filhos Frequência (ni) fi
0 1 0,04
1 4 0,16
2 10 0,40
3 6 0,24
4 2 0,08
5 2 0,08
Total 25 1,00

Exercício 2: Construir o gráfico em barras. Sugestão: Use o Bioestat.


Variável quantitativa contínua: Distribuição de frequência das alturas,
expressas, em centímetros, de 30 atletas do sexo masculino de uma
Universidade.
Classe(cm) xi ni fi Ni Fi
162 a 167 164,5 4 0,13 4 0,13
167 a 172 169,5 9 0,30 13 0,43
172 a 177 174,5 8 0,27 21 0,70
177 a 182 179,5 6 0,20 27 0,90
182 a 187 185,5 3 0,10 30 1,00

● xi é o ponto médio da i-ésima classe; é a média dos pontos extremos da classe;


● n é quantidade total de observações;
● ni é a quantidade de observações, ou frequência, da i-ésima classe ( que se
supõe concentrada no respectivo ponto médio);
● fi é a frequência relativa da classe, obtida dividindo-se ni por n;
● Ni é a frequência acumulada até a i-ésima classe, e indica a quantidade de
observações inferiores ao limite superior da classe; é obtida somando-se os
valores das frequências observadas;
● Fi é a frequência relativa acumulada, obtida dividindo-se Ni pelo total de
observações.
Histograma e polígono de frequência: é um conjunto de retângulos com bases
sobre um eixo dividido de acordo com os tamanhos de classe, centros nos
pontos médios
Exercício 3: Construir o Histograma das alturas em centímetros.
168 172 170 181 169 173 164 175 182 177 176 173 170 186 183 170 168 166
169 180 175 164 181 179 172 169 174 171 178 166
Procedimento: Calcular a amplitude total: diferença entre o maior e o menor
valor; dividi-la pelo nº de classes (neste caso, escolher entre 5 e 10 classes); o
valor encontrado será o comprimento da classe, o qual deverá ser somado ao
limite inferior da série para construção da 1ª classe, e assim por diante. Então,
a 1ª classe se inicia no limite inferior até o valor encontrado após a soma acima,
exclusive. Sugiro, também, a construção deste histograma pelo Bioestat: clicar
em gráficos e histograma.
Usando o BioEstat:
Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna-marcar dados) ► clicar
em Gráficos ►clicar em Histograma ► Seleção de amostras para gráfico Histograma (
colunas disponíveis=1) ► clicar >> ► clicar em Executar Estatística (os dados estão
distribuídos em intervalos de classe ►Não) ►Aparece um quadro: Especificação das
classes preencha e clique em confirmar ) ►Histograma aparece ► clicar em Editar
►Copiar (metafile).
Medidas associadas a variáveis quantitativas e gráfico Box Plot
Percentis- divide uma série de dados em 100 grupos (1% cada grupo).
𝐾
Posição (ordem) do percentil de ordem 𝐿 = ( ) × 𝑛 + 0,5
100

Ex: 1 2 3 4 5
50
𝐾 = 50►L = ( ) × 5 + 0,5 = 3(3º 𝑣𝑎𝑙𝑜𝑟 𝑑𝑎 𝑠é𝑟𝑖𝑒 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎)►𝑃50
100
= 3(𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑑𝑒 𝑜𝑟𝑑𝑒𝑚 50 = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 ); 𝑑𝑎í 𝑃25 = 1,75 𝑒 𝑃75
= 4,25.
OBS: 𝑃25 = 1º 𝑄𝑢𝑎𝑟𝑡𝑖𝑙; 𝑃50 = 2º 𝑄𝑢𝑎𝑟𝑡𝑖𝑙 = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎; 𝑃75 = 3º 𝑄𝑢𝑎𝑟𝑡𝑖𝑙

Limites de discrepância:
𝑃25 − 1,5(𝑃75 − 𝑃25 ); 𝑃75 + 1,5(𝑃75 − 𝑃25 ).
Valores discrepantes ou outliers:
< 𝑃25 − 1,5(𝑃75 − 𝑃25 ); > 𝑃75 + 1,5(𝑃75 − 𝑃25 )
25% 25% 25% 25%

1º Q mediana 3º Q
Diagrama em caixas (Box Plot):
Ex 1: 1 2 3 4 5
Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna-marcar dados) ►clicar
em Gráficos ►clicar em Box-Plot: mediana e quartis ou média e desvios ►Seleção de
amostras para gráfico Box-Plot (colunas disponíveis=1) ►clicar >> ►clicar em Executar
Estatística ► Gráfico Box-Plot aparece ►clicar em Editar ►Copiar (metafile).

Para revelar tendências centrais, dispersão, tipo de distribuição e a presença de


outliers (valores extremos).
Exercício 4: Usando o Box Plot comparar a eficácia das 4 variedades
(tratamentos) Ex 2. Calcular a variância entre médias (MSR) e a variância total
(MSE). Calcula F=MSR/MSE.
Comentar:
Assimetria:
𝑥̅ < 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑚𝑜𝑑𝑎► 𝑎𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑎 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑚𝑜𝑑𝑎 ►𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎
𝑚𝑜𝑑𝑎 < 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑥̅ ► 𝑎𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑐𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎

assimétrica negativa simétrica assimétrica positiva


Tendência de simetria

Gráfico ramo – e – folhas:


Exercício 5: A ingestão diária média, per capita, em gramas, de proteínas para
33 países desenvolvidos é:
81 94 116 108 74 79 101 87 93 105 109 93 106 103 100 93 100 78 101 101 95 90
94 90 91 92 100 87 89 90 89 86 85
Solução: Para fazer o ramo- e- folhas, começamos com uma linha vertical ou
horizontal com a seguinte escala: Divide-se cada valor por 10 (10 gramas por
classe) a partir de 70g. O ramo será a parte inteira e as folhas a fracionária.
Somatório:
Mostrar: ∑𝑛𝑖=1(𝑥𝑖 − 𝑦𝑖 ) = ∑𝑛𝑖=1 𝑥𝑖 − ∑𝑛𝑖=1 𝑦𝑖
Aplicar: X =( 3,4,1,4,3,3,2) é o número de brotos por cepa de eucalipto; Y=( 10,1
11,1 10,7 13,1 14,5, 13,5 12,5) é a altura das cepas.
(3-10,1)+(4-11,1)+ ... . +(2-12,5)= -65,50
(3+4+... .+3+2) – (10,1+11,1+... .13,5+ 12,5)=20-85,50=-65,5.
Aula remota (10/06/2021)

Correlação (variável quantitativa)


Introdução:

• Existem situações nas quais há interesse em estudar o comportamento


conjunto de uma ou mais variáveis;

• Em muitos casos, a explicação de um fenômeno de interesse pode estar


associada a outros fatores (variáveis) que contribuem de algum modo para a
ocorrência deste fenômeno.

• O comportamento conjunto de duas variáveis quantitativas pode ser


observado por meio do gráfico de dispersão.

Tipo de correlação:

Perfeita negativa: r=-1; r é o coeficiente de correlação


Correlação nula r=0

Perfeita positiva r=1


Tabela de cálculo

X y 𝑥2 𝑦2 xy
1 1 1 1 1
2 2 4 4 4
3 4 9 16 12
4 5 16 25 20
5 8 25 64 40
∑𝑥∑𝑦 15𝑥20
∑ 𝑥𝑦− 77−
𝑛 5
r= (∑ 𝑥)2 2
= 2 2
= 0,98
√(∑ 𝑥 2 − )(∑ 𝑦 2 −(∑ 𝑦) ) √(55−15 )(110−20 )
𝑛 𝑛 5 5

Usando o BioEstat:
Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna) ►Coluna da esquerda
(Y) e Coluna da direita X (sempre marcar as colunas) ►clicar em Estatísticas ►clicar
em Correlação ►Clicar em coef. De Correlação de Pearson ►Abre quadro: Seleção de
amostras para Teste de Correlação Linear ►clicar em >> ► clicar em Executar
Estatística ►Abre quadro: Teste de Correlação linear ►clicar em Editar ►Copiar
Resultados:
Colunas 1 e 2
n (pares) = 5
r (Pearson) = 0.9815
IC 95% = 0.74 a 1.00
IC 99% = 0.47 a 1.00
R2 = 0.9633
t= 8.8780
GL = 3
(p) = 0.0030
Poder 0.05 = 0.9515
Poder 0.01 = 0.8361

Continuando:
Clicar em Gráfico (abre quadro) ►Editar ►Copiar (metafile)
Diagrama de dispersão

c
Exercício 1: Calcular o coeficiente de correlação de Pearson
Idade(X) Escore de Gesell (Y)
15 95
26 71
10 83
9 91
15 102
20 87
18 93
11 100
8 104
20 94
7 113
9 96
10 83
11 84
11 102
10 100
12 105
42 57
17 121
11 86
10 100
Teste de Gessel- Instrumento de avaliação do desenvolvimento infantil (a
medida que aumenta a idade diminui a falta de habilidade mental)

∑𝑥∑𝑦 302𝑥1967
∑ 𝑥𝑦− 26864−
𝑛 21
r= (∑ 𝑥)2 (∑ 𝑦)2
= 2 2
= −0,64
√(∑ 𝑥 2 − )(∑ 𝑦 2 − ) √(5606−302 )(188155−1967 )
𝑛 𝑛 21 𝑛

Mede a grau de associação entre as duas variáveis


Coeficiente de determinação: 𝑟 2 = −0,642 = 0,41 ou 41%
Em percentual especifica o quanto X explica da variação de Y
Exercício 2: Elaborar o diagrama de dispersão, calcular r e 𝑟 2 . Interpretar os
resultados. Pressão sistólica (P.S) e idade de 15 participantes de pesquisa.

Idade P.S
39 144
47 220
45 138
47 145
65 162
46 142
67 170
42 124
67 158
56 154
64 162
56 150
59 140
34 110
42 128

Exercício 3: Abaixo é apresentado um quadro que associa o número de vistos


concedidos por vinte países no ano de 2011 e a entrada de turistas nestes países.
Elaborar o diagrama de dispersão, calcular r e 𝑟 2 . Interpretar os resultados.

Número de vistos concedidos (em Entradas no País (em milhões)


milhões)
575 95
525 85
200 20
455 71
360 52
350 50
125 5
425 65
150 10
500 80
300 400
125 5
260 32
290 38
350 50
575 95
475 75
375 55
600 100
225 25

Aula remota (15/06/2021)


Coeficiente de contingência (variável qualitativa)
Em estatística, quando estudamos medidas de associação para variáveis
qualitativas podemos associar variáveis com o objetivo de saber se existe um
relacionamento entre suas características. Esse estudo, chamado de Análise
Bidimensional.
Ex: Sintomas(grau) de ansiedade

Sexo
Sintomas Masculino Feminino Total
Sim 𝑂11 =50 𝐸11= 50 𝑂12 =50 100
Não 𝑂21 =50 𝑂22 =50 100
Total 100 100 200
𝑙 = 2; 𝑐 = 2

𝑂𝑖𝑗 = frequência observada. Ex: 𝑂11 =50


𝐸𝑖𝑗 = frequência esperada calculada na hipótese de independência entre as variáveis.

𝑖 = 1,2, … . 𝑙; 𝑗 = 1,2, … . 𝑐; 𝑛 = 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎


𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑙𝑖𝑛ℎ𝑎 𝑖×𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑐𝑜𝑙𝑢𝑛𝑎 𝑗 100×100
Então: 𝐸𝑖𝑗 = ⇒ 𝐸11= =50
𝑛 200

OBS: A frequência esperada na hipótese de independência, no Ex acima, é igual


a frequência observada. Conclusão sobre as variáveis:
Para medir o grau de dependência usaremos o Coeficiente de Contingência 𝐶 de
Pearson.
𝜒2
𝐶=√ , onde:
𝜒2 +𝑛

n é o tamanho de observações da amostra;


𝐶 é um número entre 0 e 1 (0 ≤ 𝐶 < 1). Se próximo de zero decidimos pela
independência das variáveis;
𝜒 2é 𝑜 𝑄𝑢𝑖 − 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜.
𝑐 𝑙 2
(𝑂𝑖𝑗 − 𝐸𝑖𝑗 )
𝜒2 = ∑ ∑ ( )
𝐸𝑖𝑗
𝑗=1 1=1

2
(𝑂𝑖𝑗 − 𝐸𝑖𝑗 ) é 𝑢𝑚𝑎 𝑚𝑒𝑑𝑖𝑑𝑎 𝑑𝑒 𝑑𝑖𝑠𝑡â𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑎𝑠 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎𝑠
𝐶
Coeficiente de contingência corrigido: 𝐶∗ = 𝑡−1
,

𝑡

𝑜𝑛𝑑𝑒 𝑡 é 𝑜 𝑚í𝑛𝑖𝑚𝑜 𝑒𝑛𝑡𝑟𝑒 𝑙 𝑒 𝑐.


Para o Exemplo acima temos:

2
(𝑂11 − 𝐸11 )2 (𝑂12 − 𝐸12)2 (𝑂21 − 𝐸21 )2 (𝑂22 − 𝐸22 )2
𝜒 = + + + =0
𝐸11 𝐸12 𝐸21 𝐸22

2
(50 − 50)2 (50 − 50)2 (50 − 50)2 (50 − 50)2
𝜒 = + + + =0
50 50 50 50

𝜒2 0
𝐶=√ 2 =√ =0
𝜒 +𝑛 0 + 200

Conclusão: As variáveis são independentes, ou seja, o grau de ansiedade não


depende do sexo.
Exercício 1: Calcule e interprete o coeficiente de contingência 𝐶 em relação ao
peso e o sexo de 600 pessoas que praticam atividade física. Os dados estão no
quadro abaixo:

Peso Feminino Masculino Total


Acima 80 85 90 85 170
Normal 120 125 130 125 250
Abaixo 100 90 80 90 180
Total 300 300 600

170 × 300 170 × 300 250 × 300


𝐸11 = = 85; 𝐸12 = = 85; 𝐸21 = ; 𝐸22
600 600 600
250 × 300 180 × 300
= = 125; 𝐸31 = = 90; 𝐸32 = 90.
600 600

2
(80 − 85)2 (90 − 85)2 (120 − 125)2
𝜒 = + +
85 85 125
(130 − 125) 2 (100 − 90)2 (80 − 90)2
+ .+ + = 3,20;
125 90 90

3,20
𝐶=√ = 0,07; 𝐶𝑜𝑛𝑐𝑙𝑢𝑠ã𝑜: 𝑣𝑎𝑟𝑖á𝑣𝑒𝑖𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒𝑠.
3,20 + 600

O peso das pessoas que praticam atividade física não depende do sexo
Usando o BioEstat:
Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna) ►sempre marcar as
colunas ►clicar em Estatísticas ►clicar em Correlação ►Clicar em coef. de
Contingência C ►Abre quadro: Seleção de amostras para Teste de Contingência C
►clicar em >> ► clicar em Executar estatística ►Abre quadro: Teste de Contingência
C ►clicar em Editar ►Copiar Resultados.
Resultados:
80 120 100
90 130 80
Resultados:
Tabela de Contingência = 3x2
Qui-quadrado = 3.2105
Coef. de Contingência C = 0.0730
Graus de liberdade = 2
(p) = 0.2008

Exercício 2: Foi feito um estudo multicêntrico para testar o efeito de um anti-


hipertensivo sobre a probabilidade de derrame recorrente. Um pesquisador
suspeita de que os tratamentos coadjuvantes diferentes ministrados nos
diversos centros, embora permitidos no protocolo, podem ter efeito sobre o
risco de derrame recorrente. Calcule e interprete o coeficiente de contingência
𝐶. Os dados estão apresentados no quadro abaixo:

Derrame recorrente
Centro Sim Não Total
A 16 179 195
B 12 70 82
C 21 78 99
D 12 54 66
Total 61 381 442

Exercício 3: Calcule e interprete o coeficiente de contingência 𝐶 em relação ao


sexo e o hábito de fumar. Os dados estão apresentados no quadro abaixo:
Sexo Fumantes Não Ex-fumantes Total
fumantes
Masculino 60 40 50 150
Feminino 40 60 50 150
Total 100 100 100 300
Exercício 4: Distribuição de portadores de prótese dupla segundo o grupo de
renda, em salários mínimos (SM) e disfunção craniomandibular.

Disfunção craniomandibular

Grupo de renda Nula Leve Moderada e


severa
Menos de 5 SM 19 21 10
DE 5 a 10 SM 21 24 5
Mais de 10 SM 25 21 2

Caso 𝜒 2 > 9,49 , 𝑎𝑠 𝑣𝑎𝑟𝑖á𝑣𝑒𝑖𝑠 𝑠ã𝑜 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑑𝑎𝑠 𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒𝑠. Calcule e


compare com o coeficiente 𝐶.

Aula remota 17/06/2021

Alguns conceitos de probabilidade


Experimento Aleatório- apresenta mais de um resultado possível.
EX 1: O nº de pessoas diagnosticados positivamente, em um
município, após o teste de Covid-19 “RT-PCR” (seleção, p.ex, de 10
funcionários);
EX 2: O nº de pacientes atendidos na emergência de um centro de
traumatologia (máx. de 24 pacientes);
EX 3: As espécies de aves que são capturadas numa rede de uma
floresta nativa;
EX 4: Face, voltada para cima, no lançamento de uma moeda 3
vezes.
Espaço amostral (S) - conjunto dos resultados possíveis de um
experimento aleatório.
EX 1: S=(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
EX4:S=(ca,ca,ca; ca,ca,co; ca,co,ca; co,ca,ca; ca,co,co; co,ca,co;
co,co,ca; co,co,co). ca=cara; co=coroa
Evento A,B... .) - subconjunto de um espaço amostral.
EX 1: A=(2,5,9 );
EX 2: B= (0,10, 23).
Obs- se o resultado é um elemento de A, dizemos que o evento A
ocorre.
Eventos mutuamente exclusivos ou excludentes- não podem
ocorrer mesmo tempo.
̅
OBS 1: Complementar de A=𝑨
A e B são complementares se P(A) + P(B) = P(S) = 1
Conceito de probabilidade - é um nº P € [ 0, 1], associado a
ocorrência de um evento.
i) 0 ≤ P(A) ≤ 1; ii) P(S)= 1; iii) Se A e B são eventos mutuamente
exclusivos ou excludentes, isto é, A∩B=Ǿ, então P(AUB)= P(A) +
P(B).
Obtenção da probabilidade:
𝑁º 𝑑𝑒 𝑚𝑎𝑛𝑒𝑖𝑟𝑎𝑠 𝑐𝑜𝑚𝑜 𝐴 𝑝𝑜𝑑𝑒 𝑜𝑐𝑜𝑟𝑟𝑒𝑟
Conceito clássico- P(A)= ; EX:
𝑛º 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑆
joga-se uma moeda equilibrada, define-se A=(cara),daí
1
S=(cara,coroa)⇒P(A)= .
2

Conceito frequência ou empírico- P(A)=


𝑁º 𝑑𝑒 𝑜𝑐𝑜𝑟𝑟ê𝑛𝑐𝑖𝑎𝑠 𝑑𝑒 𝐴
; Considerando o EX acima, joga-se
𝑛º 𝑑𝑒 𝑟𝑒𝑝𝑒𝑡𝑖çõ𝑒𝑠 𝑑𝑜 𝑒𝑟𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜
a moeda várias vezes e observa-se o nº de caras, daí P(A)=
𝑛º 𝑑𝑒 𝑐𝑎𝑟𝑎𝑠
.
𝑛º 𝑑𝑒 𝑣𝑒𝑧𝑒𝑠 𝑞𝑢𝑒 𝑎 𝑚𝑜𝑒𝑑𝑎 𝑓𝑜𝑖 𝑗𝑜𝑔𝑎𝑑𝑎.

Lei dos grandes números- se repetimos um experimento um grande


nº de vezes, a probabilidade pela frequência relativa (conceito
frequência) de um evento tende para a probabilidade teórica (conceito
clássico).
Ex 1: Determine a probabilidade de uma pessoa escolhida aleatoriamente ser
atingida por um raio este ano na região R.
Solução: O espaço amostral consiste nestes dois eventos simples: A pessoa
escolhida é atingida (A) ou não (B). Estes eventos não são igualmente prováveis.
Porém, sabemos que em um ano recente, 10 pessoas foram atingidas por um
raio nesta região. Considerando que a população da região é de 150.000
pessoas, temos que:
10
P(A)= = 0,00006666 ( conceito frequencial ou empírico)
150.000

Ex 2: Em um teste uma questão típica de múltipla escolha tem 5 respostas


possíveis. Respondendo à questão aleatoriamente, qual é a probabilidade de
sua resposta estar errada?
4
S=( a, b, c, d, f), então P(resposta errada)= ( conceito clássico)
5

Exercício 1: Uma companhia de seguros estudou as causas de morte por


acidente doméstico e compilou um arquivo que consistia em 160 mortes
causadas por quedas, 120 mortes causadas por envenenamento e 70 causadas
por fogo e queimaduras. Selecione aleatoriamente um desses casos, qual é a
probabilidade de que a morte tenha sido causada por envenenamento?
Exercício 2: Determine a probabilidade de que um casal com três filhos tenha
exatamente 2 meninos. Suponha que as probabilidades de menino e menina
sejam as mesmas, e que o sexo de uma criança não seja influenciado pelo sexo
de qualquer outra.
Exercício 3: Ao escolher entre diversos fornecedores de equipamentos
biomédicos, um comprador deseja saber a probabilidade de um equipamento
falhar durante os dois primeiros anos. Qual conceito você usaria para obter esta
probabilidade? Explique.
Exercício 4: Em uma pesquisa entre pessoas de um município que tomaram a 1ª
a dose da vacina contra a covid 19, 1162 afirmaram que tiveram sintomas,
enquanto 2648 afirmaram que não tiveram. Selecionada aleatoriamente uma
dessas pessoas, determine a probabilidade de ele ou ela ter tido sintomas.
Exercício 5: Uma pesquisa originou os dados amostrais do quadro a seguir:
Escovadas por dia Número
1 228
2 672
3 240

Selecionado aleatoriamente um dos entrevistados, qual a probabilidade de


obter alguém que escove os dentes três vezes por dia, conforme recomendam
os dentistas?
Exercício 6: Um casal planeja ter 3 filhos.
a. Relacione os 8 resultados distintos possíveis de acordo com o sexo de
cada criança. Suponha que estes resultados sejam igualmente prováveis.
b. Determine a probabilidade de serem todas meninas.
c. Determine a probabilidade de haver ao menos uma criança de cada sexo.
d. Determine a probabilidade de exatamente 2 crianças de cada sexo.
Exercício 7: Ambos os pais têm o par de genes castanho/azul da cor dos olhos,
e cada um deles contribui com um gene para um filho. Suponha que se o filho
tem ao menos um gene castanho, essa cor dominara e os olhos serão castanhos.
a. Relacione os diferentes resultados possíveis, supondo-os igualmente
prováveis.
b. Qual a probabilidade de o filho ter olhos castanhos?
Exercício 8: Admitindo que a probabilidade de uma criança ser menino (H) é
0,50. Determinar a probabilidade de uma família de seis filhos ter:
a) Ao menos um H
b) Ao menos um Mulher (M)
Regra da Adição
P (A ou B) = P (ocorrência de A, ou B, ou ambos)
P(AUB)= P(A)+P(B) – P(A∩B) P(A∩B)
P(A)
P(B)
Ss

AA

Definição: Os eventos A e B dizem-se mutuamente excludentes ou exclusivos se


não podem ocorrer simultaneamente.

P(AUB)= P(A)+P(B) P(A)


P(B)

Exercício 1: Se um dos 2072 indivíduos do quadro abaixo é escolhido


aleatoriamente.
Ex 1:Teste de Seldane
Sintoma Seldane Placebo Grupo de Total
controle
Dor de 49 49 24 122
cabeça
Não-dor de 732 616 602 1950
cabeça
Total 781 665 626 2072
Determine as seguintes probabilidades:
a. De ser obter alguém que fez uso de um placebo ou estava no grupo de
controle.
665 626 1291
P (placebo ou controle) = + = = 0,623
2072 2072 2072
b. De ser obter alguém que fez uso de um placebo e estava no grupo de
controle.
0
P(Placebo e controle)= =0
2072
c. De ser obter alguém que tenha usado seldane ou estava no grupo de
controle.
P(seldane U grupo de controle)= P(seldane=A)+P(grupo de controle=B)-
P(sedane=A ∩ grupo de controle=B)= P(AUB)= P(A)+P(B)= 2072
781
+
626
2072
=
781+626 1407
= = 0679
2072 2072

Exercício 1:
a) De ser obter alguém que tenha usado Seldane ou que não teve dor
de cabeça
b) Dado que o indivíduo usou Seldane, qual a probabilidade de ter tido
dor de cabeça?

https://www.passeidireto.com/arquivo/29450357/estatistica-aplicada-ao-
turismo
Aula remota 22/06/2021)

Probabilidade condicional-

A
BBB B

𝑃(𝐴∩B)
P(A/B)=
𝑃 (𝐵)>0
Ex 1:Teste de Seldane
Sintoma Seldane (B) Placebo (C) Grupo de Total
controle
Dor de 49 49 24 122
cabeça (A)
Não-dor de 732 616 602 1950
cabeça
Total 781 665 626 2072
122 781 49
Calcular: a) P(AUB)=P(A)+P(B) - P(A∩B) = + − =
2072 2072 2072
854 𝑃(𝐴∩𝐵) 49
= 0,412 𝑜𝑢 41,2% ; P(A/B) = = = 0,063;
2072 𝑃(𝐵) 781
49
𝑃(𝐶∩𝐴) 49
P(C/A) = = 2072
122 =
𝑃(𝐴) 122
2072

Exercício 1: Um grupo de pessoas foi classificado quanto a peso e pressão


arterial de acordo com as proporções do quadro a seguir:

Pressão/Peso Excesso Normal (D) Deficiente Total


(C) (E)
Alta (A) 100 8 2 110
Normal (B) 150 54 20 224
Total 250 62 22 334
a) Qual a probabilidade de uma pessoa escolhida ao acaso nesse
grupo ter pressão alta (A), dado que tem peso Normal (D).
b) Se se verifica que a pessoa escolhida tem excesso de peso (C),
qual a probabilidade de ela ter também pressão alta (A)?
c) Calcular: P(E/B); P(C/B); P(E/A).
Eventos independentes: Sejam A e B eventos de S. Intuitivamente,
𝑃(A∩B)
A e B são independentes, daí 𝑃(𝐴/𝐵) = = 𝑃(𝐴)
𝑃(𝐵)
► 𝑃(𝐴 ∩ B) = 𝑃(𝐴). 𝑃(𝐵);
𝑃(B∩A)
𝑃(𝐵/𝐴) = = 𝑃(𝐵) ► 𝑃(𝐵 ∩ A) = 𝑃(𝐵). 𝑃 (𝐴).
𝑃(𝐴)
Exercício 1: Uma família deseja ter 2 filhos. A probabilidade de
1
nascer Homem ou Mulher em cada nascimento é igual . Qual a
2
probabilidade de nascer Homem no segundo nascimento dado que
nasceu mulher no primeiro. Então temos os eventos:
M=(nasceu mulher no primeiro nascimento); H (nascer homem no
1 1
segundo nascimento) ►𝑃(𝐻 ) = 𝑒 𝑃(𝑀) =
2 2
𝑃(H∩M) 1
𝑃(𝐻/𝑀) = = 𝑃 (𝐻 ) = ►𝑃 (H ∩ M) =
𝑃(𝑀) 2
1 1 1
𝑃(𝐻 ). 𝑃(𝑀 ) = x =
2 2 4

Exercício 2: Sejam A e B eventos tais que P(A)=0,2, P(B)=p e


P(AUB)= 0,6. Calcular p considerando A e B:
a) Mutuamente exclusivos;
P(AUB)= P(A) + P(B) ⇒ 0,6 = 0,2 + p ⇒ p= 0,4
b) Independentes.
P(AUB) = P(A) + P(B) - P(A).P(B) ⇒ 0,6 = 0,2 + p - 0,2p ⇒
P=0,5.

Exercício 3: Uma empresa de consultoria participa de duas


concorrências para realizar estudos de impacto ambiental. A
probabilidade de vencer a primeira concorrência é de 50% e de
vencer a segunda é de 70%, enquanto que a probabilidade de vencer
ambas concorrências é 40%.
A= (vence a 1ª concorrência); B=(vence a 2ª concorrência) C=(vence
ambas as concorrências).
Qual a probabilidade de vencer a segunda concorrência dado que ela
𝑃 (B∩A) 𝑃(𝐶 ) 0,4
venceu a primeira? P(B/A) = = = =0,8
𝑃 (𝐴) 𝑃 (𝐴) 0,5
OBS: A e B são eventos independentes se P(A∩B) = P(A). P(B)
Exercício 4: Verifique a associação dos eventos CEGO (C) e SURDO
(S), de acordo com as probabilidades do quadro abaixo:
CEGO/SURDO 𝑆 𝑆̅ Toial
𝐶 0,0004 0,0796 0,0800
𝐶̅ 0,0046 0,9154 0,9200
Total 0,0050 0,9950 1,0000
Calcule: P(S/C); P(C/S) e conclua.

Aula remota 24/06/2021)

Teorema de Bayes- Partição de um espaço amostral S (i=1,2,3,4)


se: Ai∩Aj=Ǿ, B é um evento arbitrário.
A4 B

A1

A3 A2

B= A1∩B U A2∩B U A3∩B U A4∩B;


P(B)= P(A1∩B) + P (A2∩B) + P(A3∩B) + P(A4∩B);
𝑃 (𝐴1∩𝐵)
P(B/A1)= ► P(A1∩B)=P(A1).P(B/A1);
𝑃(𝐴1)
𝑃 (𝐴1∩𝐵) P(A1).P(B/A1)
P(A1/B)= = 4 =.
𝑃 (𝐵) ∑𝑖=1 P(Ai).P(B/Ai)
Sejam A1, A2,............,An eventos que formam uma partição de S.
Seja B contido em S. Sejam conhecidas P(Ai) e P(B/Ai), i=1,.....n.
Então:
𝑃(𝐴𝑗.𝑃(𝐵/𝐴𝑗)
𝑃(𝐴𝑗/𝐵)= ∑𝑛 j=1,......,n
𝑖=1 𝑃(𝐴𝑖).𝑃(𝐵/𝐴𝑖)

Exercício 1: Em uma indústria farmacêutica, 3 laboratórios L1, L2 e


L3 produzem 30%, 45% e 25%, dos medicamentos, respectivamente.
Sabe-se por experiências anteriores, que 2%, 3% e 2% dos
medicamentos feitos por cada laboratório estão, respectivamente,
fora das especificações. Suponha que um medicamento, já acabado,
seja selecionado aleatoriamente. a) Qual é a probabilidade de que tal
medicamento esteja fora da especificação? b) Qual a probabilidade
de que tenha sido produzido pelo laboratório L1, dado que está fora
da especificação?
B=FE=(o medicamento está fora da especificação); A1=L1( o
medicamento é proveniente do laboratório 1), A2=L2 (idem
laboratório 2), A3 = L3 (idem laboratório 3).

L1

FE

L2 L3

FE= L1∩FE U L2∩FE U L3∩FE;


P(FE)= P(L1∩FE) + P (L2∩FE) + P(L3∩FE);
𝑃(𝐿1∩𝐹𝐸 )
P(FE/L1) = ► P(L1∩FE)=P(L1).P(FE/L1);
𝑃(𝐿1)
𝑃(𝐿2∩𝐹𝐸 )
P(FE/L2) = ► P(L2∩FE)=P(L2).P(FE/L2);
𝑃(𝐿2)
𝑃(𝐿3∩𝐹𝐸 )
P(FE/L3) = ► P(L3∩FE)=P(L3).P(FE/L3).
𝑃(𝐿3)

P(FE)= P(L1). P(FE/L1) + P(L2). P(FE/L2) + P(L3). P(FE/L3)


a) P(FE)= (0,30 x 0,02 + 0,45 x 0,03 + 0,25 x 0,02) = 0,02450.
𝑃(L1∩FE) 0,30× 0,02
b) P(L1/FE) = = = 0,24490
𝑃 (𝐹𝐸 ) 0,02450

Exercício 2: Suponha um teste para Covid em que 95% dos que têm
o mal reagem positivamente, enquanto 3% dos que não têm o mal
reagem positivamente. Suponha ainda que 2% dos hospedes de um
hotel tenham Covid. Qual a probabilidade de um doente escolhido ao
acaso, e que reaja positivamente ao teste, ter de fato o mal?
Exercício 3: Em uma localidade, 8% dos adultos de mais de 50 anos
têm diabetes. Se um médico local diagnostica corretamente 95% das
pessoas que tem a doença, e diagnostica erroneamente 2% dos que
não a têm, qual a probabilidade de um adulto de mais de 50 anos
diagnosticado como portador da doença, ter de fato o mal?

Aula remota 29/06/2021)

●Variável aleatória X
É uma função que associa a cada, elemento de um espaço amostral
um número real.
EX1: Escolhe-se aleatoriamente três nascituros em uma maternidade
(verificação da ocorrência do sexo). Então:
S= (𝑀𝑀𝑀, 𝑀𝑀𝐹, 𝑀𝐹𝑀, 𝐹𝑀𝑀, 𝑀𝐹𝐹, 𝐹𝑀𝐹, 𝐹𝐹𝑀, 𝐹𝐹𝐹 )
Seja X o número o número de homens.
𝑋(𝑀𝑀𝑀 ) = 3; 𝑋(𝑀𝑀𝐹 ) = 2; 𝑋(𝑀𝐹𝑀 ) = 2; 𝑋(𝐹𝑀𝑀 )
= 2; 𝑋(𝑀𝐹𝐹 ) = 1; 𝑋(𝐹𝑀𝐹 ) = 1; 𝑋(𝐹𝐹𝑀 )
= 1; 𝑋(𝐹𝐹𝐹 ) = 0
Distribuição de probabilidade de X
X 𝑋2 P(X)
0 0 1/8
1 1 3/8
2 4 3/8
3 9 1/8
Total - 1
p=1/2, n=3
E(X)= ∑ 𝑋. 𝑃(𝑋)= (0×1/8)+ (1×3/8)+ (2×3/8) +(3×1/8)=1,5
2
V(X)= E(𝑋 2 ) – (𝐸 (𝑋)) = (0×1/8)+ (1×3/8) + (12×3/8) +(9×1/8)-
(1,5)2 = 0,75
APP- Probability Distributions

● Distribuição Binomial (Variável Aleatória Discreta) e o Modelo


Probabilístico Normal (Distribuição Contínua)
Definições:
1- Variável Aleatória (V.A)

Seja E um experimento e S o conjunto de todos os resultados


possíveis associados ao experimento. Uma função X , que associe a
cada elemento s  S um número real ,X(s) , é denominada variável
aleatória.
Ex. Considere o experimento de se jogar uma moeda duas vezes.
Consideremos, o espaço S abaixo, associado a este experimento.
S=[caracara, caracoroa, coroacara, coroacoroa]; Seja X a v.a que
representa o número de caras .Daí,
X(caracara)=2,X(caracoroa)=X(coroacara)=1,X(coroacoroa)=0.

caracara 2

caracoroa
1
coroacara
0
coroacoroa
Domínio(S) Rx

2- Variável Aleatória Discreta e Contínua


Seja X uma variável aleatória. Se o número de valores possíveis
de X (contradomínio-R ) for finito ou infinito numerável,
x

denominamos X de variável aleatória discreta. Suponha-se que o


contradomínio de X, seja um intervalo, isto é, X possa tomar todos os
valores possíveis no intervalo, então, diremos que X é uma variável
aleatória contínua.
Associadas as variáveis aleatórias temos as suas funções
de probabilidades.
3-Distribuição Binomial (Distribuição Discreta) - As probabilidades
são constantes e independentes na repetição da experiência
aleatória.
𝑋 (𝑐𝑐𝑐̅) = 2; 𝑋(𝑐𝑐̅𝑐 ) = 2; 𝑋(𝑐̅𝑐𝑐)
2 1 3−2
2 1
P(X=2)= 𝐶3 ( ) (1 − ) = 3/8
2 2
; V(X)= np(1-p); 1-p=q.
P(X=x)= 𝐶𝑛𝑥 (𝑝)𝑥 (1 − 𝑝)𝑛−𝑥 ; X= 0,1,…… n
Exercício 1:
a) Em um hospital 70% dos profissionais de saúde estão com
suspeita da covid-19. Seleciona-se uma amostra de 8(oito)
profissionais. Elaborar a distribuição de probabilidade. Calcular o
valor esperado, variância e desvio padrão.
P(X=0) = 𝐶80 (0,70)0 (1 − 0,70)8−0 = 0,00007
P(X=1) = 𝐶81 (0,70)1 (1 − 0,70)8−1 = 0,0012. Na tabela: n=8,
p=0,7, x=1.

Na APP: n= 8
p= 0,7

x= 1 p(X=x) 0.00122

.
.
.
Valor esperado= E(X)= np= 8x0,70=5,6
Variância= V(X)= np(1-p)=8× 0,70x0,30= 1,68
b) Em uma amostra de 10 profissionais de saúde, qual é a
probabilidade de que pelo menos 3 profissionais estejam com
suspeita da doença?
Exercício 2: De acordo com uma pesquisa, um de cada quatro
profissionais de saúde de um hospital são hipertensivos. Considere
uma amostra de 20 profissionais.
a) Calcule a probabilidade de que exatamente quatro sejam
1
hipertensivos. 𝑝 = = 0,25; 𝑃 (𝑋 = 4) = 𝐶20
4 (
0,25)4 (1 −
4
4 (
0,25)20−4 = = 𝐶20 0,25)4 (0,75)16 = 0,18969 =
18,97%.
APP: n= 20 p= 0,25 X= 4 p(X=x)= 0.18969
b) Calcule a probabilidade de que pelo menos dois profissionais
sejam hipertensivos. 𝑃(𝑋 ≥ 2) =
c) Se descobrisse que exatamente 12 dos profissionais sejam
hipertensivos, você duvidaria da exatidão dos resultados desse
estudo?
d) Calcule o número esperado de profissionais hipertensivos do
hospital. 𝐸 (𝑋) = 𝑛𝑝 = 20 × 0,25 = 5
Exercício 3: A probabilidade de um menino ser daltônico é de 8%.
Qual é a probabilidade de serem daltônicos todos os 4 meninos que
se apresentam, em determinado dia, para um exame oftalmológico?
Exercício 4: Um exame é constituído de dez testes tipo certo-errado.
Quantos testes acerta, em média, um aluno que nada sabe sobre a
matéria do exame?
Exercício 5: Suponha que determinado medicamento usado para o
diagnóstico precoce da gravidez é capaz de confirmar casos positivos
em apenas 90% das gestantes muito jovens. Isto porque, em 10%,
das gestantes muito jovens, ocorre uma escamação do epitélio do
útero, que é confundida com a menstruação. Nestas condições, qual
é a probabilidade de 2, de 3 gestantes muito jovens que fizeram uso
desse medicamento, não terem confirmado precocemente a
gravidez?
Aula remota 01/07/2021)

4 - O Modelo Normal
Seja X uma variável aleatória contínua. A função densidade de
probabilidade (fdp), é uma função f, que satisfaz às seguintes
condições:

f(x)  0,  x  R ,
x

 f ( x)dx  1
RX

d
Além disso ,definimos para qualquer c<d (em R ), P(c <X< d) =  f ( x)dx x
c

,onde P representa a probabilidade de X está compreendida no


intervalo (c,d).
Definição- A variável aleatória X , que tome todos os valores reais
   x   , com parâmetros       e 0     tem uma 2

distribuição normal (ou gaussiana), se sua fdp é dada por:


( x   )2
1
f ( x)  e 2 2 ,  x  
 2

f(X)

(b) Gráfico-

     X
(c) Momentos- Pode-se demonstrar que:
E(X)=  ;
V(X)=  ; 2

f(x) quando x ;

  e   são os pontos de inflexão de f(x);


x=  é o valor para o qual ocorre o máximo da função, isto é, f(x)=
1
;
 2

f(x) é simétrica em torno de  ,isto é,


f(    )= f(    ),  x    x  

    68,27%;   2  95,45%;   3  99,73%;


Coeficientedemomentodeassimetria  3  0; curtose   4  3

2
Desviomedio    0,7979

A área total limitada pela curva e pelo eixo dos x é igual a 1;


portanto a área sob a curva ,compreendida entre as duas
coordenadas X=a e X=b, em que a<b, representa a probabilidade de
X estar situado entre a e b, representada por P(a<X<b). Se X tem
distribuição normal , média  e variância  ,escrevemos: 2

X : N(  ,  ). 2

Quando  =0 e  =1, temos uma normal padrão ou reduzida, e


2

escrevemos N(0,1).
X 
Se X : N(  ,  ) então a v.a Z =
2
, terá uma distribuição

N(0,1).
Aplicando o operador E(esperança matemática) à variável Z, temos.

E( X )   xf ( x)dx  


E ( X )  E ( )
E(Z)=E( X   )= =    = 0  0 =0
   

X  2
 1, isto é, Z tem média 0 e
1
E (Z 2 )  E ( )2  E( X  ) 2 
 2 2
variância 1.(prova-se também a normalidade).

4.1- Tabulação da Distribuição Normal (X : N(  ,  ). 2

b ( x   )2
P(a<X<b)=  1
e 2 2 dx
a  2

A integral não pode ser calculada exatamente, e a probabilidade


acima é obtida aproximadamente por métodos numéricos. No entanto
,para cada valor de  e cada valor de  , teríamos que obter P(a<X<b)
para diversos valores de a e b. Isto pode ser contornado reduzindo a
variável X nos moldes de Z, gerando desta forma a tabela para a
distribuição normal padrão N(0,1), a saber:

P(a<X<b)= P( a    X    b   )  P( a    Z  b   )  (b)  (a) , onde


    
 representa a Função de Distribuição(fdp) da curva normal
reduzida, isto é:
z z2
1
( z ) 
2
e

2
dx  P( Z  z )

( x)  1  ( x)

 (z )

z s2
1 2
TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO P ( Z  z )  ( z )  
 2
e ds

Z 0 1 2 3 4 5 6 7 8 9
- 3,0 0,0013 0,0010 0,0007 0,0005 0,0003 0,0002 0,0002 0,0001 0,0001 0,0000
- 2,9 0,0019 0,0018 0,0017 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
- 2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0020 0,0020 0,0019
- 2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
- 2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
- 2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
- 2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
- 2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
- 2,2 0,0139 0,0136 0,0132 0,0129 0,0126 0,0122 0,0119 0,0116 0,0113 0,0110
- 2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
- 2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
- 1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0238 0,0233
- 1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0.0307 0,0300 0,0294
- 1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
- 1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
- 1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0570 0,0559
- 1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0722 0,0708 0,0694 0,0681
- 1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
- 1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
- 1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
- 1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
- 0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
- 0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
- 0,7 0,2420 0,2389 0,2358 0,2327 0,2297 0,2266 0,2236 0,2206 0,2177 0,2148
- 0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
- 0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
- 0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
- 0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
- 0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
- 0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
- 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7703 0,7734 0,7764 0,7794 0,7823 0,7853
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0.8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9278 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9430 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9648 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9700 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9762 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9874 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9990 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 1,0000
Exercício 2: Utilizando esta tabela encontre as seguintes
probabilidades:
a) P(Z > 1,96) = 1-P(Z ≤ 1,96)= 1- 0,9750=0,02500
b) P(Z < 1,96) = 0,9750
c) P(Z < - 1,96) = 0,02500 ⇒APP:
µ= 0 σ= 1

x= -1.96 p(X<x)= 0.0250


0

-0.0250

-1,96 0

d) P( -2,50 < Z < 2,50 ) = 𝑃(𝑋 < 2,5) − 𝑃 (𝑋 < −2,5) =


0,9938 − 0,0062 = 09876 𝑜𝑢 98,78%.

98,78%

-2,5 2,5

APP: µ= 0 σ= 1 X= 2,5 𝑃(𝑋 < 𝑥)= 0,99379

X= -2,5 𝑃(𝑋 < 𝑥)= 0,00621


P( -2,50 < Z < 2,50 ) = 𝑃(𝑋 < 2,5) − 𝑃 (𝑋 < −2,5) =
0,99379 − 0,00621 = 0,98758
e) P( 0,50 < Z < 1,50 ) =
f) P( Z < z ) = 0.75 ⇒ z = ? 0,67(tabela); 0,67449 (APP-Probaility
Distribution).
g) P(-z1 < Z < z1 ) = 0.75 ⇒ z1 = ?
h) P( 0.27 < Z < z2 ) = 0.50 ⇒ z2 = ?
Exercício 3: A média do preço das consultas das empresas médicas
de um município segue uma distribuição Normal com média 23 e
desvio padrão 7 . Pede-se:
a) Esquematize o gráfico da distribuição.
b) Qual a proporção de empresas com preço acima de 28?
e) Qual a proporção de empresas com preço entre 20 e 25?
f) Qual a proporção de empresas com preço entre 16 e 30cm?
g) Qual a proporção de empresas com preço entre 25 e 30cm?
h) Se 25% das menores empresas médicas forem cortadas, qual o
preço mínimo das empresas médicas remanescentes?
i) Qual a preço mínimo para uma empresa médica estar entre as 1%
com maiores preços de consultas?

1%=0,01

99%=0,99

x
𝑥−23 𝑥−23
P(X≥x)=0,01⇒P(Z≥ ) = 0,01 ⇒ 𝑝 (𝑍 ≤ ) = 0,99 ⇒
7 7
𝑥−23
= 2,33 ⇒ 𝑥 = 39,31;APP:µ=23,σ=7,
7
P(x>x)=0,01⇒x=39.284444
Aula remota 06/07/2021)

●Distribuição amostral das médias e da variância

Em uma amostra aleatória os elementos da população são


escolhidos de tal forma que cada um deles tenha igual chance de
figurar na amostra. Escolhe-se uma amostra aleatória simples de
elementos, de maneira que toda a amostra de tamanho “n” possível
tenha a mesma chance de ser escolhida.
Ex: S=espaço amostral=conjunto de todas as amostras possíveis,
p.ex,de tamanho n=4⇒ (𝑥1, 𝑥23, 𝑥50 ,𝑥5 ),(𝑥100, 𝑥230, 𝑥501 ,
𝑥92 ).......𝑘 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠 ⇒ 𝑥̅1, 𝑥̅2,............. 𝑥̅𝑘 ⇒ nº de médias=nº de
amostras possíveis.
Se amostras aleatórias de tamanho n (com reposição) forem
tomadas de uma população com média µ e desvio padrão σ, então a
distribuição amostral de 𝑋̅𝑛 : 𝑥̅1, 𝑥̅2, ............. 𝑥̅𝑘 tem as seguintes
propriedades:

1. 𝑬(𝑿̅ ) = µ𝑿̅ = µ ⇒ 𝑿
̅ 𝒏 é um estimador não tendencioso de
µ;
𝜎
2. √𝑉(𝑋̅) = 𝜎𝑋̅ = (𝑒𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑑𝑒 𝑋̅)
√𝑛
𝜎 𝑠
̅ 𝒏 ~𝑵 (µ;
3. 𝑿 ̅ 𝒏 ~𝑵 (µ;
); 𝑿 ) ; 𝒏 > 𝟑𝟎
√𝑛 √𝑛
OBS 1: Na medida em que o tamanho da amostra aumenta, a
distribuição das médias amostrais (distribuição amostral das médias)
tende para uma distribuição normal (Teorema do Limite central).
OBS 2: Também, se o tamanho da amostra cresce ⇒ o desvio padrão
𝜎
da média ou erro amostral decresce.
√𝑛

Exercício 1: Para a população P= (1, 2, 3) n=2 (com reposição),


̅ ) = µ𝑿̅ 𝒆 √𝑉(𝑋̅) = 𝜎𝑋̅ = 𝜎 .
mostrar que 𝑬(𝑿
√𝑛
Amostragem sem reposição

𝑁−𝑛 𝜎
√𝑉(𝑋̅) = 𝜎𝑋̅ = √ (𝜎 𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜)
𝑁−1 √𝑛

𝑁−𝑛 𝑆
√𝑉(𝑋̅) = 𝜎𝑋̅ = √ (𝜎 𝑑𝑒𝑠𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜)
𝑁 √𝑛

𝜎
Se (𝑛 ≤ 5%𝑁 ) podemos usar
√𝑛
Para n > 5%N ⇒ usa-se o fator de correção para população finita
(amostragem sem reposição).

Exercício 2: Mostrar que:

𝑁−𝑛 𝜎 𝜎
𝐥𝐢𝐦 𝜎𝑋̅ = √ = √𝑉(𝑋̅) = 𝜎𝑋̅ =
𝑵→∞ 𝑁−1 √𝑛 √𝑛
Comentar:
Exercício 3: Foi realizada uma pesquisa de opinião de profissionais
da área de saúde dos 30 maiores hospitais de uma certa região. A
pesquisa revelou que o salário anual médio de homens e mulheres,
eram $168 mil e $117 mil, respectivamente. Suponha que o desvio
padrão para os homens seja $ 40 mil, e para as mulheres seja $ 168
mil.
a) Qual é a probabilidade de uma amostra aleatória simples de 40
mulheres, produzir uma média amostral dentro do intervalo de
$10 mil em torno da média populacional, $117 mil?
P( 117-10< 𝑋̅ < 117+10)=P( 107< 𝑋̅ < 127)= P( 𝑋̅ <127) -
P(𝑋̅ < 107)
P( 𝑋̅ <127)- P(𝑋̅ < 107)

107 µ= 117 127 𝑋̅

P( 117-10< 𝑋̅ < 117+10)=P( 107< 𝑋̅ < 127)= P( 𝑋̅ <127) - P(𝑋̅<107)= P( 𝑋̅ <127)- P(𝑋̅<107)=
̅ −117
X 127−117 ̅ −117
X 107−117
P(𝑃 ( 168 < 168 )−𝑃( 168 < 168 ) = 𝑃(𝑍 <0,38)-P(-0,38)=0,6480-0,3520=
√40 √40 √40 √40
0,2960

P( 𝑋̅ <127)- P(𝑋̅ < 107)

107 µ= 117 127 𝑋̅

P( Z<0,38) - P(Z< −0,38)

-0,38 µ=0 0,38 Z


APP
µ= 117 σ= 26,56

𝑋̅ = 127 p(X<x)= 0,646


0,64673

µ= 117 σ= 26,56

𝑋̅ = 107 p(X<x)= 0,35327


7
P( 𝑋̅ <127) - P(𝑋̅<107)= 0,64673-0,35327 =0,2940

b) Idem para 40 homens.

Exercício 4: Seja X o consumo de proteína por família numa região


metropolitana. Suponha que X tem média igual a 2.2 e desvio padrão
igual a 1.4. Seja 𝑋̅ o número médio do consumo de proteína por
família para uma amostra de n=100.

a) Qual a distribuição de 𝑋̅ ? Desenhe um gráfico e explique.

b) Qual a probabilidade de o consumo médio por família seja menor


do que 2?

c) Qual a probabilidade de o consumo médio estar acima da média


mais três desvios padrões?

Exercício 5: Para as mulheres na faixa etária de 18 a 24, a pressão


sistólica do sangue (em mm Hg) tem distribuição normal com média
de 114,8 e desvio-padrão de 13,1.
a) Selecionada aleatoriamente uma mulher nessa faixa etária,
determine a probabilidade de a sua pressão sistólica ser
superior a 120.
b) Selecionadas aleatoriamente 12 mulheres nessa faixa etária,
determine a probabilidade de a pressão sistólica média ser
superior a 120.
c) Dado que a parte (b) envolve uma amostra de tamanho não
superior a 30, por que podemos usar o teorema central do
limite?

Exercício 6: As durações da gravidez têm distribuição normal com


média de 268 dias e desvio de 15 dias.
a) Selecionada aleatoriamente uma mulher grávida, determine a
probabilidade de a duração de sua gravidez ser inferior a 260
dias.
b) Se 25 mulheres escolhidas aleatoriamente são submetidas a
uma dieta especial a partir do dia em que engravidam,
determine a probabilidade de os prazos de duração de sua
gravidez terem média inferior a 260 dias (admitindo que a dieta
não produza efeito).
c) Se 25 mulheres têm média realmente média inferior a 260
dias, há razão de preocupação para os supervisores médicos?
Aula remota 08-07-2021
●Distribuição amostral de proporções

Seja “p” é a proporção das unidades de uma população que


possui uma certa característica (proporção de “sucessos”).

EXs :a) Proporção de pessoas do sexo masculino atendidas na


emergência de um hospital b) Proporção de consumidores que leem
a lista dos ingredientes enumerados no rótulo de produtos c) % das
residências que compram mais de $ 100 por semana em
medicamentos.

Considere amostras aleatórias de tamanho n⇒


1. 𝐸 (𝑝̂𝑛 ) = 𝑝
𝑝(1−𝑝)
2. 𝑉𝐴𝑅(𝑝̂𝑛 ) =
𝑛
3. Para n grande, n>30 ⇒ 𝑝̂𝑛 enquanto variável aleatória tem
𝑝(1−𝑝)
distribuição aproximadamente normal, isto é: 𝑝̂𝑛 ~𝑁(𝑝, )
𝑛

Exercício1 : Uma proporção de 37% dos visitantes de um parque


para a prática de esportes favorece a cobrança de taxas de entrada.
Uma amostra aleatória de 200 visitantes foi tomada:
a) Qual é o parâmetro? 37%
b) Qual é a estatística? (0,37)(200)=74
c) Qual é a probabilidade que em uma amostra de 200 visitantes
pelo menos 40% favoreçam a cobrança de taxa?

𝑃(𝑝̂𝑛 ≥ 0,40) = 1 − 𝑃(𝑝̂𝑛 < 0,40) = 1 −


𝑝̂𝑛 −𝑝 0,40−0,37
𝑃( (𝑝(1−𝑝))
< ) = 1 − 𝑃(𝑍 < 0,882) =
(0,37)(1−0,37)
√ √
𝑝 200

1 − 0,8106 = 0,189; APP: µ=0.37; σ=0.034; 𝑃(𝑋 > 𝑥) =


0.18879
Exercício 2: Um Instituto de pesquisa mostrou que 17% das
residências investem mais de $ 100 por semana em medicamentos.
Suponha que a proporção populacional (residências) seja p=0,17 e
que uma amostra aleatória simples de 800 residências será
selecionada a partir da população.
a) Mostre a distribuição amostral de 𝑝̂𝑛 , a proporção amostral de
residências que gastam mais de $ 100 por semana em
medicamentos.
b) Qual a probabilidade de que a proporção amostral esteja dentro
do intervalo de +- 0,02 em torno da proporção populacional?
−0,02 𝑝̂𝑛 −0,17
P(0,02 ≤ 𝑝̂𝑛 − 0,17 ≤ 0,02) = P( ≤
0,17(1−0,17) 0,17(1−0,17)
√ √
800 800
−0,02
≤ )= P( -151≤ Z ≤ 1,51)= 0,9345 – 0,0655= 0,8690
0,17(1−0,17)

800
ou 86,9%.

APP: P ( 0,02 ≤ 𝑝̂𝑛 − 0,17 ≤ 0,02) = P ( 0.15 ≤ 𝑝̂𝑛 ≤ 0.19)

µ= 0.17 σ= 0.0132806

x= 0.19 p(X<x)= 0.93396


⇒P(𝑝̂𝑛 ≤ 0.19) − (𝑝̂𝑛 ≤ 0.15) =
0.93396 – 0.06604= 0.86792 ou 86,79%.

µ= 0.17 σ= 0.0132806

x= 0.15 p(X<x)= 0.06604

c) Responda ao item (b) para uma amostra de 1.600 residências.


Aula remota 13-07-2021

●1. Estimação Intervalar

Média populacional:
𝑋̅−µ 𝑋̅−µ
Z= 𝜎 ⇒ 𝑃 (−𝑧𝛼 ≤ 𝑍 ≤ 𝑧𝛼 ) = 1 − 𝛼⇒ 𝑃 (−𝑧𝛼 ≤ 𝜎 ≤
√𝑛 2 2 2 √𝑛
𝜎 𝜎
𝑧𝛼 ) = 1 − 𝛼 ⇒ 𝑃 (−𝑧𝛼 ≤ 𝑋̅ − µ ≤ 𝑧𝛼 )= 1−𝛼 ⇒
2 2 √𝑛 2 √𝑛
𝜎 𝜎
𝑃 (−𝑋̅ − 𝑧𝛼 ≤ −µ ≤ 𝑋̅ + 𝑧𝛼 ) =1−𝛼 ⇒ 𝑃 (𝑋̅ −
2 √𝑛 2 √𝑛
𝜎 𝜎
𝑧𝛼 ≤ µ ≤ 𝑋̅ + 𝑧𝛼 )=1−𝛼
2 √𝑛 2 √𝑛

𝜎 𝜎 𝜎
𝐼𝐶µ = (𝑋̅ − 𝑧𝛼 ; 𝑋̅ + 𝑧𝛼 )⇒𝐼𝐶µ = 𝑋̅ ± 𝑧𝛼
2 √𝑛 2 √𝑛 2 √𝑛

𝛼 = 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎; = 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜


𝜎 𝑧𝛼 𝜎 2
𝐸 = 𝑧𝛼 = 𝑚𝑎𝑟𝑔𝑒𝑚 𝑑𝑒 𝑒𝑟𝑟𝑜; 𝑛 = ( 2 )
2 √𝑛 𝐸

OBS :Se 𝑛 > 30, podemos, podemos substituir σ pelo desvio


padrão 𝑠. Se n≤ 30, a população deve ter distribuição normal, e
devemos conhecer σ para aplicar as fórmulas acima. Para o caso de
pequenas amostras e σ desconhecido (𝑛 ≤
30) 𝑢𝑠𝑎𝑚𝑜𝑠 𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡.
Proporção populacional:

𝑝̂ (1 − 𝑝̂ )
𝐼𝐶𝑝 = 𝑝̂ ± 𝑧𝛼 √
2 𝑛
𝑝̂ (1 − 𝑝̂ )
𝐸 = 𝑧𝛼 √ = 𝑚𝑎𝑟𝑔𝑒𝑚 𝑑𝑒 𝑒𝑟𝑟𝑜; 𝑛
2 𝑛
2
(𝑧𝛼 ) 𝑝̂ (1 − 𝑝̂ )
2
=
𝐸2

Exercício 1: Uma amostra aleatória simples de 40 itens resultou em


uma média amostral 25. O desvio padrão populacional é σ= 5.
𝜎 5
a) Qual o erro padrão da média, 𝜎𝑋̅ = = = 0,79
√𝑛 √40
b) Para um grau de confiança de 95%, qual é a margem de erro?
𝜎
𝑧𝛼 = 1,96(0,79) = 5,55
2 √𝑛
c) Qual o 𝐼𝐶µ ?
𝜎
𝐼𝐶µ = 𝑋̅ ± 𝑧𝛼 = 25±1,96(0,79) = (25 − 1,55; 25 +
2 √𝑛
1,55) = (23,45; 26,55)

95%

0,025%

-1,95996 µ= 0 1,95996

µ= 0 σ= 1

x= 1,95996 p(X<x)= 0,975


Exercício 2: Em um esforço para estimar a quantia média que cada
pessoa gasta com plano de saúde em um município, foram coletados
dados de uma amostra de 49 indivíduos. Suponha um desvio padrão
populacional de $5,00.
a) Para um grau de confiança de 95%, qual é a margem de erro?
1,96×5 9,80
E= = = 1,40
√49 7

b) Se a média amostral é $ 24,80, qual é o intervalo de confiança


de 95% para a média populacional?
𝐼𝐶µ = 28,80 ± 1,40 = (27,40; 30,20)

Exercício 3: De um município, sorteou-se 31 domicílios com a


finalidade de estimar o rendimento mensal domiciliar (população
aprox.normal). Foram encontradas as seguintes estatísticas na
amostra:𝑥̅ = 1881,57; 𝑠 = 373,97. 𝐶alcule:
1,96×373,97
a) 𝐼𝐶µ(95%)= (1881,57 − ; 1881,57 +
√31
1,96×373,97
) = (1749,92; 2013,22);
√31
2,58×373,97
b) 𝐼𝐶µ(99%) = 1881,57± .
√31

99%

0,5%

-2,57583 µ= 0 2,57583
µ= 0 σ= 1

x= 2.57583 p(X<x)= 0,995


3

c) Qual o tamanho da amostra necessário para estimar a renda


média se o erro máximo provável (margem de erro) deve ser de
121,54 da média? Considere 𝜶=5% (95% de grau de
confiança).

1,96 × 373,97 2
𝑛=( ) = 36,37~37
121,54

d) Quais as margens de erro do 𝐼𝐶µ(95%); 𝐼𝐶µ(99%) ?


1,96 × 373,97
𝐼𝐶µ(95%) ⇒ 𝐸 = = 131,65
√31
2,58×373,97
𝐼𝐶µ(99%) ⇒ 𝐸 = = 173,29
√31

Exercício 4: Os resultados de um estudo envolvendo 2000 adultos


mostraram que 1.760 dos respondentes acreditam que o futuro
equilíbrio do Seguro Social é uma importante preocupação de
economia da saúde. a) Qual é a estimativa pontual da proporção
populacional de adultos que acreditam que o futuro equilíbrio do
Seguro Social é uma importante preocupação de economia da
saúde? b) Com 90% de confiança, qual é a margem de erro? c)
Desenvolva um intervalo de confiança de 90% para a proporção
populacional de adultos que pensam que o futuro equilíbrio do Seguro
Social é uma importante preocupação de economia da saúde. d)
Desenvolva um 𝐼𝐶µ(95%) para essa proporção populacional.
Exercício 5: De uma população normal com 𝜎 2 =16 levantou-se uma
amostra, obtendo-se as observações 10, 5, 10, 7. Determinar ao nível
de 5% um 𝐼𝐶µ para a média da população.

10+5+10+7 (10−8)2 +(5−8)2 +(10−8)2 +(7−8)2


𝑥̅ = = 8,00; 𝑠 = √ =
4 4=1
1,96×4
2,45; 𝜎 = √16 = 4 ; E= = 3,92
√4

𝐼𝐶µ = 8 ±3,92= (4,08; 11,92)

Exercício 6: De acordo com um relatório empresarial, a maioria dos


planos de saúde relatou lucros que superam as estimativas. Uma
amostra de 162 planos mostrou que 104 destas ultrapassaram as
estimativas.

a) Qual é a estimativa pontual da proporção dos planos de saúde


que ultrapassaram as estimativas?
104
𝑝̂ = = 0,642
162
b) Determine a margem de erro e forneça um intervalo de
confiança de 95% para a proporção dos planos de saúde que
ultrapassaram as estimativas.
𝑝̂ (1 − 𝑝̂ ) 0,642(1 − 0,642)
𝐸 = 𝑧𝛼 √ = 1,96 √ = 0,074; 𝐼𝐶𝑝
2 𝑛 162
= (𝑝̂ ± 𝐸) = (0,642 ± 0,074) = (0,568; 0,716).
c) Qual deve ser o tamanho da amostra se a margem de erro
desejada for de 0,05?
2
(𝑧𝛼 ) 𝑝̂ (1−𝑝̂)
2 1,962 ×0,642×0,358
𝑛= = = 353,18.
𝐸2 0,052
Aula remota 15-07-2021
● Revisão
Aula remota 20-07-2021
● Revisão

Você também pode gostar