Escolar Documentos
Profissional Documentos
Cultura Documentos
DISTRIBUIÇÕES TEÓRICAS DE
UNIDADE II PROBABILIDADES E TEORIA
DE ESTIMAÇÃO
2018
Ficha Técnica:
Nenhuma parte desta publicação pode ser reproduzida ou transmitida por qualquer forma ou
por qualquer processo, electrónico, mecânico ou fotográfico, incluindo fotocópia ou gravação,
sem autorização prévia e escrita do Instituto Superior Monitor. Exceptua-se a transcrição de
pequenos textos ou passagens para apresentação ou crítica do livro. Esta excepção não deve
de modo nenhum ser interpretada como sendo extensiva à transcrição de textos em recolhas
antológicas ou similares, de onde resulte prejuízo para o interesse pela obra. Os transgressores
são passíveis de procedimento judicial.
Índice
CAPÍTULO I-DISTRIBUIÇÕES DE PROBABILIDADES ............................................................... 5
1.1 DISTRIBUIÇÕES TEÓRICAS ................................................................................................. 5
1.2 PARÂMETROS E ESTATÍSTICAS ......................................................................................... 5
1.3 DISTRIBUIÇÕES DISCRETAS E CONTÍNUAS .................................................................... 5
1.3.1 DISTRIBUIÇÕES DISCRETAS ............................................................................................ 5
1.3.1.1 DISTRIBUIÇÃO DE BERNOULLI .................................................................................... 6
1.3.1.2 DISTRIBUIÇÃO BINOMIAL ............................................................................................. 8
1.3.1.3 DISTRIBUIÇÃO POISSON .............................................................................................. 12
1.3.2 DISTRIBUIÇÕES CONTÍNUAS ......................................................................................... 17
1.3.2.1 DISTRIBUIÇÃO NORMAL ............................................................................................. 17
1.4 DISTRIBUIÇÃO NORMAL PADRÃO .................................................................................. 19
1.4.1 ÁREAS ABAIXO DA CURVA NORMAL ......................................................................... 20
1.4.2 APROXIMAÇÃO DA DISTRIBUIÇÃO BINOMIAL À NORMAL .................................. 33
CAPÍTULO II- TAMANHO DA AMOSTRA .................................................................................. 35
2.1.DETERMINAÇÃO DO TAMANHO DA AMOSTRA........................................................... 35
CAPÍPULO III- TEORIA DE ESTIMAÇÃO .................................................................................... 37
3.1 ESTIMAÇÃO PONTUAL ....................................................................................................... 38
3.2 PROPRIEDADES DESEJÁVEIS NOS ESTIMADORES ...................................................... 38
3.3 ESTIMATIVA DE INTERVALO DE CONFIANÇA ............................................................. 39
3.3.1 INTERVALOS DE CONFIANÇA PARA UMA MÉDIA ................................................... 40
A. INTERVALO DE CONFIANÇA PARA MÉDIA ( POPULACIONAL CONHECIDO) . 40
A distribuição de Bernoulli é:
Esperança
Seja X ~ Bern(p) (lê-se: a variável aleatória X tem distribuição de Bernoulli com parâmetro p).
Então, E(X) = 0 × (1 − p) + 1 × p. Logo,
Se X ~ Bern(p), então E(X) = p
Variância
Seja X ~ Bern(p). Então, E(X2) = 02 × (1 − p) + 12 × p = p
Portanto, Var (x) = E(x2) - E2 (x) = p − p2. Logo,
Se X ~ Bern(p), então V ar(X) = p(1 − p)
O ensaio de Bernoulli é caracterizado por uma variável aleatória X, definida por X=1, se
sucesso; X=0, se fracasso. Note que, mesmo variáveis contínuas podem ser divididas em duas
categorias, como por exemplo, a velocidade de um automóvel pode ser classificada como
dentro ou fora do limite legal.
Geralmente, denomina-se as duas categorias como sucesso ou falha. Como as duas categorias
são mutuamente exclusivas:
P ( s u c e s s o ) P ( fa lh a ) 1
Solução: Temos que o evento ocorre com probabilidade p= 2/6, logo q=1-p=4/6
Então, a variável X tem distribuição:
X 0 1
P(x) 4/6 2/6
Com E(x)=p=1/3 e V(x)=px(1 – p)=2/9
Exemplo. Considere o experimento: retira-se uma bola da urna. Define-se uma v.a. X cujos
valores são 1 se a bola escolhida for vermelha (sucesso) e 0 caso contrário
(fracasso). Determine a função de probabilidade de X e calcule a esperança e a variância.
Solução: X: {0, 1}
P(X = 0) = 2/7 (2 bolas vermelhas (sucesso) dentre as 7 que estão na urna)
Média e variância
Demonstra-se matematicamente que
Se X ~ bin(n, p) ⇒ E (X) = n, e
Se X ~ bin(n, p) ⇒ V ar (X) = np (1 − p)
Exemplo, se p = 0,10 e n = 15, a probabilidade de obter x itens defeituosos é calculada
usando a equação da Binomial. Por exemplo, para x=1
P (X 1 )
15
1
1 1 5 1
x 0 ,1 0 x ( 1 0 ,1 0 ) 1 5 0 ,1 0 x 0 , 2 3 0 , 3 4
15!
15
1
15
1 !(1 5 1) !
Lembre que,
Exemplo: Seja X uma variável aleatória que contém o número de caras saídas em 12
lançamentos de uma moeda honesta. A probabilidade de sair 5 caras em 12 lançamentos,
P(X=5), é dada por:
(k=5, p=0.5 e n=12)
P (X 5 )
12
5
x 0 ,5 x ( 1 0 ,5 )
5 12 5
0 .1 9
Exemplo: Um atirador acerta na mosca do alvo, 20% dos tiros. Se ele dá 10 tiros, qual a
probabilidade de ele acertar na mosca no máximo 1 vez?
Solução
Podemos considerar os tiros como experimentos de Bernoulli independentes, onde a
probabilidade de sucesso é 0,20. Então, o problema pede Pr(X ≤ 1), onde X = número de
acertos em 10 tiros. Logo, X ~ bin (n=10; p=0, 20) e
Exemplo:
4!=4*3*2*1=24,
5!=5*4*3*2*1=120,
1!=1 e 0!=1
5 5! 120
5
4 4 !(5 4 ) ! 24 *1
Portanto, .
Exemplo: Dois adversários A e B disputam uma série de 8 partidas de um determinado jogo.
A probabilidade de A ganhar uma partida é 0,6 e não há empate. Qual é a probabilidade de A
ganhar pelo menos 5 jogos?
Solução:
Note que só podem ocorrer vitórias ou derrotas, o que significa que temos repetições de um
experimento de Bernoulli com probabilidade 0,6 de sucesso (vitória). Assumindo a
independência das provas, se definimos X = número de vitórias de A, então X ~ bin(n=8; p=0,
6) e o problema pede Pr (X ≥ 5), isto é A ganha mais partidas que B.
Exemplo: Joga-se uma moeda não viciada 7 vezes. Qual é a probabilidade de serem obtidas
no mínimo 5 caras?
Assim,
P(X ≤ 2) = P(0) + P(1) + P(2) = 0,1074 + 0,2684 + 0,3020 = 0,6778 ou 6,78%
Solução.
Aqui n = 15, X = 10, p = 0,85 e 1 – p = 0,15. A probabilidade de X = 10 itens aceitáveis,
com p = 0,85 é igual a probabilidade de X = 5 itens defeituosos com p = 0,15. Fazendo os
cálculos encontramos:
14 ! 14 0
P ( X 1) 1 P ( X 0 ) 1 0 , 956
0
0 , 2 0 ,8
0 ! (14 0 )!
b)
P(x=0) = 0! = 0,135
2 1
e 2
P(x=1) = 1! = 0,270
2 2
e 2
P(x=2) = 2! =0,270
2 3
e 2
P(x=3) = 3! =0,180
2 4
e 2
P(X=4) = 4! =0,090
4 2 x
e 2
p( X 4) 1 P X 4 1 1 0, 9 4 5 0, 0 5 5 5, 5 %
x0 x!
Exemplo: A experiência passada indica que 6 clientes por hora, param para colocar gasolina
numa bomba.
a) Qual é a probabilidade de 3 clientes pararem qualquer hora?
b) Qual é a probabilidade de 3 clientes ou menos pararem em qualquer hora?
c) Qual é o valor esperado e o desvio padrão para esta distribuição?
a)
b)
Assim,
Exemplo: experiência passada mostra que 1% das lâmpadas incandescentes produzidas numa
fábrica são defeituosas. Encontre a probabilidade de mais que uma lâmpada numa amostra
aleatória de 30 lâmpadas sejam defeituosas, usando:
a) A distribuição Binomial e
b) A distribuição de Poisson.
Solução:
a) Aqui n = 30, p = 0,01, e queremos encontrar P(X > 1). Então
= P(2) + P(3) + P(4) + ... = 0,0328 + 0,0031 + 0,0002 +...= 0,0361 ou 3,61%.
Solução:
Seja X o nº de clientes que chegam ao departamento do C.C./hora.
X ~Poisson ( 7 )
3 3 i
7 7
PX 3 PX i e 0 . 0818
i!
a) i0 i 0
P X 2 1 P X 0 P X 1 0 . 9927
b)
c) P X 5 0.1277
Exercícios
1. As chamadas telefónicas são recebidas à taxa de 48 por hora no balcão de reservas de
uma certa empresa de consultorias.
a) Calcule a probabilidade de receberem três chamadas em um intervalo de tempo de cinco
minutos.
b) Calcule a probabilidade de receberem exactamente dez chamadas em 15 minutos.
Resp.: a) 0,1952; b) 0,1048.
2. Os estabelecimentos da rede de hotéis Bom Descanso registaram a estadia de mais de 2
milhões de hóspedes no ano passado. O site da BD Região Sul, o qual tem uma média de
aproximadamente sete visitas por minuto, possibilita a muitos estabelecimentos da BD
atraírem hóspedes.
a) Calcule a probabilidade de não haver nenhuma visita ao site no período de um minuto.
b) Calcule a probabilidade de haver duas ou mais visitas ao site no período de um minuto.
Podemos também ter distribuições normais com o mesmo desvio padrão mas com distintas
médias ou com médias e desvios padrões distintos. Na realidade a distribuição normal é um
nome genérico para definir uma família de infinitas distribuições normais particulares, cada
uma com os seus valores específicos de média e desvio padrão. O que caracteriza, portanto, e
diferencia uma distribuição normal de outra são os valores destes dois parâmetros: a sua
média e o seu desvio padrão. A função densidade de probabilidade de uma variável aleatória
normal é dada por:
É possível demonstrar matematicamente que a média (ou valor esperado) dessa variável
aleatória é igual ao seu parâmetro e o seu desvio padrão é igual ao seu segundo parâmetro
(da equação acima) . O que quer dizer que se aplicarmos as definições de valor esperado e
de variância de uma variável aleatória contínua a expressão acima chegaremos aos resultados
e
2
. O problema é recairmos em integrais mais difíceis de serem resolvidas:
2
(X )
1 2
E[X ] Xf ( X ) dx X e 2
dx
2
2
,e
2
(X )
1
)
2
V [X ] (X E [ X ]) f ( X ) dx (X
2
dx
2 2 2
e
2
2
Talvez um bom matemático possa fazer essa demonstração, mas não é o nosso caso pois
pretendermos sermos bons somente em estatística aplicada.
É possível também demonstrar matematicamente que as duas abcissas no eixo X de valor
e - correspondem a pontos de inflexão da curva normal. Para isto basta obter a
segunda derivada da função densidade e provar que o seu valor muda de sinal no ponto de
inflexão mostrando que aí a curvatura muda de sentido de côncava para convexa ou vice-
versa.
Se X é uma variável aleatória normal com média diferente de zero e desvio padrão
diferente de 1 podemos “converter” essa distribuição em uma distribuição normal padrão
através da transformação linear:
X
Z
O cálculo da variável reduzida Z faz uma transformação dos valores reais em valores
codificados. Essa transformação é feita descontando-se a média para eliminar o efeito de
localização (tendência central) e dividindo-se pelo desvio-padrão para eliminar o efeito de
escala (variabilidade).
X 1700 2000
Z 1, 5
Para X = 1700 200
- Um valor de Z = 1 indica que o valor de $ 2200 está localizado 1 desvio padrão acima
da média de $ 2000.
- Um valor de Z = -1,5 indica que o valor de $ 1700 está localizado 1,5 desvio padrão
abaixo da média de $ 2000.
Cerca de 68 % da área sob a curva normal está entre menos um e mais um desvio padrão
1
da média. Isto pode ser escrito como .
Cerca de 95 % da área sob a curva normal está entre menos dois e mais dois desvios
2
padrões da média, escrito como .
Praticamente toda (99,74 %) a área sob a curva normal está entre menos três e mais três
3
desvios padrões da média, escrito como .
Exemplo: O uso diário de água por pessoa em uma determinada cidade é normalmente
distribuído com média igual a 20 litros e desvio padrão igual a 5 litros. O uso diário de
cerca de 68 % das pessoas nesta cidade caem entre que valores?
1 20 1 (5)
. Ou seja, cerca de 68 % das pessoas usam de 15 a 25 litros de água
por dia.
Similarmente, para 95 % e 99 %, os intervalos serão de 10 a 30 litros e 5 a 35 litros.
9 5 ,4 4 %
6 8 ,2 6 %
2 7 .6 2 7 .8 2 8 2 8 .2 2 8 .4 2 8 .6 2 8 .8 2 9 2 9 .2
-1 +1
-2 +2
-3 +3
Qual é a probabilidade de que uma pessoa seleccionada ao acaso usará menos do que 20 litros
por dia?
O valor de Z é Z = (20 – 20) / 5 = 0. Portanto P (X <20) = P (Z <0) = 0,5.
Qual é a probabilidade de que uma pessoa seleccionada ao acaso use mais do que 20 litros por
dia?
O valor de Z é Z = (20 – 20) / 5 = 0. Portanto P (X> 20) = P (Z> 0) = 0,5.
Que percentagem da população usa entre 20 e 24 litros por dia?
X = 20 Z=0
24 20
Z 0 ,8
X = 24 5
P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).
X = 20 Z=0
P(16 < X < 20) = P (-0,8 < Z < 0) = (porque ?) P (0 < Z < 0,8) = 0,2881 = 28,81
Segunda decimal de z
0 1 2 3 4 5 6 7 8 9
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
Parte inteira e primeira decimal de z
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
O caro estudante deve estar a perguntar-se como obtemos as probabilidades acima indicadas?
Para livrar-se dessa dúvida, considere o exemplo a seguir:
Exemplo: Suponha que o peso de um rolo de arame seja normalmente distribuído com média
100 e desvio-padrão 10. Então o peso está em torno de 100 a uma distância as vezes maior, as
vezes menor que 10. Queremos saber qual a probabilidade que um rolo, pego ao acaso da
produção, possuir peso menor ou igual a 110.
Solução:
Da mesma forma, se quiséssemos a probabilidade do peso estar entre 120 e 130, teríamos que
fazer o seguinte raciocínio:
P(120 < X < 130) = P(X <130) – P(X < 120) =
P(Z< 3) – P(Z< 2) =
0,9987 – 0,9772 = 0,0215
Ou seja, 2,15% de chance de um rolo pesar entre 120 e 130
35 40
P X 3 5 P Z P Z 2 , 5
2
Tabela: F (-2,5) = 0,0062
2 5 ,1 5 2 5 , 0 8 2 4, 8 5 2 5, 0 8
P Z P Z
0, 05 0, 05
P Z 1, 4 0 P Z 4 , 6 0 0 , 9 1 9 2 0 , 0 0 0 0 0 , 9 1 9 2
ou seja, 91,92% dentro das especificações(área cinza) e 8,08% fora das especificações.
LEI x LES
= 0 ,0 5
2 4 ,8 5 2 5 ,0 8 2 5 ,1 5
Em suma, sempre que lhe pedirem para calcular probabilidades de variáveis aleatórias com
distribuição normal com parâmetros ( e ), primeiro deve padronizar a variável em
questão usando a fórmula:
X
Z
Obtido o valor de Z, deve consultar a tabela da distribuição normal, sabendo que ela fornece a
probabilidade de que Z seja inferior ao um valor dado, isto é, fornece a área a esquerda de Z
dado { P(Z<k) }. Para obter, por exemplo, P(Z>k) terá que subtrair de 1 a probabilidade
P(Z<k), dada pela tabela, isto é P(Z>k) = 1 - P(Z<k).
A seguir são apresentados alguns exemplos ilustrativos para facilitar a assimilação do cálculo
de probabilidades de variáveis aleatória com distribuição normal.
Exemplos ilustrativos
Exemplo: Seja Z ~ N (0; 1), calcular
a) P(Z < 0,32)
P(0 < Z < 1,71) = P(Z < 1,71) – P(Z < 0) = F(1,71) – F(0)
= 0,9564 - 0,5 = 0,4564.
P(1,32 < Z< 1,79) = P(Z <1,79) – P(Z < 1,32) = F(1,79) - F(1,32)
= 0,9633 - 0,9066 = 0,0567.
P(Z < – 1,3) = P(Z > 1,3) = 1 – P(Z < 1,3) = 1 – F(1,3)
= 1 – 0,9032 = 0,0968.
P( -2,3 < Z < -1,49) = P(1,49 < Z < 2,3) = F(2,3) - F(1,49)
= 0,9893 - 0,9319 = 0,0574.
P(–1 < Z < 2) = P(Z < 2) – P(Z < –1) = A(2) – P(Z < 1)
= A(2) – [1 – P(Z < 1)] = A(2) – (1 – A(1) )
= 0,9773 – ( 1 – 0,8413) = 0,9773 – 0,1587 = 0,8186.
z
a é tal que F(a) = 0,975 e z = – a.
Z
Pela tabela a = 1,96. Então, z = – 1,96.
6 10 X 10 12 10
P P 0, 5 Z 0, 25
(a) P(6 X 12) 8 8 8
= F(0,25) - (1 - F(0,5)) = 0,5987- ( 1- 0,6915 ) = 0,5987- 0,3085 = 0,2902
k 10
E n tã o , z 1,6 4 .
8
k 10
E n tã o , z 1,9 6 .
8
Exemplo: O tempo gasto no exame de uma universidade tem distribuição Normal, com
média 120 min e desvio padrão 15 min.
Solução
Seja X: tempo gasto no exame vestibular X ~ N(120; 152)
100 120
P ( X 100 ) P Z P ( Z 1,3 3 )
15
1 F ( 1, 3 3 ) 1 0 , 9 0 8 2 0 , 0 9 1 8
b) Qual deve ser o tempo de prova de modo a permitir que 95% dos alunos terminem o exame
no prazo estipulado?
Solução
Seja X: tempo gasto no exame vestibular X ~ N(120; 152)
x 120
P ( X x ) 0 ,9 5 P Z 0 ,9 5
15
Z
z = ? tal que F(z) = 0,95. Pela tabela z = 1,64
x 120
E n tã o , 1,6 4
15
e x = 120 +1,64 15 = 144,6 min.
c) Qual é o intervalo central de tempo, tal que 80% dos estudantes gastam para completar o
exame?
Solução
Seja X: tempo gasto no exame vestibular X ~ N(120, 152)
Z
z = ? tal que A(z) = 0,90. Pela tabela, z = 1,28.
x 120
1
1,2 8
15 x1= 120 - 1, 28 15 x1 = 100,8 min.
x 120
2
1,2 8
15 x2 = 120 +1,28 15 x2 = 139,2 min.
A aplicação da distribuição normal só se aprende com muita prática. Por isso, para testar o seu
nível de assimilação na consulta da tabela da distribuição normal, sugerimos que peque em
um papel e caneta e resolva os seguintes exercícios.
Exercícios
1. Achar a probabilidade de um valor escolhido ao acaso seja superior a 50 em uma
distribuição normal de média 35 e desvio padrão 8.
Resp: 0,0304 ou 3,04 %
2. Seja a distribuição normal de média 6,74 e desvio padrão de 2,3. Qual a probabilidade de
encontrar um valor inferior a 3,4?
Resp: 0,0735 ou 7,35 %
3. Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio
padrão 25. Determine a probabilidade de um indivíduo submetido ao teste ter nota:
a) Maior que 120 b) entre 75 e 125 c) entre 115 e 125
Resp: a) p = 21,19 % b) p = 68,26% c) p = 11,55%
4. Os salários dos funcionários de uma escola têm distribuição normal com média de $
1500,00, e desvio padrão de $ 200,00. Qual a proporção de funcionários que ganham:
a) Entre $ 1400 e $ 1600? b) Acima de $ 1500? c) Acima de $ 1400? d) Abaixo de $ 1400? e)
Acima de $ 1650?
5. Suponha que a idade dos alunos matriculados no curso de Gestão de Recursos Humanos,
nas turmas do 1º ano no ISM está normalmente distribuída com média de 22 anos e desvio
padrão de 4 anos. Calcule:
a) A probabilidade de se encontrar um aluno com mais de 30 anos.
b) Qual a percentagem de alunos com mais de 20 anos, mas menos do que 25 anos?
c) Sabendo que são 120 os matriculados, quantos terão menos do que 20 anos?
Resp: a) 0.0228 b) 46.49% c) 37.02
6. O tamanho das pizzas médias da Pizzaria Bom-Queijo segue uma distribuição normal
com média de 25 cm e variância de 9 cm. Qual a probabilidade de:
a) Adquirir uma pizza com mais de 28 cm.
b) Adquirir uma pizza com mais de 24 cm, mas menos de 27 cm.
Resp: a) 0.1587 b) 0.3779
7. A altura dos homens de uma dada região está normalmente distribuída, com média de
172 cm e desvio padrão de 8 cm. Calcule:
a) A probabilidade de um recruta do exército proveniente dessa região medir menos de 165
cm.
b) A probabilidade de medir mais que 167 cm.
c) A probabilidade de medir menos de 180 cm.
d) A probabilidade de medir mais de 175 cm.
e) A probabilidade de medir entre 185 e 174 cm.
f) A probabilidade de medir entre 165 e 167 cm.
g) A probabilidade de medir entre 168 e 176 cm.
1 1 1 1 . 8 1 . 8 1 0 . 4641 0 . 3413
0 . 1228
Exemplo: Um estudo do Sindicato dos Bancários indica que cerca de 30% dos funcionários
de banco têm problemas de stresse, provenientes das condições de trabalho. Numa amostra de
200 bancários, seleccionados ao acaso, qual é a probabilidade de que no máximo 30
apresentem essa doença.
Solução: Seja X o número de funcionários com problemas de stresse. Como X é o número de
sucessos em 200 repetições independentes de um ensaio de Bernoulli com a mesma
probabilidade de sucesso, então, X~bin (n=200; p =0.3).
Então, P ( X 3 0 ) P ( X 1) P ( X 2 ) P ( X 3 ) .... P ( X 3 0 )
Mas como este procedimento é moroso, podemos aproximar esta distribuição à distribuição
normal.
Como X~bin (n=200; p =0.3).
E(x)=n*p=200*0.3=60 e Var(x)=n*p*q=200*0.3*0.7=42
Exemplo: Na população Moçambicana adulta, sabe-se que cerca de 19% é analfabeta. Uma
amostra aleatória de 250 Moçambicanos adultos será investigada quanto ao nível de
escolaridade. Qual é a probabilidade de que, pelo menos 25, mas não mais do que 35
indivíduos sejam analfabetos?
Para determinar o tamanho de uma amostra para um estudo qualquer, há que saber se
pretende-se determinar a média ou proporção populacionais. Portanto, vamos aprender duas
fórmulas para os dois casos.
n
x
2
2 2 2
Z /2 * 1 .9 6 * 1, 2 2 .3 5 2
4 .7 0 4 2 2 .1 2 2 3
2
n n
0, 5 0, 5
Logo o tamanho da amostra deve ser de pelo menos 23 alunos por escola.
n
2
p
, Se a população for infinita.
p̂
é a proporção estimada, baseada na experiência passada ou em uma
amostra piloto
Exemplo. Um clube deseja estimar a proporção de crianças que tem um cachorro. Se o clube
deseja que a estimativa esteja no máximo afastada 3 % da proporção populacional, quantas
crianças devem conter a amostra? Assuma um intervalo de confiança de 95 % e que o clube
estimou, com base em experiência anterior, que aproximadamente 30 % das crianças têm um
cachorro.
p 0 .3 1 p 0 .7 1 0 .9 5 Z / 2 1 .9 6
Solução. ; 0 .0 3 ;
Z c p (1 p )
2
2
n 1 .9 6 x 0 .3 x 0 .7
n 896, 4 894
2
2
p 0 .0 3
Exemplo: Suponha, que você deseja saber quantos eleitores devem ser entrevistados para
estimar a proporção que votarão no candidato XYZ, com nível de confiança de 95% e a
margem de erro igual a 2%, sabendo que aproximadamente ele tem 20% do eleitorado.
pˆ 2 0 % 0 .2
Solução: , Z=1.96 (a 95%)
2 2
Z /2 1 .9 6
n n * 0 , 2 * 0 , 8 1 5 3 6 .6 4 1 5 3 7
* pˆ * (1 pˆ )
logo, 0, 02
Observações
Ao determinarmos o tamanho da amostra, através dessas fórmulas, qualquer resultado
fraccionário é sempre arredondado para o número inteiro imediatamente superior, pois essas
fórmulas nos dão o tamanho mínimo necessário.
Qualquer resultado obtido por essas fórmulas que seja menor do que 30 deve ser aumentado
para 30, pois as mesmas são baseadas no uso da distribuição Normal. Isso só não será feito se
a população estudada for normalmente distribuída e o conhecido.
Exemplo: se n = 90.1, devemos arredondar para n =91 e
Se n = 90.8, também arredondamos para n =91.
Estimador
Um estimador não é mais do que uma fórmula, função de variáveis que assumem
determinados valores para uma dada amostra concreta, não envolvendo nenhum valor
desconhecido. Ou seja, com as observações de uma amostra concreta a referida fórmula
produz um valor determinado a que chamamos estimativa para o parâmetro desconhecido.
Estimativa
Valor especifico assumido por um estimador, obtido quando se concretiza uma amostra
concreta na fórmula matemática do estimador. Representa-se por ˆ
Exemplo: O número de itens defeituosos produzidos por uma máquina foi registado em cinco
horas seleccionadas aleatoriamente durante uma semana de trabalho de 40 horas. O número
observado de defeituosos foi 12,4,7,14 e 10. Portanto, a média amostral é 9,4. Assim a
estimativa de ponto para a média semanal do número de itens defeituosos é 9,4.
Exercício: Os dados que seguem sobre a resistência à flexão das vigas de um tipo de concreto
são listados abaixo:
5,9 7,2 7,3 6,3 8,1 6,8 7,0 7,6 6,8 6,5 7,0 6,3 7,9 9,0 8,2 8,7 7,8 9,7 7,4 7,7 9,7 7,8
a) Calcule uma estimativa pontual do valor média da resistência para a população conceitual
de todas as vigas fabricadas dessa forma.
b) Calcule uma estimativa pontual do desvio padrão da população.
Não Enviesamento: Um estimador ˆ diz-se não enviesado não viciado ou centrado para o
ˆ
parâmetro , se E ( ) .
Exemplo: A média amostral é um estimador centrado do valor médio da população, pois já
vimos anteriormente que: E ( X )
Esta propriedade só por si não é suficiente para optar por, uns entre dois estimadores, no caso
por exemplo dos mesmos terem variâncias muito diferentes.
ˆ
Eficiência: Um estimador diz-se eficiente se dentro da classe dos não enviesados ou
centrados, tiver variância mínima (o que significa que a magnitude dos erros de estimação é
mínima).
Exemplo: Demonstra-se que, de entre os estimadores para o valor médio de uma população
normal, a média amostral é um estimador eficiente.
Nota: não vamos aprofundar tanto este tópico porque envolve cálculos complicados para
alguém que não tem profundos conhecimentos de matemática. O importante é saber calcular
as estimativas pontuais (média, desvio padrão, proporção, etc) e que na verdade aprendemos
a fazer isso na Estatística I.
Uma Estimativa de Intervalo estabelece uma faixa de valores dentro da qual um parâmetro
populacional provavelmente se encontra. O intervalo dentro do qual um parâmetro
populacional é esperado ocorrer é chamado de intervalo de confiança.
A ideia é construir intervalos de confiança, que incorporem à estimativa pontual informações
a respeito de sua variabilidade (erro amostral). Os intervalos de confiança são obtidos por
meio da distribuição amostral do estimador pontual.
(SE) da média, uma vez que quanto menor seu valor, tanto mais próximas estarão as médias
amostrais da média populacional (i.e. tanto menor será o erro).
Pode-se verificar que a variável Z abaixo tem distribuição normal padrão, N (0, 1):
X
Z
n
De acordo com a função de densidade da distribuição normal padrão (Figura abaixo), pode-se
ter dois valores simétricos −
Z /2
e
Z /2
tais que: P(−
Z /2
≤Z≤
Z /2
)=1−
Onde:
X: média dos valores da amostra.
zα/2: valor de z da distribuição normal padrão para área à direita α/2.
σ: desvio-padrão (supostamente conhecido) da população.
: número de elementos da amostra.
μ: média da população (desconhecida e para a qual se deseja um intervalo de confiança).
Z / 2
X
ℓ1: limite inferior do intervalo de confiança = n
Z / 2
X
ℓ2: limite superior do intervalo de confiança = n
Exemplo: uma variável aleatória qualquer tem uma distribuição desconhecida com média
também desconhecida e variância σ² = 16. Retira-se uma amostra de 25 valores e calcula-se a
média amostral. Construa um IC de 95% para supondo que X 12, 7.
X 12, 7.
Sabendo que , σ² = 16, n=25 e Z(0.95)=1.98, teremos
4 4
1 2 , 7 1, 9 6 1 2 , 7 1, 9 6
25 25
P (1 1,1 3 2 1 4 , 2 6 8 ) 0 , 9 5
Um estudante curioso pode estar a perguntar-se como poderia obter intervalos de confiança
mais estreitos, ou seja, com limites mais próximos a média verdadeira?
A resposta pode não ser simples para si a este nível. Mas, com a exercitação, e com
habilidades matemáticas poderá perceber que poderia obter intervalos de confiança mais
estreitos diminuindo-se o nível de confiança ou aumentando-se o tamanho da amostra.
MAS N 30)
Quando o desvio padrão populacional não é conhecido, mas com um tamanho da amostra
maior ou igual a 30, ele é estimado pelo desvio padrão da amostra S e os intervalos de
confiança para a média são construídos como segue:
Z /2 s Z /2 s
X X
n n
Exemplo. Uma universidade quer estimar o número médio de horas trabalhadas por semana
por seus estudantes. Uma amostra de 49 estudantes mostrou uma média de 24 horas com um
desvio padrão de 4 horas.
A estimativa de ponto do número médio de horas trabalhadas por semana é 24 horas (média
amostral).
Qual é o intervalo de confiança de 95 % para o número médio de horas trabalhadas por
semana?
Solução: note que não nos é dado o desvio padrão populacional nem a variância, portanto,
s 4
X 1 .9 6 2 4 1 .9 6
n 49 2 2 .8 8 2 5 .1 2
usando a fórmula anterior ( ), temos ou
Interpretação
1 98% 0, 264
IC : 1 2 , 8 9 6
0, 02 9
/ 2 0, 01 t 0 , 0 1 ;8 2 , 8 9 6 IC :( 0 , 7 4 5;1, 2 5 5 )
portanto,
Exemplo: uma variável aleatória qualquer tem uma distribuição desconhecida com média µ e
variância também desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a
2
1 5 .8 7 3
Determine o intervalo de confiança para a média a 95%.
Solução: Amostra pequena (n≤30); desvio padrão desconhecido; distribuição é similar à
distribuição normal
Na tabela: para a coluna 0,05 bilateral e grau de liberdade n-1=11 encontramos tα/2=2,201
s s
X t ( n 1 , /2)
X t ( n 1 , /2)
n n
1 5 .8 7 3
2 6 .2 2 7 2 .2 0 1
12
Exemplo: Em um teste de Quociente de Inteligência (QI) de 10 alunos foram obtidos os
seguintes valores 90, 92, 92, 95, 98, 99, 100, 100, 100, 117. Calcule, para um limite de
confiança de 95%, a média esperada para todos os alunos desta escola.
Solução: como a amostra é inferior a 30, devemos utilizar o coeficiente "t" de Student, que
para um intervalo de confiança de 95% vale 1,372. Calculando a média e o desvio padrão da
amostra obtém-se: X 9 8 .3 e S 7 .5 9 .
A fórmula a ser usada é:
s s
X t ( n 1 , /2)
X t ( n 1 , /2)
n n
Substituindo os dados na fórmula acima, obtêm-se:
Portando, para um intervalo de confiança de 95%, a média dos QIs dos alunos desta escola
está entre 95,01 e 101,59.~
0, 98 n ív e l d e c o n fia n ç a a d o p ta d o
e Z = 2,33 (para )
( 0 , 35 ) ( 0 , 65 )
0 , 35 2 , 33 ou 0,35 0,0497
O IC de 98 % é 500