Você está na página 1de 50

ESTATÍSTICA II

DISTRIBUIÇÕES TEÓRICAS DE
UNIDADE II PROBABILIDADES E TEORIA
DE ESTIMAÇÃO

2018
Ficha Técnica:

Título: Distribuições Teóricas de Probabilidades e Teoria de Estimação


Autor: Narcélio Mutombene
Revisor: Domingos Pulseira
Execução gráfica e paginação: Instituto Superior Monitor
1ª Edição: 2010
Readaptação por Instituto Superior Monitor: Janeiro de 2018
© Instituto Superior Monitor

Todos os direitos reservados por:


Instituto Superior Monitor
Av. Samora Machel, n. º 202 – 2.º andar
Caixa Postal 4388 Maputo
MOÇAMBIQUE

Nenhuma parte desta publicação pode ser reproduzida ou transmitida por qualquer forma ou
por qualquer processo, electrónico, mecânico ou fotográfico, incluindo fotocópia ou gravação,
sem autorização prévia e escrita do Instituto Superior Monitor. Exceptua-se a transcrição de
pequenos textos ou passagens para apresentação ou crítica do livro. Esta excepção não deve
de modo nenhum ser interpretada como sendo extensiva à transcrição de textos em recolhas
antológicas ou similares, de onde resulte prejuízo para o interesse pela obra. Os transgressores
são passíveis de procedimento judicial.
Índice
CAPÍTULO I-DISTRIBUIÇÕES DE PROBABILIDADES ............................................................... 5
1.1 DISTRIBUIÇÕES TEÓRICAS ................................................................................................. 5
1.2 PARÂMETROS E ESTATÍSTICAS ......................................................................................... 5
1.3 DISTRIBUIÇÕES DISCRETAS E CONTÍNUAS .................................................................... 5
1.3.1 DISTRIBUIÇÕES DISCRETAS ............................................................................................ 5
1.3.1.1 DISTRIBUIÇÃO DE BERNOULLI .................................................................................... 6
1.3.1.2 DISTRIBUIÇÃO BINOMIAL ............................................................................................. 8
1.3.1.3 DISTRIBUIÇÃO POISSON .............................................................................................. 12
1.3.2 DISTRIBUIÇÕES CONTÍNUAS ......................................................................................... 17
1.3.2.1 DISTRIBUIÇÃO NORMAL ............................................................................................. 17
1.4 DISTRIBUIÇÃO NORMAL PADRÃO .................................................................................. 19
1.4.1 ÁREAS ABAIXO DA CURVA NORMAL ......................................................................... 20
1.4.2 APROXIMAÇÃO DA DISTRIBUIÇÃO BINOMIAL À NORMAL .................................. 33
CAPÍTULO II- TAMANHO DA AMOSTRA .................................................................................. 35
2.1.DETERMINAÇÃO DO TAMANHO DA AMOSTRA........................................................... 35
CAPÍPULO III- TEORIA DE ESTIMAÇÃO .................................................................................... 37
3.1 ESTIMAÇÃO PONTUAL ....................................................................................................... 38
3.2 PROPRIEDADES DESEJÁVEIS NOS ESTIMADORES ...................................................... 38
3.3 ESTIMATIVA DE INTERVALO DE CONFIANÇA ............................................................. 39
3.3.1 INTERVALOS DE CONFIANÇA PARA UMA MÉDIA ................................................... 40
A. INTERVALO DE CONFIANÇA PARA MÉDIA (  POPULACIONAL CONHECIDO) . 40

B. INTERVALO DE CONFIANÇA PARA MÉDIA (  NÃO CONHECIDO, MAS N 30)


43
C. INTERVALO DE CONFIANÇA PARA MÉDIA (  NÃO CONHECIDO E N <30) 44
3.4 DISTRIBUIÇÃO T STUDENT ................................................................................................. 44
3.4.1 UTILIZAÇÃO DA TABELA ................................................................................................... 44
3.5 INTERVALO DE CONFIANÇA PARA UMA PROPORÇÃO POPULACIONAL .............. 47
TRABALHO ...................................................................................................................................... 49
BIBLIOGRAFIA................................................................................................................................ 50
UNIDADE II –DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADES E TEORIA DE
ESTIMAÇÃO
Prezados Estudantes: A disciplina de Estatística I será ministrada em 3 unidades. Nesta 1.ª
unidade, o estudante será capaz de:

 Proporcionar aos alunos o domínio das principais técnicas e metodologias


quantitativas e qualitativas no tratamento de dados, de modo a que estes desenvolvam
capacidades de análise e de raciocínio;

 Calcular as probalilidades usando os diferentes tipos de distribuições de


probabilidades;

 Determinar o tamanho da amostra para estimar a media o a proporção populacional;

 Estimar uma média de elementos em uma população;

 Estimar uma proporção p (desconhecida) de elementos em uma população.


Cada unidade corresponde a cerca de 5 semanas de estudo. No final de cada unidade de
estudo irá encontrar um teste de avaliação que deverá ser respondido e enviado para o ISM
pelas seguintes vias: correio, entregue presencialmente na sede ou nos centros de recurso ou
digitalizado e enviado para o email: testes@ismonitor.ac.mz. Os testes devem ser enviados ao
fim de cada 5 semanas de estudo por forma a garantir o conhecimento atempado dos
resultados obtidos no mesmo. Não entregue os 3 testes ao mesmo tempo, pois assim não
estará a par da sua progressão e dos seus erros e melhorias que deve levar a cabo para ter
sucesso.

Na página do ISM www.ismonitor.ac.mz encontra todos os contactos. Deve estar sempre


atento aos contactos da direcção do seu curso, da coordenação e do tutor de cada uma das
disciplinas que frequenta.

No final de cada unidade é providenciada uma lista de bibliografia e de referências na internet


que poderá consultar. A biblioteca virtual do ISM inclui livros digitalizados, artigos, websites

INSTITUTO SUPERIOR MONITOR


4
WWW.ISMONITOR.AC.MZ
CAPÍTULO I-DISTRIBUIÇÕES DE PROBABILIDADES

1.1 DISTRIBUIÇÕES TEÓRICAS


Uma distribuição teórica é um modelo matemático. A natureza específica de uma distribuição
teórica é determinada por valores particulares através de uma entidade chamada parâmetros da
distribuição. As distribuições teóricas também são chamadas de distribuições paramétricas,
porque seus atributos específicos dependem dos valores numéricos de seus parâmetros.

1.2 PARÂMETROS E ESTATÍSTICAS


É comum a confusão entre parâmetros da distribuição e estatísticas da amostra. Os parâmetros
da distribuição são as características de uma distribuição teórica particular. Eles representam
sucintamente as propriedades fundamentais de uma população. Já as estatísticas são
quantidades calculadas a partir de uma amostra de dados. Normalmente, a notação para
estatísticas da amostra envolve letras romanas e para os parâmetros envolve letras gregas.

1.3 DISTRIBUIÇÕES DISCRETAS E CONTÍNUAS


Há dois tipos de distribuições teóricas que correspondem a diferentes tipos de dados ou
variáveis aleatórias: a distribuição discreta e a distribuição contínua.
A distribuição discreta descreve quantidades aleatórias (dados de interesse) que podem
assumir valores particulares e os valores são finitos. Por exemplo, uma variável aleatória
discreta pode assumir somente os valores 0 e 1, ou qualquer número inteiro não negativo, etc.
A distribuição contínua representa quantidades aleatórias contínuas que podem tomar
qualquer valor dentro de um intervalo especificado dos números reais. Por exemplo, uma
variável aleatória contínua deve ser definida entre os números reais 0 e 1, ou números reais
não negativos ou, para algumas distribuições, qualquer número real. A temperatura, a pressão,
a precipitação ou qualquer elemento medido numa escala contínua é uma variável aleatória
contínua. Existem várias distribuições discretas e contínuas, algumas delas serão mostradas
abaixo. As explicações iniciarão com as distribuições discretas.

1.3.1 DISTRIBUIÇÕES DISCRETAS


Existe um grande número de distribuições de probabilidades teóricas para as variáveis
aleatórias discretas. De acordo com Wilks (1995), muitas encontram-se listadas em Johnson e
Kotz (1969), junto com os resultados referentes a suas propriedades. Entretanto, somente três
distribuições de probabilidades discretas mais importantes e mais utilizadas serão abordadas
nesta unidade, nomeadamente: a distribuição de Bernoulli, a distribuição binomial e a
distribuição de Poisson.

INSTITUTO SUPERIOR MONITOR


5
WWW.ISMONITOR.AC.MZ
Lembre que existem duas funções associadas a cada variável aleatória discreta: a função de
probabilidade, f (X), e a função de distribuição de probabilidade, F (X). A probabilidade de
que x assuma um valor particular é dada por p (X).

1.3.1.1 DISTRIBUIÇÃO DE BERNOULLI


Definição
Considere o lançamento de uma moeda. A característica desse experimento aleatório é que ele
possui apenas dois resultados possíveis. Uma situação análoga surge quando da extracção da
carta de um baralho, onde o interesse está apenas na cor (preta ou vermelha) da carta sorteada.
Um experimento de Bernoulli é um experimento aleatório com apenas dois resultados
possíveis; por convenção, um deles é chamado “sucesso” e o outro “fracasso”.
A distribuição de Bernoulli é a distribuição de uma variável aleatória X associada a um
experimento de Bernoulli, onde se define X = 1 se ocorre sucesso e X = 0 se ocorre fracasso e
chamando de p a probabilidade de sucesso e (0 <p <1).

A distribuição de Bernoulli é:

Obviamente, as condições definidoras de uma função de probabilidade são satisfeitas, uma


vez que p> 0, 1 − p> 0 e p+ (1−p) = 1. O valor de p é o único valor que precisamos conhecer
para determinar completamente a distribuição. Sendo assim, ele é, então, chamado parâmetro
da distribuição de Bernoulli. Vamos denotar a distribuição de Bernoulli com parâmetro p por
Bern(p).

A função de distribuição acumulada é dada por:

Esperança
Seja X ~ Bern(p) (lê-se: a variável aleatória X tem distribuição de Bernoulli com parâmetro p).
Então, E(X) = 0 × (1 − p) + 1 × p. Logo,
Se X ~ Bern(p), então E(X) = p
Variância
Seja X ~ Bern(p). Então, E(X2) = 02 × (1 − p) + 12 × p = p
Portanto, Var (x) = E(x2) - E2 (x) = p − p2. Logo,
Se X ~ Bern(p), então V ar(X) = p(1 − p)

Em suma, os experimentos mais simples em que observamos a presença ou não de alguma


característica são conhecidos como ensaios de Bernoulli. Alguns exemplos:

INSTITUTO SUPERIOR MONITOR


6
WWW.ISMONITOR.AC.MZ
 Lançar uma moeda e observar se ocorre cara ou coroa;
 Lançar um dado e observar se ocorre seis ou não;
 Numa linha de produção, observar se um item, tomado ao acaso, é defeituoso
ou não defeituoso;
 Verificar se um servidor de internet está activo ou não activo.

Uma distribuição de Bernoulli é adequada para descrever situações em que os resultados de


uma variável aleatória podem ser agrupados em apenas duas classes ou categorias. As
categorias devem ser mutuamente exclusivas, de forma que não haja dúvidas na classificação
do resultado da variável. Por exemplo, um produto manufacturado pode ser classificado como
perfeito ou defeituoso, a resposta de um questionário pode ser verdadeira ou falsa, as
chamadas telefónicas podem ser locais ou interurbanas. Denominamos sucesso e fracasso os
dois eventos possíveis em cada caso.

O ensaio de Bernoulli é caracterizado por uma variável aleatória X, definida por X=1, se
sucesso; X=0, se fracasso. Note que, mesmo variáveis contínuas podem ser divididas em duas
categorias, como por exemplo, a velocidade de um automóvel pode ser classificada como
dentro ou fora do limite legal.
Geralmente, denomina-se as duas categorias como sucesso ou falha. Como as duas categorias
são mutuamente exclusivas:
P ( s u c e s s o )  P ( fa lh a )  1

Consequentemente, sabendo-se que, por exemplo, a probabilidade de sucesso é P (sucesso) =


0,6, a probabilidade de falha será P (falha) = 1-0,6 = 0,4.

Exemplo. Seja o experimento E: “Lançar um dado e observar a face superior.” Defina o


evento: “o número é múltiplo de 3” e a variável X é definida como o número de sucesso.
Determine a função de probabilidade de X e calcule a esperança e a variância.

Solução: Temos que o evento ocorre com probabilidade p= 2/6, logo q=1-p=4/6
Então, a variável X tem distribuição:
X 0 1
P(x) 4/6 2/6
Com E(x)=p=1/3 e V(x)=px(1 – p)=2/9
Exemplo. Considere o experimento: retira-se uma bola da urna. Define-se uma v.a. X cujos
valores são 1 se a bola escolhida for vermelha (sucesso) e 0 caso contrário
(fracasso). Determine a função de probabilidade de X e calcule a esperança e a variância.
Solução: X: {0, 1}
P(X = 0) = 2/7 (2 bolas vermelhas (sucesso) dentre as 7 que estão na urna)

INSTITUTO SUPERIOR MONITOR


7
WWW.ISMONITOR.AC.MZ
P(X = 1) = 1 - 2/7 = 5/7
X 0 1
P(x) 5/7 2/7
E(x)=2/7 e V(x)=10/42
Na prática, a Distribuição de Bernoulli é usada como pressuposto para a aplicação de outras
distribuições, principalmente na distribuição binomial, que é uma sequência de n provas de
Bernoulli, onde em cada prova há dois resultados possíveis.

1.3.1.2 DISTRIBUIÇÃO BINOMIAL


Definição
Consideremos n repetições independentes de um experimento de Bernoulli com parâmetro p
(pense em n lançamentos de uma moeda com probabilidade p de sair cara). Vamos definir a
seguinte variável aleatória associada a este experimento:
X = número de sucessos obtidos nas n repetições
Lembre-se que os valores possíveis de X são 0 (só ocorrem fracassos), 1 (ocorre apenas 1
sucesso), 2 (ocorrem 2 sucessos),. . . , n (ocorrem apenas n sucessos).
Vamos calcular a probabilidade de X = k, onde k = 0, 1, 2, . . . , n. O evento X = k equivale à
ocorrência de k sucessos e n − k fracassos. Consideremos uma situação específica em que as k
primeiras repetições são “sucesso”. Como as repetições são independentes, temos a
probabilidade da intersecção de eventos independentes que é dada por:
p × p × ·· ·×p × (1 − p) × (1 − p) × ·· ·×(1 − p) = pk(1 − p)n−k
Mas essa é uma ordenação específica, onde os sucessos são os primeiros resultados. Na
verdade, os k sucessos podem estar em qualquer posição e ainda teremos X = k. O número de
maneiras possíveis de obter k sucessos em n repetições nada mais é que o número de
n
  n
k C
combinações de n elementos tomados k a k, ou seja, ou k . Como cada uma dessas
maneiras tem a mesma probabilidade acima e elas são eventos mutuamente exclusivos, resulta
que:
P(X = k) = pk(1 − p)n−k + pk(1 − p)n−k + · · · + pk(1 − p)n−k
n
 
Onde o número de parcelas é k , Logo
n k nk
P ( X  k )    p (1  p )
k , k = 0, 1, 2, . . . , n
Essa é a distribuição binomial. Note que para determiná-la precisamos conhecer os valores de
n e p, que são os parâmetros da distribuição. Vamos usar a seguinte notação: X ~ bin (n; p).
Note que na distribuição binomial, o número de lançamentos é fixo e o número de sucessos é
a variável de interesse.

INSTITUTO SUPERIOR MONITOR


8
WWW.ISMONITOR.AC.MZ
Condições de aplicação da distribuição binomial:
 São feitas n repetições do experimento, onde n é uma constante;
 Há apenas dois resultados possíveis em cada repetição, denominados sucesso e
fracasso;
 A probabilidade de sucesso (p) e de fracasso q=(1- p) permanecem constante em todas
as repetições;
 As repetições são independentes, ou seja, o resultado de uma repetição não é
influenciado por outros resultados.

A distribuição Binomial é usada com frequência no controle de qualidade quando a


amostragem é feita sobre uma população infinita ou muito grande. Nas aplicações de controle
da qualidade, x em geral representa o número de produtos defeituosos observados em uma
amostra de n itens.

Média e variância
Demonstra-se matematicamente que
Se X ~ bin(n, p) ⇒ E (X) = n, e
Se X ~ bin(n, p) ⇒ V ar (X) = np (1 − p)
Exemplo, se p = 0,10 e n = 15, a probabilidade de obter x itens defeituosos é calculada
usando a equação da Binomial. Por exemplo, para x=1
P (X  1 )   
15
1
1 1 5 1
x 0 ,1 0 x ( 1  0 ,1 0 )  1 5  0 ,1 0 x 0 , 2 3  0 , 3 4

15!
 15
1
 15
1 !(1 5  1) !
Lembre que,

Exemplo: Seja X uma variável aleatória que contém o número de caras saídas em 12
lançamentos de uma moeda honesta. A probabilidade de sair 5 caras em 12 lançamentos,
P(X=5), é dada por:
(k=5, p=0.5 e n=12)
P (X  5 )   
12
5
x 0 ,5 x ( 1  0 ,5 )
5 12  5
 0 .1 9

Exemplo: Um atirador acerta na mosca do alvo, 20% dos tiros. Se ele dá 10 tiros, qual a
probabilidade de ele acertar na mosca no máximo 1 vez?
Solução
Podemos considerar os tiros como experimentos de Bernoulli independentes, onde a
probabilidade de sucesso é 0,20. Então, o problema pede Pr(X ≤ 1), onde X = número de
acertos em 10 tiros. Logo, X ~ bin (n=10; p=0, 20) e

INSTITUTO SUPERIOR MONITOR


9
WWW.ISMONITOR.AC.MZ
Atenção: Lembre que as combinações de n elementos tomados k a k, são dadas por:
n n!
  
k k !( n  k ) !
.
n! Significa n factorial e é dado por: n!=n*(n-1)*(n-2)....*5*4*3*2*1

Exemplo:
4!=4*3*2*1=24,
5!=5*4*3*2*1=120,
1!=1 e 0!=1
5 5! 120
     5
4 4 !(5  4 ) ! 24 *1
Portanto, .
Exemplo: Dois adversários A e B disputam uma série de 8 partidas de um determinado jogo.
A probabilidade de A ganhar uma partida é 0,6 e não há empate. Qual é a probabilidade de A
ganhar pelo menos 5 jogos?
Solução:
Note que só podem ocorrer vitórias ou derrotas, o que significa que temos repetições de um
experimento de Bernoulli com probabilidade 0,6 de sucesso (vitória). Assumindo a
independência das provas, se definimos X = número de vitórias de A, então X ~ bin(n=8; p=0,
6) e o problema pede Pr (X ≥ 5), isto é A ganha mais partidas que B.

Exemplo: Joga-se uma moeda não viciada 7 vezes. Qual é a probabilidade de serem obtidas
no mínimo 5 caras?

Vamos definir sucesso = cara e fracasso = coroa. Então, Pr(sucesso) = Pr(fracasso) = 0, 5 e


temos repetições de um experimento de Bernoulli. Logo, X ~ bin(n=7; p=0, 5) e o problema
pede Pr(X ≥ 5).

INSTITUTO SUPERIOR MONITOR


10
WWW.ISMONITOR.AC.MZ
Exemplo: Suponha que a probabilidade dos pais terem um filho com cabelos loiros seja ¼. Se
houverem 6 crianças na família, qual é a probabilidade de que metade delas terem cabelos
loiros?
Solução
Aqui n = 6, X = 3, p = 1/4, e q = 3/4. Substituindo estes valores na fórmula binomial,
obtemos

Exemplo: Se a probabilidade de atingir um alvo num único disparo é 0,3, qual é a


probabilidade de que em 4 disparos o alvo seja atingido no mínimo 3 vezes?
Solução
Aqui n = 4, X ≥ 3, p = 0,3 e 1 – p = 0,7
P(X ≥ 3) = P(3) + P(4)

Logo, P(X ≥ 3) = P(3) + P(4) = 0,0756 + 0,0081 = 0,0837


Exemplo: Um inspector de qualidade extrai uma amostra de 10 tubos aleatoriamente de uma
carga muito grande de tubos que se sabe que contém 20% de tubos defeituosos. Qual é a
probabilidade de que não mais do que 2 dos tubos extraídos sejam defeituosos
Solução
Aqui n = 10, X ≤ 2, p = 0,2 e 1 – p = 0,8
P(X ≤ 2) = P(0) + P(1) + P(2)

Assim,
P(X ≤ 2) = P(0) + P(1) + P(2) = 0,1074 + 0,2684 + 0,3020 = 0,6778 ou 6,78%

INSTITUTO SUPERIOR MONITOR


11
WWW.ISMONITOR.AC.MZ
Exemplo: Um engenheiro de inspecção extrai uma amostra de 15 itens aleatoriamente de um
processo de fabricação sabido produzir 85% de produtos aceitáveis. Qual é a probabilidade de
que 10 dos itens extraídos sejam aceitáveis

Solução.
Aqui n = 15, X = 10, p = 0,85 e 1 – p = 0,15. A probabilidade de X = 10 itens aceitáveis,
com p = 0,85 é igual a probabilidade de X = 5 itens defeituosos com p = 0,15. Fazendo os
cálculos encontramos:

Exemplo: O Departamento de Estatística do Trabalho de um município


estimou que 20 % da força de trabalho está desempregada. Uma amostra
de 14 trabalhadores é obtida deste município. Calcule as seguintes
probabilidades:
a) Três estão desempregados na amostra. (Nota: n = 14 e p = 0,2)
b) No mínimo um dos trabalhadores está desempregado.
Solução:
14 ! 14  3
P ( X  3)   0 , 250
3
0 , 2 0 ,8
3! (14  3 )!
a)

14 ! 14  0
P ( X  1)  1  P ( X  0 )  1   0 , 956
0
0 , 2 0 ,8
0 ! (14  0 )!
b)

1.3.1.3 DISTRIBUIÇÃO POISSON


Uma outra distribuição comum é a distribuição Poisson, e é frequentemente usada para
modelar o número de ocorrências de um evento por um certo período de tempo ou por um
certo volume ou por uma certa área. Por exemplo, o no de acidentes por mês, no de defeitos
por metro quadrado, no de clientes atendidos por hora.

Nota-se que a variável aleatória é discreta (número de ocorrência), no entanto a unidade de


medida é contínua (tempo, área). Além disso, as falhas não são contáveis, pois não é possível
contar o número de acidentes que não ocorreram, nem o número de defeitos que não
ocorreram.

INSTITUTO SUPERIOR MONITOR


12
WWW.ISMONITOR.AC.MZ
A distribuição de Poisson fica completamente caracterizada por um único parâmetro  que
representa a taxa média de ocorrência por unidade de medida. A equação para calcular a
probabilidade de x ocorrências é dada por:


x
e
P (x) 
x! , x = 0, 1, ...n
Onde
e - é base do logaritmo natural (e = 2.71828...),
x! - é o factorial de x,
λ é um número real, igual ao número esperado de ocorrências que ocorrem num dado
intervalo de tempo.

Média e Variância da distribuição de Poisson


A média e a variância na distribuição de Poisson são dados por:
E (x)  
e V (x)  
2

Condições de aplicação da distribuição Poisson:


 O número de ocorrências durante qualquer intervalo depende somente da extensão do
intervalo;
 As ocorrências ocorrem independentemente, ou seja, um excesso ou falta de
ocorrências em algum intervalo não exerce efeito sobre o número de ocorrências em outro
intervalo;
 A possibilidade de duas ou mais ocorrências acontecerem em um pequeno intervalo é
muito pequena quando comparada à de uma única ocorrência.
A distribuição de Poisson é uma das mais usadas para variáveis aleatórias discretas. Sua
aplicação mais comum é na descrição de dados sobre, por exemplo, número diário de
telefonemas a uma central telefónica, número de carros que passam por um cruzamento (ou
uma cabine de pedágio) durante um certo período de tempo e em análises de confiança em
uma linha de produção (saber probabilidades de falhas). Os eventos devem ocorrer em um
certo intervalo de tempo ou espaço.

Distribuição Poisson versus Distribuição Binomial


1 A distribuição de Poisson difere da Distribuição Binomial em dois aspectos:
 A binomial é afectada pelo tamanho da amostra n e pela probabilidade p, enquanto a
Poisson é afectada apenas pela taxa de ocorrência (média) λ
 Na distribuição binomial, os valores possíveis da variável aleatória X são 0, 1, 2, ..., n
(limite máximo), enquanto em uma Poisson os valores possíveis de X são 0,1,2,3 ...
(sem limite superior).

INSTITUTO SUPERIOR MONITOR


13
WWW.ISMONITOR.AC.MZ
No entanto, podemos utilizar a Distribuição de Poisson como uma aproximação da
Distribuição Binomial quando:
 “n”é grande e “p”, muito pequeno. Ou pela seguinte regra empírica: n ≥100 e n.p ≤10;
 Ao utilizarmos Poisson como aproximação da Binomial, podemos achar o valor de λ
pela fórmula: λ= n . p
Exemplo: O número de defeitos de pintura segue uma distribuição de Poisson com   2 .
Então, a probabilidade que uma peça apresente mais de 4 defeitos de pintura será dada por:
p ( X  4 )  1  P  X  4   1  { p ( x  0 )  p ( x  1)  p ( x  2 )  p ( x  3)  p ( x  4 )}
2 0
e 2

P(x=0) = 0! = 0,135
2 1
e 2

P(x=1) = 1! = 0,270
2 2
e 2

P(x=2) = 2! =0,270
2 3
e 2

P(x=3) = 3! =0,180
2 4
e 2

P(X=4) = 4! =0,090
4 2 x
e 2
p( X  4)  1  P X  4  1    1  0, 9 4 5  0, 0 5 5  5, 5 %
x0 x!

Exemplo: Um departamento de polícia recebe em média 5 solicitações por hora. Qual a


probabilidade de receber 2 solicitações numa hora seleccionada aleatoriamente?
Solução:
X = número designado de sucessos = 2
λ = o número médio de sucessos num intervalo específico (uma hora) = 5
5 2
e 5

P (x=2) = 5! =0,08422434 ou 8,42%

Exemplo: A experiência passada indica que 6 clientes por hora, param para colocar gasolina
numa bomba.
a) Qual é a probabilidade de 3 clientes pararem qualquer hora?
b) Qual é a probabilidade de 3 clientes ou menos pararem em qualquer hora?
c) Qual é o valor esperado e o desvio padrão para esta distribuição?

INSTITUTO SUPERIOR MONITOR


14
WWW.ISMONITOR.AC.MZ
Solução:

a)

b)

Assim,

Exemplo: experiência passada mostra que 1% das lâmpadas incandescentes produzidas numa
fábrica são defeituosas. Encontre a probabilidade de mais que uma lâmpada numa amostra
aleatória de 30 lâmpadas sejam defeituosas, usando:
a) A distribuição Binomial e
b) A distribuição de Poisson.

Solução:
a) Aqui n = 30, p = 0,01, e queremos encontrar P(X > 1). Então
= P(2) + P(3) + P(4) + ... = 0,0328 + 0,0031 + 0,0002 +...= 0,0361 ou 3,61%.

b) Como n = 30 e n.p = (30).(0,01) = 0,3, podemos usar a aproximação de Poisson da


distribuição binomial. Considerando λ = Np = 0,3, temos que encontrar P(X > 1)= 1 – P(X ≤
1), onde X é o número de lâmpadas defeituosas. Agora,

INSTITUTO SUPERIOR MONITOR


15
WWW.ISMONITOR.AC.MZ
P (X ≤ 1) = P(1) + P(0) = 0,222246 + 0,74082 = 0,963066

Assim, P (X > 1) = 1 – P(X ≤ 1) = 1 – 0,963066 = 0,036934 ou 3,69%

Exemplo: Num balcão de atendimento de um departamento dum Centro Comercial, chegam


clientes de acordo com uma distribuição de Poisson de média 7 clientes/hora. Para uma
determinada hora qual é a probabilidade de:
a) Não chegarem mais de 3 clientes?
b) Chegarem pelo menos 2 clientes?
c) Chegarem exactamente 5 clientes?

Solução:
Seja X o nº de clientes que chegam ao departamento do C.C./hora.
X ~Poisson (   7 )
3 3 i
7 7
PX  3   PX  i   e  0 . 0818
i!
a) i0 i 0

P  X  2   1   P  X  0   P  X  1    0 . 9927
b)

c) P  X  5   0.1277

Exercícios
1. As chamadas telefónicas são recebidas à taxa de 48 por hora no balcão de reservas de
uma certa empresa de consultorias.
a) Calcule a probabilidade de receberem três chamadas em um intervalo de tempo de cinco
minutos.
b) Calcule a probabilidade de receberem exactamente dez chamadas em 15 minutos.
Resp.: a) 0,1952; b) 0,1048.
2. Os estabelecimentos da rede de hotéis Bom Descanso registaram a estadia de mais de 2
milhões de hóspedes no ano passado. O site da BD Região Sul, o qual tem uma média de
aproximadamente sete visitas por minuto, possibilita a muitos estabelecimentos da BD
atraírem hóspedes.
a) Calcule a probabilidade de não haver nenhuma visita ao site no período de um minuto.
b) Calcule a probabilidade de haver duas ou mais visitas ao site no período de um minuto.

INSTITUTO SUPERIOR MONITOR


16
WWW.ISMONITOR.AC.MZ
d) Calcule a probabilidade de haver cinco ou mais visitas ao site no período de um minuto.
Resp.: a) 0,0009; b) 0,9927; c) 0,8271
3. De 1990 a 1999 houve uma média de aproximadamente 26 acidentes aeronáuticos por
ano que acarretaram a morte de um ou mais passageiros. A partir de 2000, a média decresceu
para 15 acidentes por ano. Suponha que os acidentes aeronáuticos continuem a ocorrer à taxa
de 15 acidentes por ano.
a) Calcule o número médio de acidentes aeronáuticos por mês.
b) Calcule a probabilidade de não ocorrer nenhum acidente durante um mês.
c) Calcule a probabilidade de ocorrer exactamente um acidente durante um mês.
d) Calcule a probabilidade de ocorrer mais de um acidente durante um mês.
Resp.: a) 1,25; b) 0,2865; c) 0,3581; d) 0,3554

1.3.2 DISTRIBUIÇÕES CONTÍNUAS


Existem muitas distribuições teóricas contínuas. Algumas das mais usadas aqui são:
distribuição normal, distribuição gama e distribuição exponencial. Nesta unidade vamos tratar
da distribuição normal, que é a que têm maior importância prática na investigação.

1.3.2.1 DISTRIBUIÇÃO NORMAL


A distribuição de probabilidade contínua mais importante e mais utilizada é a distribuição
normal, geralmente citada como curva normal ou curva de Gauss. Sua importância em análise
matemática resulta do facto de que muitas técnicas estatísticas, como análise de variância, de
regressão e alguns testes de hipótese, assumem e exigem a normalidade dos dados. Além
disso, a ampla aplicação dessa distribuição vem em parte devido ao teorema do limite central.
Este teorema declara que na medida em que o tamanho da amostra aumenta, a distribuição
amostral das médias amostrais tende para uma distribuição normal (Triola, 1998). Esta
explicação parece um pouco complicada, portanto segue uma abordagem mais detalhada
sobre a mesma.

Teorema do Limite Central


A capacidade de usar amostras para fazer inferências sobre parâmetros populacionais depende
do conhecimento da distribuição amostral. Para obtermos uma distribuição amostral é
necessário repetir n vezes um experimento e após calcular a média das amostras. Este
procedimento fornece um novo conjunto de dados que é denominado de distribuição amostral.
Na verdade o que o teorema do limite central quer dizer é que se uma população tem
distribuição normal, a distribuição das médias amostrais extraídas da população também terá
distribuição normal, para qualquer tamanho de amostra. Além disso, mesmo no caso de uma

INSTITUTO SUPERIOR MONITOR


17
WWW.ISMONITOR.AC.MZ
distribuição não-normal, a distribuição das médias amostrais será aproximadamente normal,
desde que a amostra seja grande.
Este é um resultado notável, na verdade, pois nos diz que não é necessário conhecer a
distribuição de uma população para podermos fazer inferência sobre ela a partir de dados
amostrais. A única restrição é que o tamanho da amostra seja grande. Uma regra prática muito
usada é que a amostra deve consistir de 30 ou mais observações. Estes resultados são
conhecidos como o Teorema do Limite Central e representam talvez o conceito mais
importante na inferência estatística.

Variável Aleatória Normal


A mais importante (e mais utilizada na prática) variável aleatória contínua é a variável
aleatória normal. A variável aleatória normal tem uma função densidade de probabilidade
(chamada de curva normal) que apresenta a forma de um sino e é unimodal no centro exacto
da distribuição. A média, mediana e a moda da distribuição normal são iguais e localizadas no
pico da distribuição. Metade da área sob a curva está acima do ponto central (pico) e a outra
metade está acima dele. A distribuição de probabilidade normal é simétrica em relação a sua
média e ela é assintóptica a curva aproxima-se cada vez mais do eixo X mas nunca toca
efectivamente ele.

Figura – Características de uma Função Densidade de Probabilidade Normal

Podemos também ter distribuições normais com o mesmo desvio padrão mas com distintas
médias ou com médias e desvios padrões distintos. Na realidade a distribuição normal é um
nome genérico para definir uma família de infinitas distribuições normais particulares, cada
uma com os seus valores específicos de média e desvio padrão. O que caracteriza, portanto, e
diferencia uma distribuição normal de outra são os valores destes dois parâmetros: a sua
média e o seu desvio padrão. A função densidade de probabilidade de uma variável aleatória
normal é dada por:

INSTITUTO SUPERIOR MONITOR


18
WWW.ISMONITOR.AC.MZ
2
(X  )
1 2
2
f (X )  e
2 
2
para    x  

É possível demonstrar matematicamente que a média (ou valor esperado) dessa variável
aleatória é igual ao seu parâmetro  e o seu desvio padrão é igual ao seu segundo parâmetro
(da equação acima)  . O que quer dizer que se aplicarmos as definições de valor esperado e
de variância de uma variável aleatória contínua a expressão acima chegaremos aos resultados
 e 
2
. O problema é recairmos em integrais mais difíceis de serem resolvidas:
2
  (X  )
1 2
E[X ]   Xf ( X ) dx  X e 2
dx  
2 
2
  ,e
2
  (X  )
1
 )
2
V [X ]  (X  E [ X ]) f ( X ) dx  (X
2
dx  
2 2 2
e
2 
2
 

Talvez um bom matemático possa fazer essa demonstração, mas não é o nosso caso pois
pretendermos sermos bons somente em estatística aplicada.
É possível também demonstrar matematicamente que as duas abcissas no eixo X de valor
  e -  correspondem a pontos de inflexão da curva normal. Para isto basta obter a
segunda derivada da função densidade e provar que o seu valor muda de sinal no ponto de
inflexão mostrando que aí a curvatura muda de sentido de côncava para convexa ou vice-
versa.

1.4 DISTRIBUIÇÃO NORMAL PADRÃO


É muito difícil ficarmos calculando probabilidades para distribuições normais através de
cálculos de integração. Para evitar este trabalho foi definida uma distribuição normal
particular chamada de distribuição normal padrão. Esta distribuição tem as características de
ser uma distribuição normal com média (valor esperado) igual a zero e desvio padrão igual a
1. Em notação matemática dizemos que:
Z ~ N(0,1)

Se X é uma variável aleatória normal com média  diferente de zero e desvio padrão 
diferente de 1 podemos “converter” essa distribuição em uma distribuição normal padrão
através da transformação linear:
X  
Z 

O cálculo da variável reduzida Z faz uma transformação dos valores reais em valores
codificados. Essa transformação é feita descontando-se a média para eliminar o efeito de
localização (tendência central) e dividindo-se pelo desvio-padrão para eliminar o efeito de
escala (variabilidade).

INSTITUTO SUPERIOR MONITOR


19
WWW.ISMONITOR.AC.MZ
Uma vez calculada a variável reduzida Z, consulta-se a tabela Normal padronizada para
identificar a probabilidade acumulada à esquerda de Z, ou seja, a probabilidade de ocorrerem
valores menores ou iguais a um certo valor de Z consultado.
Para que serve essa distribuição Z? Nada melhor que um exemplo para explicar isso.
Exemplo: As rendas mensais dos graduados em um curso de especialização em uma grande
empresa são normalmente distribuídas com uma média de $ 2000 e um desvio padrão de $
200. Qual é o valor de Z para uma renda X de $ 2200? $ 1700?
X   2200  2000
Z    1
Para X = 2200  200

X   1700  2000
Z     1, 5
Para X = 1700  200

- Um valor de Z = 1 indica que o valor de $ 2200 está localizado 1 desvio padrão acima
da média de $ 2000.
- Um valor de Z = -1,5 indica que o valor de $ 1700 está localizado 1,5 desvio padrão
abaixo da média de $ 2000.

1.4.1 ÁREAS ABAIXO DA CURVA NORMAL

 Cerca de 68 % da área sob a curva normal está entre menos um e mais um desvio padrão
  1
da média. Isto pode ser escrito como .
 Cerca de 95 % da área sob a curva normal está entre menos dois e mais dois desvios
  2
padrões da média, escrito como .
 Praticamente toda (99,74 %) a área sob a curva normal está entre menos três e mais três
  3
desvios padrões da média, escrito como .
Exemplo: O uso diário de água por pessoa em uma determinada cidade é normalmente
distribuído com média  igual a 20 litros e desvio padrão  igual a 5 litros. O uso diário de
cerca de 68 % das pessoas nesta cidade caem entre que valores?
  1   20  1 (5)
 . Ou seja, cerca de 68 % das pessoas usam de 15 a 25 litros de água
por dia.
 Similarmente, para 95 % e 99 %, os intervalos serão de 10 a 30 litros e 5 a 35 litros.

INSTITUTO SUPERIOR MONITOR


20
WWW.ISMONITOR.AC.MZ
9 9 ,7 3 %

9 5 ,4 4 %

6 8 ,2 6 %

2 7 .6 2 7 .8 2 8 2 8 .2 2 8 .4 2 8 .6 2 8 .8 2 9 2 9 .2

-1  +1

-2  +2

-3  +3

Qual é a probabilidade de que uma pessoa seleccionada ao acaso usará menos do que 20 litros
por dia?
 O valor de Z é Z = (20 – 20) / 5 = 0. Portanto P (X <20) = P (Z <0) = 0,5.
Qual é a probabilidade de que uma pessoa seleccionada ao acaso use mais do que 20 litros por
dia?
 O valor de Z é Z = (20 – 20) / 5 = 0. Portanto P (X> 20) = P (Z> 0) = 0,5.
Que percentagem da população usa entre 20 e 24 litros por dia?
X = 20 Z=0
24  20
Z   0 ,8
X = 24 5

P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).

Que percentagem usa entre 16 e 20 litros?


16  20
Z    0 ,8
X = 16 5

X = 20 Z=0
P(16 < X < 20) = P (-0,8 < Z < 0) = (porque ?) P (0 < Z < 0,8) = 0,2881 = 28,81

INSTITUTO SUPERIOR MONITOR


21
WWW.ISMONITOR.AC.MZ
Distribuição Normal : Valores de P( Z < z ) = A(z)

Segunda decimal de z
0 1 2 3 4 5 6 7 8 9
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
Parte inteira e primeira decimal de z

1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
O caro estudante deve estar a perguntar-se como obtemos as probabilidades acima indicadas?
Para livrar-se dessa dúvida, considere o exemplo a seguir:

Exemplo: Suponha que o peso de um rolo de arame seja normalmente distribuído com média
100 e desvio-padrão 10. Então o peso está em torno de 100 a uma distância as vezes maior, as
vezes menor que 10. Queremos saber qual a probabilidade que um rolo, pego ao acaso da
produção, possuir peso menor ou igual a 110.
Solução:

INSTITUTO SUPERIOR MONITOR


22
WWW.ISMONITOR.AC.MZ
 110  100 
P ( X  110)  P  Z    P ( Z  1)  0 .8 4 1 3
 10 
Utilização da Tabela Z
Procuremos, agora, na tabela Z o valor de z = 1,25
Na primeira coluna encontramos o valor até uma casa decimal = 1,0. Em seguida,
encontramos, na primeira linha, o valor 0.00, que corresponde ao último algarismo do número
1,00. Na intersecção da linha e coluna correspondentes encontramos o valor 0,8413 (indicado
com as primeiras setas na tabela abaixo), o que nos permite escrever:
P ( Z < 1,0 ) = 8413 ou 39,44 %, assim a probabilidade de um certo rolo apresentar um peso
menor ou igual a 110 é de 84.13 %.
Se quiséssemos saber a probabilidade do peso do rolo ser maior que 111,6, iniciamos
calculando o valor de Z:
1 1 1, 6  1 0 0 0
Z   1 .1 6
10
Ao consultarmos a tabela, na linha 1.1 e coluna 0.06 (indicado na tabela acima pela segundas
setas), encontramos o valor 0.8770. Mas como esta é a probabilidade de P(Z<1.16) =0.8770.
Então P( Z > 1,16) = 1 - P(Z < 1,16) = 1 - 0,8770 = 0,123

Da mesma forma, se quiséssemos a probabilidade do peso estar entre 120 e 130, teríamos que
fazer o seguinte raciocínio:
P(120 < X < 130) = P(X <130) – P(X < 120) =
P(Z< 3) – P(Z< 2) =
0,9987 – 0,9772 = 0,0215
Ou seja, 2,15% de chance de um rolo pesar entre 120 e 130

Exemplo: A resistência à tracção do papel usado em sacolas de supermercado é uma


característica de qualidade importante. Sabe-se que essa resistência segue um modelo Normal
com média 40 psi e desvio padrão 2 psi. Se a especificação estabelece que a resistência deve
ser maior que 35 psi, qual a probabilidade que uma sacola produzida com este material
satisfaça a especificação?
Solução
P  X  3 5  1  P  X  3 5

 35  40 
P X  3 5  P  Z    P  Z   2 , 5
 2 
Tabela: F (-2,5) = 0,0062

INSTITUTO SUPERIOR MONITOR


23
WWW.ISMONITOR.AC.MZ
Assim a resposta é 1 - 0,0062 = 99,38%
Exemplo: O diâmetro do eixo principal de um disco rígido segue a distribuição Normal com
média 25,08 in e desvio padrão 0,05 in. Se as especificações para esse eixo são 25,00 ± 0,15
in, determine o percentual de unidades produzidas em conformidades com as especificações.
Solução:
P  2 4, 8 5  x  2 5,1 5   P  x  2 5,1 5   P  x  2 4, 8 5 

 2 5 ,1 5  2 5 , 0 8   2 4, 8 5  2 5, 0 8 
 P Z    P Z  
 0, 05   0, 05 

 P  Z  1, 4 0   P  Z   4 , 6 0   0 , 9 1 9 2  0 , 0 0 0 0  0 , 9 1 9 2

ou seja, 91,92% dentro das especificações(área cinza) e 8,08% fora das especificações.
LEI x LES

 = 0 ,0 5

2 4 ,8 5 2 5 ,0 8 2 5 ,1 5

Em suma, sempre que lhe pedirem para calcular probabilidades de variáveis aleatórias com
distribuição normal com parâmetros (  e  ), primeiro deve padronizar a variável em
questão usando a fórmula:
X  
Z 

Obtido o valor de Z, deve consultar a tabela da distribuição normal, sabendo que ela fornece a
probabilidade de que Z seja inferior ao um valor dado, isto é, fornece a área a esquerda de Z
dado { P(Z<k) }. Para obter, por exemplo, P(Z>k) terá que subtrair de 1 a probabilidade
P(Z<k), dada pela tabela, isto é P(Z>k) = 1 - P(Z<k).
A seguir são apresentados alguns exemplos ilustrativos para facilitar a assimilação do cálculo
de probabilidades de variáveis aleatória com distribuição normal.
Exemplos ilustrativos
Exemplo: Seja Z ~ N (0; 1), calcular
a) P(Z < 0,32)

P(Z < 0,32) = F(0,32) = 0,6255.

INSTITUTO SUPERIOR MONITOR


24
WWW.ISMONITOR.AC.MZ
Para encontrar o valor na tabela normal:

b) P(0 < Z < 1,71)

P(0 < Z < 1,71) = P(Z < 1,71) – P(Z < 0) = F(1,71) – F(0)
= 0,9564 - 0,5 = 0,4564.

Obs.: P(Z < 0) = P(Z > 0) = 0,5.

c) P(1,32 < Z < 1,79)

P(1,32 < Z< 1,79) = P(Z <1,79) – P(Z < 1,32) = F(1,79) - F(1,32)
= 0,9633 - 0,9066 = 0,0567.

d) P(Z > 1,5)

P(Z > 1,5) = 1 – P(Z < 1,5) = 1 – F(1,5) = 1 – 0,9332 = 0,0668

INSTITUTO SUPERIOR MONITOR


25
WWW.ISMONITOR.AC.MZ
e) P(Z < –1,3)

P(Z < – 1,3) = P(Z > 1,3) = 1 – P(Z < 1,3) = 1 – F(1,3)
= 1 – 0,9032 = 0,0968.

Obs.: Pela simetria, P(Z > – 1,3) = P(Z < 1,3).

f) P(-1,5 < Z < 1,5)

P(–1,5 < Z <1,5) = P(Z < 1,5) – P(Z < –1,5)


= P(Z <1,5) – P(Z > 1,5) = P(Z <1,5) – [1 – P(Z < 1,5)]
= 2 P(Z < 1,5) – 1 = 2 F(1,5) – 1 = 2 ( 0,9332) – 1 = 0,8664.

g) P(–1,32 < Z < 0)

P(–1,32 < Z < 0) = P(0 < Z < 1,32)


= P(Z < 1,32) – P(Z < 0) = F(1,32) – 0,5 = 0,9066 – 0,5 = 0,4066.

h) P( -2,3 < Z < -1,49)

INSTITUTO SUPERIOR MONITOR


26
WWW.ISMONITOR.AC.MZ
Z

P( -2,3 < Z < -1,49) = P(1,49 < Z < 2,3) = F(2,3) - F(1,49)
= 0,9893 - 0,9319 = 0,0574.

i) P(-1 < Z < 2)

P(–1 < Z < 2) = P(Z < 2) – P(Z < –1) = A(2) – P(Z < 1)
= A(2) – [1 – P(Z < 1)] = A(2) – (1 – A(1) )
= 0,9773 – ( 1 – 0,8413) = 0,9773 – 0,1587 = 0,8186.

Como encontrar o valor z da distribuição N(0;1) tal que:


(i) P(Z z) = 0,975

z é tal que F(z) = 0,975 z Z


Pela tabela, z = 1,96

(ii) P(0 < Z z) = 0,4975

INSTITUTO SUPERIOR MONITOR


27
WWW.ISMONITOR.AC.MZ
z é tal que F(z) = 0,5 + 0,4975 = 0,9975. z Z
Pela tabela z = 2,81

(iii) P(Z z) = 0,3

z é tal que F(z) = 0,7 z Z


Pela tabela, z = 0,53.

(iv) P(Z z) = 0,975

z
a é tal que F(a) = 0,975 e z = – a.
Z
Pela tabela a = 1,96. Então, z = – 1,96.

(v) P(Z z) = 0,10

INSTITUTO SUPERIOR MONITOR


28
WWW.ISMONITOR.AC.MZ
z Z
a é tal que F(a) = 0,90 e z = – a.
Pela tabela, a = 1,28 e, assim, z = – 1,28.

(vi) P(– z Z z) = 0,80

z é tal que P(Z < –z) = P(Z > z) = 0,1


– z Z
Isto é, P(Z< z) = F(z) = 0,90 e assim, pela tabela, z = 1,28.

Exemplo: Seja X ~ N(10 ; 64) ( médiaz= 10, s2 = 64 e s = 8 ). Calcular:

 6  10 X  10 12  10 
 P     P 0, 5  Z  0, 25
(a) P(6 X 12)  8 8 8   
= F(0,25) - (1 - F(0,5)) = 0,5987- ( 1- 0,6915 ) = 0,5987- 0,3085 = 0,2902

(b) P( X 8 ou X > 14)


 8  10   14  10 
P ( X  8 ) P ( X  14 ) P  Z  PZ  
 8   8   P  Z   0, 25   P  Z  0, 5 

INSTITUTO SUPERIOR MONITOR


29
WWW.ISMONITOR.AC.MZ
Z
= 1 - F(0,25) + 1 - F(0,5)
= 1 - 0,5987 + 1 - 0,6915 = 0,7098

c) k tal que P( X k) = 0,05


 X  10 k  10   k  10 
P ( X  k )  0 ,0 5  P   P Z    0 ,0 5
 8 8   8 

z é tal que A(z)=0,95

Pela tabela z = 1,64

k  10
E n tã o , z   1,6 4 .
8

Logo k = 10 + 1,64 8 = 23,12.

d) k tal que P( X k) = 0,025


   
 X  10 k  10   k  10 
P(X  k )  0 , 025  P     P Z    0 , 025
 8 8   8 

z é tal que A(z) = 0,975.


Pela tabela, z = 1,96.

k  10
E n tã o ,   z   1,9 6 .
8

Logo k = 10 – 1,96 8 = – 5,68.

Exemplo: O tempo gasto no exame de uma universidade tem distribuição Normal, com
média 120 min e desvio padrão 15 min.

INSTITUTO SUPERIOR MONITOR


30
WWW.ISMONITOR.AC.MZ
a) Sorteando um aluno ao acaso, qual é a probabilidade que ele termine o exame antes de
100 minutos?

Solução
Seja X: tempo gasto no exame vestibular X ~ N(120; 152)
 100  120 
P ( X  100 ) P  Z    P ( Z   1,3 3 )
 15 

 1  F ( 1, 3 3 )  1  0 , 9 0 8 2  0 , 0 9 1 8

b) Qual deve ser o tempo de prova de modo a permitir que 95% dos alunos terminem o exame
no prazo estipulado?
Solução
Seja X: tempo gasto no exame vestibular X ~ N(120; 152)
 x  120 
P ( X  x )  0 ,9 5  P  Z    0 ,9 5
 15 

Z
z = ? tal que F(z) = 0,95. Pela tabela z = 1,64
x  120
E n tã o ,  1,6 4
15
e x = 120 +1,64 15 = 144,6 min.

c) Qual é o intervalo central de tempo, tal que 80% dos estudantes gastam para completar o
exame?

Solução
Seja X: tempo gasto no exame vestibular X ~ N(120, 152)

INSTITUTO SUPERIOR MONITOR


31
WWW.ISMONITOR.AC.MZ
 x1  120 x2  120 
P ( x 1  X  x 2 )  0 ,8 0  P  Z    0 ,8 0
 15 15 

Z
z = ? tal que A(z) = 0,90. Pela tabela, z = 1,28.
x 120
1
  1,2 8
15 x1= 120 - 1, 28 15 x1 = 100,8 min.
x 120
2
 1,2 8
15 x2 = 120 +1,28 15 x2 = 139,2 min.

A aplicação da distribuição normal só se aprende com muita prática. Por isso, para testar o seu
nível de assimilação na consulta da tabela da distribuição normal, sugerimos que peque em
um papel e caneta e resolva os seguintes exercícios.
Exercícios
1. Achar a probabilidade de um valor escolhido ao acaso seja superior a 50 em uma
distribuição normal de média 35 e desvio padrão 8.
Resp: 0,0304 ou 3,04 %

2. Seja a distribuição normal de média 6,74 e desvio padrão de 2,3. Qual a probabilidade de
encontrar um valor inferior a 3,4?
Resp: 0,0735 ou 7,35 %

3. Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio
padrão 25. Determine a probabilidade de um indivíduo submetido ao teste ter nota:
a) Maior que 120 b) entre 75 e 125 c) entre 115 e 125
Resp: a) p = 21,19 % b) p = 68,26% c) p = 11,55%

4. Os salários dos funcionários de uma escola têm distribuição normal com média de $
1500,00, e desvio padrão de $ 200,00. Qual a proporção de funcionários que ganham:
a) Entre $ 1400 e $ 1600? b) Acima de $ 1500? c) Acima de $ 1400? d) Abaixo de $ 1400? e)
Acima de $ 1650?

INSTITUTO SUPERIOR MONITOR


32
WWW.ISMONITOR.AC.MZ
Resp: a) p = 38,3 % b) p = 50% c) p = 69,15% d) p = 30,85% e) p = 22,66%

5. Suponha que a idade dos alunos matriculados no curso de Gestão de Recursos Humanos,
nas turmas do 1º ano no ISM está normalmente distribuída com média de 22 anos e desvio
padrão de 4 anos. Calcule:
a) A probabilidade de se encontrar um aluno com mais de 30 anos.
b) Qual a percentagem de alunos com mais de 20 anos, mas menos do que 25 anos?
c) Sabendo que são 120 os matriculados, quantos terão menos do que 20 anos?
Resp: a) 0.0228 b) 46.49% c) 37.02
6. O tamanho das pizzas médias da Pizzaria Bom-Queijo segue uma distribuição normal
com média de 25 cm e variância de 9 cm. Qual a probabilidade de:
a) Adquirir uma pizza com mais de 28 cm.
b) Adquirir uma pizza com mais de 24 cm, mas menos de 27 cm.
Resp: a) 0.1587 b) 0.3779
7. A altura dos homens de uma dada região está normalmente distribuída, com média de
172 cm e desvio padrão de 8 cm. Calcule:
a) A probabilidade de um recruta do exército proveniente dessa região medir menos de 165
cm.
b) A probabilidade de medir mais que 167 cm.
c) A probabilidade de medir menos de 180 cm.
d) A probabilidade de medir mais de 175 cm.
e) A probabilidade de medir entre 185 e 174 cm.
f) A probabilidade de medir entre 165 e 167 cm.
g) A probabilidade de medir entre 168 e 176 cm.

Resp: a) 0.1894 b) 0.7357 c) 0.8413 d) 0.3520 e) 0.3497 f) 0.0749 g) 0.3880

1.4.2 APROXIMAÇÃO DA DISTRIBUIÇÃO BINOMIAL À NORMAL


Recordemos que uma variável aleatória (v.a.) binomial é uma variável aleatória discreta cuja

função massa de probabilidade é


P( X  k )  nk p k
1  p
n k
, k  0 ,1, .. ., n
, 0≤p≤1. Quando
o valor de n é grande esta expressão envolve cálculos muito morosos e podemos recorrer à
distribuição Normal como aproximação.

INSTITUTO SUPERIOR MONITOR


33
WWW.ISMONITOR.AC.MZ
Seja X uma variável aleatória com distribuição binomial de parâmetros n e p. Se n é “grande”
e p não está muito perto de 0 ou de 1, a distribuição binomial é aproximada pela distribuição
Normal, isto é,
 X  np 
P   x     x  , x  
 npq 
X  np
npq
ou de outro modo a variável aleatória, tem uma distribuição aproximadamente
Normal padrão.
Obs: Note-se que E  X   np e Var  X   npq q  1  p  .
Exemplo: Calculemos a probabilidade de uma variável aleatória binomial com n=25 e p=0.5
ser igual a 8, 9 ou 10 usando a aproximação à normal e comparemos com a probabilidade
exacta. O que pretendemos é
 8  12 . 5 X  12 . 5 10  12 . 5 
P 8  X  10  P       1    1 .8  
 25 4 25 4 25 4 
 

 1   1   1   1 . 8     1 . 8    1   0 . 4641  0 . 3413 

 0 . 1228

Se calcularmos a probabilidade exacta:


10  25  1 25
 
P  8  X  10   P  X  10   P  X  7        0 .190
i  8  i 
2

Quando estamos a considerar distribuições discretas a aproximação pode ser melhorada


fazendo a seguinte correcção de continuidade:
 10 . 5  12 . 5   7 . 5  12 . 5 
P 8  X  10  P  7 . 5  X  10 . 5         
 2 .5   2 .5 

   0 . 8      2   0 . 4772  0 . 2881  0 . 1891

Exemplo: Um estudo do Sindicato dos Bancários indica que cerca de 30% dos funcionários
de banco têm problemas de stresse, provenientes das condições de trabalho. Numa amostra de
200 bancários, seleccionados ao acaso, qual é a probabilidade de que no máximo 30
apresentem essa doença.
Solução: Seja X o número de funcionários com problemas de stresse. Como X é o número de
sucessos em 200 repetições independentes de um ensaio de Bernoulli com a mesma
probabilidade de sucesso, então, X~bin (n=200; p =0.3).
Então, P ( X  3 0 )  P ( X  1)  P ( X  2 )  P ( X  3 )  ....  P ( X  3 0 )
Mas como este procedimento é moroso, podemos aproximar esta distribuição à distribuição
normal.
Como X~bin (n=200; p =0.3).
E(x)=n*p=200*0.3=60 e Var(x)=n*p*q=200*0.3*0.7=42

INSTITUTO SUPERIOR MONITOR


34
WWW.ISMONITOR.AC.MZ
Logo, a distribuição de X é aproximadamente igual a distribuição Normal, em que (média=60,
desvio padrão=42). Assim, utilizando-se a tabela da distribuição normal, temos:
30  60
P ( X  30)  P (Z  )  P ( Z   4 .6 3 )  P ( Z  4 .6 3 )
42
 1  P ( Z  4 .6 3 )  1  F ( 4 .6 3 )  1  1  0

Exemplo: Na população Moçambicana adulta, sabe-se que cerca de 19% é analfabeta. Uma
amostra aleatória de 250 Moçambicanos adultos será investigada quanto ao nível de
escolaridade. Qual é a probabilidade de que, pelo menos 25, mas não mais do que 35
indivíduos sejam analfabetos?

Solução: Seja X: número de indivíduos brasileiros analfabetos, então


X~bin (250, 0.19), E(x) =250 * 0.19 = 47.5 e Var(x) =250*0.19*(1-0.19)=38.475
Logo, a distribuição de X é aproximadamente igual a distribuição de Normal, em que (média
= 47,5; desvio padrão = 38,475). Assim, utilizando-se a tabela da distribuição normal, temos:
2 5  4 7 .5 3 5  4 7 .5
P (25  Y  35)  P (  Z  )  P (  3 .6 3  Z  2 .0 2 )
3 8 .4 7 5 3 8 .4 7 5
 F (3 .6 3 )  F ( 2 .0 2 )  0 .9 9 9 9  0 .9 7 8 3  0 .0 2 1 6

CAPÍTULO II- TAMANHO DA AMOSTRA

2.1.DETERMINAÇÃO DO TAMANHO DA AMOSTRA

Há 3 factores que determinam o tamanho de uma amostra, a saber


1. O grau de confiança adoptado
2. O máximo erro permissível
3. A variabilidade da população

Para determinar o tamanho de uma amostra para um estudo qualquer, há que saber se
pretende-se determinar a média ou proporção populacionais. Portanto, vamos aprender duas
fórmulas para os dois casos.

2.1.1 TAMANHO DA AMOSTRA PARA ESTIMAR A MÉDIA POPULACIONAL


Na estimação da média populacional, podemos determinar o tamanho mínimo necessário da
amostra considerando-se um erro de estimação, e um nível de confiança desejados, e
conhecendo ou estimando um valor para , através das seguintes fórmulas:

INSTITUTO SUPERIOR MONITOR


35
WWW.ISMONITOR.AC.MZ
zc
2 2

n 
x
2

Se a população for infinita.


Onde:
x
é o erro permissível
zc
é o valor da variável normal padrão associado ao grau de confiança
adoptado
 é o desvio padrão da amostra piloto
Exemplo. Um grupo de consumidores deseja estimar a média de gasto
mensal em electricidade para um domicílio familiar simples em Julho.
Baseado em estudos similares, o desvio padrão é estimado como sendo $
20,00. Deseja-se construir um intervalo de confiança de 99 % com um
 $ 5, 0 0
erro máximo admissível de . Qual deve ser o tamanho da
amostra?
 x  5 1    0 .9 9  Z  / 2  2 .5 7 5
Solução: ; ;  20
2
zc
2 2
  2, 575    20  
n  n     106, 09  107
x
2
 5 
, logo

Exemplo. Qual deve ser o tamanho da amostra de crianças de cada escola,


para estimar a nota, supondo que a estrutura de variância é a mesma para
todas as escolas e igual a (1,2)2 e a margem de erro não supere ½ ponto,
com um nível de confiança de 95%.
Solução.
= 5% Z = 1, 96
= 0,5 e   1 .2

2 2 2
 Z  /2 *    1 .9 6 * 1, 2   2 .3 5 2 
   4 .7 0 4   2 2 .1 2  2 3
2
n   n     

    0, 5   0, 5 
Logo o tamanho da amostra deve ser de pelo menos 23 alunos por escola.

2.1.2 TAMANHO DA AMOSTRA PARA ESTIMAR A PROPORÇÃO


POPULACIONAL
Na estimação da proporção populacional, determinamos o valor mínimo para “n”
considerando um erro de estimação e um nível de confiança desejados, e supondo um valor
para p, através das seguintes fórmulas:
Z c p (1  p )
2

n 

2
p
, Se a população for infinita.

é a proporção estimada, baseada na experiência passada ou em uma
amostra piloto

INSTITUTO SUPERIOR MONITOR


36
WWW.ISMONITOR.AC.MZ
zc
é o valor da variável normal padrão associado ao grau de confiança adoptado.

2
p
é o máximo erro permissível que o pesquisador tolera.
p̂ p̂
Nota: No pior dos casos, quando você não sabe nada sobre , você pode usar =0,5.

Exemplo. Um clube deseja estimar a proporção de crianças que tem um cachorro. Se o clube
deseja que a estimativa esteja no máximo afastada 3 % da proporção populacional, quantas
crianças devem conter a amostra? Assuma um intervalo de confiança de 95 % e que o clube
estimou, com base em experiência anterior, que aproximadamente 30 % das crianças têm um
cachorro.
p  0 .3  1  p  0 .7 1    0 .9 5  Z  / 2  1 .9 6
Solução. ;  0 .0 3 ;

Z c p (1  p )
2
2
n  1 .9 6 x 0 .3 x 0 .7
n  896, 4  894

2
2
p 0 .0 3
Exemplo: Suponha, que você deseja saber quantos eleitores devem ser entrevistados para
estimar a proporção que votarão no candidato XYZ, com nível de confiança de 95% e a
margem de erro igual a 2%, sabendo que aproximadamente ele tem 20% do eleitorado.
pˆ  2 0 %  0 .2
Solução: , Z=1.96 (a 95%)

2 2
 Z  /2   1 .9 6 
n   n    * 0 , 2 * 0 , 8  1 5 3 6 .6 4  1 5 3 7
 * pˆ * (1  pˆ )
   logo,  0, 02 
Observações
Ao determinarmos o tamanho da amostra, através dessas fórmulas, qualquer resultado
fraccionário é sempre arredondado para o número inteiro imediatamente superior, pois essas
fórmulas nos dão o tamanho mínimo necessário.
Qualquer resultado obtido por essas fórmulas que seja menor do que 30 deve ser aumentado
para 30, pois as mesmas são baseadas no uso da distribuição Normal. Isso só não será feito se
a população estudada for normalmente distribuída e o conhecido.
Exemplo: se n = 90.1, devemos arredondar para n =91 e
Se n = 90.8, também arredondamos para n =91.

CAPÍPULO III- TEORIA DE ESTIMAÇÃO


Suponhamos que X, representa uma certa população ou universo. O comportamento de X é
conhecido quando se conhece a sua distribuição e o valor dos parâmetros caracterizadores
dessa distribuição. Se f (x; θ) for a função de probabilidade ou de densidade da variável X, θ é
neste caso o parâmetro desconhecido. Os métodos de estimação são utilizados precisamente
para estimar um valor para o parâmetro desconhecido.

Existem três grandes áreas dentro da estimação paramétrica:

INSTITUTO SUPERIOR MONITOR


37
WWW.ISMONITOR.AC.MZ
Estimação pontual: produção de um valor, que se pretende que seja o melhor para um
determinado parâmetro da população, com base na informação amostral.
Estimação intervalar: construção de um intervalo que, com certo grau de certeza
previamente definido, contenha o verdadeiro valor do parâmetro da população.
Testes de Hipóteses: trata-se de uma metodologia que permite validar ou não determinadas
hipóteses sobre os parâmetros de uma ou mais populações.

3.1 ESTIMAÇÃO PONTUAL


O objectivo da estimação pontual é produzir um valor para θ, que pertença ao conjunto de
valores admissíveis que o parâmetro pode assumir, de acordo com a distribuição de X.

Estimador
Um estimador não é mais do que uma fórmula, função de variáveis que assumem
determinados valores para uma dada amostra concreta, não envolvendo nenhum valor
desconhecido. Ou seja, com as observações de uma amostra concreta a referida fórmula
produz um valor determinado a que chamamos estimativa para o parâmetro desconhecido.

Estimativa
Valor especifico assumido por um estimador, obtido quando se concretiza uma amostra
concreta na fórmula matemática do estimador. Representa-se por ˆ

Exemplo: A estatística X é um estimador do valor médio  , isto é, para uma amostra


concreta, obtemos uma estimativa X para  .

Exemplo: O número de itens defeituosos produzidos por uma máquina foi registado em cinco
horas seleccionadas aleatoriamente durante uma semana de trabalho de 40 horas. O número
observado de defeituosos foi 12,4,7,14 e 10. Portanto, a média amostral é 9,4. Assim a
estimativa de ponto para a média semanal do número de itens defeituosos é 9,4.
Exercício: Os dados que seguem sobre a resistência à flexão das vigas de um tipo de concreto
são listados abaixo:
5,9 7,2 7,3 6,3 8,1 6,8 7,0 7,6 6,8 6,5 7,0 6,3 7,9 9,0 8,2 8,7 7,8 9,7 7,4 7,7 9,7 7,8

a) Calcule uma estimativa pontual do valor média da resistência para a população conceitual
de todas as vigas fabricadas dessa forma.
b) Calcule uma estimativa pontual do desvio padrão da população.

3.2 PROPRIEDADES DESEJÁVEIS NOS ESTIMADORES


Para estimar um certo parâmetro da população, podem-se utilizar estimadores alternativos. A
escolha do “melhor” estimador deve ser feita tendo em conta algumas propriedades desejáveis
num bom estimador. Essas propriedades dependem da dimensão da amostra considerada.

INSTITUTO SUPERIOR MONITOR


38
WWW.ISMONITOR.AC.MZ
Existem 3 propriedades desejáveis num bom estimador obtido a partir de amostras pequenas:

Não Enviesamento: Um estimador ˆ diz-se não enviesado não viciado ou centrado para o
ˆ
parâmetro  , se E ( )   .
Exemplo: A média amostral é um estimador centrado do valor médio da população, pois já
vimos anteriormente que: E ( X )  
Esta propriedade só por si não é suficiente para optar por, uns entre dois estimadores, no caso
por exemplo dos mesmos terem variâncias muito diferentes.

ˆ
Eficiência: Um estimador  diz-se eficiente se dentro da classe dos não enviesados ou
centrados, tiver variância mínima (o que significa que a magnitude dos erros de estimação é
mínima).

Exemplo: Demonstra-se que, de entre os estimadores para o valor médio de uma população
normal, a média amostral é um estimador eficiente.

Suficiência: Um estimador ̂ diz-se suficiente, quando é obtido utilizando toda a informação


disponível na amostra, relevante para a estimação do parâmetro.

Nota: não vamos aprofundar tanto este tópico porque envolve cálculos complicados para
alguém que não tem profundos conhecimentos de matemática. O importante é saber calcular
as estimativas pontuais (média, desvio padrão, proporção, etc) e que na verdade aprendemos
a fazer isso na Estatística I.

3.3 ESTIMATIVA DE INTERVALO DE CONFIANÇA


A grande limitação dos métodos de estimação pontual é a de não fornecerem qualquer
informação relativa ao rigor das estimativas efectuadas. Esta dificuldade é ultrapassada
recorrendo aos intervalos de confiança. Na estimação por intervalos, vamos construir um
intervalo, que com certo grau de certeza, previamente fixado, contenha o verdadeiro valor do
parâmetro. Só é possível construir um intervalo de confiança para um parâmetro se for
conhecida a distribuição do estimador intervalar utilizado.

Uma Estimativa de Intervalo estabelece uma faixa de valores dentro da qual um parâmetro
populacional provavelmente se encontra. O intervalo dentro do qual um parâmetro
populacional é esperado ocorrer é chamado de intervalo de confiança.
A ideia é construir intervalos de confiança, que incorporem à estimativa pontual informações
a respeito de sua variabilidade (erro amostral). Os intervalos de confiança são obtidos por
meio da distribuição amostral do estimador pontual.

INSTITUTO SUPERIOR MONITOR


39
WWW.ISMONITOR.AC.MZ
Os intervalos de confiança que são extensivamente usados são os de 95 % e 99 %. Um
intervalo de confiança de 95 % significa que cerca de 95 % dos intervalos construídos
similarmente conterão o parâmetro que está sendo estimado.

A metodologia para a construção de um intervalo de confiança para um dado parâmetro θ


segue os seguintes passos:

 Definição da população, da sua distribuição e do parâmetro a estimar;


 Escolha da variável fulcral, ou seja, da estatística que vamos utilizar para estimar o
parâmetro;
 Escolha do nível de significância  , ou do nível de confiança ( 1   )100%
 Determinação dos limites do intervalo de confiança concretos, a partir dos valores da
amostra.

3.3.1 INTERVALOS DE CONFIANÇA PARA UMA MÉDIA


Para uma amostra suficientemente grande a distribuição das médias amostrais em torno da
 
média populacional é Normal com desvio padrão n . Chamamos de n o erro padrão

(SE) da média, uma vez que quanto menor seu valor, tanto mais próximas estarão as médias
amostrais da média populacional (i.e. tanto menor será o erro).

A. INTERVALO DE CONFIANÇA PARA MÉDIA (  POPULACIONAL


CONHECIDO)
Seja uma determinada população com os dados:
 : média (desconhecida).
 : desvio-padrão (conhecido).

X1, X2 ... Xn: uma amostra genérica dessa população.

Considera-se uma variável X igual á soma dos elementos da amostra: X = X1 + X2 + ... + Xn

Segundo o teorema do limite central, demonstra-se que X tem distribuição Normal



( ; n )

Pode-se verificar que a variável Z abaixo tem distribuição normal padrão, N (0, 1):
X  
Z 

n
De acordo com a função de densidade da distribuição normal padrão (Figura abaixo), pode-se
ter dois valores simétricos −
Z  /2
e
Z  /2
tais que: P(−
Z  /2
≤Z≤
Z  /2
)=1− 

INSTITUTO SUPERIOR MONITOR


40
WWW.ISMONITOR.AC.MZ
Obs: dado  , o valor zα/2 pode ser obtido de tabelas da distribuição normal padrão (em anexo
no fim desta unidade).
Substituindo Z, na fórmula acima pelo seu valor segundo encontrado na tabela e reagrupando
os termos, chega-se à fórmula para o intervalo de confiança da média  da população:
Z  / 2 Z  / 2
X     X 
n n
Z  / 2
IC  : X 
Ou simplesmente, n

Onde:
X: média dos valores da amostra.
zα/2: valor de z da distribuição normal padrão para área à direita α/2.
σ: desvio-padrão (supostamente conhecido) da população.
: número de elementos da amostra.
μ: média da população (desconhecida e para a qual se deseja um intervalo de confiança).
Z  / 2
X 
ℓ1: limite inferior do intervalo de confiança = n

Z  / 2
X 
ℓ2: limite superior do intervalo de confiança = n

1 − α: coeficiente de confiança desejado (exemplo: um valor comum é 95% e, portanto, α =


0,05).
Exemplo: supõe-se que a variância do peso das pessoas adultas de sexo masculino de uma
determinada região seja 144. Em uma amostra de 36 pessoas, foi encontrada uma média de
63,4 kg. Determinar o intervalo de confiança de 90% para a média dos pesos dessas pessoas.

Solução: os dados disponíveis são:


n = 36
σ² = 144. Portanto, σ = 12
X = 63,4
1 − α = 0,90 ou α = 0,10

INSTITUTO SUPERIOR MONITOR


41
WWW.ISMONITOR.AC.MZ
Nota. Aprendemos na Unidade II como consultar o valor de Z na tabela da distribuição
normal dada a probabilidade. A tabela seguinte apresenta os valores mais usados do nível de
confiança e seu respectivo coeficiente de confiança:
Nível de confiança (1 - ) Zc
0,90 1,645
0,95 1,96
0,99 2,575

1 A escolha do nível de confiança depende da precisão que desejamos estimar o


parâmetro.
2 Então o intervalo de estimação, ou confiança, para a média populacional, utilizando-se
a distribuição normal, será calculado por:
Z  / 2 Z  / 2
X     X 
n n
E os limites são:
1 .6 4 5 x 1 2 1 .6 4 5 x 1 2
l1  6 3 .4   6 0 .1 1 l 2  6 3 .4   6 6 .6 9
6 6

Portanto, o resultado é 60,11 ≤ μ ≤ 66,69 para 90% de confiança.

Exemplo: uma variável aleatória qualquer tem uma distribuição desconhecida com média 
também desconhecida e variância σ² = 16. Retira-se uma amostra de 25 valores e calcula-se a
média amostral. Construa um IC de 95% para  supondo que X  12, 7.

Solução: o intervalo de confiança para média com σ² conhecido, é dado por:


Z  / 2 Z  / 2
X     X 
n n ,

X  12, 7.
Sabendo que , σ² = 16, n=25 e Z(0.95)=1.98, teremos
4 4
1 2 , 7  1, 9 6    1 2 , 7  1, 9 6
25 25
P (1 1,1 3 2    1 4 , 2 6 8 )  0 , 9 5
Um estudante curioso pode estar a perguntar-se como poderia obter intervalos de confiança
mais estreitos, ou seja, com limites mais próximos a média verdadeira?

A resposta pode não ser simples para si a este nível. Mas, com a exercitação, e com
habilidades matemáticas poderá perceber que poderia obter intervalos de confiança mais
estreitos diminuindo-se o nível de confiança ou aumentando-se o tamanho da amostra.

INSTITUTO SUPERIOR MONITOR


42
WWW.ISMONITOR.AC.MZ
Resumindo: Suponha uma variável aleatória X normalmente distribuída com = 10 e 2 =
4. Sorteia-se 50 valores aleatoriamente e calcula-se X . Em seguida determina-se o IC para
com 95% de confiança, ou seja:
2 2
X  1, 9 6    X  1, 9 6
50 50
X  0, 5544    X  0, 5544
Interpretação: 95% dos possíveis IC obtidos a partir de uma amostra de tamanho 50, conterão
de fato a verdadeira média .
B. INTERVALO DE CONFIANÇA PARA MÉDIA (  NÃO CONHECIDO,

MAS N 30)

Quando o desvio padrão populacional  não é conhecido, mas com um tamanho da amostra
maior ou igual a 30, ele é estimado pelo desvio padrão da amostra S e os intervalos de
confiança para a média são construídos como segue:
Z  /2 s Z  /2 s
X     X 
n n
Exemplo. Uma universidade quer estimar o número médio de horas trabalhadas por semana
por seus estudantes. Uma amostra de 49 estudantes mostrou uma média de 24 horas com um
desvio padrão de 4 horas.

A estimativa de ponto do número médio de horas trabalhadas por semana é 24 horas (média
amostral).
Qual é o intervalo de confiança de 95 % para o número médio de horas trabalhadas por
semana?
Solução: note que não nos é dado o desvio padrão populacional nem a variância, portanto,
s 4
X  1 .9 6 2 4  1 .9 6
n 49 2 2 .8 8    2 5 .1 2
usando a fórmula anterior ( ), temos ou

O limite de confiança inferior é 22,88. O limite superior de confiança é 25,12. O grau de


confiança (nível de confiança) utilizado é 0,95.

Interpretação

Se nós tivéssemos tempo para seleccionar aleatoriamente 100 amostras de tamanho 49 da


população de alunos do campus e calcular as médias amostrais e os intervalos de confiança
para cada uma destas 100 amostras, a média populacional (parâmetro) do número de horas
trabalhadas estaria contida em cerca de 95 dos 100 intervalos de confiança. Cerca de 5 dos
100 intervalos de confiança não conteriam a média populacional.

INSTITUTO SUPERIOR MONITOR


43
WWW.ISMONITOR.AC.MZ
C. INTERVALO DE CONFIANÇA PARA MÉDIA (  NÃO CONHECIDO
E N <30)
Quando o desvio padrão da população (  ) é desconhecido é necessário utilizar o seu
estimador “s”. Só que ao substituir-se o desvio padrão populacional pelo seu estimador, no
X  

quociente n , não se terá mais uma normal padrão. De facto, conforme foi demonstrado

pelo estatístico inglês W. S. Gosset, conhecido por “Student” o comportamento do quociente


segue uma distribuição simétrica em torno de zero, porém com uma variabilidade maior do
que a do normal padrão. A distribuição do quociente acima é conhecida como distribuição “t”
de Student.
Neste caso, o intervalo de confiança para a média será:
s s
X  t ( n  1 , /2)
   X  t ( n  1 , /2)
n n
t ( n  1 , / 2 )
Onde é obtido na tabela da distribuição t student

3.4 DISTRIBUIÇÃO T STUDENT


A distribuição de t student tem um formato semelhante ao da distribuição normal, mas a curva
é mais larga.
Uma característica importante da distribuição t student é o número de graus de liberdade.

3.4.1 UTILIZAÇÃO DA TABELA


t
Obtemos o valor de  / 2 na tabela da distribuição t student localizando o número de graus de
liberdade na coluna à esquerda e percorrendo a linha correspondente até atingir o número
directamente abaixo do valor aplicável (bilateral) de α.
Grau de liberdade: para um conjunto de dados correspondente ao número de valores que
podem variar após terem sido impostas certas restrições a todos os valores.
Exemplo: 10 estudantes obtêm em um teste, a média 8,0. A soma das 10 notas deve ser 80.
Portanto, se temos um grau de liberdade de 10-1=9, as nove primeiras notas podem ser
escolhidas aleatoriamente, contudo a 10ª deve ser igual a [80-(soma das 9 primeiras)].
Nota: usaremos sempre (n-1) como o número de graus de liberdade
Se uma distribuição t student tem 16 graus de liberdade, encontre o valor de t que faz a área
sombreada ser de 0,005.

INSTITUTO SUPERIOR MONITOR


44
WWW.ISMONITOR.AC.MZ
Neste caso, na linha e coluna tracejadas na tabela abaixo encontramos o valor procurado,
2.921

Nota. A tabela da distribuição t student completa, encontra-se em anexo.


Exemplo 2: Uma amostra de tamanho 9, extraída de uma população normal, acusa x =1,0 e
S=0,264. Construir intervalos de 98% de confiança para a média populacional.
Solução: Como o desvio padrão populacional não é conhecido, o intervalo de confiança será
S
I C  : X  t / 2 x
dado por n

1    98% 0, 264
IC : 1  2 , 8 9 6 
  0, 02 9
 / 2  0, 01 t 0 , 0 1 ;8  2 , 8 9 6 IC :( 0 , 7 4 5;1, 2 5 5 )
portanto,

Exemplo: uma variável aleatória qualquer tem uma distribuição desconhecida com média µ e
variância  também desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a
2

média amostral e a variância amostral. Construa um IC de 95% para µ supondo que


X  1 2 .7 e S2 = 16.

Solução: X  1 2 .7 e S2 = 16, n = 25 <30, portanto o IC será dado por


s s
X  t ( n  1 , /2)
   X  t ( n  1 , /2)
n n

INSTITUTO SUPERIOR MONITOR


45
WWW.ISMONITOR.AC.MZ
Lembre-se que o valor de t = 2.064 consulta-se na tabela t student no cruzamento da linha 24
com a coluna 0.025
Exemplo: Considere um teste de colisão de carros. A análise de 12 carros danificados resulta
num custo de conserto que parece ter distribuição em forma de sino, com média e desvio-
padrão a seguir em (USD).
X  2 6 .2 2 7

  1 5 .8 7 3
Determine o intervalo de confiança para a média a 95%.
Solução: Amostra pequena (n≤30); desvio padrão desconhecido; distribuição é similar à
distribuição normal
Na tabela: para a coluna 0,05 bilateral e grau de liberdade n-1=11 encontramos tα/2=2,201
s s
X  t ( n  1 , /2)
   X  t ( n  1 , /2)
n n
1 5 .8 7 3
2 6 .2 2 7  2 .2 0 1
12
Exemplo: Em um teste de Quociente de Inteligência (QI) de 10 alunos foram obtidos os
seguintes valores 90, 92, 92, 95, 98, 99, 100, 100, 100, 117. Calcule, para um limite de
confiança de 95%, a média esperada para todos os alunos desta escola.

Solução: como a amostra é inferior a 30, devemos utilizar o coeficiente "t" de Student, que
para um intervalo de confiança de 95% vale 1,372. Calculando a média e o desvio padrão da
amostra obtém-se: X  9 8 .3 e S  7 .5 9 .
A fórmula a ser usada é:
s s
X  t ( n  1 , /2)
   X  t ( n  1 , /2)
n n
Substituindo os dados na fórmula acima, obtêm-se:

INSTITUTO SUPERIOR MONITOR


46
WWW.ISMONITOR.AC.MZ
7 .5 9
9 8 .3  1 .3 7 2
. 9

Portando, para um intervalo de confiança de 95%, a média dos QIs dos alunos desta escola
está entre 95,01 e 101,59.~

3.5 INTERVALO DE CONFIANÇA PARA UMA PROPORÇÃO


POPULACIONAL
O objectivo deste tópico é estimar uma proporção p (desconhecida) de elementos em uma
população, apresentando certa característica de interesse, a partir da informação fornecida por
uma amostra.
Da mesma forma que as médias amostrais são distribuídas nas proximidades da média
populacional, as proporções amostrais ( p̂ ) são distribuídas ao redor da verdadeira proporção
populacional p .
Devido ao Teorema Central do Limite, para n grande e p não muito próximo de 0 ou 1, a
p̂ p
distribuição de será aproximadamente normalmente distribuída com média e um desvio
p (1  p )

padrão dado por n .


p (1  p )

Chamamos n de erro padrão da proporção amostral. Podemos usar isto na construção


de um intervalo de confiança para a verdadeira proporção p .
Lembre que o estimador pontual da proporção p também denominado proporção amostral é
x
pˆ 
n
sendo que X denota o número de elementos na amostra que apresentam a característica;
n denota o tamanho da amostra.
Um intervalo de confiança para uma proporção populacional é dado
por:
pˆ (1  pˆ ) pˆ (1  pˆ ) pˆ (1  pˆ )
pˆ  Z pˆ - Z  p  pˆ + Z
n ou n n
Onde:

é a proporção amostral
Z é o valor da variável normal padrão para o grau de confiança adoptado.
n é o tamanho amostral
Exemplo. Um planejador financeiro está estudando os planos de mudança de jovens
executivos. Uma amostra de 500 jovens executivos que possuem suas próprias casas revelou
que 175 planejam vendê-las e retirarem-se para o interior do País. Construa um intervalo de
confiança de 98 % para o parâmetro proporção populacional de executivos que planejam

INSTITUTO SUPERIOR MONITOR


47
WWW.ISMONITOR.AC.MZ
mudar para o interior.
pˆ  1 7 5  0, 35
 Aqui n = 500, 500

  0, 98  n ív e l d e c o n fia n ç a a d o p ta d o
e Z = 2,33 (para )
( 0 , 35 )  ( 0 , 65 )
0 , 35  2 , 33 ou 0,35  0,0497
 O IC de 98 % é 500

INSTITUTO SUPERIOR MONITOR


48
WWW.ISMONITOR.AC.MZ
TRABALHO
1. A força (em Newton) com que um tecido sintético se parte é representada por uma
distribuição normal, dada por X~N(800,144). O comprador do tecido requer que o mesmo
tenha no mínimo uma força de ruptura igual a 772 N. A amostra de tecido é escolhida
aleatoriamente. Calcule P(X 772N).
2. Numa fábrica de condensadores, 1% da produção é defeituosa. Selecciona-se
aleatoriamente uma amostra de 30 condensadores. Calcular a probabilidade de a amostra
incluir dois ou mais condensadores usando:
a) Distribuição binomial
b) Distribuição poisson
2
3. Se X tem distribuição binomial com E(X) = 12 e = var(X) = 3, determinar:
a) Os parâmetros n e p.
b) P(X >1)

4. Um processo de produção produz 10 itens defeituosos por hora. Encontre a


probabilidade que 4 ou menos itens sejam defeituosos numa retirada aleatória por hora usando
a distribuição de Poisson.

INSTITUTO SUPERIOR MONITOR


49
WWW.ISMONITOR.AC.MZ
BIBLIOGRAFIA
 Crespo A. A (1997). Estatística Fácil. 15ª Edição, Brasil, Editora Saraiva.
 Martins, G. A. (2002). Estatística Geral Aplicada. 2ª Edição, Brasil, Editora Atlas.
 Reis E. (1996). Estatística Descritiva. 3ª Edição, Lisboa, Edições Sílabo.
 Spiegel, M. R., J. Schiller e R. A. Srinivasan (2004). Probabilidades e Estatística. 2ª
Edição, Brasil, Editora Bookman.
 Toledo, G. L. e I. I. Ovalle (1992). Estatística Básica. 2ª Edição, Brasil, Editora Atlas
 Guimarães, S.C. Estatística, 1997. McGraw-Hill
 Murteira, B.J. Probabilidades e Estatística. Vol.1 e Vol.2, 1990. Mc-GrawHill, de
Portugal, L.da
 Oliveira, J.Tiago de. Probabilidades e Estatística. Conceitos, Métodos e Aplicações.
Vol.1 e Vol.2. McGrawHill de Portugal, Lda.
 Pedrosa, Antonio C. e Gama Marque A. Introdução Computacional à Probabilidade e
Estatística, 2004. Porto Editora

INSTITUTO SUPERIOR MONITOR


50
WWW.ISMONITOR.AC.MZ

Você também pode gostar