Escolar Documentos
Profissional Documentos
Cultura Documentos
INFERÊNCIA ESTATÍSTICA - Estimação de Parâmetros PDF
INFERÊNCIA ESTATÍSTICA - Estimação de Parâmetros PDF
9.1 - Introduo
Estatstica a cincia que se ocupa de organizar, descrever, analisar e interpretar dados para
que seja possvel a tomada de decises e/ou a validao cientfica de uma concluso. Vamos rever
algumas definies dos Captulos 6 e 7.
Uma populao pode ser representada atravs de um modelo probabilstico: este apresenta
condies para uso, uma certa forma para a distribuio de probabilidades, e parmetros.
Os dados necessrios para a obteno do modelo podem ser obtidos atravs de um CENSO
(pesquisa de toda a populao), ou atravs de uma AMOSTRA (subconjunto finito) da populao.
A AMOSTRA deve ser: representativa da populao, suficiente (para que o resultado tenha
confiabilidade), e aleatria (retirada por sorteio no viciado).
Fazer uma afirmao probabilstica sobre uma caracterstica qualquer associar declarao
feita uma probabilidade de que tal declarao esteja correta (e, portanto, a probabilidade
complementar de que esteja errada). Quando se usa uma amostra da populao SEMPRE haver
uma probabilidade de estar cometendo um erro (justamente por ser usada uma amostra): a diferena
entre os mtodos estatsticos e os outros reside no fato de que os mtodos estatsticos permitem
calcular essa probabilidade de erro. E para que isso seja possvel a amostra da populao precisa
ser aleatria.
Obviamente nem sempre vivel a amostragem com reposio, se a amostragem for feita
SEM REPOSIO os resultados sero praticamente iguais se o tamanho da amostra no exceder a
5% do tamanho da populao1. Se a populao no for homognea em relao varivel sob
estudo, para garantir a representatividade da amostra somos obrigados a selecionar elementos de
cada uma de suas subdivises.
Uma vez tendo coletado os dados, seja atravs de censo ou por amostragem, preciso
resumi-los e organiz-los de maneira a permitir uma primeira anlise, e posterior uso das
informaes. As tcnicas estatsticas que se ocupam desses aspectos constituem a Anlise
Exploratria de Dados.
Mdia: trata-se de uma estatstica que caracteriza o centro de massa do conjunto de dados (Valor
Esperado); quando a mdia populacional recebe o smbolo ; quando a mdia amostral recebe o
trata de uma amostra)3. O desvio padro a raiz quadrada positiva da varincia, tendo portanto
uma unidade que igual unidade da mdia, sendo muitas vezes preferida para efeito de
mensurao da disperso.
Proporo: consiste em calcular a razo entre o nmero de ocorrncias do valor de interesse de
uma varivel qualitativa e o nmero total de ocorrncias registradas no conjunto (de todos os
valores que a varivel pode assumir); quando uma proporo populacional recebe o smbolo ;
quando uma proporo amostral recebe o smbolo p.
Os valores das medidas de sntese, alm de resumirem o conjunto de dados, constituem uma
indicao dos provveis valores dos parmetros. Assim, em estudos baseados em amostras,
comum utilizar tais medidas de sntese como estatsticas que sero utilizadas para estimar os
parmetros do modelo probabilstico que descreve a populao.
= 65,62 kg
Observe que h uma variao na estatstica mdia, e esta variao precisa ser
considerada quando so realizadas as inferncias sobre os parmetros.
Figura 1 - Distribuio Amostral - Exemplo
Assim sendo, o conhecimento das distribuies amostrais das principais estatsticas
necessrio para fazer inferncias sobre os parmetros do modelo probabilstico da populao.
3
H uma razo matemtica para isso: garantir que o valor amostral seja um estimador no viciado do valor
populacional (maiores detalhes no item Estimao por Ponto).
INE 7002 - Inferncia Estatstica Estimao de Parmetros 4
Por hora, basta conhecer as distribuies amostrais das estatsticas mdia de uma varivel
quantitativa qualquer, e proporo de um dos dois nicos resultados de uma varivel qualitativa.
Exemplo 9.14- Suponha uma varivel quantitativa cujos valores constituem uma populao com os
seguintes valores: (2, 3, 4, 5)
Para esta populao, que tem uma distribuio uniforme, podemos observar que os parmetros so:
2
= 3,5 = 1,25 (usou-se n no denominador por ser uma populao)
Se forem calculados a mdia e a varincia das mdias de todas as amostras o resultado ser:
_
1,25 2
X 56 / 16 3,5 V( x ) 0,625
2 n
Observe como a distribuio das mdias amostrais da varivel pode ser aproximada por uma
distribuio normal (no obstante a distribuio da varivel na populao no ser normal), e que o
4
Elaborado pela professora Carmen Dolores de Freitas de Lacerda.
5
H 16 amostras possveis.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 5
valor esperado das mdias amostrais (mdia das mdias) IGUAL ao valor da mdia populacional
da varivel e a varincia das mdias amostrais IGUAL ao valor da varincia populacional da
varivel dividida pelo tamanho da amostra6. Quanto maior o tamanho da amostra (quanto maior n)
mais o histograma acima aproximar-se- de uma distribuio normal, independentemente do
formato da distribuio da varivel na populao.
Exemplo 9.2 - Na Figura 3 abaixo temos a distribuio populacional de uma varivel quantitativa
qualquer de interesse. Ela apresenta mdia populacional () igual a 416,99, e varincia populacional
(2) igual a 89554,51264.
Observe que a distribuio ASSIMTRICA,
ou seja, no normal! Vamos imaginar que
70
seja possvel retirar vrias amostras aleatrias
60
(com reposio) desta populao, medir os
valores da varivel e calcular a mdia da
50
varivel em cada amostra. Posteriormente
Frequency
40
construiremos um histograma das mdias das
30
amostras, e calcularemos a mdia das mdias e
20
a varincia das mdias.
10
10
Observando o histograma vemos que a
distribuio das mdias, para amostras de 2
elementos, continua assimtrica, e o valor da
0
mdia das mdias amostrais (423,8875) no
0 250 500 750 1000
est muito prximo da mdia populacional
Mdias amostras n =2 (416,99), bem como a varincia das mdias
amostrais (67528,98666), distante de 2/n =
Figura 4 - Distribuio amostral da mdia (n = 2) 44777,25632
Obviamente o tamanho da amostra utilizada (2 elementos) ainda no foi grande o bastante para
levar aos resultados obtidos no Exemplo 9.1 (provavelmente porque a distribuio da populao
assimtrica). Vamos agora ver os resultados obtidos para 40 amostras aleatrias de 4 elementos
cada. O histograma das mdias est na Figura 5.
6
Voltaremos a analisar o significado destes resultados quando estudarmos a Estimao por Ponto.
7
A retirada das amostras foi efetuada atravs do pacote estatstico Minitab.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 6
A mdia das mdias amostrais vale 444,5375, e a
varincia das mdias amostrais vale 26464,3269. E,
20
lembrando-se do exemplo anterior, podemos calcular
o quociente varincia populacional pelo tamanho da
amostra:
2/n = 89554,51264/4 = 22388,62816.
Frequency
10
Observando o histograma vemos que a distribuio
das mdias, para amostras de 4 elementos, continua
assimtrica, e o valor da mdia das mdias amostrais
0
(444,5375) no est muito prximo da mdia
200 350 500 650 800
populacional (416,99), mas a varincia das mdias
Mdias amostras n= 4 amostrais (26464,3269) aproxima-se mais de 2/n =
22388,62816.
Figura 5 - Distribuio amostral da mdia (n = 4)
Novamente o tamanho da amostra utilizada (4 elementos) ainda no foi grande o bastante para levar
aos resultados obtidos no Exemplo 9.1 Vamos agora ver os resultados obtidos para 40 amostras
aleatrias de 16 elementos cada. O histograma das mdias est na Figura 6.
A mdia das mdias amostrais vale 394,4922, e a
varincia das mdias amostrais vale 5568,3945. E,
lembrando do exemplo anterior, podemos calcular
10 o quociente varincia populacional pelo tamanho
da amostra: 2/n = 89554,51264/16 = 5597,1577.
Frequency
40
2985,1508.
30
Observando o histograma vemos que a
20
distribuio das mdias, para amostras de 30
10
elementos virtualmente normal, e o valor da
0 mdia das mdias amostrais (421,9217) est bem
300 360 420 480 540 prximo da mdia populacional (416,99), e a
Mdias amostras n=30
varincia das mdias amostrais (2945,1326)
tambm muito prxima de 2/n = 2985,1508.
Figura 7 - Distribuio amostral da mdia (n = 30)
INE 7002 - Inferncia Estatstica Estimao de Parmetros 7
Exemplo 9.39 - Pense agora em uma varivel qualitativa que pode assumir apenas dois valores, e
que constitui a seguinte populao:
( , , , , )
Vamos supor que h interesse no valor (este valor seria o nosso sucesso). A proporo
deste valor na populao (o valor do parmetro) ser = 1/5.
(, ) (, ) (, ) (, ) (, )
Figura 8 - Amostras de tamanho 2 para proporo
Observe que se definirmos a varivel como o nmero de sucessos (nmero de ) esta ter
uma distribuio binomial: h apenas dois resultados possveis para cada realizao, h um nmero
limitado de realizaes (n = 2 no caso), e cada realizao independe da outra (porque a amostra
aleatria com reposio).
8
Este suficientemente grande varia de distribuio para distribuio, como foi visto uma distribuio uniforme
precisa de uma amostra pequena (n =2 no caso) para que a aproximao seja possvel, outras distribuies precisam de
amostras maiores. Alguns autores costumam chamar de grandes amostras aquelas que possuem mais de 30 elementos,
a partir deste tamanho a aproximao poderia ser feita sem maiores preocupaes.
9
Elaborado pela professora Carmen Dolores de Freitas de Lacerda.
10
H 25 amostras possveis.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 8
Observe que o valor esperado (mdia) das propores amostrais IGUAL ao valor da
proporo populacional de , e que a varincia das propores amostrais IGUAL ao produto da
proporo populacional de por seu complementar, dividido pelo tamanho da amostra11.
Lembrem-se de que uma distribuio binomial pode ser aproximada por uma distribuio
normal se algumas condies forem satisfeitas: se o produto do nmero de realizaes pela
probabilidade de sucesso (n x p) E o produto do nmero de realizaes pela probabilidade de
fracasso (n x [1 - p]) forem ambos maiores ou iguais a 512. E esta distribuio normal teria mdia
igual a n x p e varincia igual a n x p x (1 - p). Se estamos interessados apenas na proporo
(probabilidade de sucesso) e no no nmero de sucessos as expresses anteriores podem ser
divididas por n (o tamanho da amostra): mdia igual a p e varincia igual a [p x (1- p) / n].
Uma vez tendo decidido que modelo probabilstico mais adequado para representar a
varivel de interesse na Populao resta obter os seus parmetros. Nos estudos feitos com base em
amostras preciso escolher qual das estatsticas da amostra ser o melhor estimador para cada
parmetro do modelo.
A Estimao por Ponto consiste em determinar qual ser o melhor estimador para o
parmetro de interesse.
11
Voltaremos a analisar o significado deste resultado quando estudarmos Estimao por Ponto.
12
Isto tambm decorrncia do Teorema Central do Limite.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 9
Como os parmetros sero estimados atravs das estatsticas (estimadores) de uma amostra
aleatria, e como para cada amostra aleatria as estatsticas apresentaro diferentes valores, os
estimadores tambm tero valores aleatrios. Em outras palavras um Estimador uma varivel
aleatria que segue uma distribuio de probabilidades.
Naturalmente haver vrias estatsticas T que podero ser usadas como estimadores de um
parmetro . Como escolher qual das estatsticas ser o melhor estimador para o parmetro?
H basicamente trs critrios para a escolha de um estimador: o estimador precisa ser justo,
consistente e eficiente13.
Os principais parmetros que vamos avaliar aqui so: mdia de uma varivel que segue uma
distribuio normal (ou qualquer distribuio se a amostra for suficientemente grande) em uma
populao (mdia populacional - ) e proporo de ocorrncia de um dos valores de uma varivel
que segue uma distribuio de Bernoulli/Binomial14 em uma populao (proporo populacional -
). Em suma escolher quais estatsticas amostrais so mais adequadas para estimar estes
parmetros, usando os critrios definidos acima.
Lembrando-se dos Exemplos 9.1, 9.2 e 9.3, algumas constataes que l foram feitas
passaro a fazer sentido agora.
Lembre-se que aps retirar todas as amostras aleatrias possveis daquela populao,
calcularmos a mdia de cada amostra, e posteriormente calcularmos a mdia dessas mdias
constatou-se que o valor esperado das mdias amostrais (mdia das mdias) IGUAL ao valor da
mdia populacional da varivel e a varincia das mdias amostrais IGUAL ao valor da varincia
populacional da varivel dividida pelo tamanho da amostra:
2
E( x ) V( x )
n
O melhor estimador da mdia populacional a mdia amostral x , pois se trata de um estimador
justo e consistente:
- Justo porque o valor esperado da mdia amostral ser a mdia populacional;
13
Na realidade h mais critrios, mas estes so os mais importantes, maiores detalhes em COSTA NETO, P.O.
Estatstica, Ed. Edgard Blcher, 1978.
14
Ambas exigem que experimento seja um experimento de Bernoulli: que tenha (ou possa ser reduzido) a apenas 2
resultados possveis complementares.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 10
Agora vamos supor que houvesse a inteno de estimar a proporo populacional do valor
da varivel do Exemplo 9.3. Qual das estatsticas disponveis seria o melhor estimador?
Lembre-se que aps retirar todas as amostras aleatrias possveis daquela populao,
calcularmos a proporo de em cada amostra, e posteriormente calcularmos a mdia dessas
propores constatou-se que o valor esperado das propores amostrais (mdia das propores)
IGUAL ao valor da proporo populacional do valor da varivel e a varincia das propores
amostrais IGUAL ao valor do produto da proporo populacional do valor da varivel pela sua
complementar dividida pelo tamanho da amostra:
(1 )
E(p) V ( p)
n
Poderamos fazer um procedimento semelhante para estimar outros parmetros, como, por
exemplo, a varincia populacional de uma varivel. Este procedimento no ser demonstrado, mas o
melhor estimador da varincia populacional ser a varincia amostral SE FOR USADO n - 1 NO
DENOMINADOR DA EXPRESSO DE CLCULO15. Somente assim a varincia amostral ser
um estimador justo (no viciado) da varincia populacional.
Como o desvio padro a raiz quadrada da varincia comum estimar o desvio padro
populacional extraindo a raiz quadrada da varincia amostral.
Geralmente uma inferncia estatstica feita com base em uma nica amostra: na maior
parte dos casos totalmente invivel retirar todas as amostras possveis de uma determinada
populao.
Intuitivamente percebemos que as estatsticas calculadas nessa nica amostra, mesmo sendo
os melhores estimadores para os parmetros de interesse, tero uma probabilidade infinitesimal de
coincidir exatamente com os valores reais dos parmetros. Ento a Estimao por Ponto dos
parmetros insuficiente, e as estimativas assim obtidas serviro apenas como referncia para a
Estimao por Intervalo.
O Intervalo de Confiana ter uma certa probabilidade chamada de Nvel de confiana (que
costuma ser simbolizado como 1 - ) de conter o valor real do parmetro: fazer uma Estimao por
Intervalo de um parmetro efetuar uma afirmao probabilstica sobre este parmetro, indicando
15
Esta a razo matemtica a que se referia a nota 57.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 11
uma faixa de possveis valores, e a probabilidade de que esta faixa realmente contenha o valor real
do parmetro. A probabilidade de que o Intervalo de Confiana no contenha o valor real do
parmetro chamada de Nvel de Significncia (), e o valor desta probabilidade ser o
complementar do Nvel de Confiana. comum definir o Nvel de Significncia como uma
probabilidade mxima de erro, um risco mximo admissvel.
Para os dois parmetros em que temos maior interesse (mdia populacional e proporo
populacional ) a distribuio amostral dos estimadores (mdia amostral x e proporo amostral p,
respectivamente) pode ser aproximada por uma distribuio normal: o Intervalo de Confiana ser
ento simtrico em relao ao valor calculado da estimativa (mdia ou proporo amostral), com
base na amostra aleatria coletada:
16
Foram colocados entre aspas porque os valores dependero dos parmetros sob anlise e de outros fatores.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 12
normal com mdia igual a zero (lembrando que a distribuio normal simtrica em relao
mdia) os valores de Z1 e Z2 sero iguais em mdulo (Z1 ser negativo e Z2 positivo):
Z1 ser um valor de Z tal que P( Z Z1) , e Z2 ser um valor tal que P( Z Z 2 ) 1
2 2
E este valor Z2 costuma ser chamado de Zcrtico, porque corresponde aos limites do
intervalo17:
Li = mdia - Zcrtico desvio padro
Reparem que o mesmo valor somado e subtrado da mdia. Este valor chamado de
semi-intervalo ou preciso do intervalo, e recebe smbolo e0:
e0 = Zcrtico desvio padro
Resta agora definir corretamente o valor da mdia e do desvio padro para cada um dos
parmetros em que estamos interessados (mdia e proporo populacional). Com base nas
concluses obtidas na Estimao por Ponto isso ser simples. Contudo, h alguns outros aspectos
que precisaro ser esmiuados.
Neste caso a mdia ser a mdia amostral x (ou mais precisamente o seu valor):
P( x e 0 x e 0 ) 1
17
Esta notao a utilizada na apostila de Roteiros e Tabelas.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 13
E e0 ser: e0 Zcritico
n
Bastar ento fixar o Nvel de Confiana (ou de Significncia) para obter Zcrtico e calcular e0.
2
b) Se a varincia populacional da varivel for desconhecida.
Naturalmente este o caso mais encontrado na prtica. Como se deve proceder? Depender
do tamanho da amostra.
b.1 - Grandes amostras (mais de 30 elementos)
Nestes casos procede-se como no item anterior, apenas fazendo com que = s, ou seja,
considerando que o desvio padro da varivel na populao igual ao desvio padro da
varivel na amostra (suposio razovel para grandes amostras).
b.2 - Pequenas amostras (at 30 elementos)
Nestes casos a aproximao do item b.1 no ser vivel. Ter que ser feita uma correo na
distribuio normal padro (Z) atravs da distribuio t de Student. Trata-se de uma
distribuio de probabilidades que apresenta mdia igual a zero (como a normal padro),
simtrica em relao mdia, mas apresenta uma varincia igual a n / (n -2), ou seja seus
valores dependem do tamanho da amostra, apresentando maior varincia para menores
valores de amostra18. Quanto maior o tamanho da amostra mais a varincia de t aproxima-se
de 1,00 (varincia da normal padro)19. A distribuio t de Student est na figura abaixo:
18
Esta a correo propriamente dita, pois ao usar pequenas amostras o risco de que a varincia amostral da varivel
seja diferente da varincia populacional maior, podendo levar a intervalos de confiana que no correspondem
realidade. A no utilizao desta correo foi a fonte de muitos erros no passado, e, infelizmente, de ainda alguns erros
no presente.
19
Para tamanhos de amostra maiores do que 30 supe-se que a varincia de t igual a 1: por isso a aproximao do
item b.1.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 14
Ora, se fosse conhecido no estaramos aqui nos preocupando com a sua Estimao por
Intervalo, assim vamos verificar se possvel aproximar a distribuio binomial de p por uma
normal se:
n p 5 E n (1 - p) 5, ou seja usando o prprio valor da proporo amostral
observada (trata-se de uma aproximao razovel).
Neste caso a mdia ser a proporo amostral (ou mais precisamente o seu valor):
P(p e0 p e0 ) 1
(1 )
E o valor do desvio padro ser igual a . Novamente, como desconhecido,
n
usaremos a proporo amostral p como aproximao.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 15
p (1 p)
Ento e0 ser: e0 Zcritico
n
Bastar ento fixar o Nvel de Confiana (ou de Significncia), Zcrtico e calcular e0.
A soluo para o dilema acima obter um tamanho mnimo de amostra capaz de atender
simultaneamente ao Nvel de Confiana (ou de Significncia) e preciso (e0) especificados. Como
as expresses de e0 so em funo do tamanho de amostra (n), seria razovel pensar em reorden-
las de forma a fazer com que o tamanho de amostra seja funo do Nvel de Confiana e da preciso
(e0).
INE 7002 - Inferncia Estatstica Estimao de Parmetros 16
necessrio especificar o Nvel de Confiana (ou de Significncia) que ser usado para
encontrar o Zcrtico, e o valor de e0 (tomando o cuidado de que tanto e0 quanto p e 1- p estejam
todos como propores adimensionais ou como percentuais) para que seja possvel calcular o valor
do tamanho mnimo de amostra.
20
Esta soluo somente usada quando a natureza da pesquisa tal que no possvel retirar uma amostra piloto: a
retirada de uma amostra piloto e a eventual retirada de novos elementos da populao poderiam prejudicar muito o
resultado da pesquisa. Paga-se ento o preo de ter uma amostra substancialmente maior do que talvez fosse necessrio.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 17
Exemplo 9.4 - Retirou-se uma amostra aleatria de 4 elementos de uma produo de cortes bovinos
no intuito de estimar a mdia do peso do corte. Obteve-se mdia de 8,2 kg e desvio padro de 0,4
kg. Supondo populao normal.
a) Determinar um intervalo de confiana para a mdia populacional com 1% de significncia.
b) Para estimar a mdia, com 1% de significncia e preciso de 0,2 kg, esta amostra suficiente
a) Seguindo o roteiro de Estimao de Parmetros do apndice:
1) O parmetro de interesse a mdia populacional do peso do corte.
2) Adotou-se um nvel de significncia de 1%, ento = 0,01 e 1 - = 0,9921.
3) As estatsticas disponveis so: mdia amostral = 8,2 kg s = 0,4 kg n = 4 elementos.
4) Definio da varivel de teste: como a varincia populacional DESCONHECIDA, e o
tamanho da amostra menor do que 30 elementos, no obstante a populao ter
distribuio normal, a distribuio amostral da mdia ser t de Student, e a varivel de
teste ser tn-1.
5) Encontrar o valor de tn-1,crtico : como o Intervalo de Confiana para a mdia bilateral,
teremos uma situao semelhante da figura abaixo:
Para encontrar o valor crtico devemos
procurar na tabela da distribuio de
Student, na linha correspondente a n-1
graus de liberdade, ou seja em 4 - 1 = 3
graus de liberdade. O valor da
probabilidade pode ser visto na figura ao
lado: os valores crticos sero t3;0,005 e
t3;0,995 os quais sero iguais em mdulo. E o
valor de tn-1,crtico ser igual a 5,84 (em
mdulo)
6) Determinam-se os limites do intervalo, atravs da expresso abaixo (cujo resultado ser
somado e subtrado da mdia amostral) para determinar os limites do intervalo:
t s 5,84 0,4
e0 n 1,crtico 1,168kg
n 4
LI x e0 8,2 1,168 7,032kg LS x e0 8,2 1,168 9,368kg
7) Ento o intervalo de 99% de confiana para a mdia populacional da dimenso
[7,032;9,368] kg.
Interpretao: h 99% de probabilidade de que a verdadeira mdia populacional do peso
de corte esteja entre 7,032 e 9,368 kg.
21
Este valor pode ser arbitrado pelo usurio ou pode ser uma exigncia do problema sob anlise, ou at mesmo uma
exigncia legal. Os nveis de significncia mais comuns so de 1%, 5% ou mesmo 10%.
INE 7002 - Inferncia Estatstica Estimao de Parmetros 18
2
t s
n n 1, critico
e0
O nvel de significncia o mesmo do item a. Sendo assim, o valor crtico continuar sendo o
mesmo: tn-1,crtico = 5,84. O desvio padro amostral vale 0,4 kg, e o valor de e0, a preciso, foi
fixado em 0,2 kg. Basta ento substituir os valores na expresso:
2
t s 5,84 0,4
2
Exemplo 9.5 - Retirou-se uma amostra aleatria de 1000 peas de um lote. Verificou-se que 35
eram defeituosas.
a) Determinar um intervalo de confiana de 95% para a proporo peas defeituosas no lote.
b) Supondo 99% de confiana e preciso de 1%, esta amostra suficiente para estimar a proporo
populacional
a) Seguindo o roteiro do Apndice:
1) O parmetro de interesse a proporo populacional de peas defeituosas.
2) Adotou-se um nvel de significncia de 5%, ento = 0,05 e 1 - = 0,95
3) As estatsticas so: proporo amostral de peas defeituosas p = 35/1000 n = 1000
elementos.
4) Definio da varivel de teste: precisamos verificar se possvel fazer a aproximao
pela normal, ento n x p = 1000 x 0,035 = 35 > 5 e n x (1- p) = 1000 x 0,965 = 965 > 5.
Como ambos os produtos satisfazem as condies para a aproximao podemos usar a
varivel Z da distribuio normal padro
5) Encontrar o valor de Zcrtico : como o Intervalo de Confiana para a mdia bilateral,
teremos uma situao semelhante da figura abaixo:
Para encontrar o valor crtico
devemos procurar na tabela da
distribuio normal padro pela
probabilidade 0,975 (0,95+0,025) O
valor da probabilidade pode ser
visto na figura ao lado: os valores
crticos sero Z0,025 e Z0,975 os quais
sero iguais em mdulo. E o valor
de Zcrtico ser igual a 1,96 (em
mdulo).
b) De acordo com o item anterior possvel utilizar a aproximao pela distribuio normal. A
expresso para o clculo do tamanho mnimo de amostra para a proporo populacional ser:
2
Z
n critico p (1 p)
e0
Os valores de p e 1 - p j so conhecidos: p = 0,035 1 - p = 0,965
O nvel de confiana exigido de 99%: para encontrar o valor crtico devemos procurar na tabela
da distribuio normal padro pela probabilidade 0,995 (0,99+0,005); os valores crticos sero
Z0,005 e Z0,995 os quais sero iguais em mdulo. E o valor de Zcrtico ser igual a 2,58 (em mdulo).
A preciso foi fixada em 1% (0,01). Substituindo os valores na expresso acima:
2
Z
2
2,58
n critico p (1 p) 0,035 0,965 2248,14 2249
e0 0,01
Observe que o tamanho mnimo de amostra necessrio para atender a 99% de confiana e preciso
de 1% deveria ser de 2249 elementos. Como a amostra coletada possui apenas 1000 elementos ela
INSUFICIENTE para a confiana e preciso exigidas. Recomenda-se o retorno populao para
a retirada aleatria de mais 1249 peas.
"EMPATE TCNICO"
Exemplo 9.6 - Imagine que uma pesquisa de opinio eleitoral apresentasse os seguintes resultados
(intervalos de confiana para a proporo que declara votar no candidato) sobre a prefeitura do
municpio de Tapioca. Quais candidatos esto tecnicamente empatados?
Opinio Limite inferior % Limite superior %
Godofredo Astrogildo 31% 37%
Filismino Arquibaldo 14% 20%
Urraca Hermengarda 13% 19%
Salustiano Quintanilha 22% 28%
Indecisos 11% 17%
Filismino e Urraca esto tecnicamente empatados, pois seus intervalos de confiana apresentam
grande sobreposio. Godofredo est muito na frente, pois o limite inferior de seu intervalo
maior do que o limite superior de Salustiano, que est em segundo lugar. importante ressaltar
que o nmero de indecisos razovel, variando de 11 a 17%, quando eles se decidirem podero
mudar completamente o quadro da eleio, ou garantir a vitria folgada de Godofredo.