Você está na página 1de 19

INE 7002 - Inferncia Estatstica Estimao de Parmetros

1

9 - INFERNCIA ESTATSTICA Estimao de Parmetros

9.1 - Introduo

Estatstica a cincia que se ocupa de organizar, descrever, analisar e interpretar dados para
que seja possvel a tomada de decises e/ou a validao cientfica de uma concluso. Vamos rever
algumas definies dos Captulos 6 e 7.

Os dados so coletados para estudar uma ou mais caractersticas de uma POPULAO:
conjunto de elementos que tem pelo menos uma caracterstica em comum => conjunto das medidas
da(s) caracterstica(s) de interesse em todos os elementos que a(s) apresenta(m).

Uma populao pode ser representada atravs de um modelo probabilstico: este apresenta
condies para uso, uma certa forma para a distribuio de probabilidades, e parmetros.

Os dados necessrios para a obteno do modelo podem ser obtidos atravs de um CENSO
(pesquisa de toda a populao), ou atravs de uma AMOSTRA (subconjunto finito) da populao.

Por que usar uma AMOSTRA?
- economia;
- rapidez;
- para evitar a exausto/extino da populao.

A AMOSTRA deve ser: representativa da populao, suficiente (para que o resultado tenha
confiabilidade), e aleatria (retirada por sorteio no viciado).

A Inferncia Estatstica consiste em fazer afirmaes probabilsticas sobre as
caractersticas do modelo probabilstico, que se supe representar uma populao, a partir dos dados
de uma amostra aleatria (probabilstica) desta mesma populao.

Fazer uma afirmao probabilstica sobre uma caracterstica qualquer associar declarao
feita uma probabilidade de que tal declarao esteja correta (e, portanto, a probabilidade
complementar de que esteja errada). Quando se usa uma amostra da populao SEMPRE haver
uma probabilidade de estar cometendo um erro (justamente por ser usada uma amostra): a diferena
entre os mtodos estatsticos e os outros reside no fato de que os mtodos estatsticos permitem
calcular essa probabilidade de erro. E para que isso seja possvel a amostra da populao precisa
ser aleatria.

As afirmaes probabilsticas sobre o modelo da populao podem ser basicamente:
=> estimar quais so os possveis valores dos parmetros (Estimao de Parmetros):
- qual o valor da mdia de uma varivel que segue uma distribuio normal?
- qual o valor da proporo de um dos 2 resultados possveis de uma varivel que
segue uma distribuio binomial.
=> testar hipteses sobre as caractersticas do modelo: parmetros, forma da distribuio de
probabilidades, etc. (Testes de Hipteses).
- o valor da mdia de uma varivel que segue uma distribuio maior do que um
certo valor?
- o modelo probabilstico da populao uma distribuio normal?
- o valor da mdia de uma varivel que segue uma distribuio normal em uma
populao diferente da mesma mdia em outra populao?
INE 7002 - Inferncia Estatstica Estimao de Parmetros

2


9.1.1- Amostragem Aleatria ou Probabilstica

Na amostragem aleatria todos os elementos da populao tm chance diferente de zero de
pertencer amostra, uma vez que a seleo dos elementos feita por sorteio no viciado (ver
detalhes no Captulo 7).

Amostragem Aleatria Simples
=> todos os elementos da populao tm a mesma chance de pertencer amostra (escolha
por sorteio no viciado);
=> cada elemento sorteado reposto na populao antes do prximo sorteio.

Obviamente nem sempre vivel a amostragem com reposio, se a amostragem for feita
SEM REPOSIO os resultados sero praticamente iguais se o tamanho da amostra no exceder a
5% do tamanho da populao
1
. Se a populao no for homognea em relao varivel sob
estudo, para garantir a representatividade da amostra somos obrigados a selecionar elementos de
cada uma de suas subdivises.

9.1.2 - Anlise Exploratria de Dados
2


Uma vez tendo coletado os dados, seja atravs de censo ou por amostragem, preciso
resumi-los e organiz-los de maneira a permitir uma primeira anlise, e posterior uso das
informaes. As tcnicas estatsticas que se ocupam desses aspectos constituem a Anlise
Exploratria de Dados.

O conjunto de dados pode ser resumido (e apresentado) atravs das distribuies de
freqncias, que relacionam os valores que a varivel pode assumir com a freqncia (contagem)
com que foram encontrados naquele conjunto. Esta distribuio pode ser apresentada na forma de
uma tabela, ou atravs de um grfico (estes dois mtodos podem ser usados tanto para variveis
qualitativas quanto para variveis qualitativas).

H uma terceira forma de resumir o conjunto de dados: as medidas de sntese ou
estatsticas. As principais estatsticas so a mdia, o desvio padro, a varincia e a proporo. Sero
apresentadas suas frmulas bsicas, e o que cada uma significa.

Mdia: trata-se de uma estatstica que caracteriza o centro de massa do conjunto de dados (Valor
Esperado); quando a mdia populacional recebe o smbolo ; quando a mdia amostral recebe o
smbolo x; trata-se da mdia aritmtica simples:
n
x
x
i

= onde xi o i-simo valor do


conjunto e n o nmero de elementos da amostra.
Varincia: trata-se de uma estatstica que mede a disperso em torno da mdia do conjunto (em
torno do valor esperado), possuindo uma unidade que o quadrado da unidade da mdia (e dos
valores do conjunto); quando a varincia populacional recebe o smbolo o
2
; quando a varincia
amostral recebe o smbolo s
2
;
1 n
] n / ) x [( ) x (
s
2
i
2
i 2

=

(usa-se n - 1 no denominador quando se

1
A reposio garante que as probabilidades de selecionar um determinado elemento permanecem constantes, uma vez
que o espao amostral permanece o mesmo. Quando o tamanho da amostra menor ou igual a 5% do tamanho da
populao, mesmo que no haja reposio supe-se que as probabilidades no se modificam substancialmente.
2
Este item foi visto com grande profundidade no Captulo 2.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

3

trata de uma amostra)
3
. O desvio padro a raiz quadrada positiva da varincia, tendo portanto
uma unidade que igual unidade da mdia, sendo muitas vezes preferida para efeito de
mensurao da disperso.
Proporo: consiste em calcular a razo entre o nmero de ocorrncias do valor de interesse de
uma varivel qualitativa e o nmero total de ocorrncias registradas no conjunto (de todos os
valores que a varivel pode assumir); quando uma proporo populacional recebe o smbolo t;
quando uma proporo amostral recebe o smbolo p.

Os valores das medidas de sntese, alm de resumirem o conjunto de dados, constituem uma
indicao dos provveis valores dos parmetros. Assim, em estudos baseados em amostras,
comum utilizar tais medidas de sntese como estatsticas que sero utilizadas para estimar os
parmetros do modelo probabilstico que descreve a populao.


9.2 - Distribuio Amostral

Os valores dos parmetros do modelo populacional calculados em uma amostra so
chamados de estatsticas:
Parmetros (Populao) Estatsticas (Amostra)
Mdia () x
Varincia (o
2
) s
2

Desvio Padro (o) s
Proporo (t) p
Nmero de elementos (N) n
Seja uma populao qualquer com um parmetro u de interesse, correspondendo a uma
estatstica T em uma amostra. Amostras aleatrias so retiradas da populao e para cada amostra
calcula-se o valor t da estatstica T.

Os valores de t formam uma nova populao que segue uma distribuio de
probabilidades que chamada de distribuio amostral de T.

Seja a populao abaixo, constituda pelos pesos em kg de oito pessoas adultas:












Figura 1 - Distribuio Amostral - Exemplo
Assim sendo, o conhecimento das distribuies amostrais das principais estatsticas
necessrio para fazer inferncias sobre os parmetros do modelo probabilstico da populao.

3
H uma razo matemtica para isso: garantir que o valor amostral seja um estimador no viciado do valor
populacional (maiores detalhes no item Estimao por Ponto).
64
65
70
70
67
57
72
60
= 65,62 kg
Sortear 3
{64, 67, 60} => Mdia = 63,67 kg
{64, 70, 72} => Mdia = 68,67 kg
{65, 70, 60} => Mdia = 65 kg
Populao
Amostras
Observe que h uma variao na estatstica mdia, e esta variao precisa ser
considerada quando so realizadas as inferncias sobre os parmetros.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

4


Por hora, basta conhecer as distribuies amostrais das estatsticas mdia de uma varivel
quantitativa qualquer, e proporo de um dos dois nicos resultados de uma varivel qualitativa.

Exemplo 9.1
4
- Suponha uma varivel quantitativa cujos valores constituem uma populao com os
seguintes valores: (2, 3, 4, 5)
Para esta populao, que tem uma distribuio uniforme, podemos observar que os parmetros so:
= 3,5 o
2
= 1,25 (usou-se n no denominador por ser uma populao)

Se retirarmos todas as amostras aleatrias de 2 elementos (com reposio) possveis desta
populao (n = 2), teremos os seguintes resultados
5
:
(2, 2) (2, 3) (2, 4) (2, 5)

(3, 2) (3, 3) (3, 4) (3, 5)

(4,2) (4, 3) (4, 4) (4, 5)

(5, 2) (5, 3) (5, 4) (5, 5)

O clculo das mdias de todas as amostras acima resultar na matriz abaixo:

) 0 , 5 ( ) 5 , 4 ( ) 0 , 4 ( ) 5 , 3 (
) 5 , 4 ( ) 0 , 4 ( ) 5 , 3 ( ) 0 , 3 (
) 0 , 4 ( ) 5 , 3 ( ) 0 , 3 ( ) 5 , 2 (
) 5 , 3 ( ) 0 , 3 ( ) 5 , 2 ( ) 0 , 2 (
X
_

Se estas mdias forem plotadas em um grfico de freqncias (um histograma):

Figura 2 - Histograma de mdias amostrais

Se forem calculados a mdia e a varincia das mdias de todas as amostras o resultado ser:
= = = 5 , 3 16 / 56 X
_

n 2
25 , 1
625 , 0 ) x ( V
2
o
= = =
Observe como a distribuio das mdias amostrais da varivel pode ser aproximada por uma
distribuio normal (no obstante a distribuio da varivel na populao no ser normal), e que o

4
Elaborado pela professora Carmen Dolores de Freitas de Lacerda.
5
H 16 amostras possveis.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

5

valor esperado das mdias amostrais (mdia das mdias) IGUAL ao valor da mdia populacional
da varivel e a varincia das mdias amostrais IGUAL ao valor da varincia populacional da
varivel dividida pelo tamanho da amostra
6
. Quanto maior o tamanho da amostra (quanto maior n)
mais o histograma acima aproximar-se- de uma distribuio normal, independentemente do
formato da distribuio da varivel na populao.

Vamos ver outro exemplo.

Exemplo 9.2 - Na Figura 3 abaixo temos a distribuio populacional de uma varivel quantitativa
qualquer de interesse. Ela apresenta mdia populacional () igual a 416,99, e varincia populacional
(o
2
) igual a 89554,51264.

Figura 3 - Distribuio populacional de uma varivel quantitativa

Vamos comear com 40 amostras aleatrias de 2 elementos cada
7
. Veja a Figura 4.

Figura 4 - Distribuio amostral da mdia (n = 2)

Obviamente o tamanho da amostra utilizada (2 elementos) ainda no foi grande o bastante para
levar aos resultados obtidos no Exemplo 9.1 (provavelmente porque a distribuio da populao
assimtrica). Vamos agora ver os resultados obtidos para 40 amostras aleatrias de 4 elementos
cada. O histograma das mdias est na Figura 5.

6
Voltaremos a analisar o significado destes resultados quando estudarmos a Estimao por Ponto.
7
A retirada das amostras foi efetuada atravs do pacote estatstico Minitab.
1800 1600 1400 1200 1000 800 600 400 200 0
70
60
50
40
30
20
10
0
Dados 2
F
r
e
q
u
e
n
c
y
1000 750 500 250 0
20
10
0
Mdias amostras n =2
F
r
e
q
u
e
n
c
y
Observe que a distribuio ASSIMTRICA,
ou seja, no normal! Vamos imaginar que
seja possvel retirar vrias amostras aleatrias
(com reposio) desta populao, medir os
valores da varivel e calcular a mdia da
varivel em cada amostra. Posteriormente
construiremos um histograma das mdias das
amostras, e calcularemos a mdia das mdias e
a varincia das mdias.

A mdia das mdias amostrais vale 423,8875, e
a varincia das mdias amostrais vale
67528,98666. E, lembrando-se do exemplo
anterior, podemos calcular o quociente
varincia populacional pelo tamanho da
amostra: o
2
/n = 89554,51264/2 = 44777,25632.
Observando o histograma vemos que a
distribuio das mdias, para amostras de 2
elementos, continua assimtrica, e o valor da
mdia das mdias amostrais (423,8875) no
est muito prximo da mdia populacional
(416,99), bem como a varincia das mdias
amostrais (67528,98666), distante de o
2
/n =
44777,25632

INE 7002 - Inferncia Estatstica Estimao de Parmetros

6


Figura 5 - Distribuio amostral da mdia (n = 4)

Novamente o tamanho da amostra utilizada (4 elementos) ainda no foi grande o bastante para levar
aos resultados obtidos no Exemplo 9.1 Vamos agora ver os resultados obtidos para 40 amostras
aleatrias de 16 elementos cada. O histograma das mdias est na Figura 6.

Figura 6 - Distribuio amostral da mdia (n = 16)

Estamos muito prximos de obter um comportamento simtrico, e aproximadamente normal para o
histograma das mdias amostrais. Se retirarmos mais 40 amostras, mas agora com 30 elementos em
cada, o resultado poder ser visto na Figura 7.

Figura 7 - Distribuio amostral da mdia (n = 30)

800 650 500 350 200
20
10
0
Mdias amostras n= 4
F
r
e
q
u
e
n
c
y
500 440 380 320 260
10
5
0
Mdias amostras n =16
F
r
e
q
u
e
n
c
y
540 480 420 360 300
70
60
50
40
30
20
10
0
Mdias amostras n=30
F
r
e
q
u
e
n
c
y
A mdia das mdias amostrais vale 444,5375, e a
varincia das mdias amostrais vale 26464,3269. E,
lembrando-se do exemplo anterior, podemos calcular
o quociente varincia populacional pelo tamanho da
amostra:
o
2
/n = 89554,51264/4 = 22388,62816.
Observando o histograma vemos que a distribuio
das mdias, para amostras de 4 elementos, continua
assimtrica, e o valor da mdia das mdias amostrais
(444,5375) no est muito prximo da mdia
populacional (416,99), mas a varincia das mdias
amostrais (26464,3269) aproxima-se mais de o
2
/n =
22388,62816.

A mdia das mdias amostrais vale 394,4922, e a
varincia das mdias amostrais vale 5568,3945. E,
lembrando do exemplo anterior, podemos calcular
o quociente varincia populacional pelo tamanho
da amostra: o
2
/n = 89554,51264/16 = 5597,1577.
Observando o histograma vemos que a
distribuio das mdias, para amostras de 16
elementos est mais prxima da simetria, e o valor
da mdia das mdias amostrais (394,4922) est
mais prximo da mdia populacional (416,99), e a
varincia das mdias amostrais (5568,3945)
aproxima-se bastante de o
2
/n = 5597,1577.

A mdia das mdias amostrais vale 421,9217, e a
varincia das mdias amostrais vale 2945,1326. E,
lembrando-se do exemplo anterior, podemos
calcular o quociente varincia populacional pelo
tamanho da amostra: o
2
/n = 89554,51264/30 =
2985,1508.
Observando o histograma vemos que a
distribuio das mdias, para amostras de 30
elementos virtualmente normal, e o valor da
mdia das mdias amostrais (421,9217) est bem
prximo da mdia populacional (416,99), e a
varincia das mdias amostrais (2945,1326)
tambm muito prxima de o
2
/n = 2985,1508.

INE 7002 - Inferncia Estatstica Estimao de Parmetros

7

Podemos ento enunciar os teoremas:

TEOREMA DAS COMBINAES LINEARES
Se a varivel de interesse segue uma distribuio normal na populao a
distribuio amostral das mdias de amostras aleatrias retiradas desta populao tambm
ser normal, independentemente do tamanho destas amostras.

TEOREMA DO LIMITE CENTRAL
Se a varivel de interesse no segue uma distribuio normal na populao (ou no
se sabe qual a sua distribuio) a distribuio amostral das mdias de amostras
aleatrias retiradas desta populao ser normal se o tamanho destas amostras for
suficientemente grande
8
, com uma mdia igual mdia populacional e uma varincia igual
varincia populacional dividida pelo tamanho da amostra.


Exemplo 9.3
9
- Pense agora em uma varivel qualitativa que pode assumir apenas dois valores, e
que constitui a seguinte populao:
( , , , , )
Vamos supor que h interesse no valor (este valor seria o nosso sucesso). A proporo
deste valor na populao (o valor do parmetro) ser t = 1/5.

Se retirarmos todas as amostras aleatrias de 2 elementos (com reposio) possveis desta
populao (n = 2), teremos os seguintes resultados
10
:

(,) (,) (,) (,) (, )

(,) (,) (,) (,) (, )

(,) (,) (,) (,) (, )

(,) (,) (,) (,) (, )

(, ) (, ) (, ) (, ) (, )
Figura 8 - Amostras de tamanho 2 para proporo

Observe que se definirmos a varivel como o nmero de sucessos (nmero de ) esta ter
uma distribuio binomial: h apenas dois resultados possveis para cada realizao, h um nmero
limitado de realizaes (n = 2 no caso), e cada realizao independe da outra (porque a amostra
aleatria com reposio).

Calculando a proporo de em cada uma das amostras, e chamando esta proporo
amostral de p, teremos os seguintes resultados:

8
Este suficientemente grande varia de distribuio para distribuio, como foi visto uma distribuio uniforme
precisa de uma amostra pequena (n =2 no caso) para que a aproximao seja possvel, outras distribuies precisam de
amostras maiores. Alguns autores costumam chamar de grandes amostras aquelas que possuem mais de 30 elementos,
a partir deste tamanho a aproximao poderia ser feita sem maiores preocupaes.
9
Elaborado pela professora Carmen Dolores de Freitas de Lacerda.
10
H 25 amostras possveis.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

8

) 1 ( ) 2 / 1 ( ) 2 / 1 ( ) 2 / 1 ( ) 2 / 1 (
) 2 / 1 ( ) 0 ( ) 0 ( ) 0 ( ) 0 (
) 2 / 1 ( ) 0 ( ) 0 ( ) 0 ( ) 0 (
) 2 / 1 ( ) 0 ( ) 0 ( ) 0 ( ) 0 (
) 2 / 1 ( ) 0 ( ) 0 ( ) 0 ( ) 0 (
p =


Calculando a mdia (valor esperado) e a varincia das propores acima teremos:
t = = =
5
1
) p ( E X
_

n
) 1 (
2
5
1
1
5
1
08 , 0 s
2
t t
=
|
.
|

\
|

|
.
|

\
|
= =

Observe que o valor esperado (mdia) das propores amostrais IGUAL ao valor da
proporo populacional de , e que a varincia das propores amostrais IGUAL ao produto da
proporo populacional de por seu complementar, dividido pelo tamanho da amostra
11
.

Lembrem-se de que uma distribuio binomial pode ser aproximada por uma distribuio
normal se algumas condies forem satisfeitas: se o produto do nmero de realizaes pela
probabilidade de sucesso (n x p) E o produto do nmero de realizaes pela probabilidade de
fracasso (n x [1 - p]) forem ambos maiores ou iguais a 5
12
. E esta distribuio normal teria mdia
igual a n x p e varincia igual a n x p x (1 - p). Se estamos interessados apenas na proporo
(probabilidade de sucesso) e no no nmero de sucessos as expresses anteriores podem ser
divididas por n (o tamanho da amostra): mdia igual a p e varincia igual a [p x (1- p) / n].

Por causa do Teorema do Limite Central que a distribuio normal to importante.
claro que ela representa muito bem uma grande variedade de fenmenos, mas devido sua
utilizao generalizada em Inferncia Estatstica que o seu estudo imprescindvel. Ressalte-se,
porm que a sua aplicao costuma resumir-se ao que se chama de Inferncia Paramtrica,
inferncias sobre os parmetros dos modelos probabilsticos que descrevem as variveis na
populao. Para fazer inferncias sobre outros aspectos que no os parmetros, ou quando as
amostras utilizadas no forem suficientemente grandes para se assumir a validade do Teorema do
Limite Central, preciso usar tcnicas de Inferncia No Paramtrica (que ns no veremos nesta
disciplina).


9.3 - Estimao por Ponto de Parmetros

Uma vez tendo decidido que modelo probabilstico mais adequado para representar a
varivel de interesse na Populao resta obter os seus parmetros. Nos estudos feitos com base em
amostras preciso escolher qual das estatsticas da amostra ser o melhor estimador para cada
parmetro do modelo.

A Estimao por Ponto consiste em determinar qual ser o melhor estimador para o
parmetro de interesse.


11
Voltaremos a analisar o significado deste resultado quando estudarmos Estimao por Ponto.
12
Isto tambm decorrncia do Teorema Central do Limite.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

9

Como os parmetros sero estimados atravs das estatsticas (estimadores) de uma amostra
aleatria, e como para cada amostra aleatria as estatsticas apresentaro diferentes valores, os
estimadores tambm tero valores aleatrios. Em outras palavras um Estimador uma varivel
aleatria que segue uma distribuio de probabilidades.

Naturalmente haver vrias estatsticas T que podero ser usadas como estimadores de um
parmetro u. Como escolher qual das estatsticas ser o melhor estimador para o parmetro?

H basicamente trs critrios para a escolha de um estimador: o estimador precisa ser justo,
consistente e eficiente
13
.

Um Estimador T um estimador justo (no tendencioso) de um parmetro u quando o valor
esperado de T igual ao valor do parmetro u a ser estimado: E(T) =u .

Um Estimador T um estimador consistente de um parmetro u quando alm ser um
estimador justo a sua varincia tende a zero medida que o tamanho da amostra aleatria
aumenta: 0 ) T ( V lim
n
=

.

Se h dois Estimadores justos de um parmetro o mais eficiente aquele que apresentar a
menor varincia.

9.3.1 - Estimao por Ponto dos principais parmetros

Os principais parmetros que vamos avaliar aqui so: mdia de uma varivel que segue uma
distribuio normal (ou qualquer distribuio se a amostra for suficientemente grande) em uma
populao (mdia populacional - ) e proporo de ocorrncia de um dos valores de uma varivel
que segue uma distribuio de Bernoulli/Binomial
14
em uma populao (proporo populacional -
t). Em suma escolher quais estatsticas amostrais so mais adequadas para estimar estes
parmetros, usando os critrios definidos acima.

Lembrando-se dos Exemplos 9.1, 9.2 e 9.3, algumas constataes que l foram feitas
passaro a fazer sentido agora.

Vamos supor que houvesse a inteno de estimar a mdia populacional da varivel do
Exemplo 9.1. Qual das estatsticas disponveis seria o melhor estimador?

Lembre-se que aps retirar todas as amostras aleatrias possveis daquela populao,
calcularmos a mdia de cada amostra, e posteriormente calcularmos a mdia dessas mdias
constatou-se que o valor esperado das mdias amostrais (mdia das mdias) IGUAL ao valor da
mdia populacional da varivel e a varincia das mdias amostrais IGUAL ao valor da varincia
populacional da varivel dividida pelo tamanho da amostra:
= ) x ( E
n
) x ( V
2
o
=
O melhor estimador da mdia populacional a mdia amostral x , pois se trata de um estimador
justo e consistente:
- Justo porque o valor esperado da mdia amostral ser a mdia populacional;

13
Na realidade h mais critrios, mas estes so os mais importantes, maiores detalhes em COSTA NETO, P.O.
Estatstica, Ed. Edgard Blcher, 1978.
14
Ambas exigem que experimento seja um experimento de Bernoulli: que tenha (ou possa ser reduzido) a apenas 2
resultados possveis complementares.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

10

- Consistente porque se o tamanho da amostra n tender ao infinito a varincia da mdia
amostral (do Estimador) tender a zero.

Agora vamos supor que houvesse a inteno de estimar a proporo populacional do valor
da varivel do Exemplo 9.3. Qual das estatsticas disponveis seria o melhor estimador?

Lembre-se que aps retirar todas as amostras aleatrias possveis daquela populao,
calcularmos a proporo de em cada amostra, e posteriormente calcularmos a mdia dessas
propores constatou-se que o valor esperado das propores amostrais (mdia das propores)
IGUAL ao valor da proporo populacional do valor da varivel e a varincia das propores
amostrais IGUAL ao valor do produto da proporo populacional do valor da varivel pela sua
complementar dividida pelo tamanho da amostra:
t = ) p ( E
n
) 1 (
) p ( V
t t
=

O melhor estimador da mdia populacional t a proporo amostral p, pois se trata de um
estimador justo e consistente:
- Justo porque o valor esperado da proporo amostral ser a proporo populacional;
- Consistente porque se o tamanho da amostra n tender ao infinito a varincia da proporo
amostral (do Estimador) tender a zero.

Poderamos fazer um procedimento semelhante para estimar outros parmetros, como, por
exemplo, a varincia populacional de uma varivel. Este procedimento no ser demonstrado, mas o
melhor estimador da varincia populacional ser a varincia amostral SE FOR USADO n - 1 NO
DENOMINADOR DA EXPRESSO DE CLCULO
15
. Somente assim a varincia amostral ser
um estimador justo (no viciado) da varincia populacional.

Como o desvio padro a raiz quadrada da varincia comum estimar o desvio padro
populacional extraindo a raiz quadrada da varincia amostral.


9.4 - Estimao por Intervalo de Parmetros

Geralmente uma inferncia estatstica feita com base em uma nica amostra: na maior
parte dos casos totalmente invivel retirar todas as amostras possveis de uma determinada
populao.

Intuitivamente percebemos que as estatsticas calculadas nessa nica amostra, mesmo sendo
os melhores estimadores para os parmetros de interesse, tero uma probabilidade infinitesimal de
coincidir exatamente com os valores reais dos parmetros. Ento a Estimao por Ponto dos
parmetros insuficiente, e as estimativas assim obtidas serviro apenas como referncia para a
Estimao por Intervalo.

A Estimao por Intervalo consiste em colocar um Intervalo de Confiana (I.C.) em torno
da estimativa obtida atravs da Estimao por Ponto.

O Intervalo de Confiana ter uma certa probabilidade chamada de Nvel de confiana (que
costuma ser simbolizado como 1 - o) de conter o valor real do parmetro: fazer uma Estimao por
Intervalo de um parmetro efetuar uma afirmao probabilstica sobre este parmetro, indicando

15
Esta a razo matemtica a que se referia a nota 57.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

11

uma faixa de possveis valores, e a probabilidade de que esta faixa realmente contenha o valor real
do parmetro. A probabilidade de que o Intervalo de Confiana no contenha o valor real do
parmetro chamada de Nvel de Significncia (o), e o valor desta probabilidade ser o
complementar do Nvel de Confiana. comum definir o Nvel de Significncia como uma
probabilidade mxima de erro, um risco mximo admissvel.

A determinao do Intervalo de Confiana para um determinado parmetro resume-se
basicamente a definir o Limite Inferior e o Limite Superior do intervalo, supondo um determinado
Nvel de Confiana (ou Significncia). A definio dos limites depender tambm da distribuio
amostral da estatstica usada como referncia para o intervalo e do tamanho da amostra utilizada.

Para os dois parmetros em que temos maior interesse (mdia populacional e proporo
populacional t) a distribuio amostral dos estimadores (mdia amostral x e proporo amostral p,
respectivamente) pode ser aproximada por uma distribuio normal: o Intervalo de Confiana ser
ento simtrico em relao ao valor calculado da estimativa (mdia ou proporo amostral), com
base na amostra aleatria coletada:

Figura 9 - Intervalo de Confiana para uma distribuio normal

Onde: Li o limite inferior e Ls o limite superior do Intervalo de Confiana; 1 - o o
Nvel de Confiana estabelecido, observando que o valor do Nvel de Significncia o dividido
igualmente entre os valores abaixo de Li e acima de Ls.

Para obter os limites em funo do Nvel de Confiana devemos utilizar a distribuio
normal padro (varivel Z com mdia zero e varincia um): fixar um certo valor de probabilidade,
obter o valor de Z correspondente, e substituir o valor em Z = (x - mdia)/ desvio padro
16
,
para obter o valor x (valor correspondente ao valor de Z para a probabilidade fixada). Observe a
figura abaixo:

Figura 10 - Intervalo de Confiana para a distribuio normal padro
O limite Li (inferior) corresponde a Z
1
e o limite Ls (superior) corresponde a Z
2
. O ponto
central 0 (zero) corresponde ao valor calculado da Estimativa. Como a varivel Z tem distribuio

16
Foram colocados entre aspas porque os valores dependero dos parmetros sob anlise e de outros fatores.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

12

normal com mdia igual a zero (lembrando que a distribuio normal simtrica em relao
mdia) os valores de Z
1
e Z
2
sero iguais em mdulo (Z
1
ser negativo e Z
2
positivo):
Z
1
ser um valor de Z tal que P Z Z ( ) s =
1
2
o
, e Z
2
ser um valor tal que P Z Z ( ) s =
2
1
2
o


Ento obteremos os valores dos limites atravs das expresses:
Z
1
= (Li - mdia)/ desvio padro => Li = mdia + Z
1
desvio padro

Z
2
= (Ls - mdia)/ desvio padro => Ls = mdia + Z
2
desvio padro

Como Z
1
= - Z
2
, podemos substituir:
Li = mdia - Z
2
desvio padro

Ls = mdia + Z
2
desvio padro

E este valor Z
2
costuma ser chamado de Z
crtico
, porque corresponde aos limites do
intervalo
17
:
Li = mdia - Z
crtico
desvio padro

Ls = mdia + Z
crtico
desvio padro

Reparem que o mesmo valor somado e subtrado da mdia. Este valor chamado de
semi-intervalo ou preciso do intervalo, e recebe smbolo e
0
:
e
0
= Z
crtico
desvio padro

Resta agora definir corretamente o valor da mdia e do desvio padro para cada um dos
parmetros em que estamos interessados (mdia e proporo populacional). Com base nas
concluses obtidas na Estimao por Ponto isso ser simples. Contudo, h alguns outros aspectos
que precisaro ser esmiuados.

9.4.1 - Estimao por Intervalo da Mdia Populacional

Lembrando das expresses anteriores:
Li = mdia - Z
crtico
desvio padro = mdia - e
0

Ls = mdia + Z
crtico
desvio padro = mdia + e
0


Neste caso a mdia ser a mdia amostral x (ou mais precisamente o seu valor):
P x e x e ( ) s s + =
0 0
1 o

O valor de e
0
depender de outros aspectos.

a) Se a varincia populacional o
2
da varivel (cuja mdia populacional queremos estimar) for
conhecida.
Neste caso a varincia amostral da mdia poder ser calculada atravs da expresso:
n
) x ( V
2
o
= , e, por conseguinte, o desvio padro ser
n
padrao desvio
o
=

17
Esta notao a utilizada na apostila de Roteiros e Tabelas.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

13

E e
0
ser:
n
Z e
critico 0
o
=
Bastar ento fixar o Nvel de Confiana (ou de Significncia) para obter Z
crtico
e calcular e
0
.

b) Se a varincia populacional o
2
da varivel for desconhecida.
Naturalmente este o caso mais encontrado na prtica. Como se deve proceder? Depender
do tamanho da amostra.
b.1 - Grandes amostras (mais de 30 elementos)
Nestes casos procede-se como no item anterior, apenas fazendo com que o = s, ou seja,
considerando que o desvio padro da varivel na populao igual ao desvio padro da
varivel na amostra (suposio razovel para grandes amostras).
b.2 - Pequenas amostras (at 30 elementos)
Nestes casos a aproximao do item b.1 no ser vivel. Ter que ser feita uma correo na
distribuio normal padro (Z) atravs da distribuio t de Student. Trata-se de uma
distribuio de probabilidades que apresenta mdia igual a zero (como a normal padro),
simtrica em relao mdia, mas apresenta uma varincia igual a n / (n -2), ou seja seus
valores dependem do tamanho da amostra, apresentando maior varincia para menores
valores de amostra
18
. Quanto maior o tamanho da amostra mais a varincia de t aproxima-se
de 1,00 (varincia da normal padro)
19
. A distribuio t de Student est na figura abaixo:


Figura 11 - Distribuio t de Student

Observe que tal como a distribuio normal padro a distribuio t de Student
simtrica em relao mdia (que igual a zero).

O valor n -1 (tamanho da amostra menos 1) chamado de nmero de graus de
liberdade da estatstica. Quando a varincia amostral calculada supe-se que a mdia j
seja conhecida, assim apenas um determinado nmero de elementos da amostra poder ter
seus valores variando livremente, este nmero ser igual a n - 1, porque um dos valores no
poder variar livremente, pois ter que ter um valor tal que a mdia permanea a mesma
calculada anteriormente. Assim, a estatstica ter n - 1 graus de liberdade.

A distribuio t de Student encontra-se tabelada no apndice para vrios graus de
liberdade e valores de probabilidade.


18
Esta a correo propriamente dita, pois ao usar pequenas amostras o risco de que a varincia amostral da varivel
seja diferente da varincia populacional maior, podendo levar a intervalos de confiana que no correspondem
realidade. A no utilizao desta correo foi a fonte de muitos erros no passado, e, infelizmente, de ainda alguns erros
no presente.
19
Para tamanhos de amostra maiores do que 30 supe-se que a varincia de t igual a 1: por isso a aproximao do
item b.1.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

14

Quando a varincia populacional da varivel desconhecida e a amostra tem at 30
elementos substitui-se o por s e Z por t
n-1
em todas as expresses para determinao dos
limites do intervalo de confiana, obtendo:
Li = mdia - t
n-1,crtico
desvio padro = mdia - e
0


Ls = mdia + t
n-1,crtico
desvio padro = mdia + e
0

E e
0
ser:
n
s
t e
critico , 1 n 0
=


Os valores de t
n-1,crtico
podem ser obtidos de forma semelhante aos de Z
crtico
,
definindo o Nvel de Confiana (ou de Significncia), mas precisam tambm da definio do
nmero de graus de liberdade (n - 1): tendo estes valores basta procurar o valor em uma
tabela ou em um programa computacional.

Se o tamanho da amostra (n) for superior a 5% do tamanho da populao (N) os valores de
e
0
precisam ser corrigidos. Caso contrrio os limites dos intervalos no sero acurados. A correo
mostrada na equao a seguir:
1 N
n N
e e
0 0
corrigido

=


9.4.2 - Estimao por Intervalo da Proporo Populacional t

No item 9.3 declaramos que o melhor estimador para a proporo populacional t a
proporo amostral p. E que esta proporo amostral teria mdia igual a t e varincia igual a
[t x (1 - t)]/n onde n o tamanho da amostra aleatria. A distribuio da proporo amostral p
binomial, e sabe-se que a distribuio binomial pode ser aproximada por uma normal se algumas
condies forem satisfeitas, no caso se:
n t > 5 E n (1 - t) > 5.

Ora, se t fosse conhecido no estaramos aqui nos preocupando com a sua Estimao por
Intervalo, assim vamos verificar se possvel aproximar a distribuio binomial de p por uma
normal se:
n p > 5 E n (1 - p) > 5, ou seja usando o prprio valor da proporo amostral
observada (trata-se de uma aproximao razovel).

SE E SOMENTE SE estas duas condies forem satisfeitas poderemos usar as expresses
abaixo (lembrando das expresses anteriores):
Li = mdia - Z
crtico
desvio padro = mdia - e
0


Ls = mdia + Z
crtico
desvio padro = mdia + e
0


Neste caso a mdia ser a proporo amostral (ou mais precisamente o seu valor):
o = + s s 1 ) e p e p ( P
0 0


E o valor do desvio padro ser igual a
n
) 1 ( t t
. Novamente, como t desconhecido,
usaremos a proporo amostral p como aproximao.

INE 7002 - Inferncia Estatstica Estimao de Parmetros

15

Ento e
0
ser:
n
) p 1 ( p
Z e
critico 0

=
Bastar ento fixar o Nvel de Confiana (ou de Significncia), Z
crtico
e calcular e
0
.

Novamente, precisamos corrigir o valor de e
0
para o caso de populao finita:
1 N
n N
e e
0 0
corrigido

=


Em suma a Estimao por Intervalo da mdia e da proporo populacional consiste
basicamente em calcular a amplitude do semi-intervalo (o e
0
), de acordo com as condies do
problema sob anlise.
- Para a mdia, observar se vivel considerar que a distribuio da varivel na populao
normal, ou que a amostra seja suficientemente grande para que a distribuio das mdias amostrais
possa ser considerada normal. Se isso for verificado, identificar se a varincia populacional da
varivel conhecida: caso seja dever ser usada a varivel Z da distribuio normal padro, para
qualquer tamanho de amostra. Se varincia populacional da varivel desconhecida h duas
possibilidades: para amostras com mais de 30 elementos usar a varivel Z, e fazer a varincia
populacional igual varincia amostral da varivel; se a amostra tem at 30 elementos usar a
varivel t
n-1
da distribuio de Student.
- Para a proporo, observar se possvel fazer a aproximao pela distribuio normal.


9.5 - Tamanho Mnimo de Amostra para Estimao por Intervalo de
parmetros

Como foi observado, a determinao dos limites de um Intervalo de Confiana
(determinao do e
0
) depende do tamanho da amostra aleatria coletada, alm do Nvel de
Confiana e da distribuio amostral do estimador utilizado. Nada podemos fazer quanto
distribuio amostral do estimador, o Nvel de Confiana ns podemos controlar, seria interessante
definir ento uma preciso (um valor para e
0
) para o Intervalo de Confiana: muito comum
querermos estabelecer previamente qual ser a faixa de variao de um determinado parmetro,
com uma certa confiabilidade.

Contudo, para um mesmo tamanho de amostra:
- se aumentarmos o Nvel de Confiana (reduzirmos o Nvel de Significncia) teremos um valor
crtico maior, o que aumentar o valor de e
0
, resultando em um Intervalo de Confiana mais
largo, com menor preciso.
- se resolvermos aumentar a preciso (menor valor de e
0
), obter um Intervalo de Confiana mais
estreito, teremos uma queda no Nvel de Confiana.

A soluo para o dilema acima obter um tamanho mnimo de amostra capaz de atender
simultaneamente ao Nvel de Confiana (ou de Significncia) e preciso (e
0
) especificados. Como
as expresses de e
0
so em funo do tamanho de amostra (n), seria razovel pensar em reorden-
las de forma a fazer com que o tamanho de amostra seja funo do Nvel de Confiana e da preciso
(e
0
).

INE 7002 - Inferncia Estatstica Estimao de Parmetros

16

9.5.1 - Tamanho Mnimo de Amostra para Estimao por Intervalo da mdia
populacional
a) Varincia populacional conhecida
n
Z e
critico 0
o
= isolando n:
2
0
critico
e
Z
n
|
|
.
|

\
| o
=
Neste caso basta especificar o valor de e
0
(na mesma unidade do desvio padro populacional
o), e o Nvel de Confiana (que ser usado para encontrar o Z
crtico
) e calcular o tamanho mnimo
de amostra.

b) Varincia populacional desconhecida
n
s
t e
critico , 1 n 0
=

isolando n:
2
0
critico , 1 n
e
s t
n
|
|
.
|

\
|
=


O procedimento neste caso seria semelhante exceto por um pequeno problema: se estamos
calculando o tamanho da amostra como podemos conhecer n - 1 e o desvio padro amostral s?
Quando a varincia populacional da varivel desconhecida o usual retirar uma amostra
piloto com um tamanho n* arbitrrio. A partir dos resultados desta amostra so calculadas as
estatsticas (entre elas o desvio padro amostral s) que so substitudas na expresso acima.

Se n s n* ento a amostra piloto suficiente para o Nvel de Confiana e a preciso
exigidos.
Se n > n* ento a amostra piloto insuficiente para o Nvel de Confiana e a preciso
exigidos, sendo ento necessrio retornar populao e retirar os elementos para completar o
tamanho mnimo de amostra. O processo continua at que a amostra seja considerada suficiente.

9.5.2 - Tamanho Mnimo de Amostra para Estimao por Intervalo da proporo
populacional

Para a proporo populacional teremos:
n
) p 1 ( p
Z e
critico 0

= isolando n: ) p 1 ( p
e
Z
n
2
0
critico

|
|
.
|

\
|
=

necessrio especificar o Nvel de Confiana (ou de Significncia) que ser usado para
encontrar o Z
crtico
, e o valor de e
0
(tomando o cuidado de que tanto e
0
quanto p e 1- p estejam
todos como propores adimensionais ou como percentuais) para que seja possvel calcular o valor
do tamanho mnimo de amostra.

Da mesma forma que no caso da Estimao da mdia quando a varincia populacional
desconhecida teremos que recorrer uma amostra piloto, procedendo de forma semelhante letra b)
do item 9.5.1. No clculo do tamanho mnimo de amostra para a Estimao por Intervalo da
proporo populacional h, porm uma soluo alternativa: utiliza-se uma estimativa exagerada
20
da
amostra, supondo o mximo valor possvel para o produto p (1 - p), que ocorrer quando ambas
as propores forem iguais a 0,5 (50%).


20
Esta soluo somente usada quando a natureza da pesquisa tal que no possvel retirar uma amostra piloto: a
retirada de uma amostra piloto e a eventual retirada de novos elementos da populao poderiam prejudicar muito o
resultado da pesquisa. Paga-se ento o preo de ter uma amostra substancialmente maior do que talvez fosse necessrio.
INE 7002 - Inferncia Estatstica Estimao de Parmetros

17

Conforme visto no Captulo 7, se o tamanho da populao for conhecido recomendvel
corrigir o tamanho da amostra obtida, seja para o intervalo de confiana de mdia ou proporo,
atravs da seguinte frmula:
n N
n N
n
corrigido
+

= onde N o tamanho da populao


Assim procedendo, evitamos o inconveniente de obter um tamanho de amostra superior ao tamanho
da populao, o que pode ocorrer se N no for muito grande.

Exemplo 9.4 - Retirou-se uma amostra aleatria de 4 elementos de uma produo de cortes bovinos
no intuito de estimar a mdia do peso do corte. Obteve-se mdia de 8,2 kg e desvio padro de 0,4
kg. Supondo populao normal.
a) Determinar um intervalo de confiana para a mdia populacional com 1% de significncia.
b) Para estimar a mdia, com 1% de significncia e preciso de 0,2 kg, esta amostra suficiente?
a) Seguindo o roteiro de Estimao de Parmetros do apndice:
1) O parmetro de interesse a mdia populacional do peso do corte.
2) Adotou-se um nvel de significncia de 1%, ento o = 0,01 e 1 - o = 0,99
21
.
3) As estatsticas disponveis so: mdia amostral = 8,2 kg s = 0,4 kg n = 4 elementos.
4) Definio da varivel de teste: como a varincia populacional DESCONHECIDA, e o
tamanho da amostra menor do que 30 elementos, no obstante a populao ter
distribuio normal, a distribuio amostral da mdia ser t de Student, e a varivel de
teste ser t
n-1
.
5) Encontrar o valor de t
n-1,crtico
: como o Intervalo de Confiana para a mdia bilateral,
teremos uma situao semelhante da figura abaixo:


6) Determinam-se os limites do intervalo, atravs da expresso abaixo (cujo resultado ser
somado e subtrado da mdia amostral) para determinar os limites do intervalo:
kg 168 , 1
4
4 , 0 84 , 5
n
s t
e
crtico , 1 n
0
=
-
=
-
=


kg 032 , 7 168 , 1 2 , 8 e x L
0 I
= = = kg 368 , 9 168 , 1 2 , 8 e x L
0 S
= + = + =
7) Ento o intervalo de 99% de confiana para a mdia populacional da dimenso
[7,032;9,368] kg.
Interpretao: h 99% de probabilidade de que a verdadeira mdia populacional do peso
de corte esteja entre 7,032 e 9,368 kg.

b) Como a varincia populacional DESCONHECIDA, e o tamanho da amostra menor do que
30 elementos, no obstante a populao ter distribuio normal, a distribuio amostral da mdia
ser t de Student, e a varivel de teste ser t
n-1
. Assim ser usada a seguinte expresso para
calcular o tamanho mnimo de amostra para a estimao por intervalo da mdia populacional.

21
Este valor pode ser arbitrado pelo usurio ou pode ser uma exigncia do problema sob anlise, ou at mesmo uma
exigncia legal. Os nveis de significncia mais comuns so de 1%, 5% ou mesmo 10%.
Para encontrar o valor crtico devemos
procurar na tabela da distribuio de
Student, na linha correspondente a n-1
graus de liberdade, ou seja em 4 - 1 = 3
graus de liberdade. O valor da
probabilidade pode ser visto na figura ao
lado: os valores crticos sero t
3;0,005
e
t
3;0,995
os quais sero iguais em mdulo. E o
valor de t
n-1,crtico
ser igual a 5,84 (em
mdulo)
INE 7002 - Inferncia Estatstica Estimao de Parmetros

18

2
0
critico , 1 n
e
s t
n
|
|
.
|

\
|
=


O nvel de significncia o mesmo do item a. Sendo assim, o valor crtico continuar sendo o
mesmo: t
n-1,crtico
= 5,84. O desvio padro amostral vale 0,4 kg, e o valor de e
0
, a preciso, foi
fixado em 0,2 kg. Basta ento substituir os valores na expresso:
137 42 , 136
2 , 0
4 , 0 84 , 5
e
s t
n
2
2
0
critico , 1 n
~ = |
.
|

\
|
=
|
|
.
|

\
|
=

elementos
Observe que o tamanho mnimo de amostra necessrio para atender a 1% de significncia e
preciso de 0,2 kg deveria ser de 137 elementos. Como a amostra coletada possui apenas 4
elementos ela INSUFICIENTE para a significncia e preciso exigidas. Recomenda-se o retorno
populao para a retirada aleatria de mais 133 espcimes.

Exemplo 9.5 - Retirou-se uma amostra aleatria de 1000 peas de um lote. Verificou-se que 35
eram defeituosas.
a) Determinar um intervalo de confiana de 95% para a proporo peas defeituosas no lote.
b) Supondo 99% de confiana e preciso de 1%, esta amostra suficiente para estimar a proporo
populacional?
a) Seguindo o roteiro do Apndice:
1) O parmetro de interesse a proporo populacional t de peas defeituosas.
2) Adotou-se um nvel de significncia de 5%, ento o = 0,05 e 1 - o = 0,95
3) As estatsticas so: proporo amostral de peas defeituosas p = 35/1000 n = 1000
elementos.
4) Definio da varivel de teste: precisamos verificar se possvel fazer a aproximao
pela normal, ento n x p = 1000 x 0,035 = 35 > 5 e n x (1- p) = 1000 x 0,965 = 965 > 5.
Como ambos os produtos satisfazem as condies para a aproximao podemos usar a
varivel Z da distribuio normal padro
5) Encontrar o valor de Z
crtico
: como o Intervalo de Confiana para a mdia bilateral,
teremos uma situao semelhante da figura abaixo:

6) Passa-se agora a determinao dos limites do intervalo, atravs da expresso abaixo
(cujo resultado ser somado e subtrado da proporo amostral de peas defeituosas) para
determinar os limites do intervalo:
0114 , 0
1000
965 , 0 035 , 0
96 , 1
n
) p 1 ( p
Z e
critico 0
=

=

=
0236 , 0 0114 , 0 035 , 0 e p L
0 I
= = = 0464 , 0 0114 , 0 035 , 0 e p L
0 S
= + = + =
7) Ento, o intervalo de 95% de confiana para a proporo populacional de peas
defeituosas [2,36%;4,64%].
Para encontrar o valor crtico
devemos procurar na tabela da
distribuio normal padro pela
probabilidade 0,975 (0,95+0,025) O
valor da probabilidade pode ser
visto na figura ao lado: os valores
crticos sero Z
0,025
e Z
0,975
os quais
sero iguais em mdulo. E o valor
de Z
crtico
ser igual a 1,96 (em
mdulo).
INE 7002 - Inferncia Estatstica Estimao de Parmetros

19

Interpretao: h 95% de probabilidade de que a verdadeira proporo populacional de
plantas atacadas pelo fungo esteja entre 2,36% e 4,64%.

b) De acordo com o item anterior possvel utilizar a aproximao pela distribuio normal. A
expresso para o clculo do tamanho mnimo de amostra para a proporo populacional ser:
) p 1 ( p
e
Z
n
2
0
critico

|
|
.
|

\
|
=
Os valores de p e 1 - p j so conhecidos: p = 0,035 1 - p = 0,965
O nvel de confiana exigido de 99%: para encontrar o valor crtico devemos procurar na tabela
da distribuio normal padro pela probabilidade 0,995 (0,99+0,005); os valores crticos sero
Z
0,005
e Z
0,995
os quais sero iguais em mdulo. E o valor de Z
crtico
ser igual a 2,58 (em mdulo).
A preciso foi fixada em 1% (0,01). Substituindo os valores na expresso acima:
2249 14 , 2248 965 , 0 035 , 0
01 , 0
58 , 2
) p 1 ( p
e
Z
n
2
2
0
critico
~ = |
.
|

\
|
=
|
|
.
|

\
|
=
Observe que o tamanho mnimo de amostra necessrio para atender a 99% de confiana e preciso
de 1% deveria ser de 2249 elementos. Como a amostra coletada possui apenas 1000 elementos ela
INSUFICIENTE para a confiana e preciso exigidas. Recomenda-se o retorno populao para
a retirada aleatria de mais 1249 peas.

"EMPATE TCNICO"

Estamos acostumados a ouvir declaraes do tipo "os candidatos A e B esto tecnicamente
empatados na preferncia eleitoral". O que significa isso? Geralmente as pesquisas de opinio
eleitoral consistem em obter as propores de entrevistados que declara votar neste ou naquele
candidato, naquele momento. Posteriormente as propores so generalizadas estatisticamente para
a populao, atravs do clculo de intervalos de confiana para as propores de cada candidato. Se
os intervalos de confiana das propores de dois ou mais candidatos apresentam grandes
superposies declara-se que h um "empate tcnico": as diferenas entre eles devem-se
provavelmente ao acaso, e para todos os fins esto em condies virtualmente iguais, naquele
momento.

Exemplo 9.6 - Imagine que uma pesquisa de opinio eleitoral apresentasse os seguintes resultados
(intervalos de confiana para a proporo que declara votar no candidato) sobre a prefeitura do
municpio de Tapioca. Quais candidatos esto tecnicamente empatados?
Opinio Limite inferior % Limite superior %
Godofredo Astrogildo 31% 37%
Filismino Arquibaldo 14% 20%
Urraca Hermengarda 13% 19%
Salustiano Quintanilha 22% 28%
Indecisos 11% 17%
Filismino e Urraca esto tecnicamente empatados, pois seus intervalos de confiana apresentam
grande sobreposio. Godofredo est muito na frente, pois o limite inferior de seu intervalo
maior do que o limite superior de Salustiano, que est em segundo lugar. importante ressaltar
que o nmero de indecisos razovel, variando de 11 a 17%, quando eles se decidirem podero
mudar completamente o quadro da eleio, ou garantir a vitria folgada de Godofredo.