Você está na página 1de 17

4.

ESTIMAÇÃO

4.1 INTRODUÇÃO

Imagine que estejamos interessados em estudar o comportamento do rendimento acadêmico dos


alunos da UFGD. Podemos obter os rendimentos de todos os alunos e construir o histograma
correspondente. O problema está resolvido, pois o histograma é tudo o quanto precisamos conhecer
para fazer qualquer afirmação sobre os rendimentos.
Tal processo é, entretanto, obviamente inviável, já que pressupõe um trabalho exaustivo e de
elevado custo. Devemos então buscar alternativas.
Uma alternativa possível consiste em estudar uma amostra representativa da população de
alunos da UFGD e construir o seu histograma referente a variável rendimento acadêmico. Ao fazer
isto, constataremos que o polígono de frequências, obtido do histograma, é próximo de uma curva
normal, que, como vimos, é caracterizada por dois valores,  e 2. Portanto, para estudar o
comportamento de todos os rendimentos acadêmicos de alunos, precisamos apenas determinar os
valores de  e 2, o que será feito através de uma amostra da população.
Esta é a atitude a ser adotada em situações práticas. Através de amostras escolhemos uma forma
para a distribuição dos dados. Obtêm-se então aproximações para os valores que caracterizam este
modelo.
A estimação é utilizada quando você não possui nenhuma informação sobre os parâmetros
da população e com base em dados amostrais irá obter valores aproximados para tais
parâmetros.

4.2 PARÂMETROS

Vimos que, no estudo do comportamento das alturas, ao qual se adapta o modelo Normal,
precisamos determinar  e 2. A estes valores damos o nome de parâmetros, que são números fixos,
embora muitas vezes desconhecidos. Assim como a Normal, toda distribuição de probabilidades
estudada anteriormente, depende de parâmetros, que determinam sua forma específica, por
exemplo, o  da Poisson, o  da exponencial, o n e o p da binomial, etc. Diferentes valores dos
parâmetros conduzem a valores distintos das probabilidades, onde estes parâmetros serão escolhidos
de uma amostra extraída da população de interesse.
Assim, o parâmetro pode ser definido como uma medida numérica que descreve uma
característica de uma população.

4.3 POPULAÇÃO

Por população, no sentido estatístico, entendemos o conjunto das medidas da característica de


interesse em todos os elementos que a possuam. Assim, por exemplo, se estamos interessados em
medir as alturas dos alunos de uma universidade, a população estatística será o conjunto de números
correspondentes às alturas de todos os alunos.
Podemos organizar a população estatística através de um histograma que, em geral, é parecido
com alguma distribuição conhecida. Por isto, vamos nos referir a parâmetros populacionais
pensando nos parâmetros da distribuição.

4.4 AMOSTRA
Uma amostra é qualquer subconjunto de elementos da população. Em inferência estatística,
entretanto, trabalhamos apenas com amostras aleatórias, onde todos os elementos da população têm
a mesma probabilidade de ser escolhidos.
1
4.5 ESTATÍSTICAS, ESTIMADOR E ESTIMATIVA

Qualquer valor calculado com base nos elementos de uma amostra é chamado uma estatística.
Por exemplo, a média amostral, ou seja, a média dos elementos da amostra, é uma estatística, assim
como a variância amostral, etc. As estatísticas variam de uma amostra para outra, sendo, pois, elas
próprias variáveis aleatórias.

Estimador é a expressão matemática utilizada para obter estatísticas.

Estimativa é o valor numérico ou um intervalo de valores obtidos pelo estimador aplicado a


uma amostra.

1 n 1
x=  xi = ( x1 + x2 + x3 + ... + xn ) = 13
n i =1 n

4.6 TEOREMA CENTRAL DO LIMITE

X−
Se XN(, 2)  X N (, 2/n )  Z =  N (0 ; 1)

n

4.7 ESTIMAÇÃO

Quando estamos interessados em determinado parâmetro de uma população, uma amostra é


extraída dessa população, estudamos seus elementos e procuramos, por meio dessa amostra, estimar
o parâmetro populacional.
Exemplo: Um candidato a prefeito de uma cidade deseja avaliar a proporção de eleitores que o
favorecem, consultando uma amostra de 100 eleitores. A proporção de eleitores da amostra servirá
como estimativa da correspondente proporção populacional, que só será conhecida após as eleições.
A estimação de um parâmetro populacional pode ser realizada de 2 maneiras: estimação por
ponto (ou pontual) ou estimação por intervalo (intervalar).

4.7.1 ESTIMAÇÃO POR PONTO

A estimação pontual procura fixar um valor numérico único que esteja satisfatoriamente
próximo do verdadeiro valor do parâmetro. Para estimá-lo, extraímos uma amostra de tamanho n da
população (isto é, com n elementos, x1,x2,...,xn ) e procuramos construir uma função desses valores,
ou seja, uma estatística, tal que seu valor calculado com base nos dados amostrais, seja o mais
próximo possível do valor do parâmetro populacional. O estimador do parâmetro  é denotado por
̂ , do parâmetro 2 é denotado por ̂ 2 , e genericamente, o estimador do parâmetro  é denotado
por ̂ .
Resumindo: A estimação pontual é quando, a partir de uma amostra, procura-se obter um único
valor para o parâmetro populacional. Exemplo: x (média amostral) é uma estatística usada para
fazer uma estimativa por ponto de µ (média populacional); S2 é usado para estimar variância
populacional 2 e p̂ é a estimativa pontual para a proporção populacional p.
Agora vamos estudar as estimativas pontuais para cada caso.

2
4.7.1.1 ESTIMAÇÃO POR PONTO DA MÉDIA E DA VARIÂNCIA DE UMA
POPULAÇÃO

Os parâmetros para estimar serão a média  e a variância 2.

4.7.1.1.1 Estimação pontual para média populacional 


O melhor estimador da média populacional  é a média amostral x :

1 n 1
ˆ = x =  xi = ( x1 + x2 + x3 + ... + xn )
n i =1 n

4.7.1.1.2 Estimação pontual para variância populacional 2


O estimador da variância populacional (2) é dado pela variância amostral S2:

( x) 2
x −
2
1 n n
ˆ 2 = S 2 =  (Xi − X ) =
2

n − 1 i =1 n −1

Exemplo 1: Em uma fábrica, selecionada uma amostra de 28 peças, obtiveram-se as seguintes


medidas para os diâmetros, em mm:
10, 11, 11, 11, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13,
13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 15, 15, 15, 16
Obtenha estimativas pontuais para o diâmetro médio e desvio padrão populacionais.

Resolução: O estimador da média populacional  é obtido pela média amostral x :

n
 xi 10 + ... + 16 364
ˆ = x = i =1 = = = 13 mm
n 28 28

O estimador da variância populacional (2) é obtido pela variância amostral S2:

1 n
ˆ 2 = S 2 =  ( X i − X ) = (1,3608) mm
2 2 2

n − 1 i =1

Consequentemente, a estimativa para o desvio padrão populacional é

ˆ = S = 1,36082 = 1,3608 mm

4.7.1.2 ESTIMAÇÃO POR PONTO DE PROPORÇÃO POPULACIONAL(p)


Seja X uma v.a. com distribuição qualquer e p é a proporção de uma população, que apresenta
determinada característica. Dessa população extrai-se uma amostra de tamanho n e seja X será o
número de elementos da amostra que apresentam a característica em estudo. Então o estimador
da proporção populacional p, será a proporção amostral p̂ dada por:
X
pˆ =
n
3
Exemplo 2: Para avaliar a taxa de desemprego no estado, escolheu-se uma amostra aleatória de
1000 habitantes em idade de trabalho e observou-se que 80 estavam desempregados. Estimar a
proporção de desempregados em todo o estado (proporção da população).

X 80
pˆ = = = 0, 08 = 8%
n 1000

E qual é a estimativa pontual para a proporção de empregados no estado?

4.7.2 ESTIMAÇÃO POR INTERVALO (ou intervalos de confiança)


Um estimador por ponto com base numa amostra produz um único número como estimativa
do parâmetro. Muitas vezes, entretanto, precisamos considerar, conjuntamente, o estimador e a
precisão com que se estima o parâmetro. A forma usual de se fazer isto é por meio dos intervalos de
confiança.
O intervalo de confiança tem por objetivo a mensuração do erro de estimativa. Seja x1,... ,xn
uma amostra aleatória de tamanho n e  um parâmetro desconhecido da população. Um intervalo de
confiança para  é um intervalo construído a partir das observações da amostra, de modo que ele
inclui o verdadeiro e desconhecido valor de , com uma específica probabilidade. Esta
probabilidade, denotada por 1 - , é usualmente considerado como 0,90, 0,95 ou 0,99. Indica-se
por:
𝑃(𝑎 < 𝜃 < 𝑏) = 1−.

Então, (a, b) é chamado de intervalo com 100(1-)% de confiança para o parâmetro , sendo
1- o nível de confiança e a e b limites de confiança, inferior e superior, respectivamente, do
intervalo.

4.7.2.1. INTERVALOS DE CONFIANÇA PARA MÉDIA POPULACIONAL 


A média é uma importante característica da população e, por isso, é de interesse sua
estimação via intervalos de confiança.

4.7.2.1.1. 1ºCaso: População normal e o desvio padrão populacional  é conhecido

Nesta situação, sabe-se que:

X −
 N (0, 1)

n
Então, o intervalo para a média populacional µ com confiança 100(1−)% é obtido por:

 
 x −     
P  − z /2   z /2  = 1 −   P  x − z /2    x + z /2  = 1− 
    n n
 
 n 

4
N(0,1)

   
Ou ainda pode-se escrever, IC(µ)=  x − z /2 ; x + z 2 
 n n


IC ( µ ) = x  z 2
n


O erro da estimativa é erro = z 2
n

em que x é a média amostral


n é o tamanho da amostra
 é o desvio padrão populacional (é conhecido)
α
z /2 é um valor tal que P ( Z  z /2 ) = , que é obtido na Tabela 2 da distribuição N(0,1)
2
Dimensionamento do tamanho da amostra: Consiste em encontrar um tamanho de amostra
dimensionado pelo valor do erro e a ser considerado com a significância α . A partir da expressão
do erro da estimativa, isolando o valor do n, obtém-se:
 z 2   
2

erro = z 2  erro n = z 2  n =  
n  erro 

Exemplos:
3) Sabe-se que o desvio padrão do consumo de combustível de carros produzidos por uma
montadora é 0,8 litros por 100 km e que esta variável segue uma distribuição Normal. Para uma
amostra de 15 carros selecionados aleatoriamente nesta montadora, observou-se uma média de
consumo de 11,3 litros por 100 Km.
a) Construa um intervalo de 95% de confiança para a média de consumo dos carros desta
montadora.
Como o desvio padrão populacional é conhecido usar o 1º caso.
Desvio padrão populacional:  = 0,8 litros por 100 km;
n = 15 ; x = 11,3 litros por 100 km
Nível de confiança = 1−= 95% = 0,95   = 5% = 0,05   2 = 0, 025  Z = 1,96 (obtido pela
2
Tabela A2 da N(0,1)). Agora substituindo os valores na expressão do IC(μ), tem-se:
 0,8
IC ( µ ) = x  z 2 = 11,3  1,96 = 11,3  0, 4048 = [10,8952; 11, 7048]
n 15
ou

5
     0,8 0,8 
IC(µ)=  x − z /2 ; x + z 2  = 11,3 − 1,96 ;11,3 + 1,96 =
 n n  15 15 

11,3 − 0, 4048 ;11,3 + 0, 4048  = 10,8952; 11,7048


Portanto, o intervalo de 95% de confiança para o valor médio de consumo dos carros da montadora
é dado por [10,8952 litros; 11,7048 litros].
Para uma amostra com n = 15 obteve-se um erro de estimativa = 0,4048 litros

b) Qual deve ser o tamanho da amostra (n =?) para cometer um erro de 0,2 litros?
 z 2     1,96  0,8 
2 2

erro = z 2 n=  =  = (7,84)2 = 61 carros
n  erro   0, 2 
O tamanho da amostra deve ser de 61 carros para cometer um erro de 0,2 litros.

4) Para uma amostra de 50 observações de uma população normal com média desconhecida e
desvio padrão  = 6 e com média amostral x = 20,5, obtenha um intervalo de 96% de confiança
para a média populacional.
Nível de confiança =1−= 0,96   = 0,04   2 = 0, 02 
Z = 2, 05 (pela Tabela A2 da N(0,1)).
2

 = 6, n =50, x = 20,5
 6
IC ( µ ) = x  z 2 = 20,5  2, 05 = 20,5  1, 74
n 50

 
IC(µ)= 20,5 − 1,74; 20,5 + 1,74 = [18,76 ; 22, 24 ]

4.7.2.1.2. 2ºCaso: quando o desvio padrão populacional  for desconhecido e n<30


Neste caso, o intervalo de confiança é calculado utilizando-se a estatística:

X −
t=
S
n

onde S é o estimador do desvio padrão populacional. Esta estatística tem distribuição conhecida
como t de Student com  = (n − 1) graus de liberdade, sendo n o tamanho da amostra.
A forma da distribuição t (Tabela 10) é parecida com a Normal Padronizada. É simétrica em
relação ao 0 (zero), mas apresenta caudas mais “grossas”, maior variância do que a distribuição
Normal.
Então o intervalo de confiança para a média populacional  é dado por:

S S
P ( X − t( n −1, /2)    X + t( n −1, /2) ) = 1− 
n n

6
 S S 
Ou ainda pode ser escrito como: IC(µ)=  x − t ( n −1; /2) ; x + t ( n −1; /2) 
 n n
em que x é a média amostral
n é o tamanho da amostra
S é o desvio padrão amostral
α
t( n −1; / 2) é um valor tal que P ( t  t( n −1, /2) ) = , que é obtido na Tabela A10- distribuição t-
2
Student.

OBS: Neste caso a amostra é considerada pequena (n<30) e desvio padrão populacional é
desconhecido.

Exemplos:

5) Fez-se um estudo para estimar o custo hospitalar de vítimas de acidentes de trânsito que usavam
o cinto de segurança. Para 20 casos selecionados aleatoriamente obteve-se uma média de
R$ 9000,00 e desvio padrão de R$5600,00.
a)Construa um intervalo de 95% de confiança para o custo médio hospitalar de vitimas de acidentes
de transito que usavam cinto de segurança e interprete o resultado.
Resolução: n = 20  x = 9000, 00 e S =5600,00.
Não é conhecido o desvio padrão populacional, logo usa S que é o estimador de  e n<30, logo usa
o 2º caso.
Nível de confiança=1−= 0,95   = 0,05   2 = 0, 025 
t( n −1; / 2) = t(19; 0,025) = 2,093 (pela Tabela A10)
S 5600
IC ( µ ) = X  t( n −1; /2)
= 9000  2, 093 = 9000  2620,85 =  R$ 6379,15; R$ 11620,85
n 20
Portanto, IC(µ)= [R$ 6379,15; R$ 11620,85] com 95% de confiança. Ou seja, com 95% de
confiança esse intervalo pode conter o custo médio hospitalar de vitimas de acidentes de trânsito
que usavam cinto de segurança.

b) O diretor do hospital afirma que o custo médio hospitalar de vitimas de acidentes de trânsito que
usavam cinto de segurança é R$ 15000,00. O que você pode dizer dessa afirmação com base no
resultado obtido no intervalo de confiança obtido em a).
A afirmação do diretor está equivocada, pois R$ 15000,00 não está contido no intervalo.

6) Uma amostra de tamanho 10, extraída de uma população normal, observou-se x = 1, 0 e S=0,264.
Construir intervalos de 98% e 95% de confiança para a média populacional. Qual deles tem menor
amplitude? Por que?

Resolução

Intervalo a 98%
n=10 isso implica o grau de liberdade v=10-1=9

7
x = 1, 0
S=0,264
1−= 0,98   = 0,02   2 = 0, 01 
t( n −1; / 2) = t(9; 0,01) = (pela Tabela A10)

S
IC ( µ ) = X  t( n −1; /2)
n

S 0, 264
erro = t( n −1; /2) = 2,821 = 0, 235
n 10

IC ( ) = 1, 0 − 0, 235;1, 0 + 0, 235 = [0, 765; 1, 235]

Intervalo a 95%

n=10 isso implica o grau de liberdade v=10-1=9


x = 1, 0
S=0,264

1−= 0,95   = 0,05   2 = 0, 025 


t( n −1; / 2) = t(9; 0,025) = 2,262 (pela Tabela A10)

8
S
IC ( µ ) = X  t( n −1; /2)
n

S 0, 264
erro = t( n −1; /2) = 2, 262 = 0,188
n 10

IC =  x − erro; x + erro = 1, 0 − 0,188;1, 0 + 0,188 = [0,812; 1,188]

Amplitude do IC(98%)
A(98%)= 1,235-0,765=0,47
Amplitude do IC(95%)
A(95%)=1,188-0,812=0,38

Portanto o IC (95%) possui menor amplitude.

4.7.2.1.3. 3º Caso: população não – normal, grandes amostras (n ≥ 30)


Enquanto que, nos casos anteriores, se conhecia a distribuição da estatística, com base na qual se
obteve o intervalo, aqui não se passa o mesmo. Usa-se o Teorema do Limite Central para afirma
X −
que, se n é suficientemente grande, logo ~ N(0;1). Portanto, quando a amostra for grande,
S
n
um intervalo de confiança para a média com nível de confiança de 100(1−)% é obtido por:

S S
P ( X − z /2    X + z /2 ) = 1− 
n n

ou

 S S  S
IC(µ)=  X − z /2 ; X + z 2  = X  z 2
 n n n
Dimensionamento do tamanho da amostra: Neste caso, o tamanho da amostra é obtido por:

9
 z 2  S 
2
S
erro = z 2 n= 
n  erro 
Exemplo:
7)Uma indústria fabrica lâmpadas. Se uma amostra de 30 lâmpadas dessa empresa tem média de
duração de 780 horas com desvio padrão de 40 horas, determine um intervalo de 96% de confiança
para a duração média de todas as lâmpadas produzidas pela empresa. A empresa afirma que a
duração média das lâmpadas fabricadas é igual a 850 horas, esta afirmação está correta?
Resolução:
Este problema se enquadra no 3º caso do intervalo de confiança para média. Logo,
S
IC(µ)= X  z 2
n
n = 30  x = 780h e S = 40 h.
1−= 0,96   = 0,04   2 = 0, 02  Z = Z 0,02 = 2, 05 (obtido pela Tabela 2 da N(0,1)).
2

Agora substituindo as informações dadas no problema na expressão, tem-se:

40
IC(µ)= 780  2, 05
30
IC(µ)= 780 ± 14,97 = [765,03 h; 794,97 h] é o intervalo com 96% de confiança para a duração
média das lâmpadas da empresa.

Como o valor 850 horas não encontra-se no intervalo obtido, a duração média é inferior a 850
horas, consequentemente, a afirmação do fabricante está incorreta.

8)Os valores referentes a resistência à tração de 30 corpos de prova são expressos pelos seguintes
valores: 130, 130, 131, 132, 133, 134, 134, 135, 135, 138, 138, 139, 139, 140, 140, 141, 142, 143,
144, 144, 145, 146, 147, 148, 149, 150,150, 155, 155, 159.
a) Estabelecer uma estimativa intervalar de 95% de confiança para a média populacional.
b) Qual deve ser o tamanho da amostra para se cometer um erro de 0,08.

Resolução

a) n=30 (amostra grande)


1−= 0,95   = 0,05   2 = 0, 025  Z = Z 0,025 = 1,96 (obtido pela Tabela 2 da N(0,1)).
2

S
IC(µ)= X  z 2
n
S 7,81
erro = z 2 = 1,96 = 2, 79
n 30
IC =  x − erro; x + erro = 141,53 − 2, 79; 141, 53 + 2, 79 = [138, 74; 144,32]

b)
10
 z 2  S   1,96  7,81   1,96  7,81 
2 2 2
S
erro = z 2 n=  =  =  0, 08  = 36613
n  erro   0, 08   

4.7.2.2. ESTIMAÇÃO POR INTERVALO DE UMA PROPORÇÃO


Seja X o número de elementos de uma amostra de tamanho n que apresentam uma
determinada característica de interesse. Queremos estabelecer um intervalo de confiança para a
proporção populacional p. Temos:
X p̂(1 − p̂)
p̂ = e ˆ =
n n
Então:
p̂ − p
 N(0;1)
p̂(1 − p̂)
n

Logo, o intervalo de 100(1 − )% de confiança para a proporção populacional p é dado por:

 pˆ (1 − pˆ ) pˆ (1 − pˆ ) 
P  pˆ − z / 2  p  pˆ + z / 2  = 1−

 n n 

ou

 pˆ (1 − pˆ ) pˆ (1 − pˆ ) 
IC ( p) =  pˆ − z / 2 ; pˆ + z / 2 
 n n 
ou

pˆ (1 − pˆ )
IC ( p) = pˆ  z / 2
n
α
sendo p̂ = proporção amostral, n= tamanho da amostra e z /2 é um valor tal que P ( Z  z /2 ) =
2
obtido na Tabela 2 da distribuição N(0,1).

Dimensionamento do tamanho da amostra: Neste caso, o tamanho da amostra é obtido por:

pˆ (1 − pˆ ) z /2 2  pˆ (1 − pˆ )
erro = z /2 n=
n erro 2
Exemplos:

11
9) Examinam-se 98 animais em uma fazenda, encontrando-se 53 infectados com determinado vírus.
Construir um intervalo de 95% de confiança para a proporção populacional p de animais infectados.
53
Resolução: n = 98 animais e a proporção de infectados nessa amostra é pˆ = = 0,5408 = 54, 08%
98
e 1 − pˆ = 1 − 0,5408 = 0, 4592
1−= 0,95   = 0,05   2 = 0, 025  Z = Z 0,025 = 1,96 (obtido pela Tabela 2 da N(0,1)).
2
O intervalo de confiança para a proporção populacional é dado por:

pˆ (1 − pˆ )
IC ( p) = pˆ  z /2
n
0,5408(0, 4592)
IC ( p) = 0,5408  1,96 = 0,5408  0, 0987 = 0, 4421; 0, 6395 =
98
= [44,21%; 63,95%].
Portanto, o intervalo de 95% de confiança para a proporção de animais infectados na fazenda é
[0,4421; 0,6395].

O administrador da fazenda afirma que tem 35% de animais contaminados. Com base no intervalo
de confiança obtido anteriormente o que você poderia dizer dessa afirmação do administrador?

Qual deve ser o tamanho da amostra para cometer um erro de 3%?


erro = 3% = 0,03

pˆ (1 − pˆ ) z /2 2  pˆ (1 − pˆ ) 1,962  0,5408  0.4592


erro = z /2 n= = = 1060 animais
n erro 2 0, 032

10) Uma análise de 1907 mortes no trânsito determinou que 725 delas estavam relacionadas com
pessoas alcoolizadas. Construa um intervalo de 95% de confiança para a proporção de mortes no
transito envolvendo alcoolizados. Quantos acidentes de transito deveriam ser analisados para se
cometer um erro de 2%?

Resolução
X=725
n=1907
1−= 0,95   = 0,05   2 = 0, 025  Z = Z 0,025 = 1,96 (obtido pela Tabela 2 da N(0,1)).
2

X 725
pˆ = = = 0,3801
n 1907

pˆ (1 − pˆ ) 0,3801(1 − 0,3801)
erro = z / 2 = 1,96 = 0,0218
n 1907

12
IC ( p) =  pˆ − erro; pˆ + erro  = 0,3801 − 0, 0218; 0,3801 + 0, 0218  = 0,3583; 0, 4019

ou 35,83%; 40,19% 

erro= 0,02
z /2 2  pˆ (1 − pˆ ) 1,962  0,3801 0, 6199 3,8416  0, 2356 0.9051
n= = = = = 2263
erro2 0, 022 0, 0004 0, 0004

11) Em certo lago,retirou-se uma amostra aleatória de 1000 peixes obtendo-se 300 tilápias.
a) Construa um intervalo de 95% de confiança para a verdadeira proporção de tilápias em relação a
população total de peixes existentes neste lago. Interprete o resultado.

b) O responsável pelo lago afirma que a proporção de tilápias existentes é de 30%, avalie a
afirmação com base no resultado obtido no item a).
c) qual deve ser o número de peixes selecionados para se cometer um erro de 2%?

Resolução
X=300
n=1000
1−= 0,95   = 0,05   2 = 0, 025  Z = Z 0,025 = 1,96 (obtido pela Tabela 2 da N(0,1)).
2

X 300
pˆ = = = 0,3
n 1000

pˆ (1 − pˆ ) 0,3(1 − 0,3)
erro = z / 2 = 1,96 = 0,03
n 1000

IC ( p) =  pˆ − erro; pˆ + erro  =  0,3 − 0, 03; 0,3 + 0, 03  = 0, 27; 0,33

ou  27%; 33%

O intervalo de confiança calculado tem probabilidade de 0,95 de conter a verdadeira


proporção de tilápias existentes no lago. Se construirmos 100 intervalos a partir de 100 amostras
diferentes do mesmo tamanho esperamos que 95 deles inclua o verdadeiro parâmetro, ou seja, a
proporção populacional.

b) Como 0,3 pertence ao IC(p) calculado, com base nos resultados obtidos na letra a) a hipótese do
responsável está correta.

c) erro=0,02

z /2 2  pˆ (1 − pˆ ) 1,962  0,3  0, 7
n= = = 2017
erro2 0, 022
13
12) Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certa
proposta de horário de trabalho. Numa amostra observou que 500 eram favoráveis a proposta
apresentada. Obtenha um intervalo de 94% de confiança para a proporção de empregados
favoráveis a proposta. Qual deve ser o tamanho da amostra que garanta um erro amostral não
superior a 5%?

4.7.2.3. INTERVALO DE CONFIANÇA PARA A VARIÂNCIA POPULACIONAL σ2


Para estabelecer uma estimativa intervalar para 2 utiliza-se a estatística:

(n − 1) S 2
2 = ~  2n −1
 2

Esta estatística tem distribuição chamada “Qui-quadrado” com (n − 1) graus de


 2n −1 ,
liberdade (Tabelas 3 e 4), quando o tamanho da amostra é n. Então, o intervalo de (1-α)% de
confiança para a variância populacional σ2 é dado por:

 (n − 1) S2 (n − 1) S2 
P   2
2
=1−  ou
 2 1− (  / 2);  
  / 2; 

 
 (n − 1) S 2 (n − 1) S 2 
IC (  2 ) =  2 ; 2 

  n −1;     
 n −1;1−( ) 
  2   2  

Sendo n = tamanho da amostra, S2 = variância amostral e 2 


e  2  
valores de uma
 n −1;   n −1; 1− ( ) 
 2  2 

distribuição Qui-quadrado (Tabelas 3 e 4)

E o intervalo de confiança para o desvio padrão populacional σ é obtido por:

 
 ( n − 1) S 2 (n − 1) S 2 
IC (  ) =  ; .
  2
  
 2   
 n −1;  n −1; 1− ( ) 
  2

  2  

Exemplos:
13) Os salários dos funcionários da empresa JJ têm uma distribuição aproximadamente normal. Para
estimar o salário médio dessa empresa foram observados os salários de 20 funcionários, obtendo-se
média salarial de R$ 800,00 e variância de R$100,00. Obtenha um intervalo de 95% de confiança
para a variância populacional e de 95% para o desvio-padrão populacional.

Resolução: n = 20, S2 = R$ 100,00 e n-1= 19

1−= 0,95   = 0,05   2 = 0, 025

14
2  = (219; 0,025)
= 32,852 (pela Tabela 4)
 n −1; 
 2


1− = 1 − 0, 025 = 0,975
2

2   = (219; 0,975 )


= 8, 097 (pela Tabela 3)
 n −1; 1−( ) 
 2 

o intervalo de 95% de confiança para a variância populacional σ2 dos salários é dado por:

 
 (n − 1) S 2 (n − 1) S 2  19 100 19 100 
IC (  ) =  2 =  = 57,8351; 213,3154
2
; 2 ;

  n −1;       32,852 8,907 
 n −1;1−( ) 
  2  2  

o intervalo de 95% de confiança para o desvio populacional σ dos salários é dado por:

 
 (n − 1) S 2 (n − 1) S 2 
IC (  ) =  ;  =  57,8351; 213,3154  = 7, 6049; 14, 6053
  2
   2   
 n −1;   n −1;1− ( ) 
  2  2  

14) Têm-se os seguintes pesos, em gramas, de 10 pacotes postais remetidos por uma empresa:
46,4 46,1 45,8 47,0 46,1 45,9 45,8 46,9 45,2 46,0
Admitindo normal a distribuição dos pesos, determinar um intervalo de confiança de 95% para a
variância dos pesos de todos os pacotes expedidos pela empresa.

Resolução: n = 10, S2 = 0,286 e n-1= 9

1−= 0,95   = 0,05   2 = 0, 025


1− = 1 − 0, 025 = 0,975
2
2  = (219; 0,025)
= 19, 023 (pela Tabela 4)
 n −1; 
 2

 2
   = (219; 0,975)
= 2, 7 (pela Tabela 3)
 n −1; 1−( ) 
 2 

15
O intervalo de 95% de confiança para a variância populacional σ2 é dado por:

 
 (n − 1) S 2 (n − 1) S 2   9  0, 286 9  0, 286 
IC (  ) =  2 =  = 0,135; 0,953
2
; 2 ;

  n −1;       19, 023 2, 7 
 n −1;1−( ) 
  2   2  

o intervalo de 95% de confiança para o desvio populacional σ é dado por:

 
 (n − 1) S 2 (n − 1) S 2 
IC (  ) =  ;  =  0,135; 0,953  = 0,367; 0,976 
  2
   2   
 n −1;   n −1;1− ( ) 
  2  2  

15) A altura dos alunos da UFGD apresenta uma distribuição aproximadamente normal. Para
estimar a altura média dessa população, foi observada a altura de 30 alunos, obtendo-se média de
175 cm e desvio padrão igual a 15 cm. Determine:
a. Um intervalo de confiança de 99% para a média populacional.
16
1−= 0,99   = 0,01   2 = 0, 005  Z = Z 0,005 = 2,57 (obtido pela Tabela 2 da
2
N(0,1)).
n = 30  x = 175 cm e S =15cm

 S S  S 15
IC(µ)=  X − z /2 ; X + z 2  = X  z 2 = 175  2,57 = 175  7, 0382
 n n n 30
IC(µ)=[167,9618 cm; 182,0382 cm]
b. Um intervalo de confiança de 99% para a variância.

n = 30, S = 15 cm, S2 =152 = 225 e n-1= 29


 = 0, 005
2

1 − = 1 − 0, 005 = 0,995
2
   = (229; 0,005) = 52,336 (pela Tabela 4)
2

 n −1; 
 2

 2
   = (229; 0,995)
= 13,121 (pela Tabela 3)
 n −1; 1−( ) 
 2 

o intervalo de 99% de confiança para a variância populacional σ2 é dado por:

 
 (n − 1) S 2 (n − 1) S 2   29  225 29  225 
IC (  2 ) =  2 ; 2 = ;  = 126, 6751 cm 2 ; 497,2944 cm 2 

  n −1;       52,336 13,121 
 n −1;1−( ) 
  2  2  

c. Um intervalo de confiança de 99% para o desvio-padrão populacional.


 
 (n − 1) S 2 (n − 1) S 2 
IC (  ) =  ;  =  126, 6751; 497,2944  = [11, 2550 cm; 22,3000 cm]
   n −1;   2
2
 
 n −1;1− ( ) 

  2  2  

16) Como parte de um levantamento sobre a qualidade da água, você testa a pureza da água em 19
córregos selecionados ao acaso, obtendo-se um desvio padrão de 15 grãos/litro. Construa um
intervalo de 99 % de confiança para a variância populacional e obtenha também um intervalo de
99% de confiança para o desvio padrão populacional.

17

Você também pode gostar