Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTIMAÇÃO
4.1 INTRODUÇÃO
4.2 PARÂMETROS
Vimos que, no estudo do comportamento das alturas, ao qual se adapta o modelo Normal,
precisamos determinar e 2. A estes valores damos o nome de parâmetros, que são números fixos,
embora muitas vezes desconhecidos. Assim como a Normal, toda distribuição de probabilidades
estudada anteriormente, depende de parâmetros, que determinam sua forma específica, por
exemplo, o da Poisson, o da exponencial, o n e o p da binomial, etc. Diferentes valores dos
parâmetros conduzem a valores distintos das probabilidades, onde estes parâmetros serão escolhidos
de uma amostra extraída da população de interesse.
Assim, o parâmetro pode ser definido como uma medida numérica que descreve uma
característica de uma população.
4.3 POPULAÇÃO
4.4 AMOSTRA
Uma amostra é qualquer subconjunto de elementos da população. Em inferência estatística,
entretanto, trabalhamos apenas com amostras aleatórias, onde todos os elementos da população têm
a mesma probabilidade de ser escolhidos.
1
4.5 ESTATÍSTICAS, ESTIMADOR E ESTIMATIVA
Qualquer valor calculado com base nos elementos de uma amostra é chamado uma estatística.
Por exemplo, a média amostral, ou seja, a média dos elementos da amostra, é uma estatística, assim
como a variância amostral, etc. As estatísticas variam de uma amostra para outra, sendo, pois, elas
próprias variáveis aleatórias.
1 n 1
x= xi = ( x1 + x2 + x3 + ... + xn ) = 13
n i =1 n
X−
Se XN(, 2) X N (, 2/n ) Z = N (0 ; 1)
n
4.7 ESTIMAÇÃO
A estimação pontual procura fixar um valor numérico único que esteja satisfatoriamente
próximo do verdadeiro valor do parâmetro. Para estimá-lo, extraímos uma amostra de tamanho n da
população (isto é, com n elementos, x1,x2,...,xn ) e procuramos construir uma função desses valores,
ou seja, uma estatística, tal que seu valor calculado com base nos dados amostrais, seja o mais
próximo possível do valor do parâmetro populacional. O estimador do parâmetro é denotado por
̂ , do parâmetro 2 é denotado por ̂ 2 , e genericamente, o estimador do parâmetro é denotado
por ̂ .
Resumindo: A estimação pontual é quando, a partir de uma amostra, procura-se obter um único
valor para o parâmetro populacional. Exemplo: x (média amostral) é uma estatística usada para
fazer uma estimativa por ponto de µ (média populacional); S2 é usado para estimar variância
populacional 2 e p̂ é a estimativa pontual para a proporção populacional p.
Agora vamos estudar as estimativas pontuais para cada caso.
2
4.7.1.1 ESTIMAÇÃO POR PONTO DA MÉDIA E DA VARIÂNCIA DE UMA
POPULAÇÃO
1 n 1
ˆ = x = xi = ( x1 + x2 + x3 + ... + xn )
n i =1 n
( x) 2
x −
2
1 n n
ˆ 2 = S 2 = (Xi − X ) =
2
n − 1 i =1 n −1
n
xi 10 + ... + 16 364
ˆ = x = i =1 = = = 13 mm
n 28 28
1 n
ˆ 2 = S 2 = ( X i − X ) = (1,3608) mm
2 2 2
n − 1 i =1
ˆ = S = 1,36082 = 1,3608 mm
X 80
pˆ = = = 0, 08 = 8%
n 1000
Então, (a, b) é chamado de intervalo com 100(1-)% de confiança para o parâmetro , sendo
1- o nível de confiança e a e b limites de confiança, inferior e superior, respectivamente, do
intervalo.
X −
N (0, 1)
n
Então, o intervalo para a média populacional µ com confiança 100(1−)% é obtido por:
x −
P − z /2 z /2 = 1 − P x − z /2 x + z /2 = 1−
n n
n
4
N(0,1)
Ou ainda pode-se escrever, IC(µ)= x − z /2 ; x + z 2
n n
IC ( µ ) = x z 2
n
O erro da estimativa é erro = z 2
n
Exemplos:
3) Sabe-se que o desvio padrão do consumo de combustível de carros produzidos por uma
montadora é 0,8 litros por 100 km e que esta variável segue uma distribuição Normal. Para uma
amostra de 15 carros selecionados aleatoriamente nesta montadora, observou-se uma média de
consumo de 11,3 litros por 100 Km.
a) Construa um intervalo de 95% de confiança para a média de consumo dos carros desta
montadora.
Como o desvio padrão populacional é conhecido usar o 1º caso.
Desvio padrão populacional: = 0,8 litros por 100 km;
n = 15 ; x = 11,3 litros por 100 km
Nível de confiança = 1−= 95% = 0,95 = 5% = 0,05 2 = 0, 025 Z = 1,96 (obtido pela
2
Tabela A2 da N(0,1)). Agora substituindo os valores na expressão do IC(μ), tem-se:
0,8
IC ( µ ) = x z 2 = 11,3 1,96 = 11,3 0, 4048 = [10,8952; 11, 7048]
n 15
ou
5
0,8 0,8
IC(µ)= x − z /2 ; x + z 2 = 11,3 − 1,96 ;11,3 + 1,96 =
n n 15 15
b) Qual deve ser o tamanho da amostra (n =?) para cometer um erro de 0,2 litros?
z 2 1,96 0,8
2 2
erro = z 2 n= = = (7,84)2 = 61 carros
n erro 0, 2
O tamanho da amostra deve ser de 61 carros para cometer um erro de 0,2 litros.
4) Para uma amostra de 50 observações de uma população normal com média desconhecida e
desvio padrão = 6 e com média amostral x = 20,5, obtenha um intervalo de 96% de confiança
para a média populacional.
Nível de confiança =1−= 0,96 = 0,04 2 = 0, 02
Z = 2, 05 (pela Tabela A2 da N(0,1)).
2
= 6, n =50, x = 20,5
6
IC ( µ ) = x z 2 = 20,5 2, 05 = 20,5 1, 74
n 50
IC(µ)= 20,5 − 1,74; 20,5 + 1,74 = [18,76 ; 22, 24 ]
X −
t=
S
n
onde S é o estimador do desvio padrão populacional. Esta estatística tem distribuição conhecida
como t de Student com = (n − 1) graus de liberdade, sendo n o tamanho da amostra.
A forma da distribuição t (Tabela 10) é parecida com a Normal Padronizada. É simétrica em
relação ao 0 (zero), mas apresenta caudas mais “grossas”, maior variância do que a distribuição
Normal.
Então o intervalo de confiança para a média populacional é dado por:
S S
P ( X − t( n −1, /2) X + t( n −1, /2) ) = 1−
n n
6
S S
Ou ainda pode ser escrito como: IC(µ)= x − t ( n −1; /2) ; x + t ( n −1; /2)
n n
em que x é a média amostral
n é o tamanho da amostra
S é o desvio padrão amostral
α
t( n −1; / 2) é um valor tal que P ( t t( n −1, /2) ) = , que é obtido na Tabela A10- distribuição t-
2
Student.
OBS: Neste caso a amostra é considerada pequena (n<30) e desvio padrão populacional é
desconhecido.
Exemplos:
5) Fez-se um estudo para estimar o custo hospitalar de vítimas de acidentes de trânsito que usavam
o cinto de segurança. Para 20 casos selecionados aleatoriamente obteve-se uma média de
R$ 9000,00 e desvio padrão de R$5600,00.
a)Construa um intervalo de 95% de confiança para o custo médio hospitalar de vitimas de acidentes
de transito que usavam cinto de segurança e interprete o resultado.
Resolução: n = 20 x = 9000, 00 e S =5600,00.
Não é conhecido o desvio padrão populacional, logo usa S que é o estimador de e n<30, logo usa
o 2º caso.
Nível de confiança=1−= 0,95 = 0,05 2 = 0, 025
t( n −1; / 2) = t(19; 0,025) = 2,093 (pela Tabela A10)
S 5600
IC ( µ ) = X t( n −1; /2)
= 9000 2, 093 = 9000 2620,85 = R$ 6379,15; R$ 11620,85
n 20
Portanto, IC(µ)= [R$ 6379,15; R$ 11620,85] com 95% de confiança. Ou seja, com 95% de
confiança esse intervalo pode conter o custo médio hospitalar de vitimas de acidentes de trânsito
que usavam cinto de segurança.
b) O diretor do hospital afirma que o custo médio hospitalar de vitimas de acidentes de trânsito que
usavam cinto de segurança é R$ 15000,00. O que você pode dizer dessa afirmação com base no
resultado obtido no intervalo de confiança obtido em a).
A afirmação do diretor está equivocada, pois R$ 15000,00 não está contido no intervalo.
6) Uma amostra de tamanho 10, extraída de uma população normal, observou-se x = 1, 0 e S=0,264.
Construir intervalos de 98% e 95% de confiança para a média populacional. Qual deles tem menor
amplitude? Por que?
Resolução
Intervalo a 98%
n=10 isso implica o grau de liberdade v=10-1=9
7
x = 1, 0
S=0,264
1−= 0,98 = 0,02 2 = 0, 01
t( n −1; / 2) = t(9; 0,01) = (pela Tabela A10)
S
IC ( µ ) = X t( n −1; /2)
n
S 0, 264
erro = t( n −1; /2) = 2,821 = 0, 235
n 10
Intervalo a 95%
8
S
IC ( µ ) = X t( n −1; /2)
n
S 0, 264
erro = t( n −1; /2) = 2, 262 = 0,188
n 10
Amplitude do IC(98%)
A(98%)= 1,235-0,765=0,47
Amplitude do IC(95%)
A(95%)=1,188-0,812=0,38
S S
P ( X − z /2 X + z /2 ) = 1−
n n
ou
S S S
IC(µ)= X − z /2 ; X + z 2 = X z 2
n n n
Dimensionamento do tamanho da amostra: Neste caso, o tamanho da amostra é obtido por:
9
z 2 S
2
S
erro = z 2 n=
n erro
Exemplo:
7)Uma indústria fabrica lâmpadas. Se uma amostra de 30 lâmpadas dessa empresa tem média de
duração de 780 horas com desvio padrão de 40 horas, determine um intervalo de 96% de confiança
para a duração média de todas as lâmpadas produzidas pela empresa. A empresa afirma que a
duração média das lâmpadas fabricadas é igual a 850 horas, esta afirmação está correta?
Resolução:
Este problema se enquadra no 3º caso do intervalo de confiança para média. Logo,
S
IC(µ)= X z 2
n
n = 30 x = 780h e S = 40 h.
1−= 0,96 = 0,04 2 = 0, 02 Z = Z 0,02 = 2, 05 (obtido pela Tabela 2 da N(0,1)).
2
40
IC(µ)= 780 2, 05
30
IC(µ)= 780 ± 14,97 = [765,03 h; 794,97 h] é o intervalo com 96% de confiança para a duração
média das lâmpadas da empresa.
Como o valor 850 horas não encontra-se no intervalo obtido, a duração média é inferior a 850
horas, consequentemente, a afirmação do fabricante está incorreta.
8)Os valores referentes a resistência à tração de 30 corpos de prova são expressos pelos seguintes
valores: 130, 130, 131, 132, 133, 134, 134, 135, 135, 138, 138, 139, 139, 140, 140, 141, 142, 143,
144, 144, 145, 146, 147, 148, 149, 150,150, 155, 155, 159.
a) Estabelecer uma estimativa intervalar de 95% de confiança para a média populacional.
b) Qual deve ser o tamanho da amostra para se cometer um erro de 0,08.
Resolução
S
IC(µ)= X z 2
n
S 7,81
erro = z 2 = 1,96 = 2, 79
n 30
IC = x − erro; x + erro = 141,53 − 2, 79; 141, 53 + 2, 79 = [138, 74; 144,32]
b)
10
z 2 S 1,96 7,81 1,96 7,81
2 2 2
S
erro = z 2 n= = = 0, 08 = 36613
n erro 0, 08
Logo, o intervalo de 100(1 − )% de confiança para a proporção populacional p é dado por:
pˆ (1 − pˆ ) pˆ (1 − pˆ )
P pˆ − z / 2 p pˆ + z / 2 = 1−
n n
ou
pˆ (1 − pˆ ) pˆ (1 − pˆ )
IC ( p) = pˆ − z / 2 ; pˆ + z / 2
n n
ou
pˆ (1 − pˆ )
IC ( p) = pˆ z / 2
n
α
sendo p̂ = proporção amostral, n= tamanho da amostra e z /2 é um valor tal que P ( Z z /2 ) =
2
obtido na Tabela 2 da distribuição N(0,1).
pˆ (1 − pˆ ) z /2 2 pˆ (1 − pˆ )
erro = z /2 n=
n erro 2
Exemplos:
11
9) Examinam-se 98 animais em uma fazenda, encontrando-se 53 infectados com determinado vírus.
Construir um intervalo de 95% de confiança para a proporção populacional p de animais infectados.
53
Resolução: n = 98 animais e a proporção de infectados nessa amostra é pˆ = = 0,5408 = 54, 08%
98
e 1 − pˆ = 1 − 0,5408 = 0, 4592
1−= 0,95 = 0,05 2 = 0, 025 Z = Z 0,025 = 1,96 (obtido pela Tabela 2 da N(0,1)).
2
O intervalo de confiança para a proporção populacional é dado por:
pˆ (1 − pˆ )
IC ( p) = pˆ z /2
n
0,5408(0, 4592)
IC ( p) = 0,5408 1,96 = 0,5408 0, 0987 = 0, 4421; 0, 6395 =
98
= [44,21%; 63,95%].
Portanto, o intervalo de 95% de confiança para a proporção de animais infectados na fazenda é
[0,4421; 0,6395].
O administrador da fazenda afirma que tem 35% de animais contaminados. Com base no intervalo
de confiança obtido anteriormente o que você poderia dizer dessa afirmação do administrador?
10) Uma análise de 1907 mortes no trânsito determinou que 725 delas estavam relacionadas com
pessoas alcoolizadas. Construa um intervalo de 95% de confiança para a proporção de mortes no
transito envolvendo alcoolizados. Quantos acidentes de transito deveriam ser analisados para se
cometer um erro de 2%?
Resolução
X=725
n=1907
1−= 0,95 = 0,05 2 = 0, 025 Z = Z 0,025 = 1,96 (obtido pela Tabela 2 da N(0,1)).
2
X 725
pˆ = = = 0,3801
n 1907
pˆ (1 − pˆ ) 0,3801(1 − 0,3801)
erro = z / 2 = 1,96 = 0,0218
n 1907
12
IC ( p) = pˆ − erro; pˆ + erro = 0,3801 − 0, 0218; 0,3801 + 0, 0218 = 0,3583; 0, 4019
ou 35,83%; 40,19%
erro= 0,02
z /2 2 pˆ (1 − pˆ ) 1,962 0,3801 0, 6199 3,8416 0, 2356 0.9051
n= = = = = 2263
erro2 0, 022 0, 0004 0, 0004
11) Em certo lago,retirou-se uma amostra aleatória de 1000 peixes obtendo-se 300 tilápias.
a) Construa um intervalo de 95% de confiança para a verdadeira proporção de tilápias em relação a
população total de peixes existentes neste lago. Interprete o resultado.
b) O responsável pelo lago afirma que a proporção de tilápias existentes é de 30%, avalie a
afirmação com base no resultado obtido no item a).
c) qual deve ser o número de peixes selecionados para se cometer um erro de 2%?
Resolução
X=300
n=1000
1−= 0,95 = 0,05 2 = 0, 025 Z = Z 0,025 = 1,96 (obtido pela Tabela 2 da N(0,1)).
2
X 300
pˆ = = = 0,3
n 1000
pˆ (1 − pˆ ) 0,3(1 − 0,3)
erro = z / 2 = 1,96 = 0,03
n 1000
ou 27%; 33%
b) Como 0,3 pertence ao IC(p) calculado, com base nos resultados obtidos na letra a) a hipótese do
responsável está correta.
c) erro=0,02
z /2 2 pˆ (1 − pˆ ) 1,962 0,3 0, 7
n= = = 2017
erro2 0, 022
13
12) Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certa
proposta de horário de trabalho. Numa amostra observou que 500 eram favoráveis a proposta
apresentada. Obtenha um intervalo de 94% de confiança para a proporção de empregados
favoráveis a proposta. Qual deve ser o tamanho da amostra que garanta um erro amostral não
superior a 5%?
(n − 1) S 2
2 = ~ 2n −1
2
(n − 1) S2 (n − 1) S2
P 2
2
=1− ou
2 1− ( / 2);
/ 2;
(n − 1) S 2 (n − 1) S 2
IC ( 2 ) = 2 ; 2
n −1;
n −1;1−( )
2 2
( n − 1) S 2 (n − 1) S 2
IC ( ) = ; .
2
2
n −1; n −1; 1− ( )
2
2
Exemplos:
13) Os salários dos funcionários da empresa JJ têm uma distribuição aproximadamente normal. Para
estimar o salário médio dessa empresa foram observados os salários de 20 funcionários, obtendo-se
média salarial de R$ 800,00 e variância de R$100,00. Obtenha um intervalo de 95% de confiança
para a variância populacional e de 95% para o desvio-padrão populacional.
14
2 = (219; 0,025)
= 32,852 (pela Tabela 4)
n −1;
2
1− = 1 − 0, 025 = 0,975
2
o intervalo de 95% de confiança para a variância populacional σ2 dos salários é dado por:
(n − 1) S 2 (n − 1) S 2 19 100 19 100
IC ( ) = 2 = = 57,8351; 213,3154
2
; 2 ;
n −1; 32,852 8,907
n −1;1−( )
2 2
o intervalo de 95% de confiança para o desvio populacional σ dos salários é dado por:
(n − 1) S 2 (n − 1) S 2
IC ( ) = ; = 57,8351; 213,3154 = 7, 6049; 14, 6053
2
2
n −1; n −1;1− ( )
2 2
14) Têm-se os seguintes pesos, em gramas, de 10 pacotes postais remetidos por uma empresa:
46,4 46,1 45,8 47,0 46,1 45,9 45,8 46,9 45,2 46,0
Admitindo normal a distribuição dos pesos, determinar um intervalo de confiança de 95% para a
variância dos pesos de todos os pacotes expedidos pela empresa.
1− = 1 − 0, 025 = 0,975
2
2 = (219; 0,025)
= 19, 023 (pela Tabela 4)
n −1;
2
2
= (219; 0,975)
= 2, 7 (pela Tabela 3)
n −1; 1−( )
2
15
O intervalo de 95% de confiança para a variância populacional σ2 é dado por:
(n − 1) S 2 (n − 1) S 2 9 0, 286 9 0, 286
IC ( ) = 2 = = 0,135; 0,953
2
; 2 ;
n −1; 19, 023 2, 7
n −1;1−( )
2 2
(n − 1) S 2 (n − 1) S 2
IC ( ) = ; = 0,135; 0,953 = 0,367; 0,976
2
2
n −1; n −1;1− ( )
2 2
15) A altura dos alunos da UFGD apresenta uma distribuição aproximadamente normal. Para
estimar a altura média dessa população, foi observada a altura de 30 alunos, obtendo-se média de
175 cm e desvio padrão igual a 15 cm. Determine:
a. Um intervalo de confiança de 99% para a média populacional.
16
1−= 0,99 = 0,01 2 = 0, 005 Z = Z 0,005 = 2,57 (obtido pela Tabela 2 da
2
N(0,1)).
n = 30 x = 175 cm e S =15cm
S S S 15
IC(µ)= X − z /2 ; X + z 2 = X z 2 = 175 2,57 = 175 7, 0382
n n n 30
IC(µ)=[167,9618 cm; 182,0382 cm]
b. Um intervalo de confiança de 99% para a variância.
n −1;
2
2
= (229; 0,995)
= 13,121 (pela Tabela 3)
n −1; 1−( )
2
(n − 1) S 2 (n − 1) S 2 29 225 29 225
IC ( 2 ) = 2 ; 2 = ; = 126, 6751 cm 2 ; 497,2944 cm 2
n −1; 52,336 13,121
n −1;1−( )
2 2
16) Como parte de um levantamento sobre a qualidade da água, você testa a pureza da água em 19
córregos selecionados ao acaso, obtendo-se um desvio padrão de 15 grãos/litro. Construa um
intervalo de 99 % de confiança para a variância populacional e obtenha também um intervalo de
99% de confiança para o desvio padrão populacional.
17