Você está na página 1de 8

UNIVERSIDADE POLITÉCNICA

APOLITECNICA

Escola Superior de Gestão, Ciências e Tecnologias


Probabilidade e Estatística Resumo teórico EC 1º Semestre de 2020

Tema 4: Teoria de estimação

Estimação pontual e por Intervalo de Confiança

Introdução

A maioria dos trabalhos em estatística é realizada com o uso de amostras aleatórias extraídas de uma
população, na qual se deseja fazer um determinado estudo.

A parte da estatística que procura deduzir informações relativas a uma população, mediante a utilização de
amostras dela extraídas, é denominada Inferência Estatística.

Um dos problemas da estatística é a estimativa de parâmetros populacionais (média, variância, proporção, etc),
mediante o uso de uma estatística amostral (média amostral, variância amostral, proporção amostral, etc).

A estimação é o processo que consiste em utilizar dados amostrais para estimar (ou prever) os valores de
parâmetros populacionais desconhecidos.Exemplo: A duração de vida media de um laptop de marca HP, Salário
médio dos funcionarios da LAM, etc

Estimativa Pontual

É a estimativa de um parâmetro populacional dada por um único número. Na estimativa pontual, raramente os
estimadores estatísticos coincidem com os valores populacionais. Assim, é importante delimitar a faixa de valores
onde o parâmetro populacional deve ser procurado. Isso ocorre através das estimativas intervalares.

Qualquer valor calculado com base nos elementos da amostra X 1 , X 2 , , X n :

T  f ( X1 , X 2 , , X n )
Temos então alguns estimadores pontuais:
1 n
X   Xi  a média da amostra
n i 1

1 n
S 
2

n  1 i1
( X i  X ) 2  a variância da amostra

O estimador pontual para p, também denominado proporção amostral, é definido como


x
ˆ
p
n
Sendo que x denota o número de elementos na amostra que apresentam a característica; n denota o tamanho da
amostra coletada.

Exemplo 1: Sejam, p: proporção de alunos da que foram ao teatro pelo menos uma vez no último mês, e X:
número de estudantes que respondem “sim” em uma pesquisa com n entrevistados. Suponha que foram
entrevistados n = 500 estudantes e que, desses 100 teriam afirmado que foram ao teatro pelo menos uma vez no
último mês. A estimativa pontual (proporção amostral) para p é dada por:

100
pˆ   0,20
500
ou seja, 20% dos estudantes entrevistados afirmaram que foram ao teatro pelo menos uma vez no último mês.
Note que, outra amostra de mesmo tamanho pode levar a uma outra estimativa pontual para p.

Propriedades de um bom estimador

I. Não viciado ou não viesado


II. Consistência
III. Estimador Eficiente ( Variância Mínima)
IV. Suficiente

Estimativa Intervalar

Essa estimativa consiste em uma amplitude (ou um intervalo) de valores, no qual se admite esteja o parâmetro
populacional.

Intervalo de Confiança

Um intervalo de confiança dá um intervalo de valores, centrado na estatística amostral, no qual julgamos, com um
risco conhecido de erro (ou nível de confiança), estar o parâmetro da população.

Grau ou Nível de Confiança (1 - ) - expressa a probabilidade de o intervalo de confiança conter o verdadeiro


valor do parâmetro populacional.

Intervalos de Confiança para a Média Populacional

Grandes Amostras (Distribuição Normal)

Quando utilizamos dados amostrais para estimar uma média populacional , a margem de erro (e – erro máximo
da estimativa) é a diferença máxima provável (com probabilidade 1 - ) entre a média amostral observada x e a
verdadeira média populacional . Assim:

 
 conhecido: x  z xz ;
n n
s s
 desconhecido e n grande (n>30): x  z xz
n n
s
E= z então, x  E    x  E
n

s s N n
Onde,  ( x )  quando População Infinita e  ( x )  quando a População Finita
n n N 1

 - média populacional; x - média da amostra;


z – número de desvios padrões utilizando a distribuição normal;
 - desvio padrão da população s – desvio padrão da amostra;
n – tamanho da amostra; N – tamanho da população.

Pequenas Amostras (Distribuição de Student (“t”))

A forma da distribuição t é bastante parecida com a normal. A principal diferença entre as duas distribuições é que
a distribuição t tem maior área nas caudas. Isto significa que, para um dado nível de confiança, o valor t será um
pouco maior que o correspondente valor z.

Propriedades da Distribuição t de Student

I. A distribuição t aproxima-se da distribuição normal à medida que “n” aumenta. Para n > 30 as diferenças são tão
pequenas que podemos utilizar os valores críticos z;
II. A distribuição t tem a mesma forma geral simétrica (forma de sino) que a distribuição normal, mas reflete a maior
variabilidade (com distribuições mais amplas) que é esperada em pequenas amostras.

Condições para utilização da Distribuição t de Student


i. 2 ou  é desconhecido
ii. O tamanho da amostra é pequeno (n ≤ 30)
iii. A população original tem distribuição essencialmente normal (Como a distribuição da população original em geral
é desconhecida, estimamo-la construindo um histograma de dados amostrais).
s s
Utilizando a distribuição t:: x  t    x t ;
n n
s
Seja E  t Então: xExE
n
s s N n
Onde, E  t quando População Infinita e E  t  quando a População Finita. Para usar uma
n n N 1
tabela t devemos conhecer o nível de confiança desejado, e o número de graus de liberdade ().
O número de graus de liberdade, para um conjunto de dados, corresponde ao número de valores que podem variar
após terem sido impostas certas restrições a todos os valores. Assim: g.l.=  = n – 1

Intervalo de Confiança para Variância

Há casos em que se está mais interessado na variância do que na média da amostra. Por exemplo, em filas de
espera. Mesmo conhecendo-se o tempo médio de espera, a informação do grau de variabilidade deste tempo é
importante. A distribuição usada neste caso é conhecida como Distribuição Qui-Quadrado, definida como:
(n  1) s 2
 2

2
A função densidade de probabilidade é apresentada na Figura 1, como função do grau de liberdade, e
calculada por:
 2
1 1 
f ( 2 )   ( 2 ) 2 e 2
para 0 < 2 < ∞
2 ( )
2
2
A distribuição de probabilidade da distribuição qui-quadrado é dada por:
 2
1 1 
P(  i2 )  P(  2  i2 )   ( d ( 2 )
2 2 2
 ) e
2 2 ( )
2
Devido à dificuldade de se calcular esta integral, tabelas são dadas em anexo para P(  2 ). Se
P(  2  i2 ) =0.95, então P(  2  i2 ) =0.05. Para o caso de ν=6, tem-se:
0.05  P(  2  1.635)
0.95  P(  2  12.592)
Assim, tem-se que há 90% (95 - 5) de probabilidade de  2 estar entre 1,635 e 12,592.

(n  1) s 2 (n  1) s 2
Formula para intervalo de confiança para uma Variância: 2 
2   2
(1 ) ( )
2 2
Intervalo de Confiança para Proporções

Seja a estatística a proporção de “sucessos” em uma amostra de tamanho n  30 extraída de uma população
binomial. Se: n  30; n  p  5 e n  q  5

Pode-se utilizar a distribuição normal para a estimação do Intervalo de Confiança:

pˆ (1  pˆ )
Como: E  Z  para População Infinita e
n
pˆ (1  pˆ ) N n
E  para População Finita
n N 1

pˆ (1  pˆ ) pˆ (1  pˆ )
Então: pˆ  E  P  pˆ  E ou pˆ  Z   P  pˆ  Z 
n n
P – proporção de sucessos na população;
p̂ – proporção de sucessos na amostra;
z – número de desvios padrões utilizando a distribuição normal;
(1- p̂ ) = q : proporção de fracassos na amostra;
n – tamanho da amostra;
N – tamanho da população.

Exemplo 2: A altura dos alunos de uma academia apresenta uma distribuição aproximadamente normal. Para
estimar a altura média dessa população, foi observada a altura de 30 alunos, obtendo-se x =175 cm e s=15 cm.
Determine:
a) Um intervalo de confiança de 99% para a média populacional.
b) Um intervalo de confiança de 99% para a variância.
c) Um intervalo de confiança de 99% para o desvio-padrão populacional.
s
a) Para encontrarmos o erro, utilizamos a fórmula: E  Z  , pois n ≥ 30 e   s .
n

λ = 99%, então ZC=2,575 (vide tabela). n=30 s=15 cm.

15
E  2,575   7,05 .
30

O intervalo de confiança é dado por: x  E    x  E

175 - 7,05 <  < 175 + 7,05  167,95 <  <182,05 .

Valores de Z para Grau ou nivel de confiança mais usados no intervalo de confiança:

Grau de confiança Valor de


λ = (1 – α) Z tabelado
90% 1,645
95% 1,96
99% 2,575

Portanto, com 99% de confiança (λ), podemos dizer que a média populacional está entre 167,95 cm e 182,05 cm.

b) Intervalo de confiança para uma Variancia

(n  1) s 2 (n  1) s 2
2  onde n  30 e s  15
 (2 1 )  (2 2 )

Para um nível de confiança de 99% (λ =0,99) e amostra n=30, temos:

1   1  0,99
1    0,005 (coluna na tabela  2 )
2 2
1   1  0,99
2    0,995 (coluna na tabela  2 )
2 2
Grau de liberdade=n-1=30-1=29 (linha na tabela  2 ) Logo, o valor de  (2 1 ) =52,336.
Grau de liberdade=n-1=30-1=29 (linha na tabela  2 ) Logo o valor de  (2 2 ) = 13,121.

.
Para encontrarmos um intervalo de confiança para a variância, utilizamos a fórmula:

(n  1) s 2 (n  1) s 2
2  onde n  30 e s  15
 (2 1 )  (2 2 )
 (2 1 )  52,336 e  (2 2 )  13,121
(30  1)  152 (30  1)  152
2 
52,336 13,121
124,68   2  497,29

Portanto, com 99% de confiança, podemos dizer que a variância populacional está entre 124,68 cm 2 e 497,29 cm2.
Para encontrarmos um intervalo de confiança para o desvio-padrão populacional, utilizamos a fórmula:

(n  1) s 2 (n  1) s 2
  
 (2 1 )  (2 2 )

124,68    497,29

11,17    22,3

Portanto, com 99% de confiança, podemos dizer que o desvio-padrão populacional está entre 11,17 cm e
22,3 cm.

Exemplo 3: Uma amostra de tamanho 36 de uma população normal produz X =32,8 e s = 4,51. Construa um intervalo de
95% de confiança para a média populacional.
Dados : n  36 x  32,8 s  4,51   95%  Z ( 0,975)  1,96
s s
   x  Z ( 0,975)
x  Z ( 0,975)
n n
4,51 4,51
 32,8  1,96     32,8  1,96 
36 36
32,8  1,473267    32,8  1,473267

31,32673   34,27327  Ic  (95%) : (31,3267 ; 34,27327)


Exemplo 4: : Se na amostra com tamanho igual ao obtido em (a), observou-se que 55% dos eleitores eram
favoráveis ao candidato, construa um intervalo de confiança para a proporção de eleitores do candidato com
coeficiente de confiança de 0,95.
Temos que: n = 4096 p̂ =0,55 λ = 0,95

Logo, pela tabela da distribuição Normal Padrão, temos que z é tal que ф(z)=0,975, portanto, z =1,96.

pˆ (1  pˆ ) pˆ (1  pˆ )
pˆ  Z   P  pˆ  Z 
n n

0,55  (1  0,55) 0,55  (1  0,55)


0,55  1,96   P  0,55  1,96 
4096 4096

0,55  0,0152  P  0,55  0,0152

0,5348  P  0,5652  IC P (95%) : 0,5348; 0,5652

Exemplo 5. Foram seleccionados aleatoriamente e pesquisados 500 universitários. Verificou-se que 150 deles têm
computadores pessoais.
a) Determine a estimativa pontual da verdadeira proporção de universitários que têm computadores pessoais.
x 150
n  500 x  150  pˆ    0,3
n 500

b) Com um grau de confiança de 95% determine o intervalo de confiança da verdadeira proporção de todos os
universitários que têm computadores pessoais e interprete o seu resultado.

pˆ (1  pˆ ) 0,3  (1  0,3)
pˆ  E    pˆ  E onde E  z   1,96 
(1 ) n 500
2

0,3 - 0,040168  P  0,3  0,040168


 Ic P (95%) : 0,259832 ; 0  ,
0,259832  P  0,340168
Ficha de Exercício n0 6

1. Numa amostra aleatória de 900 adultos, 80% são a favor do controle de armas de fogo, com uma margem de
erro de ±4 pontos percentuais para um intervalo de confiança de 95%. Indique se as seguintes interpretações são
verdadeiras ou falsas:
c) O intervalo de 76 a 84 porcento refere-se a todos valores possíveis da percentagem amostral.
d) O intervalo de 76 a 84 porcento refere-se a todos valores possíveis da percentagem populacional de todos os
adultos.
e) A verdadeira percentagem populacional está entre 76 e 84 percentagem.
f) A longo termo, uma série de intervalos semelhantes a este pode falhar incluir a percentagem populacional cerca
de 5% de vezes.
g) Na prática, nunca sabemos se o intervalo de 76 a 84 porcento é verdadeiro ou falso.

2. Um comprador de tijolos acha que a qualidade dos tijolos está diminuendo, isto é, a resistência média ao
desmoronamento de tais tijolos esta diminuir. Uma amostra de 100 tijolos, escolhidos ao acaso, forneceu uma
média de 195kg e com um desvio padrão de 10kg.
a) Ao nível de confiança de 95%, construa um intervalo de confiança para a média populacional
b) Ao nível de confiança de 95%, construa uma intervalo de confiança para a variancia populacional.
c) considera-se a resistência média ao desmoronamento de tais tijolos é igual a 200kg. que conclusão o intervalo em
“a” permite chegar?

3. Relacionam-se a seguir os valores do consumo de energia eléctrica (em kWh) numa residência durante nove
anos diferentes: 13 11 10 9 9 10 11 8 7
a) Determine a estimativa pontual da média e da variancia; Resposta: ( X = 9,8 e s = 1,79 ).
b) Ao nivel de confiança de 95% construa uma intervalo de confiança para a média populacional;
Resposta: Dados : n  9 x  9,8 s  1,79   95%  t (8, 0,05)  2,306
s s 1,79 1,79
x t    x t  9,8  2,306     9,8  2,306 
n n 9 9
9,8  1,376    9,8  1,376
8,424    11,176  Ic  (95%) : [8,424 ; 11,176]
c) Ao nivel de confiança de 95% construa uma intervalo de confiança para a variança populacional.

4. Suponha que estejamos interessados em estimar a percentagem de consumidores de certo produto. Se a


amostra de tamanho 300 forneceu 100 indivíduos que consomem o dado produto.
a) Determine a estimativa pontual;
b) Determine o intervalo de confiança da proporção de pessoas que consomem o produto, com um nivel de
confiança de 95% (interprete o resultado).
5. Uma amostra aleatória de 400 domicílios mostra-nos que 25% deles são casas de aluguel. Com um nível de
confiança de 90%, diga qual é o intervalo de confiança da proporção de casas de aluguel?

Você também pode gostar