Você está na página 1de 5

Prof.

Janete Pereira Amador 1

ESTIMAÇÃO DE PARÂMETROS
1 Introdução

O objetivo da Estatística é a realização de inferência acerca de uma população,


baseadas nas informações amostrais. Como as populações são caracterizados por medidas
numéricas descritivas, denominadas parâmetros, a inferência estatística diz respeito à
realização de inferência sobre esses parâmetros populacionais.
Os métodos utilizados para realização de inferências a respeito dos parâmetros
pertencem a duas categorias. Pode-se estimar ou prever o valor do parâmetro ou pode-se
tomar decisões relativas ao mesmo, através de um teste de hipótese.
A estimação é o processo que consiste em utilizar dados amostrais para estimar os
valores de parâmetros populacionais desconhecidos. Qualquer característica de uma
população pode ser estimada a partir de uma amostra aleatória. Entre as mais comuns,
estão a média, variância e proporção populacional.
A capacidade de estimar parâmetros populacionais por meio de dados amostrais
esta ligada diretamente ao conhecimento da distribuição amostral da estatística que esta
sendo usada como estimador.
.

Parâmetros ( θ ): são medidas populacionais quando se investiga a população em sua


totalidade, neste caso é impossível fazer inferências, pois toda a população foi investigada.
Estatísticas ou Estimadores ( ˆ ): são medidas obtidas da amostra, torna-se possível neste caso
utilizarmos as teorias inferências para que possamos fazer conclusões sobre a população.
Parâmetro (população) Estimador (amostra)
m = média x = média
s² = variância S² = variância
s = desvio padrão S = desvio padrão
 = Proporção P = proporção

A estimação de parâmetros pode ser feita por ponto e por intervalo. No primeiro
caso, a estimativa do parâmetro populacional é feita através de um único valor estimado,
ao passo que, no segundo, constroem-se intervalos de confiança, o qual deverá, com
probabilidade conhecida, conter o valor do parâmetro. Uma suposição fundamental é que o
processo de amostragem seja probabilístico.

2 Propriedades dos Estimadores

Cada parâmetro a ser estimado, poderá ter diferentes tipos de estimadores. Interessa,
evidentemente, escolher o “melhor” estimador. Qualifica-se com essa designação o
estimador que apresentar as seguintes propriedades.
a) Estimador não tendencioso (justo ou imparcial): Seja X uma variável aleatória
considerada na população, cuja distribuição de probabilidades dependa do parâmetro  e
 um estimador desse parâmetro. Diz-se que 
seja   é um estimador não tendencioso de 
se:
E( )  , isto é, se o valor médio do estimador for igual ao parâmetro.
Prof. Janete Pereira Amador 2

b) Estimador eficiente: Sejam   e  , dois estimadores de um mesmo parâmetro “  ”,


1 2

 será um estimador mais eficiente do que  se V (ˆ ) < V (ˆ ) , ou seja:


1 2 1 2

Quanto menor a sua variância mais eficiente será o estimador.


c) Estimador consistente ou coerente: um estimador  é um estimador consistente do
parâmetro  , se além de ser justo sua variância tende para zero quando “n” é
suficientemente grande ( n   ).
- Se E (ˆ)   , isto é,  é justo.
- Se lim n var(ˆ)  0 ,então, ˆ é um estimador consistente de 

3 Estimativas Pontuais e Intervalares

As estimativas dos parâmetros populacionais podem ser feitas através de estimação


pontual e estimação intervalar.

3.1 Estimativas pontuais

Estimativas pontuais são utilizadas quando a partir da amostra, procura-se obter um


único valor para o parâmetro. Uma estimativa por ponto é constituída por um valor
numérico simples. Por exemplo, X  30 é uma estimativa por ponto da média
populacional.
Seja X uma população com média  , desvio padrão  e com uma proporção  e
seja
(X1, X2, ..., Xn) uma amostra aleatória simples extraída desta população. Então:
X é um estimador não-tendencioso e consistente da média da população 
.
P é um estimador não-tendencioso e consistente da proporção populacional
.
S 2 é estimador não-tendencioso e consistente da variância da população
 2 a menos que a extração seja sem reposição de população finita. Neste
n

x - x
2
i
caso, o estimador é ŝ . Dado por:
2
i 1
sˆ 2 =
n 1
3.2 Estimativas por intervalo

A estimação por ponto é em geral insuficiente quando se quer determinar um dado


parâmetro. Isso decorre, porque a probabilidade de que a estimativa adotada venha
coincidir com o verdadeiro valor do parâmetro é, em geral, nula ou praticamente nula. Isso
se deve ao fato de que os estimadores são variáveis aleatórias, muitas vezes contínuas;
logo, as estimativas obtidas provavelmente serão distintas do valor do parâmetro. Ou seja,
é quase certo que esteja sendo cometido um erro de estimação, quando for utilizada a
estimação por ponto de um parâmetro populacional.
Devido a esse fato, surge a idéia de se construir um intervalo em torno da estimativa
por ponto, de modo que esse intervalo tenha uma probabilidade conhecida de conter o
verdadeiro valor do parâmetro. Esse intervalo é chamado de intervalo de confiança para
parâmetro em estudo.
Prof. Janete Pereira Amador 3

Nível de confiança ou grau de confiança : é a probabilidade (1 - ) de o intervalo de


confiança conter o verdadeiro valor do parâmetro, é expresso em porcentagem.
Intervalo de confiança: é um intervalo centrado na estimativa pontual, cuja
probabilidade de conter o verdadeiro valor do parâmetro é igual ao nível de confiança.
Alfa (): é a probabilidade de erro na estimação por intervalo, isto é a probabilidade de
se cometer um erro ao afirmar que o valor do parâmetro está contido no intervalo de
confiança.

A seguir serão vistos como construir intervalos de confiança para os parâmetros mais usuais.

3.2.1 Tipos de intervalo de confiança

Intervalo de confiança para a média populacional (  )


Caso I – Desvio padrão populacional conhecido
O intervalo de confiança para a média (  ) de uma população é construído em
torno da estimativa pontual X . Para construir este intervalo fixa-se uma probabilidade 1-
. de que o intervalo construído contenha o parâmetro populacional. Desta forma,  será a
probabilidade de que o intervalo obtido não contenha o valor do parâmetro, isto é,  será a
probabilidade de erro. Sabe-se que a média da amostra tem distribuição normal de média
 e desvio padrão 
n se a população de onde for extraída a amostra for normal (ou se
a amostra for superior a 30 e retirada de qualquer população) de média   e de desvio
padrão  , pode-se então utilizar a curva normal para estabelecer os limites para o
intervalo de confiança. Assim o intervalo de confiança (probabilidade) de 1-. para a
média de uma população é dado por:

P X  Z σ ;X  Z σ  , onde:
 α 2 n α 2 n
X é a estimativa por ponto da média da população.
 é o desvio padrão da população e
Z é o valor da distribuição normal padrão cuja área à direita é igual a 
2
2.

Ex: Uma amostra aleatória de 40 tambores de um produto químico, utilizado na produção


de adubos, tem peso médio de 115 kg e desvio padrão de 5,5 kg. Construa um intervalo de
confiança de 95 % para o peso dos tambores.
Solução:
n  40 Z  1,96
x  115 2
  5,5

P X  Z σ ;X  Z σ 
 α 2 n α 2 n
 5,5 5,5 
P 115  1,96  ;115  1,96  
 40 40 

 5,5 5,5 
P 115  1,96  ;115  1,96 
 6,324 6,324 
Prof. Janete Pereira Amador 4

P115  1,96  0,869;115  1,96  0,869 


P115  1,703;115  1,703
P113,297 kg ;116 ,703kg  , ou seja, pode-se afirmar com uma certeza de 95% de que este
intervalo conterá a média desta população (tambores de químico).

Caso II - Desvio padrão populacional desconhecido


Quando o desvio padrão da população (  ) é desconhecido é necessário utilizar sua
estimativa “S”. Só que ao substituir o desvio padrão populacional pela sua estimativa,.
torna-se necessário a introdução de uma correção, isso porque “S” é um estimador viciado
para  .Assim, a correção consiste em usar a variável t de Student ao invés de “Z” na
expressão Zα 2
σ sendo assim, têm-se t S .
n α2 n
Neste caso, o intervalo de confiança com probabilidade “1 -  “ para a média será:

PX  t S ;X  t S 
 α2 n α 2 n
onde:
X é a estimativa por ponto da média da população;
S é o desvio padrão da amostra e uma estimativa do desvio padrão da população  ;
t  2 é o valor da distribuição “t” cuja área à direita é igual a  /2, isto é, é o valor de “t”
tal que P(t  t  2 )   2 ou então P (t  2  t  t  2 )  1   .
Ex: Uma amostra de tamanho 25 foi retirada de uma população com o objetivo de estimar
a sua média e forneceu os valores X = 50 e s = 10. Qual o intervalo de 95% de confiança
para a média desta população?
Solução:
Tem-se 1 -  = 95%, então  = 5% e  /2 = 2,5%. O coeficiente de confiança que
deve ser buscado na distribuição t com  = n - 1 = 25 - 1 = 24. Esta é a linha da tabela. A
coluna poderá ser o valor  = 5% ou então o valor  /2 = 2,5%, dependendo do tipo de
tabela. Em qualquer caso o que se procura é o valor “t” com grau de liberdade igual a 24,
isto é, o valor t24 tal que:
P (t  2  t 24  t  2 )  95% este valor corresponde a 2,064. Então o intervalo de
confiança de 95% para média desta população será:
P  X  t
 α 2
S ;X  t
n α 2  
S  = 50  2,064 10 ;50  2,064 10 
n 5 5
 45,87;54,1 3 , ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo
conterá a média da população.

Convém notar que a última linha da tabela da distribuição “t” apresenta valores
coincidentes com aqueles que seriam obtidos se fosse utilizado a distribuição normal
padrão. Isto ocorre porque a distribuição “t” tende a distribuição normal à medida que o
tamanho da amostra aumenta, isto é, a distribuição normal é o limite da distribuição “t”
quando o tamanho da amostra tende ao infinito.
Esta aproximação já será bastante boa para amostras de tamanho n > 30. Assim se a
amostra for superior a 30 pode-se utilizar a distribuição normal ao invés da distribuição
“t”, isto é, pode-se ler os valores na normal padrão, ou então na última linha da tabela “t”.

Intervalo de confiança para a proporção ( )


Prof. Janete Pereira Amador 5

Seja p̂ 0 = proporção amostral que possui uma distribuição do tipo binomial, cuja média é
próprio parâmetro populacional  .
Desta forma o intervalo para proporção populacional será dado por

P pˆ 0  Z    pˆ  p  pˆ 0  Z    pˆ   1  
 2 2 

onde:
x
p̂0  e q̂0  1  p̂0
n
p̂0  q̂0
 p̂  é uma estimativa do erro padrão, isto é, do desvio padrão amostral.
n

Ex1: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua preferência
por determinado produto. Destas 400 pessoas, 240 disseram preferir o produto. Determinar
um intervalo de confiança de 95% de probabilidade para o percentual de preferência dos
consumidores em geral para este produto.
Solução:
Tem-se 1 -  = 95%, então  = 5% e  /2 = 2,5%. O coeficiente de confiança que deve
ser buscado na normal padrão é valor Zα 2 de Z tal que: P( Z  z 2 )  2,5%  1,96 .
A estimativa por ponto para proporção populacional será:
P  f n  240 / 400  0,60  60% . Então o intervalo de confiança de 95% para a proporção

populacional será: P pˆ 0  Z    pˆ  p  pˆ 0  Z    pˆ   1  


 2 2 
 0,60(1  0,60) 0,60(1  0,60)
0,60  1,96 ;0,60 1,96    60%  4,80%;60% 4,80% 
 400 400 
 55,20%;64,
80% , ou seja pode-se afirmar com uma certeza de 95% de que este intervalo
conterá a proporção populacional, isto é, a verdadeira percentagem dos consumidores que
preferem o produto pesquisado.
Ex2: Numa pesquisa de mercado para estudar a preferência da população de uma cidade
em relação ao consumo de um determinado produto, colheu-se uma amostra aleatória de
300 consumidores da cidade e observou-se que 180 consumiam o produto. Determinar
um IC de 99% para a proporção populacional de consumidores do produto.
Solução:
Tem-se 1 -  = 99%, então  = % e  /2 = 0,5%. O coeficiente de confiança que deve
ser buscado na normal padrão é valor Zα 2 de Z tal que: P ( Z  z 2 )  0,5%  2,575 .
A estimativa por ponto para proporção populacional será:
P  f n  180 / 300  0,60  60% . Então o intervalo de confiança de 99% para a proporção

populacional será: P pˆ 0  Z    pˆ  p  pˆ 0  Z    pˆ   1   =


 2 2 
 0,60(1  0,60) 0,60(1  0,60)
0,60  2,58 ;0,60  2,58    60%  7, 28%;60% 7, 28% 
 300 300 
[52,72%; 67,28%], ou seja pode-se afirmar com uma certeza de 99% de que este intervalo
conterá a proporção populacional, isto é, a verdadeira percentagem dos consumidores que
preferem o produto pesquisado.

Você também pode gostar