Você está na página 1de 23

Probabilidades e Estatstica D

Probabilidades e Estatstica
Estatstica
Maria de Fatima Miguens
Ano Lectivo 2011/2012
Conte udo
1 Inferencia Estatstica 4
1.1 Introdu cao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Populacao e amostra aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Populacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2 Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Estimacao Pontual 8
2.1 Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Exemplo de estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Estima cao pontual do valor medio = E (X) da populacao X . . . . . . . . . . . . . . 10
2.4 Metodos para determinacao de estimadores . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4.1 Metodo dos momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4.2 Metodo da maxima verosimilhan ca . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5 Propriedades dos estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5.1 Distribui cao de amostragem de um estimador . . . . . . . . . . . . . . . . . . . 19
2.5.2 Enviesamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.3 Eciencia e erro quadr atico medio . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.4 Propriedades de

X, S
2
e

P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1
Lista de Tabelas
2.1 Tabela de estimadores para o valor medio, variancia, desvio padr ao e propor cao . . . . 22
2
Lista de Figuras
1.1 Fun cao de probabilidade da populacao e da amostra . . . . . . . . . . . . . . . . . . . 6
3
Captulo 1
Inferencia Estatstica
1.1 Introdu cao
A area de estudo sobre inferencia estatstica consiste no conjunto de metodos utilizados para que
seja possvel tomarmos decis oes ou retirarmos conclus oes acerca de uma popula cao. Este metodos
utilizam a informa cao contida numa amostra seleccionada da populacao.
A inferencia estatstica pode ser dividida em duas grandes areas: estimacao de par ametros e testes
de hip oteses. Como exemplo de um problema sobre estima cao de parametros, suponhamos que um
engenheiro pretende analisar a resistencia de uma componente usada no chassis de um autom ovel.
Uma vez que e natural que a resistencia seja variavel de componente para componente, isto devido a
diferen cas que podem ocorrer nos materiais e no processo de fabrico de cada componente assim, como
nos metodos de leitura da respectiva resistencia, o engenheiro esta apenas interessado em estimar a
resistencia media deste tipo de componentes. Na pratica, o engenheiro ir a utilizar os dados de uma
amostra de resistencias para calcular um n umero que de algum modo ser a um valor razo avel (ou uma
predi cao) da verdadeira resistencia media. Este n umero e denominado estimativa pontual. Veremos
mais tarde que e possvel estabelecer a precis ao desta estimativa.
Consideremos a situacao em que duas diferentes temperaturas de reaccao, digamos t
1
e t
2
, podem
ser utilizadas num processo qumico. Um engenheiro conjectura que com t
1
produzir a maiores resul-
tados que com t
2
. O teste de hipoteses estatsticas e uma ferramenta que permite resolver quest oes
deste tipo. Neste caso, a hipotese ser a que o resultado medio quando usada a temperatura t
1
e maior
que o resultado medio quando usada a temperatura t
2
. Repare que nao e dado enfase ` a estima cao dos
resultados; em vez disso, a atencao e dirigida para a conclus ao que se pode retirar acerca da hipotese
formulada sobre os resultados medios.
Comecemos por denir amostra aleatoria, conceito fundamental na inferencia estatstica. Mais
tarde veremos o conceito de estimador e estimativa de um parametro, e nalmente iremos calcular a
precis ao da estimativa de um parametro usando um intervalo de conanca.
1.2 Populacao e amostra aleat oria
1.2.1 Populacao
Exemplo 1.1 Consideremos o conjunto de alunos da FCT/UNL e a informa cao acerca do ano de
licenciatura em que encontram. Admitamos que 40% dos alunos est ao no 1
o
ano, 30% est ao no 2
o
ano, 20% no 3
o
ano e 10% no 4
o
ano. Se formos escolher um aluno ao caso e registarmos o seu
4
1. Inferencia Estatstica 5
ano de licenciatura, ent ao podera ocorrer um valor X =ano de licenciatura, com a seguinte funcao de
probabilidade
X
_
1 2 3 4
0.4 0.3 0.2 0.1
Se o objectivo for estudar o ano de licenciatura em que se encontram os alunos da FCT/UNL, esse
objectivo consiste em estudar a v.a. X.
Esse estudo podera consistir na estimacao da funcao de probabilidade de X ou, por exemplo, na
estimacao do ano esperado de licenciatura de um aluno, ou na estimacao do desvio padr ao de X, ou
na estimacao do ano de licenciatura em que se encontram pelo menos 80% dos alunos, etc.
No fundo o estudo incide sobre a v.a. X ou seja sobre a popula cao X de ano de licenciatura dos
alunos da FCT/UNL.
Denicao 1.1 Uma populacao consiste na totalidade das observa coes do fen omeno em estudo.
Em cada problema, a populacao pode ser pequena, grande ou innita. O n umero de observa coes
na populacao e designado por dimensao da popula cao. Por exemplo, o n umero de garrafas nao com-
pletamente cheias produzidas por dia numa companhia de refrigerantes e uma populacao nita. As
observa coes obtidas por medicao do nvel di ario de monoxido de carbono e uma populacao innita.
A estatstica dedica-se ao estudo da populacao, ou seja ao estudo da reparti cao de probabilidades
dos seus valores. Se representarmos por X o conjunto dos valores da populacao, estudar X ser a
estudar a sua reparti cao de probabilidades, portanto ser a estudar as caractersticas probabilsticas de
uma v.a. X, ou melhor dizendo ser a estudar a distribuicao de uma v.a. X.
Esse estudo poder a passar pela estima cao da propria fun cao de distribuicao de X, ou pelo estudo
do valor do parametro de uma certa fun cao de distribuic ao que se admite ser a mais correcta para X.
Por exemplo, um engenheiro pode considerar que a populacao das resistencias de um elemento
do chassis tem distribuicao normal com valor medio e variancia
2
. (Quando consideramos este
pressuposto, dizemos que temos uma popula cao normal ou uma populacao normalmente distribuda.)
O seu objectivo e agora estimar a resistencia media desse elemento do chassis.
1.2.2 Amostra
Na maioria da situacoes, e impossvel ou impraticavel observar a totalidade da popula cao. Por
exemplo, nao poderamos estudar a resistencia do elemento do chassis, considerando toda a popula cao,
porque isso seria demasiado demorado e dispendioso. Alem do mais, alguns (por ventura todos) desses
elementos nao existiriam ainda, no momento em que queremos tirar uma conclus ao acerca da sua
resistencia media.
Portanto, vamos apenas seleccionar alguns elementos da populacao, e com o estudo das carac-
tersticas destas observa coes, tirar ilaccoes sobre as caractersticas de toda a populacao.
Ficamos dependentes de um conjunto de observa coes da populacao, para podermos tomar decis oes
acerca dessa mesma populacao.
Denicao 1.2 Uma amostra e um conjunto de observa coes seleccionadas ao acaso de uma pop-
ula cao.
Exemplo 1.2 Admitamos que para estudar X =ano de licenciatura dos alunos da FCT/UNL, se
recolheu uma amostra de anos de licenciatura de 50 alunos. Destes, 22 est ao no 1
o
ano, 14 no 2
o
1. Inferencia Estatstica 6
ano, 10 no 3
o
ano e 4 no 4
o
ano. O conjunto de frequencias relativas desta amostra constitui uma
estimativa da funcao de probabilidade de X.
Valores amostrais 1 2 3 4 Total
Frequencia absoluta 22 14 10 4 50
Frequencia relativa 0.44 0.28 0.20 0.08 1.00
Se f ossemos analisar a totalidade dos alunos da FCT/UNL, obteramos
X
_
1 2 3 4
0.4 0.3 0.2 0.1
Figura 1.1: Fun cao de probabilidade da populacao e da amostra
Para que as nossas inferencias sejam v alidas, a amostra deve ser representativa da popula cao.

E por vezes tentador, seleccionar as observa coes de um modo que seja comodo ou aplicar criterios
na sua escolha. Estas atitudes podem introduzir uma tendencia na amostra provocando estimativas
sub-avaliadas ou sobre-avaliadas. Para evitar estes problemas, e desejavel seleccionar uma amostra
aleatoria de acordo com um mecanismo de escolha ao acaso. Assim sendo, a selec cao de uma amostra
deve ser resultado de uma experiencia aleatoria e cada observa cao dessa amostra e ent ao um valor ob-
servado de uma variavel aleatoria. O modo como se distribuem as observa coes na populacao determina
a fun cao de distribuicao desta variavel aleatoria.
Exemplo 1.3 Se de facto a funcao de probabilidade de X e
X
_
1 2 3 4
0.4 0.3 0.2 0.1
ent ao sera escolhido um aluno de 1
o
ano com probabilidade 0.4, um aluno do 2
o
ano com probabilidade
0.3, etc.
Importa agora falarmos do conceito de amostra aleatoria. Para denirmos uma amostra aleatoria,
seja X uma variavel aleatoria que representa o resultado da selec cao de uma observa cao da popula cao.
Seja F a fun cao de distribuicao de X. Suponhamos que cada observa cao da amostra e obtida de
modo independente, e nas mesmas condicoes. Isto e, as observa coes da amostra sao obtidas como
se observ assemos X, independentemente e sob as mesmas condicoes, por n vezes. Seja X
i
a variavel
aleatoria que representa a i-esima replica. Ent ao X
1
, X
2
, . . . , X
n
constituem uma amostra aleatoria e
1. Inferencia Estatstica 7
os valores que se obtem por concretizacao desta amostra aleatoria sao representados por x
1
, x
2
, . . . , x
n
.
As variaveis aleatorias que constituem a amostra aleatoria sao independentes e tem todas a mesma
fun cao de distribuicao F, uma vez que se admite que cada observa cao da amostra e obtida nas mesmas
condicoes.
Exemplo 1.4 Se no estudo de X = ano de licenciatura dos alunos da FCT/UNL, optassemos por
seleccionar uma amostra de 3 alunos, ent ao X
1
representa o ano de licenciatura do 1
o
aluno que
viermos a seleccionar. Claro que, se a funcao de probabilidade de X for
X
_
1 2 3 4
0.4 0.3 0.2 0.1
ent ao este o ano de licenciatura deste 1
o
aluno ter a funcao de probabilidade
X
1
_
1 2 3 4
0.4 0.3 0.2 0.1
O ano de licenciatura do 2
o
aluno que viermos a seleccionar ter a funcao de probabilidade
X
2
_
1 2 3 4
0.4 0.3 0.2 0.1
e o ano de licenciatura do 3
o
aluno que viermos a escolher ter a funcao de probabilidade
X
3
_
1 2 3 4
0.4 0.3 0.2 0.1
Se a escolha destes 3 alunos for perfeitamente casual, ent ao X
1
, X
2
e X
3
s ao v.a.s independentes
e todas igualmente distribudas.
Admitamos que, apos a escolha dos alunos, se observaram os valores x
1
= 2, x
2
= 1 e x
3
= 1. Isto
signica que a amostra aleatoria (X
1
, X
2
, X
3
) foi concretizada na amostra observada (x
1
, x
2
, x
3
) =
(2, 1, 1).
Denicao 1.3 As vari aveis aleatorias (X
1
, X
2
, . . . , X
n
) constituem uma amostra aleatoria de di-
mens ao n, se
(a) X
1
, X
2
, . . . , X
n
s ao vari aveis aleatorias independentes;
(b) X
1
, X
2
, . . . , X
n
s ao vari aveis aleatorias com a mesma funcao de distribuicao.
Captulo 2
Estimacao Pontual
2.1 Estatsticas
Muitas vezes o prop osito da recolha da amostra consiste em obtermos informa cao acerca do valor
dos parametros da distribuicao da populacao, caso tenham valor desconhecido. Essa informa cao e
obtida por estima cao dos parametros, ou seja pela utilizacao de estatsticas adequadas ao tipo de
parametros em causa.
Por exemplo, o engenheiro ao considerar que a populacao das resistencias de um elemento do
chassis tem distribuicao normal, so pretende saber algo acerca da resistencia media do elemento do
chassis, por isso so pretende estimar o valor medio desta distribuicao normal. Precisa neste caso de
uma estatstica para estimar .
Suponhamos, por exemplo, que pretendemos chegar a uma conclus ao acerca da propor cao de
pessoas em Portugal que preferem, uma marca de refrigerante, em particular. Representemos por
p o valor desconhecido desta propor cao. Sendo impraticavel interrogar todos os portugueses para
determinarmos o verdadeiro valor de p, vamos inferir o seu valor ` a custa de uma amostra (de tamanho
conveniente) e usando a propor cao observada p, de pessoas que nesta amostra preferem aquela marca
de refrigerante.
A propor cao amostral, p, e calculada dividindo o n umero total de indivduos da amostra que
preferem a marca de refrigerante, pelo total de indivduos na amostra (dimensao da amostra). Assim
sendo, p e uma fun cao dos valores observados na amostra. Mas como e possvel seleccionar muitas e
variadas amostras de uma populacao, o valor de p poder a variar de amostra para amostra. Isto e, p e
uma variavel aleatoria a que se da o nome de estatstica.
Denicao 2.1 Uma estatstica e uma funcao das vari aveis de uma amostra aleatoria.
Veremos mais tarde, outros exemplos importantes de estatsticas. Uma vez que uma estatstica e
uma variavel aleatoria, necessariamente ter a uma fun cao de distribuicao. A essa fun cao de distribuicao
e dado o nome de distribui cao de amostragem da estatstica. A nocao de distribuicao de amostragem
e muito importante e ser a abordada em todos os captulos e sec coes futuras.
Uma aplicacao muito importante da estatstica consiste na estimacao pontual de parametros tais
como o valor medio de uma populacao ou como a variancia de uma populacao. Quando se discutem
problemas de inferencia estatstica sobre parametros de uma populacao e conveniente representar de
um modo especial esses mesmos parametros. Como tal e usual represent a-los por uma letra grega.
Por exemplo, para o valor medio de uma populacao, para o desvio padr ao de uma popula cao.
O objectivo da estima cao pontual de um parametro , consiste na atribui cao de um valor numerico,
8
2. Estima cao Pontual 9
baseado na informa cao da amostra, que seja um valor plausvel para o parametro . Esse valor
numerico ser a usado como estimativa pontual do parametro.
Em geral, se X e uma populacao com fun cao de distribuicao F, caracterizada por um parametro
de valor desconhecido, e se X
1
, X
2
, . . . , X
n
e uma amostra aleatoria de dimens ao n da popula cao X,
ent ao a estatstica

= h(X
1
, X
2
, . . . , X
n
) e denominada estimador pontual de . Repare que

e uma
variavel aleatoria, porque e fun cao de variaveis aleatorias. Ap os uma amostra ter sido seleccionada,

toma um valor numerico particular



chamado estimativa pontual de .
Denicao 2.2 Uma estimativa pontual do par ametro de uma popula cao e um unico valor numerico

de uma estatstica

.
Exemplo 2.1 Regressemos ao exemplo do ano de licenciatura dos alunos da FCT/UNL.
Suponhamos que queramos saber qual o ano medio de licenciatura em que se encontram estes
alunos.
Se analisassemos toda a popula cao, saberamos que X tem funcao de probabilidade
X
_
1 2 3 4
0.4 0.3 0.2 0.1
e portanto saberamos que
= E (X) = 1 0.4 + 2 0.3 + 3 0.2 + 4 0.1 = 2
o
ano
Mas de facto, o que conhecemos e a amostra
Valores amostrais 1 2 3 4 Total
Frequencia absoluta 22 14 10 4 50
Como tal podemos, quando muito apresentar uma estimativa pontual de , usando a estatstica
X =
1
n
n

i=1
X
i
.
x =
1
50
50

i=1
x
i
=
1
50
(1 22 + 2 14 + 3 10 + 4 4) =
96
50
= 1.92 ano
2.2 Exemplo de estatsticas
De entre os muitos parametros que caracterizam uma popula cao, ou dito de outra forma, que
caracterizam a fun cao de distribuicao da variavel aleatoria X que representa uma populacao, os mais
comuns sao os parametros que correspondem ao valor medio e ` a variancia da populacao (ou de X).
Por esta razao, apresentamos os estimadores mais comuns (e melhores de acordo com certos criterios
estatsticos fora do nosso ambito de estudo) para o valor medio e para a variancia de uma popula cao.
Consideremos (X
1
, X
2
, . . . , X
n
) uma amostra aleatoria de X.
Estimador do valor medio de uma popula cao X
X =
1
n
n

i=1
X
i
=
X
1
+X
2
+. . . +X
n
n
2. Estima cao Pontual 10
Estimador da variancia
2
de uma popula cao X
S
2
=
1
n 1
n

i=1
_
X
i
X
_
2
=
_
X
1
X
_
2
+
_
X
2
X
_
2
+. . . +
_
X
n
X
_
2
n 1
que tambem pode ser escrito e calculado por
S
2
=
1
n 1
__
n

i=1
X
2
i
_
nX
2
_
=
1
n 1
_
_
X
2
1
+X
2
2
+. . . +X
2
n
_
nX
2
_
Estimador do desvio padrao de uma popula cao X
S = +

S
2
As estimativas pontuais destes parametros, representar-se- ao por x, s
2
e s, respectivamente.
Estimador da propor cao (ou probabilidade) p de realizacao de um acontecimento A
Se numa amostra de dimensao n, se observa K vezes o acontecimento A, o estimador de p e

P =
K
n
2.3 Estimacao pontual do valor medio = E (X) da populacao X
Admitamos que a populacao X tem um valor medio = E (X) (desconhecido) e uma variancia

2
= V (X). Face a uma amostra aleatoria (X
1
, X
2
, . . . , X
n
) da populacao X, podemos estimar o valor
medio atraves do estimador
X =
1
n
n

i=1
X
i
=
X
1
+X
2
+. . . +X
n
n
.
Contudo os valores de X dependem directamente da amostra aleatoria (X
1
, X
2
, . . . , X
n
). AssimX e
uma variavel aleatoria e portanto sofrera de uma certa variabilidade.

E desejavel que essa variabilidade
seja pequena de modo a que tenhamos algumas garantias de que os valores das estimativas de , X,
nao se afastem muito do verdadeiro valor de .
Para medirmos a variabilidade de uma qualquer variavel aleatoria j a sabemos que podemos usar
a variancia dessa mesma variavel aleatoria. Assim para medirmos a variabilidade de X, podemos
considerar a sua variancia, V
_
X
_
, que passamos a determinar.
Se (X
1
, X
2
, . . . , X
n
) e a amostra aleatoria que nos dara a informa cao para o calculo de X, ent ao
sabemos que X
1
, X
2
, . . . , X
n
sao variaveis aleatorias independentes e todas com a mesma distribuicao,
distribuicao essa que ser a a distribuicao da populacao X em estudo.
Assim sendo, sabemos que X
1
, X
2
, . . . , X
n
sao variaveis aleatorias independentes e todas com o
mesmo valor medio E (X
i
) = E (X) = e a mesma variancia V (X
i
) = V (X) =
2
. Como tal
V
_
X
_
= V
_
1
n
n

i=1
X
i
_
=
1
n
2
n

i=1
V (X
i
) =
1
n
2
n

i=1

2
=
n
2
n
2
=

2
n
.
Consequentemente, a variabilidade de X e dada por
2
/n.
Quando pretendemos dar a conhecer a precis ao associada a um determinado estimador, devemos
indicar a variabilidade desse estimador, mas essa variabilidade deve ser expressa na mesma escala
2. Estima cao Pontual 11
de medicao que a associada ao estimador. Por exemplo, se estamos a estimar a altura media dos
habitantes de um pas e a escala de medicao escolhida sao centmetros, ent ao a indicacao sobre a
variabilidade das estimativas da altura media tambem deve ser fornecida em centmetros. Em resumo,
a variabilidade de um estimador deve ser expressa atraves do desvio padr ao desse estimador, e a que
se da o nome de erro padr ao do estimador e se representa por SE.
No caso do estimador X do valor medio da populacao X, a precis ao deste estimador e dada pelo
respectivo erro padr ao, ou seja por
SE = +
_
V
_
X
_
= +
_

2
n
=

n
.
Se a variancia da populacao
2
= V (X) tiver um valor desconhecido, nao podemos conhecer o
valor do erro padr ao. Neste caso, podemos aceder a um valor estimado do erro padr ao, substituindo

2
pelo seu estimador S
2
, e obter desta maneira o erro padr ao estimado, SE

SE

=
S

n
.
Sobre o estimador X do valor medio , ter a ainda interesse saber algo sobre o seu valor medio.
Determinemos ent ao o valor medio de X.
E
_
X
_
= E
_
1
n
n

i=1
X
i
_
=
1
n
n

i=1
E (X
i
) =
1
n
n

i=1
=
n
n
= .
Este resultado permite-nos dizer que se consider assemos todas as amostras de dimens ao n que e
possvel seleccionar de uma populacao, e para cada uma delas determin assemos a respectiva media, o
conjunto formado pelos valores de todas essas medias tem um ponto de equilbrio que coincide com o
ponto de equilbrio da populacao (e que sabemos ser = E (X)).
Exemplo 2.2 O n umero de defeitos num painel met alico usado na constru cao de autom oveis tem
distribuicao de Poisson. Seleccionada uma amostra do n
o
de defeitos em 10 paineis, obteve-se os
seguintes valores: (2, 7, 15, 8, 7, 6, 3, 7, 3, 4).
Se pretendermos estimar o par ametro da distribuicao da popula cao, como sabemos que esta e
Poisson e o par ametro da distribui cao de Poisson coincide com o valor medio desta distribui cao,
ent ao o problema resume-se `a estimacao do valor medio da popula cao.
Assim, para a amostra obtida, a estimativa do par ametro ser a:
x =
2 + 7 + 15 + 8 + 7 + 6 + 3 + 7 + 3 + 4
10
=
62
10
= 6.2
ou seja, estimamos que seja de 6.2 o n
o
medio de defeitos por painel.
Quanto ao erro padr ao da nossa estimativa, como a vari ancia da popula cao e desconhecida, quando
muito podemos adiantar um erro padr ao estimado.
A vari ancia amostral, e calculavel por
10

i=1
x
2
i
= 2
2
+ 7
2
+ 15
2
+ 8
2
+ 7
2
+ 6
2
+ 3
2
+ 4
2
= 510
s
2
=
1
10 1
_
510 10 6.2
2
_
=
125.6
9
= 13.95555(5)
2. Estima cao Pontual 12
pelo que o erro padr ao estimado e de
SE

= +
_
s
2
10
= 1.181336343.
Podemos interpretar estes resultados, dizendo que o n
o
medio de defeitos por painel e estimado em
6.2 com uma margem de erro de mais ou menos 1 defeito por painel.
2.4 Metodos para determinacao de estimadores
2.4.1 Metodo dos momentos
Denicao 2.3 Dada uma popula cao X e r N, dene-se momento centrado de ordem r, por

r
= E [(X E (X))]
r
, r N.
(Repare que
1
= E [(X E (X))]
1
= E (X) E (X) = 0)
Dada uma amostra aleatoria (X
1
, X
2
, . . . , X
n
) da populacao X, para estimador de
r
considere-se
M
r
=
1
n
n

i=1
_
X
i


X
_
r
, r N
designado por momento amostral centrado de ordem r.
Se X e uma populacao cuja distribuicao depende de k parametros,
1
,
2
, . . . ,
k
, o seu valor medio
E (X) e os seus momentos centrados sao fun cao destes k parametros:
E (X) =
1
(
1
,
2
, . . . ,
k
) ,
r
=
r
(
1
,
2
, . . . ,
k
) , r = 2, 3, . . . .
O metodo dos momentos consiste em:
A Construrmos um sistema de k equacoes onde igualamos aqueles momentos da popula cao aos
respectivos estimadores,
_

_
E (X) =

X

2
= M
2

3
= M
3
.
.
.

k
= M
k

1
(
1
,
2
, . . . ,
k
) =

X

2
(
1
,
2
, . . . ,
k
) = M
2

3
(
1
,
2
, . . . ,
k
) = M
3
.
.
.

k
(
1
,
2
, . . . ,
k
) = M
k
B Resolvermos o sistema de equacoes em ordem as incognitas
1
,
2
, . . . ,
k
.
Admitindo que o sistema tem uma unica solucao, digamos

1
,

2
, . . . ,

k
, dizemos que

1
,

2
, . . . ,

k
sao os estimadores dos momentos dos parametros
1
,
2
, . . . ,
k
, respectivamente.
Propriedade de invariancia dos estimadores dos momentos: Se

e um estimador dos momentos


de e h() e uma fun cao biunvoca de , ent ao h(

) e um estimador dos momentos de h().


2. Estima cao Pontual 13
Exemplo 2.3 Seja (X
1
, X
2
, . . . , X
n
) uma amostra aleatoria de uma popula cao X com distribui cao
U (a, b). Determinemos os estimadores de momentos a

e b

, dos par ametros a e b.


Como sabemos, se X U (a, b), ent ao E (X) =
a +b
2
e
2
= V (X) =
(b a)
2
12
. Assim
_
E (X) =

X
V (X) = M
2

_
a+b
2
=

X
(ba)
2
12
= M
2

_
a =

X

3 M
2
b =

X +

3 M
2
Repare que M
2
=
1
n
n

i=1
_
X
i


X
_
2
=
n 1
n
1
n 1
n

i=1
_
X
i


X
_
2
=
n 1
n
S
2
.
Os estimadores de momentos para a e b s ao, respectivamente
_

_
a

=

X
_
3 (n 1)
n
S
b

=

X +
_
3 (n 1)
n
S
.
2.4.2 Metodo da maxima verosimilhanca
O metodo da maxima verosimilhan ca da origem a estimadores com mais qualidade do que os esti-
madores dos momentos. Contudo e frequente os dois metodos possibilitarem os mesmos estimadores.
Para a explanacao deste metodo e obrigatorio conhecer a fun cao de verosimilhan ca e entender o
seu signicado.

E tambem necess ario entender o prncipio associado a este metodo. Neste sentido,
comecamos por explorar um exemplo.
Exemplo 2.4 Considere X e uma popula cao com distribuicao Binomial de par ametros (2, 1/4). A
sua funcao de probabilidade e:
X
_
0 1 2
9
16
6
16
1
16
Assim podemos dizer que ao seleccionarmos uma observa cao de X, o valor mais provavel de ser obtido
e x = 0.
Suponhamos agora que a probabilidade de sucesso, , pode assumir valores = 1/4 ou = 1/2.
No quadro seguinte apresentamos a funcao de probabilidade de X para os dois valores de :
x 0 1 2
P (X = x| = 1/4)
9
16
6
16
1
16
P (X = x| = 1/2)
1
4
1
2
1
4
Quando se selecciona uma observa cao de X e o resultado e x = 1, partindo do princpio de que se
obtem este valor porque e o mais provavel de ser observado, ent ao dever a ser igual a 1/2 porque
P (X = 0 | = 1/2) > P (X = 0 | = 1/4) .
Admitamos por m que a probabilidade de sucesso e e que n ao se conhece o seu valor. X ter a
distribuicao Binomial de par ametros (2, ) e a sua funcao de probabilidade e
f (x|) = P (X = x|) =
_
2
x
_

x
(1 )
2x
, x = 0, 1, 2, 0 < < 1.
2. Estima cao Pontual 14
Se novamente obtivermos x = 1 na seleccao de uma observa cao de X, e repetindo o princpio de que
se obtem este valor porque e o mais provavel de ser observado, ent ao dever a ser o valor que torna
m axima a
P (X = 1 |) = 2 (1 ) , 0 < < 1.
Como
d
d
2 (1 ) = 0 2 (1 2) = 0 = 1/2 e
d
2
d
2
2 (1 ) = 4 < 0, ent ao P (X = 1 |)
tem valor m aximo para = 1/2.
Continuemos a considerar o caso da probabilidade de sucesso ter um valor desconhecido e admi-
tamos que se selecciona uma amostra de duas observa coes de X. Sendo (X
1
, X
2
) a amostra aleatoria
associada e se a amostra observada foi (2, 1), ent ao a sua probabilidade de realizacao e
L(; (2, 1)) = P (X
1
= 2; X
2
= 1 |) = P (X
1
= 2 |) P (X
2
= 1 |)
. .
porque X
1
e X
2
sao independentes
=
= P (X = 2 |) P (X = 1 |)
. .
porque X
1
e X
2
tem a mesma diistribui c ao que X
= f (2 |) f (1 |) =
=
2
..
P(X=2| )
2 (1 )
. .
P(X=1| )
= 2
3
(1 )
A funcao L(; (2, 1)) e designada por funcao de verosimilhan ca da amostra (2, 1).
Mantendo o prncipio de que a amostra (2, 1) foi seleccionada por ser a mais provavel, ent ao o
valor de sera o valor que corresponde ao m aximo da funcao de verosimilhan ca da amostra (2, 1).
Teremos ent ao de determinar o valor de que satisfaz:
max
0<<1
L(; (2, 1)) = max
0<<1
2
3
(1 ) .
Uma vez que
d
d
L(; (2, 1)) = 0
d
d
2
3
(1 ) = 0 2
2
(3 4) = 0 = 3/4 e que
d
2
d
2
L(; (2, 1))

=3/4
< 0, ent ao = 3/4.
Generalizemos agora este exemplo e consideremos que se seleccionam ao acaso e com reposicao n
observa coes da popula cao X B(2, ). Sendo (X
1
, X
2
, . . . , X
n
) a amostra aleatoria associada a essas
2. Estima cao Pontual 15
seleccoes, a probabilidade de ser observada a amostra (x
1
, x
2
, . . . , x
n
) e:
L(; (x
1
, x
2
, . . . , x
n
)) = P (X
1
= x
1
; X
2
= x
2
; . . . ; X
n
= x
n
|) =
= P (X
1
= x
1
|) P (X
2
= x
2
|) . . . P (X
n
= x
n
|)
. .
porque X
1
,...X
n
sao independentes
=
= P (X = x
1
|) P (X = x
2
|) . . . P (X = x
n
|)
. .
porque X
1
,...X
n
tem a mesma diistribui c ao que X
=
=
n

i=1
f (x
i
|) =
n

i=1
_
2
x
i
_

x
i
(1 )
2x
i
=
=
n

i=1
_
2
x
i
_
n

i=1

x
i
n

i=1
(1 )
2x
i
=
n

i=1
_
2
x
i
_

n
i=1
x
i
(1 )

n
i=1
2x
i
=
considerando x =
1
n
n

i=1
x
i
=
n

i=1
_
2
x
i
_

nx
(1 )
n(2x)
Assim, a funcao de verosimilhan ca de uma amostra (x
1
, x
2
, . . . , x
n
) da popula cao X B(2, ) e:
L(; (x
1
, . . . , x
n
)) =
n

i=1
_
2
x
i
_
. .
AA((x
1
,...,x
n
))

nx
(1 )
n(2x)
, 0 < < 1, x
i
{0, 1, 2} , i = 1, . . . , n
= A
nx
(1 )
n(2x)
, 0 < < 1, x
i
{0, 1, 2} , i = 1, . . . , n
Pelo prncipio da m axima verosimilhan ca, a amostra (x
1
, . . . , x
n
) foi observada por ser a mais
provavel. O valor de que permitiu que ela fosse a mais provavel e, o valor de que maximiza a
funcao de verosimilhan ca de uma amostra (x
1
, x
2
, . . . , x
n
). Assim, ter a um valor
0
tal que:
L(
0
; (x
1
, . . . , x
n
)) = max
0<<1
L(; (x
1
, . . . , x
n
))
Recorrendo aos conhecimentos de An alise Matematica,
0
ser a o valor de que satisfaz:
d
d
L(; (x
1
, . . . , x
n
)) = 0, 0 < < 1 e
d
2
d
2
L(
0
; (x
1
, . . . , x
n
)) < 0
Contudo, a funcao de verosimilhan ca da amostra (x
1
, x
2
, . . . , x
n
) n ao e mais do que um produto
de termos n ao negativos, pelo que
L(; (x
1
, . . . , x
n
)) =
n

1=1
P (X = x
i
|) =
n

i=1
f (x
i
|) > 0, 0 < < 1, x
i
{0, 1, 2} , i = 1, . . . , n
Pela monotonia da funcao logaritmo neperiano e porque o logaritmo do produto ser igual ` a soma
dos logaritmos, encontrar o valor de que maximiza L(; (x
1
, . . . , x
n
)) e equivalente a determinar o
valor de que maximiza a funcao log-verosimilhn ca da amostra (x
1
, . . . , x
n
),
l (; (x
1
, . . . , x
n
)) = ln L(; (x
1
, . . . , x
n
)) = ln
_
n

1=1
P (X = x
i
|)
_
= ln
_
n

1=1
f (x
i
|)
_
=
=
n

i=1
ln f (x
i
|),
2. Estima cao Pontual 16
isto e, o valor
0
tal que:
d
d
l (; (x
1
, . . . , x
n
)) = 0, 0 < < 1 e
d
2
d
2
l (
0
; (x
1
, . . . , x
n
)) < 0
Seguem-se os calculos para este exemplo:
L(; (x
1
, . . . , x
n
)) =
n

i=1
_
2
x
i
_
. .
AA((x
1
,...,x
n
))

nx
(1 )
n(2x)
, 0 < < 1, x
i
{0, 1, 2} , i = 1, . . . , n
= A
nx
(1 )
n(2x)
, 0 < < 1, x
i
{0, 1, 2} , i = 1, . . . , n
l (; (x
1
, . . . , x
n
)) = ln L(; (x
1
, . . . , x
n
)) = ln A+nxln +n(2 x) ln (1 )
d
d
l (; (x
1
, . . . , x
n
)) = 0
nx


n(2 x)
1
= 0 =
x
2
d
2
d
2
l (
0
; (x
1
, . . . , x
n
)) = n
_
x

2
+
2 x
(1 )
2
_

=
x
2
< 0
Para uma amostra (x
1
, . . . , x
n
), o valor que maximiza a funcao de verosimilhan ca e
0
=
x
2
.
Para uma amostra aleatoria (X
1
, . . . , X
n
) da popula cao X B(2, ) o estimador de m axima
verosimilhan ca de e

=
X
2
, com X =
1
n
n

i=1
X
i
.
Fun cao de verosimilhanca
Passamos agora a apresentar a denicao de fun cao de verosimilhan ca.
Denicao 2.4 (Funcao de verosimilhanca)
Seja X uma popula cao cuja distribui cao depende do conhecimento do valor de um par ametro . Para
uma amostra aleatoria (X
1
, X
2
, . . . , X
n
) da popula cao X, a funcao de verosimilhan ca de uma amostra
observada (x
1
, x
2
, . . . , x
n
) e:
L(; (x
1
, . . . , x
n
)) =
n

i=1
f (x
i
|)
sendo:
1. f (x|) = P (X = x|), a funcao de probabilidade de X quando X e uma popula cao discreta;
2. f (x|) a funcao densidade de probabilidade de X, quando X e uma popula cao absolutamente
contnua.
2. Estima cao Pontual 17
Exemplo 2.5 Considere X uma popula cao com distribuicao N (, 4). Relembre que a funcao densi-
dade associada `a distribui cao de X e:
f (x|) =
1
2

2
e

1
4
(x)
2
, R, x R.
Para uma amostra (x
1
, x
2
, . . . , x
n
) de X,
L() L(; (x
1
, . . . , x
n
)) =
n

i=1
f (x
i
|) =
n

i=1
1
2

2
e

1
4
(x
i
)
2
=
=
_
1
2

2
_
n
e

1
4

n
i=1
(x
i
)
2
, R, x
i
R, i = 1, . . . , n.
Vimos tambem no exemplo 2.4, a import ancia da fun cao log-verosimilhan ca. Assim,
Denicao 2.5 (Funcao de log-verosimilhanca)
Seja X uma popula cao cuja distribui cao depende do conhecimento do valor de um par ametro . Para
uma amostra aleatoria (X
1
, X
2
, . . . , X
n
) da popula cao X, a funcao de log-verosimilhan ca de uma
amostra observada (x
1
, x
2
, . . . , x
n
) e:
l (; (x
1
, . . . , x
n
)) = ln L(; (x
1
, . . . , x
n
)),
denida para os valores L(; (x
1
, . . . , x
n
)) > 0.
Exemplo 2.6 Na continuacao do exemplo 2.5,
l () l (; (x
1
, . . . , x
n
)) = ln
_
1
2

2
_
n
e

1
4

n
i=1
(x
i
)
2
, R, x
i
R, i = 1, . . . , n
= nln
_
2

2
_

1
4
n

i=1
(x
i
)
2
, R, x
i
R, i = 1, . . . , n.
Estimador de maxima verosimilhanca
Seja X uma populacao cuja distribuicao depende de um parametro com valor desconhecido.
Ao seleccionarmos n observacoes (ao acaso e com reposi cao) de X, com resultados (x
1
, . . . , x
n
), a
fun cao de verosimilhan ca desta amostra e:
L(; (x
1
, . . . , x
n
)) =
n

i=1
f (x
i
|)
e corresponde `a:
1. probabilidade da amostra aleatoria (X
1
, . . . , X
n
) da populacao X se concretizar na amostra
(x
1
, . . . , x
n
);
2. fun cao densidade conjunta da amostra aleatoria (X
1
, . . . , X
n
) da populacao X para a amostra
observada (x
1
, . . . , x
n
).
2. Estima cao Pontual 18
O prncipio da maxima verosimilhan ca estabelece que a amostra (x
1
, . . . , x
n
) e a mais prov avel de
ser observada pelo que devera ter um valor que corresponda ao m aximo de L(; (x
1
, . . . , x
n
)).
Assim, encontrar o estimador de m axima verosimilhan ca de ser a determinar o valor

de que
torna maxima a fun cao de verosimilhan ca, para qualquer amostra (X
1
, . . . , X
n
).
A fun cao de verosimilhan ca, L(; (x
1
, . . . , x
n
)), devera ser encarada como fun cao de e, caso
admita derivada para todos os valores de , encontrar o seu m aximo corresponde a determinar o valor

0
que satisfaz:
d
d
L(; (x
1
, . . . , x
n
)) |
=
0
= 0 e
d
2
d
2
L(; (x
1
, . . . , x
n
)) |
=
0
< 0 (2.4.1)
No nal deste processo,
0
ser a fun cao da amostra (x
1
, . . . , x
n
), isto e
0
= T (x
1
, . . . , x
n
).
O estimador de maxima verosimilhan ca de e ent ao

= T (X
1
, . . . , X
n
).
Para efeitos praticos, e uma vez que a fun cao logaritmo e uma aplicacao monotona crescente, o
processo 2.4.1 de determinacao do maximo da fun cao de verosimilhan ca e equivalente ao processo de de-
termina cao do maximo da fun cao log-verosimilhan ca. Assim, poderemos calcular
0
= T (x
1
, . . . , x
n
),
resolvendo:
d
d
l (; (x
1
, . . . , x
n
)) |
=
0
= 0 e
d
2
d
2
l (; (x
1
, . . . , x
n
)) |
=
0
< 0 (2.4.2)
apos o que,

= T (X
1
, . . . , X
n
) e estimador de m axima verosimilhan ca de .
Exemplo 2.7 Na continuacao dos exemplos 2.5 e 2.6, se tiver valor desconhecido e quisermos
encontrar o seu estimador de m axima verosimilhan ca, seguem-se os calculos necess arios:
l () = nln
_
2

2
_

1
4
n

i=1
(x
i
)
2
, R, x
i
R, i = 1, . . . , n.
d
d
l () =
1
2
n

i=1
(x
i
) =
n
2
(x ) , com x =
1
n
n

i=1
x
i
d
d
l () = 0
n
2
(x ) = 0 = x
d
2
d
2
l () =
n
2
< 0
O estimador de m axima verosimilhan ca de e = X, sendo X =
1
n

n
i=1
X
i
.
Observa coes:
1. Caso a fun cao de verosimilhan ca, L(; (x
1
, . . . , x
n
)) (ou a fun cao de log-verosimilhan ca,
l (; (x
1
, . . . , x
n
))) nao tenha derivada para todos os valores de , o seu m aximo ter a de ser
determinado por uma analise que nao envolva a sua derivada.
2. Propriedade de invariancia dos estimadores de m axima verosimilhan ca: Se

e o estimador de
maxima verosimilhan ca de e h() e uma fun cao biunvoca de , ent ao h
_

_
e o estimador de
maxima verosimilhan ca de h().
2. Estima cao Pontual 19
2.5 Propriedades dos estimadores
Ja atr as foi dito que, se X e uma populacao com fun cao de distribuicao F, caracterizada por um
parametro de valor desconhecido, e se X
1
, X
2
, . . . , X
n
e uma amostra aleatoria de dimens ao n desta
populacao X, ent ao a estatstica

= h(X
1
, X
2
, . . . , X
n
) e denominada estimador pontual de . Repare
que

e uma variavel aleatoria, porque e fun cao de variaveis aleatorias. Ap os uma amostra ter sido
seleccionada,

toma um valor particular

chamado estimativa pontual de .
Sendo

uma variavel aleatoria, ter a uma distribuicao.
2.5.1 Distribuicao de amostragem de um estimador
Denicao 2.6 A distribui cao de um estimador pontual

e designada por distribuicao de amostragem.
Exemplo 2.8 Admita que a popula cao X descreve o n umero di ario de contas a prazo contratualizadas
num determinado Banco. Se admitirmos que X P () e que queremos estimar o n umero medio
E (X) = de contas contratualizadas diariamente, propondo

= X =
1
n

n
i=1
X
i
como estatstica de
avaliacao do valor de E (X) = , a distribuicao de amostragem de

e:
P
_

= y
_
= P
_
X = y
_
= P
_
1
n
n

i=1
X
i
= y
_
= P
_
n

i=1
X
i
= ny
_
=
= e
n
(n)
ny
ny!
, ny N
0
.
porque

n
i=1
X
i
P (n).
Exemplo 2.9 Admita que a popula cao X descreve a largura (em mm) de uma tablete de chocolate
produzida na f abrica Cho. Se admitirmos que X N (, 4) e que queremos estimar a largura media
E (X) = das tabletes de chocolates produzidas na f abrica Cho, propondo = X =
1
n

n
i=1
X
i
como estatstica de afericao do valor de E (X) = , a distribuicao de amostragem de e expressa
pela sua distribui cao. Sendo (X
1
, . . . , X
n
) uma amostra aleatoria de X N (, 4), ent ao = X =
1
n

n
i=1
X
i
N
_
,
4
n
_
.
Resumindo, a distribui cao de amostragem de e: N
_
,
4
n
_
.
Como

tem uma distribuicao, podemos falar do E
_

_
, medida que indica a localizacao do ponto
de equilbrio da distribuicao, da V
_

_
e do desvio padr ao
_

_
, quantidades estas que expressam
a dispers ao de

.
Estas medidas permitem estabelecer propriedades importantes para o estimador

.
2. Estima cao Pontual 20
2.5.2 Enviesamento
O estimador

para o parametro e considerado um bomestimador se o valor que se espera
que ele produza coincidir com o verdadeiro valor de . Dito de outro modo,

e bomestimador de
theta se E
_

_
= .
Denicao 2.7 Um estimador

para o par ametro diz-se centrado (ou n ao enviesado) se E
_

_
= .
Denicao 2.8 O enviesamento de um estimador

para o par ametro e bias
_

_
= E
_

_
.
Exemplo 2.10 Suponhamos que X e uma popula cao com distribuicao exponencial de par ametros
(, 1) em que tem valor desconhecido.
Dada uma amostra aleatoria (X
1
, X
2
, . . . , X
n
) desta popula cao, considerem-se os dois estimadores
para :

= min (X
1
, X
2
, . . . , X
n
) e

=

X 1
e analisemos o respectivo enviesamento. Como

E
_
,
1
n
_
:
E
_

_
= E (min (X
1
, X
2
, . . . , X
n
)) = +
1
n
E (

) = E
_

X 1
_
= E (X) 1 = + 1 1 =
Relativamente ao enviesamento,

e um bomestimador porque e centrado.


O enviesamento de

e bias
_

_
= +
1
n
=
1
n
.
2.5.3 Eciencia e erro quadratico medio
O estimador

para o parametro , ser a tanto melhorquanto menor for a sua dispers ao em
torno do verdadeiro valor de , isto e quanto menor for E
_
_

_
2
_
.
Dena-se ent ao,
Denicao 2.9 O erro quadratico medio do estimador pontual

do par ametro , e
EQM
_

_
= E
_
_

_
2
_
.
Teorema 2.1 Se

e um estimador do par ametro ,
EQM
_

_
= V
_

_
+
_
E
_

_
2
.
2. Estima cao Pontual 21
Demonstracao:
EQM
_

_
= E
_
_

_
2
_
= E
_
_

E
_

_
+E
_

_
2
_
=
= E
_
_

E
_

__
2
_
. .
V (

)
+
_

_
E
_

. .
bias(

)
_

_
2
+ 2E
_

_
_

E
_

___
E
_

_
. .
bias(

)
_

_
=
= V
_

_
+bias
2
_

_
+ 2
_

_
E
_

_
E
_

_
. .
=0
_

_
bias
_

_
=
= V
_

_
+bias
2
_

_
= V
_

_
+
_
E
_

_
2
Se o estimador

do parametro for um estimador centrado, isto e se E
_

_
= , ent ao
EQM
_

_
= E
_
_

_
2
_
= E
_
_

E
_

__
2
_
= V
_

_
.
pelo que, ele ser a tanto melhorquanto menor for a sua variancia.
Se o estimador

e estimador enviesado do parametro , isto e se E
_

_
= , ent ao
EQM
_

_
= E
_
_

_
2
_
= V
_

_
+
_
E
_

_
2
.
pelo que, ele ser a tanto melhorquanto menor for o seu erro quadr atico medio.
Face a dois estimadores, nao necess ariamente centrados, devemos optar pelo que apresenta menor
erro quadr atico medio, pelo que
Denicao 2.10 Dados dois estimadores

e

para o mesmo par ametro , dizemos que



e melhor
que

se,
EQM
_

_
< EQM (

) .
Quando temos dois estimadores sao centrados, o seu enviesamento e nulo, e ent ao a compara cao
do seu erro quadr atico medio acaba por ser a comparacao da sua variancia.
Denicao 2.11 Dados dois estimadores centrados

e

para o mesmo par ametro , dizemos que

e mais eciente que

se,
V
_

_
< V (

) .
Denicao 2.12 Se

e estimador de , o seu erro padr ao e
SE
_

_
=
_
V
_

_
.
2. Estima cao Pontual 22
Exemplo 2.11 Na continuacao do exemplo 2.10,
EQM (

) = V (

) = V
_
X 1
_
= V
_
X
_
=
V (X)
n
=
1
n
EQM
_

_
= V
_

_
+bias
2
_

_
=
1
n
2
+
1
n
2
=
2
n
2
Para n 3, o estimador

e melhordo que o estimador

porque EQM
_

_
< EQM (

).
2.5.4 Propriedades de

X, S
2
e

P
Apresentamos na tabela abaixo, os estimadores mais usados para o valor medio, variancia e pro-
por cao, indicando tambem os respectivos valores medios e variancias.
Tabela 2.1: Tabela de estimadores para o valor medio, variancia, desvio padr ao e propor cao
Par ametro Estimador Valor medio Variancia do
do estimador estimador


E
_

_
V
_

_
= E (X)

X =
1
n
n

i=1
X
i


2
n

2
= V (X) S
2
=
1
n 1
n

i=1
_
X
i


X
_
2

2

4
n
_

n 3
n 1
_
p = P (A) p =
k
n
p
p (1 p)
n

4
e o coeciente de curtose que tem o valor 3 para a distribuicao normal.