Você está na página 1de 132

1

Problema de estimacin:

Por qu una encuesta de 1500 personas permite predecir
bastante bien el resultado de una eleccin con 10 millones de
votantes? Cmo se consigue? Cmo se mide la precisin del
resultado?

Problema de test de hiptesis:

Las normas de calidad exigen que, en un lote de 5000 bombillas,
a lo sumo el 3% pueden durar menos de 1000 horas.
En un estudio de control de calidad de una fabrica de bombillas
sera muy costoso examinar cada una. Se decide usar una muestra
de 500 bombillas. Si obtenemos el 3,2% de bombillas defectuosas,
deberamos declarar el lote completo defectuoso?

2
Problema de estimacin:

Se busca precisar una caracterstica totalmente
desconocida de la poblacin a partir de los datos
obtenidos sobre una muestra.

Estimar el porcentaje de la poblacin (7 millones) que
votar por explotar el Yasuni a partir de una muestra de 1500
votantes.

O estimar la duracin promedio de las bombillas del lote
de 5000, a partir de una muestra de 500.

3


Problema de test de hiptesis:

Se busca comprobar alguna informacin sobre la
poblacin a partir de los datos obtenidos de una
muestra.

Aprueba el Yasuni obtendr ms del 65% de los votos.

Menos del 3% de las bombillas del lote de 5000 duran
menos de 1000 horas.

Las bombillas duran ms de 1000 horas en promedio.

Estimacin de Parmetros
Parmetros poblacionales y Estadsticos Muestrales
UMSNH -
FIE
Datos
(Poblacin de Inters)
Muestras
-4 -2 0 2 4
0
20
40
60
80
100
120
140
160
Histograma de la Poblacion
Clases
F
r
e
c
u
e
n
c
i
a
-4 -2 0 2 4
0
2
4
6
8
10
12
14
16
Histograma de la Muestra
Clases
F
r
e
c
u
e
n
c
i
a
Parmetros:
Media ()
Varianza(o
2
)
Desv. Est. (o)
Etc.
Estadsticos:
Promedio ( )
Varianza muestral(S
2
)
Desv. Est. muestral(S)
Etc.
Inferencias
Muestreo
X
Estimacin de Parmetros
Ejemplo: Estimacin de la media de una poblacin
UMSNH -
FIE
Estimador: La media muestral ( ) que se calcula a partir de una muestra de
N datos como sigue:
X
) x ... x (x
N
1
N 2 1
____
X
+ + + =
Parmetro que se pretende estimar : La media de la poblacin ( ) que en
general no se conoce, no se puede conocer, o se conoce slo un valor terico:
El estimador (en el ejemplo la media muestral) puede tomar diferentes
valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es
decir, el estimador es una variable aleatoria
Es natural preguntarse : Cul ser la distribucin de probabilidad del
estimador? De hecho cules sern sus parmetros? tendrn que ver con los
de la poblacin?
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
UMSNH -
FIE
Estimador: La media muestral ( ) X ) x ... x (x
N
1
N 2 1
____
X
+ + + =
Poblacin de inters : El conjunto de datos obtenidos al lanzar un dado legal
en diversas ocasiones
Parmetro de inters : La media () de la poblacin
Experimento aleatorio : Lanzar un dado
Variable aleatoria X= nmero obtenido en la cara superior
Espacio muestral = {1, 2 , 3, 4, 5 , 6}
Distribucin de la variable aleatoria X: Uniforme
Media terica: =3.5
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
UMSNH -
FIE
Distribucin de la variable aleatoria (X) del experimento
Funcin de Probabilidad: f(x) = P(X=x)
x 1 2 3 4 5 6
f(x) 1/6 1/6 1/6 1/6 1/6 1/6
1 2 3 4 5 6
0
0.05
0.1
0.15
0.2
x
f
(
x
)

Funcin de Probabilidad

Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
UMSNH -
FIE
Distribucin del estadstico .
Muestra
x
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9
x
10
1 1 3 5 1 1 2 2 4 2 2 2.1
2 1 5 3 6 3 3 6 4 2 5 3.8
3 6 1 5 3 5 4 5 3 2 2 3.2
4 2 5 2 4 1 5 3 6 6 4 3.8
5 3 6 5 4 5 4 3 2 3 4 3.7
... ...
X
X
X
Cada muestra puede considerarse como:
10 valores de la variable aleatoria X,
1 slo valor para 10 variables aleatorias X
1
,X
2
,...,X
10
Diferentes clculos de para N=10:
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
UMSNH -
FIE
Distribucin del estadstico . X
X Si obtenemos 1000 muestras, obtendremos 1000 valores de , para
estos 1000 valores realizamos el histograma:
1 2 3 4 5 6
0
0.05
0.1
0.15
0.2
0.25
X
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a

Distribucin de la media muestral
Estimacin de Parmetros
En general: un estadstico que pretende estimar un parmetro
u es una v. a. Que depende de las N variables aleatorias que
forman una muestra, es decir
UMSNH -
FIE
O
^
O
^
= f(X
1
,X
2
,...,X
N
)
As, una muestra es un conjunto de valores (x
1
,x
2
,...,x
N
) tomados
por las variables aleatorias (X
1
,X
2
,...,X
N
).
O
^
u
^
u
^
Es natural suponer que la distribucin f(X
i
)=P(X
i
=x
i
) de cada
variable de la muestra es igual a la de la poblacin
Sin embargo, la distribucin f( ) = P( = ) del estadstico
como se vi en el ejemplo del dado es otra cosa.
Estimacin de Intervalos
En la explicacin previa, un estimador produce un valor
que pretende aproximar a un parmetro u. A este enfoque se le
llama estimacin puntual
UMSNH -
FIE
O
^
En el enfoque de estimacin de intervalos, para un parmetro u
no se estima un valor, sino un intervalo de la forma l s u s u,
donde los valores extremos l, u dependen del valor numrico del
estadstico para una muestra en particular y de la distribucin
de muestreo de
O
^
u
^
u
^
Es decir, l,u dependen de la muestra, por lo tanto son valores de
variables aleatorias L, U
Estimacin de Intervalos
Partiendo de la distribucin de muestreo para , es posible
determinar valores de L,U tales que se cumpla lo siguiente:
UMSNH -
FIE
P(L s u s U) =1 o
Donde 0 < o < 1
Es decir, se puede garantizar con una probabilidad de 1-o que
la muestra elegida contendr el valor verdadero de u
O
^
Al intervalo resultante l s u s u se le conoce como el intervalo
de confianza del 100(1 o) para el parmetro desconocido u
Estimacin de Intervalos
Ejemplo: Construccin repetida de un intervalo de confianza
para la media :
UMSNH -
FIE
Si los intervalos de confianza mostrados son del 95% significa
que si se construye un gran nmero de ellos, el 95% de ellos
contendr a la media

Estimacin de Intervalos
En la prctica se obtiene solamente una muestra y se calcula con
ella un intervalo de confianza dicho intervalo contiene o no
contiene a , no es razonable asignar una probabilidad a este
evento.
UMSNH -
FIE
La proposicin a decuada es que el intervalo contiene a con
una confianza del 95%
La longitud del intervalo de confianza (u-l) es una medida de la
calidad de la informacin obtenida en la muestra, al semi
intervalo u-u, o u-l se le llama Precisin del estimador.
Qu significado tiene un intervalo grande?
s deseable que sea grande o que sea pequeo?
Qu relacin tiene con el valor de 1-o?
Propiedades de los estimadores

una comparacin
Cuatro tiradores han efectuado 10 disparos sobre una diana. Si traducimos cada disparo en una
estimacin, efectuada por un determinado estimador, sobre una muestra, podemos interpretar las
propiedades de los estimadores de la siguiente forma:
Estimador insesgado
y no eficiente
Estimador sesgado
y no eficiente
Estimador sesgado
y eficiente
Estimador insesgado
y eficiente
16
Sea un estadstico ( funcin de la muestra ) que
utilizamos para estimar el valor de .
Observa que el estadstico:

es una funcin que depende de la muestra y lo
llamaremos estimador. El valor concreto de es la
estimacin.
Hay dos tipos bsicos de estimacin: puntual y por
intervalo de confianza.

Sea una caracterstica, un parmetro poblacional
cuyo valor se desea conocer a partir de una muestra.
u
Estimacin
u

u
) ,..., , (

2 1 n
X X X T = u
u

17
-Estimacin puntual

Provee un solo valor, un valor concreto para la estimacin.
Un estimador puntual es simplemente un estadstico
(media aritmtica, varianza, etc.) que se emplea para
estimar parmetros (media poblacional, varianza
poblacional, etc.).
Por ejemplo, cuando obtenemos una media aritmtica a
partir de una muestra, tal valor puede ser empleado como
un estimador para el valor de la media poblacional.
Algunos autores comparan los estimadores con los
lanzamientos en una diana: el crculo central sera el valor
real del parmetro.

18

Hablaremos de nivel de confianza 1- cuando en el intervalo se
encuentre el valor del estimador con probabilidad 1-.

Observa que la probabilidad de error (no contener al parmetro) es .

En general el tamao del intervalo disminuye con el tamao muestral y
aumenta con 1-.

En todo intervalo de confianza hay una noticia buena y otra mala:
La buena: hemos usado una tcnica que en % alto de casos acierta.
La mala: no sabemos si ha acertado en nuestro caso.
-Por intervalo

Determina dos valores (lmites de confianza) entre
los que acepta puede estar el valor del estimador.
19
Mtodos de estimacin puntual
Mtodo de los momentos
Mtodo de mxima verosimilitud
Hemos visto que un estimador de la media poblacional es
la media muestral y de la varianza poblacional es la cuasivarianza
muestral. Pero, cmo determinar un estimador cuando no
se trata de la media o la varianza?
Por ejemplo, supongamos una poblacin con funcin densidad:
0 , 0
) 1 (
) (
1
> >
+
=
+
u
u
u
x
x
x f
Cmo estimar
el parmetro ?
Momentos (K. Pearson)
| |

= =
r
i r
r
x
n
m X E
1
La idea es simple. Consiste en
igualar los momentos de la
poblacin y de la muestra
Mxima Verosimilitud
Consideremos X = (X
1
, X
2
,..., X
n
) m.a. f ( x , u ). Se
llama funcin de verosimilitud a:


Adems se define:
+ funcin soporte:

+ funcin score:

El valor (vector) de u que maximiza se llama
estimador mximo verosimil, i.e.

(caso univariado)

( ) ( ) ( )
[
=
= =
n
i
i
x f x f
1
0
u u u , ,
( ) ( ) | | u u ln = L
( )
u
u
c
cL
( ) ( ) | | u u L
( ) ( )
0 0
2
2
<
c
c
. =
c
c
u
u
u
u L L
Propiedades de los Estimadores
Mximo Verosmiles
Los estimadores mximo verosmiles son:

Asintticamente insesgados
Asintticamente normales
Asintticamente eficientes
Invariantes bajo transformaciones biunvocas
Si - estimador suficiente, es suficiente

MV
u

Sea X
1
, X
2
,..., X
n
m.a. N ( , o
2
).
Encontrar el EMV de



( ) ( )

=
2
2
2 2
2
1
2

o
o o
i X
X
n
L ln ,
( ) | |
( )
(


=
2
2
2
1
2
2 2

o
o o
i
X
n
X
e ,
( )
|
|
|
.
|

\
|

=
4
2
2
2
0
0
S
n
S
n
S X H ,
( )
2
o u , =
( )
2
2 2
0
n
n
X
S X L = . = = V o o
, ,
,
En general:



( )
( )
( )
( )
|
|
|
|
.
|

\
|

=
|
|
|
|
|
.
|

\
|
c
c
c c
c
c
c
=

6
2
4
4 2
2
2
2
2
2
2
2
2
1
2 o

o
o

o
o
o
o
i
X
n
X n n
L
L L
H ,


:= Matriz de Informacin de Fisher
esperada.

:= Matriz de Informacin observada
en la muestra.
( ) | |
2
o , H E
( )
2
S X H ,
( ) u IE
( ) u IO
OBS: Caso u escalar



Se dice que es un
estimador eficiente de u

. .R C
L
E =
)
`

c
c

1
2
2
u
( ) . .
~
R C V = u
u
~
26
Mtodo de los momentos
Si una distribucin tiene k parmetros, el procedimiento
consiste en calcular los primeros k momentos muestrales de la
distribucin y usarlos como estimadores de los
correspondientes momentos poblacionales.
La media poblacional es el primer momento de la
distribucin alrededor del origen. La media muestral es el
promedio aritmtico de las observaciones muestrales x
1
, x
2
, ...,
x
n
. El mtodo de los momentos toma a la media muestral como
una estimacin de la media poblacional.
De la misma manera, la varianza de una variable aleatoria es o
2

y se denomina segundo momento alrededor de la media. La
cuasivarianza muestral s
2
*
se usa como un estimador de la
varianza poblacional de la distribucin.

x
27
Recordemos que el momento muestral centrado en el origen
de orden r se define como:

=
=
n
i
r
i r
x
n
m
1
1
Para el ejemplo anterior, los momentos de primer orden centrados
en el origen de la poblacin y la muestra son respectivamente:

}
=
=
+

+
=

=
+
n
i
i
n
i
i
x
n
x
n
m
dx
x
x
1
1
1
1
1
1
1
1
1
1
) 1 (
u
u
u
u
1

1
+ =

=
n
i
i
x
n
u
Luego podemos usar como
estimador:
Igualando:
28
Mtodo de mxima verosimilitud
Sea X una variable aleatoria cuya distribucin de
probabilidad depende del parmetro desconocido u.
Sea la funcin de densidad de probabilidad de la poblacin
f(x, u). Se toma una muestra aleatoria x
1
, x
2
, ..., x
n
de
observaciones independientes y se calcula la densidad
conjunta de la muestra: la funcin de verosimilitud y se
expresa como:
( )
[
=
=
=
n
i
i n
n n
x f , ,...,x L(x
, f(x ... , f (x , f(x , ,...,x L(x
1
1
2 1 1
, )
) ) ) )
u
29
MV
u

L
u

Si de una poblacin cualquiera hemos obtenido una muestra


particular, es razonable pensar que la muestra obtenida era
la que mayor probabilidad tena de ser escogida.
Valor del estimador mxima
verosimilitud
Funcin
mxima
verosimilitud
30
Si los valores posibles de u son discretos, el procedimiento es
evaluar L(x,u) para cada valor posible y elegir el valor de u para
el cual L alcanza su mximo.

Por otro lado, si L(x,u) es diferenciable se puede maximizar L
sobre el rango de valores posibles de u obtenindose
condiciones de primer y segundo orden.

En la prctica es ms fcil maximizar el logaritmo de la funcin
de verosimilitud. Como la funcin logaritmo es una
transformacin montona, maximizar L(x,u) es equivalente a
maximizar Ln(L(x,u)).



31
Ejemplo: Sea una urna con bolas rojas y blancas en proporciones
desconocidas. Extraemos 10 bolas con reemplazo (n = 10) y
obtenemos 3R y 7B. Llamemos p a la proporcin de R en la urna.
! 7 ! 3
! 10
) 1 ( ) 1 ( ) (
7 3 10
7 , 3
7 3
p p PR p p p L = =
0
! 7 ! 3
! 10
) 10 3 ( ) 1 (
) (
6 2
= =
c
c
p p p
p
p L
Soluciones: p = 0 p = 1 p = 3/10
Imposible porque
hemos extrado 3R
Imposible porque
hemos extrado 7B
Que adems
hace mxima
la funcin L(p)
0
) (
10 / 3
2
2
<
c
c
= p
p
p L
32
0 , 0
) 1 (
) (
1
> >
+
=
+
u
u
u
x
x
x f Volvamos al ejemplo:
( )
( )
( )

[
[
=
=
=
+
+ + =
+
= =
n
i
i n
n
i
n
i
i
n
i n
x Ln nLn , ,...,x L(x Ln
x
x f , ,...,x L(x
1
1
1
1
1
1
1 ) 1 ( )
1
, )
u u
u
u
u
( )
( )
0

)
1

0 1
)
2

2
1
2
1
1
1
< =
c
c
+
=
= + =
c
c
=
=
=

u
u
u
u u
n

, ,...,x L(x Ln
x Ln
n
x Ln
n

, ,...,x L(x Ln
n
n
i
i
n
i
i
n
Construimos la funcin
verosimilitud
Extraemos logaritmos
a ambos lados
Derivamos e igualamos
a cero para encontrar
el mximo de la funcin
Observemos que no
coincide con el estimador
que nos propone el mtodo
de los momentos.
35
36
Propiedades de los estimadores puntuales
Un estimador es una v.a. y todo juicio sobre l, se basar
en su ley de Probabilidad, y ms especficamente sobre su
Esperanza y Varianza.

1. se dice que es insesgado

2. se llama sesgo de

3. se llama error cuadrtico
medio del estimador
4. se dice que es
consistente

| | ( ) | | u u = =
n
X X T E E ,...,

1
u

| | | | u u u =

E B u

( ) | | ( ) u u u

2
B Var ECM + =
( ) 1

lim = s

c u u P
n
u

( ) u u
W

Propiedades de los estimadores puntuales



5. Si , decimos que es un estimador insesgado
de varianza mnima para u . Si todo otro estimador
insesgado de u , digamos , se verifica que:


6. Sea X
1
, X
2
,..., X
n
m.a. f ( x , u ). Si es:





Nota: Si es eficiente

| | u u =

E u

( ) ( ) u u
~

Var Var s
u
~
| | | |
1
2

(
(

|
.
|

\
|
c
c
> =
u
u
u u u
) , ( ln

x f
nE Var E
u

| | u
u
u
u

) , ( ln

(
(

|
.
|

\
|
c
c
=
1
2
x f
nE Var

7. Sean dos estimadores de . Se llama

eficiencia relativa de a:




8. es un estimador suficiente si usa toda la informacin
contenida en la muestra.

2 1
u u
~

y
u
( )
( )
( )
1
2
1 2
u
u
u u

,
~
ECM
ECM
ef =
u

1 2
u u

/
~
r c
Propiedades de los estimadores puntuales
40
1. Estimador insesgado. Diremos que es un
estimador insesgado de si:
u
u
Vimos que la media muestral es un estimador
insesgado de la media poblacional.
Vimos que la varianza muestral no es un estimador
insesgado de la varianza poblacional, es sesgado.


Recuerda que construimos la cuasivarianza, que s es
un estimador insesgado de la varianza poblacional.
| | ( ) | | u u = =
n
X X T E E ,...,

1
| | u u u =

) ( E b
se llama sesgo de
u

41
Sea una poblacin N(, o) y construyamos los estimadores de
varianza: varianza muestral y cuasivarianza muestral.

= =
n
j
j
x x
n
s
1
2 2
* 2
) (
1
1

=
= =
n
j
j
x x
n
s
1
2 2
1
) (
1

u
Vimos que si la poblacin es normal, entonces el estimador:
2
1
2
como distribuye se

) 1 (
2
*

n
s n
_
o
_
sesgo
n n
n
E
n
n
E
E
n
s E E
n
2
2 2
2
]
2
1
2
1
]

[
1
]

[
[
1
] [ ]

[
2 1
2
* 2
o
o o u u
o _
o
u
=

= = =

42
Propiedades en muestras grandes
Muchos estimadores no tienen buenas propiedades
para muestras pequeas, pero cuando el tamao
muestral aumenta, muchas de las propiedades
deseables pueden cumplirse. En esta situacin se
habla de propiedades asintticas de los estimadores.
Como el estimador va a depender del tamao de la
muestra, vamos a expresarlo utilizando el smbolo
Por ejemplo, el sesgo puede depender del tamao de
la muestra. Si el sesgo tiende a cero cuando el tamao
de la muestra crece hasta infinito, decimos que el
estimador es asintticamente insesgado.
n
u

43
Ausencia de sesgo asinttico

Definicin: Un estimador se dice que es
asintticamente insesgado si:


o equivalentemente:


n
u

u u =

]

[ lim
n
n
E
0 ] ]

[ [ lim =

u u
n
n
E
44
2. Consistencia. Se dice que un estimador es
consistente si se cumple que
Es decir, a medida que se incrementa el tamao muestral, el
estimador se acerca ms y ms al valor del parmetro. La
consistencia es una propiedad asinttica.
Tanto la media muestral como la cuasivarianza son
estimadores consistentes. La varianza muestral tambin es
un estimador consistente de la varianza poblacional, dado
que a medida que el tamao muestral n se incrementa, el
sesgo disminuye.
( ) 1

lim = s

c u u
n
n
P
u u ]

[
n
E 0 ]

[
n
Var u
o ( ) 0

lim = >

c u u
n
n
P
45
Ejemplo: supongamos que la poblacin es no normal y de media
desconocida. Construyamos estadsticos media muestral:
Para cada tamao muestral n tenemos:
= ) (
n
x E
n
x Var
n
2
) (
o
=
Por el teorema de Chebychev:
( )
( ) ( )
c
o
c
c
o
c
n
k
x P
n
x P
k
x Var k x E x P
n
n
n
n n n
=
= s > s
> s

con
1 lim 1
1
1 ) ( ) (
2
2
2
La media muestral es un estimador
consistente de la media poblacional.
46
3. Eficiencia. Idea: Utilizar las varianzas de los estimadores
insesgados como una forma de elegir entre ellos.

Si , decimos que es un estimador insesgado
eficiente o de varianza mnima para u , si cualquier otro
estimador insesgado de u , digamos , verifica que:


| | u u =

E u

( ) ( ) u u
~

Var Var s
u
~
La varianza de una variable aleatoria mide la dispersin
alrededor de la media. Menor varianza para una variable
aleatoria significa que, en promedio, sus valores fluctan poco
alrededor de la media comparados con los valores de otra
variable aleatoria con la misma media y mayor varianza. Menor
varianza implica mayor precisin y entonces el estimador que
tenga menor varianza es claramente ms deseable porque, en
promedio, est mas cerca del verdadero valor de u.
47
Sean y dos estimadores insesgados del
parmetro u.

Si Var ( ) < Var ( ) decimos que es ms
eficiente que .

El cociente Var ( ) / Var ( ) se llama eficiencia
relativa.

Entre todos los estimadores insesgados de u, el que tenga
menor varianza es el estimador insesgado de mnima
varianza. Pero, cmo podemos encontrarlo?
1

u
2

u
1

u
2

u
1

u
2

u
2

u
1

u
48
| |
( )
(

c
c
+
>
2
2
2
) , ( ln
) ( ' 1

u
u
u
u
x f
nE
b
Var
Cota de Cramr-Rao:

Sea una poblacin con densidad de probabilidad
f(x, u), entonces se cumple que:
Si un estimador tiene una varianza que coincide con la cota
de Cramr-Rao se dice que es un estimador eficiente.

Si adems en insesgado, se dice que es un estimador de
eficiencia absoluta o completa.
49
Ejemplo: Sea una poblacin que se distribuye normalmente
con desviacin tpica conocida y media desconocida. Como
estimador utilizaremos la media muestral. Sabemos que
la distribucin del estimador es tambin una normal con
la misma media y varianza . Luego el estimador
es insesgado: b(u) = 0. Calculemos la cota de Cramr-Rao (CCR).

2
/ n o
CCR x Var
n
x f
nE
CCR
E
x f
E
x f x x f
x
x f
x
x f
= =
(

c
c

=
=
(

=
(

c
c
=
c
c
=
c
c

=
)
`


=
) ( ;
) , ( ln
1
1 1 ) , ( Ln
1 ) , ( Ln
;
) , ( Ln
2
) (
2
1
Ln ) , ( Ln ;
2
) (
exp
2
1
) , (
2
2
2
2 2 2
2
2 2
2
2
2
2
2
2
o
u
u
o o u
u
o u
u
o
u
u
u
o
u
t o
u
o
u
t o
u
50
Eficiencia asinttica
Cuando trabajamos con estimadores consistentes, el
rango de valores de u para el cual un estimador es ms
eficiente que otro, disminuye a medida que n crece. En
el lmite cuando n tiene a infinito la distribucin de
todos los estimadores consistentes colapsa en el
verdadero parmetro u. Entonces deberamos preferir
aquel estimador que se aproxime ms rpidamente (es
decir, aquel cuya varianza converge ms rpido a
cero)
51
En trminos intuitivos, un estimador consistente es
asintticamente eficiente, si para muestras grandes su
varianza es menor que la de cualquier otro estimador
consistente.

Definicin: un estimador consistente se dice que es
asintticamente eficiente si para cualquier otro
estimador el
1

u
2

u
u
u
u
>
(
(


1
)

(
)

(
1
2
Var
Var
lim
n
52
4. Suficiencia. Diremos que es un estimador
suficiente del parmetro si dicho estimador basta por
s solo para estimar . Si el conocimiento pormenorizado
de los elementos la muestra no aade ninguna
informacin sobre u.
u
u
u
Ejemplo: Supongamos una poblacin binomial de la que
desconocemos la proporcin u = p. Extraemos una muestra
de tamao n = 50.
1 } { max ) ( ; 35 ) (
fracaso es si 0
xito es si 1
2
50
1
1
= = = =

=
i
i
i
i
x X T x X T
x
Estimador suficiente, p aprox. 35/50.
53
Error cuadrtico medio (ECM)

Consideremos dos estimadores, uno insesgado y el
otro sesgado pero con una varianza bastante menor,
de modo que en promedio puede estar ms cerca de la
verdadera media que el estimador insesgado.
En esta situacin podramos admitir algo de sesgo con
la intencin de obtener una mayor precisin en la
estimacin (menor varianza del estimador).
Una medida que refleja este compromiso (trade off)
entre ausencia de sesgo y varianza es el ECM.
54
El error cuadrtico medio de un estimador se define como
ECM ( ) = E[( - u )
2
] . Esto es la esperanza de la desviacin
al cuadrado del estimador con respecto al parmetro de inters.
Si , son dos estimadores alternativos de u y ECM ( ) <
ECM ( ) entonces se dice que es eficiente en el sentido
del ECM comparado con . Si los dos son insesgados,
entonces es ms eficiente.
Entre todos los posibles estimadores de u, aquel que tenga el
menor ECM es el llamado estimador de mnimo error
cuadrtico medio.
ECM = Var( ) + sesgo
2
.
es decir que el ECM es igual a la suma de la varianza ms el
sesgo al cuadrado.

u

u
1

u
u

u
2

u
1

u
2

u
1

u
u

55
( ) =
(

+ = =
2
2

( )

] )

[( )

( u u u u u u u E E E E ECM
( ) ( ) ( )
| |
2
0
constante
2 2
)

( )

(
] )

( [ )

2 ] )

( [ ] )

[
u u
u u u u u u u u
b Var
E E E E E E E
+ =
+ +

_
)

(
2
u E
2

u
1

u
)

(
1
u u E =
sesgo u
2
Compromiso
entre varianza y
sesgo de los
estimadores.
Variable aleatoria Constante
56
Ejemplos: Supongamos una poblacin de la que conocemos
la media y la varianza (= 100). Tomemos muestras n = 10.
Consideremos los dos estimadores de la media siguientes:

= =
+
= = =
n
i
i
n
i
i
x
n
x
n
x
1
2
1
1
1
1

;
1

u u
10
10
100
)

(
)

(
1
)

(
] [
1
]

[
2
1
2
1
1
2
1
1
1
= = =

= =
= =

=
=
n
ECM
n
Var
n
Var
x E
n
E
n
i
i
n
i
o
u
o
u u
u
121
1000
) 1 (
)

(
) 1 (
)

(
) 1 (
1
)

(
1
] [
1
1
]

[
2
2
2 2
1
2
2
1
1
2
2
1
2
+
=
+
+
=

+
=
+
=
+
=
+
=

=
=
o
u
o
u u
u
n
n
ECM
n
n
Var
n
Var
n
n
x E
n
E
n
i
i
n
i
Dependiendo de la media de la poblacin nos interesar tomar un estimador u otro.
57
Los estimadores mximo verosmiles son:

Asintticamente insesgados
Asintticamente normales
Asintticamente eficientes
Invariantes bajo transformaciones biunvocas
Si - estimador suficiente, es suficiente

MV
u

Propiedades de los estimadores de mxima


verosimilitud
58
59
60
61
62
63
64
65
Pregunta: Qu porcentaje de hogares espaoles tienen
ordenador con conexin a Internet?
Definicin clara?:
Qu es un hogar?
Piso de estudiantes?
Apartamento en la playa?...
Muestra representativa?

Resultado: 42,8 %
Si volviramos
a realizar el
estudio, volvera
a salir 42,8%?

42,8 %
Estimacin
puntual
Margen
de error
Dice la verdad el
95 % de les veces
3,2 %
Intervalo de confianza del 95 %
67
Estimacin por intervalos de
confianza.
En este caso, en lugar de indicar simplemente un nico valor
como estimacin del parmetro poblacional u, lo que haremos
es ofrecer un intervalo de valores en el que se tiene cierta
probabilidad (confianza) de que se encuentre el verdadero
valor de u.

Intervalo de confianza: Es el intervalo de las estimaciones
(probables) sobre el parmetro. Lmites de los intervalos de
confianza: Son los dos valores extremos del intervalo de
confianza. Amplitud del intervalo o margen de error...
c u u c u + < <

68
Ahora bien, cun grande debe de ser el intervalo de
confianza? Evidentemente, si decimos que el intervalo de
confianza va de menos infinito a ms infinito, seguro que
acertamos...Pero eso no es muy til. El caso extremo
contrario es la estimacin puntual, donde la amplitud del
intervalo es nula.
La idea es crear unos intervalos de confianza de manera que
sepamos en qu porcentaje de casos el valor del parmetro
poblacional estar dentro del intervalo crtico.
Es decir, dar una medida de bondad de la estimacin, la
probabilidad de que el valor real u se encuentre dentro del
intervalo.
o c u u c u = + < < 1 )

( P
Coeficiente
o grado de
confianza
Nivel de significacin (N. S.)
69
Y cmo fijamos tal probabilidad? Usualmente se asume un
porcentaje del 95%. Al calcular un intervalo de confianza al
95%, ello quiere decir que el 95% de las veces que repitamos
el proceso de muestreo (y calculemos el estadstico), el valor
del parmetro poblacional estar dentro de tal intervalo. A ese
usual nivel de significacin se le denomina confianza casi
significativa.
Otros casos usuales son:
confianza significativa: 99%.
confianza muy significativa: 99.5%
70
71
Intervalos de confianza para la media:
Supongamos que la poblacin sigue una distribucin normal,
con cierta media y cierta desviacin tpica o. Utilizaremos como
estimador puntual para la media poblacional la media muestral .
Sabemos que:
(1). La media de la distribucin muestral de medias es la media
poblacional .
(2). La varianza de la distribucin muestral de medias es o
2
/n. O lo
que es lo mismo, la desviacin tpica de la distribucin muestral
de medias es o /\n.
Veremos dos casos para calcular intervalos de confianza:
(1) Conocemos la desviacin tpica o y (2) no la conocemos.

x
72
(1) La poblacin es normal y conocemos o :

=
=
n
i
i
x
n
x
1
1
( ) 1 , 0
/
N
n
x
z

=
o

( ) n N x / ,o
Tipificamos la variable:
Sabemos cmo se distribuye la variable aleatoria
muestral y a partir de esa distribucin podemos
determinar el intervalo de confianza.
Supongamos que deseamos tener un nivel de
significacin o.
73
-z
o/2

o/2
o/2
1-o
z
o/2
0

( ) 1 , 0 N
o
o

o
o
o

o o
o o
= |
.
|

\
|
+ < <
= |
.
|

\
|
<

<
1
1
/
2 / 2 /
2 / 2 /
z
n
x z
n
x P
z
n
x
z P
74
2 / 2 / o o
o

o
z
n
x z
n
x + < <
As, una estimacin puntual de la media poblacional
se obtendra de una muestra de n elementos haciendo
la media muestral. Mientras que un intervalo de confianza
con nivel de significacin o sera:
Nota: Observa que podemos determinar el tamao
necesario de una muestra para obtener una
amplitud del intervalo de confianza determinada.
2
2 /
|
.
|

\
|
=
o
c
o
z n
Semiamplitud del
intervalo
75
Ejemplo: n = 100
1.96 1.96
025 . 0 025 . 0
+ = = z y z
20 = x 5 = o
Confianza = 0.95 o = 0.05
02 . 19 96 . 1
100
5
20
2 /
= =
o
o
z
n
x
98 . 20 96 . 1
100
5
20
2 /
= + = +
o
o
z
n
x

) 98 . 20 ; 02 . 19 ( e
Buscamos en las tablas N(0,1) los valores de z que
dejan 0.05 / 2 = 0.025 de probabilidad por abajo y
0.05 / 2 = 0.025 de probabilidad por arriba:
76
Observemos cmo a medida que el tamao muestral
aumenta, la amplitud del intervalo disminuye.
(Evidentemente, esto es general, no slo para la media.)
Veamos, un ejemplo. Supongamos que deseamos 1 - o =
0.95:
Caso 1. Media muestral =10, varianza poblacional = 4, tamao
muestral =12.


Caso 2. Media muestral =10, varianza poblacional = 4, tamao
muestral = 20.

( )
2 2
10 ( 1.96) 10 1.96 9.12 10.88 0.95
20 20
P P
| |
+ < < + = < < =
|
\ .
( )
2 2
10 ( 1.96) 10 1.96 8.87 11.13 0.95
12 12
P P
| |
+ < < + = < < =
|
\ .
77
Supongamos ahora que deseamos que 1 - o = 0.99. En tal caso,
tendremos ms seguridad de que el parmetro de inters se halle
en los lmites del intervalo. El problema es que incrementar la
confianza aumenta la amplitud del intervalo.
Caso 1. Media muestral = 10, varianza poblacional = 4, tamao
muestral = 12. Intervalo al 95%



Caso 2. Media muestral = 10, varianza poblacional =4, tamao
muestral = 12. Intervalo al 99%

( )
2 2
10 ( 2.57) 10 2.57 8.52 11.48 0.99
12 12
P P
| |
+ < < + = < < =
|
\ .
( )
2 2
10 ( 1.96) 10 1.96 8.87 11.13 0.95
12 12
P P
| |
+ < < + = < < =
|
\ .
78
Por el tema anterior sabemos que la distribucin muestral
del estadstico:
no es una distribucin normal, sino una distribucin t de
Student con n -1 grados de libertad.
(2) Poblacin normal y desconocemos o :
n s
x
/

o
o

o o
o o
= |
.
|

\
|
+ < <
= |
.
|

\
|
<

<
1
1
/
2 / 2 /
2 / 2 /
t
n
s
x t
n
s
x P
t
n s
x
t P
79
En definitiva, para la media (cuando conocemos la varianza
poblacional), tenemos :
Pero si no conocemos la varianza poblacional (el caso
realista), tenemos como intervalo:
2 / 2 / o o
o

o
z
n
x z
n
x + < <
2 / 2 / o o
t
n
s
x t
n
s
x + < <
80
Si n es grande (n > 30), la distribucin del estadstico


ser prcticamente una distribucin normal N(0,1). Y el
intervalo de confianza ser:
Distribucin de la poblacin desconocida y n > 30
n s
x
/

2 / 2 / o o
o

o
z
n
x z
n
x + < <
Nota: Observa, en particular, que para n > 30 la distribucin t de Student
es prcticamente una normal.
81
2
1
2
2
*
1
2 2
*
) 1 (
que Vimos
) (
1
1
: Estimador
) , ( Poblacin

=
~

n
n
i
i
s n
x x
n
s
N
_
o
o
2
2 / 1 ; 1
2
*
2
2
2 / ; 1
2
*
) 1 ( ) 1 (
o o
_
o
_

s s

n n
s n s n
Intervalo de confianza para las varianzas:
Intervalo de confianza:
82
Ejemplo:
n = 31
2 2 2
de tablas las de 8 . 16 ; 0 . 47
025 . 0 ; 30 975 . 0 ; 30
_ _ _ = =
4
*
= s
o = 0.05
8 . 16
4 30
0 . 47
4 30
2
2
2

s s

o
57 . 28 21 . 10
2
s so
n -1 = 30
+
Si se desea estimar o = \o
2
3.20 s o s 5.35


83
2. Conociendo la distribucin en el muestreo de y poseyendo
una estimacin puntual, hallar los percentiles x
o/2
y x
1- o/2
de
Resumen: Procedimiento para determinar el
intervalo de confianza
u

2 / o
u

b = u
1. Fijar el nivel de significacin o
Si es simtrica el intervalo
de confianza es simtrico en
x y en probabilidad.
)

(u f
2 / o
)

(u f Si es asimtrica el intervalo
de confianza es simtrico en
probabilidad solamente.
)

(u f
LCi LCs
d d
0. 0
0. 2
0. 4
0. 0 1 . 5 3. 0 4. 5
x
f (x)
2 / o
2 / o
)

(u f
84
Intervalo
85
Es grande n?
n>30
Se conoce valor de o?
Es aproximadamente
normal la poblacin?
Usar s de la muestra
para estimar o
Usar s
de la muestra
para estimar o
Aumentar tamao
de la muestra
para determinar un
estimado de intervalo
Se conoce valor de o?
/ 2
X z
n
o
o

/ 2
s
X z
n
o

/ 2
X z
n
o
o

/ 2
X
s
t
n
o

Si No
Si
Si
Si
No No
No
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Intervalo de confianza para diferencia de medias muestrales
101
102
103
104
Intervalo de confianza para o
1
2
/o
2
2
.
105
106
Intervalo de confianza para la proporcin poblacional.

107
108
109
Intervalo de Confianza para diferencia
de medias
P
1
: X
1
, X
2
,..., X
n1
N (
1
,o
2
1
)
P
2
: Y
1
, Y
2
,..., Y
n2
N (
2
,o
2
2
)
Supuesto: Poblaciones Normales
) 1 , 0 (
1 1
1
1
N
n
X
o

) , ( 1 0
2 2
2
2
N
n
Y
o

( )
) ( 1
2
2
1
2
1 1
1
1

n
S n
_
o
( )
) ( 1
2
2
2
2
2 2
2
1

n
S n
_
o
~
~
~
~
( ) ( )
) ( 2
2
2
2
2
2 2
2
1
2
1 1
2 1
1 1
+

n n
S n S n
_
o o
( )
) ( 2
2
2
2
2 1
2 1
2
+
+
n n
P
S n n
_
o
~
~
Asumiendo independencia de las muestras :
2
2
2
1
o o = Si
( ) ( )
( ) 2
2 1
2 1
2 1
2 1
1 1
+
+

=
n n
P
t
n n
S
X X
Q

~
( )
( )
(

+ =
+
2 1
2
2
2 1
2 1
1 1
2 1
n n
S t X X I
P
n n ,
) (
o

Finalmente:
Es un Intervalo de confianza de nivel para
1
-
2

( )
( )
(
(

+ =
2
2
2
1
2
1
2
2 1
2 1
n
S
n
S
t X X I
g ,
) (
o

Supongamos que
Siendo g = n
1
+ n
2
- 2 - A grados de libertad
2
2
2
1
o o =
( ) ( ) | |
( ) ( )
2
2
1
2
1
2
2
2
1
1
2
1 1
1 1
' '
' '
S n S n
S n S n


= A
2 1,
'
= = i
n
S
S
i
i
i
Intervalo de Confianza para o
1
2
/o
2
2

( )
. .
,
l g F
S
S
F
n n 1 1
2
2
2
2
2
1
2
1
2 1

=
o
o
~
Recordemos que:
( )
) ( 1
2
2
1
2
1 1
1
1

n
S n
_
o
( )
) ( 1
2
2
2
2
2 2
2
1

n
S n
_
o
~
~
(

< < =
|
|
.
|

\
|
2
1
2
2
2
1
2
2
2
1
2
2
2
1
2
2
S
S
F
S
S
F I
b a
o
o
o
o

donde
| | o = = s s 1
b a
F F F P
2 o
F F
a
=
2 o
F F
b
= Si
Se obtiene el intervalo
de iguales colas ;
Parmetro Estadstica Distribucin Intervalo
, o
conocido
, o
desconocido

1
-
2

o
1
= o
2

1
-
2

o
1
= o
2

u
muestra grande
N (0,1)
N (0,1)
2
2 1
A +n n
t
1 n
t
2
2 1
+n n
t
1
2
n
_
2
o
( ) ( )
2 1
2 1
2 1
1 1
n n
S
X X
P
+

( ) ( )
2
2
2
1
2
1
2 1
2 1
n
S
n
S
X X
+

( )
MV
MV
u o
u u

( )
2
2
1
o
S n
( )
S
X n
( )
o
X n
n
z X
o
o 2

n
S
t X
2 o

( ) ( )
(


2
2
2
2 1
2
2
1 1
o o _ _
S n S n
;
( )
2 1
2
2 1
1 1
n n
S t X X
P
+
o
( )
2
2
2
1
2
1
2
2 1
n
S
n
S
t X X +
o
( )
MV MV
z u o u
o

2

Diferencia entre dos medias






Si muestras son independientes y se conocen las
varianzas poblacionales
8-16
2
2
2
1
2
1
2 1 2 1
n n
z xm xm u u
o o
+ =
Ejemplo
Se desea comparar el rendimiento de consumo de gasolina
de dos motores. Para el motor 1, se realizan 50 pruebas; y
para el motor 2, 75 pruebas.
Los promedios muestrales resultan 36 y 42 respectivamente,
Se conoce que la varianza poblacional es 6 y 8
respectivamente y se trabaja al 96% de confianza.


8-16
50
36
75
64
05 . 2 36 42
2 1
+ = u u
57 . 8 43 . 3
2 1
< < u u
Diferencia entre dos medias






Si muestras son independientes, pero se
desconocen las varianzas poblacionales,
asumindose que son iguales
Trabaja con n
1
+n
2
-2 grados de libertad
8-16
2 1
2 1 2 1
1 1
*
n n
Sp t xm xm u u + =
2 2 1
) 1 2 ( ) 1 1 (
2
2
2
1
2
+
+
=
n n
s n s n
p S
Ejemplo
Se desea comparar el nivel de degradacin del agua abajo y
sobre una mina. Abajo se toman 12 muestras y arriba de la
mina se toman 10 muestras.
Los promedios muestrales resultan 3.11 y 2.04 con
desviaciones muestrales de 0.771 y 0.448 en uno y otro caso
respectivamente y se trabaja al 90% de confianza.


8-16
547 . 1 59 . 0
2 1
< < u u
10
1
12
1
646 . 0 * 72 . 1 04 . 2 11 . 3
2 1
+ = u u
417 . 0
2 10 12
448 . 0 ) 9 ( 771 . 0 ) 11 (
2 2
2
=
+
+
= p S
Diferencia entre dos medias






Si muestras son independientes, pero se
desconocen las varianzas poblacionales,
asumindose que son diferentes
8-16
2
2
2
1
2
1
2 1 2 1
n
s
n
s
t xm xm u u + =
)) 1 2 /( ) 2 / (( )) 1 1 /( ) 1 / ((
) 2 / 1 / (
2 2
2
2 2
1
2 2
2
2
1
+
+
=
n n s n n s
n s n s
v
Ejemplo
Se desea comparar la cantidad de qumico en un ro en dos
estaciones diferentes. En E1 se toman 15 muestras y en E2 se
toman 12 muestras.
Los promedios muestrales resultan 3.84 y 1.49, con desviaciones
muestrales de 3.07 y 0.8 en uno y otro caso respectivamente y se
trabaja al 95% de confianza.
8-16
12
8 . 0
15
07 . 3
12 . 2 49 . 1 84 . 3
2
2
2 1
+ = u u
16
)) 11 /( ) 12 / 8 . 0 (( )) 14 /( ) 15 / 07 . 3 ((
) 12 / 8 . 0 15 / 07 . 3 (
2 2 2 2
2 2 2
=
+
+
= v
1 . 4 6 . 0
2 1
< < u u
Diferencia entre dos medias







Si muestras son dependientes (pareadas). Se da
cuando el mismo dato se toma en dos momentos
del tiempo, o cuando se toma un mismo dato por
dos observadores diferentes.
8-16
n
sd
t d u u =
__
2 1
1
) (
__
2

=

n
d d
Sd
i
Ejemplo
Se compara niveles de oxido en 20 maquinas, antes del
proceso de antioxidacion y despues de este, se puede
decir cuanto se redujo la oxidacion
Del conjunto de 20 datos (pares), se saca la diferencia
entre uno y otro por par.

8-16
Ejemplo







8-16
20
9773 . 2
093 . 2 87 . 0
2 1
= u u
97 . 2
19
1684220
= = Sd
53 . 0 26 . 2
2 1
< < u u
Factor de correccin de
poblacin finita
Se dice que una poblacin con una cota superior
fija es finita.
Para una poblacin finita, donde el nmero total de
objetos es N y el tamao de la muestra es n, se
hace el siguiente ajuste a los errores estndar de
las medias muestrales y proporciones:
Error estndar de las medias muestrales:
o
o
x
n
N n
N
=

1
8-24
Factor de correccin de
poblacin finita
8-25
Error estndar de las proporciones de las muestras:




Este ajuste se llama factor de correccin de poblacin
finita.
Nota: si n/N < .05, el factor de correccin de poblacin
finita se ignora.
1
) - 1 (
=

N
n N
n
pm pm
p
EJEMPLO
8-26
Si la muestra es 49 y la poblacin es 500, se
concluye que n/N = 49/500 = .098>.05, se tiene que
usar el factor de correccin de poblacin finita.
24 196
4
49
500 49
500 1
22 9352 250648

= . ( )( ) [ . , . ]
Diferencia entre dos
proporciones



8-16
2
2 2
1
1 1
2 1 2 1
) 1 ( ) 1 (
n
pm pm
n
pm pm
z pm pm pp pp

+

=
Aplica en muestras grandes (npm>5)
Ejemplo
Si 75 de 1500 artculos son defectuosos bajo el
procedimiento actual, y 80 de 2000 lo son bajo el
procedimiento nuevo, encuentre la diferencia entre
fraccin de defectuosos bajo uno y otro
procedimiento al 90% de confianza.

8-16
2000
96 . 0 * 04 . 0
1500
95 . 0 * 05 . 0
645 . 1 04 . 0 05 . 0
2 1
+ = pp pp
0217 . 0 2 1 0017 . 0 < < pp pp
Estimacin por Intervalos
En la prctica, interesa no slo dar una estimacin
de un parmetro, sino que adems, un intervalo
que permita precisar la incertidumbre existente en
la estimacin.
Definicin: Sea x m.a. f ( x , u ). Sean u
1
=T
1
(x),
u
2
=T
2
(x) dos estadsticas de u : T
1
s T
2
. x e_ ;
P |u
1
s u s u
2
| = 1 - o =
Entonces el I = |u
1
; u
2
| se llama intervalo aleatorio
de confianza del 100 % para u ( 0 < o < 1 ).
Fijado o, el problema de determinar u
1
y u
2
puede
resolverse encontrando una variable aleatoria
Q(x,u) cuya distribucin est totalmente definida,
que sea independiente de u.
La variable Q(x,u) se denomina Cantidad Pivotal
Estimacin por Intervalos
Ejemplo: X
1
, X
2
,..., X
n1
N (
1
,o
2
1
)


Q(x,u)=

Q(x,u)= ) 1 , 0 ( ~
1 1
1
1
N
n
X
o

) 1 (
1 1
1 1
~

n
t
n S
X
1. Encontrar una cantidad Q.
2. P |q
1
s Q s q
2
| = 1 - o =
3. Invertir P |u
1
s u s u
2
| = , obteniendo as un
intervalo I=|u
1
; u
2
| de confianza para u de nivel
100 %.
Observacin: Para muestras grandes la v.a. Q
siempre existe, ya que si , entonces

tiene distribucin asintticamente normal estndar.
MV
u

( )
MV
MV
u o
u u

Mtodo de la Cantidad Pivotal

Você também pode gostar