Você está na página 1de 22

AO DE LA DIVERSIFICACIN PRODUCTIVA

Y DEL FORTALECIMIENTO DE LA
EDUCACIN

UNIVERSIDAD NACIONAL DE FRONTERA SULLANA


Ingeniera Econmica - III Ciclo
Estadstica I
Estimacin
Jorge Meja Silup

ALUMNA: Leydi Estrada


Saldarriaga

NDICE

ESTIMACIN
En inferencia estadstica se llama estimacin al conjunto de tcnicas que
permiten dar un valor aproximado de un parmetro de una poblacin a partir de
los datos proporcionados por una muestra. Por ejemplo, una estimacin de
la media de una determinada caracterstica de una poblacin de tamao N
podra ser la media de esa misma caracterstica para una muestra de tamao n.
La estimacin estadstica se divide en dos grandes grupos: la estimacin puntual
y la estimacin por intervalos.

I.

ESTIMACIN PUNTUAL

Consiste en obtener un nico nmero calculado a partir de las observaciones


muestrales, y que es utilizado como estimacin del valor del parmetro . Se le
llama estimacin puntual porque a ese nmero, que se utiliza como estimacin
del parmetro , se le puede asignar un punto sobre la recta real. En la
estimacin por intervalos se obtienen dos puntos (un extremo inferior y un
extremo superior) que definen un intervalo sobre la recta real, el cual contendr
con cierta seguridad el valor del parmetro .
El estimador del parmetro poblacional es una funcin de las variables
aleatorias u observaciones muestrales y se representa por

=g (

Para una realizacin particular de la muestra (


) se obtiene un valor
especfico del estimador que recibe el nombre de estimacin del parmetro
poblacional y lo notaremos por

=g(

Vemos pues que existe diferencia entre estimador y estimacin. El estimador es


un estadstico y, por tanto, una variable aleatoria y el valor de esta variable para
una muestra concreta (
tendr su distribucin muestral.

) ser la estimacin puntual. El estimador

En la tabla expresamos diferentes parmetros poblacionales, sus estimadores y


sus estimaciones.
Parmetro
poblacional

Estimador

Estimacin

Media

Varianza
Proporcin
Para la eleccin de estos estimadores puntuales nos hemos basado,
principalmente en la intuicin y en la posible analoga de los parmetros
poblacionales con sus correspondientes valores muestrales, pero ste no ser el
mtodo ms adecuado para la obtencin de estimadores puntuales, aunque en
este caso se obtienen estimadores satisfactorios para los parmetros
poblacionales. En general, el problema de obtener estimadores puntuales no
ser tan sencillo, por ello tenemos que dar propiedades que seran deseables
que se cumplieran por los diferentes estimadores puntuales obtenidos, aunque
no existe un mecanismo o mtodo nico que nos permita obtener el mejor
estimador puntual en todas las circunstancias.
Nuestro objetivo ahora ser dar algunas propiedades deseables de los
estimadores puntuales, con el fin de poder conocer la bondad de los mismos,
pues cuantas ms propiedades verifiquen los estimadores puntuales mejores
sern.

1. PROPIEDADES DE LOS ESTIMADOS


I.1. Insegadez
Se dice que un estimador T(X1,. . ., Xn) de es insesgado (o centrado)
si:

E [T(X1,. . ., Xn)] =
Es decir, si tomamos repetidas muestras, EN MEDIA, el valor del
estadstico estar cerca del verdadero valor del parmetro.
Y por lo tanto, su sesgo es:

E [ ]- = Var [ ]

Para elegir entre diferentes estimadores para estimar un mismo


parmetro nos basaremos en una medida, el ERROR CUADRTICO
MEDIO (ECM):

ECM [

] = Var [ ] +

(E[ ])2

*El criterio: elegir el estimador que tenga el menor ECM.

*Donde T(X1,. . ., Xn) es


En la tabla expresamos diferentes parmetros poblacionales, sus
estimadores y si es insesgado o no
Parmetro
poblacional

Estimador

Es insesgado?
Si

Media

Si

Varianza
Desviacin
tpica

s2

No
Si

Proporcin
I.2. Estimador asintticamente insesgado

Significa que al aumentar el tamao de la muestra, su media tiende a


coincidir con el parmetro , y por lo tanto, su sesgo tiende a cero.
Se dice que un estimador T(X1,. . ., Xn) de es asintticamente
insesgado si:
lim E[T ( X 1,. . . , Xn)]

Esta propiedad es interesante si tenemos una muestra de tamao


grande.
I.3. Eficiencia
Sean T1(X1,. . ., Xn) y T2(X1,. . ., Xn) dos estimadores insesgado de .
Se dice que T1 es ms eficiente que T2 si se verifica que:

Var [T1(X1,. . ., Xn)] < Var [T2(X1,. . ., Xn)]

Es decir, un estimador ms eficiente que otro tiene menor dispersin


Sean T1(X1,. . ., Xn) y T2(X1,. . ., Xn) dos estimadores insesgado de .
Se define la eficiencia relativa de T1 respecto a T2 como:

E.R. [T1, T2] =

Var [T 2]
Var [T 1]

Algunos autores la definen al revs, es decir:

E.R. [T1, T2] =

Var [T 1]
Var [T 2]

Da igual que definicin se use, lo importante es interpretar


correctamente el resultado

I.4. Suficiencia
Un estimador es suficiente cuando no depende del parmetro a estimar
.
En trminos ms simples, cuando se aprovecha toda la informacin
muestral.
I.5. Consistencia
Se dice que un estimador T(X1,. . ., Xn) de es consistente si, adems de
carecer de sesgo, se aproxima cada vez ms al valor del parmetro a medida
que aumenta el tamao de muestra. Si el tamao n se hace indefinidamente
grande, los valores de T(X1,. . ., Xn) se concentran cada vez ms en torno al
valor del parmetro, hasta que con un tamao muestral infinito obtenemos
una varianza del estimador nula. Por lo tanto, un estimador es consistente si
cuando n tiende a infinito se cumple
T ( X 1,.. . , Xn)
Var
lim
n

] =0

2. MTODOS DE ESTIMACIN
2.1.

Mtodo de los momentos


La idea bsica consiste en igualar ciertas caractersticas muestrales
con las correspondientes caractersticas poblacionales. Recordemos la
siguiente definicin:
Sea X una v.a. con funcin de probabilidad puntual
discreto o funcin de densidad

px

(x) en el caso

f x (x) en el caso continuo. Se

denomina momento de orden k (k N) o momento poblacional de


k

orden k a E (M.x poblacionales


), es decir

Een caso continuo

X k f x dx

E(

p x (X )

xk

)=
M. muestrales

Een caso discreto

Si esas esperanzas existen.


Como ya hemos visto cuando estudiamos funcin generadora de
momentos de una variable aleatoria, los momentos estn relacionados
con los parmetros de la distribucin asociada.

Dada una muestra aleatoria X 1 , X 2 , , X n , el momento muestral de


orden k es:
n

1
X ik

n i=1

2.2. Funcin generatriz


Si X es una variable aleatoria, el momento de orden k de X se define
como
E ( xk )
Siempre que la esperanza exista.
Notemos que:
E(X) =
E( X

1er momento: posicin


) = +

2do momento: dispersin

3
E( X )

3er momento: relacionado con una medida de


asimetra

E( X

4to momento: relacionado con la kurtosis

La funcin generadora de momentos de una v.a. X es una funcin a


valores reales M x (t) definida como:

M x (t)

=E(

e tx

Siempre que el valor esperado exista para todo t (h, h), h > 0. Esta
ltima es una condicin tcnica necesaria para que M x (t) sea
diferenciable en 0.
Se denomina funcin generadora de momentos porque los momentos
de

n
X (E ( X

pueden ser obtenidos derivando esta funcin y

evaluando la derivada en t = 0, tal como lo establece el siguiente


teorema.
Teorema: Sea X una v.a. para la cual existe la funcin generadora de
momentos M x (t) , entonces:

E(

2.3.

Xn

M x (t)
n
t
t=0

Estimacin de mxima verosimilitud


El mtodo de mxima verosimilitud es una tcnica para estimar los
valores de dada una muestra finita de datos.
Supongamos n medidas de

X 1 , X 2 , , X n . Puesto que las medidas

son independientes, la probabilidad de que

[ X 1, X 1 +dx 1 ]

X2

en

*probabilidad de que

X1

[ X 2, X 2 + dx2 ] ,
est en

X1

est en

es:

[ X 1, X 1 +dx 1 ] ,

para todo

i=

f (x 1, )dx 1
i=1

Si la funcin de probabilidad y el (los) parmetro(s) describen


realmente los datos, esperamos alta probabilidad para los datos que
hemos medido. Anlogamente un parmetro cuyo valor se desve
mucho del autntico resultar en baja probabilidad para las medidas
observadas.

Funcin de verosimilitud

f ( x i , )dxi

L( )
Ser mxima para la funcin de probabilidad y parmetros correctos.
En estadstica clsica L () no es la funcin de probabilidad de sino
la funcin de probabilidad conjunta de los x.
i=1

En estadstica Bayesiana, podemos tratar L ()= L ( X| ) como la


funcin de probabilidad de x dado y a usar el teorema de Bayes para
calcular la probabilidad posterior p ( |X ) ).
Para optimizar la funcin debemos:
a. Aplicar Ln a esta funcin con objeto de transformar la expresin de
productos a sumas o restas.
n

ln [ L() ]

ln[ f ( x i , ) dx i ]
i=1

b. Derivar con respecto a los parmetros, igualando la derivada a 0


L
=0, i=1,2, m

2.4.

Estimacin por mnimos cuadrados

II. ESTIMACIN INTERVLICA.

La estimacin por intervalo consiste en determinar un par de valores a y b,


tales que constituidos en el intervalo [a, b]; y para una probabilidad 1- prefijada
(nivel de confianza) se verifique en relacin al parmetro a estimar se cumpla:

P ( [a, b]) = 1-
O en otros trminos:

P (a b) = 1-

Podemos considerar el nivel de confianza (1- ) que hemos prefijado para la


expresin anterior como la probabilidad que existe (antes de tomar la nuestra)
de que el intervalo a construir a partir de la muestra incluya el verdadero valor
del parmetro a estimar. Refleja la confianza en la construccin del intervalo y
de que ste tras concretar la muestra contendr el valor a estimar. De ah que en
trminos numricos dicho nivel o probabilidad haya de tomar un valor alto (0.9,
0.95, 0.99).
Evidentemente el complementario al nivel de confianza; es decir , nivel de
significacin supondr las probabilidades de cometer un error de no dar por
incluido el verdadero valor del parmetro a estimar en un intervalo en el que
realmente si est. De ah y dado que se trata de un error posible a cometer, su
cuantificacin en trminos de probabilidad sera muy pequea (0.1,
0.005,0.005,..)
En relacin a lo anterior. Obviamente, cuanto mayor sea el nivel de confianza
prefijado la amplitud del intervalo de estimacin ser tambin mayor y por lo
tanto la estimacin ser menos precisa.
Existen para cualquier distribucin una infinidad de intervalos a los cuales les
corresponde la misma probabilidad y por tanto habr una infinidad de intervalos,
, que verifiquen que: P ( ) = 1- lgicamente nosotros buscamos una
estimacin lo ms precisa posible; es decir, de todos los intervalos que verifican
la anterior expresin P ( ) = 1- el de menor amplitud. En este sentido, es
sencillo ver que si la distribucin es simtrica y unimodal, de todos los intervalos
isoprobables, el de menor amplitud (que coincidir con el de mayor densidad
media de probabilidad) es el intervalo centrado con la media. De acuerdo con
esto, si la distribucin que consideramos es simtrica la determinacin del
intervalo de estimacin es relativamente sencilla.

1. ESTIMACIN DE LA DIFERENCIA DE MEDIAS POBLACIONALES

1.1. Asumiendo igualdad de varianzas


Si
s12 y s22 son las medias y las varianzas de dos muestras
aleatorias de tamao n1 y n2, respectivamente, tomadas de dos
poblaciones normales e independientes con varianzas desconocidas
pero iguales, entonces un intervalo de confianza del 100(
) por
ciento para la diferencia entre medias es:

1.2. Caso general

2. ESTIMACIN DE LA DIFERENCIA DE PROPORCIONES


Un estimador puntual de la proporcin P en un experimento binomial
est dado por la estadstica P=X/N, donde x representa el nmero de
xitos en n pruebas. Por tanto, la proporcin de la muestra p =x/n se
utilizar como estimador puntual del parmetro P.
Si no se espera que la proporcin P desconocida est demasiado cerca
de 0 de 1, se puede establecer un intervalo de confianza para P al
considerar la distribucin muestral de proporciones.

Al despejar P de esta ecuacin nos queda:

En este despeje podemos observar que se necesita el valor del


parmetro P y es precisamente lo que queremos estimar, por lo que lo
sustituiremos por la proporcin de la muestra p siempre y cuando el
tamao de muestra no sea pequeo.

Cuando n es pequea y la proporcin desconocida P se considera


cercana a 0 a 1, el procedimiento del intervalo de confianza que se
establece aqu no es confiable, por tanto, no se debe utilizar. Para estar
seguro, se debe requerir que n p nq sea mayor o igual a 5.
El error de estimacin ser la diferencia absoluta entre p y P, y
podemos tener el nivel de confianza de que esta diferencia no
exceder.

III. EJERCICIOS
Ejercicio 1: Suponga que de una poblacin se saca una muestra de
tamao 3: X 1 , X 2 , X 3
2
Se conoce E(x) = y VAR (x) =

Decida si los estimadores son insesgado y cul de estos


estimadores es mejor:
1
1
1
X1+ X2+ X3
1 =
4
2
4
-

RESOLUCIN

E(

1
1
1
X + X + X
4 1 2 2 4 3

( 14 X + 12 X + 14 X )
1

)=E

E(

)=

E(

)=

E(

)=

E(x) =

1
1
1
X 1 ) + E ( X 2 )+ E ( X 3 )
(
4 E
2
4
1
1
1
+ +
4
2
4

n= 3

E () = E

1
n

E () = E

1
3

E () =

1
3

E () =

1
3

es insesgado

)
)

[ E ( x 1 ) + E ( x 2) + E ( x3 ) ]

E(x) =

es insesgado

E () =

1
3

(+ + )

E () =

1
3

(3) = E () =

Cul de los dos es ms eficiente?

VAR (

VAR (

1
1
1
X1+ X2+ X3
4
2
4

( 14 X + 12 X + 14 X )
1

) = VAR

VAR (

VAR (

)=

1
1
1
( X 1 ) + 2 VAR ( X 2 ) + 4 VAR ( X 3 )
4 VAR

)=

1
1 2 1
2+
+
2
4
2
4

() () ()

)=

1 2 1 2 1 2
+ +
16
4
16

)=

3 2

VAR (

n= 3

VAR () = E

1
n

VAR () = E

1
3

VAR () =

1
3

)
)
X

( i )

()

VAR
X
i=1

VAR( i )

VAR () =

1
9

VAR () =

1
9

[ VAR ( x 1 ) +VAR ( x 2 ) +VAR ( x 3 ) ]

E () =

1
9

E () =

1
9

2
(3 ) =

VAR (

VAR (

*Como no se cumple la desigualdad decimos

3 2
<
8
3

0.375 2 <0.3 2

que

2 es

ms eficiente que

Ejercicio 2: Sea
X
, 0< X < 2 , >0
2
2
Ff(x) =
0 en otro caso

Sea

3
4 . Determine si

lim E()

E( )

E( )

E( )

es consistente

3
4

3
4 )
E
3
E
4
3 1
E( )
4 n

E( )=

3
4n

[ E()]

E( )=

3
4n

[ E ( x 1+ x 2 + x 3 ++ x n ) ]

E( )=

3
4n

[ E ( x 1 ) + E ( x 2) + E ( x3 ) + E ( x n ) ]

x f ( x ) dx
E( )=

E( )=

x 2x2 dx

E( )=

1 x3
2 2 3

( )|

E ( )=

3
1 (2 ) 03

3
2 2 3

E ( )=

E( )=

3
4n

[ E ( x 1 ) + E ( x 2) + E ( x3 ) + E ( x n ) ]

E( )=

3
4n

E( )=

3
4n

[ ]

E( )=

4
4
4
4
+ + +
3
3
3
3

4
n
3

Reemplazando
lim
n

lim Var ()

lim

3
4 )

Var ( ) = Var (
3
4

Var ( ) =

()

Var ( ) =

3
4

()

Var ( ) =

( )

Var ()

( i )

3
1

n2 i=1
X
3 Var

(
4 n i )

i=1

Var

1 2

8n

2
1
lim
8 n n

=0

3
4n

( )

Var ( ) =
Var (x) =

E ( x1

)]

[ Var ( x1 + x 2 + x 3+ + x n ) ]

[ E ( x1 )]

[ 2 2 ]

[ ]
4

2 2

E(

Var ( ) =

x 2 2x2 dx

) =0

9
16 n2

2
=2

[ Var ( x1 ) +Var ( x 2 ) ++Var ( x n ) ]

Var ( ) =

9 2 2 2 2
2
+ + + 2
2
9
9
16 n 9

Var ( ) =

9
2
n 2
2
9
16 n

Var ( ) =

1 2

8n

[ ]

*Como se cumple

lim E()

lim Var ()

entonces es eficiente

Ejercicio 3: Un artculo publicado dio a conocer los resultados de un


anlisis del peso de calcio en cemento estndar y en cemento
contaminado con plomo. Los niveles bajos de calcio indican que el
mecanismo de hidratacin del cemento queda bloqueado y esto
permite que el agua ataque varias partes de una estructura de
cemento. Al tomar diez muestras de cemento estndar, se encontr
que el peso promedio de calcio es de 90 con una desviacin
estndar de 5; los resultados obtenidos con 15 muestras de
cemento contaminado con plomo fueron de 87 en promedio con
una desviacin estndar de 4. Supngase que el porcentaje de
peso de calcio est distribuido de manera normal. Encuntrese un

= 0,

intervalo de confianza del 95% para la diferencia entre medias de


los dos tipos de cementos. Por otra parte, supngase que las dos
poblaciones normales tienen la misma desviacin estndar.
RESOLUCIN:
El estimador combinado de la desviacin estndar es:

Al calcularle raz cuadrada a este valor nos queda que s p = 4.41

Expresin que se reduce a 0.72

6.72

Ejercicio 4: Un fabricante de reproductores de discos compactos


utiliza un conjunto de pruebas amplias para evaluar la funcin
elctrica de su producto. Todos los reproductores de discos
compactos deben pasar todas las pruebas antes de venderse. Una
muestra aleatoria de 500 reproductores tiene como resultado 15
que fallan en una o ms pruebas. Encuentre un intervalo de
confianza de 90% para la proporcin de los reproductores de
discos compactos de la poblacin que no pasan todas las pruebas.
RESOLUCIN:
n=500
p = 15/500 = 0.03
Z(0.90) = 1.645

0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporcin de
discos defectuosos que no pasan la prueba en esa poblacin est
entre 0.0237 y 0.0376.

Você também pode gostar