Estadística

Estadística I 224
Unidad XIII- TEORÍA DE LA ESTIMACIÓN ESTADÍSTICA

1. CONCEPTO. ESTIMACIÓN PUNTUAL Y POR INTERVALOS. PRINCIPALES
ESTIMADORES PUNTUALES. PROPIEDADES DE LOS ESTIMADORES PUN-
TUALES.
La teoría del muestreo puede emplearse para obtener información acerca de muestras ex-
traídas al azar de una población conocida. Sin embargo, desde un punto de vista práctico, es fre-
cuentemente más importante el poder inferir información sobre una población mediante muestras
extraídas de ellas. Estos problemas son tratados en la inferencia estadística, basándose en la teo-
ría del muestreo.
Un importante problema de la inferencia estadística es la estimación de parámetros po-

blacionales o brevemente parámetros (tales como la media, la varianza de la población, etc.) a
partir de los correspondientes estadísticos muestrales o brevemente estadísticos (es decir, media
muestral, varianza muestral, etc.)
En síntesis, los valores muestrales conocidos, llamados estadísticos, se convierten en es-

timadores de los valores poblacionales desconocidos llamados parámetros.
La “Teoría de la Estimación Estadística” es la parte de la Inferencia Estadística que

trata acerca de los procedimientos específicos que posibilitan inferir o estimar, sobre la base de
resultados muestrales conocidos -estadísticos - cuáles son los valores poblacionales descono-
cidos correspondientes – parámetros- .
En estos procedimientos los valores muestrales conocidos, las “estadísticas”, se convier-

ten en estimadores de los valores poblacionales desconocidos, los “parámetros”.
El siguiente cuadro permite apreciar más claramente el tema:
CONCEPTOS EN LA MUESTRA EN LA POBLACIÓN

Denominación Estadísticas Parámetros
Simbología x ; Me; Sx2; Sx; hi x;x2;x; p
Función Son Estimadores Deben Ser estimados
Características Son conocidos Son desconocidos
Son variables Son fijos
Hay dos tipos fundamentales de estimaciones:
 Estimación puntual: es un procedimiento de estimación en el que se estima al pará-

metro mediante un solo valor muestral.
 Estimación por intervalos: es un procedimiento que permite, a partir de un estima-

dor puntual, obtener dos valores que limitan un intervalo denominado intervalo de
confianza dentro del cual se encuentra el parámetro a estimar con una cierta probabi-
lidad conocida cercana a uno, denominada nivel de confianza.
Estadística I 225
ESTIMACIÓN PUNTUAL
Los estimadores puntuales están constituidos por las estadísticos, denominación que se
da a los cálculos muestrales conocidos que permiten estimar a los correspondientes valores po-
blacionales desconocidos, denominados parámetros. Los estadísticos a los que se hace referen-
cia son, por ejemplo: la media muestral x ; la mediana Me; la variancia muestral Sx2; el desvío
estándar Sx; la proporción muestral hi. Cada uno de ellos estima al correspondiente parámetro,
es decir, a la media poblacional x; a la variancia poblacionalx2; al desvío estándar poblacional
x; o a la proporción poblacional p.
Siendo los estadísticos variables y los parámetros fijos, es imposible considerar que un
estadístico sea igual a un parámetro. Por consiguiente, y sólo a modo de ejemplo, no es factible
aceptar la igualdad que se indica a continuación:
x  x
Como esta igualdad es incorrecta, para indicar el hecho de que un estadístico estima a un
parámetro (en este ejemplo, que la media muestral estima al parámetro media poblacional), se
utiliza la conocida simbología de estimador poniéndole un acento circunflejo al parámetro:
x  x , que se lee “mu estimado” o “estimador de mu”.
Idéntico criterio se utiliza para indicar que las restantes estadísticas estiman a los corres-
pondientes parámetros, es decir,
Me = ̂ x
Sx2 = ˆ x2
Sx = ̂ x
hi = p
En todos los casos la simbología utilizada indica que cada uno de los estadísticos estima
al parámetro, que lleva precisamente un acento circunflejo (sombrerito) para señalar que se lo
está estimando.
Ejemplo: En la distribución de frecuencias de la concesionaria calculamos el precio me-

dio de los autos x  92,25 mil $, la proporción de autos nacionales vendidos: hi = 62,50 % y la
varianza muestral s 2x  306,34 mil $2. Estos estadísticos se calcularon con una muestra de 80
clientes.
 un estimador puntual del precio promedio de todos los autos vendidos por la conce-
sionaria es:

 x  x  $92,25 mil
 un estimador puntual de la proporción de autos nacionales es:
p̂  h  62,50 %
i
Estadística I 226
 un estimador puntual para la variancia poblacional y para el desvío estándar


 x2  S2x  306,34 mil $2 ˆ  S  17,50 mil $
x x
PROPIEDADES DE LOS ESTIMADORES PUNTUALES
Un buen estimador debe cumplir con determinadas propiedades. Las más importantes
son:
 Estimador insesgado o no viciado: Se denomina así a aquel estimador cuya esperanza ma-
temática da como resultado el parámetro a estimar.
 Caso del estimador x : se verificará si el estimador media muestral es insesgado o no

viciado. Para ello, calcularemos su esperanza matemática, recordando, que esa media
muestral es una variable y que, como tal, su esperanza matemática puede calcularse.
Aplicando Esperanza, se obtiene el siguiente desarrollo, recordando que:
 la esperanza de una suma de variables es la suma de sus esperanzas, y

 la E (xi )  x .
1  1 1 1 1
E (x)  E
n
 xi   n E xi  n  E (xi )  n  x  n nx  x
con lo cual se ha demostrado que el estimador x es no viciado o insesgado.
A diferencia de la media aritmética, los estimadores mediana (Me) y modo (Mo) son vi-
ciados.
 Caso del estimador hi: Según se ha demostrado en la Teoría de las Muestras la E(hi) = p,
con lo cual se verifica que hi es un estimador no viciado.
 Caso del estimador Sx2: para poder desarrollar esta demostración, debe tenerse presente que:
E( xi  x )2   x2 (1)
 x2
y que E ( x  x ) 2  (2)
n
A partir de esto, se obtiene la esperanza matemática de Sx2 procediendo del siguiente mo-
do:
en la igualdad xi  x  xi  x  x  x
se agrupan los elementos haciendo xi  x  ( xi  x )  ( x  x )
Elevando al cuadrado ambos miembros y sumando:

Estadística I 227
2
  x  xi  x    x  x  
2
 x
 i  
dividiendo la igualdad por n
1 1
 (xi  x) 2   (xi  x )  (x  x ) 
2

n n
 1  ( xi  x ) 2  2( xi  x )( x  x )  ( x  x ) 2  
n  

1
n i x x
1
n i x
1
 ( x   )  2( x   )  x    n( x   ) 
2
n x
2
 
2  2 (x   )  i  n x   (x   ) 2 
 x 
1

n
 i x
( x   ) x 
 n n


x
 

1
n
 xi   x 2  2 x   x    x    
2
x
2

1
n
 xi   x 2  x   x   2
Aplicando Esperanza Matemática, y de acuerdo con lo indicado en (1) y en (2), se obtie-

ne:
1  1 
  i
E (S x2 )  E  ( x  x) 2   E   ( xi  x ) 2  ( x  x ) 2  
  
n  n 
1

n
 E( x   ) 2 E( x   ) 2
i x x
 x2   2
 n 1
2

1 1
  x2   n 2  x   2  x   2  
n n n x n x n x
 n 
con lo cual se verifica que el estimador Sx2 es un estimador viciado o sesgado: su esperanza
matemática no da un resultado igual al parámetro a estimar, porque se obtuvo el parámetro a
estimar acompañado por un coeficiente que, precisamente, convierte al estimador en viciado.
Se verifica, también, que el estimador Sx2 estima al parámetro x por defecto, ya que el coefi-
ciente que acompaña al estimador da un resultado menor que 1.
 Corrección del vicio: Cuando un estimador es viciado, ¿puede corregirse el vicio?. Analiza-
remos la posibilidad de realizar tal corrección en el caso del estimador Sx2, procediendo del
siguiente modo:
1  n 1
E (Sx2 )  E 

n
 (xi  x)2    x2 n
Estadística I 228
Efectuando el pasaje de los términos del coeficiente que acompaña a x al primer miem-
bro de la igualdad, y recordando que la Esperanza es un operador lineal, obtenemos:
n n 1   n 1   1 
E(S2 )  E   (x  x) 2   E   (x  x) 2   E   (x  x) 2    2
n 1 x n 1  n i   n 1 n i   n 1 i  x
con lo que se verifica que la esperanza matemática de un nuevo “estadístico”, que en este caso
es 1  ( xi  x)2 , da como resultado el parámetro variancia poblacional, por lo que ese nuevo
n 1
estadístico es no viciado. Observando con detenimiento, se comprueba que tiene forma de una
varianza, sólo que en lugar de estar dividida por n, lo está por (n-1). Por eso mismo se la deno-
mina varianza corregida y se simboliza con Sc2. Por consiguiente, se ha comprobado que Sc2 es
insesgada o no viciada, por cuanto su esperanza es el parámetro a estimar, es decir que
 1 
E (Sc2 )  E 

 n 1
 (xi  x) 2    x2


donde Sc2 
1
n 1
 
xi  x
2

No siempre es necesario efectuar la corrección del vicio en el caso del estimador Sx2, ya
n
que cuando n crece indefinidamente, el término tiende a la unidad. Luego, si
n 1
n
n  1
n 1
Empíricamente se considera que si el tamaño de la muestra n es menor o igual que 30 se

está trabajando con las llamadas “muestras pequeñas”, en cuyo caso debe efectuarse la correc-
ción, transformando Sx2 en Sc2. En cambio, si n> 30, se está trabajando con “muestras grandes”,
en cuyo caso no debe corregirse el vicio. En este último caso, además, todos los estadísticos tie-
nen distribución normal.
 Cálculo de Sc2: En todos los ejemplos planteados, cuando se debió calcular una medida de
dispersión, se obtuvo el Sx2. En caso de resultar necesario el cálculo de la variancia corregida
Sc 2, se procede del siguiente modo:
 
1 2
Se sabe que: S x2  xi  x
n
 
1 2
y que: Sc2  xi  x
n 1
Por consiguiente, en ambas expresiones, por pasaje de términos, se puede obtener:
 x  x 
2
nS x2  i
Estadística I 229
 x  x 
2
( n  1 )Sc2  i
Se verifica que en estas dos igualdades, sus segundos miembros son iguales, por lo que
también lo serán sus dos primeros miembros. O sea que:
nS x2  ( n  1 )Sc2
a partir de lo cual se despeja Sc2:
n 2
Sc2  Sx
n 1
 Estimador eficiente: Se denomina eficiente a aquel estimador que, de un conjunto de esti-

madores, posee la menor variancia, mientras que al otro estadístico se llama estimador inefi-
ciente.
Hay varios estimadores que estiman al mismo parámetro. Como todos son variables, tienen
una varianza que podría llegar a calcularse. Un ejemplo de ello puede verse en el caso que se
desee estimar la media poblacional: son estimadores posibles la media aritmética o la media-
na. De ambos, la media aritmética posee la menor varianza, por lo que resulta ser un estima-
dor eficiente. Para confirmarlo, bastará saber que así como la varianza de la media aritméti-
ca es x2/n, la varianza de la Mediana es (x2/n)(/2), resultado éste que, como puede verifi-
carse fácilmente, resulta mayor que el anterior.
 Estimador suficiente: Se denomina suficiente a aquel estimador que contiene toda la in-
formación que proviene de la muestra. Para entender este concepto conviene comparar a la
media aritmética con la mediana: la primera contiene toda la información contenida en la
muestra, mientras la segunda no contiene toda la información disponible en la muestra (en
su cálculo no intervienen todos los valores de la variable). Luego, la media aritmética es un
estimador suficiente, mientras que la mediana no lo es.
Hemos desarrollado una serie de demostraciones que han permitido verificar la existencia
de numerosas ventajas y propiedades de la media aritmética. En este punto se detallará ese con-
junto de ventajas, que permiten mostrarla como una herramienta extraordinaria en el campo de la
estadística en general y de la estimación en particular.
Esas ventajas de la media aritmética son:
a) La suma de desvíos respecto de ella es igual a cero.
b) La suma de los desvíos respecto de ella, al cuadrado, es un mínimo.
c) Puede ser considerada una variable en el campo de la teoría de las muestras.
d) Su distribución tiende a ser normal cuando el tamaño de la muestra n   .
e) La media poblacional de su distribución muestral es igual a la media poblacio-

nal de la variable xi, es decir que es no viciada.
Estadística I 230
f) La dispersión de su distribución es menor que la distribución de la variable xi,

es decir que  2   x2 .
x
g) Es suficiente y eficiente.
2. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA LA MEDIA.
La estimación por intervalos es un procedimiento que permite, a partir de un estimador

puntual, encontrar dos valores que limitan un intervalo denominado intervalo de confianza,
dentro del cual puede encontrarse el parámetro a estimar con una cierta probabilidad conocida,
cercana a uno, que se denomina nivel de confianza y que se simboliza NC.
Algo que es común en el caso de la construcción de todos los intervalos de confianza, es

que en primer lugar debe fijarse el nivel de confianza, que es una probabilidad cercana a uno
que se establece de antemano y es fijada por quien encarga el trabajo de estimación (no puede ser
una decisión de quien construye el intervalo). Los valores más comunes (aunque no los únicos)
para el nivel de confianza son: 0,99; 0,95 o 0,90.
El valor de la estimación puntual variará de una muestra a otra, porque en cada muestra
sólo se selecciona una parte de la población. Pero, la distribución de la media muestral, sigue una
distribución normal. Esta información relacionada con el estadístico muestral se toma en cuenta
al desarrollar una estimación por intervalos del parámetro de la población. En lugar de tener una
estimación basada en un solo valor, el intervalo se utiliza para estimar el parámetro de la pobla-
ción. Este intervalo tiene una confianza específica o probabilidad de estimar en forma correcta el
valor real del parámetro de la población.
Un intervalo de confianza para la media poblacional permite especificar la probabilidad

de que incluya el valor de la media poblacional. El nivel de confianza señala el porcentaje a lar-
go plazo de esa clase de intervalos que incluirían el parámetro que se estima.
Sea x y x la media y el desvío estándar de la distribución muestral del estadístico S. En-

tonces, si la distribución muestral de S es en forma aproximadamente normal (lo que es verdade-
ro para muchos estadísticos si el tamaño de la muestra n >30), se puede esperar encontrar un es-
tadístico muestral S real en los intervalos S - S a S + SS - 2S a S + 2SS - 3S a S +
3S aproximadamente el 68,27%; 95,45 % y 99,73 % de las veces, respectivamente.
Los extremos del intervalo se denominan límites de confianza o límites fiduciales.
Necesitamos tomar una única media muestral y estimar una media poblacional desco-
nocida, con cierto grado de confianza o probabilidad.
En una situación real, la media de la población es desconocida y es la cantidad que se de-

be estimar. El desvío estándar de la población rara vez se conoce y suele estimarse con los resul-
tados de la muestra. Supongamos que estamos haciendo un muestreo con reemplazamiento y que
el desvío estándar de la población es conocido.
En este caso, como la variable que se utiliza para estimar la media poblacional es la me-
dia muestral x , y tiene distribución normal, podemos construir un gráfico. En ese gráfico se ob-
Estadística I 231
serva a la variable x tiene distribución normal con media poblacional x  x  y que, como
cualquier variable, puede ser estandarizada mediante su conversión a una variable z i, la cual se

representa en un segundo eje. Recordemos, además, que el desvío estándar de x es igual a x .
n
La estandarización mencionada más arriba se realiza del siguiente modo:
x x
zi  x   x
x x
n
El nivel de confianza (NC) se ubica en el centro de la figura (zona gris) y una vez deter-
minado cuál es su valor, se verifica que existen dos valores de la variable estandarizada zi, simé-
tricos entre sí (-z1 y +z1), tales que la P(z1  zi  z1 ) NC
Reemplazando en este término la variable zi obtenemos la siguiente expresión:
 
 
 x 
P  z1   x  z  NC 
 x 
 
 n 
 
Al efectuar en el interior del paréntesis las transformaciones apropiadas, pasando el tér-

mino que divide en el centro del paréntesis como producto a ambos lados de las desigualdades:
 x x 
P  z1  x  x   z1 
  NC
 n n 
Luego se despeja la media poblacional, dejándola en el centro:
   
P  x  z1 x    x   x  z1 x   NC
 n n
Estadística I 232
Finalmente se multiplica todo por menos uno para modificar los signos, con lo cual cam-
bia también el sentido de las desigualdades:
   
P x  z1 x   x  x  z1 x   NC
 n n
La anterior es una primera expresión para el intervalo de confianza, que está compuesta
por los siguientes elementos:
 x : es el estimador puntual media muestral, que, como toda estadística, puede ser cal-
culada sin ningún inconveniente a partir de la muestra disponible.
 +z1 y –z1: son dos valores simétricos que se obtienen a partir de la tabla de la distribu-
ción normal una vez fijado el valor de NC.
 n: es el tamaño de la muestra y debe ser un dato conocido.
 x: es el desvío estándar poblacional, un parámetro (desconocido). Por consiguiente se

lo reemplaza directamente por su estimador Sx sin efectuar corrección alguna por tra-
tarse de muestras grandes, con lo que, la expresión final del intervalo de confianza pa-
ra estimar la media poblacional queda del siguiente modo.
 S S 
P x  z1 x   x  x  z1 x   NC
 n n
en el que todos los elementos son conocidos y puede calcularse sin inconvenientes.
Por ejemplo, en la concesionaria, el precio promedio de los autos es de $ 92,25 mil, el

desvío estándar es de $ 17,50 mil y n = 80. A partir de los resultados de la muestra podemos
construir un intervalo con un nivel de confianza del 90%, para estimar el precio promedio de to-
dos los autos vendidos por la concesionaria.
 17,50 17,50 
P 92,25  1,64   x  92,25  1,64   0,90
 80 80 
P95,45  x  89,04  0,90
Los intervalos de confianza tienen las siguientes características:
 El intervalo de confianza tiene dos límites que se obtienen sumando y restando un

mismo valor al estimador puntual media muestral ( x ). Estos límites se denominan lí-
mite superior y límite inferior del intervalo de confianza.
 Si el nivel de confianza aumenta, su superficie en el gráfico sería mayor y eso se co-

rrespondería con mayores valores para los z1. En ese caso, a mayor NC, mayor ampli-
tud en el intervalo de confianza. Pero asimismo, una mayor amplitud para el intervalo
Estadística I 233
implica que hay más valores posibles para estimar la media poblacional x, lo que
convierte a la estimación en algo menos precisa, es decir que a mayor amplitud del in-
tervalo, menor precisión en la estimación. Conclusión: a mayor nivel de confianza,
menor precisión en la estimación.
 Si el nivel de confianza llegara a tomar el valor extremo máximo para una probabili-
dad, es decir un valor igual a 1, el valor de los z1 sería, según se puede observar en la
tabla normal, el máximo posible, es decir que los z1 serían iguales a  . En ese caso,
no sería posible obtener resultados para los límites del intervalo de confianza
porque darían un resultado indefinido. Conclusión: no puede exigirse un nivel de
confianza igual a la unidad porque no se obtendrían resultados prácticos para
los límites del intervalo.
 La decisión de tomar al nivel de confianza entre dos valores simétricos de z1 no sólo

es la única solución posible desde el punto de vista de la búsqueda inversa en la ta-
bla; también conduce a un intervalo mínimo, ya que el intervalo conseguido es más
pequeño que cualquier otro que pueda obtenerse tomando los valores de z i de cual-
quier otra forma diferente.
 El nivel de confianza es una probabilidad, es el resultado de realizar un cociente entre

el número de casos favorables sobre el número de casos posibles. Recordando este
concepto, puede decirse entonces que de cada cien intervalos que se construyan, en
una proporción de ellos igual a NC el parámetro quedará encerrado en el inter-
valo construido. Esta es una forma de medir la confianza existente de que en un por-
centaje de los casos se estime correctamente el parámetro desconocido.
3. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA LA PROPORCIÓN.
En este caso se utilizará la estadística hi y el procedimiento no difiere en nada del aplica-

do para los casos de la media. Deberá recordarse, sin embargo, que como toda estadística, el es-
timador hi es una variable que tiene distribución normal con media poblacional h  p y varian-
pq
cia  h2  Si se desea calcular la variancia en un caso concreto, como p y q son parámetros
n
desconocidos, se reemplazan por sus estimadores, p̂  hi y q̂  ( 1  hi )
Por consiguiente, la variable estandarizada zi se construye del siguiente modo:
hi  p
zi 
hi 1  hi 
n
y existirán dos valores de zi, simétricos respecto del origen( -z1 y +z1) tales que
P(z1  zi  z1 )  NC
Reemplazando zi por la expresión indicada más arriba, se tiene que

Estadística I 234
 
 
 hi  p 
P  z1   z1   NC
 hi 1  hi  
 
 n 
En la última expresión algebraica, efectuando en el interior del paréntesis los pasajes de

términos con el propósito de despejar p, objeto de la estimación, finalmente se encuentra que la
 hi 1  hi  h 1  hi  
P hi  z1  p  hi  z1 i   NC
 n n 
 
que constituye el intervalo de confianza buscado.
Ejemplo: En el problema de la concesionaria, se desea realizar una estimación por inter-

valos para la proporción de autos nacionales vendidos con un nivel de confianza del 95 %.
Si hi = 0,6250, luego
pˆ qˆ h (1  h ) (0,625)(0,375)
ˆ   i i
  0,0541
h n n 80
P0,6250  1,96(0,0541)  p  0,6250 1,96(0,0541)  0,95
P(0,7310  p  0,5190)  0,95
4. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA EL DESVÍO ESTÁN-

DAR.
Para construir este intervalo de confianza para estimar el desvío estándar poblacional, el
estimador puntual que se utiliza es Sx. Este estimador es una estadística que, como todas en el
Estadística I 235
caso de muestras grandes, tiene distribución normal con media poblacional  S x  x y con va-
 x2
riancia poblacional  2
Sx  . Esto permite construir la siguiente variable estandarizada zi:
2n
Sx   x
zi 
Sx
2n
Con estos datos, se fija el correspondiente nivel de confianza, para el cual existen dos va-
lores de la variable zi, simétricos, tales que:
P(z1  zi  z1)  NC
En este término, reemplazando zi por la expresión a la que es igual, tenemos:
 
 
 Sx   x
P  z1    z1   NC
 Sx 
 
 2n 
Procediendo del mismo modo que en los casos anteriores, es decir mediante un pasaje de
términos en el interior del paréntesis, se obtiene la siguiente expresión final que permite esti-
mar el desvío estándar poblacional por intervalos de confianza:
 S S 
P S x  z1 x   x  S x  z1 x   NC .
 2n 2n 
Este intervalo se puede convertir en un intervalo para estimar la varianza poblacional

simplemente elevando al cuadrado los términos incluidos dentro del paréntesis:
 Sx 
2
 Sx  
2
P  S x  z1    x   S x  z1
2
   NC
 2n   2n  
Estadística I 236
Ejemplo: En el caso de la concesionaria, se desea estimar por intervalos para el desvío estándar
poblacional de los precios de los autos con una confianza del 99 %.
 17,50 17,50 
P17,50  2,58   x  17,50  2,58   0,99
 80 80 
P22,5479  x  12,4521  0,99
5. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA MUESTRAS PEQUE-

ÑAS.
Debe considerarse que para la construcción de estos intervalos se presentan las siguientes
condiciones:
1 – El tamaño de la muestra es menor o igual que 30.
2 – En ese caso la distribución de las estadísticas suele no ser normal.
3 – El estimador Sx2 de la varianza poblacional es viciado y debe corregirse.
ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIO-

NAL
Para muestras pequeñas, si la variable bajo estudio posee distribución normal, para la
construcción de este intervalo de confianza se utiliza la variable “t de Student:
x  x
t Student 
 x 
2
i x
n (n  1)
Sabiendo que  x   x y modificando el denominador, se obtienen las siguientes dos al-

ternativas de solución:
x  x x  x
tSt  
Sx Sc
n 1 n
v=n–1
Fijado el nivel de confianza, existirán dos valores de la variable tSt, iguales en valor abso-
luto pero de distinto signo, simétricos entre sí, tales que la
P t1  tSt , v  t1   NC

Estadística I 237
 
 
x  
P  t1  x
 t1   NC
 Sx 
 
 n 1 
Efectuando los correspondientes pasajes de términos en el interior del paréntesis de modo

de despejar la media poblacional que debe ser estimada, se obtiene
 Sx Sx 
P x  t1   x  x  t1   NC
 n 1 n 1 
Esta expresión está compuesta por un conjunto de elementos todos conocidos y, por lo
tanto, calculables por lo que el resultado final puede obtenerse sin mayores dificultades.
Ejemplo: Partiendo del ejemplo de la concesionaria se desea investigar la edad de los

compradores, si tomamos una muestra aleatoria de 26 ventas, se trata de un problema de mues-
tras pequeñas. Se calcula la edad media, que resulta ser de 42,62 años y el desvío estándar que es
6,25 años. Se construye un intervalo de confianza para la edad promedio de todos los clientes de
la sucursal, con una confianza del 95 %. En este caso:
t25;0,95  2,06 .
 6,25 6,25 
P 42,62  2,06   x  42.62  2,06   0,95
 25 25 

P 45,19    40,04  0,95
x

ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA VARIANZA POBLA-
CIONAL
Para la construcción de este intervalo de confianza se utiliza  vgl

2
(Chi cuadrado) con ν gra-
dos de libertad.
Estadística I 238
 x  x
2
n S x2
   v2 gl
i
 x2  x2
Fijado el NC, existen dos valores de la variable y) tales que

P 12   v2   22  NC 
Reemplazando la variable por la expresión a la que es igual, se obtiene
 
 nSx2 
P 12   22   NC

  x2 

Invirtiendo la expresión:
 1  x2 1 
P 2  2  2   NC
 1 nS x  2 
 nS x2 nS x2 
P 2   x  2   NC
2
 1 2 
con lo cual se ha encerrado el parámetro a estimar, x, entre dos límites con una cierta probabi-
lidad NC, obteniéndose de ese modo el intervalo de confianza requerido.
Resulta importante destacar que, en este caso, el intervalo de confianza conseguido resul-
tará mínimo si las dos superficies que quedan fuera del NC bajo la curva son iguales, cada una
1  NC
de ellas, a .
2
Ejemplo: Retomando el ejemplo de la concesionaria se desea investigar la variabilidad

de la edad de los compradores. La muestra aleatoria de 26 ventas, dio como resultado un desvío
estándar que es 6,25 años. Se construye un intervalo de confianza para la variancia poblacional,
con un nivel de confianza de 0,90.
Como los valores de 12 y son

Estadística I 239
12;25g .l  37,7  22;25g .l .  14,6
 2639,05 2639,05  0,90

P   2x 
 37,7 14,6 
 
P 26,93   2x  69,54  0,90
ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN PO-

BLACIONAL
No resulta conveniente estimar la proporción poblacional en el caso de muestras peque-

ñas. Fundamentalmente por que, siendo el tamaño de la muestra menor o igual a 30, la propor-
ción muestral hi resulta mucho menos confiable que en el caso de una muestra grande. Adicio-
nalmente, eso también determina que el valor de la varianza de la proporción, que se obtiene ha-
ciendo hi (1-hi), y que interviene en el cálculo de los límites inferior y superior del intervalo de
confianza, estén exageradamente distanciados entre sí, por lo que el intervalo en sí mismo carece
de sentido.
6. CALCULO DEL TAMAÑO DE LA MUESTRA PARA POBLACIONES INFINITAS

Y FINITAS
Tamaño de la muestra para poblaciones infinitas
Para calcular el tamaño de la muestra a utilizar para estimar la media poblacional en po-
blaciones infinitas, se parte de la siguiente negación: la media muestral no es igual a la media
poblacional, por consiguiente
x  x
Como ambos elementos son diferentes, es lógico entender que entre ellos hay una dife-
rencia, que se simbolizará con d, positiva o negativa, y que se denominará margen de error o
tolerancia. Es decir que
x  x  d
Dividimos ambos miembros de esta igualdad por  x

:
x  x d
  z1
x x
x
Siendo  x igual a , se tiene:
n
x  x d
  z1
x x
n n
Estadística I 240
Se toma la segunda parte de la igualdad:

d
 z1
x
n
De allí se despeja n con el siguiente resultado:
z12 x2
n
d2
obteniéndose un primer cálculo para el tamaño de la muestra, para la estimación de la media

poblacional, en poblaciones infinitas.
Si se observa detenidamente la expresión hallada, se verá que el tamaño de la muestra

n depende de los siguientes factores:
 de la varianza de la variable bajo estudio (x2), en forma directa (la varianza apare-
ce multiplicando), con lo cual a mayor variabilidad de la variable bajo estudio,
mayor tamaño de la muestra.
 del valor z1, que representa al coeficiente que indica el grado de confianza exigido
en la estimación, también en forma directa: a mayor grado de confianza exigido,
mayor tamaño de la muestra. Si el grado de confianza fuera igual a 1, z1 sería infi-
nito, por lo que el tamaño de la muestra n   .
 del valor de la tolerancia d, en forma inversa: a mayor margen de error o tole-

rancia admitida, menor tamaño de la muestra. Si la tolerancia fuera cero, eso im-
plicaría que la diferencia entre las medias muestral y poblacional debería ser cero, o,
lo que es lo mismo, ambas media deberían ser iguales, con lo que el n deberá ser igual
al N, es decir, infinito.
Tamaño de la muestra para poblaciones finitas o muestreo sin reposición
El procedimiento que se sigue es similar al utilizado para poblaciones infinitas, sólo que
en el momento de reemplazar  x , se recurre a la fórmula del desvío estándar para poblaciones
finitas o sin reposición, lo cual dará la siguiente igualdad:
d
 z1
x N  n
n N 1
Operando para despejar n, se obtiene la siguiente fórmula:

Estadística I 241
z12 x2 N
n 2
d  N  1  z12 x2
Puede verificarse fácilmente que si en la última fórmula deducida N→  , aplicando al-
gún método de resolución de casos indeterminados (Regla de L´Hopital, por ejemplo), se obtiene
la que corresponde a los casos para poblaciones infinitas.
ANÁLISIS DE LA TOLERANCIA O MARGEN DE ERROR
Para poder efectuar empíricamente el cálculo del tamaño de la muestra, el valor que in-
terviene en la fórmula correspondiente a la tolerancia d se suele presentar como un porcentaje
de alguno de los valores conocidos en juego. En este caso aparece el concepto de tolerancia
relativa, es un porcentaje del valor de la media muestral, que es, precisamente, el valor que se ha
obtenido para la estimación de la media poblacional.
Ejemplo: En la concesionaria se desea evaluar el precio promedio de los autos vendidos,

cuál debería ser el tamaño de la muestra si se desea efectuar el trabajo de estimación con una
confianza del 95 % y una tolerancia relativa del 10 % respecto del valor estimado para la media
poblacional.
Como la media muestral resultó igual a $ 92,25 mil, el 10 % es 9,225; el nivel de con-
fianza del 95 % se corresponde con un valor de z1=1,96, y la varianza (desconocida) se reempla-
za por su estimador, igual a 306,25 miles de $2. Con estos datos, aplicando la fórmula que co-
rresponde a un tamaño de población infinita, tenemos:
z12  2x 1,96 2306,25

n   13,82  14 clientes
d2 9,2252
(siempre se redondea hacia arriba).
Si trabajamos con una muestra de un tamaño determinado se puede obtener el valor por-
centual de la tolerancia relativa d, con los datos disponibles. Para ello, a partir de la fórmula para
n y mediante pasaje de términos, se obtiene una fórmula de cálculo para d.
z12 x2
d
n
En el ejemplo de la concesionaria, la muestra tomada fue de 80 cliente, con ese tamaño

de muestra calculamos la tolerancia
1,96 2 306,25
d  3,8349 miles de $
80
La tolerancia relativa se obtiene dividiendo el valor de d por la media aritmética (y luego

se multiplica por 100 ese resultado para convertirlo en un valor porcentual), entonces:
Estadística I 242
d 3,8349
  0,0416  d  4,16%
x 92,25
PREGUNTAS TEÓRICAS
1) La E S x2   E Sc2 
a) Siempre
b) Nunca
c) A veces
2) En un intervalo de confianza, a mayor precisión exigida, ¿cómo varía el tamaño del

intervalo?
a) Aumenta
b) Disminuye
c) No varía
3) Con una muestra de tamaño 17 se obtuvieron estos resultados:  xi  340 y
 xi2  7.888 ¿Cuál es el valor del estimador puntual no viciado de  x ?
a) 20
b) 64
c) 340

Estadística

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estadística

Enviado por

Direitos autorais:

Formatos disponíveis

Estadística I 224

Unidad XIII- TEORÍA DE LA ESTIMACIÓN ESTADÍSTICA

Un importante problema de la inferencia estadística es la estimación de parámetros po-

En síntesis, los valores muestrales conocidos, llamados estadísticos, se convierten en es-

La “Teoría de la Estimación Estadística” es la parte de la Inferencia Estadística que

En estos procedimientos los valores muestrales conocidos, las “estadísticas”, se convier-

El siguiente cuadro permite apreciar más claramente el tema:

CONCEPTOS EN LA MUESTRA EN LA POBLACIÓN

Hay dos tipos fundamentales de estimaciones:

 Estimación puntual: es un procedimiento de estimación en el que se estima al pará-

 Estimación por intervalos: es un procedimiento que permite, a partir de un estima-

x  x , que se lee “mu estimado” o “estimador de mu”.

Ejemplo: En la distribución de frecuencias de la concesionaria calculamos el precio me-

 un estimador puntual de la proporción de autos nacionales es:

 un estimador puntual para la variancia poblacional y para el desvío estándar

PROPIEDADES DE LOS ESTIMADORES PUNTUALES

 Caso del estimador x : se verificará si el estimador media muestral es insesgado o no

Aplicando Esperanza, se obtiene el siguiente desarrollo, recordando que:

 la esperanza de una suma de variables es la suma de sus esperanzas, y

se agrupan los elementos haciendo xi  x  ( xi  x )  ( x  x )

Elevando al cuadrado ambos miembros y sumando:

dividiendo la igualdad por n

Aplicando Esperanza Matemática, y de acuerdo con lo indicado en (1) y en (2), se obtie-

Empíricamente se considera que si el tamaño de la muestra n es menor o igual que 30 se

Por consiguiente, en ambas expresiones, por pasaje de términos, se puede obtener:

 Estimador eficiente: Se denomina eficiente a aquel estimador que, de un conjunto de esti-

Esas ventajas de la media aritmética son:

a) La suma de desvíos respecto de ella es igual a cero.

b) La suma de los desvíos respecto de ella, al cuadrado, es un mínimo.

c) Puede ser considerada una variable en el campo de la teoría de las muestras.

d) Su distribución tiende a ser normal cuando el tamaño de la muestra n   .

e) La media poblacional de su distribución muestral es igual a la media poblacio-

f) La dispersión de su distribución es menor que la distribución de la variable xi,

2. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA LA MEDIA.

La estimación por intervalos es un procedimiento que permite, a partir de un estimador

Algo que es común en el caso de la construcción de todos los intervalos de confianza, es

Un intervalo de confianza para la media poblacional permite especificar la probabilidad

Sea x y x la media y el desvío estándar de la distribución muestral del estadístico S. En-

Los extremos del intervalo se denominan límites de confianza o límites fiduciales.

En una situación real, la media de la población es desconocida y es la cantidad que se de-

La estandarización mencionada más arriba se realiza del siguiente modo:

Reemplazando en este término la variable zi obtenemos la siguiente expresión:

Al efectuar en el interior del paréntesis las transformaciones apropiadas, pasando el tér-

Luego se despeja la media poblacional, dejándola en el centro:

 n: es el tamaño de la muestra y debe ser un dato conocido.

 x: es el desvío estándar poblacional, un parámetro (desconocido). Por consiguiente se

Por ejemplo, en la concesionaria, el precio promedio de los autos es de $ 92,25 mil, el

P95,45  x  89,04  0,90

Los intervalos de confianza tienen las siguientes características:

 El intervalo de confianza tiene dos límites que se obtienen sumando y restando un

 Si el nivel de confianza aumenta, su superficie en el gráfico sería mayor y eso se co-

 La decisión de tomar al nivel de confianza entre dos valores simétricos de z1 no sólo

 El nivel de confianza es una probabilidad, es el resultado de realizar un cociente entre

3. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA LA PROPORCIÓN.

En este caso se utilizará la estadística hi y el procedimiento no difiere en nada del aplica-

Por consiguiente, la variable estandarizada zi se construye del siguiente modo:

Reemplazando zi por la expresión indicada más arriba, se tiene que

En la última expresión algebraica, efectuando en el interior del paréntesis los pasajes de

que constituye el intervalo de confianza buscado.

Ejemplo: En el problema de la concesionaria, se desea realizar una estimación por inter-

P0,6250  1,96(0,0541)  p  0,6250 1,96(0,0541)  0,95

P(0,7310  p  0,5190)  0,95

4. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA EL DESVÍO ESTÁN-

En este término, reemplazando zi por la expresión a la que es igual, tenemos: