Escolar Documentos
Profissional Documentos
Cultura Documentos
La teoría del muestreo puede emplearse para obtener información acerca de muestras ex-
traídas al azar de una población conocida. Sin embargo, desde un punto de vista práctico, es fre-
cuentemente más importante el poder inferir información sobre una población mediante muestras
extraídas de ellas. Estos problemas son tratados en la inferencia estadística, basándose en la teo-
ría del muestreo.
ESTIMACIÓN PUNTUAL
Los estimadores puntuales están constituidos por las estadísticos, denominación que se
da a los cálculos muestrales conocidos que permiten estimar a los correspondientes valores po-
blacionales desconocidos, denominados parámetros. Los estadísticos a los que se hace referen-
cia son, por ejemplo: la media muestral x ; la mediana Me; la variancia muestral Sx2; el desvío
estándar Sx; la proporción muestral hi. Cada uno de ellos estima al correspondiente parámetro,
es decir, a la media poblacional x; a la variancia poblacionalx2; al desvío estándar poblacional
x; o a la proporción poblacional p.
Siendo los estadísticos variables y los parámetros fijos, es imposible considerar que un
estadístico sea igual a un parámetro. Por consiguiente, y sólo a modo de ejemplo, no es factible
aceptar la igualdad que se indica a continuación:
x x
Como esta igualdad es incorrecta, para indicar el hecho de que un estadístico estima a un
parámetro (en este ejemplo, que la media muestral estima al parámetro media poblacional), se
utiliza la conocida simbología de estimador poniéndole un acento circunflejo al parámetro:
Idéntico criterio se utiliza para indicar que las restantes estadísticas estiman a los corres-
pondientes parámetros, es decir,
Me = ̂ x
Sx2 = ˆ x2
Sx = ̂ x
hi = p
En todos los casos la simbología utilizada indica que cada uno de los estadísticos estima
al parámetro, que lleva precisamente un acento circunflejo (sombrerito) para señalar que se lo
está estimando.
un estimador puntual del precio promedio de todos los autos vendidos por la conce-
sionaria es:
x x $92,25 mil
p̂ h 62,50 %
i
Estadística I 226
Un buen estimador debe cumplir con determinadas propiedades. Las más importantes
son:
Estimador insesgado o no viciado: Se denomina así a aquel estimador cuya esperanza ma-
temática da como resultado el parámetro a estimar.
1 1 1 1 1
E (x) E
n
xi n E xi n E (xi ) n x n nx x
con lo cual se ha demostrado que el estimador x es no viciado o insesgado.
A diferencia de la media aritmética, los estimadores mediana (Me) y modo (Mo) son vi-
ciados.
Caso del estimador hi: Según se ha demostrado en la Teoría de las Muestras la E(hi) = p,
con lo cual se verifica que hi es un estimador no viciado.
Caso del estimador Sx2: para poder desarrollar esta demostración, debe tenerse presente que:
E( xi x )2 x2 (1)
x2
y que E ( x x ) 2 (2)
n
A partir de esto, se obtiene la esperanza matemática de Sx2 procediendo del siguiente mo-
do:
en la igualdad xi x xi x x x
2
x xi x x x
2
x
i
1 1
(xi x) 2 (xi x ) (x x )
2
n n
1 ( xi x ) 2 2( xi x )( x x ) ( x x ) 2
n
1
n i x x
1
n i x
1
( x ) 2( x ) x n( x )
2
n x
2
2 2 (x ) i n x (x ) 2
x
1
n
i x
( x ) x
n n
x
1
n
xi x 2 2 x x x
2
x
2
1
n
xi x 2 x x 2
x2 2
n 1
2
1 1
x2 n 2 x 2 x 2
n n n x n x n x
n
con lo cual se verifica que el estimador Sx2 es un estimador viciado o sesgado: su esperanza
matemática no da un resultado igual al parámetro a estimar, porque se obtuvo el parámetro a
estimar acompañado por un coeficiente que, precisamente, convierte al estimador en viciado.
Se verifica, también, que el estimador Sx2 estima al parámetro x por defecto, ya que el coefi-
ciente que acompaña al estimador da un resultado menor que 1.
Corrección del vicio: Cuando un estimador es viciado, ¿puede corregirse el vicio?. Analiza-
remos la posibilidad de realizar tal corrección en el caso del estimador Sx2, procediendo del
siguiente modo:
1 n 1
E (Sx2 ) E
n
(xi x)2 x2 n
Estadística I 228
Efectuando el pasaje de los términos del coeficiente que acompaña a x al primer miem-
bro de la igualdad, y recordando que la Esperanza es un operador lineal, obtenemos:
n n 1 n 1 1
E(S2 ) E (x x) 2 E (x x) 2 E (x x) 2 2
n 1 x n 1 n i n 1 n i n 1 i x
con lo que se verifica que la esperanza matemática de un nuevo “estadístico”, que en este caso
es 1 ( xi x)2 , da como resultado el parámetro variancia poblacional, por lo que ese nuevo
n 1
estadístico es no viciado. Observando con detenimiento, se comprueba que tiene forma de una
varianza, sólo que en lugar de estar dividida por n, lo está por (n-1). Por eso mismo se la deno-
mina varianza corregida y se simboliza con Sc2. Por consiguiente, se ha comprobado que Sc2 es
insesgada o no viciada, por cuanto su esperanza es el parámetro a estimar, es decir que
1
E (Sc2 ) E
n 1
(xi x) 2 x2
donde Sc2
1
n 1
xi x
2
No siempre es necesario efectuar la corrección del vicio en el caso del estimador Sx2, ya
n
que cuando n crece indefinidamente, el término tiende a la unidad. Luego, si
n 1
n
n 1
n 1
Cálculo de Sc2: En todos los ejemplos planteados, cuando se debió calcular una medida de
dispersión, se obtuvo el Sx2. En caso de resultar necesario el cálculo de la variancia corregida
Sc 2, se procede del siguiente modo:
1 2
Se sabe que: S x2 xi x
n
1 2
y que: Sc2 xi x
n 1
x x
2
nS x2 i
Estadística I 229
x x
2
( n 1 )Sc2 i
Se verifica que en estas dos igualdades, sus segundos miembros son iguales, por lo que
también lo serán sus dos primeros miembros. O sea que:
nS x2 ( n 1 )Sc2
a partir de lo cual se despeja Sc2:
n 2
Sc2 Sx
n 1
Hay varios estimadores que estiman al mismo parámetro. Como todos son variables, tienen
una varianza que podría llegar a calcularse. Un ejemplo de ello puede verse en el caso que se
desee estimar la media poblacional: son estimadores posibles la media aritmética o la media-
na. De ambos, la media aritmética posee la menor varianza, por lo que resulta ser un estima-
dor eficiente. Para confirmarlo, bastará saber que así como la varianza de la media aritméti-
ca es x2/n, la varianza de la Mediana es (x2/n)(/2), resultado éste que, como puede verifi-
carse fácilmente, resulta mayor que el anterior.
Estimador suficiente: Se denomina suficiente a aquel estimador que contiene toda la in-
formación que proviene de la muestra. Para entender este concepto conviene comparar a la
media aritmética con la mediana: la primera contiene toda la información contenida en la
muestra, mientras la segunda no contiene toda la información disponible en la muestra (en
su cálculo no intervienen todos los valores de la variable). Luego, la media aritmética es un
estimador suficiente, mientras que la mediana no lo es.
Hemos desarrollado una serie de demostraciones que han permitido verificar la existencia
de numerosas ventajas y propiedades de la media aritmética. En este punto se detallará ese con-
junto de ventajas, que permiten mostrarla como una herramienta extraordinaria en el campo de la
estadística en general y de la estimación en particular.
El valor de la estimación puntual variará de una muestra a otra, porque en cada muestra
sólo se selecciona una parte de la población. Pero, la distribución de la media muestral, sigue una
distribución normal. Esta información relacionada con el estadístico muestral se toma en cuenta
al desarrollar una estimación por intervalos del parámetro de la población. En lugar de tener una
estimación basada en un solo valor, el intervalo se utiliza para estimar el parámetro de la pobla-
ción. Este intervalo tiene una confianza específica o probabilidad de estimar en forma correcta el
valor real del parámetro de la población.
Necesitamos tomar una única media muestral y estimar una media poblacional desco-
nocida, con cierto grado de confianza o probabilidad.
En este caso, como la variable que se utiliza para estimar la media poblacional es la me-
dia muestral x , y tiene distribución normal, podemos construir un gráfico. En ese gráfico se ob-
Estadística I 231
serva a la variable x tiene distribución normal con media poblacional x x y que, como
cualquier variable, puede ser estandarizada mediante su conversión a una variable z i, la cual se
representa en un segundo eje. Recordemos, además, que el desvío estándar de x es igual a x .
n
x x
zi x x
x x
n
El nivel de confianza (NC) se ubica en el centro de la figura (zona gris) y una vez deter-
minado cuál es su valor, se verifica que existen dos valores de la variable estandarizada zi, simé-
tricos entre sí (-z1 y +z1), tales que la P(z1 zi z1 ) NC
x
P z1 x z NC
x
n
x x
P z1 x x z1
NC
n n
P x z1 x x x z1 x NC
n n
Estadística I 232
Finalmente se multiplica todo por menos uno para modificar los signos, con lo cual cam-
bia también el sentido de las desigualdades:
P x z1 x x x z1 x NC
n n
La anterior es una primera expresión para el intervalo de confianza, que está compuesta
por los siguientes elementos:
x : es el estimador puntual media muestral, que, como toda estadística, puede ser cal-
culada sin ningún inconveniente a partir de la muestra disponible.
+z1 y –z1: son dos valores simétricos que se obtienen a partir de la tabla de la distribu-
ción normal una vez fijado el valor de NC.
S S
P x z1 x x x z1 x NC
n n
en el que todos los elementos son conocidos y puede calcularse sin inconvenientes.
17,50 17,50
P 92,25 1,64 x 92,25 1,64 0,90
80 80
implica que hay más valores posibles para estimar la media poblacional x, lo que
convierte a la estimación en algo menos precisa, es decir que a mayor amplitud del in-
tervalo, menor precisión en la estimación. Conclusión: a mayor nivel de confianza,
menor precisión en la estimación.
Si el nivel de confianza llegara a tomar el valor extremo máximo para una probabili-
dad, es decir un valor igual a 1, el valor de los z1 sería, según se puede observar en la
tabla normal, el máximo posible, es decir que los z1 serían iguales a . En ese caso,
no sería posible obtener resultados para los límites del intervalo de confianza
porque darían un resultado indefinido. Conclusión: no puede exigirse un nivel de
confianza igual a la unidad porque no se obtendrían resultados prácticos para
los límites del intervalo.
hi p
zi
hi 1 hi
n
y existirán dos valores de zi, simétricos respecto del origen( -z1 y +z1) tales que
P(z1 zi z1 ) NC
hi p
P z1 z1 NC
hi 1 hi
n
hi 1 hi h 1 hi
P hi z1 p hi z1 i NC
n n
Si hi = 0,6250, luego
pˆ qˆ h (1 h ) (0,625)(0,375)
ˆ i i
0,0541
h n n 80
Para construir este intervalo de confianza para estimar el desvío estándar poblacional, el
estimador puntual que se utiliza es Sx. Este estimador es una estadística que, como todas en el
Estadística I 235
caso de muestras grandes, tiene distribución normal con media poblacional S x x y con va-
x2
riancia poblacional 2
Sx . Esto permite construir la siguiente variable estandarizada zi:
2n
Sx x
zi
Sx
2n
Con estos datos, se fija el correspondiente nivel de confianza, para el cual existen dos va-
lores de la variable zi, simétricos, tales que:
P(z1 zi z1) NC
Sx x
P z1 z1 NC
Sx
2n
Procediendo del mismo modo que en los casos anteriores, es decir mediante un pasaje de
términos en el interior del paréntesis, se obtiene la siguiente expresión final que permite esti-
mar el desvío estándar poblacional por intervalos de confianza:
S S
P S x z1 x x S x z1 x NC .
2n 2n
Sx
2
Sx
2
P S x z1 x S x z1
2
NC
2n 2n
Estadística I 236
Ejemplo: En el caso de la concesionaria, se desea estimar por intervalos para el desvío estándar
poblacional de los precios de los autos con una confianza del 99 %.
17,50 17,50
P17,50 2,58 x 17,50 2,58 0,99
80 80
Debe considerarse que para la construcción de estos intervalos se presentan las siguientes
condiciones:
Para muestras pequeñas, si la variable bajo estudio posee distribución normal, para la
construcción de este intervalo de confianza se utiliza la variable “t de Student:
x x
t Student
x
2
i x
n (n 1)
v=n–1
Fijado el nivel de confianza, existirán dos valores de la variable tSt, iguales en valor abso-
luto pero de distinto signo, simétricos entre sí, tales que la
x
P t1 x
t1 NC
Sx
n 1
Sx Sx
P x t1 x x t1 NC
n 1 n 1
Esta expresión está compuesta por un conjunto de elementos todos conocidos y, por lo
tanto, calculables por lo que el resultado final puede obtenerse sin mayores dificultades.
t25;0,95 2,06 .
6,25 6,25
P 42,62 2,06 x 42.62 2,06 0,95
25 25
P 45,19 40,04 0,95
x
ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA VARIANZA POBLA-
CIONAL
x x
2
n S x2
v2 gl
i
x2 x2
P 12 v2 22 NC
Reemplazando la variable por la expresión a la que es igual, se obtiene
nSx2
P 12 22 NC
x2
Invirtiendo la expresión:
1 x2 1
P 2 2 2 NC
1 nS x 2
nS x2 nS x2
P 2 x 2 NC
2
1 2
con lo cual se ha encerrado el parámetro a estimar, x, entre dos límites con una cierta probabi-
lidad NC, obteniéndose de ese modo el intervalo de confianza requerido.
Resulta importante destacar que, en este caso, el intervalo de confianza conseguido resul-
tará mínimo si las dos superficies que quedan fuera del NC bajo la curva son iguales, cada una
1 NC
de ellas, a .
2
P 26,93 2x 69,54 0,90
Para calcular el tamaño de la muestra a utilizar para estimar la media poblacional en po-
blaciones infinitas, se parte de la siguiente negación: la media muestral no es igual a la media
poblacional, por consiguiente
x x
Como ambos elementos son diferentes, es lógico entender que entre ellos hay una dife-
rencia, que se simbolizará con d, positiva o negativa, y que se denominará margen de error o
tolerancia. Es decir que
x x d
x
Siendo x igual a , se tiene:
n
x x d
z1
x x
n n
Estadística I 240
z12 x2
n
d2
de la varianza de la variable bajo estudio (x2), en forma directa (la varianza apare-
ce multiplicando), con lo cual a mayor variabilidad de la variable bajo estudio,
mayor tamaño de la muestra.
del valor z1, que representa al coeficiente que indica el grado de confianza exigido
en la estimación, también en forma directa: a mayor grado de confianza exigido,
mayor tamaño de la muestra. Si el grado de confianza fuera igual a 1, z1 sería infi-
nito, por lo que el tamaño de la muestra n .
El procedimiento que se sigue es similar al utilizado para poblaciones infinitas, sólo que
en el momento de reemplazar x , se recurre a la fórmula del desvío estándar para poblaciones
finitas o sin reposición, lo cual dará la siguiente igualdad:
d
z1
x N n
n N 1
z12 x2 N
n 2
d N 1 z12 x2
Puede verificarse fácilmente que si en la última fórmula deducida N→ , aplicando al-
gún método de resolución de casos indeterminados (Regla de L´Hopital, por ejemplo), se obtiene
la que corresponde a los casos para poblaciones infinitas.
Para poder efectuar empíricamente el cálculo del tamaño de la muestra, el valor que in-
terviene en la fórmula correspondiente a la tolerancia d se suele presentar como un porcentaje
de alguno de los valores conocidos en juego. En este caso aparece el concepto de tolerancia
relativa, es un porcentaje del valor de la media muestral, que es, precisamente, el valor que se ha
obtenido para la estimación de la media poblacional.
Como la media muestral resultó igual a $ 92,25 mil, el 10 % es 9,225; el nivel de con-
fianza del 95 % se corresponde con un valor de z1=1,96, y la varianza (desconocida) se reempla-
za por su estimador, igual a 306,25 miles de $2. Con estos datos, aplicando la fórmula que co-
rresponde a un tamaño de población infinita, tenemos:
Si trabajamos con una muestra de un tamaño determinado se puede obtener el valor por-
centual de la tolerancia relativa d, con los datos disponibles. Para ello, a partir de la fórmula para
n y mediante pasaje de términos, se obtiene una fórmula de cálculo para d.
z12 x2
d
n
1,96 2 306,25
d 3,8349 miles de $
80
d 3,8349
0,0416 d 4,16%
x 92,25
PREGUNTAS TEÓRICAS
1) La E S x2 E Sc2
a) Siempre
b) Nunca
c) A veces
b) Disminuye
c) No varía
a) 20
b) 64
c) 340