Escolar Documentos
Profissional Documentos
Cultura Documentos
SEMANA 3
Muestras aleatorias y
distribuciones de muestreo
IACC
1
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
APRENDIZAJES ESPERADOS
IACC
2
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
IACC
3
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
INTRODUCCIÓN
Los métodos estadísticos que buscan hacer verá perjudicada en sus ganancias y si está
inferencias sobre una población utilizan cargando menos, la empresa se expone a
muestras para poder obtener sus sanciones tanto de intermediarios como
conclusiones. La estadística inferencial se también de clientes. Si diariamente se
puede dividir en dos grandes áreas: envasan 10.000 bolsas de azúcar, lógicamente
estimación de parámetros y pruebas de sería inoperante pesar cada una. Además,
hipótesis. estando envasado el azúcar se incurriría en
Supóngase una nuevos costos tener que abrir la mercadería
máquina que llena para sacar o meter más azúcar según
bolsas de 1 kg de corresponda. Lo más probable es que el
azúcar. El ingeniero ingeniero esté interesado en obtener pesos
a cargo de testear que efectivamente la promedio y no algún peso en particular de
máquina vierta 1 kg en cada bolsa debe una bolsa.
garantizar que exactamente ese sea el peso, Por todo esto, es adecuado elegir muestras
ya que si está cargando más la empresa se que sean aleatorias para testear.
IACC
4
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
1. MUESTRAS ALEATORIAS
Siguiendo con el ejemplo de las bolsas de azúcar, es posible que el ingeniero a cargo considere que
la población de los pesos de las bolsas de azúcar producidas en un día (se refiere a todas las bolsas
de azúcar) tiene una distribución normal con media 𝜇 y varianza 𝜎 2 . Puede hacerse referencia a este
hecho diciendo que la población es normal o que es una población normalmente distribuida.
Como en la mayoría de los problemas de inferencia estadística es imposible medir a toda la
población por los altos costos asociados, es razonable seleccionar un subconjunto de las
observaciones. Para garantizar que los resultados obtenidos a partir de estas muestras representen
realmente a la población, es necesario seleccionar muestras aleatorias.
IACC
5
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
distribución normal. Después de recopilar los datos, los valores numéricos de los tiempos de
duración observados se denotan por X1, X2, …, Xn.
El propósito principal de la toma de una muestra aleatoria es obtener información sobre los
parámetros no conocidos de una población.
Por ejemplo, podría ser relevante conocer la proporción de habitantes de Santiago que beben
alcohol. Se llama p al valor desconocido de esta proporción. Entonces se toma una muestra y se
calcula p que es la proporción de personas en la muestra que beben alcohol. p se calcula dividiendo
el número de personas bebedoras en la muestra por el total de personas consideradas en la
muestra. Por lo tanto, p es una función de los valores observados en la muestra aleatoria.
Puesto que es posible obtener muchas muestras aleatorias de una población, el valor p cambiará
de una a otra. Entonces, p es una variable aleatoria que se conoce como estadístico1.
https://www.youtube.com/watch?v=pKg7GV-zd9Q
1Un estadístico es cualquier función de las observaciones contenidas en una muestra. Como una
estadística es una variable aleatoria, esta tiene función de probabilidad.
IACC
6
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
DISTRIBUCIÓN MUESTRAL
Estos parámetros poblacionales desconocidos serán estimados por los llamados estimadores
puntuales. La siguiente es la lista de estimadores puntuales para cada parámetro:
Los estadísticos son la base de construcción de los estimadores de parámetros, ya que son la medida
más práctica a partir de una muestra para tratar de estimar el valor de un parámetro poblacional.
IACC
7
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
Parámetro Estadístico
Media poblacional Media muestral
Proporción poblacional Proporción muestral
Varianza poblacional Varianza muestral
IACC
8
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
Solución
6 + 3 + 8 + 2 + 1 20
𝑥̅ = = =4
5 5
No hay moda
|(𝑥𝑖 − 𝑥̅ )| (6 − 4) + (3 − 4) + (8 − 4) + (2 − 4) + (1 − 4)
𝐷𝑀 = =| |
𝑛 5
2 + 1 + 4 + 2 + 3 12
= =
5 5
Varianza
4 + 1 + 16 + 4 + 9 34
𝜎2 = =
5 5
Desviación estándar
34
𝜎 = √𝜎 2 = √
5
IACC
9
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
2. DISTRIBUCIÓN DE MUESTREOS
Una población involucra a todos los datos y una porción representativa de esta se llama muestra.
Las muestras juegan un papel muy importante en la estadística, ya que usualmente es imposible o
muy costoso analizar a la población entera. La información obtenida de una muestra o de un grupo
de muestras es útil para parámetros desconocidos de una población, tales como la media y la
varianza.
Dado que se supone que las muestras son aleatorias, la distribución de una estadística es un tipo de
modelo de probabilidad conjunta para variables aleatorias independientes, en donde cada variable
posee una función de densidad de probabilidad igual a la de las demás. De manera general, la
distribución de muestreo de una estadística no tiene la misma forma que la función de densidad de
probabilidad en la distribución de la población
IACC
10
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
Se agrupan las 20 realizaciones en cinco clases y se obtienen las frecuencias relativas como aparecen
en la siguiente tabla.
De acuerdo con los valores obtenidos de las frecuencias relativas se puede construir el siguiente
gráfico:
A partir de estas frecuencias relativas es evidente que la más alta concentración de tiempos de
duración promedio se encuentra entre 147,6 y 151,0 horas, en donde los tiempos de duración
IACC
11
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
promedio por debajo de 144 horas o por encima de 154,6 tienen una probabilidad muy pequeña.
La distribución de muestreo de una estadística hace posible este tipo de análisis de probabilidad,
esencial para valorar el riesgo inherente cuando se formulan inferencias. Además, se observa que
la distribución de medias muestrales describe aproximadamente una curva normal. A medida que
el número de muestras aumenta, la gráfica se convierte exactamente en una curva normal.
una población normal con media y varianza 𝜎 2 . Cada observación de la muestra X1, X2, …, Xn es
una variable aleatoria normal y distribuida independientemente, con media y varianza 𝜎 2 .
Si se obtienen muestras de una población que tiene una distribución de probabilidad desconocida,
𝜎2
la distribución muestral de la media muestral seguirá siendo normal con media y varianza 𝑛
, si el
tamaño n es grande.
𝑥̅ − 𝜇
𝑍=𝜎 ~𝑁(0,1) 𝑠𝑖 𝑛 → ∞
⁄ 𝑛
√
IACC
12
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
EJEMPLO: El peso de un producto en kilogramos sigue una distribución normal con media 30 y
desviación típica 3. Un empresario decide aceptar un lote de 600 unidades que le envía el proveedor,
si al elegir 5 unidades de dicho producto al azar encuentra que su peso medio no es menor que 29.
Calcular la probabilidad de que rechace el lote.
𝜎
Solución: Recuerda que x̅ es la media muestral y que μ es la media poblacional con N(μ, ), es
√𝑁
muy importante tener en cuenta el vocabulario para entender que nos están preguntado.
3
𝑥̅ ~𝑁(30, ; 𝑍~𝑁(0,1)
√5
𝑥̅ − 𝜇 29 − 30
𝑍=𝜎 = = −0,75
⁄ 𝑛 3⁄
√ √5
30−29
𝑃(𝑥̅ < 29) = 𝑃 (𝑍 < 3 ) = 𝑃(𝑍 < −0,75) =0,2266 (Debes usar la tabla de la distribución
√5
normal de la semana 2)
𝑥̅ − 𝜇 29 − 30
𝑍=𝜎 = = −0,75
⁄ 𝑛 3⁄
√ √5
IACC
13
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
EJEMPLO: Se sabe que el saldo promedio para los clientes de una tarjeta de crédito de cierto banco
que la media es de $14.350 con una desviación estándar de $6.500. Del listado de clientes se obtiene
una muestra aleatoria de 49 clientes. ¿Cuál es la probabilidad de que la muestra tenga un promedio
mayor que $17.500?
𝜎
Solución: Recuerda que x̅ es la media muestral y que μ es la media poblacional con N(μ, ), es
√𝑁
muy importante tener en cuenta el vocabulario para entender que nos están preguntado.
6500
𝑥̅ ~𝑁(14350, ; 𝑍~𝑁(0,1)
√49
𝑥̅ − 𝜇 17500 − 14350
𝑍=𝜎 = = 3,39
⁄ 𝑛 6500⁄
√ √49
17500−14350
𝑃 (𝑍 > 6500⁄ ) = 1 − 𝑃(𝑍 > 3,36) =0,003 (Debes usar la tabla de la distribución normal de
√49
la semana 2)
EJEMPLO: Una compañía electrónica fabrica resistores que tienen una resistencia promedio de 100
𝛺 y una desviación estándar de 10 𝛺. La distribución de la resistencia es normal.
Hallar la probabilidad que al tomar una muestra n=25 resistores, la resistencia promedio de estos
sea menor que 95𝛺 .
𝜎
Solución: Recuerda que x̅ es la media muestral y que μ es la media poblacional con N(μ, ), es
√𝑁
muy importante tener en cuenta el vocabulario para entender que nos están preguntado.
IACC
14
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
10
𝑥̅ ~𝑁(100, ); 𝑍~𝑁(0,1)
√25
𝑥̅ − 𝜇 95 − 100
𝑍=𝜎 = = −2,5
⁄ 𝑛 10⁄
√ √29
𝑃(𝑍 < −2,5) = 0,0062 (Debes usar la tabla de la distribución normal de la semana 2)
IACC
15
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
grandes (𝑛1 ≥ 30 𝑦 𝑛2 ≥ 30), la distribución de muestreo de 𝑥̅1 − 𝑥̅2 es normal con media 𝜇1 − 𝜇2
𝜎1 𝜎2
y varianza 𝑛 + 𝑛 .
1 2
Observación:
a) Si las poblaciones tienen una distribución normal, entonces ̅̅̅
𝑥1 − 𝑥̅2 sigue una distribución
normal.
b) Si ambas poblaciones son normales, entonces ̅̅̅
𝑥1 − 𝑥̅2 sigue una distribución normal sin
importar los valores que tengan 𝑛1 𝑦 𝑛2 .
IACC
16
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
IACC
17
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
A un cliente le da lo mismo que un producto funcione bien “en promedio”, lo que le interesa es que
funcione el que ha comprado. Se puede obtener productos de calidad en un proceso de producción
si este tiene una baja varianza poblacional, de manera que es menor el número de unidades que
tienen un nivel de calidad inferior al deseado. Comprendiendo la distribución de las varianzas
muestrales en el muestreo, se puede hacer inferencias sobre la varianza poblacional. Por lo tanto,
es posible identificar y corregir los procesos que tienen una elevada varianza. Además, cuando la
varianza poblacional es menor, se pueden hacer mejores inferencias sobre las medias poblacionales,
utilizando medias muestrales.
Dado que la dispersión es una consideración tan importante como la tendencia central, el significado
de s2 para formular inferencias de 𝜎 2 es comparable con el que tiene 𝑥
̅ para formular inferencias
con respecto a μ.
Se desarrollará la distribución de muestreo de s2 cuando este se lleva a cabo sobre una población
que tiene una distribución normal. Para comenzar, es necesario suponer que μ es conocida y 𝜎 2 no.
Así, s2 se encuentra definida por:
IACC
18
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
En donde X1, X2,…, Xn constituye una muestra aleatoria de una distribución normal con media μ y
varianza σ2 desconocida. Para determinar una distribución de muestreo que permita hacer
inferencias sobre σ2 con base en s2 definida por (1), se enuncia y demuestra el siguiente teorema.
TEOREMA
Sean X1, X2,…, Xn una muestra aleatoria de una distribución normal con media μ y varianza σ2. La
distribución de la variable aleatoria:
SOLUCIÓN:
Si Y = Variable aleatoria que modela la varianza muestral
Se pide que se determine la probabilidad que la varianza muestral sea mayor que 0,014, es decir
IACC
19
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
Como las probabilidades acumulan para valores menores o iguales, se usa la propiedad del
complemento
𝐏(𝑨𝑪 )𝟏 − 𝑷(𝑨)
IACC
20
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
En este caso:
= 1 − 𝑃(𝑌 ≤ 35)
2
De acuerdo con el teorema, la variable Y distribuye ji-cuadrado con n grados de libertad (𝑌~𝜒25 ).
Se ubica en la tabla 3 con 25 grados de libertad el percentil asociado a 35.
Se observa que para 25 grados de libertad (la fila que aparece simbolizada por la letra 𝜐 ), el valor
más cercano a 35 es 34,38 y corresponde al percentil 90, es decir que 𝑃(𝑌 ≤ 35) = 0,9.
= 1 − 0,9 = 0,1
Opcionalmente, se puede usar Excel para determinar de manera más precisa esta probabilidad. Con
la fórmula:
Observe que Excel entrega directamente el área de la distribución ji-cuadrado a la derecha del valor
2
𝜒25 , es decir, da inmediatamente la probabilidad 𝑃(𝑌 > 35)
Interpretación: Probabilidad de que el valor de la varianza muestral sea mayor de 0.014 unidades
cuadradas, es alrededor de 0,1 para las condiciones dadas.
IACC
21
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
TEOREMA:
Dada una muestra aleatoria de n observaciones procedentes de una población que sigue una
distribución normal cuya varianza poblacional es σ2 y cuya varianza muestral resultante es s2. La
distribución de la variable aleatoria (Carlson & Thorne, 2008).
Se tiene una distribución conocida con el nombre de distribución χ2 (ji-cuadrado) con n – 1 grados
de libertad.
IACC
22
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
La distribución se define únicamente para valores positivos, ya que las varianzas son todas ellas
valores positivos. La función de densidad de una distribución ji-cuadrado es asimétrica y tiene una
larga cola positiva. Se puede caracterizar un miembro de la familia de distribuciones ji-cuadrado
mediante un único parámetro denominado grados de libertad y representado por medio del
símbolo v. Una distribución χ2 con υ grados de libertad se representa de la siguiente manera: 𝜒𝜐2 . La
esperanza y la varianza de esta distribución son iguales al número de grados de libertad y el doble
del número de grados de libertad.
Desde un punto de vista práctico, la varianza muestral tal como se encuentra definida en la ecuación
(1) tiene poco uso, ya que es muy raro que se conozca el valor de la media.
poblacional μ. De acuerdo con lo anterior, si se muestra una distribución normal con media μ y
varianza σ2, la varianza muestral (s2) se define por:
Se podría calcular la varianza muestral y esta sería diferente para cada muestra aleatoria debido a
las diferencias entre las observaciones muestrales.
Una sencilla explicación del uso de (n – 1) como divisor en la definición anterior es que en una
muestra aleatoria de n observaciones se tienen n valores o grados de libertad independientes. Pero
una vez que se conoce la media muestral calculada, solo hay n – 1 valores diferentes que pueden
definirse de forma independiente. Puede demostrarse, además, que el valor esperado de la varianza
muestral calculado de esta manera es la varianza poblacional.
IACC
23
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
3. GRADOS DE LIBERTAD
Existe una restricción para determinar el número de muestras posibles sobre un conjunto. Esto se
puede comprender mejor, considerando la propiedad de las desviaciones de cada observación
respecto de la media:
Por ejemplo, se toma una muestra de tamaño 5 (n = 5). Se calcula las 5 desviaciones respecto de la
media. Sea 𝐷1 la desviación para i=1, 2, 3, 4, 5, se tiene:
𝐷1 + 𝐷2 + 𝐷3 + 𝐷4 + 𝐷5 = 0
Siguiendo con el ejemplo y para entender lo anterior, se tomarán valores para 4 de las 5
desviaciones:
𝐷1 = 9, 𝐷2 = −7, 𝐷3 = 4 𝑦 𝐷4 = 0
9 ± 7 + 4 + 0 + 𝐷5 = 0
𝐷5 = −6
Es claro que 𝐷5 solo puede valer -6. Es claro que como la muestra tiene 5 observaciones, solo puede
haber n – 1 grados de libertad al asignar valores a las desviaciones respecto de la media muestral.
En consecuencia, la varianza muestral y, por tanto, el error típico de la media muestral tiene n – 1
grados de libertad.
IACC
24
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
Las probabilidades para la distribución de la variable aleatoria que sigue una distribución ji-cuadrado
aparecen calculadas en la tabla 3 del apéndice. En dicha tabla, los grados de libertad se indican en
la columna de la izquierda y los valores críticos de K correspondientes a los diferentes niveles de
probabilidad se indican en las demás columnas. Así, por ejemplo, con 10 grados de libertad el valor
de K correspondiente al intervalo inferior es 3,94. Este resultado se encuentra mirando la fila de 10
grados de libertad en la columna de la izquierda y la columna correspondiente a la probabilidad
0,950. El valor de ji-cuadrado es 3,94. Asimismo, en el caso del intervalo superior de 0,05, el valor
de K es 18,31. Este resultado se encuentra mirando la fila de 10 grados de libertad en la columna de
la izquierda y la columna correspondiente a la probabilidad 0,050. El valor de ji-cuadrado es 18,31.
Estas probabilidades se muestran esquemáticamente en el siguiente gráfico.
Por lo tanto, si se tiene una muestra aleatoria procedente de una población que sigue una
distribución normal, se puede hacer inferencias sobre la varianza muestral σ2 utilizando s2 y la
distribución ji-cuadrado. Este proceso se muestra en el siguiente ejemplo:
IACC
25
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
SOLUCIÓN:
IACC
26
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
https://www.youtube.com/watch?v=OCBBl8sZhuo
5. LA DISTRIBUCIÓN DE T DE STUDENT
La distribución de muestreo de una estadística t de Student es la distribución de probabilidad de t
que puede obtenerse como resultado de un número infinito de muestras aleatorias independientes
provenientes de la población normal cuyo tamaño de muestra n es pequeño (menor que 30), en que
no se conoce la varianza σ2.
La distribución de probabilidad t se puede obtener a partir de una variable aleatoria sigue una
distribución normal sobre una población.
Sigue una distribución normal estándar. En el caso en el que la desviación estándar poblacional es
desconocida, este resultado no puede utilizarse directamente. Es por ello por lo que se sustituye la
σ desconocida por la desviación estándar muestral s, lo que da:
IACC
27
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
La variable aleatoria t sigue la distribución t de Student con (n – 1) grados de libertad y viene dada
por un miembro específico de la familia de distribuciones t de Student que se caracteriza por el
número de grados de libertad. υ es el parámetro que representa los grados de libertad y tυ para
representar una variable aleatoria t de Student con υ grados de libertad.
Para basar las inferencias sobre una media poblacional en la distribución t de Student, se necesitan
valores críticos análogos a 𝑍𝛼 . De la misma forma que 𝑍𝛼 es el valor de la distribución normal
2 2
𝛼
estándar, tal que la probabilidad de la cola superior es , 𝑡 𝛼, es el valor de la distribución t de
2 𝜐, 2
𝛼
Student para υ (grados de libertad) tal que la probabilidad de la cola superior es 2 , como muestra
el gráfico (b).
IACC
28
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
Considere que la variable consumo de galones por hora es normal, sabiendo que el consumo
promedio poblacional es de 12 galones por hora.
SOLUCIÓN:
IACC
29
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
En la tabla, para 15 galones, 0,0000002 es insignificante y, por tanto, se puede concluir que el
consumo de 12 gal/h es real.
IACC
30
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
https://www.youtube.com/watch?v=5VsQV0jRzvE&t=16s
https://www.youtube.com/watch?v=6bmGsTolIo0
6. DISTRIBUCIÓN F DE SNEDECOR
Si de dos poblaciones normales o aproximadamente normales, se extraen dos muestras aleatorias
e independientes y a cada una se le calcula su respectiva varianza, el cociente de ambos valores 𝐹 =
𝑠12
(con F>1, esto es, siempre se coloca el más grande como numerador) tendrá una distribución de
𝑠22
F de Snedecor. Se caracteriza por tener dos grados de libertad que corresponden a cada una de las
muestras extraídas: el correspondiente al numerador υ1 =n1-1 y el del denominador υ2 = n2-1 .
Programas de computación permiten calcular los valores críticos respectivos.
IACC
31
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
https://www.youtube.com/watch?v=DO1K2oSE6yU
COMENTARIO FINAL
Las distribuciones en el muestreo permiten hallar la probabilidad de un estadístico muestral, dado
un modelo específico de distribución de probabilidad para la distribución en el muestreo. Estas
distribuciones muestrales permitirán en las próximas semanas, construir intervalos de confianza y
dar respuesta a las pruebas de hipótesis. Esta es la base en las decisiones objetivas obtenidas en
datos muestrales.
IACC
32
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
REFERENCIAS
Canavos, G. (1984). Probabilidad y estadística, aplicaciones y métodos. 1.ª edición. Estados Unidos:
McGraw-Hill.
Chao, L. (1975). Estadística para las ciencias administrativas. 2.ª edición. Estados Unidos: McGraw-
Hill.
Montgomery, D. & Runger, G. (1996). Probabilidad y estadística aplicadas a la ingeniería. 1.ª edición.
Estados Unidos: McGraw-Hill.
IACC
33
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN
IACC
34