Você está na página 1de 34

SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

ESTADÍSTICA PARA LA GESTIÓN

SEMANA 3
Muestras aleatorias y
distribuciones de muestreo

IACC
1
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

APRENDIZAJES ESPERADOS

• Analizar la varianza de distribución poblacional a partir de una o


varias muestras.

IACC
2
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

APRENDIZAJES ESPERADOS ................................................................................................................. 2


INTRODUCCIÓN ................................................................................................................................... 4
1. MUESTRAS ALEATORIAS .............................................................................................................. 5
1.1 ESTIMACIÓN PUNTUAL ....................................................................................................... 7
2. DISTRIBUCIÓN DE MUESTREOS ..................................................................................................... 10
2.1. DISTRIBUCIÓN DE MUESTREO DE LA MEDIA MUESTRAL ....................................................... 10
2.1. TEOREMA CENTRAL DEL LÍMITE ............................................................................................. 12
2.3. DISTRIBUCIÓN DE MUESTREO PARA LA DIFERENCIA DE MEDIAS MUESTRALES ................... 15
2.4. DISTRIBUCIÓN DE VARIANZAS MUESTRALES ......................................................................... 18
2.5. DISTRIBUCIÓN DE VARIANZAS MUESTRALES ......................................................................... 18
3. GRADOS DE LIBERTAD ................................................................................................................... 24
4. valores de las probabilidades para la distribución ji-cuadrado..................................................... 24
5. LA DISTRIBUCIÓN DE t de student ................................................................................................ 27
6. DISTRIBUCIÓN F DE SNEDECOR..................................................................................................... 31
COMENTARIO FINAL.......................................................................................................................... 32
REFERENCIAS ..................................................................................................................................... 33

IACC
3
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

INTRODUCCIÓN

Los métodos estadísticos que buscan hacer verá perjudicada en sus ganancias y si está
inferencias sobre una población utilizan cargando menos, la empresa se expone a
muestras para poder obtener sus sanciones tanto de intermediarios como
conclusiones. La estadística inferencial se también de clientes. Si diariamente se
puede dividir en dos grandes áreas: envasan 10.000 bolsas de azúcar, lógicamente
estimación de parámetros y pruebas de sería inoperante pesar cada una. Además,
hipótesis. estando envasado el azúcar se incurriría en
Supóngase una nuevos costos tener que abrir la mercadería
máquina que llena para sacar o meter más azúcar según
bolsas de 1 kg de corresponda. Lo más probable es que el
azúcar. El ingeniero ingeniero esté interesado en obtener pesos
a cargo de testear que efectivamente la promedio y no algún peso en particular de
máquina vierta 1 kg en cada bolsa debe una bolsa.
garantizar que exactamente ese sea el peso, Por todo esto, es adecuado elegir muestras
ya que si está cargando más la empresa se que sean aleatorias para testear.

IACC
4
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

1. MUESTRAS ALEATORIAS

Siguiendo con el ejemplo de las bolsas de azúcar, es posible que el ingeniero a cargo considere que
la población de los pesos de las bolsas de azúcar producidas en un día (se refiere a todas las bolsas
de azúcar) tiene una distribución normal con media 𝜇 y varianza 𝜎 2 . Puede hacerse referencia a este
hecho diciendo que la población es normal o que es una población normalmente distribuida.
Como en la mayoría de los problemas de inferencia estadística es imposible medir a toda la
población por los altos costos asociados, es razonable seleccionar un subconjunto de las
observaciones. Para garantizar que los resultados obtenidos a partir de estas muestras representen
realmente a la población, es necesario seleccionar muestras aleatorias.

La selección de una muestra es un experimento aleatorio en donde cada observación es un valor de


una variable aleatoria. Las observaciones en la población determinan la distribución de probabilidad
de la variable aleatoria.

Variables aleatorias (Montgomery y Runger, 1996)

Las variables aleatorias (X1, X2, …, Xn) constituyen una muestra


aleatoria de tamaño si n

a) Las X i son variables aleatorias independientes.


b) Todas las X i tienen la misma distribución de probabilidad

EJEMPLO: Supóngase que se investiga la duración efectiva de un componente electrónico utilizado


en un marcapaso cardíaco y que la duración del componente tiene una distribución normal.
Entonces se espera que cada una de las observaciones de la duración del componente X1, X2, …, Xn
en una muestra aleatoria de n componentes, sean variables aleatorias independientes con la misma

IACC
5
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

distribución normal. Después de recopilar los datos, los valores numéricos de los tiempos de
duración observados se denotan por X1, X2, …, Xn.

El propósito principal de la toma de una muestra aleatoria es obtener información sobre los
parámetros no conocidos de una población.

Por ejemplo, podría ser relevante conocer la proporción de habitantes de Santiago que beben
alcohol. Se llama p al valor desconocido de esta proporción. Entonces se toma una muestra y se
calcula p que es la proporción de personas en la muestra que beben alcohol. p se calcula dividiendo
el número de personas bebedoras en la muestra por el total de personas consideradas en la
muestra. Por lo tanto, p es una función de los valores observados en la muestra aleatoria.

Puesto que es posible obtener muchas muestras aleatorias de una población, el valor p cambiará
de una a otra. Entonces, p es una variable aleatoria que se conoce como estadístico1.

Es muy importante que vayan revisando los links adjuntos, para


revisar los conceptos aplicados

https://www.youtube.com/watch?v=pKg7GV-zd9Q

Link del recurso (DESCARGA).

1Un estadístico es cualquier función de las observaciones contenidas en una muestra. Como una
estadística es una variable aleatoria, esta tiene función de probabilidad.

IACC
6
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

DISTRIBUCIÓN MUESTRAL

Una distribución muestral es la distribución de probabilidad de una estadística (Montgomery &


Runger, 1996).
Las distribuciones muestrales tendrán por objetivo realizar estimaciones puntuales de los
parámetros desconocidos. Usualmente habrá que estimar:
a) La media 𝜇 de una población
b) La varianza 𝜎 2 (o desviación estándar 𝜎) de una población
c) La proporción 𝜌 de objetos de una población que pertenecen a una cierta clase de interés
d) La diferencia entre las medias de dos poblaciones(𝜇1 −𝜇2 )
e) La diferencia entre las proporciones de dos poblaciones (𝜌1 −𝜌2 )

Estos parámetros poblacionales desconocidos serán estimados por los llamados estimadores
puntuales. La siguiente es la lista de estimadores puntuales para cada parámetro:

1.1 ESTIMACIÓN PUNTUAL


Un parámetro es un valor resumen, obtenido a través de una fórmula estándar, que describe los
valores de los datos de una población completa, es decir, para calcular los parámetros (media,
varianza y proporción poblacional) se debe considerar la información de todos los individuos de la
población de interés.

Los estadísticos son la base de construcción de los estimadores de parámetros, ya que son la medida
más práctica a partir de una muestra para tratar de estimar el valor de un parámetro poblacional.

IACC
7
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Parámetro Estadístico
Media poblacional Media muestral
Proporción poblacional Proporción muestral
Varianza poblacional Varianza muestral

Un estimador puntual consiste en un solo valor (punto)


deducido de una muestra para estimar el valor de una
población. (Lind, 2008)

Los estadísticos básicos son:

EJEMPLO: Si tenemos la nota de 5 estudiantes, que corresponde a 6, 3, 8, 2 y 1. Se solicita el


promedio, moda, rango, medina, moda, varianza, desviación media y la desviación típica.

IACC
8
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Solución

6 + 3 + 8 + 2 + 1 20
𝑥̅ = = =4
5 5

No hay moda

Rango = |𝑉𝑎𝑙𝑜𝑟 𝑚á𝑥 − 𝑉𝑎𝑙𝑜𝑟 𝑀í𝑛| = |8 − 1| = 7

Mediana 1, 2, 3, 6, 8, por lo tanto, nuestra media es 3 porque está en la posición 3

|(𝑥𝑖 − 𝑥̅ )| (6 − 4) + (3 − 4) + (8 − 4) + (2 − 4) + (1 − 4)
𝐷𝑀 = =| |
𝑛 5

2 + 1 + 4 + 2 + 3 12
= =
5 5

Varianza

(6 − 4)2 + (3 − 4)2 + (8 − 4)2 + (2 − 4)2 + (1 − 4)2


𝜎2 =
5

4 + 1 + 16 + 4 + 9 34
𝜎2 = =
5 5

Desviación estándar

34
𝜎 = √𝜎 2 = √
5

IACC
9
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

2. DISTRIBUCIÓN DE MUESTREOS
Una población involucra a todos los datos y una porción representativa de esta se llama muestra.
Las muestras juegan un papel muy importante en la estadística, ya que usualmente es imposible o
muy costoso analizar a la población entera. La información obtenida de una muestra o de un grupo
de muestras es útil para parámetros desconocidos de una población, tales como la media y la
varianza.
Dado que se supone que las muestras son aleatorias, la distribución de una estadística es un tipo de
modelo de probabilidad conjunta para variables aleatorias independientes, en donde cada variable
posee una función de densidad de probabilidad igual a la de las demás. De manera general, la
distribución de muestreo de una estadística no tiene la misma forma que la función de densidad de
probabilidad en la distribución de la población

2.1. DISTRIBUCIÓN DE MUESTREO DE LA MEDIA MUESTRAL


La media muestral es una estadística, esto es una variable que depende de los resultados obtenidos
en cada muestra en particular. Para ilustrar lo anterior, considere la distribución de muestreo de
una estadística para los 20 promedios muestrales dados en la siguiente tabla.

IACC
10
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Se agrupan las 20 realizaciones en cinco clases y se obtienen las frecuencias relativas como aparecen
en la siguiente tabla.

De acuerdo con los valores obtenidos de las frecuencias relativas se puede construir el siguiente
gráfico:

A partir de estas frecuencias relativas es evidente que la más alta concentración de tiempos de
duración promedio se encuentra entre 147,6 y 151,0 horas, en donde los tiempos de duración

IACC
11
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

promedio por debajo de 144 horas o por encima de 154,6 tienen una probabilidad muy pequeña.
La distribución de muestreo de una estadística hace posible este tipo de análisis de probabilidad,
esencial para valorar el riesgo inherente cuando se formulan inferencias. Además, se observa que
la distribución de medias muestrales describe aproximadamente una curva normal. A medida que
el número de muestras aumenta, la gráfica se convierte exactamente en una curva normal.

La distribución de muestreo de la media muestral supone una muestra aleatoria de tamaño n de

una población normal con media y varianza 𝜎 2 . Cada observación de la muestra X1, X2, …, Xn es

una variable aleatoria normal y distribuida independientemente, con media y varianza 𝜎 2 .

Si se obtienen muestras de una población que tiene una distribución de probabilidad desconocida,
𝜎2
la distribución muestral de la media muestral seguirá siendo normal con media y varianza 𝑛
, si el

tamaño n es grande.

Lo anterior se conoce con el nombre de Teorema de Límite Central.

2.1. TEOREMA CENTRAL DEL LÍMITE


Si 𝑥̅ es la media de una muestra aleatoria de tamaño n que se selecciona de una población con media
𝜇 y 𝜎 2 , entonces a variable aleatoria:

𝑥̅ − 𝜇
𝑍=𝜎 ~𝑁(0,1) 𝑠𝑖 𝑛 → ∞
⁄ 𝑛

IACC
12
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

a) El teorema central del límite se usa cuando 𝒏 ≥ 𝟑𝟎, sin importar


la distribución de la población.

b) Si n < 30, la distribución de la media aritmética muestral sigue


una distribución normal, si se sabe que la distribución poblacional
es normal.

EJEMPLO: El peso de un producto en kilogramos sigue una distribución normal con media 30 y
desviación típica 3. Un empresario decide aceptar un lote de 600 unidades que le envía el proveedor,
si al elegir 5 unidades de dicho producto al azar encuentra que su peso medio no es menor que 29.
Calcular la probabilidad de que rechace el lote.

𝜎
Solución: Recuerda que x̅ es la media muestral y que μ es la media poblacional con N(μ, ), es
√𝑁
muy importante tener en cuenta el vocabulario para entender que nos están preguntado.

N(30, 3) si te fijas la desviación es conocida, con un n=5.

3
𝑥̅ ~𝑁(30, ; 𝑍~𝑁(0,1)
√5

𝑥̅ − 𝜇 29 − 30
𝑍=𝜎 = = −0,75
⁄ 𝑛 3⁄
√ √5

30−29
𝑃(𝑥̅ < 29) = 𝑃 (𝑍 < 3 ) = 𝑃(𝑍 < −0,75) =0,2266 (Debes usar la tabla de la distribución
√5
normal de la semana 2)

𝑥̅ − 𝜇 29 − 30
𝑍=𝜎 = = −0,75
⁄ 𝑛 3⁄
√ √5

IACC
13
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

EJEMPLO: Se sabe que el saldo promedio para los clientes de una tarjeta de crédito de cierto banco
que la media es de $14.350 con una desviación estándar de $6.500. Del listado de clientes se obtiene
una muestra aleatoria de 49 clientes. ¿Cuál es la probabilidad de que la muestra tenga un promedio
mayor que $17.500?

𝜎
Solución: Recuerda que x̅ es la media muestral y que μ es la media poblacional con N(μ, ), es
√𝑁

muy importante tener en cuenta el vocabulario para entender que nos están preguntado.

N(14350,6500) si te fijas la desviación es conocida, con un n=49.

6500
𝑥̅ ~𝑁(14350, ; 𝑍~𝑁(0,1)
√49
𝑥̅ − 𝜇 17500 − 14350
𝑍=𝜎 = = 3,39
⁄ 𝑛 6500⁄
√ √49

17500−14350
𝑃 (𝑍 > 6500⁄ ) = 1 − 𝑃(𝑍 > 3,36) =0,003 (Debes usar la tabla de la distribución normal de
√49
la semana 2)

EJEMPLO: Una compañía electrónica fabrica resistores que tienen una resistencia promedio de 100
𝛺 y una desviación estándar de 10 𝛺. La distribución de la resistencia es normal.

Hallar la probabilidad que al tomar una muestra n=25 resistores, la resistencia promedio de estos
sea menor que 95𝛺 .

𝜎
Solución: Recuerda que x̅ es la media muestral y que μ es la media poblacional con N(μ, ), es
√𝑁

muy importante tener en cuenta el vocabulario para entender que nos están preguntado.

N(100,10) si te fijas la desviación es conocida, con un n=49.

IACC
14
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

10
𝑥̅ ~𝑁(100, ); 𝑍~𝑁(0,1)
√25

𝑥̅ − 𝜇 95 − 100
𝑍=𝜎 = = −2,5
⁄ 𝑛 10⁄
√ √29

𝑃(𝑍 < −2,5) = 0,0062 (Debes usar la tabla de la distribución normal de la semana 2)

La ventaja de estandarizar es que la función de probabilidad acumulada


se encuentra tabulada

2.3. DISTRIBUCIÓN DE MUESTREO PARA LA DIFERENCIA DE MEDIAS


MUESTRALES
Este mismo análisis se puede realizar para comparar las medias de 2 poblaciones. Supóngase que la
primera población tiene media 𝜇1 y varianza 𝜎12 , mientras que la segunda población tiene media 𝜇2
y varianza 𝜎22 . Se presume, además, que ambas poblaciones están normalmente distribuidas o bien,
aunque las poblaciones no sean normales, se extraen muestras de tamaño 𝑛1 𝑦 𝑛2 lo bastante

IACC
15
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

grandes (𝑛1 ≥ 30 𝑦 𝑛2 ≥ 30), la distribución de muestreo de 𝑥̅1 − 𝑥̅2 es normal con media 𝜇1 − 𝜇2
𝜎1 𝜎2
y varianza 𝑛 + 𝑛 .
1 2

TEOREMA (MONTGOMERY & RUNGER, 1996):

Bajo las condiciones anteriores, la variable aleatoria:

Observación:
a) Si las poblaciones tienen una distribución normal, entonces ̅̅̅
𝑥1 − 𝑥̅2 sigue una distribución
normal.
b) Si ambas poblaciones son normales, entonces ̅̅̅
𝑥1 − 𝑥̅2 sigue una distribución normal sin
importar los valores que tengan 𝑛1 𝑦 𝑛2 .

EJEMPLO: La duración media en años de los refrigeradores de la marca A es 18 años y la de los de


la marca B es 16 años. Las desviaciones estándar son 3 y 5 años respectivamente. Se toman 75
refrigeradores de la marca A y 50 de la marca B y se observa su duración media. ¿Cuál es la
probabilidad de que la duración media de la muestra A supere en más de un año a la duración media
de la muestra B?

SOLUCIÓN: Se trata de la distribución de muestreo sobre la diferencia de medias.

Se considera la variable aleatoria ̅̅̅


𝑥1 − 𝑥̅2 que asigna a cada par formado por una muestra de A y
una de B la diferencia de sus duraciones medias.
Los datos del enunciado son: las medias poblacionales son conocidas, es decir,
𝜇1 = 18 𝑎ñ𝑜𝑠 y 𝜇1 = 16 𝑎ñ𝑜𝑠

IACC
16
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Además, se conocen las desviaciones estándar poblacionales, que son:


𝜎1 = 3 𝑎ñ𝑜𝑠 𝑦 𝜎2 = 5 𝑎ñ𝑜𝑠

Y los tamaños de muestra son 75 refrigeradores de la marca A y 50 refrigeradores de la marca B.


La probabilidad pedida es:

Se construye la variable aleatoria:

Se utilizan las propiedades de la distribución normal:

IACC
17
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

2.4. DISTRIBUCIÓN DE VARIANZAS MUESTRALES


A medida que la industria pone más énfasis en la producción de bienes que satisfagan los criterios
de calidad de los clientes, es mayor la necesidad de calcular y reducir la varianza poblacional. Cuando
la varianza es alta en un proceso, algunas características importantes de los productos pueden
tomar una gama más amplia de valores, como consecuencia de la cual hay más productos que no
tienen un nivel de calidad aceptable.

A un cliente le da lo mismo que un producto funcione bien “en promedio”, lo que le interesa es que
funcione el que ha comprado. Se puede obtener productos de calidad en un proceso de producción
si este tiene una baja varianza poblacional, de manera que es menor el número de unidades que
tienen un nivel de calidad inferior al deseado. Comprendiendo la distribución de las varianzas
muestrales en el muestreo, se puede hacer inferencias sobre la varianza poblacional. Por lo tanto,
es posible identificar y corregir los procesos que tienen una elevada varianza. Además, cuando la
varianza poblacional es menor, se pueden hacer mejores inferencias sobre las medias poblacionales,
utilizando medias muestrales.

2.5. DISTRIBUCIÓN DE VARIANZAS MUESTRALES


Una estadística importante empleada para formular inferencias con respecto a las varianzas de la
población es la varianza muestral denotada por s2. Hay que recordar que s2 es una medida de la
variabilidad e indica la dispersión o extensión entre las observaciones.

Dado que la dispersión es una consideración tan importante como la tendencia central, el significado
de s2 para formular inferencias de 𝜎 2 es comparable con el que tiene 𝑥
̅ para formular inferencias
con respecto a μ.

Se desarrollará la distribución de muestreo de s2 cuando este se lleva a cabo sobre una población
que tiene una distribución normal. Para comenzar, es necesario suponer que μ es conocida y 𝜎 2 no.
Así, s2 se encuentra definida por:

IACC
18
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

En donde X1, X2,…, Xn constituye una muestra aleatoria de una distribución normal con media μ y
varianza σ2 desconocida. Para determinar una distribución de muestreo que permita hacer
inferencias sobre σ2 con base en s2 definida por (1), se enuncia y demuestra el siguiente teorema.

TEOREMA
Sean X1, X2,…, Xn una muestra aleatoria de una distribución normal con media μ y varianza σ2. La
distribución de la variable aleatoria:

Es del tipo ji-cuadrado 𝜒 2 con grados de libertad.


Se resalta que en este caso la media poblacional 𝜇 es conocida.

EJEMPLO: Se considera una medición física proporcionada por un instrumento de precisión, en


donde el interés recae en la variabilidad de la lectura. Supóngase que, con base en la experiencia, la
medición es una variable aleatoria normalmente distribuida con media 10 y desviación estándar
igual a 0,1 unidades. Si se toma una muestra aleatoria procedente del proceso de manufactura de
los instrumentos de tamaño 25, ¿cuál es la probabilidad de que el valor de la varianza muestral sea
mayor de 0,014 unidades cuadradas?

SOLUCIÓN:
Si Y = Variable aleatoria que modela la varianza muestral
Se pide que se determine la probabilidad que la varianza muestral sea mayor que 0,014, es decir

IACC
19
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Como las probabilidades acumulan para valores menores o iguales, se usa la propiedad del
complemento
𝐏(𝑨𝑪 )𝟏 − 𝑷(𝑨)

IACC
20
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

En este caso:

= 1 − 𝑃(𝑌 ≤ 35)
2
De acuerdo con el teorema, la variable Y distribuye ji-cuadrado con n grados de libertad (𝑌~𝜒25 ).
Se ubica en la tabla 3 con 25 grados de libertad el percentil asociado a 35.

Se observa que para 25 grados de libertad (la fila que aparece simbolizada por la letra 𝜐 ), el valor
más cercano a 35 es 34,38 y corresponde al percentil 90, es decir que 𝑃(𝑌 ≤ 35) = 0,9.

= 1 − 0,9 = 0,1

Opcionalmente, se puede usar Excel para determinar de manera más precisa esta probabilidad. Con
la fórmula:

Observe que Excel entrega directamente el área de la distribución ji-cuadrado a la derecha del valor
2
𝜒25 , es decir, da inmediatamente la probabilidad 𝑃(𝑌 > 35)

Interpretación: Probabilidad de que el valor de la varianza muestral sea mayor de 0.014 unidades
cuadradas, es alrededor de 0,1 para las condiciones dadas.

IACC
21
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Si se desconoce el valor de la media poblacional, entonces se pierde un


grado de libertad. Ahora se puede enunciar el siguiente teorema

TEOREMA:

Dada una muestra aleatoria de n observaciones procedentes de una población que sigue una
distribución normal cuya varianza poblacional es σ2 y cuya varianza muestral resultante es s2. La
distribución de la variable aleatoria (Carlson & Thorne, 2008).

Se tiene una distribución conocida con el nombre de distribución χ2 (ji-cuadrado) con n – 1 grados
de libertad.

La distribución ji-cuadrado no es única. Existen familias de distribuciones ji-cuadrado que se utilizan


en el análisis estadístico aplicado que establecen una relación entre las varianzas muestrales y las
varianzas poblacionales.

La distribución ji-cuadrado con n – 1 grados de libertad es la distribución de la suma de los cuadrados


de n – 1 variables aleatorias normales estándar independientes. La distribución ji-cuadrado anterior
y las probabilidades calculadas resultantes de varios valores de s2 requieren que la distribución
poblacional sea normal. Por lo tanto, el supuesto de la existencia de una distribución normal
subyacente es más importante para hallar las probabilidades de las varianzas muestrales que para
hallar las probabilidades de las medias muestrales.

IACC
22
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

La distribución se define únicamente para valores positivos, ya que las varianzas son todas ellas
valores positivos. La función de densidad de una distribución ji-cuadrado es asimétrica y tiene una
larga cola positiva. Se puede caracterizar un miembro de la familia de distribuciones ji-cuadrado
mediante un único parámetro denominado grados de libertad y representado por medio del
símbolo v. Una distribución χ2 con υ grados de libertad se representa de la siguiente manera: 𝜒𝜐2 . La
esperanza y la varianza de esta distribución son iguales al número de grados de libertad y el doble
del número de grados de libertad.

Desde un punto de vista práctico, la varianza muestral tal como se encuentra definida en la ecuación
(1) tiene poco uso, ya que es muy raro que se conozca el valor de la media.
poblacional μ. De acuerdo con lo anterior, si se muestra una distribución normal con media μ y
varianza σ2, la varianza muestral (s2) se define por:

Se podría calcular la varianza muestral y esta sería diferente para cada muestra aleatoria debido a
las diferencias entre las observaciones muestrales.
Una sencilla explicación del uso de (n – 1) como divisor en la definición anterior es que en una
muestra aleatoria de n observaciones se tienen n valores o grados de libertad independientes. Pero
una vez que se conoce la media muestral calculada, solo hay n – 1 valores diferentes que pueden
definirse de forma independiente. Puede demostrarse, además, que el valor esperado de la varianza
muestral calculado de esta manera es la varianza poblacional.

IACC
23
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

3. GRADOS DE LIBERTAD
Existe una restricción para determinar el número de muestras posibles sobre un conjunto. Esto se
puede comprender mejor, considerando la propiedad de las desviaciones de cada observación
respecto de la media:

Por ejemplo, se toma una muestra de tamaño 5 (n = 5). Se calcula las 5 desviaciones respecto de la
media. Sea 𝐷1 la desviación para i=1, 2, 3, 4, 5, se tiene:

𝐷1 + 𝐷2 + 𝐷3 + 𝐷4 + 𝐷5 = 0

Se tiene la completa libertad de elegir 4 de las 5 desviaciones. Si ya se fijaron 4 valores no se tendrá


la libertad de fijar el quinto, ya que ese valor estará sujeto a que, sumado a las otras 4 desviaciones,
se debería obtener 0.

Siguiendo con el ejemplo y para entender lo anterior, se tomarán valores para 4 de las 5
desviaciones:
𝐷1 = 9, 𝐷2 = −7, 𝐷3 = 4 𝑦 𝐷4 = 0

La quinta desviación queda ya determinada. Se despeja:

9 ± 7 + 4 + 0 + 𝐷5 = 0

𝐷5 = −6

Es claro que 𝐷5 solo puede valer -6. Es claro que como la muestra tiene 5 observaciones, solo puede
haber n – 1 grados de libertad al asignar valores a las desviaciones respecto de la media muestral.
En consecuencia, la varianza muestral y, por tanto, el error típico de la media muestral tiene n – 1
grados de libertad.

4. VALORES DE LAS PROBABILIDADES PARA LA


DISTRIBUCIÓN JI-CUADRADO

IACC
24
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Las probabilidades para la distribución de la variable aleatoria que sigue una distribución ji-cuadrado
aparecen calculadas en la tabla 3 del apéndice. En dicha tabla, los grados de libertad se indican en
la columna de la izquierda y los valores críticos de K correspondientes a los diferentes niveles de
probabilidad se indican en las demás columnas. Así, por ejemplo, con 10 grados de libertad el valor
de K correspondiente al intervalo inferior es 3,94. Este resultado se encuentra mirando la fila de 10
grados de libertad en la columna de la izquierda y la columna correspondiente a la probabilidad
0,950. El valor de ji-cuadrado es 3,94. Asimismo, en el caso del intervalo superior de 0,05, el valor
de K es 18,31. Este resultado se encuentra mirando la fila de 10 grados de libertad en la columna de
la izquierda y la columna correspondiente a la probabilidad 0,050. El valor de ji-cuadrado es 18,31.
Estas probabilidades se muestran esquemáticamente en el siguiente gráfico.

Por lo tanto, si se tiene una muestra aleatoria procedente de una población que sigue una
distribución normal, se puede hacer inferencias sobre la varianza muestral σ2 utilizando s2 y la
distribución ji-cuadrado. Este proceso se muestra en el siguiente ejemplo:

EJEMPLO: Daniel F es responsable de la garantía de calidad de Electrónica Integrada y le ha pedido


a usted, como experto, que cree un proceso de control de la calidad para la fabricación de un
mecanismo de control A. La variabilidad de la resistencia eléctrica, expresada en ohmios, es
fundamental para este mecanismo. Las normas de fabricación especifican una desviación estándar

IACC
25
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

de 3,6 y la distribución poblacional de las medidas de la resistencia es normal. El proceso de control


requiere que se obtenga una muestra aleatoria de n = 6 observaciones de la población de
mecanismos y que se calcule la varianza muestral. Halle un límite superior de la varianza muestral
tal que la probabilidad de que se supere este límite, dada una desviación estándar poblacional de
3,6, sea inferior a 0,05.

SOLUCIÓN:

IACC
26
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Es muy importante que vayan revisando los links adjuntos, para


revisar los conceptos aplicados

https://www.youtube.com/watch?v=OCBBl8sZhuo

Link del recurso (DESCARGA).

5. LA DISTRIBUCIÓN DE T DE STUDENT
La distribución de muestreo de una estadística t de Student es la distribución de probabilidad de t
que puede obtenerse como resultado de un número infinito de muestras aleatorias independientes
provenientes de la población normal cuyo tamaño de muestra n es pequeño (menor que 30), en que
no se conoce la varianza σ2.
La distribución de probabilidad t se puede obtener a partir de una variable aleatoria sigue una
distribución normal sobre una población.

La distribución t es el cociente entre la distribución normal estándar y la raíz cuadrada de la


distribución ji-cuadrado dividida por sus grados de libertad, υ.
Se sabe que la variable aleatoria Z corresponde a:

Sigue una distribución normal estándar. En el caso en el que la desviación estándar poblacional es
desconocida, este resultado no puede utilizarse directamente. Es por ello por lo que se sustituye la
σ desconocida por la desviación estándar muestral s, lo que da:

IACC
27
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Esta variable aleatoria no sigue una distribución normal estándar.

La variable aleatoria t sigue la distribución t de Student con (n – 1) grados de libertad y viene dada
por un miembro específico de la familia de distribuciones t de Student que se caracteriza por el
número de grados de libertad. υ es el parámetro que representa los grados de libertad y tυ para
representar una variable aleatoria t de Student con υ grados de libertad.

La forma de la distribución t de Student es bastante parecida a la de la distribución normal estándar.


Ambas distribuciones tienen una media de 0 y las funciones de densidad de las dos son simétricas
en torno a sus medias. Sin embargo, la función de densidad de la distribución t de Student tiene una
dispersión mayor (reflejada en una varianza mayor) que la distribución normal estándar, como
puede verse en el gráfico (a), que muestra las funciones de densidad de la distribución normal
estándar y de la distribución t de Student con 3 grados de libertad.

La dispersión mayor de la distribución t de Student se debe a la incertidumbre adicional provocada


por la sustitución de la desviación estándar poblacional conocida por su estimador muestral (s). A
medida que aumenta el número de grados de libertad, la distribución t de Student es cada vez más
parecida a la distribución normal estándar. Cuando el número de grados de libertad es alto, las dos
distribuciones son casi idénticas. Es decir, la distribución t de Student converge hacia N(0,1), que es
bastante parecida a la t si n es grande.

Para basar las inferencias sobre una media poblacional en la distribución t de Student, se necesitan
valores críticos análogos a 𝑍𝛼 . De la misma forma que 𝑍𝛼 es el valor de la distribución normal
2 2
𝛼
estándar, tal que la probabilidad de la cola superior es , 𝑡 𝛼, es el valor de la distribución t de
2 𝜐, 2
𝛼
Student para υ (grados de libertad) tal que la probabilidad de la cola superior es 2 , como muestra

el gráfico (b).

IACC
28
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

EJEMPLO: En 16 recorridos de prueba de 1 hora cada uno, el consumo de gasolina de un motor


promedio 16,4 galones por hora, con una desviación estándar de 2,1 galones por hora. Calcular la
probabilidad de que el consumo de gasolina promedio sea mayor al promedio muestral.

Considere que la variable consumo de galones por hora es normal, sabiendo que el consumo
promedio poblacional es de 12 galones por hora.

SOLUCIÓN:

Se define la variable x Consumo de galones por hora.


Consideraciones importantes:
x distribuye normal con media 12 galones por hora y desviación estándar desconocida.
Como el tamaño de muestra es menor que 30 (en este caso n 16) y x distribuye normal y, además,
se desconoce la varianza poblacional, entonces la variable aleatoria que describe el comportamiento
muestral del consumo promedio de galones por hora es t de Student.

IACC
29
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Para hallar la probabilidad se ingresa la fórmula Excel =DISTR.T(8,38;15;1) = 0, 0000002

En la tabla, para 15 galones, 0,0000002 es insignificante y, por tanto, se puede concluir que el
consumo de 12 gal/h es real.

IACC
30
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

Es muy importante que vayan revisando los links adjuntos, para


revisar los conceptos aplicados

https://www.youtube.com/watch?v=5VsQV0jRzvE&t=16s
https://www.youtube.com/watch?v=6bmGsTolIo0

Link del recurso (DESCARGA).

6. DISTRIBUCIÓN F DE SNEDECOR
Si de dos poblaciones normales o aproximadamente normales, se extraen dos muestras aleatorias
e independientes y a cada una se le calcula su respectiva varianza, el cociente de ambos valores 𝐹 =
𝑠12
(con F>1, esto es, siempre se coloca el más grande como numerador) tendrá una distribución de
𝑠22

F de Snedecor. Se caracteriza por tener dos grados de libertad que corresponden a cada una de las
muestras extraídas: el correspondiente al numerador υ1 =n1-1 y el del denominador υ2 = n2-1 .
Programas de computación permiten calcular los valores críticos respectivos.

IACC
31
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

La distribución F se usa generalmente en intervalos de confianza y pruebas de hipótesis, temas que


se tratarán en las próximas semanas. Existen tablas que entregan las probabilidades para cada nivel
de confianza, eligiéndose los más apropiados como: 95%; 97,5%; 99%; 99,5% y 99,9%. Como
siempre, el área total bajo la curva es la unidad (que indica probabilísticamente el 100% de los
percentiles) y se extiende desde 0 a+∞. La forma es muy parecida a la ji- cuadrado. Hay tres casos,
con diferentes grados de libertad, y se marca el valor de F = 2,5 con una línea punteada vertical.

Es muy importante que vayan revisando los links adjuntos, para


revisar los conceptos aplicados

https://www.youtube.com/watch?v=DO1K2oSE6yU

Link del recurso (DESCARGA).

COMENTARIO FINAL
Las distribuciones en el muestreo permiten hallar la probabilidad de un estadístico muestral, dado
un modelo específico de distribución de probabilidad para la distribución en el muestreo. Estas
distribuciones muestrales permitirán en las próximas semanas, construir intervalos de confianza y
dar respuesta a las pruebas de hipótesis. Esta es la base en las decisiones objetivas obtenidas en
datos muestrales.

IACC
32
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

REFERENCIAS

Canavos, G. (1984). Probabilidad y estadística, aplicaciones y métodos. 1.ª edición. Estados Unidos:
McGraw-Hill.

Chao, L. (1975). Estadística para las ciencias administrativas. 2.ª edición. Estados Unidos: McGraw-
Hill.

Matemáticas II aplicadas a las ciencias sociales. (2003). España: Edebé bachillerato.

Montgomery, D. & Runger, G. (1996). Probabilidad y estadística aplicadas a la ingeniería. 1.ª edición.
Estados Unidos: McGraw-Hill.

PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:

IACC (2018). Muestras aleatorias y distribuciones de muestreo. Estadística para la


Gestión. Semana 3.

IACC
33
SEMANA 3 – ESTADÍSTICA PARA LA GESTIÓN

IACC
34

Você também pode gostar