Escolar Documentos
Profissional Documentos
Cultura Documentos
CONTINUAS
Introducción
Una de las distribuciones teóricas mejor estudiadas en los textos de estadística y más
utilizada en la práctica es la distribución normal, también llamada distribución
gaussiana. Su importancia se debe fundamentalmente a la frecuencia con la que distintas
variables asociadas a fenómenos naturales y cotidianos siguen, aproximadamente, esta
distribución. Caracteres morfológicos (como la talla o el peso),
o psicológicos (como el cociente intelectual) son ejemplos de variables de las que
frecuentemente se asume que siguen una distribución normal.
El uso extendido de la distribución normal en las aplicaciones estadísticas puede
explicarse, además, por otras razones. Muchos de los procedimientos estadísticos
habitualmente utilizados asumen la normalidad de los datos observados. Aunque muchas
de estas técnicas no son demasiado sensibles a desviaciones de la normal y, en general,
esta hipótesis puede obviarse cuando se dispone de un número suficiente de datos, resulta
recomendable contrastar siempre si se puede asumir o no una distribución normal. La
simple exploración visual de los datos puede sugerir la forma de su distribución. No
obstante, existen otras medidas, gráficos de normalidad y contrastes de hipótesis que
pueden ayudarnos a decidir, de un modo más riguroso, si la muestra de la que se dispone
procede o no de una distribución normal. Cuando los datos no sean normales, podremos
o bien transformarlos o emplear otros métodos estadísticos que no exijan este tipo de
restricciones (los llamados métodos no paramétricos).
A continuación se describirá la distribución normal, su ecuación matemática y sus
propiedades más relevantes, proporcionando algún ejemplo sobre sus aplicaciones a la
inferencia estadística.
Dato Histórico
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre
(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más
profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más
comúnmente, como la "campana de Gauss".
Definición
Se dice que la v.a continua X es una v.a. normal con parámetros y 2 si su función
de densidad es:
1 x
2
1
2
f ( x) e , x ......(1)
2
Se denota X~ N (µ, σ²) y se dice X se distribuye normal con parámetros µ y σ²
1 2
1 z
f ( z) e 2 , z ......(2)
2
(-) 0 (+) Z
Ejercicios
1. Dada una distribución normal estándar, encuentre el área bajo la curva que está
a) a la izquierda de z = 1.43
b) a la derecha de z = -0.89
c) entre z = -2.16 y z = -0.65
d) a la izquierda de z = -1.39
e) a la derecha de z = 1.96
f) entre z = -0.48 y z = 1.74
2. Una de las estrategias para determinar el manejo de bosques naturales se basa en la
reducción de un porcentaje de los árboles presentes (raleo). Los árboles que se cortan
son los de mayor diámetro. Si la distribución de los diámetros de los árboles sigue una
distribución normal, con media 60 cm y varianza 144 cm2.
a) ¿qué porcentaje de árboles se removerá si se talan todos los árboles con más de 70
cm de diámetro?
b) Si se quiere remover el 30% de los árboles, ¿cuál será el diámetro mínimo para
cortar el árbol?
Ejercicio 3: El caudal de un canal de riego medido en m3/seg es una variable aleatoria
con distribución aproximadamente normal con media 3 m3/seg. y desviación estándar
0.8 m3/seg. A partir de estas referencias calcular la probabilidad de los siguientes
eventos:
a) Evento A: que el caudal en un instante dado sea a lo sumo de 2.4 m3/seg.
b) Evento B: que el caudal en un instante dado esté entre 2.8 y 3.4 m3/seg.
2. Una fábrica de alimentos empaca productos cuyos pesos están normalmente
distribuidos con media de 450 gramos y desviación estándar de 20 gramos. Encuentre
la probabilidad de que un paquete escogido al azar pese entre 425 y 486 gramos.
3. Se regula una máquina despachadora de refresco para que sirva un promedio de 200
mililitro por vaso. Si la cantidad de bebida se distribuye normalmente con una
desviación estándar igual a 15 mililitros,
a) ¿qué fracción de los vasos contendrán más de 224 mililitros?
b) ¿cuál es la probabilidad de que un vaso contenga entre 191 y 209 mililitros?
c) ¿cuántos vasos probablemente se derramarán si se utilizan vasos de 230 mililitros
para las siguientes 1000 bebidas?
d) ¿por debajo de qué valor obtendremos 25% de las bebidas más pequeñas?
Importante
¿Quién era Student? Pues en realidad Student no era el nombre o el apellido del
responsable de esta distribución de probabilidad, sino que era un seudónimo. El
verdadero nombre del creador de la t de Student es William Sealy Gosset, (1876 – 1937);
era un matemático y químico inglés.
DEFINICIÓN
Una variable con distribución t de Student se define como el cociente entre una variable
normal estandarizada y la raíz cuadrada positiva de una variable 2 dividida por sus
grados de libertad.
(v 1) / 2 1 t 2
( v 1) / 2
h(t ) , t
(v / 2) v v
Esta se conoce como la distribución t con grados de libertad.
CARACTERISTICAS
b) Encuentre k tal que P (k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño
15 que se selecciona de una distribución normal.
A LA
INFERENCIA ESTADÍSTICA
- Estimación de Parámetros
- Contraste de Hipótesis
Estimación de Parámetros
El método de estimación de un parámetro puede ser puntual o por intervalo.
Estimación puntual de µ
En nuestro ejemplo, a partir de una muestra de n=50 planchas de acero. Daríamos como
estimación del peso medio poblacional o teórico, X = 215 Kg.
Inconveniente(s):
X
X N ( , X ) Z N (0,1)
X
Donde: X es el error típico o desviación estándar de la media muestral.
Supongamos que de una población normal con media desconocida y varianza conocida
o desconocida 2 se extrae una muestra de tamaño n, entonces de la distribución de la
media muestral X se obtiene que, lleva asociado un error típico de dicho estadístico de
lo que ha de tenerse en cuenta para valorar la precisión de una estimación puntual.
Idea
X Z1 / 2 * X X Z1 / 2 * X
Se puede determinar que tan grande debe ser el tamaño de la muestra, n, de manera que
si se estima por x , el error de estimación no sea mayor que un valor dado e. En
efecto:
Ejercicio
Se desea establecer el contenido vitamínico de un alimento balanceado para pollos. Se toma una
muestra de 49 bolsas y se encuentra que el contenido promedio de vitaminas por cada 100 grs. es
de 12 mg. y que la desviación estándar es de 2 mg. Encontrar el intervalo de confianza del 95%
para el verdadero promedio del contenido de vitaminas.
Ejercicio
Para estimar el rendimiento promedio del trigo en un departamento del sur cordobés se
relevan los campos de distintos productores mediante un esquema de muestreo aleatorio
simple. Se conoce por experiencias anteriores que es igual a 0.7 qq/ha y que el
promedio histórico es 26 qq/ha.
1) ¿Qué número de campos se deben evaluar para estimar la media de rendimiento con
una confianza del 95% si la amplitud del intervalo no debe ser mayor que el 2.5% del
promedio histórico?
2) Si la varianza de la distribución aumenta (proponga =1.4), ¿aumenta o disminuye el
tamaño muestral necesario para mantener la misma amplitud? Justificar la respuesta.