Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTADÍSTICA Y
PROBABILIDADES
SEMANA 13
DISTRIBUCIÓN NORMAL
DOCENTE:
Huancayo – 2016
Estadística y Probabilidades 1
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
DISTRIBUCIÓN DE PROBABILIDAD
Distribución Binomial:
Se aplica a la selección de una muestra, sólo cuando el resultado de cada solución es independiente de
los resultados de las selecciones anteriores. Es una de las distribuciones más utilizadas de la estadística
aplicada. La distribución se deriva de un procedimiento llamado ensayo de Bernoulli.
Características:
1. El experimento consiste en una serie de n ensayos repetidos.
2. Cada ensayo sólo tiene dos resultados: éxito o fracaso
3. La probabilidad de éxito, designado por p es la misma para cada ensayo, la probabilidad de fracaso q
(igual 1 – p) es también constante.
4 Los ensayos sucesivos son independientes.
5. Puede ser simétrica o sesgada.
La información de la muestra se obtiene con reposición de una población finita.
FÓRMULA
n!
p( x) = Cxn p x q n - x = p x q n-x
x !(n - x)!
Donde:
n: número de ensayos
x: número de éxitos
p: probabilidad de éxito de un ensayo.
q: probabilidad de fracaso ensayo
n – x : número de fracaso en el ensayo.
Ejemplo 1:
Una muestra de 4 frascos se selecciona sin restitución de un lote de 5 000 frascos de cierto laboratorio
farmacéutico. Suponiendo que 20% de los frascos de lote no cumplen con las especificaciones medicas.
¿Cuál es la probabilidad de que la muestra contenga exactamente 2 frascos malos?
n = 4 x = 2 p = 0,20 q = 0,80
Ejemplo 2
Supóngase que en cierta población el 52% de todos los nacimientos que se registraron son varones. Si
aleatoriamente se escogen cinco registros de nacimientos dentro de esa población, ¿Cuál es la
probabilidad de que exactamente tres de ellos pertenezcan a varones?
n = 5 x = 3 p = 0,52 q = 0,48
Ejemplo 3
Si el 20% de los cerrojos producidos por una máquina son defectuosos, determinar la probabilidad de
que de 4 cerrojos elegidos al azar:
a) Un cerrojo sea defectuoso de los cuatro
b) Todos sean buenos
c) Dos cerrojos sean defectuosos
Distribución Normal
Las distribuciones normales ocupan un lugar importante, tanto en la estadística teórica como en la
aplicada, por varias de frecuencias observadas de muchas mediciones naturales y físicas.
Determinar un área o probabilidad en la distribución normal demanda la integración de la ecuación de la
curva normal. Para simplificar este trabajo se usa la DISTRIBUCION NORMAL ESTANDAR o Distribución
Z.
Estadística y Probabilidades 2
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
Si Z es una variable aleatoria distribuida normalmente con m = 0... y...s = 1 , obtenemos la curva
normal, llamada CURVA NORMAL ESTÁNDAR, mostrada en la figura.
Valor z : la distancia entre un valor seleccionado, designado como X, y la población media m, dividida
entre la desviación estándar de la población s,
Ejemplo:
Un estudio sobre la instalación y programación de software en una mega empresa indica que el tiempo
medio que se lleva en completar el programa es de 500 horas y que esta variable aleatoria normalmente
distribuida tiene una desviación estándar de 100 horas.
Contestar las siguientes preguntas:
¿Cuál es la probabilidad de que un participante elegido al azar requiere más de 500 horas para
completar el programa?
¿Cuál es la probabilidad de que un supervisor elegido al azar se tome entre 500 y 650 horas
para completar el programa de entrenamiento?
¿Cuál es la probabilidad de que un supervisor elegido al azar se tome más de 700 horas en
completar el programa?
Suponer que el director del programa desea saber la probabilidad de que un participante
escogido al azar requiera entre 550 y 650 horas para completar el trabajo requerido en el
programa
Estadística y Probabilidades 3
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
Ejemplo
Las notas del examen de la asignatura de estadística tiene una distribución aproximadamente normal, con
una media, con una media de 10 y una desviación estándar de 2,5. Si a un estudiante, elegido
aleatoriamente, se le aplica el examen.
¿Cuál es la probabilidad de que logre un puntaje de 15 o más puntos?
Estadística y Probabilidades 4
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
Ejemplo 1:
La media X de la variable aleatoria de un estudio es 18,5 y la desviación estándar de los valores de X es
5,07, se requiere calcular el puntaje estandarizado de los siguientes valores de X.
Xi = 9,4 x2 = 15,06 X3 = 18,5 x4 = 20,07
Ejemplo 2:
El promedio de los sueldos mensuales de los trabajadores de una empresa grande (en miles de soles) es
de S/. 100 000 con una desviación estándar de S/. 25 000. Transformar en puntaje estandarizado los
siguientes sueldos.
a) 75 000
b) 58 000
c) 120 600
d) 92 300
e) 145 000
Ejemplo 3
El ingreso mensual que una corporación grande ofrece a los graduados en MBA tiene una distribución
normal con media de $2000 y desviación estándar de $200. ¿Cuál es el valor z para un ingreso de
$2200? y ¿cuál para uno de $1700?
Para X=$2200,
z=(2200-2000)/200 = 1.
Distribución ji cuadrada o x 2
Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas. Se
simboliza x2 La ji cuadrada se calcula por medio de una tabla de contingencia o tabulación cruzada, que
es un cuadro de dos dimensiones. y cada dimensión contiene una variable. A su vez, cada variable se sub
divide en dos o más categorías.
En la tabla de contingencia se anotan las frecuencias observadas en la muestra de la investigación;
posteriormente, se calculan las frecuencias esperadas para cada celda. En esencia, la ji cuadrada es una
comparación entre la tabla de frecuencias observadas y la denominada tabla de frecuencias esperadas, la
cual constituye la tabla que esperaríamos encontrar si las variables fueran estadísticamente
independientes o no estuvieran relacionadas.
La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula
aplicada a la tabla de frecuencias observadas.
Estadística y Probabilidades 5
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
Ejemplo: 1
La tabla muestra los resultados de una elección de un distrito para ocupar el sillón municipal.
Una vez obtenidas las frecuencias esperadas, se aplica la siguiente formula de ji cuadrada.
(O - E )2
x2 = �
E
Donde:
O es la frecuencia observada en cada celda.
E es la frecuencia esperada en cada celda
Gl = (r – 1)(c – 1)
r: número de filas
c: número de columnas
(O-E)2
CELDA O E O–E (O – E) 2
E
Zona Norte/partido
180 145,4 34,6 1197,16 8,23
derechista
Zona norte / partido centro 190 244,4 -54,4 2959,36 12,11
Zona norte / partido
170 150,6 19,4 376,36 2,5
izquierdista
Zona sur/partido
100 134,6 -34,6 1197,16 8,89
derechista
Zona sur/partido centro 280 226 54 2916 12,90
Estadística y Probabilidades 6
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
Zona sur/partido
120 139,4 -19,4 376,36 2,7
izquierdista
2
x =47,33
Luego eligiendo un nivel de confianza 0,05 . Si nuestro valor calculado de x2 es igual o superior al de la
tabla, decidimos que las variables están relacionadas (x2 es significativa) sabiendo que los Gl = (3 – 1)(2 –
1) = 2
En el ejemplo, el valor que requerimos empatar o superar a un nivel de 0,05 es de 5,991.
47,33 > 5,991 es ampliamente superior.
Interpretación x2 es significativa
Ejemplo 2:
ANALISIS DE CORRELACIÓN
Se llama correlación a la relación entre dos o más variables estadísticas referidas a una misma muestra.
El grado de correlación entre dos variables se mide mediante los coeficientes de correlación.
Ejemplos
- Las calificaciones altas en una asignatura, suele corresponder calificaciones en un test de
inteligencia.
- El peso de las personas depende generalmente de su estatura.
- El tiempo de servicios generalmente se relaciona con la edad.
- El ahorro depende del ingreso
- La demanda depende de los precios
- El consumo depende del ingreso
Clases de correlaciones:
a) Correlación simple (cuando se realiza entre dos variables)
b) Correlación múltiple (cuando se realiza tres o mas variables)
c) Correlación lineal (Cuando el diagrama de dispersión tiende a formar una línea recta)
d) Correlación no lineal (cuando el diagrama de dispersión tiende a formar una curva
Diagramas de dispersión: Gráfica que describe la relación entre las dos variables de interés
Las variables X e Y se grafican en un plano cartesiano se puede obtener los siguientes gráficos.
Estadística y Probabilidades 7
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
X 18 18 17 17 16 16 15 15 14 14 13 13 12 12
Y 28 30 30 26 28 24 22 20 26 22 24 18 20 18
X Y X2 Y2 XY
1
2
3
4
5
6
Estadística y Probabilidades 8
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
7
8
9
10
11
12
13
14
N
Ejemplo:
1. Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la longitud
en cm. de una cierta variedad de planta al cabo de un año de vida para predecir la longitud de
esa variedad de planta en edad adulta:
Longitud en cm. Longitud en cm.
el primer año (x) en edad adulta (y)
15,3 30,7
14,8 32,5
12,6 26,3
18,4 35,9
17,9 34,3
15,6 28,5
18,4 37,4
14,1 29,7
20,2 38,8
21,7 40,4
20,4 40,9
16,5 33,3
15,9 30,1
17,9 35,7
16,7 31,4
Se pide:
a) Representar el diagrama de dispersión
b) Calcular el coeficiente de correlación r de pearson
COEFICIENTE DE CORRELACIÓN POR RANGOS “ρ”
La correlación por rangos se refiere a la correspondencia en el ordenamiento de los elementos de
dos conjuntos dados. La fuerza de la correlación se mide por medio del coeficiente de correlación por
rangos se Spearman. Cuya fórmula es:
6 �D2
r = (1 - )
n(n2 - 1)
ρ: La letra griega rho, designa el coeficiente de correlación por rangos
D: Diferencia de rangos correspondientes entre si pertenecientes a dos variables X y Y. Por ejemplo D =
x1 – y1
n : número de pares correspondientes.
Ejemplo:
En la primera columna de la izquierda de la tabla se presenta un grupo de 5 estudiantes; en la segunda
columna están sus niveles mentales que se consideran como categorías de la variable X, en la tercera
columna se indican los resultados de un test psicotécnico aplicado al grupo, cuyas puntuaciones son
valores de la variable Y.
Estadística y Probabilidades 9
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
6(4)
r = (1 - )
5(25 - 1)
r = 0,80
Ejemplo
Cinco niños se someten a una prueba de habilidad mental y los resultados de ésta se ordenan por rangos
en la columna X. También se muestran en la columna Y los rangos de estos mismos cinco niños respecto
al tiempo que gastan en mirar TV
ALUMNOS X Y Y
A 1 4ó5 4,5
B 2 4ó5 4,5
C 3 2ó3 2,5
D 4 1 0,5
E 5 2o3 2,5
Estadística y Probabilidades 10
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
Estadística y Probabilidades 11
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
Estadística y Probabilidades 12
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
PRÁCTICA 1
1. En un examen final de matemática la media fue 72 y la desviación típica 15. Determinar las
referencias tipificadas (es decir, graduaciones en unidades de desviación típica) de los estudiantes
que obtuvieron puntaciones de:
a) 60
b) 93
c) 72
2. En un examen de estadística la media fue 78 y la desviación típica 10.
a) Determinar las referencias tipificadas de dos estudiantes cuyas puntuaciones fueron 93 y 62,
respectivamente.
b) Determinar las puntuaciones de dos estudiantes cuyas referencias tipificadas fueron – 0,6 y 1,2
respectivamente.
3. Salarios de los empleados. Suponer que los salarios semanales de 5000 empleados en una
empresa están distribuidos normalmente con una media de $450 y desviación estándar de $40.
¿Cuántos empleados ganan menos de $400 semanalmente?.
4. Hallar el área bajo la curva normal en cada uno de los siguientes casos. (Utiliza la tabla)
a) Entre z=0 y z= 1,2
b) Entre z= – 0,68 y z= 0
c) Entre z= – 0,46 y z= 2,21
d) A la izquierda de z= – 0,6
e) A la derecha de z= – 1,28
5. Si Z es una variable aleatoria normal estándar, encuentre cada una de las siguientes
probabilidades.
P(0<Z<1,8) c) P(Z > -1,22) e) P(-1.96<Z<1,96)
P(0,45<Z<2,81) d) P (Z< 2,93) f) P(Z<1,05)
6. Encuentre Zo tal que el enunciado dado sea verdadero. Suponga que Z es una variable aleatoria
normal estándar.
a) P(Z < Zo) = 0,5517 c) P(-Zo < Z < Zo) = 0,2662
b) P (Z > Zo) = 0,8599 d) P(Z > Zo) = 0,4960
7. Supongamos que se sabe que el peso de los sujetos de una determinada población sigue una
distribución aproximadamente normal, con una media de 80 Kg y una desviación estándar de 10
Kg. ¿Podremos saber cuál es la probabilidad de que una persona, elegida al azar, tenga un peso
superior a 100 Kg?
8. Si X esta distribuido normalmente con la temperatura de la ciudad de Tarma m=25 y s2=9,
encuentre p(19<X<28).
9. Si X esta distribuida normalmente con m= 40 y P(X>54) =0,0401, encuentre s.
10. Las calificaciones de un examen a nivel nacional están distribuidas normalmente con una media de
500 y desviación estándar de 100. ¿Qué porcentaje de los que presentaron el examen tuvieron una
calificación mayor a 630?.
11. El ingreso anual de un grupo de 10 000 profesionales está distribuido normalmente con m= $60 000
y s =$ 5000.
¿Cuáles la probabilidad de que una persona de este grupo tenga un ingreso anual menor de $56
000?
Cuantas personas de este grupo tienen ingresos anuales de mas de $ 70 000? .
12. Determinar el valor o valores de z en cada uno de los siguientes casos, donde el área dada se
refiere a una curva normal.
a) El área entre 0 y z es 0,3770
b) El área a la izquierda de z es 0,8621
c) El área entre – 1,5 y z es 0,0217
Estadística y Probabilidades 13
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
14. En una distribución normal de media 4 y desviación típica 2, calcular el valor de a para que:
P(4−a ≤ x ≤ 4+a) = 0,5934
PRACTICA 2
1. En un estudio de la relación entre publicidad por radio y las ventas de un producto, durante 10
semanas se han recopilado tiempos de duración en minutos a la publicidad por semana (X), y el
número de artículos vendidos (Y), resultando:
Semana 1 2 3 4 5 6 7 8 9 10
Publicidad X 20 30 30 40 50 60 60 60 70 80
Ventas Y 50 73 69 87 108 128 135 132 148 170
a) Trazar el diagrama de dispersión
b) Calcular el coeficiente de correlación r de pearson
2. En la siguiente tabla calcular el coeficiente de correlación por rangos
Examinados
(X) (Y)
Susana 49 55
Iván 46 55
Lourdes 45 53
Aldo 42 29
Juan 39 48
María 37 29
Cesar 20 29
Olga 15 32
3. Hallar el coeficiente de correlación por rangos ordenados de las puntuaciones obtenidas por 17
estudiantes a los cuales se le han tomado dos pruebas de ortografía X y de redacción Y
X 60 54 53 49 49 47 46 45 45 45 43 41 39 38 32 32 30
Y 60 68 40 52 51 38 51 32 39 41 50 48 36 48 40 46 47
(X) (Y)
18 82
15 68
12 60
9 32
3 18
Estadística y Probabilidades 14
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
5. Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la longitud
en cm. de una cierta variedad de planta al cabo de un año de vida para predecir la longitud de
esa variedad de planta en edad adulta:
Se pide:
a) Representar el diagrama de dispersión
b) Calcular el coeficiente de correlación r de Pearson
6. Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la
concentración de alcohol en la saliva para predecir la concentración de dicho toxico en la sangre.
Se tomaron los siguientes datos de 13 varones en posible recuperación:
Se pide:
a) Representar el diagrama de dispersión
b) Obtener el coeficiente de correlación lineal de Pearson
Estadística y Probabilidades 15
Separata de ayuda 09 Mg. Héctor Basilio Marcelo
Estadística y Probabilidades 16