Você está na página 1de 20

1 El papel de la estadstica en la ingeniera.

1.1 EL MTODODE LAINGENIERIAYEL PENSAMIENTO


ESTADSTICO
1.1.1 La ingeniera y la solucin de problemas
Un ingeniero es alguien que resuelve problemas de inters para la sociedad medi-
ante la aplicacin eciente de principios cientcos. Los ingenieros llevan a cabo
esta tarea perfeccionando un producto o un proceso existente o bien diseando
un producto o proceso nuevo que satisfaga las necesidades de los consumidores.
El mtodo de la ingeniera o cientco es el enfoque aplicado para formular y re-
solver estos problemas. Los pasos del mtodo de la ingeniera son los siguientes:
1. Desarrollar una descripcin clara y concisa del problema.
2. Identicar, al menos de manera tentativa, los factores importantes que
afectan el problema o que pueden jugar un papel en su solucin.
3. proponer una solucin para el problema, utilizando los conocimientos
cientcos o de la ingeniera del fenmeno bajo estudio. Consignar todas las
limitaciones y/o supuestos del modelo.
4. Realizar los experimentos apropiados y recolectar datos para probar o
validar el modelo tentativo o las conclusiones planteadas en los pasos 2 y 3.
5. Renar el modelo con base en los datos observados.
6. Manipular el modelo para contribuir a desarrollar una solucin del prob-
lema.
7. Realizar un experimento apropiado para conrmar que la solucin prop-
uesta del problema es efectiva a la vez que eciente.
8. Sacar conclusiones o hacer recomendaciones con base en la solucin del
problema.
El campo de la estadstica trata de la recoleccin, presentacin, anlisis y
uso de datos para tomar decisiones, solucionar problemas y disear productos y
procesos. Debido a que diversos aspectos del ejercicio de la ingeniera implican
trabajar con datos, resulta evidente la importancia de ciertos conocimientos
de estadstica para cualquier ingeniero. Especcamente, las tcnicas pueden
constitur una poderosa ayuda para disear, desarrollar y mejorar procesos de
produccin.
Los mtodos estadsticos se utilizan como ayuda para describir y entender
la variabilidad.
Por variabilidad se entiende que observaciones sucesivas de un sistema o
fenmeno no producen exactamente el mismo resultado. Por ejemplo, consid-
rese el rendimiento del tanque de gasolina de un automvil. Se recorre siempre
el mismo kilometraje con cada tanque de combustible? Desde luego que no;
de hecho, en ocasiones el kilometraje recorrido vara considerablemente. Esta
variabilidad observada en el rendimiento depende de muchos factores, como las
condiciones de manejo, los cambios en el estado del vehculo con el tiempo, el
tipo y octanaje de la gasolina usada, y posiblemente hasta las condiciones me-
tereolgicas que hayan prevalecido recientemente. Estos factores representan
1
fuentes de variabilidad potenciales en el sistema. La estadstica proporciona
un marco para describir esta variabilidad y para saber cules de las fuentes
de variabilidad son ms importantes o cules tienen el mayor impacto sobre el
rendimiento por tanque de gasolina.
La variabilidad tambin est presente cuando se abordan problemas de in-
geniera. Por ejemplo, supngase que un ingeniero est diseando un conector
de nylon que usar en un motor de automvil. El ingeniero est considerando
establecer la especicacin del diseo del espesor de la pared en 3/32 de pul-
gada, pero se encuentra un tanto inseguro acerca del efecto dde esta decisin
sobre la fuerza de desconexin del conector. Si la fuerza de desconexin es muy
dbil el conector puede provovar una avera cuando est instalado en un motor.
Se hacen ocho unidades prototipo y se miden las fuerzas de desconexin, pro-
duciendo los siguientes datos (en libras-pie): 12.6, 12.9, 13.4, 12.3, 13.6, 13.5,
12.6, 13.1. Como se anticipaba, la fuerza de desconexin no es la misma para
todos los prototipos.
Estos datos se pueden representar mediante un diagrama de puntos. El
diagrama de puntos es una grca muy til para ilustrar un nmero reducido
de datos, digamos hasta unas 20 observaciones. Esta grca permite ver con
facilidad dos caractersticas de los datos: la localizacin, o parte de en medio,
y la dispersin o variabilidad.
Cuando el nmero de observaciones es reducido, suele ser dcil identicar
algn patrn de variabilidad especco, aun cuando el diagrama de puntos es una
forma conveniente para observar cualquier caracterstica inusual de los datos.
Tambin es posible describir numricamente las caracterstica de los datos.
Por ejemplo, la localizacin o tendencia central de los datos puede caracterizarse
con el promedio aritmtico ordinario o media. Debido a que lo ms comn es
considerar los datos como una muestra, nos referiremos a la media aritmtica
como la media muestral.
Denicin
Si las n observaciones de una muestra se denotan por x
1
; x
2
; :::; x
n
; entonces
la media muestral es
x =
x
1
+ x
2
+; :::; +x
n
n
=
n

i=1
x
i
n
(1)
Ejemplo 1-1
La media muestral de la fuerza de desconexin de las ocho observaciones
realizadas en los conectores proptotipo es 13.0.
La media muestral es el valor promedio de todas las observaciones del con-
junto de datos. Por lo general, estos datos son una muestra de observaciones
que se ha seleccionado de una poblacin de observaciones ms grande. En este
caso, la poblacin podra componerse de todos los conectores que se vendern
2
a los consumidores. en ocasiones existe una poblacin fsica real como un lote
de pastillas de silicio producidas en una fbrica de semiconductores. Tambin
podra considerarse el clculo del valor promedio de todas las observaciones de
una poblacin. A este promedio se le llama media poblacional y se denota
por la letra griega (mu).
Cuando hay un nmero nito de observaciones (digamos N) en la poblacin,
entonces la media poblacional es
=
N

i=1
x
i
N
(2)
La media muestral, x; es una estimacin razonable de la media poblacional
. por tanto, el ingeniero que disea el conector utilizando un espesor de la
pared de 3/32 de pulgada concluira, con base en los datos, que una estimacin
de la fuerza de desconexin media es 13.0 libras-pie.
Aun cuando la media muestral es til, no comunica toda la informacin
acerca de una muestra de datos. la variabilidad o dispersin de los datos puede
describirse con la varianza muestral o la desviacin estndar muestral.
Denicin
Si x
1
; x
2
; :::; x
n
; es una muestra de n observaciones entonces la varianza
muestral es
s
2
=
n

i=1
(x
i
x)
2
n 1
(3)
La desviacin estndar muestral es la raz cuadrada positiva de la varianza
muestral.
Clculo de s
2
Para encontrar el valor de s
2
es necesario hacer el clculo de x; de n sustrac-
ciones y de n cuadrados y sumar las operaciones. Si las observaciones originales
o las desviaciones x
i
x no son nmeros enteros, el manejo de las desviaciones
x
i
x puede ser tedioso y quiz sea necesario trabajar con varios decimales para
asegurar la precisin numrica. Una frmula de clculo ms eciente para la
varianzxa muestral se obtiene de la siguiente manera:
s
2
=
n
P
i=1
(xi x)
2
n1
=
n
P
i=1
(x
2
i
+x
2
2xxi)
n1
=
n
P
i=1
x
2
i
+nx
2
2x
n
P
i=1
xi
n1
3
y puesto que x = (1=n)
n

i=1
x
i
; esta ltima ecuacin se reduce a
s
2
=
n

i=1
x
2
i

n
P
i=1
xi

2
n
n 1
(4)
Ejemplo
Varianza y desviacin estndar del ejercicio anterior...
Anlogo a la varianza muestral, s
2
; existe una medida de variabilidad de
la poblacin llamada varianza poblacional. Se usa la letra griega
2
para
denotar la varianza poblacional. la raz cuadrada positiva de
2
, o , denotar
la desviacin estndar poblacional.
Cuando la poblacin es nita y se compone de N valores, la varianza pobla-
cional puede denirse como

2
=
N

i=1
(x
i
)
2
N
(5)
Se indic que la media muestral puede usarse como como una estimacin de
la media poblacional. De manera similar, la varianza muestral es una estimacin
de la varianza poblacional.
Obsrvese que el divisor de la varianza muestral es el tamano de la muestra
menos 1 (n 1), en tanto que el de la varianza poblacional es el tamano de la
poblacin N. Si se conociera el valor exacto de la media poblacional , entonces la
varianza muestral podra encontrarse elevando al cuadrado la desviacin prome-
dio de las observaciones muestrales alrededor de : En la prctica, casi nunca
se conoce el valor de ; por lo que es necesario usar la suma del cuadrado de las
desviaciones alrededor del promedio muestral x: Sin embargo, las observaciones
x
i
tienden a estar ms prximas a su promedio, x; que a la media poblacional,
: Por lo tanto, para compensar este hecho se usa n1 como divisor, en lugar de
n: Si se usara n como divisor en la varianza muestral, se obtendra una medida
de variabilidad que es, en promedio, consistentemente menor que la verdadera
varianza poblacional
2
:
Otra forma de visualizar lo anterior es considerar la varianza muestral s
2
como una medida basada en n 1 grados de libertad. El trmino grados de
libertad resulta del hecho de que las n desviaciones x
1
x; x
2
x; :::; x
n
x;
siempre suman cero, por lo que al especicar los valores de cualesquiera n1 de
estas cantidades automticamente se determina la nica que queda. Por tanto,
slo n 1 de las n desviaciones x
i
x; estn determinadas libremente.
Adems de la varianza muestral y la desviacin estndar muestral, el rango
muestral, la diferencia entre la observacin ms grande y la ms pequena, es
una medida til de la variabilidad. El rango muestral se dene como sigue.
4
Denicin
Si las n observaciones de una muestra se denotan por x
1
; x
2
; :::x
n
; entonces
el rango muestral es
r = max (x
i
) min(x
i
) (6)
Enn general, cuando la variabilidad de los datos muestrales aumenta, el
rango muestral se incrementa.
El clculo del rango muestral es encillo, pero ignora toda la informacin de
los datos muestrales entre el valor ms pequeno y el ms grande. Por ejemplo, las
dos muestras 1,3,5,8, 9 y 1,5,5,5,9 tienen el mismo rango (r = 8): Sin embargo,
la desviacin estndar de la primera muestra es s
1
= 3:35, en tanto que la de la
segunda muestra es s
2
= 2:83:La variabilidad es, en efecto, menor en la segunda
muestra.
En ocasiones, cuando el tamano de la muestra es pequeno, digamos n < 8
o 10, la prdida de informacin asociada con el rango no es demasiado grave.
Por ejemplo, el rango tiene un uso generalizado en el control estadstico de la
calidad, donde los tamanos de la muestras de 4 o 5 observaciones son bastantes
comunes.
2 Resumen y presentacin de datos
2.1 LA IMPORTANCIA DEL RESUMEN Y LA PRE-
SENTACIN DE DATOS
En anterior capitulo se introdujeron la media muestral, lavarianza muestral,
la desviacin estndar muestral y el diagrama de puntos como tcnicas para
resumir datos. Los resmenes y las representaciones de datos bien elaborados
son esenciales para el pensamiento estadstico correcto, ya que pueden enfocar
al ingeniero en caractersticas importantes de los datos o proporcionar ideas
acerca del modelo que debera emplearse para la solucin del problema.
La computadora se ha convertido en una herramienta importante para la
reperesentacin y el anlisis de datos. An cuando muchas tcnicas estadsti-
cas slo requieren una calculadora de mano, ese enfoque puede requerir mucho
tiempo y esfuerzo, mientras que una computadora llevar a cabo las tareas con
mayor eciencia.
2.2 DIAGRAMA DE TALLO Y HOJAS
El diagrama de puntos es una representacin de datos til para muestras pe-
quenas, hasta (digamos) unas 20 observaciones. Sin embargo, cuando el nmero
5
de observaciones es ms o menos grande, otras representaciones grcas pueden
resultar ms convenientes.
Por ejemplo, sean los siguientes datos, son datos de la resistencia a la com-
presin en libras por pulgada cuadrada (psi, por sus siglas en ingls) de 80
ejemplares de una nueva aleacin aluminio-litio sujeta a evaluacin como posible
material para elementos estructurales de aeronaves. Los datos se registraron en
el orden de las pruebas y en este formato no comunican sobre la resistencia a la
compresin. No es sencillo responder a preguntas tales como: "Qu porcentaje
de los ejemplares estn abajo de 120 psi? ". Debido al gran nmero de observa-
ciones, construr el diagrama de puntos de estos datos resulta dispendioso. Sin
embargo, se cuenta con representaciones ms ecaces para conjunto grandes de
datos
105 221 183 186 121 181 180 143
97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
Un diagrama de tallo y hoja es una forma adecuada de obtener una rep-
resentacin visual informativa de un conjunto de datos x
1
; x
2
; :::; x
n
; donde cada
nmero x
i
tiene al menos dos dgitos. Para construir un diagrama de tallo y
hoja, cada nmero x
i
se divide en dos partes: un tallo, compuesto por uno o
ms de los primeros dgitos, y una hoja, compuesta por los dgitos restantes.
Como ilustracin, si los datos consisten en informacin del porcentaje entre 0
y 100 de piezas defectuosas en lotes de obleas de semiconductores, entonces el
valor el valor 76 puede dividirse en el tallo 7 y la hoja 6. En general, debern ele-
girse relativamente pocos tallos en comparacincon el nmero de observaciones.
La mejor eleccinsuele ser entre 5 y 20 tallos. Una vez que se ha elegido un
conjunto de ellos, se enlistan en el margen izquierdo del programa. En seguida
de cada tallo se enlistan todas las hojas correspondientes a los valores de los
datos observados en el orden en que se van encontrando en el conjunto de datos.
EJEMPLO 2-1
Para ilustrar la construccin de un diagrama de tallo y hoja, considrense
los datos de la resistencia a la cpmpresin de la tabla anterior. Se seleccionarn
como valores del tallo los nmeros 7, 8 , 9,...,24. El diagrama de tallo y hoja se
muestra en la gura 2-1
Diagrama de tallo y hoja para X
Frecuencia Tallo y hoja
2,00 Extremos (=<87)
1,00 0 . 9
6
22,00 1 . 0011122233333344444444
45,00 1 . 555555555555666666666677777777778888888999999
8,00 2 . 00001222
2,00 Extremos (>=237)
Stem width: 100,00
Each leaf: 1 case(s)
La representacin ordenada de tallo y hoja hace relativamente sencillo de-
terminar caractersticas de los datos, tales como los percentiles, los cuartiles y
la mediana. La mediana muestral es una medida de la tendencia central que
divide los datos en dos partes iguales, la mitad qwue queda abajo de la mediana
y la mitad que queda arriba de ella. Si el nmero de observaciones es par, la
mediana est a la mitad de los valores centrales medx =
X
(
n
2
)
+X
(
n
2
+1
)
2
:
Si el nmero de observaciones es impar, medx = x
(
n+1
2
)
: En ambos casos
x
(n)
indica el n esimo dato ordenado.
La moda muestral es el valor de los datos que ocurre con mayor frecuencia.
Los datos tambin pueden dividirse en ms de dos partes. Cuando un con-
junto ordenado de datos se divide en cuatro partes iguales, los puntos de divisin
se denominan cuartiles. El primer cuartil o cuartil inferior, q
1
; es un valor que
tiene aproximadamente una cuarta parte (25%)de las observaciones abajo de
l y aproximadamente 75% de las observaciones arriba. El segundo cuartil, q
2
;
tiene aproximadamente la mitad (50%) de las observaciones abajo de su valor.
El segundo cuartil es exactamente igual a la mediana. El tercer cuartil; q
3
;
tiene aproximadamente tres cuartas partes (75%) de las observaciones abajo de
su valor. Como en el caso de la mediana, los cuartiles pueden no ser nicos.
(Obtener los cuartiles del ejemplo)
En general, el percentil 100 k
0
esimo es un valor de los datos tal que aprox-
imadamente el 100k% de las observaciones est en este valor o abajo del mismo
y aproximadamente el 100(1-k)% de ellas se encuentra arriba de l. Por ltimo,
puede usarse un rango intercuartlico, denido como IQR = q
3
q
1
; como
medida de variabilidad. El rango intercuartlico es menos sensible a los valores
extremos de la muestra que el rango muestral ordinario.
2.3 DISTRIBUCIONES DE FRECUENCIAS E HISTOGRA-
MAS
Una distribucin de frecuencias es un resumen de datos ms compacto que
un diagrama de tallo y hoja. Para construir una distribucin de frecuencias, el
rango de los datos debe dividirse, a los que acostumbra llamarse intervalos de
clase o celdas. De ser posible, los intervalos de clase debern ser de la misma
anchura a n de reforzar la informacin visual de la distribucin de frecuencias.
7
La seleccin del nmero de intervalos de clase deber hacerse con criterio para
que pueda desarrollarse una representacin razonable. El nmero de intervalos
de clase depende del nmero de observaciones y del grado de dispersin de
los datos. Una distribucin de frecuencias que emplea muy pocos intervalos de
clase o demasiados no ser informativa. En general, se encuentra que entre 5
y 20 intervalos de clase son satisfactorios en la mayora de los casos y que el
nmero de intervalos de clase deber incrementarse con n. Elegir un nmero de
intervalos de clase aproximadamente igual a la raz cuadrada del nmeronmero
de observaciones suele dar buenos resultados en la prctica.
En la siguiente tabla se muestra la distribucin de frecuencias para los datos
de la resistencia a la compresin. Puesto que el conjunto de datos contiene 80
observaciones, y como
_
80
~
= 9; se supone que entre 8 y 9 celdas proporcionar
una distribucin de frecuencia satisfactoria. Los valores ms grande y ms
pequeno son 245 y 76, respectivamente, por lo que los intervalos de clase deben
cubrir un rango de al menos 245 76 = 169 unidades en la escala psi. Si
se desea que el lmite inferior del primer intervalo empiece un poco antes del
valor ms pequeno y que el lmite superior del ltimo intervalo de clase est un
poco despus del valor ms grande, entonces la distribucin de frecuencia podra
empezar en 70 y terminar en 250. Este es un intervalo o rangode 180 unidades
psi. Nueve intervalos de clase, cada uno de 20 psi de anchura, producen una
distribucin de frecuencias razonable, por lo que la distribucin de frecuencias,
se basa en nueve intervalos dde clase.
Intervalo de clase Frec. Frec. Rel. Frec. Rel. Acum.
70 _ x < 90 2 0:0250 0:0250
90 _ x < 110 3 0:0375 0:625
110 _ x < 130 6 0:0750 0:1375
130 _ x < 150 14 0:1750 0:3125
150 _ x < 170 22 0:2750 0:5875
170 _ x < 190 17 0:2125 0:8000
190 _ x < 210 10 0:1250 0:9250
210 _ x < 230 4 0:0500 0:9750
230 _ x < 250 2 0:0250 1:0000
8
2.4
9
3 Probabilidad
3.1 Espacios muestrales y eventos
Denicin
Un experimento aleatorio es aquel que puede producir resultados diferentes,
an cuando se repita siempre de la misma manera.
Denicin
Al conjunto de todos los resultados posibles de un exprimento aleatorio se
le llama espacio muestral. El espacio muestral se denota por S:
Ejemplo 3.1
Consderese un experimento en el que se selecciona un conector y se mide su
espesor. Los valores posibles del espesor dependen de la resolucin del instru-
mento de medicin, as como de los lmites superior e inferior del espesor. Sin
embargo, podra resultar conveniente denir el espacio muestral simplemente
como la recta real R:
S = R
An cuando no puede ocurrir un valor negativo del espesor.
Si el nico objetivo del anlisis es considerar si una pieza particular tiene
espesor bajo, medio o alto, entonces el espacio muestral podra tomarse como
el conjunto de los tres resultados
S = bajo; medio; alto
Si el nico objetivo del anlisis es considerar si una pieza particular cumple
o no con las especicaciones de fabricacin, entonces el espacio muestral podra
simplicarse al conjunto de los dos resultados
S = s{; no
que indica si la pieza cumple o no con las especicaciones.
Ejemplo 3.2
Si se seleccionan y miden dos conectores, entonces la extensin de la recta
real R llevar el espacio muestral al plano
S = R R
Si el nico objetivo del anlisis es considerar si las piezas particulares cumplen
o no con las especicaciones de fabricacin, entonces cualquiera de las dos puede
cumplir con ellas o no. Se abrevian s y no como s y n. Si el par ordenado sn
10
indica que el primer conector cumple con las especicaciones y el segundo no lo
hace, entonces el espacio muestral puede representarse por los cuatro resultados
S = ss; sn; ns; nn
Si slo nos interesarmos en el nmero de piezas de la muestra que cumple
con las especicaciones, el espacio muestral podra resumirse como
S = 0; 1; 2
Como otro ejemplo, considerse un experimento en el que el espesor se mide
hasta que un conector no cumple con las especicaciones. El espacio muestral
puede representarse como
S = n; sn; ssn; sssn; ssssn; y as sucesivamente
En los experimentos aleatorios que impliquen seleccionar artculos de un
lote, se indicar si el artculo seleccionado se reemplaza o no antes de selec-
cionar el siguiente. Por ejemplo, si el lote se compone de tres artcilos a; b; c
y el experimento consiste en seleccionar dos artculos sin reemplazo el es-
pacio muestral puede representarse como S = ab; ac; ba; bc; ca; cb : Sin em-
bargo, si los artculos se reemplazan antes de seleccionar el siguiente, se dice
que el muestreo es con reemplazo. Entonces, los resultados posibles son
S = aa; ab; ac; ba; bb; bc; ca; cb; cc :
3.2 Eventos
Denicin
3.2.1 Un evento es un subconjunto del espacio muestral de un ex-
perimento aleatorio.
Dado que los eventos son subconjuntos, es posible usar las operaciones bsicas
con conjuntos tales como la unin, interseccin y el complemento para formar
otros eventos de inters.
Ejemplo 3.3
En el ejemplo anterior, suponga que el conjunto de todos los resultados
para los que al menos una pieza cumple con las especicaciones se denota por
E
1
:Entonces
E
1
= ss; sn; ns
El evento de que ninguna dde las dos piezas cumpla con las especicaciones,
denotado por E
2
; solo contiene el resultado, E
2
= nn : Otros ejemplos de
eventos son E
3
= ?; el conjunto vaco y E
4
= S; el espacio muestral.
11
Si E
5
= sn; ns; nn ; entonces
E
1
' E
5
= S E
1
E
5
= sn; ns E
0
1
= nn
Denicin
Se dice que dos eventos, denotados como E
1
y E
2
son mutuamente ex-
cluyentes si E
1
E
2
= ?
Las leyes de Morgan implican que (A' B)
0
= A
0
B
0
y (A B)
0
= A
0
'B
0
;
adems A B = B A y A' B = B ' A
3.3 Interpretacin de la probabilidad
Denicin
Un espacio muestral es discreto si contiene un conjunto nito (o contable-
mente innito) de resultados.
Siempre que un espacio muestral conste de N resultados posibles que son
igualmente factibles, la probabilidad de cada resultado es 1=N:
Denicin
Para un espacio muestral discreto, la probabilidad de un evento E; denotada
como P (E) ; es igual a la suma de las probabilidades de los resultados en E:
Ejemplo
Un experimento aleatorio puede producir uno de los resultados a; b; c; d
con probabilidades 0:1; 0:3; 0:5; 0:1, respectivamente. Sea que A denote el evento
a; b ; B; el evento b; c; d y C el evento d :
Entonces
P (A) = 0:1 + 0:3 = 0:4
P (B) = 0:3 + 0:5 + 0:1 = 0:9
P (C) = 0:1
Adems, P (A
0
) = 0:6; P (B
0
) = 0:1 y P (C
0
) = 0:9: Adems puesto que
A B = b ; P (A B) = 0:3:Puesto que A ' B = a; b; c; d ; P (A' B) =
0:1 + 0:3 + 0:5 + 0:1 = 1: Puesto que A C es el conjunto vaco P (A C) = 0
3.3.1 Axiomas de probabilidad
La probabilidad es un nmero que se asigna a cada miembro de una coleccin
de eventos de un experimento aleatorio que satisface las siguientes propiedades.
Si S es el espacio muestral y E es cualquier evento en un experimento aleato-
rio,
1) P (S) = 1
12
2) 0 _ P (E) _ 1
3) Para dos eventos E
1
y E
2
con E
1
E
2
= ?; P (E
1
' E
2
) = P (E
1
)+P (E
2
)
De los axiomas anteriores se deducen las siguientes propiedades
a. P (?) = 0
b. P (E
0
) = 1 P (E)
c. Si E
1
E
2
; entonces P (E
1
) _ P (E
2
)
3.4 Reglas de adicin
P (A' B) = P (A) + P (B) P (A B) (7)
Si A y B son eventos mutuamente excluyentes, entonces
P (A' B) = P (A) + P (B) (8)
Prubese para tres eventos
P (A' B ' C) = P (A) + P (B) + P (C)
P (A B) P (A C) P (B C) + P(A B C) (9)
Denicin
Se dice que los eventos de una coleccin E
1
; E
2
; :::; E
k
son mutuamente ex-
cluyentes si para todos los pares E
i
E
j
= ?:
Para una coleccin de eventos mutuamente excluyentes,
P (E
1
' E
2
' ::: ' E
k
) = P(E
1
) ' P(E
2
) ' ::: ' P(E
k
) (10)
3.5 Probabilidad condicional
La probabilidad de que un evento B ocurra cuando se sabe que ya ocurri algn
evento A se llama probabilidad condicional y se denota por P (B [ A) : El
smbolo P (B [ A) por lo general se lee "la probabilidad de ocurra B dado que
ocurri A". O simplemente "la probabilidad de B dado A":
Denicin
La probabilidad condicional de B, dado A; se dene como
P (B [ A) =
P (A B)
P (A)
; si P (A) > 0
Ejemplo
13
La probabilidad de que un vuelo programado normalmente salga a tiempo
es P (D) = 0:83; la probabilidad de que llegue a tiempo esP (A) = 0:82; y la
probabilidad de que salga y llegue a tiempo es P (D A) = 0:78: Encuentre la
probabilidad de que un avin a) llegue a tiempo, dado que sali a tiempo y b)
sali atiempo, dado que lleg a tiempo.
Eventos independientes
Denicin
Dos eventos A y B son independientes si y slo si
P (B [ A) = P (B) y P (A [ B) = P (A) :
De otra forma, A y B son dependientes.
3.6 Reglas multiplicativas
Teorema
Si en un experimento pueden ocurrir los eventos A y B; entonces P (A B) =
P (A) P (B [ A) :
Teorema
Dos eventos A y B son independientes si y slo si
P (A B) = P (A) P (B)
3.7 Regla de Bayes
Teorema de probabilidad total
Si los eventos B
1
; B
2
; :::B
k
constituyen una particin del espacio muestral S
tal que P (B
i
) ,= 0 para i = 1; 2; :::k; entonces para cualquier evento A de S,
P (A) =
k

i=1
P (B
i
A) =
k

i=1
P (B
i
) (A [ B
i
)
Teorema (Regla de Bayes) Si los eventos B
1
; B
2
; :::B
k
constituyen una
particin del espacio muestral S donde P (B
i
) ,= 0 para i = 1; 2; :::; k; entonces
para cualquier evento A en S tal que P (A) ,= 0;
P (B
r
[ A) =
P (B
r
A)
k

i=1
P (B
i
A)
=
P (B
r
) P (A [ B
r
)
k

i=1
P (B
i
) P (A [ B
i
)
para r = 1; 2; :::; k
14
4 Variables aleatorias ydistribuciones de proba-
bilidad
4.1 Concepto de variable aleatoria
Denicin
Una variable aleatoria es una funcin que asocia un nmero real con cada
elemento del espacio muestral.
Se utilizar una letra mayscula, X, para denotar una variable aleatoria y
su correspondiente minscula, x; en este caso, para uno de sus valores.
Ejemplo
Se sacan dos bolas de menera sucesiva sin reemplazo de una urna que contiene
cuatro bolas rojas y tres negras. Los posibles resultados y los valores y de la
variable aleatoria Y , donde Y es el nmero de bolas rojas, son
Espacio muestral y
RR 2
RB 1
BR 1
BB 0
Ejemplo
El empleado de un almacn regresa tres cascos de seguridad al azar a tres
empleados de un taller siderrgico que ya los haban probado. Si Smith, Jones y
Brown, en ese orden, reciben uno de los tres cascos, liste los puntos muestrales
para los posibles rdenes de regreso de los cascos y encuentre el valor m de la
variable aleatoria M que representa el nmero de asociaciones correctas.
Solucin
Si S; J y B representan los cascos de Smith, Jones y Brown, respectivamente,
entonces los posibles arreglos en los que se pueden regresar los cascos y el nmero
de asociaciones correctas son
Espacio muestral m
SJB 3
SBJ 1
JSB 1
JBS 0
BSJ 0
BJS 1
15
Denicin
Si un espacio muestral contiene un nmero nito de posibilidades o una
serie interminable con tantos elementos como nmeros enteros existen, se llama
espacio muestral discreto.
Denicin
Si un espacio muestral contiene un nmero innito de posibilidades igual al
nmero de puntos en un segmento de lnea, se llama espacio muestral continuo.
Una variable aleatoria se llama variable aleatoria discreta si se puede
contar su conjunto de resultados posibles. Como los posibles valores de Y en el
ejemplo anterior son 0,1 y 2 y los valores de M en el ejemplo anterior son 0,1 y
3, se sigue que Y y M son variables aleatorias discretas. Cuando una variable
aleatoria puede tomaer valores en una escala continua, se le denomina variable
aleatoria continua.
En la mayor parte de los problemas prcticos, las variables aleatorias con-
tinuas representan datos medidos, como son todos los posibles pesos, alturas,
temperaturas, distancias o peodos de vida, mientras que las variables aleatorias
discretas representan datos contados, como el nmero de artculos defectuosos
en una muestra de k artculos o el nmero de accidentes de carretera por anio
en un estado dado. Ntese que las variables aleatorias Y y M de los ejemp-
los anteriores representan datos contados, Y el nmero de bolas rojas y M el
nmero de asignaciones correctas de los cascos.
4.2 Distribuciones discretas de probabilidad
Si se supnen pesos iguales para los eventos simples del ejemplo de las asigna-
ciones de los cascos, la probabilidad de que ningn empleadom obtenga de vuelta
su casco correcto, es decir, la probabilidad de que M tome el valor cero, es 1/3.
Los valores posibles m de M y sus probabilidades son
m 0 1 3
P (M = m)
1
3
1
2
1
6
Note que los valores de m agotan todos los caso posibles y por ello las
probabilidades suman 1.
Denicin
El conjunto de pares ordenados (x; f (x)) es una funcin de probabilidad, fun-
cin masa de probabilidad o distribucin de probabilidad de la variable aleatoria
discreta X si, para cada resultado posible x;
1. f (x) _ 0:
16
2.

x
f (x) = 1:
3. P (X = x) = f (x) :
Ejemplo
Un embarque de 8 microcomputadores similares para una tienda contiene
tres que estn defectuosos. Si una escuela hace una compra al azar de dos de
estas computadoras, encuentre las distribuciones de probabilidad para el nmero
de defectuosas.
Solucin
Sea X una variable aleatoria cuyos valores x son los nmeros posibles de com-
putadoras defectuosas que compra la escuela. Entonces x puede ser cualquiera
de los nmeros 0,1 y 2. Ahora bien,
f (0) = P (X = 0) =
_
3
0
__
5
2
_
_
8
2
_ =
10
28
f (1) = P (X = 1) =
_
3
1
__
5
1
_
_
8
2
_ =
15
28
f (2) = P (X = 2) =
_
3
2
__
5
0
_
_
8
2
_ =
3
28
En tonces la distribucin de probabilidad de X es
x 0 1 2
f (x)
10
28
15
28
3
28
Denicin
La distribucin acumulada F (x) de una variable aleatoria discreta X con
distribucin de probabilidad f (x) es
F (x) = P (X _ x) =

tx
f((t) para < x < :
Para la variable aleatoria M, el nmero de asociaciones correctas en el ejem-
plo anterior, se tiene
F (2:4) = P (M _ 2:4) = f (0) + f (1) =
1
3
+
1
2
=
5
6
La distribucin acumulada de M es
F (m) =
_

_
0 para m < 0
1
3
para 0 _ m < 1
5
6
para 1 _ m < 3
1 para m _ 3
Ejemplo
17
Si una agencia de autos vende 50% de su inventario de cierto vehculo ex-
tranjero equipado con bolsas de aire.
a) Encuentre una frmula para la distribucin de probabilidad del nmero
de autos con bolsas de aire entre los siguientes cuatro vehculos que venda la
agencia.
b) Encuentre la distribucin acumulada, mediante el uso de F (x) ; verique
que f (2) =
3
8
:
Solucin
a) Como la probabilidad de vender un auto con bolsas de aire es 0.5, los 2
4
=
16 puntos del espacio muestral tienen la misma probabiloidad de ocurrencia. Por
tanto, el denominador para todas las probabilidades, y tambin para nuestra
funcin, es 16. Para obtener el nmero de maneras de vender tres modelos con
bolsas de aire, necesitamos considerar el nmero de formas de dividir cuatro
resultados en dos celdas con tres modelos con bolsas de aire asignadas a una
celda, y el modelo sin bolsas de aire asignado a la otra. Esto se puede hacer de
_
4
3
_
= 4 formas. En general, el evento de vender x modelos con bolsas de aire
y 4 x modelos sin bolsas de aire puede ocurrir de
_
4
x
_
formas, donde x puede
ser 0; 1; 2; 3 o 4: Entonces, la distribucin de probabilidad f (x) = P (X = x) es
f (x) =
_
4
x
_
16
para x = 0; 1; 2; 3; 4
b) F (0) = f (0) =
1
16
;
F (1) = f (0) + f (1) =
5
16
F (2) = f (0) + f (1) + f (2) =
11
16
F (3) = f (0) + f (1) + f (2) + f (3) =
15
16
F (4) = f (0) + f (1) + f (2) + f (3) + f (4) = 1:
De aqu
F (x) =
_

_
0 para x < 0
1
16
para 0 _ x < 1
5
16
para 1 _ x < 2
11
16
para 2 _ x < 3
15
16
para 3 _ x < 4
1 para x _ 4
Entonces, f (2) = F (2) F (1) =
11
16

5
16
=
3
8
Grca de barras.
Histograma de probabilidada.
Grca de la distribucin acumulada.
18
4.3 Distribuciones continuas de probabilidad
Una variable aleatoria continua tiene una probabilidad cero de tomar exacta-
mente cualquiera de sus valores. En consecuencia, su distribucin de probabili-
dad no se puede dar en forma tabular. Ntese que cuando X es continua,
P (a < X _ b) = P (a < X < b) + P (X = b) = P (a < X < b) :
Al trabajar con funciones continuas, f (x) por o general se llama funcin
de densidad de probabilidad o simplemente funcin de densidad de X.
Una funcin de densidad de probabilidad se construye de modo que el rea
bajo su curva limitada por el eje x sea igual a 1cuando se calcula en el rango de
X para el que se dene f (x) :
Denicin
La funcin f (x) es una funcin de densidad de probabilidad para la variable
aleatoria continua X, denida en el conjunto de nmeros reales R, si
1. f (x) _ 0; para toda x R:
2.
_
1
1
f (x) dx = 1:
3. P (a < X < b) =
_
b
a
f (x) dx
Ejemplo
Suponga que el error en la temperatura de reaccin, en

C; para un experi-
mento de laboratorio controlado es una variable aleatoria continua X que tiene
la funcin de densidad de probabilidad
f (x) =
_
x
2
3
; 1 < x < 2
0; en otro caso
(a) Verique la condicin 2 de la denicin anterior.
(b) Encuentre P (0 < X _ 1) :
Denicin
La distribucin acumulada F (x) de una variable aleatoria continua X con
funcin de densidad f (x) es
F (x) = P (X = x) =
_
x
1
f (t) dt para < x <
Como consecuencia inmediata de la denicin anterior se puede escribir los
dos resultados,
P (a < X < b) = F (b) F (a) y f (x) =
dF(x)
dx
; si existe la derivada.
Ejemplo
19
Para la funcin de densidad del ejemplo anterior, encuentre F (x) ; y utilcela
para evaluar P (0 < X _ 1) :
20

Você também pode gostar