Você está na página 1de 132

Probabilidad

Libro de Texto
Maria de la Luz Torres Valles
Instituto Tecnolgico de
Durango
t=
ii
TABLA DE CONTENIDO

INTRODUCCIN.................................................................................................................................................... V
1. ESTADSTICA DESCRIPTIVA......................................................................................................................... 6
1.1 INTRODUCCIN, NOTACIN SUMATORIA................................................................................................ 6
1.1.1 Antecedentes de la Probabilidad ........................................................................................................ 6
1.1.2 Antecedentes de la Estadstica............................................................................................................ 8
1.1.3 Notacin Sumatoria.......................................................................................................................... 10
1.1.3.1 Propiedades de las Sumatorias ................................................................................................................................. 11
1.2 DATOS NO AGRUPADOS ......................................................................................................................... 15
1.2.1 Medidas de Tendencia Central para Datos No Agrupados ............................................................. 16
1.2.1.1 Media Aritmtica ( o
X
) ............................................................................................................................ 17
1.2.1.2 Mediana (Med) ................................................................................................................................................ 18
1.2.1.3 Moda (Mo) ....................................................................................................................................................... 19
1.2.1.4 Medidas de tendencia central con menor incidencia..................................................................................... 20
1.2.1.4.1 Media Geomtrica...................................................................................................................................... 20
1.2.1.4.2 Media Armnica ........................................................................................................................................ 20
1.2.1.4.3 Media Aritmtica Ponderada o Promedio Ponderado ............................................................................. 20
1.2.2 Medidas de Dispersin...................................................................................................................... 21
1.2.2.1 Desviacin Media o Promedio de Desviacin (DM). ................................................................................... 22
1.2.2.2 Desviacin Tpica o Estndar (o)................................................................................................................... 23
1.2.2.3 Varianza. .......................................................................................................................................................... 23
1.3 DATOS AGRUPADOS.............................................................................................................................. 25
1.3.1 Medidas de Tendencia Central para Datos Agrupados ................................................................... 28
1.3.1.1 Media Aritmtica ( o X) ............................................................................................................................ 30
1.3.1.2 Mediana (Med) ................................................................................................................................................ 31
1.3.1.3 Moda (Mo) ....................................................................................................................................................... 33
1.3.2 Medidas de Dispersin para Datos Agrupados................................................................................ 34
1.3.2.1 Desviacin Media o Promedio de Desviacin (DM) .................................................................................... 34
1.3.2.2 Desviacin Tpica o Estndar (o)................................................................................................................... 35
1.3.2.3 Varianza ........................................................................................................................................................... 36
1.4 REPRESENTACIN DE UN CONJUNTO DADO DE DATOS, MEDIANTE UN HISTOGRAMA, POLGONO DE
FRECUENCIA, OJIVAS, ETC. .................................................................................................................................. 36
1.4.1 Histograma o histograma de Frecuencia......................................................................................... 39
1.4.2 Polgono de frecuencia..................................................................................................................... 40
1.4.3 Ojivas................................................................................................................................................. 40
2 FUNDAMENTOS DE PROBABILIDAD.................................................................................................... 42
2.1 CONJUNTOS Y TCNICAS DE CONTEO. ................................................................................................. 42
2.1.1 Teora de Conjuntos ......................................................................................................................... 42
2.1.1.1 Definicin ........................................................................................................................................................ 42
2.1.1.2 Caractersticas.................................................................................................................................................. 43
2.1.1.3 Representacin................................................................................................................................................. 44
2.1.1.4 Relaciones ........................................................................................................................................................ 44
2.1.1.4.1 Igualdad ...................................................................................................................................................... 45
2.1.1.4.2 Inclusin ..................................................................................................................................................... 45
2.1.1.5 Operaciones..................................................................................................................................................... 45
2.1.1.6 Leyes de Conjuntos ......................................................................................................................................... 48
2.1.2 Tcnicas Conteo................................................................................................................................ 49
2.1.2.1 Permutaciones.................................................................................................................................................. 49
2.1.2.1.1 Permutacin Ordinaria............................................................................................................................... 50
2.1.2.1.2 Permutacin con Sustitucin..................................................................................................................... 51
2.1.2.1.3 Permutacin Circular ................................................................................................................................. 52
2.1.2.1.4 Permutacin con Repeticin ..................................................................................................................... 52
2.1.2.2 Combinaciones ................................................................................................................................................ 53
2.1.2.3 Diagrama de rbol .......................................................................................................................................... 54
t=
iii
2.1.2.4 Particiones Ordenadas..................................................................................................................................... 55
2.1.2.5 Diagrama para la Resolucin de Problemas de Tcnicas de Conteo ........................................................... 57
2.2 CONCEPTO CLSICO Y COMO FRECUENCIA RELATIVA ........................................................................ 58
2.3 ESPACIO MUESTRAL Y EVENTOS ........................................................................................................... 58
2.4 AXIOMAS Y TEOREMAS.......................................................................................................................... 59
2.4.1 Axiomas de Probabilidad.................................................................................................................. 59
2.4.2 Teoremas de Probabilidad................................................................................................................ 60
2.5 ESPACIO FINITO EQUIPROBABLE........................................................................................................... 61
2.6 PROBABILIDAD CONDICIONAL E INDEPENDENCIA................................................................................ 62
2.6.1 Probabilidad Condicional................................................................................................................. 62
2.7 TEOREMA DE BAYES.............................................................................................................................. 64
3 MODELOS ANALTICOS DE FENMENOS ALEATORIOS DISCRETOS ...................................... 67
3.1 DEFINICIN DE VARIABLE ALEATORIA DISCRETA................................................................................ 67
3.2 FUNCIN DE PROBABILIDAD Y DE DISTRIBUCIN, VALOR ESPERADO, VARIANZA Y DESVIACIN
ESTNDAR............................................................................................................................................................. 68
3.2.1 Funcin de Probabilidad.................................................................................................................. 68
3.2.2 Funcin de Distribucin................................................................................................................... 68
3.2.3 Medidas de Tendencia Central......................................................................................................... 68
3.2.3.1 Valor esperado o media................................................................................................................................... 68
3.2.3.2 Moda................................................................................................................................................................. 68
3.2.3.3 Mediana............................................................................................................................................................ 69
3.2.4 Medidas de Variacin....................................................................................................................... 69
3.2.4.1 Varianza ........................................................................................................................................................... 69
3.2.4.2 Desviacin Tpica o Estndar ......................................................................................................................... 69
3.3 DISTRIBUCIN BERNOULLI ................................................................................................................... 69
3.4 DISTRIBUCIN BINOMIAL. .................................................................................................................... 70
3.5 DISTRIBUCIN HIPERGEOMTRICA...................................................................................................... 73
3.5.1 Aproximacin de la hipergeomtrica por la Binomial .................................................................... 76
3.6 DISTRIBUCIN GEOMTRICA................................................................................................................ 76
3.7 DISTRIBUCIN MULTINONIAL............................................................................................................... 78
3.8 DISTRIBUCIN DE POISSON................................................................................................................... 79
4 MODELOS ANALTICOS DE FENMENOS ALEATORIOS CONTINUOS ..................................... 83
4.1 DEFINICIN DE VARIABLE ALEATORIA CONTNUA. .............................................................................. 83
4.2 FUNCIN DE DENSIDAD Y ACUMULATIVA. ............................................................................................ 84
4.3 VALOR ESPERADO, VARIANZA Y DESVIACIN ESTNDAR. ................................................................... 84
4.3.1 Medidas de Tendencia Central: ....................................................................................................... 84
4.3.1.1 Valor esperado o media de una V.A.C........................................................................................................... 84
4.3.1.2 Moda de una V.A.C......................................................................................................................................... 84
4.3.1.3 Mediana de una V.A.C.................................................................................................................................... 85
4.3.2 Medidas de Variacin:...................................................................................................................... 85
4.3.2.1 Varianza de una V.A.C. .................................................................................................................................. 85
4.3.2.2 Desviacin Tpica o Estndar de una V.A.C. ................................................................................................ 85
4.4 DISTRIBUCIN UNIFORME Y EXPONENCIAL......................................................................................... 85
4.4.1 Distribucin Uniforme...................................................................................................................... 85
4.4.2 Distribucin Exponencial................................................................................................................. 86
4.5 DISTRIBUCIN NORMAL........................................................................................................................ 88
4.5.1 Aproximacin de la Binomial a la Normal. ..................................................................................... 92
4.6 TEOREMA DE CHEBYSHEV. ................................................................................................................... 94
5 REGRESIN Y CORRELACIN SIMPLE.............................................................................................. 97
5.1 INTRODUCCIN. ..................................................................................................................................... 97
5.1.1 Tabla de Frecuencia Absoluta para Variables Bidimensionales. ................................................... 98
5.1.2 Tabla de Doble Entrada.................................................................................................................... 99
5.1.3 Distribuciones Marginales. ............................................................................................................ 100
5.1.4 Tabla de Frecuencia Relativa para Variables Bidimensionales. .................................................. 100
5.1.5 Funciones estadsticas: media, varianza, desviacin y covarianza............................................... 101
t=
iv
5.1.6 Diagrama de Dispersin o Nube de Puntos ................................................................................... 103
5.2 REGRESIN LINEAL SIMPLE Y CURVILNEA. ....................................................................................... 107
5.2.1 Distinguir entre variable dependiente e independiente. ................................................................ 107
5.2.2 Diferencia entre Dependencia Funcional y Dependencia Estadstica.......................................... 108
5.2.3 Definir ecuacin de regresin y cul es su aplicacin. ................................................................. 110
5.2.4 Mtodo de Mnimos Cuadrados ..................................................................................................... 111
5.2.5 Consideraciones sobre la recta de regresin.................................................................................. 116
5.3 CORRELACIN..................................................................................................................................... 116
5.3.1 Coeficiente de Correlacin de Pearson.......................................................................................... 117
5.4 EJERCICIO INTEGRAL.......................................................................................................................... 120
ANEXOS ................................................................................................................................................................ 127
REFERENCIAS BIBLIOGRFICAS................................................................................................................. 131
t=
v
Introduccin

En este libro se tratan los temas que contiene el programa de estudios de la materia
Probabilidad en la especialidad de Ingeniera Industrial del Sistema de Institutos
Tecnolgicos, fue realizado con la finalidad de que sirva como auxiliar en la preparacin de los
alumnos de Ingeniera Industrial, adems de que tambin puede ser consultado por los
alumnos que estn cursando la materia de Probabilidad en cualquiera de las especialidades
que ofrece el sistema.

El Libro est dividido en 5 captulos, de acuerdo al nmero de unidades que componen el
programa de estudios, El tema central del primer captulo es la Estadstica Descriptiva en
este se abordan temas tales como: antecedentes de la probabilidad y la estadstica,
sumatorias y Manejo de Datos no Agrupados y Datos Agrupados a travs del clculo de las
medidas de tendencia central, de dispersin y la representacin grfica de los datos.

En el segundo captulo denominado Fundamentos de Probabilidad se tratan los siguientes
temas: Conjuntos y Tcnicas de Conteo, el concepto clsico y como frecuencia relativa de la
probabilidad, espacios muestrales y eventos, axiomas y teoremas de la probabilidad, espacio
finito equiprobable, probabilidad condicional e independencia y teorema de Bayes.

La informacin que contiene el tercer captulo se relaciona con los Modelos Analticos de
Fenmenos Aleatorios Discretos; adems de la definicin de variable aleatoria discreta, la
funcin de probabilidad y de distribucin, valor esperado, varianza y desviacin estndar se
estudian las distribuciones: Bernoulli, Binomial, Hipergeomtrica, Geomtrica, Multinomial y
Poisson.

Los temas relacionados con los Modelos Analticos de Fenmenos Aleatorios Continuos
tales como: definicin de variable aleatoria continua, funcin de densidad y acumulativa, valor
esperado, varianza y desviacin estndar as como las distribuciones Uniforme y Exponencial,
Distribucin Normal y Teorema de Chebyshev, se tratan en el captulo cuatro.

Corresponde al captulo cinco, el estudio de temas relacionados con la Regresin Lineal y
Correlacin Simple.
Cada uno de los temas estn abordados de acuerdo al punto de vista de la autora buscando
siempre simplificar su comprensin; el criterio utilizado en la elaboracin del libro fue abordar
primero la parte conceptual del tema a tratar, luego las ecuaciones cuando as se requiere y se
cierra el tema con ejemplos que contengan aparte del enunciado del ejercicio, las formulas a
utilizar, el desarrollo paso a paso utilizando tablas y grficas (si se requieren para la mejor
comprensin) en las que se resaltan la informacin que se va generando con color amarillo y/o
verde, hasta llegar al resultado.

El logro de cualquier objetivo requiere de esfuerzo, se espera que este libro sirva de apoyo.

Bienvenidos al maravilloso mundo de la probabilidad!

E
E
s
s
t
t
a
a
d
d

s
s
t
t
i
i
c
c
a
a
D
D
e
e
s
s
c
c
r
r
i
i
p
p
t
t
i
i
v
v
a
a
1.1 Introduccin, notacin sumatoria
1.2 Datos no agrupados.
1.2.1 Medidas de tendencia central y de posicin.
1.2.2 Medidas de dispersin
1.3 Datos agrupados
1.3.1 Tabla de frecuencia
1.3.2 Medidas de tendencia central y de posicin
1.3.3 Medidas de dispersin
1.4 Representacin de un conjunto dado de datos, mediante un
histograma, polgono de frecuencia, ojivas, etc.

1. ESTADSTICA DESCRIPTIVA

1 1. .1 1 I In nt tr ro od du uc cc ci i n n, , n no ot ta ac ci i n n s su um ma at to or ri ia a
1 1. .1 1. .1 1 A An nt te ec ce ed de en nt te es s d de e l la a P Pr ro ob ba ab bi il li id da ad d
La Teora de la Probabilidad, es la rama de las matemticas que se ocupa de medir
o determinar cuantitativamente la posibilidad de que ocurra un determinado suceso.
Si queremos saber lo que suceder maana o la semana que entra, habr que
contemplar muchas probabilidades; lo que hace la teora de la probabilidad es
decirnos, esto es lo ms probable o esto es lo que sucede ms frecuentemente o hay
una tendencia hacia aquello. La Probabilidad est basada en las tcnicas de conteo
y es fundamento necesario de la Estadstica.

PROBABILIDAD Fundamentos de Probabilidad
t=
7
Aunque algunos matemticos como Gerolamo Cardano en el siglo XVI, haban
hecho algunas contribuciones al desarrollo de la probabilidad, la Teora de la
probabilidad se atribuye a los matemticos franceses del siglo XVII Blaise Pascal y
Pierre de Fermat.

Pascal tena un colega que era jugador empedernido, un da su colega le
dijo que quera resolver una duda que tena sobre probabilidad y juegos de
azar, el problema que llam la atencin de Pascal y Fermat, trataba sobre un
juego de dados con un final en disputa, supongan que dos personas juegan
dados, estn a la mitad del juego y sbitamente deben abandonarlo, uno de
ellos tiene mas puntos que el otro Cmo dividirn el dinero de las apuestas
de un modo justo?

Para resolver el problema hay que mirar el futuro, qu habra sucedido si
hubieran podido terminar el juego? En un juego de cartas, Pascal y Fermat
imaginaron un juego de dados de cinco turnos, el primero en ganar tres tiros,
ganara el juego, en su escenario, imaginaron que Fermat iba ganando dos
tiros a uno.

Fermat solo necesitaba otro tiro para ganar, as que pensaron en todos los
finales posibles:

1. Si Fermat ganaba los tiros 4 y 5, ganaba el juego, ya que habra ganado al
menos 3 tiros de 5.
2. Si Fermat ganaba el cuarto tiro y perda el quinto, ganaba otra vez porque
habra ganado 3 tiros de 5.
3. Si Fermat perda el cuarto tiro y ganaba el quinto, segua ganando.
4. La nica forma en que poda perder sera perdiendo los dos ltimos tiros.

Dadas tales posibilidades, Fermat y Pascal razonaron correctamente que las
probabilidades eran 3 a 1 a favor de Fermat, por lo tanto, Fermat debera
quedarse con partes del dinero y pascal con , los matemticos
descubrieron que una leve ventaja aumentara mucho las probabilidades de
ganar de un jugador, ms de 300 aos despus, los casinos sacan provecho
de las leyes de la probabilidad.
1
Como ven, la Teora de la Probabilidad, se desarroll para entender los juegos de
azar, Fermat y Pascal se convencieron de que el juego tiene mucho que ver con el
pensamiento matemtico y lgico. Tal vez Fermat y Pascal nunca imaginaron que

1
Vdeo Las Probabilidades Diarias
Jugador 1 2 3 4 5
Fermat

Pascal

PROBABILIDAD Fundamentos de Probabilidad
t=
8
aparte del juego, la Teora de la Probabilidad se puede aplicar en cualquier actividad
de la vida cotidiana, en esto radica su verdadera importancia.

1 1. .1 1. .2 2 A An nt te ec ce ed de en nt te es s d de e l la a E Es st ta ad d s st ti ic ca a
La Estadstica se encarga de la recoleccin, procesamiento, anlisis e interpretacin
de datos numricos que ayuden a resolver problemas como el diseo de experimentos
y la toma de decisiones.

Existen algunas representaciones grficas y otros smbolos hechos por las antiguas
civilizaciones sobre rocas, pieles, paredes de cuevas etc., relacionados con el conteo
de personas, animales o cosas que pueden ser consideradas como formas sencillas de
estadstica; tambin existen registros de agricultura y comercio de los babilonios que
datan del ao 3000 a.C.; de los egipcios en el siglo XXXI a.C. sobre poblacin; de los
Chinos, de los Griegos, sin embargo, el primer estudio de poblacin que llama la
atencin es el realizado en el ao 1066 por encargo del William el conquistador, rey de
Inglaterra, el pas fue dividido en pequeas reas y se registro en nmero de personas
por cada zona y el tipo de productos que se producan ah, estos datos fueron
registrados en un libro llamado El Libro del Juicio Final (Domesday Book), sin
embargo no pas de ser solo una coleccin de datos hasta a mediados de siglo XVII
en la que se conoci el verdadero poder del libro al efectuarse un anlisis e
interpretacin de los datos por parte de John Graunt tendero de profesin quin
determin a partir de los datos registrados, correlacionado bautismos con nacimientos,
nacimientos con mujeres en edad de criar, nmero de mujeres con nmero de familias
y su tamao, que en ese tiempo, la poblacin de Inglaterra no era de 2 millones como
se especulaba sino que a era solo una quinta parte, 384,000 personas
aproximadamente. Muchos expertos actuales creen que la estimacin de Graunt era
muy cercana a la realidad, al sacar conclusiones de los datos, Graunt realiz el anlisis
estadstico moderno.

En la actualidad, la Estadstica se utiliza como una poderosa herramienta en cualquier
rama del conocimiento. En Ingeniera se puede utilizar en el control de calidad de un
producto; en Medicina para conocer la eficacia de un nuevo medicamento; en el
Deporte para medir los logros de los deportistas; en Educacin para mostrar la eficacia
de los mtodos de estudio; en el Comercio para surtir productos de temporada; en
Economa Domstica para controlar el gasto familiar. Sin duda sera demasiado
extenso ejemplificar la utilizacin de la estadstica tambin en: Biologa, Economa,
Poltica, Psicologa, Agricultura, Fsica, Qumica, Opinin Pblica, Trabajo Social, etc.

Actualmente la Estadstica tiene dos ramificaciones: Estadstica Descriptiva y
Estadstica Inferencial. La Estadstica Descriptiva, la cual es motivo de estudio en este
captulo, trabaja con todos los individuos de la poblacin que cumplan con una
caracterstica previamente especificada. Tiene como finalidad recolectar informacin,
analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada
cmoda y rpidamente, y por tanto, pueda utilizarse eficazmente para el fin que se
desee, se recomienda realizar los siguientes pasos:
PROBABILIDAD Fundamentos de Probabilidad
t=
9
1. Determinar la caracterstica del individuo se desea estudiar.

2. Recopilar la informacin de cada individuo que cumple con la caracterstica
definida (se pueden utilizar entrevistas, mediciones, sondeos, encuestas, etc.).

3. Previa clasificacin, se elaboran tablas de frecuencia.

4. A partir de las tablas, se representan los datos en forma grfica (histogramas,
polgonos, ojivas).

5. Obtencin de parmetros estadsticos (medidas de tendencia centra, y de
dispersin).

La Estadstica Inferencial, contrario a la Estadstica Descriptiva, solo trabaja con una
muestra de la poblacin, y a partir de los resultados que se obtienen en esta, se hacen
inferencias sobre toda la poblacin, en esta es importante la seleccin de la muestra,
debe ser representativa de la poblacin para evitar inferencias errneas y tener un
mayor grado de certidumbre.

No debemos perder de vista que la recopilacin de datos por si sola, no nos dice nada,
solo estaremos haciendo estadstica con e minscula, si realmente queremos hacer
Estadstica con E mayscula, los datos se deben someter a un proceso de anlisis e
interpretacin, que nos lleve a la toma de decisiones, fundamentadas en la Teora de
la Probabilidad para alcanzar la mayor posibilidad de xito.

PROBABILIDAD Fundamentos de Probabilidad
t=
10
1 1. .1 1. .3 3 N No ot ta ac ci i n n S Su um ma at to or ri ia a
Para determinar si un elevador con capacidad de 400 Kg. soporta el peso de 6
personas que desean abordarlo, usted que hara? Sin duda, optara por sumar los
pesos de las 6 personas para conocer si el peso total no excede la capacidad del
elevador.

Bien, ahora imaginemos que los pesos de las 6 personas son:

Persona Peso en Kg.
1 80
2 63
3 75
4 52
5 47
6 68
Nuestro conjunto de observaciones {80, 63, 75, 52, 47, 68}, est asociado a la
variable peso a la cual llamaremos X.

La letra i la utilizaremos para indicar el nmero de observacin (en este ejemplo, el
nmero de la persona a la que corresponde el peso, ejemplo: la cuarta persona pesa
52 Kg.).

Al total de observaciones (nmero de personas que desean abordar el elevador) le
llamaremos n.
La letra S del alfabeto griego (E), nos sirve para representar la sumatoria de los
valores.

De acuerdo con lo anterior, nuestro conjunto de observaciones se representa de la
siguiente manera:
i X
1 80
2 63
3 75
4 52
5 47
6 68
Ahora bien, dado un conjunto de observaciones de alguna variable representada por
X
1
, X
2
,..., X
n
, podemos expresar su suma X
1
+ X
2
+...+X
n
en forma abreviada como:

=
n
i
i
X
1
PROBABILIDAD Fundamentos de Probabilidad
t=
11
Esto se lee suma de los X
i
desde i igual a 1 hasta n en donde:
385 68 47 52 75 63 80
6 5 4 3
6
1
2 1
= + + + + + = + + + + + =

=
X X X X X X X
i
i
1.1.3.1 Propiedades de las Sumatorias

1.- Si c es una constante cualquiera que multiplica a la variable X, entonces:

i
n
i
i
n
i
X c cX
1
1
=
=
E = E
Demostracin:
( )
n i
n
i
n i
n
i
X X X c X c
cX cX cX cX
+ + + = E =
+ + + = E
=
=
...
...
2 1
1
2 1
1
Ejemplo: Un centro comercial tienen la siguiente promocin, en cada compra que
usted realice durante el mes, le proporcionan una tarjeta para que la raspe y
conozca el nmero de puntos a los que se hizo acreedor, el nmero de puntos ser
multiplicado por 4 y son acumulables; al finalizar el mes, de acuerdo al nmero de
puntos obtenidos le darn un obsequio. Si en total realiz 5 compras y obtuvo los
siguientes puntos, cuntos puntos acumul al final del mes?

i X
1 -3
2 5
3 1
4 7
5 0
Solucin:
c = 4
40 4 4
5
1
5
1
= E = E
= =
i
i
i
i
X X
Porque
40
0 28 4 20 12
) 0 ( 4 ) 7 ( 3 ) 1 ( 4 ) 5 ( 4 ) 3 ( 4 4
5
1
=
+ + + + =
+ + + + = E
=
i
i
X
40
) 10 ( 4
) 0 7 1 5 3 ( 4
5
1
=
=
+ + + + = E
=
i
i
X
PROBABILIDAD Fundamentos de Probabilidad
t=
12
2. Si X es una constante, entonces
nX X
i
n
i
= E
=1
Demostracin:

Si X
i
=1 en la propiedad anterior, entonces

4 1 4
4 1 1 1 1 1
4
1
4
1
= =
= + + + = =

= =
i
i i
i
nX
X
Ejemplo: Si usted cursa actualmente 6 materias y todas tienen un valor de 8
crditos, cuantos crditos est cursando?

Solucin:

48 8 8 8 8 8 8 8
6
1
= + + + + + = E
= i
o tambin 48 ) 8 ( 6 8
6
1
= = E
= i
3. Si tenemos 2 o ms conjuntos de observaciones del mismo tamao que deseamos
sumar y estas son acumulables entonces:
i
n
i
i
n
i
i
n
i
i i i
n
i
Z Y X Z Y X
1 1 1 1
) (
= = = =
E + E + E = + + E
Demostracin:
) ... ( ) ... ( ) ... (
) ( ... ) ( ) ( ) (
2 1 2 1 2 1
1 1 1
2 2 2 1 1 1
1
n n n
i
n
i
i
n
i
i
n
i
n n n i i i
n
i
Z Z Z Y Y Y X X X
Z Y X
Z Y X Z Y X Z Y X Z Y X
+ + + + + + + + + + + =
E + E + E =
+ + + + + + + + + = + + E
= = =
=
Ejemplo: 4 Alumnos formarn parte de un equipo deportivo, deben ir a que les
tomen medidas para que les confeccionen el uniforme (pants(X), chamarra (Y) y
shorts (Z), los tres son de la misma tela. De acuerdo a la siguiente tabla, Cuanta
tela deber comprar la modista?

i X Y Z
1 1.5 1.8 .75
2 1.7 2 .85
3 1.65 1.95 .8
4 1.55 1.85 .75
PROBABILIDAD Fundamentos de Probabilidad
t=
13
Solucin:

5 . 17
) 15 . 4 ( ) 40 . 4 ( ) 55 . 4 ( ) 05 . 4 (
) 75 . 85 . 1 55 . 1 ( ) 8 . 95 . 1 65 . 1 ( ) 85 . 2 7 . 1 ( ) 75 . 8 . 1 5 . 1 ( ) (
4
1
=
+ + + =
+ + + + + + + + + + + = + + E
=
i i i
i
Z Y X
5 . 17
15 . 3 6 . 7 4 . 6
) 75 . 8 . 85 . 75 (. ) 85 . 1 95 . 1 2 8 . 1 ( ) 55 . 1 65 . 1 7 . 1 5 . 1 (
4
1
4
1
4
1
=
+ + =
+ + + + + + + + + + + = E + E + E
= = =
i
i
i
i
i
i
Z Y X
4. Si c es una constante que se suma a X
i
entonces nc X c X
i
n
i
i
n
i
+ E = + E
= = 1 1
) (
Demostracin:

= = = =
+ = + = +
4
1 1 1 1
) (
i
i
n
i
n
i
i
n
i
i
nc X c X c X
Ejemplo: Por cada venta de productos con un valor mayor o igual a $300.00, el
empleado de una tienda, se quedar con $50.00 de comisin. Al final del da
cunto deber reportar a caja?

i X
1 420.00
2 375.00
3 530.00
Solucin:

c = $50.00 que deber restar a cada precio
1175 150 1325 ) 50 ( 3 ) 530 375 420 ( ) (
1175 150 1325 ) 50 50 50 ( ) 530 375 420 (
1175 480 325 370 ) 50 530 ( ) 50 375 ( ) 50 420 ( ) (
4
1
3
1
3
1
3
1
= = + + =
= + = + + + + =
= + + = + + =

=
= =
=
i
i
i i
i
i
i
c n X
c X
c X
PROBABILIDAD Fundamentos de Probabilidad
t=
14
Ejemplo: Dados X Y
4 6
5 4
8 5
6 8
DETERMINAR:
a)
xi
i
2
3
1 =
E Solucin: 105 64 25 16 8 5 4
2 2 2 2
3
1
= + + = + + = E
=
i
i
X
b)
2
4
1
) 3 ( + E
=
i
i
X Solucin:
315
81 121 64 49
) 3 6 ( ) 3 8 ( ) 3 5 ( ) 3 4 ( ) 3 (
2 2 2 2 2
4
1
=
+ + + =
+ + + + + + + = + E
=
i
i
X
c) 3
2
4
1
+ E
=
i
i
X Solucin:
144 3 141
3 ) 36 64 25 16 (
3 ) 6 8 5 4 ( 3
2 2 2 2 2
4
1
= + =
+ + + + =
+ + + + = + E
=
i
i
X
d)
i i
i
Y X
4
1 =
E Solucin:
132
) 48 40 20 24
) 8 * 6 ( ) 5 * 8 ( ) 4 * 5 ( ) 6 * 4 (
4
1
=
+ + + =
+ + + = E
=
i i
i
Y X
PROBABILIDAD Fundamentos de Probabilidad
t=
15
1 1. .2 2 D Da at to os s n no o A Ag gr ru up pa ad do os s
Cuando la cantidad de datos es mnima y por consecuencia su manejo es sencillo,
permite fcilmente la obtencin resultados representativos, se trabaja con la totalidad
de los datos (x) es decir, con datos no agrupados.

Contar con un grupo de datos agrupados o no agrupados por si mismo no nos dice
nada, si queremos conocer cual es la tendencia de los datos, o que tan distante
podemos esperar un dato con respecto a la mayora, debemos calcular estadsticos
que nos indiquen por ejemplo el valor promedio o la desviacin estndar, estos
estadsticos son identificados con letras griegas si fue calculado a partir de la totalidad
de los datos que forman la poblacin y con letras latinas si el estadstico fue calculado
solo con una muestra de la poblacin.

Cabe sealar que si los valores de la muestra son enteros y en caso de que los
resultados obtenidos de los estadsticos sean con decimales, estos debern
aproximarse al entero ms cercano.

Ejemplo: A un grupo de 25 alumnos que cursan la carrera de Ingeniera en Sistemas,
se les pregunt la cantidad de dinero que gastan diariamente con el
propsito de saber: Cunto gasta en promedio diariamente un alumno?

Se recomienda seguir los siguientes pasos:

1. Toma o Recoleccin de Datos: Refiere a la obtencin de una coleccin de datos
que no han sido ordenados numricamente, es decir, es la seleccin de una
muestra aleatoria de la poblacin de inters.

Para este ejemplo, se recopilaron 25 datos que corresponden a la cantidad de
dinero que gastan diario 25 alumnos de la especialidad de Ingeniera en sistemas.
Por lo tanto, n = 25.
20 10 35 40 20 35 15 45 20
25 15 30 20 30 20 25 25
35 20 10 25 15 20 25 35
2. Ordenacin de Datos: Es la colocacin de los nmeros tomados en orden
creciente o decreciente de magnitud. (leer la siguiente tabla de arriba hacia abajo
y de izquierda a derecha )

10 15 20 20 25 25 30 35 45
10 15 20 20 25 25 35 35
15 20 20 20 25 30 35 40
PROBABILIDAD Fundamentos de Probabilidad
t=
16
3. Elaboracin de la Tabla de Distribucin de Frecuencia: Es la tabla que se forma
por 3 columnas, La primera de ellas, representa el nmero de clase (k); la segunda
(x), indica el conjunto de valores que intervienen en la muestra, tambin se le
conoce como conjunto imagen. En la tercera columna, se registra la frecuencia (f),
es decir, cuantos valores x existen en la muestra. La sumatoria de f debe ser igual
a n (E(f) = n).

Tabla de Distribucin de Frecuencia
k x f
1 10 2
2 15 3
3 20 7
4 25 5
5 30 2
6 35 4
7 40 1
8 45 1
n = 25
8. Clculo de las Medidas de Tendencia Central: Las ms comunes son: Media
Aritmtica, Mediana y Moda; existen otras con menos incidencia aunque no por ello
menos importantes como son: Media Geomtrica, Media Armnica y Media
Ponderada, el clculo de estas se describe en el apartado 1.2.1.

9. Calculo de las Medidas de Dispersin: Se les conoce tambin como medidas de
variacin y en el apartado 1.2.2 se estudiarn la Desviacin Media, la Desviacin
Estndar y la Varianza.

1 1. .2 2. .1 1 M Me ed di id da as s d de e T Te en nd de en nc ci ia a C Ce en nt tr ra al l p pa ar ra a D Da at to os s N No o A Ag gr ru up pa ad do os s
Se les conoce tambin como medidas de centralizacin, se emplean para indicar un
valor que tiende a ser el ms representativo de un conjunto de nmeros.

Las medidas de mayor importancia son: La Media Aritmtica, la Mediana y la Moda.
Aunque se emplean con menor incidencia tambin estn: la media geomtrica, la
media armnica y la media ponderada.

PROBABILIDAD Fundamentos de Probabilidad
t=
17
1.2.1.1 Media Aritmtica ( o
X
)
Representa el valor promedio de un conjunto de datos y se obtiene a partir de la
sumatoria del conjunto de valores que forman la poblacin o la muestra divididos entre
el total de ellos.
n
X
n
i
i
=
=
1

Por lo tanto:
=20+10+35+40+20+35+15+45+20+25+15+30+20+30+20+25+25+35+20+10+25+15+20+25+35
25

25 6 . 24
25
615
1
~ = = =

=
n
X
n
i
i

Cuando en la muestra existen repeticiones de datos, la media aritmtica tambin se


puede calcular a partir de la siguiente expresin:

n
X f
m
k
k k
=
=
1
) (

Donde: f
k
= frecuencia de clase
X
k
= valor de x de la clase
n = total de datos de la muestra

Estos datos son tomados de la Tabla de Distribucin de frecuencia.

Tabla de Distribucin de Frecuencia
k x f f
k
X
k
1 10 2 20
2 15 3 45
3 20 7 140
4 25 5 125
5 30 2 60
6 35 4 140
7 40 1 40
8 45 1 45
n = 25 615
=

=
m
k
k k
X f
1
) (
PROBABILIDAD Fundamentos de Probabilidad
t=
18
25 6 . 24
25
615
) (
1
~ = = =

=
n
X f
m
k
k k

1.2.1.2 Mediana (Med)



La mediana representa el valor central de los datos ya ordenados de acuerdo a su
magnitud. Para datos No agrupados, la mediana es igual al valor medio de la muestra
ya ordenada, para notar la diferencia, a continuacin se presentan los datos
desordenados (tal y como se recopilaron y posteriormente, se presentan ya ordenados
de menor a mayor.

Datos desordenados:
20, 10, 35, 40, 20, 35, 15, 45, 20, 25, 15, 30, 20, 30, 20, 25, 25, 35, 20, 10, 25, 15, 20, 25, 35

Datos ordenados:

10, 10, 15, 15, 15, 20, 20, 20, 20, 20, 20, 20, 25, 25, 25, 25, 25, 30, 30, 35, 35, 35, 35, 40, 45

Puesto que el nmero 25 se encuentra justo en el centro de la lista numrica ya que
existen doce nmeros menores o iguales que 25 y doce nmeros mayores o iguales
que 25 , ste es del valor que toma la mediana; por lo tanto:

Pero, qu pasa si el nmero de valores es par?, es decir, que en lugar de 25 datos
fueran 10 por ejemplo, en este caso, se ordena la lista y se toman los dos nmeros
que quedan en el centro y se obtiene el promedio de ellos, es decir, se suman y el
resultado se divide entre 2, el valor resultante, es el valor de la media.

Ejemplo:
10, 10, 15, 15, 15, 20, 20, 20, 20, 20

Los dos datos que se encuentran al centro de la lista numrica son 15 y 20, existen
cuatro nmeros menores o iguales a 15 y cuatro nmeros mayores o iguales a 20, en
este caso la Mediana se obtiene de la siguiente manera:

Med = 25
PROBABILIDAD Fundamentos de Probabilidad
t=
19
18 5 . 17
2
35
2
20 15
~ = =
+
= Med
1.2.1.3 Moda (Mo)

Representa el valor que ms veces se repite en la muestra, por lo que, para identificar
la clase modal, se recurre a la clase que tenga mayor frecuencia, este dato lo
podemos obtener de la lista de datos ordenada como se muestra a continuacin:

10, 10, 15, 15, 15, 20, 20, 20, 20, 20, 20, 20, 25, 25, 25, 25, 25, 30, 30, 35, 35, 35, 35, 40, 45

o de la Tabla de Distribucin de Frecuencia:

Tabla de Distribucin de Frecuencia
k x f
1 10 2
2 15 3
3 20 7
4 25 5
5 30 2
6 35 4
7 40 1
8 45 1
n = 25
En ambos casos, vemos que el nmero con mayor frecuencia es el 20, por lo tanto:

Si dentro de la muestra existen 2 valores que tienen el mismo nmero mximo de
repeticiones, entonces se dice que la muestra es bimodal y se toman ambos valores
como la moda, diferencindolas con el subndice 1 y 2 como en el ejemplo que se
muestra a continuacin:
10, 10, 15, 15, 15, 20, 20, 25, 25, 25
Tanto el 15 como el 25 tienen el valor mximo de repeticiones (3), por lo tanto, esta
muestra es bimodal.

Mo
1
= 15
Mo
2
= 25
Mo = 20
PROBABILIDAD Fundamentos de Probabilidad
t=
20
1.2.1.4 Medidas de tendencia central con menor incidencia

Como se explica al inicio del tema de medidas de tendencia central para datos no
agrupados, existen algunas de estas con menor incidencia pero no por ello son menos
importantes, tal es el caso de la Media Geomtrica, la Media Armnica y la Media
Ponderada que se estudian a continuacin.
1.2.1.4.1 Media Geomtrica
Se define como la raz n-sima del producto de los valores de la variable.
10x10x15x15x15x20x20x20x20x20x20x20x25x25x25x25x25x30x30x35x35x35x35x40x45 =
1.0255833984375e+34
23 93 . 22 34 375 0255833984 . 1
25
~ = + = e G
1.2.1.4.2 Media Armnica
Se define como el valor inverso de la media aritmtica de los recprocos de los valores
de la variable.

= =
= =
n
i i
n
i i
x
n
x n
H
1 1
1 1 1
1
45
1
40
1
35
1
35
1
35
1
35
1
30
1
30
1
25
1
25
1
25
1
25
1
25
1
20
1
20
1
20
1
20
1
20
1
20
1
20
1
15
1
15
1
15
1
10
1
10
1
25
1
+ + + + + + + + + + + + + + + + + + + + + + + +
= =

i
x
n
H
21 22 . 21
1
1
~ = =

=
n
i i
x
n
H
1.2.1.4.3 Media Aritmtica Ponderada o Promedio Ponderado
Se utiliza cuando las variables en estudios (x), son afectadas por ciertos pesos o
factores (w), en este caso, el valor promedio de los datos viene dado por:

=
=
=
m
k
k
m
k
k k
w
w x
1
1

PROBABILIDAD Fundamentos de Probabilidad


t=
21
Debido a que la serie de datos con la que hemos estado trabajando no est afectada
por un peso o factor (w), para ejemplificar esta medida en particular, cambiaremos
nuestra muestra, ahora tomemos los datos de un solo alumno que estudia en el
Instituto Tecnolgico de Durango: supongamos que ste alumno est estudiando la
carrera de Ingeniera Industrial y que actualmente cursa las siguientes asignaturas:
Matemticas, Probabilidad, Informtica y Metodologa de la Investigacin, cada una de
ellas con un valor curricular de 8 crditos; tambin cursa la materia de Dibujo con un
valor curricular de 4 crditos y por ltimo la materia de Ingeniera Industrial, la cual
tiene un valor curricular de 6 crditos.

Desde el momento en el que a cada materia se le asigna un peso o factor especfico
(en este caso los crditos de cada materia), para obtener el promedio obtenido, no
basta con el clculo de la media aritmtica, en este caso, se debe calcular el promedio
a travs de la Media Ponderada, para esto, es necesario conocer aparte del nmero
de crditos de cada materia (w), la calificacin obtenida en cada una de las materias
(x).

Materia
Cred.
(w) Calif. (x) w
k
x
k
Matemticas 8 70 560
Probabilidad 8 80 640
Informtica 8 90 720
Dibujo 4 100 400
Int. Ingeniera Industrial 6 90 540
Met. de la Investigacin 8 70 560
E(w) = 42 E( w
k
x
k
)= 3420
81 42 . 81
42
3420
1
1
~ = = =

=
=
m
k
k
m
k
k k
w
w x

1 1. .2 2. .2 2 M Me ed di id da as s d de e D Di is sp pe er rs si i n n. .
Se les conoce tambin como medidas de variacin y nos permite conocer si los
valores de la variable de estudio estn relativamente cercanos o si se encuentran
dispersos tomando como punto de referencia la media ().

PROBABILIDAD Fundamentos de Probabilidad
t=
22
Operacin
indicada
Resultado
de la
Operacin
1.2.2.1 Desviacin Media o Promedio de Desviacin (DM).
Se emplea para medir el promedio de los alejamientos de los datos observados en la
muestra respecto a la media y se define mediante:

n
x f
MD
m
k
k k
=

=
1

Donde: = 25
m = nmero total de clases
x
k
= Valor de la variable x en la clase k
l x
k
- l = Valor absoluto de la diferencia de la variable x con respecto a su media
aritmtica
f
k
= Frecuencia de la clase k
Estos datos los podemos calcular fcilmente a partir de la Tabla de Distribucin de
Frecuencia.

Tabla de Distribucin de Frecuencia
Ahora si, ya que conocemos los datos requeridos, se sustituyen en la ecuacin para
conocer la Desviacin Media (MD).

7 2 . 7
25
180
1
~ = =

=
n
x f
MD
m
k
k k

k x f l x
k
- l l x
k
- l f
k
l x
k-
l f
k
l x
k-
l
1 10 2
l 10-25 l
15
2 x 15
30
2 15 3 l 15-25 l 10 3 x 10 30
3 20 7 l 20-25 l 5 7 x 5 35
4 25 5 l 25-25 l 0 5 x 0 0
5 30 2 l 30-25 l 5 2 x 5 10
6 35 4 l 35-25 l 10 4 x 10 40
7 40 1 l 40-25 l 15 1 x 15 15
8 45 1 l 45-25 l 20 1 x 20 20
E(f) = 25 E( f
k
l x
k-
l)= 180
PROBABILIDAD Fundamentos de Probabilidad
t=
23
1.2.2.2 Desviacin Tpica o Estndar (o).
Es una de las medidas ms importantes dentro de la estadstica, mide la dispersin en
unidades idnticas a aquellas en las que las x
i
estn dadas y se obtiene a travs de la
siguiente frmula:
1
) (
1
2

=
n
x f
m
k
k k

o
Donde: = 25
x
k
= Valor de la variable x en la clase k
(x
k -
)
2
= Diferencia de x con respeto a su media aritmtica elevada al
cuadrado.
f
k
= Frecuencia de clase.
n = Tamao de la muestra =25.

Recurrimos nuevamente a la Tabla de Distribuciones de Frecuencia y agregamos las
columnas que sean necesarias para facilitar los clculos; en lo sucesivo, no se
agregarn columnas para indicar las operaciones, se agregarn solo las columnas que
contengan el resultado de la operacin.

Tabla de Distribucin de Frecuencia
k x f x
k
- ( x
k-
)
2
f
k
( x
k-
)
2
1 10 2 -15 225 450
2 15 3 -10 100 300
3 20 7 -5 25 175
4 25 5 0 0 0
5 30 2 5 25 50
6 35 4 10 100 400
7 40 1 15 225 225
8 45 1 20 400 400
n = 25 E = 2000
12 . 9 23 . 83
24
2000
1
) (
1
2
= = =

=
n
x f
m
k
k k

o
1.2.2.3 Varianza.
Es la medida de variabilidad de la poblacin y est dada por o
2
por lo tanto, una vez
que se conoce el valor de la Desviacin Estndar, es muy sencillo obtener la varianza
y viceversa.
23 . 83 12 . 9 var
2 2
= = =o
PROBABILIDAD Fundamentos de Probabilidad
t=
24
Ntese que para el clculo de la Desviacin Estndar y la Varianza, no aproximamos
los valores al entero ms prximo debido a que si lo hubisemos hecho, no habra
coincidencia en los resultados.

PROBABILIDAD Fundamentos de Probabilidad
t=
25
1 1. .3 3 D Da at to os s A Ag gr ru up pa ad do os s
Habr ocasiones en que el tamao de la muestra aleatoria sea muy grande;
obviamente, la gran cantidad de informacin nos dificulta el proceso y anlisis de la
misma complicando tambin la obtencin de resultados, en estos casos, se
recomienda simplificar el proceso de anlisis de la muestra de estudio organizando y
ordenando la informacin numrica, de tal forma que se pueda agrupar por rangos
predeterminados y disminuir el nmero de clases que se registren en una Tabla de
Distribuciones de Frecuencia.

Para la manipulacin de los datos y la obtencin de las Medidas de Tendencia Central
y Medidas de Dispersin las cuales van a ser nombradas con letras griegas si se
trabaja con la poblacin y con letras latinas si se trabaja con una muestra de la
poblacin, adems se har la representacin Grfica de los Datos. Se sugiere seguir
los siguientes pasos.

1. Toma o recopilacin de Datos: Refiere a la obtencin de una coleccin de datos
que no han sido ordenados numricamente, que representa la poblacin de estudio
o en su defecto, es la seleccin de una muestra aleatoria de la poblacin de
inters.

Para este ejemplo, se recopilaron 50 datos que corresponden a igual nmero de
calificaciones obtenidas por alumnos de la especialidad de Ingeniera en Sistemas
en la materia de Estructura de Datos durante el semestre Enero-Junio 2004, por lo
tanto, n = 50.
98 100 100 45 100 97 98 90 91 100
90 90 100 100 92 80 85 70 97 100
100 50 100 97 50 53 70 84 81 64
70 70 91 81 88 70 64 64 92 50
78 84 100 92 70 86 75 85 55 45
2. Ordenacin de Datos: Es la colocacin de los nmeros tomados en orden
creciente o decreciente de magnitud. (leer la siguiente tabla de arriba hacia abajo
y de izquierda a derecha )

45 53 70 70 81 86 91 97 100 100
45 55 70 75 84 88 91 97 100 100
50 64 70 78 84 90 92 97 100 100
50 64 70 80 85 90 92 98 100 100
50 64 70 81 85 90 92 98 100 100
PROBABILIDAD Fundamentos de Probabilidad
t=
26
3. Determinacin del Rango (R): Una vez ordenados los datos, es fcil identificar
cual es el valor ms pequeo de la muestra (45) al que llamaremos V
mnimo
y el
valor mas grande (100) al que llamaremos, V
mximo.
A partir de los valores mximo y mnimo obtenemos el rango a travs de la
siguiente frmula.

Por lo tanto:

4. Obtencin del nmero de clases o categoras (k): Representa el nmero de
clases que vamos a tener.
( ) ( ) n k log 3 . 3 1 + =
Donde: n = 50

Dado que el nmero de clases o categoras (k) de una distribucin no puede ser
fraccionario, se recomienda efectuar un proceso de aproximacin o redondeo al
entero superior contiguo. Como puede verse en el siguiente clculo.

( ) ( )
( )
606601 . 6
606601 . 5 1
69897 . 1 3 . 3 1
50 log 3 . 3 1
=
+ =
+ =
+ = k
7 606601 . 6 ~ = k
5. Clculo de la amplitud o anchura del intervalo de clase ( a ): Indica el nmero
de valores que va a comprender cada clase, se recomienda que se use en las
mismas unidades en que estn dados los datos recopilados. Es decir, si los datos
originales son enteros, el valor de la amplitud deber ser el entero superior al
resultado del cociente del rango entre el nmero de clases. Por otra parte, si los
datos fueran en centsimas, milsimas, etc., el valor de (a) deber ser un valor
coincidente al nmero de fracciones.
k R a =
Donde, de acuerdo a los clculos anteriores: R = 55 y k = 7
R = V
mximo
- V
mnimo

R = 100 45 = 55
PROBABILIDAD Fundamentos de Probabilidad
t=
27
8 85714 . 7
7 55
~ =
= a
6. Elaboracin de la Tabla de Distribucin de Frecuencia
Es la tabla que se forma por 3 columnas, la primera de ellas, representa el nmero
de clase (k) ; la segunda, indica los limites inferiores (l.i.)y superiores (l.s.) que
comprende la clase, generalmente inicia en el menor mas pequeo de la muestra
(V
inferior
) y a partir de este, se cuentan (a) valores para terminar el limite superior, en
la siguiente clase, el lmite inferior deber ser uno mas que el limite superior de la
clase anterior; mientras que en la tercer columna, se registra cuantos valores caen
dentro de el rango que comprende cada clase, a esto se le llama frecuencia de
clase (f).

Tabla de Distribucin de Frecuencia
Intervalo
k Li Ls f
1 45 52 5
2 53 60 2
3 61 68 3
4 69 76 7
5 77 84 6
6 85 92 12
7 93 100 15
Ef = 50
Como se puede ver, el valor mas pequeo que se encuentra en la muestra es el
45, por lo tanto, este es el primer valor que se toma, la amplitud de clase (a) es = 8,
entonces a partir del 45, se cuentan 8 valores (45, 46, 47, 48, 49, 50, 51 y 52) y el
ltimo se toma como lmite superior para esa clase.

En la segunda clase se empieza desde el 53 y se repite la operacin hasta
completar las 7 clases, obviamente, si se trabaja con nmeros que manejaran
hasta centsimas, milsimas, etc., la siguiente clase deber iniciar en el siguiente
valor coincidente al nmero de fracciones, ejemplo: Si una clase va desde 1.12
hasta 1.24, la siguiente clase iniciar en 1.25.

La sumatoria de f debe ser igual a n.
= n
PROBABILIDAD Fundamentos de Probabilidad
t=
28
7. Clculo de las Medidas de Tendencia Central: Ms adelante, se dedica un
apartado para estudiar las ms comunes son: Media Aritmtica, Mediana y Moda.

8. Clculo de las Medidas de Dispersin: se les conoce tambin como medidas de
variacin y se estudiarn la Desviacin Media, la Desviacin Estndar y la
Varianza.

9. Representacin de un conjunto dado de datos, mediante un histograma,
polgono de frecuencia, ojivas, etc.

1 1. .3 3. .1 1 M Me ed di id da as s d de e T Te en nd de en nc ci ia a C Ce en nt tr ra al l p pa ar ra a D Da at to os s A Ag gr ru up pa ad do os s
Se les conoce tambin como medidas de centralizacin, se emplean para indicar un
valor que tiende a ser el ms representativo de un conjunto de nmeros. Las medidas
de mayor importancia son: La Media Aritmtica, la Mediana y la Moda, aunque se
emplean con menor incidencia tambin, la media geomtrica y la Media Armnica(De
la Barrera Frayre, 2004). Y antes se requiere incorporar los componentes
complementarios a la tabla de distribuciones de frecuencia que son necesarios para el
clculo de las medidas de tendencia central.

a) Lmites Reales de Clase. Es importante incorporarlos debido a que van a ser
utilizados para el clculo de la mediana y la moda para datos agrupados. El lmite
real inferior (LRI), se obtiene restando punto al lmite inferior de la clase y el
lmite real superior (LRS), se obtiene sumando punto al lmite superior, en este
ejemplo se trabaja con nmeros enteros por lo tanto, se debe restar o sumar 0.5 al
lmite inferior o superior segn sea el caso.

No debemos perder de vista que si se trabaja con nmeros que utilicen dcimas,
entonces se restar o sumar 0.05; para centsimas se resta o se suma 0.005; en
nmeros con milsimas 0.0005 y as sucesivamente.

Para este ejemplo, los lmites reales se obtienen de la siguiente forma:

Para la primera clase los lmites reales toman los siguientes valores:

LRI
k
= Li
k
- 0.5 LRS
k
= Ls
k
+ 0.5
LRI
k
= 45 - 0.5 = 44.5 LRS
k
= 52 + 0.5 = 52.5
PROBABILIDAD Fundamentos de Probabilidad
t=
29
Tabla de Distribucin de Frecuencia
Intervalo
k Li Ls f LRI LRS
1 45 52 5 44.5 52.5
2 53 60 2 52.5 60.5
3 61 68 3 60.5 68.5
4 69 76 7 68.5 76.5
5 77 84 6 76.5 84.5
6 85 92 12 84.5 92.5
7 93 100 15 92.5 100.5
E= 50
b) Marca de Clase o Punto Medio (MC). Se obtiene sumando los lmites inferior y
superior de una clase y dividiendo entre dos. Es fcil observar que esto es el
punto medio del intervalo de clase y por ello se le conoce tambin como punto
medio.

2
k k
k
Ls Li
MC
+
=
Para la clase nmero 1, la Marca de Clase se obtiene de la siguiente forma:

5 . 48
2
97
2
52 45
2
1 1
1
= =
+
=
+
=
Ls Li
MC
Tabla de Distribucin de Frecuencia

Intervalo
k Li Ls f LRI LRS MC
1 45 52 5 44.5 52.5 48.5
2 53 60 2 52.5 60.5 56.5
3 61 68 3 60.5 68.5 64.5
4 69 76 7 68.5 76.5 72.5
5 77 84 6 76.5 84.5 80.5
6 85 92 12 84.5 92.5 88.5
7 93 100 15 92.5 100.5 96.5
PROBABILIDAD Fundamentos de Probabilidad
t=
30
Ef = 50
1.3.1.1 Media Aritmtica ( o X)
Representa el valor promedio de un conjunto de datos, si estos datos estn
representados a travs de una tabla de distribucin de frecuencia, la media aritmtica
se obtiene a partir de la siguiente ecuacin:

n
MC f
m
k
k k
=
=
1
) (

Donde: f
k
= frecuencia de clase
MC
k
= marca de clase, en ocasiones se representa a travs de la
variable x
n = total de datos de la muestra

Estos datos son tomados de la Tabla de Distribucin de frecuencia que se presenta a
continuacin; en esta misma tabla se agregarn las columnas necesarias para facilitar
la comprensin y el clculo de la media aritmtica.

Tabla de Distribucin de Frecuencia

Intervalo
k Li Ls f LRI LRS MC f
k
MC
k
1 45 52 5 44.5 52.5 48.5 242.50
2 53 60 2 52.5 60.5 56.5 113.00
3 61 68 3 60.5 68.5 64.5 193.50
4 69 76 7 68.5 76.5 72.5 507.50
5 77 84 6 76.5 84.5 80.5 483.00
6 85 92 12 84.5 92.5 88.5 1,062.00
7 93 100 15 92.5 100.5 96.5 1,447.50
Ef = 50 = n Ef
k
MC
k
= 4.049.00
PROBABILIDAD Fundamentos de Probabilidad
t=
31
81 98 . 80
50
4049
) (
1
~ = = =

=
n
MC f
m
k
k k

1.3.1.2 Mediana (Med)


Representa el valor central de los datos ya ordenados de acuerdo a su magnitud.
Para datos agrupados la mediana se calcula a travs de la siguiente expresin:

c
f
f n
LRI Med
med
kmed
|
|
.
|

\
|
E
+ =
1
) ( ) 2 (
Donde:
LRI
kmed
= Lmite real inferior de la clase mediana
Kmed

= Clase mediana
n = total de datos de la muestra
(Ef)
1
= Sumatoria de frecuencias de clases inferiores (anteriores) de la
clase mediana (kmed)
f
med
= frecuencia de la clase mediana
c = tamao del intervalo de la clase mediana y se obtiene de la
siguiente manera: LS
kmed
- LI
kmed
+ 1
LRS
kmed
= Lmite real superior de la clase mediana

Antes de calcular la mediana, tenemos que conocer la clase mediana (kmed), sta se
obtiene al realizar el siguiente procedimiento:

a) Dividir n/2; para este ejemplo n = 50 por lo tanto el resultado es igual a 25, ste
resultado representa la posicin que ocupa el dato que se encuentra en medio de
la muestra ordenada.

b) Desde la primera clase se acumulan las frecuencias una a una hasta encontrar el
primer resultado que sea mayor o igual a n/2 (25). Esto nos permite conocer en
qu clase se encuentra el dato que est en medio de la muestra (posicin 25).

Para este ejemplo, 5+2+3+7+6 representa la frecuencia acumulada de las primeras 5
clases y como el resultado es 23, entonces se tiene que acumular tambin el 12,
resultando 35; ste valor es el primero mayor o igual a 25 por lo tanto kmed = 6 dado
que nosotros estamos buscando la clase en la que queda el dato en la posicin
nmero 25 y ste fue encontrado en la clase nmero 6.

PROBABILIDAD Fundamentos de Probabilidad
t=
32
Tabla de Distribucin de Frecuencia

Intervalo
k Li Ls f LRI LRS MC f
k
MC
k
1 45 52 5 44.5 52.5 48.5 242.50
2 53 60 2 52.5 60.5 56.5 113.00
3 61 68 3 60.5 68.5 64.5 193.50
4 69 76 7 68.5 76.5 72.5 507.50
5 77 84 6 76.5 84.5 80.5 483.00
6 85 92 12 84.5 92.5 88.5 1,062.00 kmed
7 93 100 15 92.5 100.5 96.5 1,447.50
Ef = 50 = n Ef
k
MC
k
= 4,049.00
Ahora si, a partir de kmed podemos conocer otros datos por ejemplo: si kmed=6,
entonces las clases inferiores (anteriores) a kmed son las clases 1, 2, 3, 4 y 5, por lo
tanto ( Ef )
1
se obtiene de sumar todas las frecuencias que estn en estas clase
(5+2+3+7+6) entonces ( Ef )
1
= 23.

Para obtener el tamao del intervalo de la clase mediana ( c ), se resta al limite
superior de la clase mediana, el lmite real de la clase mediana y se suma 1 (92-85+1
= 8), este dato representa el nmero de valores que existen en el intervalo 85-92, al
enumerarlos; 85, 86, 87, 88, 89, 90, 91 y 92, podemos comprobar que son 8; por lo
tanto; c = 8.

8 . 85
33 . 1 5 . 84
8 * 166 . 0 5 . 84
8
12
2
5 . 84
8
12
23 25
5 . 84
8
12
23 ) 2 50 (
5 . 84
) ( ) 2 (
6
1
6
=
+ =
+ =
|
.
|

\
|
+ =
|
.
|

\
|
+ =
|
.
|

\
|
+ =
|
|
.
|

\
| E
+ = c
f
f n
LRI Med
86 8 . 85 ~ = Med
PROBABILIDAD Fundamentos de Probabilidad
t=
33
1.3.1.3 Moda (Mo)
Representa el valor que ms veces se repite en la muestra, por lo que, para identificar
la clase modal, se recurre a la clase cuya frecuencia sea mayor (kmodal), la moda
para datos agrupados, se obtiene mediante la siguiente frmula:

c LRI Mo
(

A + A
A
+ =
2 1
1
kmodal
Donde: LRI
kmodal
= Lmite Real Inferior de la clase modal.
A
1
= Frecuencia de la clase modal menos la frecuencia de
la clase anterior.
A
2
= Frecuencia de la clase modal menos la frecuencia de
la clase siguiente.
c = tamao del intervalo de la clase modal se obtiene de
restar al Lmite superior de la clase modal, el Lmite
inferior de la clase modal y sumando 1 (Ls
modal
Li
modal

+1).

Tabla de Distribucin de Frecuencia

Intervalo
k Li Ls f LRI LRS MC f
k
MC
k
1 45 52 5 44.5 52.5 48.5 242.50
2 53 60 2 52.5 60.5 56.5 113.00
3 61 68 3 60.5 68.5 64.5 193.50
4 69 76 7 68.5 76.5 72.5 507.50
5 77 84 6 76.5 84.5 80.5 483.00
6 85 92 12 84.5 92.5 88.5 1,062.00
7 93 100 15 92.5 100.5 96.5 1,447.50
kmodal
E = 50 = n E = 4,049.00
Puesto que la clase 7 es la que tiene mayor frecuencia; kmodal = 7, a partir de este
dato obtenemos que: f = 15; c = 100-93+1 = 8; A
1
= 15-12 = 3 y puesto que la 7 clase
es la ltima, no hay clase posterior, por lo tanto: A
2
=15-0=15

PROBABILIDAD Fundamentos de Probabilidad
t=
34
83 . 93 33 . 1 5 . 92
8 * 166 . 0 5 . 92
8
18
3
5 . 92
8
15 3
3
5 . 92
2 1
1
mod
= + =
+ =
(

+ =
(

+
+ =
(

A + A
A
+ = c LRI Mo
al k
94 83 . 93 ~ = Mo
1 1. .3 3. .2 2 M Me ed di id da as s d de e D Di is sp pe er rs si i n n p pa ar ra a D Da at to os s A Ag gr ru up pa ad do os s
Se les conoce tambin como medidas de variacin y nos permite conocer si los
valores de la variable de estudio estn relativamente cercanos o si se encuentran
dispersos tomando como punto de referencia la media ().

1.3.2.1 Desviacin Media o Promedio de Desviacin (DM)
Nos indica en promedio, que tan lejos se encuentran los datos de la muestra con
respecto a la media y se define mediante:

n
x f
DM
n
k
k k
=

=
1

Donde: f = frecuencia de la clase


x = marca de clase
= media = 81 para este ejercicio

k
x
= Valor absoluto de la marca de clase menos la media
n = total de elementos en la muestra

PROBABILIDAD Fundamentos de Probabilidad
t=
35
Tabla de Distribucin de Frecuencia
13 92 . 12
50
646
1
~ = =

=
n
x f
DM
m
k
k k

1.3.2.2 Desviacin Tpica o Estndar (o)


Es una de las medidas ms importantes dentro de la estadstica mide la dispersin en
unidades idnticas a aquellas en las que las x
i
estn dadas y se obtiene a travs de la
siguiente frmula:

1
) (
1
2

=
n
MC f
m
k
k k

o
Donde: = media = 81 para este ejercicio
MC
k
= Marca de clase o valor de la variable x en la clase k
( MC
k-
)
2
= Diferencia de la marca de clase con respeto a su media
aritmtica elevada al cuadrado
f
k
= Frecuencia de la Marca de clase
n = Tamao de la muestra = 50 para este ejercicio
m = Nmero de clases (7 para este ejemplo)

Recurrimos nuevamente a la Tabla de Distribuciones de Frecuencia y agregamos las
columnas que sean necesarias para facilitar los clculos.

Intervalo

k Li Ls f LRI LRS
MC
(X) f
k
X
k l
MC
k-

l
f
k l
MC
k-

l
1 45 52 5 44.5 52.5 48.5 242.50 32.50 162.50
2 53 60 2 52.5 60.5 56.5 113.00 24.50 49.00
3 61 68 3 60.5 68.5 64.5 193.50 16.50 49.50
4 69 76 7 68.5 76.5 72.5 507.50 8.50 59.50
5 77 84 6 76.5 84.5 80.5 483.00 0.50 3.00
6 85 92 12 84.5 92.5 88.5 1,062.00 7.50 90.00
7 93 100 15 92.5 100.5 96.5 1,447.50 15.50 232.50
n = 50 E = 4,049.00 E = 646.00
PROBABILIDAD Fundamentos de Probabilidad
t=
36
Tabla de Distribucin de Frecuencia
17 . 15 62 . 246
49
50 . 084 , 12
1
) (
1
2
= = =

=
n
MC f
m
k
K k

o
1.3.2.3 Varianza
Es la medida de variabilidad de la poblacin y est dada por o
2
por lo tanto, una vez
que se conoce el valor de la Desviacin Estndar, es muy sencillo obtener la varianza
y viceversa.

62 . 246 17 . 15 var
2 2
= = = o
Ntese que para el clculo de la Desviacin Estndar y la Varianza, no
aproximamos los valores al entero ms prximo debido a que si lo hubisemos
hecho, no habra coincidencia en los resultados.

1 1. .4 4 R Re ep pr re es se en nt ta ac ci i n n d de e u un n c co on nj ju un nt to o d da ad do o d de e d da at to os s, , m me ed di ia an nt te e u un n
h hi is st to og gr ra am ma a, , p po ol l g go on no o d de e f fr re ec cu ue en nc ci ia a, , o oj ji iv va as s, , e et tc c. .
Las distribuciones de frecuencia pueden ser representadas grficamente
permitindonos tener un panorama general del comportamiento de los datos. Los
grficos ms comunes son Histograma de Frecuencia, Polgono de frecuencia y Ojivas
sin embargo, antes de graficar, es recomendable Incorporar los componentes
complementarios a la tabla de distribuciones de frecuencia que son necesarios para la
representacin grfica de los datos como a continuacin se sugiere:

Intervalo

k Li Ls f LRI LRS
MC
(X) f
k
X
k
MC
k-

(
MC
k-

)
2
f
k (
MC
k-

)
2
1 45 52 5 44.5 52.5 48.5 242.50 -32.50 1056.25 5,281.25
2 53 60 2 52.5 60.5 56.5 113.00 -24.50 600.25 1,200.50
3 61 68 3 60.5 68.5 64.5 193.50 -16.50 272.25 816.75
4 69 76 7 68.5 76.5 72.5 507.50 -8.50 72.25 505.75
5 77 84 6 76.5 84.5 80.5 483.00 -0.50 0.25 1.50
6 85 92 12 84.5 92.5 88.5 1,062.00 7.50 56.25 675.00
7 93 100 15 92.5 100.5 96.5 1,447.50 15.50 240.25 3,603.75
n = 50 E = 4,049.00
E =
12,084.50
PROBABILIDAD Fundamentos de Probabilidad
t=
37
a) Frecuencia Relativa (FR). Se expresa generalmente en porcentaje y se obtiene de
dividir la frecuencia de la clase entre la sumatoria de frecuencia (Ef =n). La suma
de la frecuencia relativa de todas las clases es igual a 1 o 100%.

n
f
FR
k
k
=
Para la clase nmero 1, la Frecuencia Relativa se obtiene de la siguiente forma:

10 . 0
50
5
1
1
= = =
n
f
FR
Tabla de Distribucin de Frecuencia
Intervalo
k Li Ls f LRI LRS MC FR
1 45 52 5 44.5 52.5 48.5 0.10
2 53 60 2 52.5 60.5 56.5 0.04
3 61 68 3 60.5 68.5 64.5 0.06
4 69 76 7 68.5 76.5 72.5 0.14
5 77 84 6 76.5 84.5 80.5 0.12
6 85 92 12 84.5 92.5 88.5 0.24
7 93 100 15 92.5 100.5 96.5 0.30
E = 50 E = 1.0
b) Distribucin de frecuencia acumulada "menor que" (FA < que). Est diseada
para mostrar el nmero o porcentaje de elementos que son menores que cierto
valor especfico o iguales a este. Esta columna, se construye a partir de la
pregunta, Cuntos valores hay menores que el Lmite Real Superior (LRS) de esta
clase?, por lo que se suman todas las frecuencias anteriores a esta clase + la
frecuencia de la clase actual.

La Frecuencia Acumulada menor que para la clase 1 se obtiene preguntando:
Cuntos valores hay menores que el LRS
1
?
Es decir: Cuntos valores hay menores que 52.5? La respuesta es 5.

Para la segunda clase la pregunta se formula: Cuntos valores hay menores que
60.5? La respuesta es 7 (5 de la primera clase + 2 de la segunda clase) y as
sucesivamente

PROBABILIDAD Fundamentos de Probabilidad
t=
38
Tabla de Distribucin de Frecuencia

Intervalo
k Li Ls f LRI LRS MC FR FA < que
1 45 52 5 44.5 52.5 48.5 0.10 5
2 53 60 2 52.5 60.5 56.5 0.04 7
3 61 68 3 60.5 68.5 64.5 0.06 10
4 69 76 7 68.5 76.5 72.5 0.14 17
5 77 84 6 76.5 84.5 80.5 0.12 23
6 85 92 12 84.5 92.5 88.5 0.24 35
7 93 100 15 92.5 100.5 96.5 0.30 50
E = 50
E =
1.0
c) Distribucin de frecuencia acumulada "mayor que" (FA > que). Est diseada
para mostrar el nmero o porcentaje de elementos que son mayores que cierto
valor especfico o iguales a este. Esta columna, se construye a partir de la
pregunta, Cuntos valores hay mayores que el Lmite Real Inferior (LRI) de esta
clase?, por lo que se suman todas las frecuencias posteriores a esta clase + la
frecuencia de la clase actual.

La Frecuencia Acumulada mayor que para la clase 1 se obtiene preguntando:
Cuntos valores hay mayores que el LRI
1
?
Es decir: Cuntos valores hay mayores que 44.5? La Respuesta, 50

Para la segunda clase la pregunta se formula: Cuntos valores hay mayores que
52.5? La respuesta es 45 (50 - 5 de la primera) y as sucesivamente.

Tabla de Distribucin de Frecuencia
Intervalo
k Li Ls f LRI LRS MC FR
FA <
que FA > que
1 45 52 5 44.5 52.5 48.5 0.10 5 50
2 53 60 2 52.5 60.5 56.5 0.04 7 45
3 61 68 3 60.5 68.5 64.5 0.06 10 43
4 69 76 7 68.5 76.5 72.5 0.14 17 40
5 77 84 6 76.5 84.5 80.5 0.12 23 33
6 85 92 12 84.5 92.5 88.5 0.24 35 27
7 93 100 15 92.5 100.5 96.5 0.30 50 15
E = 50 E = 1.0
PROBABILIDAD Fundamentos de Probabilidad
t=
39
d) Distribucin de frecuencia relativa acumulada menor que (FRA < que) y
Distribucin de frecuencia relativa acumulada mayor que (FRA > que), se
obtienen dividiendo la frecuencia acumulada (< que o > que) segn sea el caso,
entre "n".
n
que FA
que FRA
k
k
<
= <
n
que FA
que FRA
k
k
>
= >
Para la clase uno, la frecuencia real acumulada se obtienen como sigue:

10 . 0
50
5
1
1
= =
<
= <
n
que FA
que FRA 1
50
50
1
1
= =
>
= >
n
que FA
que FRA
Tabla de Distribucin de Frecuencia
Intervalo
k Li Ls f LRI LRS MC FR FA < que FA > que FRA < que FRA > que
1 45 52 5 44.5 52.5 48.5 0.10 5 50 0.10 1.00
2 53 60 2 52.5 60.5 56.5 0.04 7 45 0.14 0.90
3 61 68 3 60.5 68.5 64.5 0.06 10 43 0.20 0.86
4 69 76 7 68.5 76.5 72.5 0.14 17 40 0.34 0.80
5 77 84 6 76.5 84.5 80.5 0.12 23 33 0.46 0.66
6 85 92 12 84.5 92.5 88.5 0.24 35 27 0.70 0.54
7 93 100 15 92.5 100.5 96.5 0.30 50 15 1.00 0.30
Ef = 50
EFR =
1.0
Ya que tenemos los datos necesarios, procedamos a describir y a elaborar las
siguientes grficas: Histograma, Polgono y Ojivas.

1 1. .4 4. .1 1 H Hi is st to og gr ra am ma a o o h hi is st to og gr ra am ma a d de e F Fr re ec cu ue en nc ci ia a
Muestra de manera grfica cmo se comportan los datos agrupados en la distribucin
de frecuencia, se construye a partir de un conjunto de barras que descansan sobre el
eje de las x, representando a la variable que se est estudiando; el ancho de la barra o
columna est dado por los lmites reales de los intervalos de clase (LRI y LRS),
mientras que la altura es proporcional al valor de la frecuencia (f) de la clase en cada
intervalo, el punto medio de la barra coincide con la marca de clase (MC).

PROBABILIDAD Fundamentos de Probabilidad
t=
40
1 1. .4 4. .2 2 P Po ol l g go on no o d de e f fr re ec cu ue en nc ci ia a
Muestra de manera grfica cmo se comportan los datos agrupados en la distribucin
de frecuencia y al igual que en el histograma, se puede ver fcilmente en donde existe
la mayor concentracin de los datos, cuales datos son los menos probables, etc. El
Polgono de frecuencia se obtiene al unir a travs de lneas las marcas de clase o
puntos medios con punto de partida y fin en el origen.

0
2
4
6
8
10
12
14
16
44.5 52.5 60.5 68.5 76.5 84.5 92.5 100.5 LR
8.5 56.5 64.5 72.5 80.5 88.5 94.5 MC
Histograma y Polgono de Frecuencias f
1 1. .4 4. .3 3 O Oj ji iv va as s
Muestran la frecuencia acumuladas menor, menores o superiores a cualquier lmite
real superior o inferior de clase. Presentan informacin inicial del comportamiento de
la muestra en estudio, lo cual; permite ir formulando hiptesis acerca de una futura
decisin.

OJIVAS
0
10
20
30
40
50
60
LIMITES REALES DE CLASE
F
R
E
C
U
E
N
C
I
A
A
C
U
M
U
L
A
D
A
44.5 52.5 60.5 68.5 76.5 84.5 92.5
10%
14%
20%
34
%
46%
70%
100% 100%
90%
86%
80%
66%
54%
30%
OJIVA "> QUE"
OJIVA "< QUE"
PROBABILIDAD Fundamentos de Probabilidad
t=
41
F O R M U L A R I O
Media Aritmtica para Datos No
Agrupados
n
x
n
i
i
=
=
1

Media Aritmtica para Datos


Agrupados
n
x f
m
k
k k
=
=
1

Media Geomtrica
n
n
x x x x G = ...
3 2 1
Media Armnica

=
=
n
i i
x
n
H
1
1
Promedio Ponderado

=
=
=
n
i
i
n
i
i i
w
w x
POND P
1
1
. .
Mediana (Med) Datos Agrupados

c
f
f n
LRI Med
med
kmed
|
|
.
|

\
| E
+ =
1
) ( ) 2 (
Moda para Datos Agrupados
c LRI Mo
al k (

A + A
A
+ =
2 1
1
mod

Desviacin Media o Promedio de
Desviacin (DM).

n
x f
MD
n
i
i i
=

=
1

Desviacin Tpica o Estndar )


1
) (
1
2

=
n
x f
m
k
k k

o
Varianza
1
) (
1
2
2

=
n
x f
m
k
k k

o
Rango R = V
mximo
- V
mnimo

Nmero de clases o categoras
( ) ( ) n k log 3 . 3 1 + =
Amplitud o anchura del intervalo
k R a =
Lmite Real Inferior LRI
k
= Li
k
- 0.5
Lmite Real Superior LRS
k
= Ls
k
+ 0.5
Marca de Clase o Punto Medio(MC)
2
k k
k
Ls Li
MC
+
=
Frecuencia Relativa (FR)
n
f
FR
k
k
=
PROBABILIDAD Fundamentos de Probabilidad
t=
42
F
F
u
u
n
n
d
d
a
a
m
m
e
e
n
n
t
t
o
o
s
s
d
d
e
e
P
P
r
r
o
o
b
b
a
a
b
b
i
i
l
l
i
i
d
d
a
a
d
d
2.1 Conjuntos y tcnicas de conteo.
2.2 Concepto clsico y como frecuencia relativa.
2.3 Espacio muestral y eventos.
2.4 Axiomas y teoremas.
2.5 Espacio finito equiprobable.
2.6 Probabilidad condicional e independencia.
2.7 Teorema de Bayes.

2 FUNDAMENTOS DE PROBABILIDAD

2 2. .1 1 C Co on nj ju un nt to os s y y T T c cn ni ic ca as s d de e C Co on nt te eo o. .
2 2. .1 1. .1 1 T Te eo or r a a d de e C Co on nj ju un nt to os s
El objetivo de estudiar la teora de conjuntos antes de entrar de lleno a la teora de la
probabilidad es que una vez que se haya aprendido a construir los conjuntos, a partir
de ellos se establezcan relaciones con otros conjuntos haciendo uso de las
definiciones, operaciones y leyes de conjuntos para facilitar la comprensin y manejo
de las probabilidades.

2.1.1.1 Definicin

Un conjunto se define como una coleccin de objetos con caractersticas definidas en
forma clara y precisa.

PROBABILIDAD Fundamentos de Probabilidad
t=
43
2.1.1.2 Caractersticas

En cuanto a su notacin, los conjuntos se simbolizan a travs de letras maysculas y
se iguala con el grupo de elementos encerrados entre llaves; mientras que sus
elementos se representan a travs de letras minsculas separados por coma, y en
caso de que existan dos o mas elementos iguales en el conjunto, solo debe ponerse
en la lista una vez como se ejemplifica a continuacin:

A = {a, e, i, 1, 2} B = {1, 2, 3, 4, 5}

Los conjuntos estn dentro de un sper conjunto que contiene todos los elementos y al
cual se le llama Conjunto Universo, este se representa a travs de la letra U.

U = {a, e, i, 1, 2, 3, 4, 5}
Cuando un conjunto carece de elementos se puede indicar a travs de el smbolo | o
bien a travs de {} y se le conoce como Conjunto Vaco.
B = {} C = |
Ambos conjuntos estn vacos. No se debe cometer el error de poner B = {|} para
indicar que est vaco porque en realidad lo que se est indicando es que B contiene
un elemento que es un conjunto vaco.

De acuerdo al nmero de elementos, los conjuntos pueden ser de dos tipos:
contablemente finitos o contablemente infinitos. En los conjuntos contablemente
finitos se pueden conocer los elementos y determinar con precisin el nmero de
ellos que existen en el conjunto por ejemplo, el conjunto C consta de 15 elementos
mientras que el D solo de 8.

C = {-4,-3,-2,-1,0,1,2,3,4,5,6,7,8,9,10} D = {1,2,8}

Como puede observarse, en el conjunto D, se utilizan puntos suspensivos para dar
continuidad a la lista de elementos, solo se indican los valores iniciales y los finales, y
dado que es una lista numrica entera conocida, se deducen los elementos
intermedios, esto no lo podemos hacer con datos desconocidos o con valores de punto
flotante.

Por el contrario en los conjuntos contablemente infinitos no se pude conocer con
exactitud los elementos que lo forman ejemplo:

A = {1,2,3,} o bien B = {nmeros enteros positivos}

Para nuestros fines, en este libro trataremos solo con conjuntos contablemente finitos.

PROBABILIDAD Fundamentos de Probabilidad
t=
44
2.1.1.3 Representacin

Cuando se enumera la totalidad de los elementos en el conjunto, se dice que su
representacin es por extensin, (tambin se le conoce por tabulacin o
enumeracin) he aqu algunos ejemplos:

A = {a,e,i,o,u} W= {pedro, juan, maria} Y = {a,f,w,x}

En la representacin por comprensin (tambin conocida como descripcin o
construccin), se especifican claramente las caractersticas de los elementos que
componen el conjunto por ejemplo:

A = {las vocales del alfabeto} M = {los nmeros positivos del 1 al 10}

Tambin es posible representar a los conjuntos en forma grfica, a travs de
Diagramas de Ven, utilizando rectngulos para representar el universo y crculos para
representar los conjuntos.

En este ejemplo podemos ver que los elementos i, u pertenecen a los conjunto A y B;
para respetar la regla de no repetir elementos en los conjuntos, se hace un traslape de
ambos conjuntos y aqu se colocan los elementos en comn.

Cabe mencionar que cuando se desea indicar que un elemento pertenece a un
conjunto, se utiliza el smbolo e por ejemplo para indicar que el elemento a pertenece
al conjunto A, se indica a travs de la siguiente expresin: a e A.
Si por el contrario, se desea indicar que un elemento no pertenece a un conjunto se
utiliza el smbolo e como en el siguiente ejemplo: 7 e A.
2.1.1.4 Relaciones

Las relaciones de los conjuntos se pueden dar por igualdad o por inclusin.

a
i
u e
o
7
8
A
B
U
A = {a, e, i, o, u}

B = {i, u, 7, 8}

U = {a, e, i, o, u, 7, 8}
PROBABILIDAD Fundamentos de Probabilidad
t=
45
2.1.1.4.1 Igualdad
Se dice que dos conjuntos son iguales (=) cuando ambos tienen exactamente los
mismos elementos y desiguales (=) cuando existe al menos un elemento diferente en
alguno de los conjuntos.

Si A = { 1,2,3,4}, B = {1,2,4 } y C = {1,2,3,4} entonces A = B y A = C.
2.1.1.4.2 Inclusin
Cuando todos los elementos de un conjunto A estn incluidos (o pertenecen) a un
conjunto B, se dice que A es subconjunto de B y se representa a travs del smbolo
c. En el caso de que los conjuntos A y B sean iguales se les denomina subconjuntos
impropios y se representa a travs del smbolo _.
Si A = { 1,2,3,4}, B = {1,2,4 } y C = {1,2,3,4} entonces B c A y A _ C.
.
2.1.1.5 Operaciones

Las operaciones que se pueden realizar entre conjuntos son:

Unin ( ): Representa la totalidad de los elementos que pertenecen al
conjunto A o al conjunto B, si un elemento existe en ambos conjuntos, solo se
pone una vez.

A = { a,e,i,o,u}
B = {i,u,7,8 }
A B = { a,e,i,o,u,7,8 }

Interseccin ( ): Representa solo los elementos que pertenecen tanto al
conjunto A como al conjunto B.

A = { a,e,i,o,u}
B = {i,u,7,8 }
A B = { i,u }

a
i
u e
o
7
8
A
B
U
a
e
o
7
8
A
B
U
i
u
PROBABILIDAD Fundamentos de Probabilidad
t=
46
a
e
o
7
8
A
B
U
i
u
Diferencia (): Si se realiza la operacin A menos B, el resultado ser: los
elementos del conjunto A excepto los que sean iguales en el conjunto B.

A = { a,e,i,o,u}
B = {i,u,7,8 }
A B = { a,e,o }

Mientras que

B A = { 7, 8 }

Complemento ( ): Representa todos los elementos del universo menos los del
conjunto al cual se le aplique el complemento.

A = { a,e,i,o,u}
B = {i,u,7,8 }
U = { a,e,i,o,u,7,8 }

A = { 7,8 }

mientras que

B = { a,e,o }

a
e
o
7
8
A
B
U
i
u
a
e
o
7
8
A
B
U
i
u
a
e
o
7
8
A
B
U
i
u
PROBABILIDAD Fundamentos de Probabilidad
t=
47
Otras operaciones que se pueden realizar entre conjuntos son:

Producto ( X ): Es el conjunto de pares ordenados entre los elementos del
conjunto A y el conjunto B, es decir, a cada elemento de A, le corresponde un
elemento del conjunto B.

A = {1,2,3} B = {a,b} A X B = {(1,a),(1,b),(2,a),(2,b),(3,a),(3,b)}

El nmero de pares ordenados, debe ser igual del resultado de multiplicar el
nmero de elementos del conjunto A por el nmero de elementos del conjunto
B, para este ejemplo, A tiene 3 elementos y B tiene 2 por lo tanto, debemos
obtener 6 pares ordenados, esto se nos har ms fcil si recurrimos al diagrama
de rbol para obtener la totalidad de pares ordenados. Para construir el
diagrama de rbol, desde el origen, debemos sacar tantas ramas como
elementos tenga el primer conjunto, en este caso el primer conjunto es A y tiene
3 elementos, por lo tanto, se dibujan 3 ramas y al final de estas, se coloca cada
uno de los elementos (1,2,3), ahora, el punto de partida es cada uno de los
elementos del conjunto A y de cada uno de ellos, se sacan tantas ramas como
elementos tenga el conjunto B en este caso 2 y en el extremo se colocan los
elementos de B (a, b), si hubiese un tercer conjunto, se procedera a hacer lo
mismo hasta finalizar.

Para conocer cada uno de los pares ordenados, se recorre desde el origen
hasta el final cada una de las ramas existentes y se colocan entre parntesis y
separados por coma, cada uno de los elementos que se encontr al recorrerla
rama.

A B A X B
a (1,a)

1
b (1,b)

a (2,a)

2
b (2,b)

a (3,a)

3
b (3,b)

Si deseamos tener el producto de 3 conjuntos ejemplo A X B X C, entonces
debemos obtener la totalidad de las tercias ordenadas y as sucesivamente.

A = {1, 2, 3} B = {a, b} C = (x,y)
PROBABILIDAD Fundamentos de Probabilidad
t=
48
A B C A X B X C
a x (1, a, x)
1 y (1, a, y)
b x (1, b, x)
y (1, b, y)

a x (2, a, x)
y (2, a, y)

2
b x (2, b, x)
y (2, b, y)

a x (3, a, x)
3 y (3, a, y)
b x (3, b, x)
y (3, b, y)

Potencia (2
A
): Es la totalidad de subconjuntos que se pueden generar a partir
de un conjunto, si un conjunto tiene 3 elementos, el total de subconjuntos ser
dos al cubo y siempre se deben considerar como subconjuntos, el conjunto
vaco y el mismo conjunto.

A = {1, 2, 3} 2
A =
{ {1}, {2}, {3}, {1,2}, {1,3}, {2,3}, {1, 2, 3}, {} }

B = {a, b, c, d} El conjunto potencia de B tendr 2
4
= 16 subconjuntos

2
B
={{a},{b},{c},{d}, {a,b},{a,c},{a,d},{b,c},{b,d},{c,d}, {a,b,c},{a,c,d},{b,c,d}, {a,b,c,d},|}
2.1.1.6 Leyes de Conjuntos

Idempotencia: La unin o la interseccin del conjunto A con el conjunto A es
igual al mismo conjunto A. (A A = A) (A A = A).
Distributivas: Obtenemos el mismo resultado al realizar la operacin A
interseccin con el resultado de B Unin C que si elegimos hacer la operacin
A interseccin B, unin, A interseccin C. A (B C) = (A B) (A C).
Conmutativas: El orden de los factores no altera el producto, A unin B es
igual a B unin A. (A B) = (B A).
PROBABILIDAD Fundamentos de Probabilidad
t=
49
Asociativa: Si realizamos la misma operacin entre 3 o mas conjuntos, no
importa el orden en el que se realice. (A B) C = A (B C) .
Identidad: Cualquier conjunto que se una al conjunto vaco, nos dar por
resultado el mismo conjunto, mientras que si se une al universo, el resultado
ser el conjunto universo. A | = A y A U = U.
Complemento: La unin de un conjunto con su complemento nos da como
resultado el conjunto universo, mientras que, la interseccin de los mismos da
como resultado el conjunto vaco. A A = U y A A = |.
El complemento del conjunto universo es el conjunto vaco y viceversa. U= |
y |= U
Morgan: El complemento del resultado de la operacin A unin B, es igual al
resultado de A complemento, interseccin, B complemento. (A B) = (A B)
2 2. .1 1. .2 2 T T c cn ni ic ca as s C Co on nt te eo o
Las Tcnicas de conteo nos permiten conocer de cuantas maneras puede ocurrir un
suceso en el que se realizan varios eventos y en donde el orden de los eventos que
participan en dicho suceso puede o no ser importante partiendo desde el principio
fundamental de que si un primer evento se puede realizar n
1
maneras y un segundo
evento se puede realizar de n
2
maneras diferentes y un tercer evento de n
3
maneras
diferentes y un m
simo
evento se puede realizar de n
m
maneras diferentes, entonces
en conjunto de eventos se pueden realizar de
m
n n n n ...
3 2 1
maneras diferentes. A
este principio se le conoce como principio multiplicativo y debemos tener en cuenta
que en este caso, todos los eventos deben ocurrir simultneamente para poder
obtener el resultado.

Si podemos elegir entre diferentes opciones para lograr el objetivo, es decir no importa
cual camino elijamos, llegamos a donde mismo, entonces debemos hacer una suma
de resultados para conocer el total de maneras posibles que tenemos para lograr
nuestro objetivo, a esto se le conoce como principio aditivo y se puede resumir de la
siguiente manera: Si una actividad que nos lleva al objetivo X se puede realizar de
n
1
maneras diferentes y otra actividad que tambin nos lleva al objetivo X se puede
realizar de n
2
formas distintas, el nmero de formas en que se pueden realizar una u
otra actividades es n
1
+ n
2
.
2.1.2.1 Permutaciones

Cuando colocamos en orden natural los siguientes nmeros 3, 5, 4, 2, 1 (1,2,3,4,5),
cuando colocamos en orden alfabtico las letras B, C, A, D, J, W (A, B, C, D, J, W), o
PROBABILIDAD Fundamentos de Probabilidad
t=
50
cuando seguimos algn criterio para acomodar a un conjunto de personas (por edad, por
estatura, por nombre, etc.) decimos que estamos ORDENANDO los nmeros, las letras, a
las personas etc. y en estos casos, el orden si es importante y se le conoce como
Permutacin.
De acuerdo a lo anterior, la Permutacin es todo arreglo de un conjunto de elementos
en el cual interesa el orden en que estn colocados dichos elementos.

Por ejemplo: Si tenemos el conjunto de dgitos {1, 2, 3, 4, 5}, Cuntos y cules
nmeros diferentes de 2 cifras se pueden formar? Aqu, el orden si es importante
porque no obtenemos el mismo resultado si se coloca primero el uno y luego el dos
(12) a si se coloca primero el dos y despus el uno (21).

Cuando sabemos que el orden si es importante, sabemos que se trata de una
permutacin (seguramente en el enunciado del problema aparecer la palabra ordenar, colocar,
acomodar, o cualquier otra que sea sinnimo de orden), en seguida se tendr que determinar
de que tipo de permutacin se trata de acuerdo a las caractersticas que se presentan
en el enunciado:

2.1.2.1.1 Permutacin Ordinaria
Si de los n elementos con los que se cuenta, solo se desea tomar r a la vez como en
el enunciado del ejemplo anterior, se utiliza la siguiente frmula:

)! (
!
r n
n
r
n
P

=
|
|
.
|

\
|
Ejemplo: Si tenemos el conjunto de dgitos {1, 2, 3, 4, 5}, Cuntos y cules nmeros
diferentes de 2 cifras se pueden formar? esto es, si de los 5 (n) dgitos solo se desean
formar nmeros de 2 (r) dgitos, entonces hagamos la sustitucin de estos valores
para saber cuntos nmeros diferentes de dos dgitos se pueden formar.

20 4 5
! 3
! 3 4 5
)! 2 5 (
! 5
2
5
= =

=

=
|
|
.
|

\
|
P
El resultado es 20, ntese que en la primera posicin se pueden colocar cualquiera de
los 5 dgitos del conjunto y en la segunda posicin se pueden colocar cualquiera de los
cuatro dgitos restantes que no han sido utilizados.

Si el enunciado especifica que se trabaje con los n elementos a la vez, entonces n = r
y la frmula que se deber utilizar es:

! n
n
n
P =
|
|
.
|

\
|
PROBABILIDAD Fundamentos de Probabilidad
t=
51
Ejemplo: Si tenemos el conjunto de dgitos {1, 2, 3, 4, 5}, Cuntos y cules nmeros
diferentes se pueden formar? esto es, si tenemos 5 (n) dgitos y se desea trabajar con
todos los n dgitos o no se especifica como en este caso, hagamos la sustitucin de
estos valores para saber cuntos nmeros diferentes se pueden formar.

120 1 2 3 4 5 ! 5
5
5
= = =
|
|
.
|

\
|
P
El resultado es 120, ntese que en la primera posicin se pueden colocar cualquiera
de los 5 dgitos del conjunto y en la segunda posicin se pueden colocar cualquiera
de los cuatro dgitos restantes, en la tercera posicin se pueden colocar cualquiera de
los tres dgitos restantes que no han sido utilizados y as sucesivamente.

2.1.2.1.2 Permutacin con Sustitucin

En la permutacin ordinaria, el elemento que es utilizado en cualquiera de las
posiciones, ya no se vuelve a utilizar por eso en el primer ejemplo decimos que solo se
pueden formar 20 nmeros, resultantes de colocar cualquiera de los 5 dgitos del
conjunto en la primera posicin y cualquiera de los cuatro dgitos restantes que no han
sido utilizados en la segunda posicin (5 x 4 = 20). Sin embargo, de esta manera
estaremos dejando fuera los nmeros 11, 22, 33, 44 y 55 debido a que el dgito que se
utiliza una vez ya no puede volver a ser usado.

Si nos interesa que la totalidad de los elementos se puedan usar desde 1 hasta r
veces, es decir, si el elemento utilizado lo podemos seguir utilizando, entonces
decimos que se trata de una Permutacin con Sustitucin y la frmula que se usa es la
siguiente:
r
n
r
n
PS =
|
|
.
|

\
|
Ejemplo: Si tenemos el conjunto de dgitos {1, 2, 3, 4, 5}, Cuntos y cules nmeros
de dos dgitos se pueden formar si los dgitos utilizados se pueden volver a usar? Esto
es, si tenemos 5 (n) dgitos y se desea trabajar con todos para formar nmeros de 2
dgitos hagamos la sustitucin de estos valores para saber cuntos nmeros diferentes
se pueden formar.
25 5 5 5
2
5
2
= = =
|
|
.
|

\
|
PS
Si nos interesara formar nmeros de 5 dgitos entonces el resultado sera:

3125 5 5 5 5 5 5
5
5
5
= = =
|
|
.
|

\
|
PS
PROBABILIDAD Fundamentos de Probabilidad
t=
52
En la permutacin con sustitucin, ntese que en cualquiera de las posiciones se
pueden colocar cualquiera de los 5 dgitos que integran el conjunto de datos.

2.1.2.1.3 Permutacin Circular
Cuando se trabaja con la totalidad de los datos, tal vez nos interese acomodarlos en
forma circular, y en este caso como se necesita tener un punto de referencia, se
asume que uno de los elementos debe permanecer esttico para que acte como tal y
solo se acomodan los n-1 elementos restantes por lo tanto, se utiliza la siguiente
frmula:

)! 1 ( =
|
|
.
|

\
|
n
n
n
PC
Ejemplo: Se va a organizar una cena entre amigos, en total, el nmero de asistentes
es 7. De cuntas maneras se pueden sentar en una mesa redonda?

720 1 2 3 4 5 6 ! 6 )! 1 7 (
7
7
= = = =
|
|
.
|

\
|
= PC
Podemos sentar de 720 maneras diferentes a nuestros invitados.

2.1.2.1.4 Permutacin con Repeticin
Si en este momento nos preguntaran cuantas palabras se pueden formar con todas las
letras de la palabra amor, nosotros sabemos que se puede resolver a travs de una
permutacin ordinaria donde n = 4 = r y como respuesta diramos que se pueden
formar 24 palabras diferentes porque en la primera posicin podemos usar cualquiera
de las letras (a, m, o, r), en la segunda posicin cualquiera de las tres restantes y as
sucesivamente, pero si nos preguntan lo mismo de la palabra campana, o de la palabra
instituto, el criterio ya no es el mismo debido a que en ambas palabra existen
elementos que se repite, en el caso de la palabra campana, se repite 3 veces la letra a
y en el caso de la palabra instituto, se repite 3 veces la letra t y 2 veces la letra i.
Cuando existen elementos que se repiten como en las palabras anteriores, se
resuelve a travs de una Permutacin con Repeticin utilizando para ello la siguiente
frmula:
! ... ! !
!
,... ,
2 1 2 1 m m
n n n
n
n n n
n
PR

=
|
|
.
|

\
|
En donde n = nmero total de elementos
y
m
n n n ,... ,
2 1
= nmero de cada uno de los elementos que se repiten

Ejemplo 1:
Cuntas palabras se pueden formar con todas las letras de la palabra campana?
n = 7 (la palabra campana tiene 7 letras)
PROBABILIDAD Fundamentos de Probabilidad
t=
53
1
n = 3 (la letra a se repite 3 veces)
840 4 5 6 7
! 3
! 3 4 5 6 7
! 3
! 7
3
7
= =

= =
|
|
.
|

\
|
PR
Resultado: Se pueden formar 840 palabras con todas las letras de la palabra campana.
Ejemplo 2:
Cuntas palabras se pueden formar con todas las letras de la palabra instituto?
n = 9 (la palabra instituto tiene 9 letras)
1
n = 2 (la letra i se repite 2 veces)
2
n = 3 (la letra t se repite 3 veces)

30240
2
60480
1 2
4 5 6 7 8 9
! 3 1 2
! 3 4 5 6 7 8 9
! 3 ! 2
! 9
3 , 2
9
= =


=


=

=
|
|
.
|

\
|
PR
Resultado: Se pueden formar 30240 palabras con todas las letras de la palabra
instituto
2.1.2.2 Combinaciones

Habr ocasiones en las que el orden no es importante, por ejemplo si tenemos un
conjunto de 3 personas (Juan, Mara, Pedro), y nos interesa seleccionar a una pareja
para que expongan un tema en clase, la pareja puede estar formada por:

Juan y Maria Juan y Pedro Pedro y Mara

Si se elige primero a Mara, las parejas se pueden formar de la siguiente forma:

Mara y Juan Juan y Pedro Mara y Pedro

Si se elige primero a Pedro, las parejas se pueden formar de la siguiente forma:

Juan y Maria Pedro y Juan Pedro y Mara

Ntese que no importa el orden en el que se elige a las personas, solo se pueden
formar 3 posibles parejas en este caso, el equipo formado por Maria y Juan es
exactamente el mismo que el de Juan y Mara, el orden no altera el resultado, caso
contrario que en la permutacin cuando hablamos de combinaciones, seguramente en
el enunciado del problema a resolver seguramente se har referencia a el nmero de
equipos, conjuntos, comits, o cualquier palabra que nos de idea de agrupar y la
formula que usaremos es:
)! ( !
!
r n r
n
r
n
C

=
|
|
.
|

\
|
PROBABILIDAD Fundamentos de Probabilidad
t=
54
En donde:
n = total de elementos
r = tamao del grupo que se desea formar

Ejemplo: Tenemos a 5 jugadores de bsquetbol, para identificarlos, en sus camisetas
traen los siguientes nmeros: 1, 2, 3, 4, 5; se van a formar retas de 2 jugadores.
Cuntos y cules retas diferentes podemos formar con ellos?

10
2
20
1 2
4 5
! 3 ! 2
! 3 4 5
)! 2 5 ( ! 2
! 5
2
5
= =

=
|
|
.
|

\
|
C
Resultado: Se pueden formar 10 equipos (retas) diferentes.
Y son: (1,2), (1,3), (1,4), (1,5), (2,3), (2,4), (2,5), (3,4), (3,5), (4,5)

A travs de la frmula de combinaciones respondimos cuntas?, en seguida diremos
como obtuvimos cules?

2.1.2.3 Diagrama de rbol

El diagrama de rbol (utilizado con anterioridad en el tema Producto de Conjuntos), es
una herramienta importante que nos permite conocer no solo cuantos? sino cules?
Estos resultados los podemos obtener travs del siguiente diagrama de rbol, donde
cada rama del rbol representa un equipo (reta) diferente.

1. Pos.

1
2. Pos.

2
3
4
5
Reta

1,2
1,3
1,4
1,5

2
3
4
5
2,3
2,4
2,5

3
4
5
34
35

4 5 4,5

El primer jugador, puede hacer equipo con el jugador 2 o 3 o 4 o 5, por lo tanto, puede
hacer equipo con cualquiera de las 4 personas, es decir, de aqu resultan 4 equipos
diferentes; el segundo jugador puede hacer equipo solo con los jugadores 3 o 4 o 5;
resultando solo tres equipos. El tercer jugador puede hacer equipo solo con los
jugadores 4 o 5; resultando solo dos equipos y el cuarto jugador solo puede hacer
PROBABILIDAD Fundamentos de Probabilidad
t=
55
equipo con el quinto jugador; resultando solo un equipos haciendo un total de
(4+3+2+1) 10 equipos diferentes.
2.1.2.4 Particiones Ordenadas

Cuando el Orden no es importante y se desea repartir el todo en partes, siempre y
cuando la suma de las partes es igual al todo, estamos trabajando con particiones
ordenadas

Ejemplo: Encuentre el nmero de formas como se pueden distribuir 9 juguetes entre 4
nios, si el ms pequeo debe recibir 3 juguetes y cada uno de los otros, 2 juguetes.

En el enunciado anterior se especifica claramente que el todo (los 9 juguetes que se
tienen en total), se van a repartir en 4 partes (4 nios) una de esas partes es de
tamao 3 (al nio ms pequeo se le darn 3 juguetes) y los seis juguetes restantes
se deben repartir entre las 3 partes restantes por lo tanto, el tamao de cada una de
estas partes ser de tamao 2, vemoslo grficamente:

La frmula que se va a utilizar es:
! ... ! !
!
,... ,
2 1 2 1 m m
n n n
n
n n n
n
PO

=
|
|
.
|

\
|
En donde n = nmero total de elementos
y
m
n n n ,... ,
2 1
= tamao de cada una de las partes

Para este ejemplo:

n = 9 (total de juguetes)
1
n = 3 (nmero de juguetes que se le dan al nio ms pequeo nio 1-)
2
n = 2 (nmero de juguetes que se le dan al nio 2)
3
n = 2 (nmero de juguetes que se le dan al nio 3)
4
n = 2 (nmero de juguetes que se le dan al nio 4)

7560
8
60480
8
4 5 6 7 8 9
! 3 1 2 1 2 1 2
! 3 4 5 6 7 8 9
! 2 ! 2 ! 2 ! 3
! 9
2 , 2 , 2 , 3
9
= =

=


=

=
|
|
.
|

\
|
PO
3 2
2 2
3+2+2+2 = 9

La suma de las partes es igual al todo
PROBABILIDAD Fundamentos de Probabilidad
t=
56
Resultado: Existen 7560 maneras de repartir 9 juguetes entre 4 nios dndole al ms
pequeo 3 juguetes.
PROBABILIDAD Fundamentos de Probabilidad
t=
57
2.1.2.5 Diagrama para la Resolucin de Problemas de Tcnicas de Conteo
Permutacin con Repeticin
n!
n
1
! n
2
! n
3
! . . . n
m
!
n
n1,n2,nm
PR =
Combinacin
n!
r! (n-r)!
C(n,r)=
Importa el
orden?
Considerar
todos los
elementos?
Se repiten
algunos
elementos?
si
si
no
no
Sustitucin
de
elementos?
Ordenados en
crculo?
si
Permutacin
Circular
PC(n) =(n-1)!
no
Permutacin
Ordinaria
cuando n<>r
n!
( n- r)!
P(n,r)=
si
Se reparte el
todo en
partes?
no
si
Tcnicas de Conteo
no
no
si
Permutacin
con
Sustitucin
PS(n,r)=n
r
Permutacin
Ordinaria
cuando n = r
P(n,n)=n!
Particiones Ordenadas
n!
n
1
! n
2
! n
3
! . . . n
m
!
n
n1,n2,n PO =
PROBABILIDAD Fundamentos de Probabilidad
t=
58
2 2. .2 2 C Co on nc ce ep pt to o c cl l s si ic co o y y c co om mo o f fr re ec cu ue en nc ci ia a r re el la at ti iv va a
La Teora de la Probabilidad, se desarroll para entender los juegos de azar, y es la
rama de las matemticas que se ocupa de medir o determinar cuantitativamente la
posibilidad de que ocurra un determinado suceso.

Sea E el resultado de un experimento, llamado evento, hay dos formas de obtener la
probabilidad p de E:
a) Definicin clsica (A priori): suponiendo que un evento E puede ocurrir de s
formas de un total de n formas igualmente posibles. Entonces p = s/n.
b) Definicin de frecuencia (A posteriori): Suponiendo que despus de n
repeticiones, para valores muy grandes de n, un evento E ocurre s veces.
Entonces p = s/n.
Las dos definiciones anteriores tienen grandes fallas. La definicin clsica es
esencialmente circular, puesto que la idea de igualmente posibles es la misma de
aquella de con igual posibilidad que no ha sido definida. La definicin de frecuencia no
est claramente definida puesto que valores muy grandes no han sido definidos
(Lipschutz, 2001, p 62).

2 2. .3 3 E Es sp pa ac ci io o m mu ue es st tr ra al l y y e ev ve en nt to os s
El uso de conjuntos representados por diagramas de Venn, facilita la compresin de
espacio muestral y evento, ya que el espacio muestral S, se puede equiparar con el
conjunto universo, debido a que S contiene la totalidad de los resultados posibles de
un experimento, mientras que los eventos E contienen solo un conjunto de resultados
posibles del experimento, mientras que los puntos muestrales se equiparan con los
elementos.

Vamos a suponer que el experimento que se realiza es el lanzamiento de un dado y
queremos conocer cul es la probabilidad de que caiga un 3 o un 5? Si S contiene la
totalidad de los resultados posibles, entonces S = {1, 2, 3, 4, 5, 6} puesto que el dado
tiene 6 caras y si buscamos la probabilidad P de que caiga 3 o 5, esto constituye un
evento entonces, E = {3, 5}, la representacin grfica queda de la siguiente manera:

S
E
3 5
1 2
4
6
Puntos Muestrales
PROBABILIDAD Fundamentos de Probabilidad
t=
59
El espacio muestral S, est representado por un rectngulo, este contiene eventos E
representados a travs de crculos y puntos muestrales. Dado que en E existen dos
elementos y en S seis, la probabilidad P de que ocurra E es 2 de 6 y se obtiene al
dividir el nmero de elementos en E sobre el nmero de elementos en S.
) (
) (
S en elemenos de nmero
E en elementos de nmero
) (
S n
E n
E P = =
Tambin se puede leer:

) (
) (
S muestral espacio el ocurrir puede que en formas de nmero
E evento el ocurrir puede que en formas de nmero
) (
S n
E n
E P = =
Se obtiene como resultado:

3
1
6
2
) (
) (
) ( = = =
S n
E n
E P
2 2. .4 4 A Ax xi io om ma as s y y t te eo or re em ma as s
2 2. .4 4. .1 1 A Ax xi io om ma as s d de e P Pr ro ob ba ab bi il li id da ad d
De acuerdo al Diccionario de la Lengua Espaola un axioma es una proposicin tan
clara y evidente que se admite sin necesidad de demostracin, por tanto existen tres
axiomas de probabilidad que se describen a continuacin, partiendo del hecho de que
S representa el espacio muestral, A representa cualquier evento y P la utilizaremos
para llamar a la funcin de probabilidad, por consiguiente P(A) se denomina la
probabilidad del evento A.
Axioma 1 Para cualquier evento A, se tiene que la probabilidad del evento A se
encuentra entre 0 y 1.
0 s P(A) > 1
Axioma 2 Para el espacio muestral S, se tiene que la probabilidad es igual a 1.
P(S) = 1
Axioma 3 Para dos eventos mutuamente excluyentes A y B, se tiene que la
probabilidad de la unin de estos eventos es igual a la suma de la
probabilidad del evento A + la suma de la probabilidad del evento B.
P (A B) = P(A) + P(B)
Si se tiene una secuencia infinita de eventos mutuamente excluyentes A
1,
A
2,
A
3,,
A
n
se tiene que:

PROBABILIDAD Fundamentos de Probabilidad
t=
60
P(A
1
A
2
A
3

,,
A
n
) = P(A
1
)+ P(A
2
) + P(A
3
) ++ P(A
n
)
2 2. .4 4. .2 2 T Te eo or re em ma as s d de e P Pr ro ob ba ab bi il li id da ad d
De acuerdo al Diccionario de la Lengua Espaola, Teorema es una proposicin
demostrable lgicamente, partiendo de axiomas o de otros teoremas ya demostrados
mediante reglas de inferencia aceptadas

Teorema 1 La probabilidad del conjunto vaco |, tiene probabilidad cero, esto
tambin es conocido como evento imposible.

P (|) = 0
Teorema 2 A este teorema se le llama regla del complemento y se refiere a que la
probabilidad del complemento del evento A es igual a 1 menos la
probabilidad del evento A.
P (A) = 1- P (A)
Teorema 3 Si la probabilidad del evento A est entre 0 y 1 inclusive, y la probabilidad
de A se obtiene de restar 1 P(A), se deduce que la suma de la
probabilidad del evento A + la probabilidad del evento A es igual a:

1 = P(S) = P(A A) = P(A) + P(A')
Teorema 4 Si el evento A c B, entonces la probabilidad del evento A es menor que la
probabilidad del evento B
P (B) = P(A) + P(B -A)
Teorema 5 Para dos eventos A y B, la probabilidad del evento A menos el evento B
es igual a la probabilidad del evento A menos la probabilidad A
interseccin B.
P(A \ B) = P(A) P (A B)
Teorema 6 A este teorema se le conoce como regla de adicin y se refiere a que
para dos eventos A yGB, la probabilidad de la unin de los dos eventos es
igual a la suma de la probabilidad del evento A mas la probabilidad el
evento B menos la probabilidad A interseccin B.
P(A B) = P(A) + P(B) P(A B)
PROBABILIDAD Fundamentos de Probabilidad
t=
61
2 2. .5 5 E Es sp pa ac ci io o f fi in ni it to o e eq qu ui ip pr ro ob ba ab bl le e
Un espacio muestral es finito cuando es posible contar sus puntos muestrales es decir,
es un espacio contablemente finito y se convierte en espacio de probabilidad finito
cuando a cada punto a
i
se le asigna una probabilidad p
i
; si la probabilidad es la misma
para todos los puntos muestrales, entonces se dice que es un espacio finito
equiprobable y debe satisfacer las siguientes propiedades:

Cada p
i
debe ser mayor o igual a cero, es decir, p
i
> 0
La suma de todos las p
i
debe ser igual a 1, es decir, Ep
i =
1
Un dado tiene seis caras, por lo tanto, su espacio muestral est formado de la
siguiente manera:

S = {1, 2, 3, 4, 5, 6}

si es tratado como un espacio finito equiprobable, tenemos que la probabilidad que
caiga un 1, es la misma probabilidad de que caiga 2 o 3 o 4 o 5 o 6.

p(1) = 1/6, p(2) = 1/6, p(3) = 1/6, p(4) = 1/6, p(5) = 1/6, p(6) = 1/6
Algunas veces, la asignacin de las probabilidades a los puntos muestrales, se dan en
forma de tabla como se muestra a continuacin:

Resultado a
1
a
2
. . . a
n
Probabilidad p
1
p
2
. . . p
n
A esta tabla se le conoce como una distribucin de probabilidad.
Continuando con el ejemplo del dado, a continuacin se presenta su distribucin de
probabilidad.

Resultado 1 2 3 4 5 6
Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6
Obsrvese que se cumplen las dos propiedades de los espacios finitos de
probabilidad:

Cada p
i
debe ser mayor o igual a cero, es decir, p
i
> 0
En este caso p
i
= 1/6, por lo tanto se cumple que, p
i
> 0
La suma de todos las p
i
debe ser igual a 1, es decir, Ep
i =
1
PROBABILIDAD Fundamentos de Probabilidad
t=
62
1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 6/6 = 1, cumpliendo que; Ep
i =
1
2 2. .6 6 P Pr ro ob ba ab bi il li id da ad d c co on nd di ic ci io on na al l e e i in nd de ep pe en nd de en nc ci ia a
2 2. .6 6. .1 1 P Pr ro ob ba ab bi il li id da ad d C Co on nd di ic ci io on na al l
A partir de un espacio muestral se pueden generar diferentes eventos por ejemplo, en
el lanzamiento de un dado con S = {1, 2, 3, 4, 5, 6} queremos conocer la probabilidad
de que caiga un nmero par y la probabilidad de que caiga un nmero primo. Primero
se construyen los eventos: A = {2, 4, 6} y B = {1, 2, 3, 5}, para poder obtener el
resultado de P(A) y P(B); podemos utilizar la tabla de distribucin de probabilidades.

Resultado 1 2 3 4 5 6
Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6
P(A) = p(2) + p(4) +p(6) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2
P(B) = p(1) + p(2) +p(3) + p(5) = 1/6 + 1/6 + 1/6 + 1/6= 4/6 = 2/3

Tambin podemos auxiliarnos de los diagramas de Venn y hacer una representacin
grfica del S, A y B.
Obtenemos que:

2
1
6
3
) (
) (
) ( = = =
S n
A n
A P y
3
2
6
4
) (
) (
) ( = = =
S n
B n
B P
Ntese que en diagrama se ve claramente que hay puntos muestrales que contienen
tanto el evento A como el evento B, es decir, se da una interseccin entre A y B.
S
B
2 3
1 5
4
6
A
A B = { 2 }
S
B
2 3
1 5
4
6
A
PROBABILIDAD Fundamentos de Probabilidad
t=
63
Los elementos que se encuentran en la interseccin pueden representar dos cosas:

Los nmeros pares siempre y cuando sean primos

o bien,

Los nmeros primos siempre y cuando sean pares

Obsrvese que en ambos casos, se condiciona a que ocurra un evento A, cuando
haya ocurrido un evento E.
En el primer caso se condiciona a que ocurra:

A = {nmeros pares del 1 al 6} cuando haya ocurrido E = {nmeros primos del 1 al 6}

En el segundo caso se condiciona a que ocurra:

A = {nmeros primos del 1 al 6} cuando haya ocurrido E = {nmeros pares del 1 al 6}

A la probabilidad de que ocurra un evento A una vez que E ha ocurrido, se le conoce
como probabilidad condicional de A dado E, se escribe P(A|E), y se define as:

) (
) (
) (
E n
B A P
E A P

=
Si S es un espacio equiprobable:

) (
) (
) (
S n
E A n
E A P

= y
) (
) (
) (
S n
E n
E P =
entonces:

) (
) (
) ( ) (
) ( ) (
) (
) (
) (
) (
) (
) (
) (
E n
E A n
E n S n
E A n S n
S n
E n
S n
E A n
E n
E A P
E A P

=

=
PROBABILIDAD Fundamentos de Probabilidad
t=
64
por lo tanto:
) (
) (
) (
E n
E A n
E A P

=
Ejemplo: Se lanza un dado y se desea conocer cual es la probabilidad de que caiga
un nmero par siempre y cuando sea primo.
Si A = {2, 4, 6} , B = { 1, 2, 3, 5} y A B = { 2 }
Entonces:
4
1
) (
) (
) ( =

=
B n
B A n
B A P
Pero si se busca la probabilidad de que caiga un nmero primo siempre y cuando
sea par:
Entonces:
3
1
) (
) (
) ( =

=
A n
B A n
A B P
2 2. .7 7 T Te eo or re em ma a d de e B Ba ay ye es s
Recibe su nombre por el matemtico ingls Thomas Bayes y se desarroll a partir de
la suposicin de que los eventos A
1
, A
2
,, A
n
mutuamente excluyentes, forman una
particin del espacio muestral S y son causas posibles del evento E, quien tambin
est contenido en S. La frmula de Bayes nos permite determinar la probabilidad de
ocurrencia de un A particular, dada la ocurrencia de E(Lipschutz. 2001, p. 92) y se
define como:

) ( ) ( ... ) ( ) ( ) ( ) (
) ( ) (
) (
2 2 1 1
An E P An P A E P A P A E P A P
A E P A P
E A P
k k
k
+ + +

=
Ejemplo: En una fbrica que produce escritorios, se trabajan 3 turnos, A, B y C,
supongamos que en el turno A, se produce el 50% de todos los escritorios, y de ellos,
A B = { 2 }
S
B
2 3
1 5
4
6
A
PROBABILIDAD Fundamentos de Probabilidad
t=
65
el 3% salen con algn defecto. En el turno B, se producen el 30% de los escritorios y
el resto, se producen en el turno C, el turno B obtiene un 4% de escritorios
defectuosos mientras que el C el 5%. Se elige un escritorio al azar y se resulta
defectuoso, se desea conocer cual es la probabilidad de que haya sido fabricado en el
turno A.
De acuerdo a la informacin proporcionada:

P(A) = 50% y P(D|A) = 3%
P(B) = 30% y P(D|B) = 4%
P(C) = 20% y P(D|C) = 5%

Utilizando el teorema de Bayes:

) ( ) ( ) ( ) ( ) ( ) (
) ( ) (
) (
C D P C P B D P B P A D P A P
A D P A P
D A P
+ +

=
% 5 . 40 405 . 0
037 . 0
015 . 0
01 . 0 012 . 0 015 . 0
015 . 0
05 . 0 20 . 0 04 . 0 30 . 0 03 . 0 50 . 0
03 . 0 50 . 0
) ( = = =
+ +
=
+ +

= D A P
En el teorema, el divisor representa la probabilidad que se tiene de que un artculo
salga defectuoso considerando la produccin total por lo tanto:

P(D) = 0.037
=
3.7%

Conocer este dato, facilita el calculo de la probabilidad de que el artculo defectuoso
haya sido fabricado en el turno B.
% 4 . 32 324 . 0
037 . 0
012 . 0
037 . 0
04 . 0 3 . 0
) (
) ( ) (
) ( = = =

=
D P
B D P B P
D B P
Calcule usted la probabilidad de que el artculo defectuoso haya sido fabricado en el
turno C.
PROBABILIDAD Fundamentos de Probabilidad
t=
66
F O R M U L A R I O
Permutacin Ordinaria
)! (
!
r n
n
r
n
P

=
|
|
.
|

\
|
Permutacin con sustitucin

r
n
r
n
PS =
|
|
.
|

\
|
Permutacin Circular

)! 1 ( =
|
|
.
|

\
|
n
n
n
PC
Permutacin con Repeticin

! ... ! !
!
,... ,
2 1 2 1 m m
n n n
n
n n n
n
PR

=
|
|
.
|

\
|
Combinaciones

)! ( !
!
r n r
n
r
n
C

=
|
|
.
|

\
|
Particiones Ordenadas

! ... ! !
!
,... ,
2 1 2 1 m m
n n n
n
n n n
n
PO

=
|
|
.
|

\
|
Probabilidad de que ocurra el
evento E
) (
) (
S en elemenos de nmero
E en elementos de nmero
) (
S n
E n
E P = =
Independencia Si ) ( ) ( ) ( B A P B P A P = entonces A y B
son independientes
Si ) ( ) ( ) ( B A P B P A P = entonces A y B
son dependientes

Probabilidad Condicional
) (
) (
) (
E n
B A P
E A P

=
Teorema de Bayes
) ( ) ( ) ( ) ( ) ( ) (
) ( ) (
) (
C D P C P B D P B P A D P A P
A D P A P
D A P
+ +

=
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
67
M
M
o
o
d
d
e
e
l
l
o
o
s
s
A
A
n
n
a
a
l
l

t
t
i
i
c
c
o
o
s
s
d
d
e
e
F
F
e
e
n
n

m
m
e
e
n
n
o
o
s
s
A
A
l
l
e
e
a
a
t
t
o
o
r
r
i
i
o
o
s
s
D
D
i
i
s
s
c
c
r
r
e
e
t
t
o
o
s
s
3.1 Definicin de variable aleatoria discreta.
3.2 Funcin de probabilidad y de distribucin, valor esperado,
varianza y desviacin estndar.
3.3 Distribucin Binomial.
3.4 Distribucin Hipergeomtrica.
3.4.1Aproximacin de la hipergeomtrica por la Binomial.
3.5 Distribucin Geomtrica.
3.6 Distribucin Multinonial.
3.7 Distribucin de Poisson.
3.7.1 Aproximacin de la Binomial por la de Poisson.

3 MODELOS ANALTICOS DE FENMENOS ALEATORIOS
DISCRETOS

3 3. .1 1 D De ef fi in ni ic ci i n n d de e v va ar ri ia ab bl le e a al le ea at to or ri ia a d di is sc cr re et ta a. .
Variable aleatoria: Es la correspondencia que se establece entre el conjunto de los
resultados de experimento aleatorio y el conjunto de los nmeros reales.

PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
68
Variable Aleatoria Discreta (V.A.D.): Es la correspondencia que se establece entre el
conjunto de los resultados de un experimento aleatorio y el conjunto de los nmeros
reales cuando el conjunto de resultados del experimento es contable.

3 3. .2 2 F Fu un nc ci i n n d de e p pr ro ob ba ab bi il li id da ad d y y d de e d di is st tr ri ib bu uc ci i n n, , v va al lo or r e es sp pe er ra ad do o, ,
v va ar ri ia an nz za a y y d de es sv vi ia ac ci i n n e es st t n nd da ar r
3 3. .2 2. .1 1 F Fu un nc ci i n n d de e P Pr ro ob ba ab bi il li id da ad d
Permite asignar a cada valor de la variable su probabilidad y se expresa de la
siguiente manera:

( ) 1 =
e X x
x p
3 3. .2 2. .2 2 F Fu un nc ci i n n d de e D Di is st tr ri ib bu uc ci i n n
La Funcin de Distribucin, es la probabilidad de que una variable aleatoria tome
valores menores o iguales que un cierto valor real t; tambin se le conoce como
probabilidad acumulada. La Funcin de distribucin se representa como:

( ) 1 =
e X x
x p
3 3. .2 2. .3 3 M Me ed di id da as s d de e T Te en nd de en nc ci ia a C Ce en nt tr ra al l
Muestran el comportamiento medio o promedio de los valores que puede tomar la
variable aleatoria, las ms comunes son: Valor esperado o media, mediana y moda.

3.2.3.1 Valor esperado o media
El valor esperado, es la sumatoria de los valores de la variable aleatoria x
multiplicados por su probabilidad p.
( )
e X x
x p x
3.2.3.2 Moda
La Moda de una Variable Aleatoria Discreta (V. A. D.), es el valor ms probable, o ms
frecuente, de una variable aleatoria: es decir, se define como el valor de la variable
aleatoria tal que ( ) ( ) x p Mo p > para toda xeX.
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
69
3.2.3.3 Mediana
La Mediana de una V. A. D, es el nmero real para el que se cumple que la
probabilidad acumulada de una variable aleatoria es menor o igual que 0.5 y su
expresin matemtica es:
( )
2
1
=
e
s

X x
Med x p
3 3. .2 2. .4 4 M Me ed di id da as s d de e V Va ar ri ia ac ci i n n
Permiten estudiar la dispersin que tienen los diferentes valores de la variable
aleatoria, las ms comunes son la Varianza y la Desviacin Tpica o Estndar.

3.2.4.1 Varianza
La varianza es una medida de dispersin alrededor de su valor medio, si su valor es
pequeo, indica una concentracin o poca dispersin de los datos, alrededor de su
valor medio y, por el contrario, su valor es alto, indica una dispersin considerable de
los datos respecto al valor central.

( ) ( )
2 2 2
) (
e
= =
X x
x p x X E X V
3.2.4.2 Desviacin Tpica o Estndar
Es la raz cuadrada de la varianza y se expresa de la siguiente manera:

( ) ( ) X V X + = o
3 3. .3 3 D Di is st tr ri ib bu uc ci i n n B Be er rn no ou ul ll li i
Describe el comportamiento de una variable aleatoria x: nmero de xitos en una
extraccin o prueba, cuando solo hay dos posibles resultados xito o fracaso;
Las extracciones son independientes y la probabilidad de xito permanece constante
e igual a p.

El espacio muestral de una prueba de Bernoulli es: S = {xito, fracaso}; al xito se
le asigna el valor de 1 y al fracaso el valor 0, por lo que el espacio muestral tambin
puede representarse como : S = {1,0}.
La Media () de Distribucin Bernoulli es igual a la probabilidad de xito.
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
70
( ) ( ) ( ) ( ) p p p
i
x f
i
x X E = + = = = 1 1 0
La Varianza (var o o
2
) de la Distribucin Bernoulli se obtiene de multiplicar la
probabilid de xito por la probabilidad de fracaso.

( ) ( ) ( ) [ ] ( )
( ) q p p p p p
p p p X E
i
x f
i
x X V
= =
=
(

+ = = =
1
2
2 2
1 1
2
0
2 2 2
o
La Desviacin Estndar de la Distribucin Bernoulli se calcula de la raz cuadrada
de la varianza.

q p = o
3 3. .4 4 D Di is st tr ri ib bu uc ci i n n B Bi in no om mi ia al l. .
Describe el comportamiento de una variable aleatoria x: nmero de xitos en n
extracciones o pruebas cuando solo hay dos posibles resultados xito o fracaso;
Las extracciones son independientes y la probabilidad de xito permanece constante
e igual a p.

Funcin de Probabilidad Binomial:

( )
( )

= +
=

=
valores otros para
q p
n x para
x n
q
x
p
n
x
x p
0
1
, , 2 , 1 , 0 A
La Media () de la Distribucin Binomial se obtiene de multiplicar el nmero de
extracciones o pruebas n por la probabilidad de xito p.

( ) np X E = =
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
71
La Varianza (var o o
2
) de la Distribucin Binomial se calcula multiplicando en
nmero de extracciones o pruebas n por la probabilidad de xito p por la probabilidad
de fracaso q.
( ) npq X V = =
2
o
Ejercicios de Distribucin Binomial
Ejercicio 1
La probabilidad de que cierta clase de componente resista a una prueba de choque
dada es de 3/4. Encuentre la probabilidad de que resistan exactamente dos de los
cuatro componentes que se prueban:

Solucin: Suponga que las pruebas son independientes, n = 4, x = 2 y como p =
para cada una de las cuatro pruebas, obtenemos:

Formula a utilizar:
( )
( )

= +
=

=
valores otros para
q p
n x para
x n
q
x
p
n
x
x p
0
1
, , 2 , 1 , 0 A
Sustitucin de valores:
( ) 2 = x p =
128
27
4
1
4
3
! 2 ! 2
! 4
4
1
4
3
2
4
2 2 2 4 2
=
|
.
|

\
|
|
.
|

\
|
=
|
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|

Ejercicio 2
Cul es la probabilidad de obtener exactamente dos sello en 6 lanzamientos de una
moneda balanceada?

Solucin: Suponga que los lanzamientos son independientes, n = 6, x = 2 y como p =
1/2 para cada una de los seis lanzamientos, obtenemos:

Frmula a utilizar:
( )
( )

= +
=

=
valores otros para
q p
n x para
x n
q
x
p
n
x
x p
0
1
, , 2 , 1 , 0 A
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
72
Sustitucin de valores:
( ) 2 = x p =
64
15
2
1
2
1
! 4 ! 2
! 6
2
1
2
1
2
6
4 2 2 6 2
= |
.
|

\
|
|
.
|

\
|
= |
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|

Ejercicio 3
Encuentre la probabilidad de que en una familia de cuatro hijos haya al menos un nio.
Suponga que la probabilidad de nacimiento de un varn es de .

Solucin: Suponga que los nacimientos son independientes; n = 4, x =1, 2, 3, 4 y
como p = 1/2 para cada valor de x, obtenemos:

Frmula a utilizar:

( )
( )

= +
=

=
valores otros para 0
1
, , 2 , 1 , 0
q p
n x para
x n
q
x
p
n
x
x p
A
Sustitucin de valores:
( ) 1 = x p =
4
1
2
1
2
1
! 3 ! 1
! 4
2
1
2
1
1
4
3 1 1 4 1
= |
.
|

\
|
|
.
|

\
|
= |
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|

( ) 2 = x p =
8
3
2
1
2
1
! 2 ! 2
! 4
2
1
2
1
2
4
2 2 2 4 2
=
|
.
|

\
|
|
.
|

\
|
=
|
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|

( ) 3 = x p =
4
1
2
1
2
1
! 1 ! 3
! 4
2
1
2
1
3
4
1 3 3 4 3
= |
.
|

\
|
|
.
|

\
|
= |
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|

( ) 4 = x p =
16
1
2
1
2
1
! 0 ! 4
! 4
2
1
2
1
4
4
0 4 4 4 4
= |
.
|

\
|
|
.
|

\
|
= |
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|

Entonces:
p(al menos 1 nio) = p(x=1) + p(x=2)+p(x=3)+p(x=4 ) =
16
15
16
1
4
1
8
3
4
1
= + + +
Otro forma de hacerlo es obtener el resultado para cuando no haya ningn nio,
es decir x = 0
( ) 0 = x p =
16
1
2
1
2
1
! 4 ! 0
! 4
2
1
2
1
0
4
4 0 0 4 0
=
|
.
|

\
|
|
.
|

\
|
=
|
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|

PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
73
Entonces:
p(al menos 1 nio) = 1 - p(x=0) =
16
15
16
1
16
16
16
1
1 = =
3 3. .5 5 D Di is st tr ri ib bu uc ci i n n H Hi ip pe er rg ge eo om m t tr ri ic ca a
Describe el comportamiento de una variable aleatoria x: nmero de xitos en n
extracciones o pruebas consecutivas y sin reemplazo, de una caja o urna que
contiene en total N objetos de los cuales D son objetos blancos ; cuando solo hay
dos posibles resultados: objeto blanco =xito u objeto que no sea blanco = fracaso.

Funcin de Probabilidad Hipergeomtrica:

( )
( )( )
( )

=
valores otros para 0
, , 2 , 1 N n para
N
n
D N
x n
D
x
x p
A
Media de la Distribucin Hipergeomtrica:

( )
N
nD
X E = =
Varianza de la Distribucin Hipergeomtrica:

( )
|
.
|

\
|

= =
1
2
N
n N
npq X V o
Desviacin Estndar de la Distribucin Hipergeomtrica:

|
.
|

\
|

=
1 N
n N
npq o
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
74
Ejercicios de Distribucin Hipergeomtrica

Ejercicio 1:
Una caja contiene 6 canicas azules y 4 canicas rojas. Se lleva a cabo un experimento
en el cual se escoge al azar una canica y se observa su color. Pero la canica no se
devuelve a la caja. Encuentre la probabilidad de que despus de 5 pruebas del
experimento, se hayan escogido 3 canicas azules.

Solucin: En total tenemos 10 canicas dentro de la caja por lo tanto: N = 10, si nos
interesan las canicas azules entonces D = 6; al realizar 5 pruebas del
experimento, n = 5 y x= 3 representa el nmero de canicas azules que se
desea obtener.

Formula a utilizar:
( )
( )( )
( )

=
valores otros para
N n para
N
n
D N
x n
D
x
x p
0
, , 2 , 1 A
Sustitucin de valores:
( )
( )( )
( )
( )( )
( )
21
10
)! 5 10 ( ! 5
! 10
)! 2 4 ( ! 2
! 4
)! 3 6 ( ! 3
! 6
10
5
4
2
6
3
10
5
6 10
3 5
6
3
3 =
|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

= =

= = x p
Ejercicio 2:
Un comit de 4 personas, se selecciona aleatoriamente de una clase con 12
estudiantes de los cuales 7 son hombres. Encuentre la probabilidad de que el comit
contenga exactamente 2 hombres.

Solucin: El total de estudiantes es 12 por lo tanto: N = 12, si nos interesan que el
comit contenga hombres entonces D = 7; n = 4 representa el nmero de
personas en el comit y x = 2 el nmero de hombres que se desea
integrar al comit.

Formula a utilizar:
( )
( )( )
( )

=
valores otros para
N n para
N
n
D N
x n
D
x
x p
0
, , 2 , 1 A
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
75
Sustitucin de valores:
( ) 424 . 0
495
210
)! 4 12 ( ! 4
! 12
)! 2 5 ( ! 2
! 5
)! 2 7 ( ! 2
! 7
4
12
2
5
2
7
4
12
2 4
7 12
2
7
2 = =
|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

==
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
=
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= = x p
Ejercicio 3
Un comit de 4 personas, se selecciona en forma aleatoria de una clase con 12
estudiantes de los cuales 7 son hombres. Encuentre la probabilidad de que el comit
contenga al menos 2 hombres

Solucin: El total de estudiantes es 12 por lo tanto: N = 12, si nos interesan que el
comit contenga hombres entonces D = 7; n = 4 representa el nmero de
personas en el comit y x= 2, 3, 4, el nmero de hombres que pueden
integrar el comit.

Formula a utilizar:
( )
( )( )
( )

=
valores otros para
N n para
N
n
D N
x n
D
x
x p
0
, , 2 , 1 A
Sustitucin de valores:
( ) 424 . 0
495
210
)! 4 12 ( ! 4
! 12
)! 2 5 ( ! 2
! 5
)! 2 7 ( ! 2
! 7
4
12
2
5
2
7
4
12
2 4
7 12
2
7
2 = =
|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

=
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
=
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= = x p
( ) 354 . 0
495
175
)! 4 12 ( ! 4
! 12
)! 1 5 ( ! 1
! 5
)! 3 7 ( ! 3
! 7
4
12
1
5
3
7
4
12
3 4
7 12
3
7
3 = =
|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

=
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
=
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= = x p
( ) 070 . 0
495
35
)! 4 12 ( ! 4
! 12
)! 0 5 ( ! 0
! 5
)! 4 7 ( ! 4
! 7
4
12
0
5
4
7
4
12
4 4
7 12
4
7
4 = =
|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

=
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
=
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= = x p
Entonces:

p(al menos 2 hombres) = p(x=2)+p(x=3)+p(x=4 ) = 848 . 0
495
420
495
35
495
175
495
210
= = + +
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
76
Otro forma de resolverlo es, obtener los resultados para cuando haya uno o
ningn hombre, es decir x = 0, 1 y la suma de estos, restarlos a la unidad.

p(al menos 2 hombres)= 1 -
848 . 0 152 . 0 1
495
75
1
4
12
1 4
7 12
1
7
4
12
0 4
7 12
0
7
= = =
|
|
|
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
+
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
3 3. .5 5. .1 1 A Ap pr ro ox xi im ma ac ci i n n d de e l la a h hi ip pe er rg ge eo om m t tr ri ic ca a p po or r l la a B Bi in no om mi ia al l
Cuando n es mucho menor que D < N, se puede usar la distribucin binomial
considerando p = D/N.
Funcin de aproximacin de la hipergeomtrica a la Binomial:

( ) ( )
x n
q
x
p
n
x
x p
N

=
o
lm
3 3. .6 6 D Di is st tr ri ib bu uc ci i n n G Ge eo om m t tr ri ic ca a. .
Determina la probabilidad de que en x extracciones consecutivas aparezcan las
primeras (x-1)-simas extracciones como fracaso y la x-sima extraccin como
xito; cuando las extracciones son con reemplazo y la probabilidad de xito es
constante e igual a p.
Funcin de Probabilidad Geomtrica:

( ) p
x
q p q q q q x p
1
= = A
Media de la Distribucin Geomtrica:

( )
p
X E
1
= =
Varianza de la Distribucin Geomtrica:

PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
77
( )
2
2
p
q
X V = = o
Desviacin Estndar de la Distribucin Geomtrica:

2
p
q
= o
Ejercicios de Distribucin Geomtrica:

Ejercicio 1
Supongamos de que la probabilidad de que un cohete alcance un objetivo es p=0.2 y
el cohete se dispara repetidamente hasta alcanzar el objetivo. Encuentre la
probabilidad de que 4 o ms cohetes sern requeridos para alcanzar finalmente el
objetivo.

Solucin: x=4, representa el nmero mnimo de cohetes. Si p =0.2, entonces q = 1-p
=0.8
Formula a utilizar:
( )
1
= =
x
q q q q q x p A
Sustitucin de valores:
( ) 512 . 0
3
8 . 0
1 4
8 . 0 4 = =

= >= x p
Ejercicio 2

Se sabe que en un cierto proceso de fabricacin, en promedio, uno de cada 100
artculos est defectuoso. Cul es la probabilidad de que el quinto artculo que se
inspecciona, sea el primer defectuoso que se encuentra?

Solucin: x=5, representa la posicin del primer artculo defectuoso y si en promedio
1 de cada 100 artculos est defectuoso, entonces p =0.01, y por lo tanto q
= 1-p =0.99
Formula a utilizar:
( ) p
x
q p q q q q x p
1
= = A
Sustitucin de valores:
( ) 0096 . 0 01 . 0 96 . 0 01 . 0
4
99 . 0 01 . 0
1 5
99 . 0 5 = = |
.
|

\
|
= |
.
|

\
|
= = x p
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
78
Ejercicio 3
En tiempo ocupado un conmutador telefnico est muy cerca de su capacidad, por lo
que los usuarios tienen dificultades al hacer sus llamadas. Puede ser de inters
conocer el nmero de intentos necesarios a fin de conseguir un enlace telefnico.
Suponga que p = 0.05 es la probabilidad de conseguir un enlace durante el tiempo
ocupado. Nos interesa conocer la probabilidad de que se necesiten seis intentos
para una llamada exitosa.
Solucin: X=6, representa el nmero de intentos para obtener una llamada exitosa.
Si p =0.05, q = 1-p =0.95
Formula a utilizar:

( ) p
x
q p q q q q x p
1
= = A
Sustitucin de valores:

( ) 00385 . 0 ) 05 . 0 )( 77 . 0 ( 05 . 0
5
95 . 0 05 . 0
1 6
95 . 0 6 = = |
.
|

\
|
= |
.
|

\
|
= = x p
3 3. .7 7 D Di is st tr ri ib bu uc ci i n n M Mu ul lt ti in no om mi ia al l. .
Determina la probabilidad de que se obtengan x
1
objetos blancos , x
2
objetos
negros, x
k
objetos azules cuando se tienen n extracciones consecutivas con
reemplazo de una caja que contiene n
1
objetos blancos , n
2
objetos negros,
n
k
objetos azules y donde p
1
= n
1
/N, p
2
= n
2
/N,p
k
= n
k
/N; n
1
+n
2
++n
k
= N .
Funcin de Probabilidad Multinomial:

( )
k
n
k
p
n
p
n
p
k
n n n
n
k
n n n f A
A
A
2
2
1
1
! !
2
!
1
!
, ,
2
,
1
=
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
79
3 3. .8 8 D Di is st tr ri ib bu uc ci i n n d de e P Po oi is ss so on n
Se puede utilizar como una aproximacin para calcular la probabilidad de una variable
aleatoria binomial x; donde = np para n grandes y p pequeas

Funcin de Probabilidad Poisson:

( )

=
valores otros para
x para
x
e
x
x p
0
, , 2 , 1
!
A

Media de la Distribucin Poisson:



( ) = = X E
Varianza de Distribucin Poisson:

( ) o = = X V
2
Desviacin Estndar de Distribucin Poisson:

o =
Ejercicios de Distribucin Poisson:

Ejercicio 1
Durante un experimento de laboratorio el nmero promedio de partculas
radioactivas que pasan a travs de un contador en un milisegundo es cuatro. Cul
es la posibilidad de que seis partculas entren al contador en un milisegundo dado?

Solucin: =4, representa el nmero de partculas que entran en un milisegundo y
x=6, es el nmero de partculas de las cuales se busca la probabilidad que
entren.
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
80
Formula a utilizar:

( )

=
0
, , 2 , 1
!
A x para
x
e
x
x p

Sustitucin de valores:
( ) 1042 . 0
720
0210587 . 75
720
) 018315 . 0 )( 4096 (
! 6
4 6
4
6 = = =

= =
e
x p
Ejercicio 2

Supngase que el 2% de los artculos producidos por una fbrica estn defectuosos.
Encuentre la probabilidad P de que haya 3 artculos defectuosos en una muestra de
100 artculos.

Solucin: =2, se obtiene de multiplicar (n)(p) en donde n = 100 y p = 0.2; x=3, es el
nmero de artculos de las cuales se busca la probabilidad de que sean
defectuosos.

Formula a utilizar:
( )

=
0
, , 2 , 1
!
n x para
x
e
x
x p
A

Sustitucin de valores:
( ) 180 . 0
6
08268372 . 1
6
) 13535 . 0 )( 8 (
! 3
2 3
2
3 = = =

= =
e
x p
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
81
F O R M U L A R I O
Funcin de Probabilidad
( ) 1 =
e X x
x p
Funcin de Distribucin
( ) 1 =
e X x
x p
Valor esperado o media
( )
e X x
x p x
Moda
( ) ( ) x p Mo p > para toda xeX
Mediana
( )
2
1
=
e
s

X x
Med x p
Varianza
( ) ( )
2 2 2
) (
e
= =
X x
x p x X E X V
Desviacin Tpica o
Estndar
( ) ( ) X V X + = o
Media () de Distribucin
Bernoulli
( ) ( ) ( ) ( ) p p p
i
x f
i
x X E = + = = = 1 1 0
Varianza (var o o
2
) de la
Distribucin Bernoulli
( ) ( ) ( ) [ ] ( )
( ) q p p p p p
p p p X E
i
x f
i
x X V
= =
=
(

+ = = =
1
2
2 2
1 1
2
0
2 2 2
o
Desviacin Estndar de
la Distribucin Bernoulli
q p = o
Funcin de Probabilidad
Binomial
( )
( )

= +
=

=
valores otros para
q p
n x para
x n
q
x
p
n
x
x p
0
1
, , 2 , 1 , 0 A
Media () de la
Distribucin Binomial
( ) np X E = =
La Varianza (var o o
2
) de
la Distribucin Binomial
( ) npq X V = =
2
o
Funcin de Probabilidad
Hipergeomtrica
( )
( )( )
( )

=
valores otros para 0
, , 2 , 1 N n para
N
n
D N
x n
D
x
x p
A
Media de la Distribucin
Hipergeomtrica
( )
N
nD
X E = =
Varianza de la
Distribucin
Hipergeomtrica
( )
|
.
|

\
|

= =
1
2
N
n N
npq X V o
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Discretos
t=
82
Desviacin Estndar de
la Distribucin
Hipergeomtrica
|
.
|

\
|

=
1 N
n N
npq o
Funcin de aproximacin
de la hipergeomtrica a
la Binomial
( ) ( )
x n
q
x
p
n
x
x p
N

=
o
lm
Funcin de Probabilidad
Geomtrica
( ) p
x
q p q q q q x p
1
= = A
Media de la Distribucin
Geomtrica
( )
p
X E
1
= =
Varianza de la
Distribucin Geomtrica
( )
2
2
p
q
X V = = o
Desviacin Estndar de
la Distribucin
Geomtrica
2
p
q
= o
Funcin de Probabilidad
Multinomial
( )
k
n
k
p
n
p
n
p
k
n n n
n
k
n n n f A
A
A
2
2
1
1
! !
2
!
1
!
, ,
2
,
1
=
Funcin de Probabilidad
Poisson
( )

=
valores otros para
x para
x
e
x
x p
0
, , 2 , 1
!
A

Media de la Distribucin
Poisson
( ) = = X E
Varianza de Distribucin
Poisson
( ) o = = X V
2
Desviacin Estndar de
Distribucin Poisson
o =
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
83
M
M
o
o
d
d
e
e
l
l
o
o
s
s
A
A
n
n
a
a
l
l

t
t
i
i
c
c
o
o
s
s
d
d
e
e
F
F
e
e
n
n

m
m
e
e
n
n
o
o
s
s
A
A
l
l
e
e
a
a
t
t
o
o
r
r
i
i
o
o
s
s
C
C
o
o
n
n
t
t
i
i
n
n
u
u
o
o
s
s
4.1 Definicin de variable aleatoria contnua.
4.2 Funcin de densidad y acumulativa.
4.3 Valor esperado, varianza y desviacin estndar.
4.4 Distribucin Uniforme y Exponencial.
4.5 Distribucin Normal.
4.5.1 Aproximacin de la Binomial a la Normal.
4.6 Teorema de Chebyshev.

4 MODELOS ANALTICOS DE FENMENOS ALEATORIOS
CONTINUOS

4 4. .1 1 D De ef fi in ni ic ci i n n d de e v va ar ri ia ab bl le e a al le ea at to or ri ia a c co on nt t n nu ua a. .
Variable aleatoria: Es la correspondencia que se establece entre el conjunto de los
resultados de experimento aleatorio y el conjunto de los nmeros reales.

PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
84
Variable aleatoria contnua (V.A.C): Es la correspondencia que se establece entre el
conjunto de los resultados de un experimento aleatorio y el conjunto de los nmeros
reales; puede tomar cualquier valor dentro de un determinado intervalo.
4 4. .2 2 F Fu un nc ci i n n d de e d de en ns si id da ad d y y a ac cu um mu ul la at ti iv va a. .
La Funcin de densidad de probabilidad, permite asignar a los valores de una
variable aleatoria comprendidos en un intervalo su correspondiente probabilidad.

La Funcin de distribucin, es la probabilidad de que una variable aleatoria continua,
tome valores menores o iguales que un cierto valor real t; tambin se le conoce
como probabilidad acumulada.

Funcin de Distribucin Acumulada:

( ) ( ) ( )
}

= s =
t
dx x f t X P t F
4 4. .3 3 V Va al lo or r e es sp pe er ra ad do o, , v va ar ri ia an nz za a y y d de es sv vi ia ac ci i n n e es st t n nd da ar r. .
4 4. .3 3. .1 1 M Me ed di id da as s d de e T Te en nd de en nc ci ia a C Ce en nt tr ra al l: :
Muestran el comportamiento medio o promedio de los valores que puede tomar la
variable aleatoria.
4.3.1.1 Valor esperado o media de una V.A.C
Es la integral en todo el dominio de los valores de la variable aleatoria, multiplicados
por su funcin de densidad de probabilidad.
( ) ( )
}
+

= = dx x f x X E
4.3.1.2 Moda de una V. A. C.
Es el valor de la variable aleatoria para la cual se cumple que la funcin de densidad
de probabilidades adquiere el mximo valor.
( ) ( ) Mo a cercano x todo para x f Mo f >
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
85
4.3.1.3 Mediana de una V. A. C.
Es el nmero real para el que se cumple que la probabilidad acumulada de una
variable aleatoria es menor o igual que 0.5.
( ) ( ) Med F Med F
X X
= = 1 50 . 0
4 4. .3 3. .2 2 M Me ed di id da as s d de e V Va ar ri ia ac ci i n n: :
Permiten estudiar la dispersin o variabilidad que tienen los diferentes valores de la
variable aleatoria.

4.3.2.1 Varianza de una V. A. C.
Es la integral en todo el dominio de los valores de la diferencia entre la variable
aleatoria y la media elevada al cuadrado, multiplicada por la funcin de densidad de
probabilidad. Si su valor es pequeo, indica una concentracin o poca dispersin de
los datos, alrededor de su valor medio y, por el contrario, si valor es alto, indica una
dispersin considerable de los datos respecto al valor central.

( ) ( ) ( )
}
+

= = = dx x f x X E X V
2 2 2
o
4.3.2.2 Desviacin Tpica o Estndar de una V.A.C.
Es la raz cuadrada de la varianza.

( ) ( ) X V X + = o
4 4. .4 4 D Di is st tr ri ib bu uc ci i n n U Un ni if fo or rm me e y y E Ex xp po on ne en nc ci ia al l. .
4 4. .4 4. .1 1 D Di is st tr ri ib bu uc ci i n n U Un ni if fo or rm me e. .
Describe el comportamiento probabilstico de una variable aleatoria que toma cualquier
valor en el intervalo cerrado continuo [ ] b a, ; de tal modo que su valor en ese intervalo
es una constante.
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
86
Funcin de Distribucin Uniforme:
( )
}

=
t
a
dx
a b
t F
1
Funcin de Densidad de la Distribucin Uniforme:
( )

s s

=
valores otros para
b x a para
a b
x f
0
1
Media de distribucin Uniforme:
( )
2
b a
X E
+
= =
Varianza de la distribucin Uniforme:

( )
( )
12
2
2
a b
X V

= = o
4 4. .4 4. .2 2 D Di is st tr ri ib bu uc ci i n n E Ex xp po on ne en nc ci ia al l. .
Es una funcin de densidad de probabilidades que en el contexto de los procesos de
llegadas aleatorias, describe el comportamiento probabilstico de los tiempos entre
dos llegadas consecutivas.
Funcin de Distribucin Exponencial:
( )

/
0
1
t
t
x
e dx e t F

= =
}
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
87
Funcin de Densidad Exponencial:

( )

>
=

valores otros para


t para e
t f
t
_ _ 0
0

Media de distribucin Exponencial:


( )
u

1
= = X E
Varianza de la distribucin Exponencial:
( )
2
2
1
u
o = = X V
Desviacin tpica de la distribucin Exponencial:

( )
u
o
1
= = = X E
Ejercicios de Distribucin Exponencial

Ejercicio 1:

Suponiendo que la duracin de X (en das) de cierto componente C es exponencial,
donde = 120. Encuentre la probabilidad de que el componente C dure menos de 60
das.
Solucin: La probabilidad de que C dure menos de 60 das, nos indica entonces que
el valor de t = 60, los valores de e y son ya conocidos, =120 y e es
constante~ 2.81

Formula a utilizar:
( )

/
0
1 ) (
t
t
x
e dx e t F t X P

= = = <
}
Sustitucin de valores:
393 . 0 81 . 2 1 1 1 ) 60 ( ) 60 (
2 / 1 120 / 60 /
= = = = = <

e e F X P
t
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
88
Resultado:
La probabilidad de que C dure menos de 60 das = P(X<60) = 0.393 = 39.3%

Ejercicio 2:

Suponiendo que la duracin de X (en das) de cierto componente C es exponencial,
donde = 120, Encuentre la probabilidad de que el componente C dure ms de 240
das.
Solucin: La probabilidad de que C dure ms de 240 das, nos indica entonces que el
valor de t = 240, los valores de e y son ya conocidos, =120 y e es
constante~ 2.81

Formula a utilizar:
( )

/ /
0
) 1 ( 1 1 1 ) (
t t
t
x
e e dx e t F t X P

= = = = >
}
Sustitucin de valores:

135 . 0 81 . 2 ) 1 ( 1 ) 240 ( 1 ) 240 (
2 120 / 240 /
= = = = = >

e e F X P
t
Resultado:
La probabilidad de que C dure ms de 240 das = P(X>240) = 0.135 = 13.5%

4 4. .5 5 D Di is st tr ri ib bu uc ci i n n N No or rm ma al l. .
Tiene un papel particularmente importante en las aplicaciones prcticas de la teora
de la probabilidad. Una caracterstica importante es que es posible especificarla de
manera amplia por medio de dos parmetros: la media y la desviacin estndar o .
La curva que se forma es simtrica con respecto a la media de la distribucin, tiene
forma de campana y se extiende de a + . El rea total bajo la curva es 100% o
1.00.
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
89
Funcin de Densidad de Probabilidad Normal:
( )
2
2
1
2
1
|
.
|

\
|

=
o

t o
x
e x f
Funcin de la Distribucin Normal:
( ) dx e t F
t
x
}

|
.
|

\
|

=
2
2
1
2
1
o

t o
Funcin de Densidad de Probabilidad Normal Estandarizada:
( )
2
2
1
2
1
z
e z f

=
t
Donde:
o

=
x
z
Funcin de la Distribucin Normal Estandarizada:
( ) z d e t
z t
2
2
1
2
1


}
=
t
| Donde:
o

=
x
z
Media de la distribucin Normal:

( ) = x E
Varianza de la distribucin Normal:

( )
2 2 2 2
o o = + = X V
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
90
Ejercicios de Distribucin Normal

Ejercicio 1:

Supongamos que X es la distribucin normal N(70,4). Encuentre la probabilidad de
que X sea menor o igual a 74. P(X<=74)
Solucin: X tiene media = 70 y desviacin estndar o= 4 =2. Se transforma x
2
=74
en unidades estndar de la siguiente manera:

Formula a utilizar:
( ) ) (
2
1
2
1
2
2
1
2
2
1
2
2
2
z dz e x d e x X P
z z
x
x
|
t t o
o

= = = <=


|
.
|

\
|


} }
Donde:
o

=
2
x
z
Sustitucin de valores:

2
2
70 74
=

= z
( ) 9772 . 0 ) 2 (
2
1
2 2
1
74
2
2
1
2
2
2
70 74
2
1
74
= = = = <=


|
.
|

\
|


} }
|
t t
dz e dx e X P
z
| (2) = 0.9772 se obtiene de las tablas de reas bajo la curva normal estandarizada
representada en la siguiente curva:

Resultado:
La probabilidad de que X sea menor o igual a 74. P(X<=74) = 0.9772 = 97.72%
Ejercicio 2:
Supongamos que X es la distribucin normal N(70,4). Encuentre la probabilidad de
que X sea mayor a 74. P(X>74).

Solucin: X tiene media = 70 y desviacin estndar o= 4 =2. Se transforma x
2
=74
en unidades estndar de la siguiente manera:
0.9772
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
91
Formula a utilizar:
( ) ) ( 1
2
1
1
2
1
1 1
2
2
2
1
2
2
1
2
2 2
2
2
z dz e x d e x X P
z z
x
x
|
t t o
o

= = = <=


|
.
|

\
|


} }
Donde:
o

=
2
2
x
z
Sustitucin de valores:
2
2
70 74
2
=

= z
( ) 0228 . 0 9772 . 0 1 ) 2 ( 1
2
1
1
2 2
1
1 74 1
2
2
1
2
2
2
70 74
2
1
74
2
= = = = = <=


|
.
|

\
|


} }
|
t t
dz e dx e X P
z
| (2) = 0.9772 se obtuvo de las tablas de reas bajo la curva normal estandarizada,
representada en la siguiente curva

Resultado:
La probabilidad de que X sea mayor a 74. P(X>74). = 0.0228 = 2.28%

Ejercicio 3:

Supongamos que X es la distribucin normal N(70,4). Encuentre la probabilidad de
que X sea mayor o igual a 68 y X sea menor o igual a 74. P(68<=X<=74).

Solucin: X tiene media = 70 y desviacin estndar o= 4 =2. Se transforma x
1
=68
y x
2
=74 en unidades estndar de la siguiente manera:

Formula a utilizar:
( ) ) ( ) (
2
1
2
1
1
2
1
2
2
2
1
2
1
2
2
1
2 1
z z dz e x d e x x x P
z z
z
x
x
x
| |
t t o
o

= = = <= <=

|
.
|

\
|

} }
0.9772
0
0.0228
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
92
Donde:
o

=
x
z
Sustitucin de valores:
1
2
70 68
1
=

= z y 2
2
70 74
2
=

= z
( ) 8185 . 0 1587 . 0 9772 . 0 ) 1 ( ) 2 (
2
1
2
1
74 68
2
2
1
2
1
2
2
1
74
68
= = = = = <= <=

|
.
|

\
|

} }
| |
t t o
o

dz e x d e x P
z
x
Donde:
| (2) = 0.9772
| (-1) = 0.1587
Se obtuvieron de las tablas de reas bajo la curva normal estandarizada, representada
en la curva anexa y se obtiene de la resta de | (2) - | (-1) debido a que se busca la
probabilidad de que X se encuentre entre estos dos valores.

Resultado:
La probabilidad de que X sea mayor o igual a 68 y X sea menor o igual a 74.
P(68<=X<=74). = | (2) - | (-1) = 0.9772 - 0.1587 = 0.8185 = 81.85%
4 4. .5 5. .1 1 A Ap pr ro ox xi im ma ac ci i n n d de e l la a B Bi in no om mi ia al l a a l la a N No or rm ma al l. .
Cuando el nmero de pruebas es grande y la probabilidad de xito muy pequea, se
puede usar la funcin de densidad de probabilidades normal con parmetros y o
para calcular probabilidades binomiales, usando las equivalencias = np y o = q p n
que son respectivamente la media y la desviacin estndar de la binomial. Dado que
cuando se emplea la distribucin binomial para calcular la probabilidad de que x tome
por ejemplo entre 1 y 3, se hace el clculo para x = 1, x = 2 y x = 3 y posteriormente se
suman todos los resultados para conocer p(1 x 3).
Para hacer la aproximacin de la Binomial a la Normal, tenemos solo dos valores para
x, el que representa el lmite inferior y el que representa el lmite superior y estos se
0.1587 0.9772
0.8185
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
93
modifican en punto restndoselo al lmite inferior y sumndolo al lmite superior de
tal manera que si deseamos conocer p(1 x 3) x
1
=1 -0.5 , x
2
=3 +0.5 por tanto
x
1
=0.5 , x
2
=3.5 y estos datos se sustituyen en la ecuacin para obtener el valor de z.

o

=
x
z
Ejercicio 1:

Suponga que el 4% de la poblacin mayor de 65 aos tiene la enfermedad de
Alzheimer. Suponga que se toma una muestra aleatoria de 3500 personas mayores
de 65. Encuentre la probabilidad de que:
a) 150 o ms de ellos tengan la enfermedad.
b) Entre 100 y 120 inclusive tengan la enfermedad.

Solucin
De acuerdo a los datos que se proporcionan, se hace una aproximacin por la
binomial y a partir del tamao de la muestra n, de la probabilidad de xito p y la
probabilidad de fracaso q se calcula la media y la desviacin estndar o antes del
clculo de z.
n = 3500 p = 0.04 q = 0.96
140 04 . 0 3500 = = = np
59 . 11 5931 . 11 4 . 134 96 . 0 04 . 0 3500 ~ = = = = npq o
a) Cul es la Probabilidad de que 150 o ms de ellos tengan la enfermedad?
Dado que tambin se debe considerar el 150, se disminuye medio punto a la
variable x por tanto:
x = 150-0.5 = 149.5

82 . 0 8194 . 0
59 . 11
5 . 9
59 . 11
140 5 . 149
~ = =

=
o
x
z
7939 . 0 ) 82 . 0 ( = = z |
7939 . 0 ) 82 . 0 ( = = z | , se obtuvo de las tablas de reas bajo la curva normal
estandarizada, dado que la tabla proporciona la probabilidad menor o igual a z, a la
unidad se le resta el valor obtenido de la tabla para conocer el resultado.
% 21 2061 . 0 7939 . 0 1 ) 150 ( ~ = = > x p
la ) 150 ( > x p se representa en la siguiente curva

0.7939
0
0.2061
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
94
b) Cul es la Probabilidad de que entre 100 y 120 inclusive tengan la
enfermedad? Los lmites se modifican en punto, se le resta al lmite inferior y se
le suma al lmite superior
x
1
= 100-0.5 = 99.5 x
2
= 120+0.5 = 120.5

49 . 3 4943 . 3
59 . 11
5 . 40
59 . 11
140 5 . 99
1
1
~ =

=
o
x
z 0002 . 0 ) 49 . 3 (
1
= = z |
68 . 1 6824 . 1
59 . 11
5 . 19
59 . 11
140 5 . 120
2
2
~ =

=
o
x
z 0465 . 0 ) 68 . 1 (
2
= = z |
0002 . 0 ) 49 . 3 (
1
= = z | y 0465 . 0 ) 68 . 1 (
2
= = z | se obtuvieron de la tabla de reas bajo
la curva normal estandarizada, y para calcular la probabilidad ) 120 100 ( s s x p se
obtiene restando a ) (
2
z | el valor de ) (
1
z | .
0463 . 0 0002 . 0 0465 . 0 ) ( ) ( ) 120 100 (
1 2
= = = s s z z x p | |
La ) 120 100 ( s s x p se representa en la siguiente curva

4 4. .6 6 T Te eo or re em ma a d de e C Ch he eb by ys sh he ev v. .
Este teorema, a partir de la media y la varianza o
2
; permite calcular un lmite para la
probabilidad de que una variable aleatoria est en un cierto intervalo.

Desigualdad o Teorema de Chebyshev:

( )
2
1
1
h
h X h P > + s s o o
Ejercicio 1
Sea X una variable aleatoria con media = 40 y desviacin estndar = 5. Utilice la
desigualdad de Chebyshev para encontrar un valor b para el cual P (40 b X 40 + b)
0.95
0.0002 0.0465 0
0.0463
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
95
Solucin
Frmula a utilizar:
2
1
1 ) (
h
h X h P > + s s o o
Sustitucin de valores:
Primero resuelva 1 -
2
1
h
= 0.95 para h de la siguiente manera:
2
1
95 . 0 1
h
=
2
1
05 . 0
h
= 20
05 . 0
1
2
= = h 47 . 4 20 = = h
Por desigualdad de Chebyshev b = h = (4.47)(5) = 22.3

Donde:
P (40 22.3 X 40 + 22.3) 1 -
2
1
h
P (17.7 X 62.3) 0.95

F O R M U L A R I O
Funcin de Distribucin
Acumulada ( ) ( ) ( )
}

= s =
t
dx x f t X P t F
Valor esperado o media de una
V.A.C
( ) ( )
}
+

= = dx x f x X E
Moda de una V. A. C.
( ) ( ) Mo a cercano x todo para x f Mo f >
Mediana de una V. A. C.
( ) ( ) Med F Med F
X X
= = 1 50 . 0
Varianza de una V. A. C.
( ) ( ) ( )
}
+

= = = dx x f x X E X V
2 2 2
o
Desviacin Tpica o Estndar de
una V.A.C.
( ) ( ) X V X + = o
Funcin de Distribucin
Uniforme
( )
}

=
t
a
dx
a b
t F
1
Funcin de Densidad de la
Distribucin Uniforme
( )

s s

=
valores otros para
b x a para
a b
x f
0
1
PROBABILIDAD Modelos Analticos de Fenmenos
Aleatorios Continuos
t=
96
Media de distribucin Uniforme
( )
2
b a
X E
+
= =
Varianza de la distribucin
Uniforme
( )
( )
12
2
2
a b
X V

= = o
Funcin de Distribucin
Exponencial
( )

/
0
1
t
t
x
e dx e t F

= =
}
Funcin de Densidad
Exponencial
( )

>
=

valores otros para


t para e
t f
t
_ _ 0
0

Media de distribucin
Exponencial
( )
u

1
= = X E
Varianza de la distribucin
Exponencial
( )
2
2
1
u
o = = X V
Desviacin tpica de la
distribucin Exponencial
( )
u
o
1
= = = X E
Funcin de Densidad de
Probabilidad Normal
( )
2
2
1
2
1
|
.
|

\
|

=
o

t o
x
e x f
Funcin de la Distribucin
Normal ( ) dx e t F
t
x
}

|
.
|

\
|

=
2
2
1
2
1
o

t o
Funcin de Densidad de
Probabilidad Normal
Estandarizada
( )
2
2
1
2
1
z
e z f

=
t
Donde:
o

=
x
z
Funcin de la Distribucin
Normal Estandarizada ( ) z d e t
z t
2
2
1
2
1


}
=
t
| Donde:
o

=
x
z
Media de la distribucin Normal
( ) = x E
Varianza de la distribucin
Normal
( )
2 2 2 2
o o = + = X V
Aproximacin de la Binomial a
la Normal
o

=
x
z
Desigualdad o Teorema de
Chebyshev
( )
2
1
1
h
h X h P > + s s o o
PROBABILIDAD Regresin y Correlacin Simple
t=
97
R
R
e
e
g
g
r
r
e
e
s
s
i
i

n
n
y
y
C
C
o
o
r
r
r
r
e
e
l
l
a
a
c
c
i
i

n
n
S
S
i
i
m
m
p
p
l
l
e
e
5.1 Regresin lineal simple y curvilnea.
5.1.1 Distinguir entre variable dependiente e independiente.
5.1.2 Definir ecuacin de regresin y cual es su aplicacin.
5.1.3 Aplicar el mtodo de mnimos cuadrados para determinar
la recta, parbola o curva que mejor se ajuste a un
conjunto de datos.
5.2 Correlacin.

5 REGRESIN Y CORRELACIN SIMPLE

5 5. .1 1 I In nt tr ro od du uc cc ci i n n. .
Para el estudio de la primera unidad se recopilaron datos pertenecientes a una sola
variable y por consecuencia, de la observacin se obtena una medida, por eso a estas
variables se les llama variables unidimensionales

Sin embargo, frecuentemente para realizar el estudio estadstico de una observacin
se requieren un par de variables de las cules nos interesa conocer cmo se
relacionan, a stas les llamaremos variable estadstica bidimensional.

Como ejemplo de variables bidimensionales podemos mencionar el estudio estadstico
de:

Estatura y peso de un grupo de personas.
PROBABILIDAD Regresin y Correlacin Simple
t=
98
Ingreso y gastos de una familia con determinadas caractersticas.

Calificaciones en Fsica y Matemticas de los alumnos de segundo semestre de la
especialidad de Ingeniera Industrial.

Pulso y temperatura de los enfermos de un hospital.

Si se toman por separado, cada una es una variable unidimensional por ejemplo: la
estatura la podemos representar por la variable X y tomar valores x
1
, x
2
, x
3
, ..., xn,
mientras que al peso le llamaremos Y que toma los valores y
1
, y
2
, y
3
, ..., y
n
de tal
manera que si estudiamos al mismo tiempo la estatura (X) y el peso (Y) como
variables bidimensionales las representamos por el par (X
i
,Y
i
) y los valores se
representan en pares ( x
1
, y
1
); ( x
2
, y
2
); ( x
3
, y
3
); ...; ( x
n
, y
n
)
La estatura y peso de 12 individuos que practican ftbol:

Individuo Estatura en Mt.
(X
i
)
Peso en Kg
(Y
i
)
1 1.75 70
2 1.70 70
3 1.80 78
4 1.68 70
5 1.70 75
6 1.80 78
7 1.70 68
8 1.74 73
9 175 70
10 1.70 78
11 1.80 78
12 1.75 70
5 5. .1 1. .1 1 T Ta ab bl la a d de e F Fr re ec cu ue en nc ci ia a A Ab bs so ol lu ut ta a p pa ar ra a V Va ar ri ia ab bl le es s B Bi id di im me en ns si io on na al le es s. .
De los datos recopilados:

(1.75 , 70) ; (1.70 , 70) ; (1.80 , 78) ; (1.68 , 70) ; (1.70 , 75) ; (1.80 , 78); (1.70 , 68) ;
(1.74 , 73) ; (1.75 , 70) ; (1.70 , 78) ; (1.80 , 78) ; (1.75 , 70)

Se observa que el par (1.75, 70) aparece 3 veces; es decir, hay 3 jugadores que miden
1.75 mts. de estatura y pesan 70 Kg. Al igual que en las variables unidimensionales,
al nmero de veces que la variable toma un valor; en este caso al nmero de veces
que el par (x
i
,y
i
) toman el mismo valor; se le llama frecuencia absoluta f
ij
y podemos
construir la tabla de frecuencias de la siguiente manera:

PROBABILIDAD Regresin y Correlacin Simple
t=
99
TABLA DE FRECUENCIAS ABSOLUTAS

(X
i
,Y
i
) f
ij

(1.75 , 70) 3
(1.70 , 70) 1
(1.80 , 78) 3
(1.68 , 70) 1
(1.70 , 75) 1
(1.70 , 68) 1
(1.74 , 73) 1
(1.70 , 78) 1
E 12
5 5. .1 1. .2 2 T Ta ab bl la a d de e D Do ob bl le e E En nt tr ra ad da a. .
La tabla de frecuencias absolutas suele ser muy larga y poco gil, en su lugar se utiliza
la tabla de doble entrada que consiste en distribuir las frecuencias absolutas en una
cuadrcula, donde f
ij
representa la frecuencia absoluta del par ( x
i
, y
j
).

TABLA DE DOBLE ENTRADA

X
Y X
1
X
2
. . . X
n
Y
1
f
11
f
21
. . . f
n1

Y
2
f
12
f
22
. . . f
n2

. . . . . . . . . . . . . . .
Y
m
f
1m
f
2m
. . . f
nm

La tabla de doble entrada de los datos recabados queda de siguiente manera:

TABLA DE DOBLE ENTRADA

X
Y 1.68 1.70 1.74 1.75 1.80
68 -- 1 -- -- --
70 1 1 -- 3 --
73 -- -- 1 -- --
75 -- 1 -- -- --
78 -- 1 -- -- 3
PROBABILIDAD Regresin y Correlacin Simple
t=
100
5 5. .1 1. .3 3 D Di is st tr ri ib bu uc ci io on ne es s M Ma ar rg gi in na al le es s. .
A la suma de las frecuencias X (columnas) y Y (filas) se les llama Distribuciones
Marginales.

TABLA DE DOBLE ENTRADA
Distribuciones Marginales
X
Y 1.68 1.70 1.74 1.75 1.80
68 -- 1 -- -- -- 1
70 1 1 -- 3 -- 5
73 -- -- 1 -- -- 1
75 -- 1 -- -- -- 1
78 -- 1 -- -- 3 4
1 4 1 3 3 12
5 5. .1 1. .4 4 T Ta ab bl la a d de e F Fr re ec cu ue en nc ci ia a R Re el la at ti iv va a p pa ar ra a V Va ar ri ia ab bl le es s B Bi id di im me en ns si io on na al le es s. .
A partir de estas sumatorias, podemos construir las tablas de distribuciones
marginales de X y Y en donde aparezca la frecuencia absoluta y relativa de X y de Y
como se presenta a continuacin:

X
i
Frecuencias
Absolutas
f
i
Frecuencias
Relativas
H
i
= f
i
/N
1.68 1 1/12
1.70 4 4/12
1.74 1 1/12
1.75 3 3/12
1.80 3 3/12
E f
i
=12 E h
i
=1
Y
i
Frecuencias
Absolutas
f
i
Frecuencias
Relativas
H
i
= f
i
/N
68 1 1/12
70 5 5/12
73 1 1/12
75 1 1/12
78 4 4/12
E f
i
=12 E h
i
=1
Frecuencias absolutas
marginales de la variable Y
Frecuencias absolutas
marginales de la variable X
PROBABILIDAD Regresin y Correlacin Simple
t=
101
5 5. .1 1. .5 5 F Fu un nc ci io on ne es s e es st ta ad d s st ti ic ca as s: : m me ed di ia a, , v va ar ri ia an nz za a, , d de es sv vi ia ac ci i n n y y c co ov va ar ri ia an nz za a. .
Estas distribuciones marginales son obviamente distribuciones unidimensionales y, por
tanto, se pueden calcular las medias, varianzas, desviaciones tpicas, etc., por
separado, apliquemos los conocimientos que adquirimos en el captulo 1 y recordemos
cmo se calculan estas funciones estadsticas las cuales nos sern de utilidad para el
clculo de la covarianza y algunos clculos que se realizarn posteriormente.

Medias:
n
x f
x
i i
n
i
) (
1

=
=
n
y f
y
i i
n
i
) (
1

=
=
Varianzas:
1
) (
1
2
2

=
n
x x f
s
n
i
i i
x
1
) (
1
2
2

=
n
y y f
s
n
i
i i
y
Desviaciones Tpicas:

1
) (
1
2

=
n
x x f
s
n
i
i i
x
1
) (
1
2

=
n
y y f
s
n
i
i i
y
Covarianza:

La Covarianza Cov(x,y), tambin se identifica como s
xy
; mide la correlacin que hay
entre las variables X y Y; una covarianza grande y positiva (s
xy
> 0) est asociada a
una fuerte correlacin positiva mientras que una covarianza grande y negativa (s
xy
< 0)
est asociada a una correlacin negativa fuerte, el signo de la covarianza determina el
sentido de la correlacin (positivo o negativo), mientras que la fuerza est dada por el
valor absoluto de la covarianza a mayor valor mayor correlacin y por consiguiente, la
nube de puntos ser ms estrecha. Si X y Y son independientes, s
xy
= 0. Debemos
tener en cuenta que los puntos que estn ms alejados en la nube influyen ms en su
valor y signo que los centrales.
PROBABILIDAD Regresin y Correlacin Simple
t=
102
La covarianza se calcula a travs de la siguiente frmula:

n
y y x x
s
n
i
i i
y x

=

=
1
) )( (
La cual al ser despejada se sintetiza hasta llegar a:

y x
n
y x
s
n
i
i i
y x
=

=1
Esta ltima facilita su clculo

Ejemplo:
La siguiente tabla muestra la lluvia caida X (medida en Mm.) en diferentes regiones y
los kilos de trigo cosechados por hectrea (Y) en cada una de estas regiones.

mm
n
x f
x
i i
n
x
700
5
3500
) (
1
= = =

=
Kg
n
x f
y
i i
n
x
800 . 10
5
54
) (
1
= = =

=
Una vez que se conocen las medias de las variables X y Y procederemos a calcular
la covarianza con las dos frmulas proporcionadas anteriormente:

CALCULO DE COVARIANZA CON LA FORMULA ORIGINAL
Observacin x
i
y
i
1 800 12
2 700 11
3 500 9
4 900 12
5 600 10
Sumas 3,500 54
Observacin x
i
y
i
x x
i
y y
i

(
x x
i

)(
y y
i

)
1 800 12 100 1,2 120
2 700 11 0 0,2 0
3 500 9 -200 -1,8 360
4 900 12 200 1,2 240
5 600 10 -100 -0,8 80
Sumas 3,500 54 800
700 = x 800 . 10 = y
PROBABILIDAD Regresin y Correlacin Simple
t=
103
160
5
800
) )( (
1
= =

=

=
n
y y x x
s
n
i
i i
y x
CALCULO DE COVARIANZA CON FORMULA SINTETIZADA

160 7560 7720
1
= = =

=
y x
n
j x
s
n
i
i i
y x
Obsrvese que con cualquiera de las dos formulas, se llega al mismo resultado y dado
que el resultado de la covarianza (s
xy
= 160) es positivo y alejado del cero, se presume
que se tiene una correlacin positiva la cual a simple vista, se puede corroborar a
travs de la representacin grfica de los valores x, y en el plano cartesiano.

5 5. .1 1. .6 6 D Di ia ag gr ra am ma a d de e D Di is sp pe er rs si i n n o o N Nu ub be e d de e P Pu un nt to os s. .
Despus de que se haya hecho la recoleccin y clasificacin de los datos a travs de
las tablas; el siguiente paso a realizar en el estudio de la relacin entre dos variables
es la representacin grfica de los datos en el plano cartesiano, definiendo cada punto
en las coordenadas (x,y), a este grfico se les conoce como Diagrama de Dispersin
o Nube de Puntos y dependiendo de la forma que toma la nube de puntos es el
nombre que reciben, si la nube no toma ninguna forma definida, se debe a que no
existe correlacin entre las variables de la observacin; por el contrario, si la nube es
estirada y sus puntos se pueden encerrar en una elipse, lo cerrado de esa elipse nos
indica la fuerza de la correlacin lineal. A continuacin se presentan algunos
ejemplos de Diagramas de Dispersin.

Observacin x
i
y
i
i i
y x
1 800 12 9600
2 700 11 7700
3 500 9 4500
4 900 12 10800
5 600 10 6000
Sumas 3,500 54 38600
700 = x 800 . 10 = y
7560 800 . 10 * 700 = = y x 7720
5
38600
1
= = =

=
n
j x
s
n
i
i i
y x
PROBABILIDAD Regresin y Correlacin Simple
t=
104
Diagrama de Dispersin o Nube de Puntos
0
20
40
60
80
100
120
0 10 20 30 40 50 60 70
Independencia o Ausencia de Correlacin
Diagrama de Dispersin o Nube de Puntos
0
10
20
30
40
50
60
70
0 10 20 30 40 50
Mientras mas estrecha sea la elipse, mayor es la fuerza de la correlacin
PROBABILIDAD Regresin y Correlacin Simple
t=
105
Diagrama de Dispersin o Nube de Puntos
0
10
20
30
40
50
60
0 5 10 15 20 25 30
Dependencia Funcional
Diagrama de Dispersin o Nube de Puntos
0
10
20
30
40
50
60
70
0 10 20 30 40 50
Correlacin Lineal Positiva Fuerte
Diagrama de Dispersin o Nube de Puntos
0
100
200
300
400
500
600
0 2 4 6 8 10
Correlacin Curvilinea Positiva Fuerte
PROBABILIDAD Regresin y Correlacin Simple
t=
106
Diagrama de Dispersin o Nube de Puntos
0
5
10
15
20
25
30
35
1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95
Correlacin Lineal Negativa
Diagrama de Dispersin o Nube de Puntos
0
100
200
300
400
500
600
0 2 4 6 8 10
Correlacin Curvilinea Negativa
Algunos tipos de nubes de puntos seran:

Dependencia funcional si la nube de puntos se sita en la grfica de una
funcin.

Correlacin lineal si la nube de puntos se sita en torno a una lnea recta.

Correlacin curvilnea si la nube de puntos se sita en torno a una curva.

Correlacin positiva si a medida que aumenta una variable aumenta la otra.

Correlacin negativa si a medida que aumenta una variable la otra disminuye.
PROBABILIDAD Regresin y Correlacin Simple
t=
107
Independencia o ausencia de correlacin.

La naturaleza y grado de relacin entre las variables X y Y pueden ser analizadas por
dos tcnicas: Regresin y Correlacin que aunque estn relacionadas tienen
propsitos diferentes e interpretaciones diferentes y por lo mismo, no debe sustituirse
una por la otra. El anlisis de regresin puede ser lineal o curvilneo y tambin lineal
simple y lineal mltiple; el lineal siempre se ocupa de dos variables y el mltiplo de tres
o mas, nosotros nos enfocaremos al estudio de la regresin lineal y la correlacin
entre variables

5 5. .2 2 R Re eg gr re es si i n n l li in ne ea al l s si im mp pl le e y y c cu ur rv vi il l n ne ea a. .
La palabra regresin surgi a finales del siglo XVII cuando Sir Francis Galton, cientfico
ingles dedicado a investigaciones genticas, trat de establecer la relacin entre las
caractersticas de padre e hijo. Al comparar la altura de los padres, not que de
padres altos, generalmente sus hijos no alcanzaban su estatura mientras que de
padres bajos generalmente los hijos superaban la estatura, lo que lo llev a concluir
que las caractersticas genticas tendan a regresar a un valor medio de la poblacin.

El anlisis de regresin se emplea en situaciones experimentales cuando se desea
determinar la forma en la que se relacionan las variables cuando hay un fenmeno de
causa efecto en donde la causa es la variable independiente (x) y el efecto la
variable dependiente (y); su objetivo principal es el de estimar el valor de una variable
dependiente correspondiente al valor dado de otra variable independiente.

5 5. .2 2. .1 1 D Di is st ti in ng gu ui ir r e en nt tr re e v va ar ri ia ab bl le e d de ep pe en nd di ie en nt te e e e i in nd de ep pe en nd di ie en nt te e. .
Cuando se realiza el estudio estadstico de una observacin que requieren variables
estadstica bidimensional, puede ser que sean:
Independientes: Cuando una de las variables no tiene ninguna relacin con la otra
por ejemplo: la cantidad de lluvia en mm

que cae en temporada de lluvias,

es
independiente de la cosecha que se recoge por lo tanto, la cantidad de lluvia en mm
es una variable independiente, otro ejemplo de variables independientes sera la
cosecha que levanta una familia y el nmero de integrantes de la misma, en este caso,
no tienen nada que ver entre si las dos variables.

Dependientes: cuando el valor de una de las variables, se relaciona con el valor de la
otra variables, retomando el ejemplo de la lluvia y la cosecha, podemos asegurar que
la cosecha si es dependiente de los mm de lluvia por lo tanto, la lluvia es la variable
independiente y la cosecha la variable dependiente.

PROBABILIDAD Regresin y Correlacin Simple
t=
108
5 5. .2 2. .2 2 D Di if fe er re en nc ci ia a e en nt tr re e D De ep pe en nd de en nc ci ia a F Fu un nc ci io on na al l y y D De ep pe en nd de en nc ci ia a E Es st ta ad d s st ti ic ca a. .
Cuando la relacin entre las variables x y yse da de manera proporcional y para
conocer el valor de una de ellas se debe obtener a partir de una frmula matemtica
que contenga el valor de la otra variable se dice que existe dependencia funcional
por ejemplo:

La reproduccin de la bacteria "salmonella typhimurium" se realiza
dividindose cada bacteria en otras dos cada hora. Partiendo de una
bacteria, existe una frmula matemtica que nos permite calcular el
nmero de bacterias en funcin del tiempo que pasa:

y = 2
x
Esta dependencia entre el tiempo y el nmero de bacterias es una
dependencia funcional.
2
Observacin Tiempo en horas
(X
i
)
Nmero de bacterias
(Y
i
=2
x
i
)
1 1 2
2 2 4
3 3 8
4 4 16
5 5 32
6 6 64
7 7 128
8 8 256
9 9 512
En cambio, habr casos en los que el valor de una variable tenga relacin con el valor
de la otra pero no de manera proporcional como por ejemplo, sabemos que una
persona entre ms estatura tiene, mayor es el nmero de calzado que usa, sin
embargo, no podemos establecer una regla que nos diga que el nmero de calzado
que usa la persona representa el 15% de su estatura ni nada por el estilo,
simplemente sabemos que por lo general, entre ms alta es la persona, el nmero de
calzado es mayor. Esto se conoce como dependencia estadstica.
La dependencia o correlacin es positiva cuando a mayor valor de una, le
corresponde tambin mayor valor de la otra.

2
Lectus Vergara, Estadstica Nivel II
x tiempo en horas
y nmero de bacterias
PROBABILIDAD Regresin y Correlacin Simple
t=
109
Individuo
Var. Independiente
Estatura en Mts.
(X
i
)
Var. Dependiente +
Medida de Calzado
(Y
i
)
1 1,60 24
2 1,65 25
3 1,70 26
4 1,75 26,5
5 1,80 27
6 1,80 27
7 1,85 28
8 1,90 29
La dependencia o correlacin es negativa cuando a mayor valor de una, le
corresponde menor valor a la otra.

Empresa
Var. Independiente
%de personal que se
les dio capacitacin y
adiestramiento
(X
i
)
Var. Dependiente -
%de personal con
accidentes de
trabajo
(Y
i
)
6 70 20
3 75 17
2 80 15
5 85 10
4 90 5
1 95 3
8 95 2
7 100 1
Los siguientes pares de variables tienen una dependencia estadstica:

Estatura y peso de un grupo de personas.

Ingreso y gastos de una familia con determinadas caractersticas.

Calificaciones en Fsica y Matemticas de los alumnos de segundo semestre de
la especialidad de Ingeniera Industrial.

Pulso y temperatura de los enfermos de un hospital.

La renta per cpita y el ndice de natalidad de un pas.
PROBABILIDAD Regresin y Correlacin Simple
t=
110
La cantidad de dinero que una empresa se gasta en publicidad y las ventas que
obtiene.

La temperatura media anual y la latitud de las capitales de los pases de la
Comunidad Econmica Europea.

5 5. .2 2. .3 3 D De ef fi in ni ir r e ec cu ua ac ci i n n d de e r re eg gr re es si i n n y y c cu u l l e es s s su u a ap pl li ic ca ac ci i n n. .
A la funcin que describe lo mejor posible la relacin existente entre dos variables se
la denomina ecuacin de regresin, y a su grfica, lnea de regresin.

En ocasiones, entre dos variables existe un cierto grado de dependencia, es decir, una
relacin. As, por ejemplo, la estatura y el peso de los individuos, la natalidad y el
grado de desarrollo de un pas, la edad y la propensin a adquirir una determinada
enfermedad, etc.

De una manera general, llamaremos regresin a la teora que trata de exponer,
mediante una ecuacin matemtica, la relacin que existe entre las dos variables
X y Y; de esta forma podemos obtener con cierta aproximacin el valor de una de las
variables conociendo el de la otra.

Diagrama de Dispersin o Nube de Puntos
0
10
20
30
40
50
60
70
0 10 20 30 40 50
Correlacin Lineal Positiva Fuerte
La ecuacin que relacione los dos variables puede ser de diversos tipos;

La lineal: b ax y + = Parablica: c bx ax y + + =
2
Cbica: d cx bx ax y + + + =
2 3
Exponencial:
x
ca y =
A la lnea que mejor se ajuste al
diagrama de dispersin (nube de
puntos). Se llama lnea de
regresin.

Si los puntos de la nube estn
alineados o casi alineados como en
esta grfica, el trazado de la lnea
de regresin se puede hacer a
ojo, a esto se le llama Mtodo
Intuitivo, pero cuando la nube est
muy dispersa es mejor buscar un
mtodo ms cientfico.
PROBABILIDAD Regresin y Correlacin Simple
t=
111
Hiperblica:
bx a
y
+
=
1
Sin embargo, nos enfocaremos al nicamente al estudio de la regresin lineal, es
decir, cuando la funcin que mejor se ajusta a la nube de puntos sea una recta, en
otras palabras, cuando las dos variables se pueden relacionar por una recta tal y como
se muestra el en diagrama de dispersin anterior.

Dada una serie de valores (x
i
,y
i
) la recta de regresin y = ax+b nos permite hacer
estimaciones, es decir dado un valor x de la variable X podemos evaluar el valor ax+b
que le corresponde de la variable Y
Para encontrar la recta de regresin deberemos calcular la ecuacin:

b ax y + =
Donde
a = pendiente de la recta y b = punto de corte con el eje de ordenadas

5 5. .2 2. .4 4 M M t to od do o d de e M M n ni im mo os s C Cu ua ad dr ra ad do os s. .
Supongamos que la nube de puntos de la variable estadstica bidimensional (X, Y)
tiene una forma alargada, es decir, la correlacin lineal entre las dos variables es
fuerte.
Diagrama de Dispersin o Nube de Puntos
0
10
20
30
40
50
60
70
0 10 20 30 40
Pi(x
i
,y
i
)
Qi(x
i
,y
i
)
Y = ax+b
PROBABILIDAD Regresin y Correlacin Simple
t=
112
Sin embargo que pasar si tenemos el siguiente diagrama de dispersin:

0
20
40
60
80
100
120
0 10 20 30 40 50 60 70
En el ejemplo anterior, tenemos el problema que no podemos encontrar la recta que
ms ajuste a la nube de puntos porque para empezar, ni siquiera hemos determinado
un criterio a seguir para elegir la recta, no olvidemos que los resultados dependern
del criterio que tomemos.

El mtodo de los mnimos cuadrados es el ms prctico para hallar la mencionada
recta de regresin y diferencia entre la recta de regresin de Y sobre X y la recta de
regresin de X sobre Y:
RECTA DE REGRESION DE X SOBRE Y
Recta de Regresin de Y sobre X
0
10
20
30
40
50
60
70
0 10 20 30 40
Pi(x
i
,y
i
)
Qi(x
i
,y
i
)
Y = ax+b
PROBABILIDAD Regresin y Correlacin Simple
t=
113
Sean (x
1
, y
1
), (x
2
, y
2
),..., (x
n
, y
n
) los valores de la variable y sea y = ax + b la recta
buscada.

A cada valor x
i
de la variable X le corresponde un el valor y
i
de la variable Y y un valor
Y
i
*
= ax
i
+ b de la recta. En general estos dos valores no sern iguales.

En estas condiciones el error mnimo de la recta de regresin de X sobre Y es aquella
que hace mnima la suma de los cuadrados de las diferencias entre los valores
observados y los valores estimados. Es decir:

E = E(y
i
y
i
*) = mnimo

RECTA DE REGRESION DE Y SOBRE X
Recta de Regresin de Xsobre Y
0
10
20
30
40
50
60
70
0 10 20 30 40
Sean (x
1
, y
1
), (x
2
, y
2
),..., (x
n
, y
n
) los valores de la variable y sea y=ax+b la recta
buscada.

A cada valor y
i
de la variable Y le corresponde un el valor x
i
de la variable X y un valor
estimado x
i
*
= ay
i
+ b de la recta. En general estos dos valores no sern iguales.

En estas condiciones el error mnimo de la recta de regresin de Y sobre X es aquella
que hace mnima la suma de los cuadrados de las diferencias entre los valores
observados y los valores estimados. Es decir:
E = E(x
i
x
i
*) = mnimo

Pi(x
i
,y
i
)
Qi(x
i
,y
i
)
Y = ax+b
PROBABILIDAD Regresin y Correlacin Simple
t=
114
Sea y = ax + b la recta de regresin de Y sobre X, por el mtodo de los mnimos
cuadrados se obtienen unas condiciones sobre a y b.
Ex
i
y
i
= a Ex
i
2
+ bEx
i
Ey
i
= aEx
i
+ nb

De las que resulta:

x
xy
s
s
a
2
=
|
|
.
|

\
|
= y x
s
s
b
x
xy
2
En definitiva la recta de regresin de Y sobre X es:

( ) x x
s
s
y y
x
xy
=
2
o
|
|
.
|

\
|
= y x
s
s
x
s
s
y
x
xy
x
xy
2 2
Esta ecuacin nos proporciona aproximadamente los valores de Y conocidos los de X.

Anlogamente, se obtiene la recta de regresin de X sobre Y, que permite hallar
aproximadamente los valores de X conocidos los de Y:
( ) y y
s
s
x x
y
xy
=
2
o
|
|
.
|

\
|
= x y
s
s
y
s
s
x
y
xy
y
xy
2 2
Los coeficientes obtenidos del cociente de la covarianza sobre la varianza:
x
xy
s
s
2
y
y
xy
s
s
2
se llaman coeficientes de regresin.

Ejemplo:

La tabla muestra la lluvia caida X (medida en mm.) en diferentes regiones y los kilos de
trigo cosechados por hectrea (Y) en cada una de estas regiones. Si en una regin
han caido 550 mm de lluvia, cuntos Kg./Ha. Se pueden recoger?

PROBABILIDAD Regresin y Correlacin Simple
t=
115
160
7560 7720
1
=
=
=

=
y x
n
j x
s
n
i
i i
y x
113883 . 158
25000
4
100000
1
) (
1
2
=
=
=

=
n
x x f
s
n
i
i i
x
3038 . 1
7 . 1
4
8 . 6
1
) (
1
2
=
=
=

=
n
y y f
s
n
i
i i
y
El valor que conocemos es el valor de X, debemos predecir Y por lo tanto se debe
obtener la recta de regresin de Y sobre X
006 . 0
25000
160
2
=
=
=
x
xy
s
s
a
32 . 6
) 32 . 6 (
) 800 . 10 48 . 4 (
) 800 . 10 700 005 . 0 (
800 . 10 700
25000
160
2
=
=
=
- =
|
.
|

\
|
=
|
|
.
|

\
|
= y x
s
s
b
x
xy
A partir de a y b, la recta de regresin de Y sobre X se obtiene el valor de y

b ax y + =
Observacin
x
i
2
) ( x x
i

y
i
2
) ( y y
i

i i
y x
1 800 10,000 12 1.44 9600
2 700 0 11 0.04 7700
3 500 40,000 9 3.24 4500
4 900 40,000 12 1.44 10800
5 600 10,000 10 0.64 6000
Sumas 3,600 100,000 54 6.8 38600
700 = x 800 . 10 = y
7560 800 . 10 * 700 = = y x
7720
5
38600
1
= =

=
n
j x
n
i
i i
PROBABILIDAD Regresin y Correlacin Simple
t=
116
Si en una regin han cado 550 mm. de lluvia, cuntos Kg./Ha. Se pueden recoger?

x = 550
a = 0.006
b = 6.32
84 . 9
32 . 6 52 . 3
32 . 6 550 0064 . 0
=
+ =
+ - =
+ = b ax y
Resultado:

Si en una regin han caido 550 mm de lluvia se espera recoger 9.84 Kg./Ha.

5 5. .2 2. .5 5 C Co on ns si id de er ra ac ci io on ne es s s so ob br re e l la a r re ec ct ta a d de e r re eg gr re es si i n n. .
Las dos rectas de regresin siempre pasan por el punto (x, y).

Al calcular la recta de regresin hay que tener absolutamente clara la nocin de cul
es la variable independiente (x) y cul la dependiente (y). No son intercambiables; una
cosecha puede depender de la lluvia cada, pero la lluvia no depende de la cosecha.

Cuando utilizamos la recta de regresin para predecir un resultado y a partir de un
valor x, corremos un riesgo; este riesgo es mayor en la medida que nos alejamos del
valor central x.
La pendiente de la recta de regresin (de y sobre x), tiene el mismo signo que el
coeficiente de correlacin: si la correlacin es directa a debe ser positiva; si es inversa,
negativa. (Que a sea ms o menos grande no es indicativo de que la correlacin sea
ms o menos fuerte).

El coeficiente de correlacin se relaciona con las pendientes de la recta de regresin
de la siguiente manera:

mY = pendiente de la recta de regresin de y sobre x.
mX = pendiente de la recta de regresin de x sobre y.
5 5. .3 3 C Co or rr re el la ac ci i n n. .
El anlisis de correlacin nos permite medir el grado de intensidad de la asociacin
entre dos variables, sin importar cual es la independiente y cual es la dependiente, en
este anlisis las variables X y Y son vistas simplemente como variables aleatorias.

PROBABILIDAD Regresin y Correlacin Simple
t=
117
A la medida del grado de correlacin entre dos variables se le llama coeficiente de
correlacin y se representa por para la poblacin y r para la muestra. En el modelo
de correlacin se asume que las variables X y Y varan conjuntamente, si la
distribucin es normal se llamar distribucin normal bivariable; las suposiciones que
constituyen un modelo de correlacin lineal de variables bidimensionales son:

X y Y son variables aleatorias. No deben ser designadas como dependiente e
independiente puesto que esto no modifica el resultado.

La poblacin bivariable es normal si X y Y estn normalmente distribuidas.

La relacin entre X y Y es en cierto sentido lineal, esto es que todas las medias de Y
asociadas a un valor X caen sobre una lnea recta que es la lnea de regresin de Y
sobre X e igualmente las medias de X asociadas a un valor Y caen sobre una lnea
recta que es la lnea de regresin de X sobre Y.
5 5. .3 3. .1 1 C Co oe ef fi ic ci ie en nt te e d de e C Co or rr re el la ac ci i n n d de e P Pe ea ar rs so on n. .
A travs de este coeficiente (r), es posible medir en forma objetiva el grado de la
correlacin lineal entre dos variables, su valor oscila entre -1 y +1 y a medida que el
valor de r se acerca a 1 o -1, la correlacin es ms fuerte. Si el valor del coeficiente de
Pearson es cercano a cero, no vale la pena hacer predicciones ni calcular la recta de
regresin ya que las estimaciones que se realicen no son fiables debido a que la
correlacin es mas dbil mientras mas cercana est de cero.

El coeficiente de correlacin lineal o coeficiente de Pearson (r), se obtiene del cociente
entre la covarianza y el producto de las desviaciones tpicas de las dos variables:

-1 0 1
Correlacin
negativa perfecta
Correlacin
positiva perfecta
No existe
correlacin
Toma mayor fuerza Toma mayor fuerza
Se debilita Se debilita
PROBABILIDAD Regresin y Correlacin Simple
t=
118
y x
xy
s s
s
r =
Donde:

s
xy
es la covarianza de las variables x y y.
s
x
es la desviacin tpica de la variable x.
s
y
es la desviacin tpica de la variable y.
Retomemos el ejemplo que contiene los datos relacionados con la lluvia caida x
(medida en mm.) en diferentes regiones y los kilos de trigo cosechados por hectrea
(Y) en cada una de estas regiones.

160
7560 7720
1
=
=
=

=
y x
n
j x
s
n
i
i i
y x
113883 . 158
4
100000
1
) (
1
2
=
=

=
n
x x f
s
n
i
i i
x
3038 . 1
4
8 . 6
1
) (
1
2
=
=

=
n
y y f
s
n
i
i i
y
Observacin
x
i
2
) ( x x
i

y
i
2
) ( y y
i

i i
y x
1 800 10,000 12 1.44 9600
2 700 0 11 0.04 7700
3 500 40,000 9 3.24 4500
4 900 40,000 12 1.44 10800
5 600 10,000 10 0.64 6000
Sumas 3,500 100,000 54 6.8 38600
700 = x 800 . 10 = y
7560 800 . 10 * 700 = = y x
7720
5
38600
1
= = =

=
n
j x
s
n
i
i i
y x
PROBABILIDAD Regresin y Correlacin Simple
t=
119
776 . 0
155281 . 206
160
3038 . 1 * 113883 . 158
160
=
=
=
=
y x
xy
s s
s
r
Dado que el valor de r (0.776) tiende a 1, se trata de una correlacin fuerte positiva
entre las variables. La ubicacin del valor en la recta, nos permite apreciarlo con
mayor claridad.

Diagrama de Dispersin o Nube de Puntos
Regresin Lineal Positiva
0
2
4
6
8
10
12
14
0 200 400 600 800 1000
Lluvia medida en mm
K
g
.
d
e
t
r
i
g
o
p
o
r
h
e
c
t
-1 0 1
Correlacin
negativa perfecta
Correlacin
positiva perfecta
No existe
correlacin
r = 0.776
PROBABILIDAD Regresin y Correlacin Simple
t=
120
5 5. .4 4 E Ej je er rc ci ic ci io o I In nt te eg gr ra al l
En la tabla esta reflejada la prdida de actividad de un preparado farmacutico en el
curso del tiempo.

Tiempo en meses 1 2 3 4 5
% de actividad restante 90 75 42 30 21
Paso 1.
Identificacin de Variables dependiente e independiente a partir de la
siguiente interrogante Cul es la causa y cul el efecto?

La prdida de actividad de un preparado farmacutico, se debe al paso del
tiempo y no al revs por lo tanto, la causa es el tiempo y el efecto es la
prdida de actividad es decir, la variable dependiente es la prdida de
actividad (y) y la independiente el tiempo (x)
Paso 2.
Construccin de Tabla de Frecuencias (bidimensional), en este ejemplo no se
repiten los valores por lo tanto, todas las observaciones van a tener una
frecuencia = 1.

Tabla de Frecuencias
(Xi,Yi) fij
(1,90) 1
(2,75) 1
(3,42) 1
(4,30) 1
(5,21) 1
Paso 3.
Construccin de Tabla de Doble Entrada.

TABLA DE DOBLE ENTRADA

X
Y 1 2 3 4 5
90 1 -- -- -- --
75 -- 1 -- -- --
42 -- -- 1 -- --
30 -- -- -- 1 --
21 -- -- -- -- 1
PROBABILIDAD Regresin y Correlacin Simple
t=
121
Paso 4.
Clculo de Distribuciones Marginales.

X
Y 1 2 3 4 5
90 1 -- -- -- -- 1
75 -- 1 -- -- -- 1
42 -- -- 1 -- -- 1
30 -- -- -- 1 -- 1
21 -- -- -- -- 1 1
1 1 1 1 1 5
Paso 5.
Clculo de la Medias, Varianzas, Desviaciones Tpicas y Covarianza de las
Variables X y Y.
Medias
Tabla Distribucin de Frecuencias

meses 3
5
15
) (
= = =

n
x f
x
i i
rest Act. % 6 . 51
5
258
) (
= = =

n
y f
y
i i
Varianzas
Tabla Distribucin de Frecuencias

5 . 2
4
10
1
) (
1
2
2
= =

=
n
x x f
s
n
i
i i
x 3 . 879
4
2 . 3517
1
) (
1
2
2
= =

=
n
y y f
s
n
i
i i
y
Obs. x
i
f
i
f
i
x
i
y
i
f
i
f
i
y
i
1 1 1 1 90 1 90
2 2 1 2 75 1 75
3 3 1 3 42 1 42
4 4 1 4 30 1 30
5 5 1 5 21 1 21
Sumas 5 15 5 258
Obs. x
i
f
i
f
i
x
i
2
) ( x x f
i i
y
i
f
i
f
i
y
i
2
) ( y y f
i i

1 1 1 1 4 90 1 90 1474.56
2 2 1 2 1 75 1 75 547.56
3 3 1 3 0 42 1 42 92.16
4 4 1 4 1 30 1 30 466.56
5 5 1 5 4 21 1 21 936.36
Sumas 5 15 10 5 258 3517.20
3 = x 6 . 51 = y
PROBABILIDAD Regresin y Correlacin Simple
t=
122
Desviaciones Tpicas

58 . 1 5 . 2
1
) (
1
2
= =

=
n
x x f
s
n
i
i i
x
65 . 29 3 . 879
1
) (
1
2
= =

=
n
y y f
s
n
i
i i
y
Covarianza
Tabla Distribucin de Frecuencias

6 . 36 8 . 154
5
591
1
= = =

=
y x
n
y x
s
n
i
i i
y x
Una covarianza grande y negativa (s
xy
<0) est asociada a una correlacin negativa
fuerte.

Paso 6
Construir Diagrama de Dispersin e identificar el tipo de Diagrama
Diagrama de Dispersin o Nube de Puntos
Correlacin Lineal Negativa
0
20
40
60
80
100
0 1 2 3 4 5 6
Tiempo Medido en Meses
%
d
e
A
c
t
i
v
i
d
a
d
R
e
s
Obs. x
i
f
i
f
i
x
i
2
) ( x x f
i i
y
i
f
i
f
i
y
i
2
) ( y y f
i i
x
i*
y
i
1 1 1 1 4 90 1 90 1474.56 90
2 2 1 2 1 75 1 75 547.56 150
3 3 1 3 0 42 1 42 92.16 126
4 4 1 4 1 30 1 30 466.56 120
5 5 1 5 4 21 1 21 936.36 105
Sumas 5 15 10 5 258 3517.20 591
3 = x 6 . 51 = y
8 . 154 6 . 51 * 3 = = y x
PROBABILIDAD Regresin y Correlacin Simple
t=
123
Paso 7.
Calcular la Recta de Regresin de Y sobre X
A partir de la Media de X, Media de Y, Varianza de X (s
2
x
) y la Covarianza (s
xy
)
se calcula la recta de regresin de Y sobre X
meses 3
5
15
) (
= = =

n
x f
x
i i
rest Act. % 6 . 51
5
258
) (
= = =

n
y f
y
i i
5 . 2
4
10
1
) (
1
2
2
= =

=
n
x x f
s
n
i
i i
x
6 . 36 8 . 154
5
591
1
= = =

=
y x
n
y x
s
n
i
i i
y x
Recta de Regresin de Y sobre X
b ax y + =
65 . 14
5 . 2
6 . 36
2
=

=
=
x
xy
s
s
a
52 . 95
) 52 . 95 (
) 5 . 51 92 . 43 (
) 6 . 51 3 65 . 14 (
6 . 51 3
5 . 2
5 . 36
2
=
=
=
- =
|
.
|

\
|

=
|
|
.
|

\
|
= y x
s
s
b
x
xy
Esta recta encontrada la podemos utilizar para predecir resultados, por ejemplo:
en 2.5 meses, Qu % de actividad restante tendr el compuesto?

59 92 . 58
52 . 95 6 . 36
52 . 95 5 . 2 65 . 14
~ =
+ =
+ - =
+ = b ax y
Estimacin:
Se espera que en 2.5 meses el compuesto tenga un 59 % de
actividad restante.

PROBABILIDAD Regresin y Correlacin Simple
t=
124
Paso 8.
Calcular la Recta de Regresin de X sobre Y
A partir de la Media de X, Media de Y, Varianza de Y (s
2
x
) y la Covarianza (s
xy
)
se calcula la recta de regresin de Y sobre X.
meses 3
5
15
) (
= = =

n
x f
x
i i
rest Act. % 6 . 51
5
258
) (
= = =

n
y f
y
i i
3 . 879
4
2 . 3517
1
) (
1
2
2
= =

=
n
y y f
s
n
i
i i
y
6 . 36 8 . 154
5
591
1
= = =

=
y x
n
y x
s
n
i
i i
y x
Recta de Regresin de X sobre Y
b ay x + =
0416 . 0
3 . 879
6 . 36
2
=

=
=
y
xy
s
s
a
147 . 5
) 147 . 5 (
) 3 1477 . 2 (
) 3 6 . 51 0416 . 0 (
3 6 . 51
3 . 879
5 . 36
2
=
=
=
- =
|
.
|

\
|

=
|
|
.
|

\
|
= x y
s
s
b
y
xy
Esta recta encontrada la podemos utilizar para predecir resultados, por ejemplo:
en cunto tiempo tendr el compuesto an un 50% de actividad restante?

3 06 . 3
147 . 5 08 . 2
147 . 5 50 0416 . 0
~ =
+ =
+ - =
+ = b ay x
Estimacin:
Se espera que en 3 meses el compuesto aun tenga un 50% de
actividad restante.

PROBABILIDAD Regresin y Correlacin Simple
t=
125
Paso 9.
Calcular el coeficiente de correlacin de Pearson (r) a partir de las
desviaciones tpicas (s
x
y s
y
) y la covarianza (s
xy
) ya calculadas.

58 . 1 5 . 2
1
) (
1
2
= =

=
n
x x f
s
n
i
i i
x
65 . 29 3 . 879
1
) (
1
2
= =

=
n
y y f
s
n
i
i i
y
6 . 36 8 . 154
5
591
1
= = =

=
y x
n
y x
s
n
i
i i
y x
78 . 0
88 . 45
6 . 36
65 . 29 * 58 . 1
6 . 36
=

=
=
y x
xy
s s
s
r
r = -0.78 dado que tiende a -1, indica una correlacin fuerte negativa

-1 0 1
Correlacin
negativa perfecta
Correlacin
positiva perfecta
No existe
correlacin
r = -0.78
PROBABILIDAD Regresin y Correlacin Simple
t=
126
F O R M U L A R I O
Funcin estadstica:
Medias
n
x f
x
i i
n
i
) (
1

=
=
n
y f
y
i i
n
i
) (
1

=
=
Funcin estadstica:
Varianzas
1
) (
1
2
2

=
n
x x f
s
n
i
i i
x
1
) (
1
2
2

=
n
y y f
s
n
i
i i
y
Funcin estadstica:
Desviaciones Tpicas
1
) (
1
2

=
n
x x f
s
n
i
i i
x
1
) (
1
2

=
n
y y f
s
n
i
i i
y
Funcin estadstica:
Covarianza
n
y y x x
s
n
i
i i
y x

=

=
1
) )( (
t=
127
Anexos

t=
128
Simbologa

SMBOLO SIGNIFICADO
A, B, C, Indican conjuntos
A, b, c, Indican elementos
e Pertenece a, es elemento de
e No pertenece a, no es igual a
| Tal que, dado que
= Es igual a, esta formado por
= No es igual a, es distinto a
Implica que
Equivale a, si y slo si
c Est incluido en, es subconjunto propio de
. No est incluido en, no es subconjunto de
_ Es subconjunto impropio de
O Conjunto Universal
C Conjunto Vaco
Operacin de Unin
Operacin de Interseccin
A; A Operacin de Complemento
A\B; A - B Operacin de Diferencia
( ) n A
Nmero de elementos del conjunto A
t=
129
t=
130
t=
131
Referencias Bibliogrficas

De la Barrera Frayre, Yolanda (2004). Probabilidad, Instituto Tecnolgico de Durango,
Durango, Dgo. Mxico.

Devore, Jay L (1988). Probabilidad y Estadstica para ingenieros y ciencias,
Internacional Thomson, Mxico, D. F.

Diccionario de la Lengua Espaola, Vigsima segunda edicin, internet 2005.

Glover Danny. Tele-Serie Los nmeros en la vida, Introduccin a la Probabilidad,
transmitida en el canal Edusat

Johnson, Richard A.(1997). Probabilidad y Estadstica para Ingenieros de Millar y
Freund, 5. Edicin. Prentice Hall, Mxico, D. F.

Lectus Vergara. Enciclopedia Universal del Saber. Las matemticas como herramienta
de la sociologa; Azar y Estadstica. Producido por CWD MEXICO, S.A. de
C.V. Mxico, direccin electrnica http://www.cwdmexico.com

Lipschutz, Seymour y Lipson, Marc Lars(2001). Teora y Problemas de Probabilidad,
Mc. Graw Hill, Colombia, 2. Edicin

Mrquez de Cant, Maria Jos (1991). Probabilidad y Estadstica para Ciencias
Qumico-Biolgicas, Preedicin, Ed. Mc Graw Hill, Mxico.

Moriarty, James (Guinista) y Chamberlan, David (productor) Serie Concepts
Matemticos. Probabilidad. Sucesos simples, Sucesos no tan simples,
Intento Bernoulli. Producido por TVONTARIO y transmitido en el canal
Edusat.

Montgomery, Douglas C. y Runger, George C(2002). Probabilidad y Estadstica
aplicada a la ingeniera, segunda edicin, Ed Limusa Wiley, Mxico

t=
132
Spiegel, Murray R. et al(2003). Probabilidad y Estadstica, Mc. Graw Hill. Mxico, D. F.

Torres Valles Maria de la Luz y Torres Alba Liborio (2004). Gua Didctica de
Probabilidad, Presentaciones Multimedia: Estadstica Descriptiva, Teora de
Conjuntos, Modelos Analticos Discretos y Modelos Analticos Continuos.
Durango, Mxico: Instituto Tecnolgico de Durango

Torres Valles Maria de la Luz y Torres Alba Liborio (2004). Gua Didctica de
Probabilidad, Autoevaluaciones Electrnicas: Estadstica Descriptiva,
Fundamentos de Probabilidad, Modelos Analticos Discretos y Modelos
Analticos Contnuos. Durango, Mxico: Instituto Tecnolgico de Durango.

Walpole, Ronald E., Myers, Raymond H. y Myers Sharon L. (1999). Probabilidad y
Estadstica para Ingenieros, Pearson Educacin. Mxico.

Você também pode gostar