Você está na página 1de 15

CAPITULO 5

Compilador: Hernando Castao Buitrago

CAPITULO 5
DISTRIBUCIONES DE PROBABILIDAD En la unidad anterior se ha estudiado la regla para asociar un valor de probabilidad a un suceso o un conjunto de sucesos. En esta unidad se ampliar el alcance del anlisis y se considerar todos los sucesos posibles en un estudio. Mediante una notacin ms formal se comenzar presentando uno de los conceptos ms importantes de la teora de la probabilidad que es el concepto de variable aleatoria. 1. VARIABLE ALEATORIA En las unidades anteriores se dio el nombre de variables a los distintos fenmenos o caractersticas que cambian de un individuo a otro en la poblacin o grupo bajo estudio, por ejemplo, sexo, edad, nivel de instruccin, ingresos, etc. Por otra parte, se dio una clasificacin de las variables en dos grandes grupos, cualitativas y cuantitativas, remarcando que la diferencia fundamental entre ellas es que, mientras los posibles valores de las variables cuantitativas surgen a partir de una medicin o conteo y por lo tanto ellas son naturalmente numricas, esto no sucede con las variables de tipo cualitativo, donde los resultados posibles son categoras. Sin embargo, para hacer uso de los mtodos de la Estadstica Inferencial, que constituyen una herramienta para la toma de decisiones, se requiere que los resultados posibles de la variable de inters sean de tipo numrico. De manera que se hace necesario convertir los resultados de una variable cualitativa a valores numricos. Para ello se define un nuevo concepto, tal vez uno de los ms importantes en la teora estadstica, y que es el concepto de variable aleatoria. Formalmente una variable aleatoria es una regla bien definida para asignar valores numricos a todos los resultados posibles de un fenmeno o caracterstica de inters. Resulta claro que si la variable es de tipo cuantitativo, la asignacin es directa, sin embargo, para las variables cualitativas se debe especificar con exactitud cual es el valor numrico que se asigna a cada una de las categoras. Por ejemplo, para la variable Nivel de Instruccin cuyas categoras son Analfabeto, Primario, Secundario, y Terciario o Universitario, se puede asignar los valores 0, 1, 2, 3, respectivamente. Si se observa el Sexo de una persona se podra asignar el valor 1 al sexo femenino y 2 al sexo masculino, o viceversa. Es decir, los nombres para designar las categoras de las variables cualitativas sern sustituidos aqu por nmeros. Las variables aleatorias se designan con las ltimas letras maysculas del abecedario (X, Y, Z, ...). Los valores especficos de una variable aleatoria se designan con letras minsculas y subndices, de manera tal que si la variable aleatoria se denot con X, sus valores se denotarn con x1, x2, x3, etc. Por ejemplo, la variable aleatoria X = Nivel de Instruccin cuyas categoras son las mencionadas arriba, se encuentra definida en un espacio muestral discreto y los valores posibles se definen como se muestra en la Figura 1: Observacin: La variable aleatoria as definida es de tipo discreto a pesar de que la caracterstica observada sea de tipo cualitativo. De esta manera, una variable aleatoria discreta puede definirse a travs de una caracterstica cualitativa o de una caracterstica cuantitativa discreta. Sin embargo, una variable aleatoria continua slo puede generarse a partir de una caracterstica de tipo continuo.

CAPITULO 5

Compilador: Hernando Castao Buitrago

CARACTERSTICA OBSERVADA NIVEL DE INSTRUCCIN ALFABETO PRIMARIA SEGUNDARIA UNIVERSITARIO

VARIABLE ALEATORIA X X1 = 0 X2 = 1 X3 = 2 X4 = 3

Figura 1: Ejemplo de una regla para generar una variable aleatoria a partir de una caracterstica observada. 2. DISTRIBUCIN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA

Una vez especificada la variable aleatoria discreta y sus resultados posibles, a cada uno de ellos se le puede asignar una probabilidad de ocurrencia. El conjunto de valores posibles de una variable aleatoria conjuntamente con sus respectivas probabilidades de ocurrencia recibe el nombre de distribucin de probabilidad. Ejemplo 1: Supongamos que 150 alumnos son asignados aleatoriamente a 4 docentes (A, B, C, D) de la siguiente manera: Tabla 4.1: N de alumnos asignados a cada docente. Docente No de alumnos 30 A 45 B 40 C 35 D Total 150 Este proceso se puede pensar como representado por un espacio muestral con 4 eventos posibles. Se puede definir en l una variable aleatoria discreta X que toma los valores x = 1, 2, 3 y 4 para los docentes A, B, C, y D respectivamente. Se tiene entonces un espacio muestral discreto y finito. La probabilidad que un alumno sea asignado a cualquiera de los docentes puede representarse con P(x). De esta manera, la probabilidad que un alumno sea asignado al docente x = 1 ser P(X=1) = P(1) = 30/150 = 0.20. Continuando de esta forma se puede determinar la distribucin de probabilidad de la variable aleatoria X (Tabla 2). En este ejemplo slo cuatro valores de X tienen probabilidad mayor que cero, cualquier otro valor tiene probabilidad cero, lo que est indicando que ellos son imposibles de presentarse. Por otra parte, siendo los valores 1, 2, 3, y 4 los nicos valores posibles de presentarse y ellos son mutuamente excluyentes y colectivamente exhaustivos, entonces la suma de sus respectivas probabilidades es igual a 1. Tabla 2: Distribucin de probabilidad de la variable aleatoria X Resultados posibles de Variable X P(X = x) la variable docente (x) 30/150 = 0.200 1 Docente A 45/150 = 0.300 2 Docente B 40/150 = 0.267 3 Docente C 35/150 = 0.233 4 Docente D Una representacin grfica de la distribucin de frecuencia de la variable X se presenta en la Figura 2

CAPITULO 5

Compilador: Hernando Castao Buitrago

Figura 2: Distribucin de probabilidad de la variable aleatoria X definida en la Tabla 2 En este caso la asignacin de probabilidades a los valores de la variable aleatoria surge de la determinacin de la frecuencia de presentacin de cada uno de ellos y luego del clculo de las frecuencias relativas las cuales representan las probabilidades empricas. Hay otras situaciones donde la asignacin de las probabilidades surge del conocimiento del fenmeno y de ciertas idealizaciones que deben hacerse para simplificar la asignacin de probabilidades (probabilidades tericas) a cada uno de los posibles resultados. Un ejemplo de este ltimo caso es el experimento de arrojar un dado y donde el inters se centra el nmero de puntos que muestra la cara. Es claro que la variable as definida es de tipo cuantitativo discreto, y por lo tanto define una variable aleatoria discreta que se denotar con Y. Para poder asignar probabilidades a la presentacin de cada cara es necesario suponer que el dado es perfecto, y entonces, bajo esta suposicin el fenmeno es tal que todas las caras tienen la misma probabilidad de presentarse. Luego, como hay 6 (seis) resultados posibles cada uno de ellos tendr una probabilidad 1/6 de presentarse. La distribucin de probabilidad de la variable aleatoria Y, que representa el nmero de puntos que tiene la cara visible del dado en el fenmeno se arroja un dado, se presenta en la Tabla 3 y Figura 3. Tabla 3: Distribucin de probabilidad de la variable aleatoria Y Valores de Y Probabilidad (y) P(Y = y) 1/6 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6

CAPITULO 5

Compilador: Hernando Castao Buitrago

Figura 3: Distribucin de probabilidad de la variable aleatoria X definida en la Tabla 3 Este tipo de distribuciones recibe el nombre de distribuciones uniformes discretas. En general se dice que una variable aleatoria discreta tiene distribucin uniforme si todos sus posibles valores tienen igual probabilidad de presentarse. La determinacin de una distribucin de probabilidad completa la descripcin de lo que se denomina el modelo probabilstico. La Figura 4 resume los pasos a seguir para la determinacin de este modelo. Primero se debe describir claramente el experimento o fenmeno de manera que pueda especificarse el espacio muestral correspondiente.

Especificar el experimento

Reconocer todos los resultados

Espacio muestral

Asignar nmeros a cada uno de los resultados


P(x)

Variable aleatoria

Determinar la probabilidad correspondiente a cada valor de x.

x Distribucin de probabilidad

Figura 4: Pasos para determinar el Modelo Probabilstico Luego se asocia la variable aleatoria con este espacio muestral, y a partir de ella es posible definir la distribucin de probabilidad a travs de algn procedimiento, obteniendo as el denominado modelo probabilstico. Es decir, un modelo probabilstico describe los posibles eventos asociados a algn fenmeno subyacente y las respectivas oportunidades de observarlos.

CAPITULO 5

Compilador: Hernando Castao Buitrago

2.1. FUNCIN DE DISTRIBUCIN DE PROBABILIDAD La distribucin de probabilidad de una variable aleatoria discreta puede surgir a travs de distintos procedimientos para asignar probabilidades a todos los valores posibles de una variable aleatoria, a saber:

Encontrar la frecuencia de presentacin de cada uno de los posibles valores de la variable aleatoria y luego calcular sus frecuencias relativas. De esta manera, las frecuencias relativas representarn las probabilidades empricas (ejemplo presentado en Tabla 2) A travs del conocimiento del fenmeno que tiene lugar (tirada de un dado), suponer un modelo terico razonable que establezca ciertas caractersticas y relaciones entre los eventos observables (todas las caras tienen la misma probabilidad de presentarse). Luego, bajo las condiciones supuestas, buscar un modelo matemtico que contemple tales caractersticas y usar tal modelo para hacer la asignacin de las probabilidades tericas (ejemplo de la Tabla 3, modelo de distribucin uniforme). Asignar probabilidades subjetivas que representan el grado de conviccin que tiene una persona respecto a la posibilidad que se presente cada uno de los resultados posibles.

En muchos casos resulta casi imposible buscar las frecuencias de presentacin de los valores de la variable aleatoria para luego calcular las frecuencias relativas. La tercera de las posibilidades (asignar probabilidades subjetivas), tiene el inconveniente de que podra llevar a discusiones interminables entre posiciones encontradas. Afortunadamente, en muchos casos se puede obviar estos inconvenientes observando si el fenmeno de inters tiene semejanzas con determinados tipos o familias de experimentos para los cuales existen reglas o expresiones matemticas que permiten obtener las probabilidades asociadas cada uno de los resultados. Para variables aleatorias discretas la expresin matemtica que define las probabilidades de sus posibles valores se denomina funcin de distribucin de probabilidad. Para el caso de una variable aleatoria con distribucin uniforme como la presentada en la Tabla 3, sus posibles valores son y1 = 1, y2 = 2, y3 = 3, y4 = 4, y5 = 5 e y6 = 6. La expresin matemtica que define la funcin de distribucin est dada por P(yi) = 1/6 para todo i = 1, , 6. En general, si el fenmeno de inters es tal que se puede definir una variable aleatoria X que tiene k resultados posibles y adems, es razonable suponer que todos ellos tienen igual probabilidad de presentarse, entonces, se dice que X sigue o tiene un modelo de distribucin uniforme, y su funcin de distribucin de probabilidad queda definida como: P[X = xi] = 1/k , para todo i = 1, , k. (1)

Se debe observar que el valor de k define completamente la distribucin uniforme. La existencia de una cantidad que define completamente de distribucin de probabilidad no es exclusiva de las distribuciones uniformes discretas, en efecto, se puede dar la definicin de otro concepto importante y es el concepto de parmetro de una distribucin. Definicin: Todas aquellas cantidades que definen completamente una distribucin de probabilidad reciben el nombre de parmetros de la distribucin. Cuando se dispone de la funcin de distribucin de probabilidad se puede calcular la probabilidad exacta de ocurrencia de cualquier resultado particular de la variable aleatoria y en tal caso se dice que se conoce la distribucin de probabilidad de tal variable aleatoria. Como veremos ms adelante una vez identificado el tipo de distribucin de

CAPITULO 5

Compilador: Hernando Castao Buitrago

una variable aleatoria basta conocer los parmetros asociadas a ella para que la distribucin de probabilidad quede completamente definida. Se han desarrollado distintos tipos de modelos matemticos para representar diferentes fenmenos discretos que ocurren en las ciencias sociales y naturales, en investigaciones mdicas y en los negocios. Los ms frecuentes de presentarse son los caracterizados por las denominadas distribucin binomial y distribucin Poisson. Antes de pasar a describir este tipo de distribuciones se requiere de algunas definiciones que permiten el clculo y la determinacin de algunas caractersticas importantes de cualquier variable aleatoria. 2.2. VALOR ESPERADO, VARIANZA Y DESVO ESTANDAR Recordemos que una manera de resumir la informacin de la distribucin de frecuencia de una variable cuantitativa es a travs de las medidas descriptivas, entre las cuales se encuentra la media aritmtica (medida de tendencia central) y la varianza (medida de variabilidad o dispersin). Puesto que las variables aleatorias son numricas se podra pensar en encontrar medidas similares para describir la distribucin de probabilidad de una variable aleatoria. Sin embargo, en este caso no se puede hablar de media observada o de una varianza observada, sino de la media o varianza que se esperara obtener (en promedio) para la variable aleatoria en consideracin. En efecto, estos valores se les da el nombre de esperanza o valores esperados. Generalmente para denotar el valor esperado se usa la letra E y a continuacin de ella se escribe entre corchetes el nombre de la variable aleatoria de inters o de alguna funcin de ella, por ejemplo E[X] representa el valor esperado de la variable X, y la expresin E[X2] representa el valor esperado de X elevada al cuadrado. El valor esperado de una variable aleatoria X, E[X], recibe el nombre particular de media de X y se designar con la letra griega . Para el caso de una variable aleatoria discreta = E[X] se obtiene multiplicando cada posible valor de X por su correspondiente probabilidad y luego sumando estos productos, simblicamente esto se escribe como: = E[X ] = x P( x ) (2)
todo x

Es importante observar la semejanza de m con la definicin de la media aritmtica, pero donde en la expresin de, P(x) se reemplaza por 1/n. Estas definiciones seran equivalentes si se considera a los n datos o valores observados de la caracterstica de inters como los valores posibles de una variable aleatoria X y se piensa que cada uno de ellos tiene igual probabilidad de ser seleccionados, es decir, cada una tiene probabilidad 1/n de presentarse, y de esta manera m = x . Esto hace que la media aritmtica reciba tambin el nombre de media muestral.
Ejemplo 2: Se quiere conocer el nmero promedio de das que un alumno de una institucin usa el libro AA que se puede solicitar en la biblioteca. La experiencia muestra que la distribucin de probabilidad de la variable aleatoria X = nmero de das que un alumno usa el libro AA viene dada por Tabla 4: Distribucin de probabilidad de la variable aleatoria X Valores de X Probabilidad P(X (x) = x) 0.03125 0 0.15625 1 0.31250 2 0.31250 3 0.15625 4 0.03125 5 Total 1.00000

CAPITULO 5

Compilador: Hernando Castao Buitrago

Usando la expresin (2) para el clculo se obtiene

= E[X] = 0.(0.03125) + 1.(0.15625) + 2.(0.31250) + 3.(0.31250) + 4.(0.15625) + 5.(0.03125) = E[X] = 2.5 das
Esto significa que en promedio cada alumno usa 2,5 das el libro AA. Como ya se mencion no slo es factible calcular la esperanza de una variable aleatoria simple sino tambin de cualquier funcin de una variable aleatoria, que representaremos por g(X); ejemplos de funciones son, g(X) = X3, g(X) = (X k)2, etc. Si X es una variable aleatoria discreta, entonces la expresin para el clculo de E[g(X)] es similar a la dada en (2) pero donde los sumandos x P(x) se reemplazan por g(x)P(x).

A partir de esta generalizacin se puede definir una medida de dispersin de la distribucin de probabilidad denominada la varianza de la variable aleatoria, denotada por V[X] o ms frecuentemente por 2.
Definicin: la varianza de una variable aleatoria X es el valor esperado del cuadrado de las desviaciones de los valores de X con respecto a la media , es decir, simblicamente (3) 2 = V[X] = E[(X - )2]

Puesto que la expresin que acompaa a E entre corchetes es una funcin de la variable aleatoria X, es decir, g(X) = (X - )2, por lo expresado en el prrafo anterior, si X es una variable aleatoria discreta, entonces 2 (x )2 P( x) 2 = V[X ] = E (X ) = (4)

todo x

Una medida de variabilidad ms frecuentemente usada en la prctica es el denominado desviacin estndar de la variable aleatoria y que se define como la raz cuadrada de la varianza, y se denota con , es decir, = V [X ] (5) Para ilustrar el uso de la expresin (4) y (5) se considera el ejemplo cuya distribucin de probabilidad se muestra en la Tabla 4. Puesto que la media en ese caso fue de = 2.5, la expresin de la varianza ser (x 2.5)2 P(x ) , reemplazando los valores de x y de P(x) y haciendo los clculos se tiene que la varianza 2 =
todoX

es 2 = 1.25 de donde el se obtiene, a travs de la expresin (5) que el desvo estndar es = 1.118 das, lo que indica que el tamao esperado de la dispersin de la distribucin de los das de uso del libro AA es de 1.118 das. Es importante recalcar que es conveniente verificar siempre que los valores de E[X] y V[X] sean razonables. Una regla prctica para llevar a cabo tal verificacin para la media es que ella debe ubicarse cercana al centro de gravedad de la distribucin, en caso contrario se debera revisar los clculos. Por otra parte, y si la distribucin es razonablemente simtrica y unimodal, entonces la probabilidad comprendida entre los valores debe ser prxima al valor 0.68, es decir, prxima al 68%, y la probabilidad comprendida entre 2 se debe aproximar al valor 0.95, es decir, al 95%. Usando los valores de y obtenidos con la distribucin de probabilidad del ejemplo dado en esta seccin se tiene: Intervalo = 2.5 1.118 = 1.382 a 3.618 2 = 2.5 2.236 = 0.264 a 4.736 Porcentaje de probabilidad en el intervalo P(2) + P(3) = 0.31250 + 0.31250 = 0.625 P(1) + P(2) + P(3) + P(4) = 0.15625 + 0.3125 + 0.3125 + 0.15625 = 0.9375

Lo que concuerda bastante bien con lo esperado a travs de la regla prctica.

CAPITULO 5

Compilador: Hernando Castao Buitrago

Ejercicio: Los montos de venta de un determinado negocio durante los 10 primeros das del mes fueron: 175, 188, 194, 215, 188, 196, 202, 194, 202, 196.

a) Si se supone que estos valores se presentan al azar, es decir tienen igual probabilidad de presentarse en cualquiera de los das, qu tipo de distribucin de probabilidad presenta la variable aleatoria definida como X = montos de ventas? b) Encuentre la media, varianza y desvo estndar de la variable aleatoria X c) Qu porcentaje de observaciones cae dentro de m s y de m 2 s? El concepto de valor esperado de una variable aleatoria ser frecuentemente usado a partir de ahora y por ello es necesario considerar algunas de sus propiedades ms importantes. Tales propiedades se enunciarn sin demostracin y ellas resultarn de mucha utilidad para el desarrollo de algunos temas en las prximas unidades. Regla 1 Regla 2 Regla 3 Regla 4 Regla 5 Regla 6 E[k] = k V[k] = 0 E[kX] = kE[X] V[kX] = k2V[X] E[k bX] = k bE[X] V[k bX] = b2V[X]
El valor esperado de una constante es la misma constante La varianza de una constante es cero. El valor esperado del producto de una constante por una variable es igual al producto de la constante por el valor esperado de la variable. La varianza del producto de una constante por una variable es igual al producto del cuadrado de la constante por la varianza de la variable. El valor esperado de (k + bX)[o de (k bX)] es igual a k ms (o menos) b por el valor esperado de X. La varianza de (k + bX)[o de (k bX)] es igual a b2 por la varianza de X.

3. DISTRIBUCIN BINOMIAL La distribucin de probabilidad binomial es una distribucin de probabilidad discreta, que es extremadamente til para describir muchos fenmenos. Ella se genera a partir de n repeticiones de una experiencia, denominada experiencia de Bernioulli, la cual consiste en observar un fenmeno que puede tener slo dos resultados posibles mutuamente excluyentes y colectivamente exhaustivos, usualmente denominados xito (se presenta caracterstica de inters) y fracaso (no se presenta). Ejemplos de este tipo de experiencias son: Se arroja una moneda y se observa si sali cara (xito) o sali sello (fracaso). Se seleccionan un individuo mayor de 25 aos y se observa si tiene estudios universitarios (xito) o no (fracaso). Se selecciona un producto y se observa si es defectuoso (xito) o no (fracaso).

La variable aleatoria asociada a cada experiencia de Bernioulli viene dada por:


xito Fracaso Y=1 Y=0

Observemos que si la probabilidad de xito la denotamos con p, es decir, si P(Y = 1) = p, entonces la probabilidad de fracaso P(Y = 0) = 1 p.

CAPITULO 5

Compilador: Hernando Castao Buitrago

Supongamos ahora que se repite n veces una experiencia de Bernoulli tal que se cumplan las siguientes condiciones:
1. La probabilidad de xito p se mantiene constante para cada experiencia. 2. El resultado de cada repeticin de la experiencia es independiente del resultado de cualquier otro.

Si a partir de esta experiencia se define una variable aleatoria X que cuenta el nmero de xitos obtenidos en las n repeticiones, entonces se dice que X tiene distribucin binomial. Para los tres ejemplos de experiencia de Bernoulli dados arriba, si se hace n repeticiones de las mismas tales que se cumplan las condiciones 1 y 2 enunciadas se puede definir las siguientes variables aleatorias que tienen distribucin binomial:
X = nmero de caras en n tiradas de una moneda X = nmero de personas mayores de 25 aos con estudios universitarios entre n personas seleccionadas aleatoriamente. X = nmero de productos defectuosos entre n productos seleccionados aleatoriamente. Observaciones: 1. Se debe observar que X puede tomar cualquier valor entre 0 (ningn xito) y n (todos xitos). 2. A partir de la primera observacin se puede inferir que X cambia si cambia n, por lo tanto, n es una constante para una dada variable aleatoria con distribucin binomial. 3. Por la primera condicin, la probabilidad de xito p no debe cambiar en las n repeticiones, por lo tanto p es tambin una constante para una dada variable aleatoria con distribucin binomial. 4. Los valores de n y p definen completamente la distribucin de probabilidad de una variable aleatoria con distribucin binomial.

A partir de la observacin 4 se concluye que los parmetros de la distribucin binomial son las cantidades: n = nmero de repeticiones de una experiencia de Bernoulli, p = probabilidad de xito en cada experiencia de Bernoulli. La distribucin binomial ha gozado de numerosas aplicaciones en la prctica. Las preguntas que se podran responder usando la distribucin binomial en las experiencias definidas anteriormente pueden ser:

Cul es la probabilidad que salgan 3 caras en cinco tiradas de una moneda? Cul es la probabilidad de que en una muestra de 100 individuos mayores de 25 aos tenga 15 con estudios universitarios si la proporcin de personas mayores de 25 aos con estudios universitarios en la poblacin es del 10%? Cul es la probabilidad de que en una muestra de 20 vacunas del mismo tipo, ninguna est vencida, si se sabe que el 8% del stock existente estn vencidas?

Qu suposiciones deben hacer en cada uno de los casos enunciados para poder usar la distribucin binomial para el clculo de las probabilidades?

Para responder a las preguntas planteadas se necesita de la expresin matemtica que defina la funcin de distribucin de probabilidad binomial. Es claro que si n y p son los parmetros de la distribucin, es decir, sus valores definen completamente la distribucin de probabilidad de una variable aleatoria con distribucin binomial, ellos deben aparecer el la expresin de la funcin de distribucin. En efecto, si el inters es conocer la probabilidad de obtener k xitos, donde k toma valores entre 0 y n, entonces ella se puede obtener a travs de la siguiente expresin matemtica:

CAPITULO 5

Compilador: Hernando Castao Buitrago

10

P[X = k / n, p] =

n! n k p k (1 p ) k! (n k )!

(6)

La interpretacin del primer miembro de la igualdad es la siguiente:


La probabilidad de obtener k xitos en n repeticiones, sabiendo que la probabilidad de xito es p

Para responder a cada pregunta formulada anteriormente y bajo la suposicin que la variable aleatoria definida tiene distribucin binomial, es decir se cumplen las condiciones 1 y 2 ya enunciadas, primero es necesario identificar en el enunciado los parmetros de la distribucin y luego el valor de k a fin de usar la expresin (6) y de esta manera responder a la cuestin planteada:

En el caso de la tirada de una moneda 5 veces, es claro que n = 5. Para establecer el valor de p debemos suponer que la moneda es perfecta y como consecuencia la probabilidad de xito (cara) es igual a la probabilidad de fracaso (sello) y por lo tanto p = 0.5. En este caso, el inters es conocer la probabilidad de obtener 3 caras por lo tanto k = 3. Reemplazando en la expresin (6) se obtiene la respuesta a la pregunta planteada. P[X = 3| 5, 0.5] = 0.3125. Muchos software estadsticos permiten el clculo ingresando los valores de n, p y k. En el segundo ejemplo n = 100, p = 0.10 y k = 15, entonces, P[X = 15 | 100, 0.10] = 0.032683. En el tercer ejemplo n = 20, p = 0.08 y k = 0, entonces, P[X = 0 | 20, 0.08] = 0.189.

Puesto que los parmetros de la distribucin binomial son n y p, se esperara que la media y la varianza de la distribucin se puedan expresar en trminos de estas cantidades, en efecto, se puede demostrar con alguna lgebra que: = E[X binomial ] = np
2 = V[X binomial ] = np(1 p ) = np(1 p )

(7)

Ejercicio: Las encuestas indican que slo el 40% de las empresas del pas realiza capacitacin a sus empleados. Supngase que se selecciona al azar 5 empresas. Si la proporcin real de empresas que capacitan a sus empleados es lo que indican las encuestas a) Cul es la probabilidad que en la muestra haya exactamente 3 empresas que capacitaron a sus empleados? b) Cuntas empresas que no capacitan a sus empleados esperara que haya en la muestra? c) Si en la muestra no tuviera empresas que capacitan a sus empleados, con qu probabilidad podra ocurrir esta situacin?, qu pensara sobre la muestra o sobre la distribucin de probabilidad que us para hacer este clculo de probabilidad? 4. DISTRIBUCIN POISSON Otra distribucin discreta importante es la de Poisson, que actualmente tiene una gran cantidad de aplicaciones. Los siguientes son algunos ejemplos de fenmenos con distribucin Piosson:

Nmero de llegadas por unidad de tiempo de vehculos en los puestos de peaje, de clientes o solicitudes de servicio a una empresa, de aviones a una pista de aterrizaje. Nmero de llamadas que entran por hora a un conmutador telefnico.

CAPITULO 5

Compilador: Hernando Castao Buitrago

11

Nmero manchas por metro cuadrado de tela.

En cada uno de los ejemplos anteriores los fenmenos de inters son tales que se puede observar eventos discretos (llegadas de vehculos, clientes o aviones; llamadas telefnicas; manchas) en un intervalo continuo (de tiempo, longitud, rea, etc.). Si adems el fenmeno se produce de tal forma que si se acorta el intervalo de manera suficiente para que se cumplan las siguientes condiciones: 1. La probabilidad de observar exactamente un xito es estable. 2. La probabilidad de observar ms de un xito en el intervalo es cero. 3. La probabilidad de ocurrencia de un xito en cualquier intervalo es independiente de la probabilidad de observar un xito en cualquier otro intervalo. Entonces se dice que el fenmeno responde a un proceso Piosson. Para comprender mejor esta definicin, suponga que se observa las llegadas de clientes a un supermercado entre las 10 y 11 hs. y durante ese intervalo de tiempo llegan 360 clientes. A partir de este fenmeno observado se analizar si se cumplen las condiciones para que l sea un proceso Poisson. En efecto, a continuacin se presenta un resumen de cmo deben interpretarse las condiciones para el ejemplo considerado: Suposiciones 1. Es posible dividir el intervalo considerado en pequeos subintervalos. 2. La probabilidad de ocurrencia permanece constante a lo largo de los intervalos. 3. La probabilidad de dos o ms ocurrencias en un subintervalo es suficientemente pequea como para ignorarla. 4. Las ocurrencias son independientes. Ejemplos 1. Puede dividirse la hora en subintervalos de un segundo cada uno. 2. Se elige una hora en la que es razonable suponer que el flujo de clientes es constante 3. Es imposible que dos personas lleguen simultneamente (o sea en el mismo segundo) 4. Las llegadas de un cliente es independiente de la llegada de cualquier otro.

De las cuatro suposiciones la primera y tercera son suficientemente generales como para que sea posible que se cumplan en muchas situaciones que se refieren a la observacin de eventos aleatorios en perodos de tiempo o en unidades dadas de rea, longitud, capacidad, etc. Sin embargo, es mucho menos posible que se cumplan la suposicin de que las ocurrencias son independientes y constante a lo largo del intervalo, por ello en cada caso se hace necesaria una verificacin de las condiciones para poder aplicar esta distribucin. Si en los ejemplos mencionados se define la variable aleatoria discreta X = nmero de xitos (eventos) por unidad (es decir, por intervalo de tiempo, longitud, rea, etc.), y en ellos se verifican las condiciones para que pueda considerarse un proceso Poisson, entonces se dice que X tiene distribucin de probabilidad Poisson. Por otra parte, el nico parmetro necesario para caracterizar esta distribucin es el promedio o nmero esperados de xitos en el intervalo, tambin denominado tasa media de ocurrencia de los sucesos por cualquier unidad de tiempo (rea, longitud, etc.), y que se denotar con la letra griega (lambda). En el caso del ejemplo del supermercado, la tasa media de ocurrencia por segundo ser de = 60/3600 seg. = 0.1 llegadas por segundo. Sin embargo si la pregunta se refiere al numero esperado de clientes en un minuto, entonces = 360/60 min. = 6 llegadas por minuto. Es decir para el mismo fenmeno, depender de la unidad de tiempo (rea, longitud, etc.) que se considere. La expresin matemtica que define la funcin de distribucin de probabilidad Poisson est dada por:

CAPITULO 5

Compilador: Hernando Castao Buitrago

12

P[X = k / ] =

l k k!

(8)

donde el primer miembro se interpreta como la probabilidad que se observen k sucesos dado que se esperan observar sucesos en un dado intervalo.
Observaciones: 1. Cada vez que se especifica el parmetro , puede generarse una distribucin de probabilidad Poisson especfica. 2. Una distribucin Poisson estar sesgada a derecha cuando es pequea y se aproximar a la simetra (con un pico en el centro) al crecer . 3. Puesto que la distribucin Poisson tiene solamente un parmetro (), entonces la media y la varianza de la distribucin deben ser funciones de esta parmetro, en efecto:

= E[X Poisson ] = =

2 = V[X Poisson ] =

(9)

Ejemplo: Se desea estudiar la llegada de clientes a las cajas de un banco. Si se piensa que ellas pueden seguir una distribucin Poisson lo primero que debe hacerse es verificar si se cumplen las cuatro suposiciones bsicas, especialmente la 2 (probabilidad constante) y la 4 (independencia). A partir de este paso se puede elegir el perodo durante el cual se cumplen razonablemente tales suposiciones. Despus de una cuidadosa investigacin se elige el intervalo comprendido entre las 9 y las 11 horas cono apropiado. El paso siguiente consiste en hacer la recoleccin de las observaciones respecto al nmero de llegadas en ese perodo. En lugar de contar el nmero de clientes que llega en todos los perodos de dos horas se decide registrar las llegadas en cada de 100 perodos de un minuto seleccionados aleatoriamente entre los 9 y las 11 horas durante una semana. Este procedimiento es razonable ya que si se admite que las llegadas son constantes durante dos horas, no importa la unidad que se use para obtener las observaciones. De las expresiones dadas en (9) se puede ver que para la distribucin Poisson y 2 son iguales, por lo tanto, una vez que se tiene los datos, lo primero que debe verificarse es si los valores de y 2 calculados a partir de ellos coinciden o son muy prximos. En efecto, se encontr que = 3.79 y y 2 = 3.90. Si bien tericamente, ambos parmetros deben coincidir, se debe tener en cuenta que ellos fueron calculados a partir de una muestra de perodos y por lo tanto es de esperar que ellos no sean exactamente iguales. 1. Suponga que en el ejemplo anterior se considera que = 3.8. Usando la expresin, calcule la probabilidad que en un determinado minuto se produzcan exactamente dos llegadas. 2. Determine qu porcentaje de la distribucin Poisson est comprendido en los intervalos y 2. Se parecen estos valores a los indicados en la regla emprica para la desviacin estndar? NOTA COMPLEMENTARIA La distribucin de probabilidad de Poisson proporciona una aproximacin sencilla, precisa, fcil de calcular, a las probabilidades binomiales cuando n es muy grande y = np es muy pequea, de preferencia con np < 7. En la conferencia 11 se dar una aproximacin adecuada para valores ms grandes de = np.

CAPITULO 5

Compilador: Hernando Castao Buitrago

13

Ejemplo: Suponga que una compaa de seguros de vida asegura a 5000 hombres de 42 aos de edad. Si los estudios actuariales muestran que la probabilidad de que un hombre de 42 aos mera en un cierto ao es de 0.001, calcule la probabilidad exacta de que la compaa pague x = 4 demandas en un ao dado. Solucin: La probabilidad exacta est dada por la distribucin binomial como 5000! 5000 4 P(x = 4 ) = P(4 ) = 0.0014 (1 0.001) 4!(5000 4 )!

Para realizar el clculo propuesto no existe una tabla especfica y la calculadora tampoco lo realiza, pero se puede la distribucin de Poisson para tener una buena aproximacin a P(x = 4). Al calcular = np = (5000)(0.001) = 5 y sustituirla en la frmula para la distribucin de probabilidad de Poisson, se tiene
P(4 ) 4 e 5 4 e 5 625 0.006738 = = = 0.175 4! 4! 24

EJERCICIOS 1. Sea X una variable aleatoria discreta con P(X = 0) = 0.25, P(X = 1) = 0.125, P(X = 2) = 0.125 y P(X = 3) = 0.50. Graficar la funcin de frecuencia y la funcin de distribucin acumulada de X.

2. La siguiente tabla muestra la funcin de distribucin acumulada de una variable aleatoria discreta. Hallar la funcin de frecuencia.
0 0.1 0.3 0.7 0.8 1 si x < 1 si 1 x < 2 si 2 x < 3 si 3 x < 4 si 4 x < 5 si 5 x

F(X) =

3. En una tienda de telas, un promedio de 12 personas por hora le hacen preguntas a un decorador. Cul ser la probabilidad de que tres o ms personas se acerquen al decorador en un perodo de 10 minutos? 4. Durante un ao en particular, el 30% de las acciones ordinarias inscritas en la Bolsa de Valores permaneci sin cambio o redujo su valor de mercado, mientras el 70% restante elevaron su mercado. Al inicio del ao, un servicio de consultora accionaria eligi 10 emisiones de acciones como especialmente recomendables. Si las 10 emisiones representan una seleccin aleatoria, cul es la probabilidad de que al menos ocho emisiones hayan elevado su valor de mercado? 5. Un promedio de un barco llega a cierto muelle uno de cada dos das. Cul es la probabilidad de que dos o ms barcos lleguen a ese punto en un da aleatoriamente seleccionado? 6. Suponga que la tasa de mortalidad para cierta enfermedad es de 0.10 y que la contraen 10 personas de la comunidad. Cul es la probabilidad de que el 50% muera? 7. Un promedio de seis personas por hora hacen uso de una caja bancaria automtica durante el horario pico de compras en una tienda departamental. Cul es la probabilidad de que ninguna persona la use durante un intervalo de 10 minutos?

CAPITULO 5

Compilador: Hernando Castao Buitrago

14

8. Supongamos que 40% de los empleados de una gran empresa estn a favor de la representacin sindical, y que se contacta a una muestra aleatoria de 10 empleados en solicitud de una respuesta annima. Cul es la probabilidad de que la mayora de los interrogados estn a favor de la representacin sindical? 9. Supongamos que el manuscrito de un libro de texto tiene un total de 50 errores, o errores de dedo, en las 500 pginas del material y que stos se distribuyen aleatoriamente a lo largo del texto. Cul es la probabilidad de que un capitulo de 30 pginas tenga dos o ms errores? 10. Tras su ensamble en una planta manufacturera, se encuentra que slo una computadora personal por millar (1000) es defectuosa, y que las PC defectuosas se distribuyen aleatoriamente en la corrida de produccin. Cul es la probabilidad de que un embarque de 100 PC no incluya al menos un computador defectuoso? 11. De entre 2000 familias con 4 hijos, cuntas cabe esperar que: a) Tengan al menos un varn? b) No tengan mujeres? 12. Si la probabilidad de que un individuo sufra una reaccin negativa ante una inyeccin de cierto suero es 0.001, hallar la probabilidad de que entre 2000 individuos ms de dos de ellos reaccione negativamente. 13. Un agente de seguros contrata 5 plizas con personas de la misma edad y de buena salud. Segn las tablas en uso, la probabilidad de que un hombre de esa edad est vivo dentro de treinta aos es 2/3. Hallar la probabilidad de que dentro de 30 aos vivan: a) Los cinco. b) Al menos tres c) Slo dos d) Al menos uno 14. Basndose en la experiencia anterior, 2% de las cuentas telefnicas enviadas a casas ubicadas en las afueras de las ciudades son incorrectas. Si se selecciona una muestra de 20 cuentas, encuentre la probabilidad de que al menos una cuenta sea incorrecta. Haga esto usando dos distribuciones de probabilidad (la Binomial y la Poisson) y compare y explique brevemente sus resultados. 15. Abe Lincoln dijo que no puedes complacer a todos todo el tiempo. Suponga que usted pueda complacer a cada individuo nueve veces de diez y que hay ocho personas que desea complacer. a) Calcule 1) la probabilidad que los complacer a todos. 2) La probabilidad de que complacer al menos a seis de ellos. 3) La probabilidad de que complacer a cuatro o menos. b) Cul es el nmero esperado de personas que complacer? Qu tan factible es que complazca exactamente ese nmero? c) Cul es la desviacin estndar del nmero de personas que complacer?. De sta y del valor esperado, encuentre aproximadamente cunta gente complacer al menos tres cuartas partes del tiempo 16. Los registros proporcionados por el presidente de recursos humanos de un gran hospital urbano indica que, en cualquier da de trabajo dado, 10% de la fuerza de trabajo no clnica (es decir, cocina, mantenimiento y consejera, electricidad y plomera, seguridad, correo, lavanderas, oficinas y administracin) falta al trabajo. Cul es la probabilidad de que en una muestra aleatoria de 10trabajadores no clnicos a) exactamente uno faltar hoy? b) Al menos dos faltarn?

CAPITULO 5

Compilador: Hernando Castao Buitrago

15

17. Una compaa de exploracin de gas natural promedia 4 descubrimientos (es decir, se encuentra gas natural) por 100 pozos perforados. Si se deben perforar 20 pozos , cul es la probabilidad de que a) Se haga exactamente un descubrimiento? b) Se hagan al menos dos descubrimientos?