Você está na página 1de 17

Modelos de probabilidad continuos.

La distribucin normal

Modelos de probabilidad continuos


Funcin de densidad de probabilidad de una variable aleatoria
continua
Cuando una variable aleatoria es continua no tiene sentido el clculo de las probabilidades de
los puntos individuales. En este caso se habla de probabilidad por intervalos, es decir, la
probabilidad de que el valor de la variable aleatoria est entre los de un intervalo dado. Para
ello se define la funcin de densidad de probabilidad.
La funcin de densidad de probabilidad de una variable aleatoria continua es una funcin f
integrable que verifica las dos propiedades siguientes:
f(x) 0 x R

f x dx 1

Dada la variable aleatoria continua X cuya funcin de densidad de probabilidad es f, la


probabilidad de que X tome un valor comprendido entre a y b se calcula como:
P a X b f x dx
b

Al ser f una funcin integrable la probabilidad de un punto es nula:


P X a P a X a f x dx 0
a

De lo anterior se deduce que, al calcular la probabilidad de un intervalo, el resultado no vara


si este es abierto o cerrado por cualquiera de sus extremos:
P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b)
Se puede emplear la funcin de densidad de probabilidad para calcular los parmetros
estadsticos de una variable aleatoria continua X:

E X xf x dx

Var X x 2 f x dx xf x dx

Para nosotros la funcin de densidad de probabilidad es el lmite del polgono de frecuencias


(recordar los histogramas vistos en el tema de estadstica descriptiva), cuando el nmero de
intervalos tiende a infinito y la amplitud de los mismos tiende a 0, eligiendo la constante de
proporcionalidad de manera que el rea encerrada por dicho polgono sea igual a la unidad
(recordamos que en los histogramas el rea no es necesariamente igual a la frecuencia, sino
proporcional a la misma, por lo que podemos multiplicar la altura de todos los rectngulos por
una constante arbitraria, siempre teniendo la precaucin de elegir la misma constante para
todos ellos).
En un polgono de frecuencias como el descrito, correspondiente a un histograma muy
detallado, la altura correspondiente a un punto es un indicador de cmo de probable es
obtener valores de la variable aleatoria alrededor de dicho punto, es decir, a un valor x1 de la
variable aleatoria le corresponder una mayor altura en el polgono de frecuencias que a otro
punto x2 cuando la probabilidad de obtener un resultado prximo a x1 sea mayor que la
probabilidad de obtener un resultado prximo a x2. Por ejemplo, si tenemos la funcin de
densidad de probabilidad correspondiente a la variable aleatoria continua X = estatura de los
varones de 20 aos de la Comunidad Valenciana, dicha funcin proporcionar un valor ms
elevado para x1 = 170 cm que para x2 = 190 cm.
1

Modelos de probabilidad continuos. La distribucin normal

Funcin de distribucin de probabilidad de una variable aleatoria


continua
La funcin de distribucin, F, de una variable aleatoria continua X, se define como:
F t P X t f x dx
t

A partir de la definicin de la funcin de distribucin es fcil comprobar que:


P X a, b Pa X b F b F a

Adems se puede comprobar que la funcin de densidad de probabilidad de una variable


aleatoria continua es igual a la derivada de la funcin de distribucin, es decir: f(t) = F(t).
De entre todos los modelos de probabilidad continuos, en este curso estudiaremos slo dos: el
modelo uniforme, que se emplear para dar a conocer los principales conceptos de los
modelos continuos, por ser el modelo ms sencillo, y el modelo normal, por su amplia
aplicabilidad a problemas reales.

Distribucin uniforme o rectangular


Una variable aleatoria continua se dice que es uniforme con extremos a y b cuando puede
tomar cualquier valor en el intervalo [a, b], sin que existan zonas privilegiadas, es decir, la
probabilidad de obtener un valor en un subintervalo de [a, b] es proporcional a la anchura del
mismo. Para entender mejor la distribucin uniforme pondremos un ejemplo ilustrativo:
Ejemplo
Un profesor inquieto, sensible a las continuas quejas de sus compaeros, en relacin al tiempo
que pierden corrigiendo los exmenes de sus alumnos, inventa un ingenioso Dispositivo
Automtico de Correccin de Exmenes, al que llama DACE que, bsicamente, consiste en
una ruleta con una escala muy detallada en su permetro, con notas que van desde el 2 hasta el
9, de manera que a cada alumno le asigna como nota el punto de dicha escala en el que se para
la ruleta despus de hacerla girar. Se debe notar que este procedimiento es, con diferencia,
mucho ms sencillo que el sistema tradicional, consistente en leer detalladamente las
respuestas de los alumnos, asignando una puntuacin a cada pregunta, en funcin del grado de
acierto de la respuesta. El profesor, que no es tonto, advierte que el sistema DACE tiene
algunos inconvenientes, aunque considera que los beneficios son netamente superiores y
decide emplearlo de manera generalizada.
Imaginemos que el profesor tiene una gran habilidad manual y
consigue construir el sistema DACE con una gran precisin, es decir,
que dispone de una escala subdividida en una cantidad
virtualmente
infinita
de
subdivisiones
perfectamente
equiespaciadas en un permetro perfectamente circular que gira
alrededor de un eje perfectamente centrado y debidamente lubricado.
Si el profesor pone a prueba su dispositivo un nmero muy elevado de
veces, para disponer de una gran cantidad de datos, a partir de estos datos
puede construir un histograma con muchos rectngulos. A partir del histograma podr,
adems, construir el polgono de frecuencias correspondiente, qu aspecto tendr dicho
polgono de frecuencias?
Parece sencillo deducir que los rectngulos que componen el histograma sern todos de la
misma altura, es decir, no habr zonas privilegiadas cuya probabilidad de ocurrencia sea
2

Modelos de probabilidad continuos. La distribucin normal


mayor que la correspondiente a otras zonas y esto implica que, necesariamente, el polgono de
frecuencias ser horizontal, segn se muestra en la siguiente figura:

10

Polgono de frecuencias terico para la puntuacin obtenida con el dispositivo DACE.

Como en los histogramas el rea de los rectngulos es proporcional a su frecuencia, podemos


elegir la constante de proporcionalidad de manera que el rea total encerrada por el polgono
de frecuencias sea exactamente igual a 1. En el caso del dispositivo DACE resultar:
h = 1/(92) = 1/7.
Para calcular la probabilidad de aprobar la asignatura con el sistema DACE, habra que
calcular qu parte del rea total corresponde a valores de la variable que implican el aprobado,
es decir, a notas por encima del 5. En este caso sera P(Aprobar) = (95)/(92) = 4/7.
Una eventual mayor altura en el polgono de frecuencias para un valor de la variable x1 que
para otro valor x2 implicara una mayor frecuencia en un entorno de x1 que en un entorno de
x2, es decir, los datos estaran ms apretados alrededor de x1 que alrededor de x2, con lo que
un nombre adecuado para el lmite del polgono de frecuencias, cuando el nmero de
intervalos del histograma tiende a infinito, es funcin de densidad de probabilidad.
En nuestro caso diremos que la variable aleatoria X = nota obtenida con el dispositivo DACE,
es una variable uniforme con parmetros a = 2 y b = 9 (los parmetros de un modelo de
distribucin de probabilidad son valores que es preciso conocer para especificar el modelo
concreto y de estos valores dependern las caractersticas de la variable aleatoria: rango,
media, varianza, ). En el caso del modelo uniforme que nos ocupa es claro que los
parmetros deben ser los extremos a y b entre los cuales estarn todos los valores obtenidos
con el dispositivo.
Para indicar que una variable aleatoria se distribuye segn el modelo de distribucin de
probabilidad uniforme con parmetros a y b se representa: X ~ U a, b el rango de X es el
intervalo [a, b] y se puede demostrar que la expresin que relaciona la media y la varianza de
X con los parmetros de la distribucin es: a b 2 y 2 b a 2 12 , respectivamente.
En el caso del dispositivo DACE la nota media terica es 5,50 y la varianza terica es,
aproximadamente, 4,08.

1
1

para 2 x 9
92 7
x2
La funcin de distribucin en este caso sera: F x P X x
(el rea del rectngulo
92
a la izquierda de x, para x entre 2 y 9).

La funcin de densidad de probabilidad sera, en este caso: f x

Generalizando el caso del ejemplo anterior, se dice que una variable aleatoria X posee una
distribucin uniforme en el intervalo [a, b] y se escribe X ~ U(a, b) cuando su funcin de
densidad de probabilidad es:

Modelos de probabilidad continuos. La distribucin normal

1
para a x b
ba
Consecuentemente con lo anterior, la funcin de distribucin correspondiente a una variable
0
xa
x a
a xb
aleatoria uniforme en el intervalo [a, b] ser: F x
b a
xb
1
f x

Segn ya hemos visto, la media y la varianza correspondientes a la distribucin uniforme son:


2

ab
b a
2
y X
X~U(a, b) X
2
12
Ejemplo: El profesor tiene 1000 alumnos y, despus de corregir cuidadosamente el examen,
con el dispositivo DACE, dispone de 1000 notas, a partir de las que construye el histograma
correspondiente, segn se muestra en la siguiente figura:

Se observa que el resultado es el esperado, con un polgono de frecuencias prcticamente


horizontal, con media 5,5 y con varianza 2 4,08 .
Ejemplo: para X ~ U(1, 5) la funcin de densidad de probabilidad se representara como
0,5
0,4
0,3
0,2
0,1
0
-2

-1

mientras que la funcin de distribucin se puede representar como:


1,2
1
0,8
0,6
0,4
0,2
0
-2

-1

1 5
5 1
2
En este caso la media y la varianza seran: X
3 y X
1,3
2
12

Modelos de probabilidad continuos. La distribucin normal


La distribucin uniforme implica que la probabilidad de que al hacer un experimento aleatorio
el valor de X est en un cierto subintervalo del intervalo [a, b] depende nicamente de la
longitud del mismo, no de su posicin, por ejemplo, para X~U(a = 2; b = 9), las siguientes
probabilidades coincidirn: P(3X5) = P(6X8) = P(4X6), ya que en los tres casos la
amplitud del intervalo es 2.
Ejemplo
Si consideramos X~U(a = 1; b = 1), se pide:
a. Media, Varianza y Desviacin Tpica de X.

b a 2 1 12 0,3 ; 2 0,3 0,57735


a b 1 1

0 ; X2
X
X
12
12
2
2

b. Las probabilidades:
b.1 P(X 0,75) = F(0,75) =

0,75 ( 1)
0,875
1 ( 1)

b.2 P(X 1,5) = F(1,5) = 1


b.3 P(X 0,25) = F(0,25) =

0,25 ( 1)
0,375
1 ( 1)

b.4 P(X 1,75) = F(1,75) = 0


b.5 P(0,8 X 0,3) = F(0,3) F(0,8) =

0,3 1 0,8 1

0,65 0,1 0,55


1 1
1 1

Modelos de probabilidad continuos. La distribucin normal

Distribucin Normal
Siguiendo con el ejemplo del dispositivo DACE, algunos alumnos se quejan, porque
consideran que no es justo jugarse el 100% de la calificacin en un nico examen (si ellos
supieran), y piden una evaluacin continua, haciendo referencias imprecisas a Bolonia. Al
profesor lo nico que le interesa de Bolonia es la mortadela, pero prefiere no llamar
demasiado la atencin sobre su avanzada gestin de las calificaciones, por lo que decide
atender las demandas de los alumnos, realizando 5 exmenes, que sern debidamente
corregidos con el dispositivo DACE, de manera que la nota final de cada alumnos ser la
media de las 5 notas.
Qu aspecto tendrn el histograma y el polgono de frecuencias de las notas finales?.
Crees que es igual de probable tener una nota entre 2 y 3 que entre 5 y 6?.
Qu tiene que pasar para que un alumno tenga una nota entre 2 y 3?
El profesor examina a sus 1000 alumnos 5 veces, y promedia las notas obtenidas con el
dispositivo DACE, con lo que dispone de 1000 notas medias, a partir de las que construye el
histograma correspondiente, segn se muestra en la siguiente figura:

La forma de campana, centrada en 5,5, parece indicar que la nota media no cambia, pero
disminuye la dispersin, ya que ahora son ms frecuentes las calificaciones alrededor de 5,5
que las calificaciones ms lejanas de 5,5. Para comprobarlo, el profesor calcula la media y la
varianza de las 1000 notas finales y obtiene los siguientes resultados: 5,5 y 2 0,82 , es
decir, la media coincide con la que se obtena con un nico examen, pero la varianza es 5
veces ms pequea (queda dividida por 5).
El profesor decide probar a poner 20 exmenes a cada alumno, en lugar de 5, y obtiene el
siguiente histograma para la nota final:

Lo curioso ahora es que, si bien la nota media sigue siendo la misma, la varianza ha vuelto a
reducirse, siendo ahora 2 0,204 , es decir, 20 veces ms pequea que la original.
Lo que el profesor acaba de descubrir es que dada una variable aleatoria X, con media X y
varianza X2 , si consideramos la variable X X 1 X 2 X n n , es decir, la media muestral

Modelos de probabilidad continuos. La distribucin normal


de una muestra formada por n observaciones, la nueva variable tiene la misma media que X,
es decir, X X , pero la varianza queda dividida por n, es decir, X2 X2 n .
Es claro que la media muestral de n calificaciones uniformes no es uniforme, lo cual se
evidencia en que el polgono de frecuencias resultante no es horizontal, sino que adopta una
forma de campana, con lo que los valores alrededor de la media son ms frecuentes que los
alejados de la misma.
Este fenmeno, por el cual la media muestral de una variable aleatoria se distribuye en forma
de campana, aunque la distribucin de la variable original sea muy diferente, se repite para
cualquier otra variable aleatoria, siempre que el tamao de las muestras sea lo suficientemente
grande, y se conoce como Teorema del Lmite Central.
La distribucin en forma de campana a la que se llega promediando muestras de cualquier
variable aleatoria se denomina Distribucin Normal.
http://www.disfrutalasmatematicas.com/datos/quincunce.html

La distribucin normal es la ms utilizada en la modelizacin de experimentos aleatorios. Esta


distribucin puede obtenerse al considerar el modelo bsico de una variable aleatoria binomial
cuando el nmero de ensayos se vuelve cada vez ms grande.
La importancia de la distribucin normal se extiende ms all de proporcionar
aproximaciones a las probabilidades binomiales. Por ejemplo, puede demostrarse que cada
vez que un experimento aleatorio est formado por una serie de ensayos independientes,
donde cada uno da como resultado un valor observado de la variable aleatoria en particular,
entonces la variable aleatoria que representa el resultado promedio (o total) en n ensayos
tiende hacia una distribucin normal.
Diremos que una variable aleatoria continua X es normal con media y varianza 2 y lo
representaremos como X~N(,2), siendo < x < y > 0, siempre que su funcin de
densidad de probabilidad sea:

1
f x
e
2

x 2
2 2

La expresin obtenida para la funcin de densidad de probabilidad para una variable normal
nos muestra que dicha funcin depende slo de la media y de la varianza 2 de la variable,
por lo que una variable normal queda totalmente determinada por estos dos parmetros, lo
cual justifica la expresin: X~N(,2).
La funcin de densidad de probabilidad es una curva simtrica con forma de campana
(campana de Gauss):

Modelos de probabilidad continuos. La distribucin normal


Densidad Normal (Media = 10)

-15

-10

-5

10

Varianza = 4

15

20

Varianza = 9

25

30

35

Varianza = 16

Un resultado til para toda variable aleatoria normal es el siguiente:

X ~ N ,

P X 0,6827

P 2 X 2 0,9545
P 3 X 3 0,9973

Esto se aprecia mejor en las siguientes figuras:

68,27%

-3

-2

-1

99,73%

95,45%

-3

-2

-1

-3

-2

-1

La escala empleada en las figuras es en nmero de desviaciones tpicas.

Dado que ms del 0,9973 de la probabilidad de una distribucin normal est comprendida en
el intervalo ]3, +3 [, con longitud 6, a menudo se dice que el ancho de la distribucin
normal es 6 (notar que la probabilidad de encontrar un valor de la variable aleatoria fuera del
intervalo es slo 0,0027). Al intervalo ]3, +3 [ se le llama frecuentemente regin de
variabilidad natural para la variable X~N(,2).

Variable aleatoria normal estndar


Una variable aleatoria normal con media = 0 y varianza 2 = 1 recibe el nombre de variable
aleatoria normal estndar y se denota como Z.
La siguiente tabla muestra las probabilidades acumuladas para una variable aleatoria normal
estndar (funcin de distribucin), F(z) = P(Z z).

Distribucin Normal Estndar

Modelos de probabilidad continuos. La distribucin normal


0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
1,10
1,20
1,30
1,40
1,50
1,60
1,70
1,80
1,90
2,00
2,10
2,20
2,30
2,40
2,50
2,60
2,70
2,80
2,90
3,00
3,10
3,20
3,30

0,00
0,500
0,540
0,579
0,618
0,655
0,691
0,726
0,758
0,788
0,816
0,841
0,864
0,885
0,903
0,919
0,933
0,945
0,955
0,964
0,971
0,977
0,982
0,986
0,989
0,992
0,994
0,995
0,997
0,997
0,998
0,999
0,999
0,999
1,000

0,01
0,504
0,544
0,583
0,622
0,659
0,695
0,729
0,761
0,791
0,819
0,844
0,867
0,887
0,905
0,921
0,934
0,946
0,956
0,965
0,972
0,978
0,983
0,986
0,990
0,992
0,994
0,995
0,997
0,998
0,998
0,999
0,999
0,999
1,000

0,02
0,508
0,548
0,587
0,626
0,663
0,698
0,732
0,764
0,794
0,821
0,846
0,869
0,889
0,907
0,922
0,936
0,947
0,957
0,966
0,973
0,978
0,983
0,987
0,990
0,992
0,994
0,996
0,997
0,998
0,998
0,999
0,999
0,999
1,000

0,03
0,512
0,552
0,591
0,629
0,666
0,702
0,736
0,767
0,797
0,824
0,848
0,871
0,891
0,908
0,924
0,937
0,948
0,958
0,966
0,973
0,979
0,983
0,987
0,990
0,992
0,994
0,996
0,997
0,998
0,998
0,999
0,999
0,999
1,000

0,04
0,516
0,556
0,595
0,633
0,670
0,705
0,739
0,770
0,800
0,826
0,851
0,873
0,893
0,910
0,925
0,938
0,949
0,959
0,967
0,974
0,979
0,984
0,987
0,990
0,993
0,994
0,996
0,997
0,998
0,998
0,999
0,999
0,999
1,000

0,05
0,520
0,560
0,599
0,637
0,674
0,709
0,742
0,773
0,802
0,829
0,853
0,875
0,894
0,911
0,926
0,939
0,951
0,960
0,968
0,974
0,980
0,984
0,988
0,991
0,993
0,995
0,996
0,997
0,998
0,998
0,999
0,999
0,999
1,000

0,06
0,524
0,564
0,603
0,641
0,677
0,712
0,745
0,776
0,805
0,831
0,855
0,877
0,896
0,913
0,928
0,941
0,952
0,961
0,969
0,975
0,980
0,985
0,988
0,991
0,993
0,995
0,996
0,997
0,998
0,998
0,999
0,999
0,999
1,000

0,07
0,528
0,567
0,606
0,644
0,681
0,716
0,749
0,779
0,808
0,834
0,858
0,879
0,898
0,915
0,929
0,942
0,953
0,962
0,969
0,976
0,981
0,985
0,988
0,991
0,993
0,995
0,996
0,997
0,998
0,999
0,999
0,999
0,999
1,000

0,08
0,532
0,571
0,610
0,648
0,684
0,719
0,752
0,782
0,811
0,836
0,860
0,881
0,900
0,916
0,931
0,943
0,954
0,962
0,970
0,976
0,981
0,985
0,989
0,991
0,993
0,995
0,996
0,997
0,998
0,999
0,999
0,999
0,999
1,000

0,09
0,536
0,575
0,614
0,652
0,688
0,722
0,755
0,785
0,813
0,839
0,862
0,883
0,901
0,918
0,932
0,944
0,954
0,963
0,971
0,977
0,982
0,986
0,989
0,992
0,994
0,995
0,996
0,997
0,998
0,999
0,999
0,999
0,999
1,000

En la tabla slo se muestran probabilidades acumuladas para valores positivos de z, ya que


aplicando simetra se pueden calcular las probabilidades acumuladas correspondientes a
valores negativos de z.
Ejemplo (Uso bsico de la tabla de la funcin de distribucin normal estndar)
Para Z ~ N(0; 1), calcularemos P(Z 1,24):
En la primera columna localizo la fila correspondiente al valor 1,2 y la cruzo con la columna
correspondiente a 0,04, obteniendo P(Z 1,24) = 0,893
Ejemplo (Uso general de la tabla de la funcin de distribucin normal estndar)
Para Z ~ N(0; 1), calcular:
P(Z 0,46) = P(Z 0,46) = 1 P(Z 0,46) = 1 0,677 = 0,323
P(Z > 0,30) = 1 P(Z 0,30) = 1 0,618 = 0,382
P(Z > 1,72) = P(Z 1,72) = 0,957
P(0,5 Z 1,25) = P(Z 1,25) P(Z 0,5) = 0,894 0,691 = 0,203
P(0,5 Z 1,25) = P(Z 1,25) P(Z 0,5) = 0,894 (1 0,691) = 0,585
P(1,25 Z 0,5) = P(Z 0,5) P(Z 1,25) = (1 0,691) (1 0,894) = 0,203
Mnemotcnicos para el uso general de la tabla normal estndar

Directo

P(Z 1,45) = 0,926

1 ( +)

P(Z 1,45) = 1 P(Z 1,45) = 0,074

Modelos de probabilidad continuos. La distribucin normal

1 ( +)

P(Z 1,45) = 1 P(Z 1,45) = 0,074


P(Z 1,45) = P(Z 1,45) = 0,926

Siendo Z ~ N(0; 1), a menudo estamos interesados en calcular un valor de z que verifique la
siguiente propiedad: P(Z z) = p, siendo p una cantidad conocida.
Ejemplo (Uso inverso de la tabla de la funcin de distribucin normal estndar)
Sea Z ~ N(0; 1), calcular z tal que P(Z z) = 0,75 (Notar que se est pidiendo Q3)
En este caso conocemos la probabilidad acumulada y desconocemos el valor que la ha
ocasionado, por lo que deberemos recurrir a la tabla, pero buscando 0,75 en el cuerpo de la
tabla y localizando la fila y columna correspondientes para reconstruir el valor de z.
El valor ms cercano a 0,75 que podemos encontrar en el cuerpo de la tabla es 0,749,
correspondiente a la fila 0,60 y a la columna 0,07, por lo que podemos decir que el valor
buscado es, aproximadamente, z 0,67.
Para afinar ms el resultado deberamos recurrir a la interpolacin lineal, aunque la ganancia
en precisin es, en general, pequea:
z 0,67
0,68 0,67
z 0,6733

0,75 0,749 0,752 0,749

Para recordar la expresin de la interpolacin lineal empleada podemos escribirla de la


z z MIN
z
z MIN
z
z MIN
y, despejando, z z MIN MAX
p pMIN .
siguiente forma,
MAX
p p MIN p MAX p MIN
p MAX p MIN
Ejercicio
Hallar z tal que P(Z z) = 0.95
Ejercicio
Hallar z tal que P(Z > z) = 0.95
Ejercicio
Hallar z tal que P(z Z z) = 0.5

Estandarizacin de una variable aleatoria normal


Si X es una variable aleatoria normal con media y varianza 2, X ~ N(; 2), entonces la
X
es una variable aleatoria normal estndar, es decir Z ~ N(0; 1).
variable aleatoria Z

Este resultado es de gran utilidad en el clculo de probabilidades con variables aleatorias


normales, ya que nos permite transformar la probabilidad de un intervalo para una variable
aleatoria general en la probabilidad de otro intervalo para una variable normal estndar, lo que
nos permite recurrir a la tabla de la distribucin normal estndar para cualquier variable
normal.

10

Modelos de probabilidad continuos. La distribucin normal


Ejemplo
Si la estatura de los individuos de cierta poblacin es aproximadamente normal con media
170 cm y varianza 36 cm, calcular la probabilidad de que al seleccionar a un individuo al azar
dentro de la poblacin cumpla lo siguiente:
a. El individuo mide ms de 185 cm.
X = Estatura de un individuo seleccionado al azar en la poblacin X ~ N(170; 36)
X 170 185 170

P X 185 P
PZ 2.5 1 PZ 2.5 1 0.994 0.006
6
6

b. El individuo mide entre 175 y 195 cm.


175 170 X 170 195 170

P175 X 195 P
P0.83 Z 4.17
6
6
6

PZ 4.17 PZ 0.83 1 0.797 0.203


c. El individuo mide entre 160 y 168 cm.
160 170 X 170 168 170

P160 X 168 P
P 1.67 Z 0.33
6
6
6

PZ 0.33 PZ 1.67 1 PZ 0.33 1 PZ 1.67


1 0.629 1 0.953 0.324
d. Hallar el tercer cuartil, Q3, de la estatura de los individuos de la poblacin.
Q 170

X 170 Q3 170
P X Q3 0.75 P

0.75
0.75 P Z 3
6
6

Q 170
0.67, de donde:
Como conocemos el resultado usamos la tabla a la inversa 3
6
Q3 = 174.02

11

Modelos de probabilidad continuos. La distribucin normal

Transformaciones afines de una variable aleatoria normal


Dada la variable aleatoria X ~ N(, 2), si construimos la variable aleatoria Y = a + bX, se
cumple que Y es normal, con media Y = a + b y varianza Y2 b 2 2 .
Ejemplo
La estatura medida en metros de los individuos de cierta poblacin se considera como una
variable aleatoria, X, aproximadamente normal con media 1.68 m y varianza 0.0256.
Si llamamos Y a la estatura de los individuos, medida en centmetros, podemos construir la
nueva variable como Y = 100X, entonces podemos decir que Y es aproximadamente normal,
con media 1001.68 = 168 cm y varianza 10020.0256 = 256.
Resumiendo: X ~ N(1.68; 0.0256), Y = 100X Y ~ N(168; 256)

Suma de variables aleatorias normales independientes

Dadas X ~ N X ; X2 e Y ~ N Y ; Y2 independientes X Y ~ N X Y ; X2 X2 .
Ejemplo
Al hacer mallas con 8 naranjas tomadas al azar de una cierta partida observamos que el peso
en kilogramos de la malla se distribuye aproximadamente segn una distribucin normal con
media 2 y varianza 0,25. Si juntamos las mallas de dos en dos, las nuevas mallas se
distribuirn segn una distribucin normal, con media 4 y varianza 0,5.

Aproximacin normal a las distribuciones binomial y Poisson


Al definir la variable aleatoria normal se indic que sta puede construirse como una
aproximacin de la variable aleatoria binomial con un nmero grande de ensayos. Como
consecuencia de esto no es sorprendente que la distribucin normal se emplee para aproximar
probabilidades binomiales en casos donde n es grande.
Ejemplo
En un canal de comunicacin digital el nmero de bits que se reciben de manera errnea
puede modelarse como una variable aleatoria binomial, siendo la probabilidad de recibir un
bit de manera errnea igual a 105. Si una retransmisin consta de 16 millones de bits, cul es
la probabilidad de que se presenten ms de 150 errores?
Si tratamos de resolver el problema aplicando directamente la distribucin binomial tenemos:
X = Nmero de errores en la retransmisin X ~ Bi(16 000 000; 105), con lo que la
probabilidad pedida es:
150
16 000 000 x
16 000 000 5 x
10
1 10 5
P X 150 1 P X 150 1
x
x 0

Es evidente la dificultad para efectuar el clculo anterior. En este caso la media de X es 160 y
la varianza es 159,9984. Construimos XN ~ N(160; 159,9984) X XN, es decir:

150 160
= P(Z > 0,79) = P(Z < 0,79) = 0,785
P(X > 150) P(XN > 150) = P Z
159,9984

La aproximacin normal a la distribucin binomial es buena si n es lo suficientemente grande


con respecto a p; en particular esto es cierto cuando np > 5 y n(1p) > 5.

12

Modelos de probabilidad continuos. La distribucin normal


Si recordamos, adems, que la distribucin de Poisson se defini como el lmite de una
distribucin binomial cuando el nmero de ensayos tiende a infinito, no nos sorprender que
la distribucin normal pueda emplearse para aproximar las probabilidades de una variable
aleatoria Poisson.
Ejemplo
Supngase que el nmero de ciertas partculas en un litro de sangre tiene una distribucin
Poisson con media 1000. Si se analiza un litro de sangre, cul es la probabilidad de encontrar
menos de 950 partculas?
X = Nmero de partculas de cierta sustancia en un litro de sangre X ~ Po( = 1000)
e 1000 1000 x
x!
x 0
950

P X 950

La media de X es igual que su varianza y es igual a 1000.


Si construimos XN ~ N(1000; 1000) se cumple que X XN, es decir:

950 1000
P X 950 P X N 950 P Z
PZ 1,58 0,057
1000

La aproximacin es buena siempre que > 5.

Correccin por continuidad


Cuando aproximamos una variable aleatoria discreta mediante una variable aleatoria continua
la aproximacin mejora si a los valores de la variable discreta se les considera como
intervalos, en lugar de cmo puntos, es decir, si el valor de una variable binomial o Poisson es
4 consideraremos el intervalo que va desde 3,5 hasta 4,5 como el equivalente continuo de 4.
Ejemplo
Sea X ~ Bi(50; 0.1) y estamos interesados en calcular P(X 2) y P(X < 2).
La media de X es = 500.1 = 5 y la varianza es 2 = 500.10.9 = 4.5
Construimos XN ~ N(5; 4.5)

2.5 5
P X 2 P X N 2.5 P Z
PZ 1.18 1 PZ 1.18 1 0.881 0.119
4.5

Nota.- El verdadero valor de P(X 2) calculado con la binomial es 0.118

1.5 5
P X 2 P X N 1.5 P Z
PZ 1.65 1 PZ 1.65 1 0.951 0.049
4.5

X 2
X 2

13

Modelos de probabilidad continuos. La distribucin normal


Ejemplo
Sea X ~ Bi(50; 0.1), calcular aproximadamente:

6.5 5
a.- P(X > 6) P(XN 6.5) = P Z
= P(Z 0.71) = 1 P(Z 0.71) = 0.239
4.5

5.5 5
b.- P(X 6) P(XN 5.5) = P Z
= P(Z 0.24) = 1 P(Z 0.24) = 0.405
4.5

c.- P(2 X 6) P(1.5 XN 6.5) = P(Z 0.71) P(Z 1.65) = 0.761 0.049 = 0.712
d.- P(2 < X 6) P(2.5 XN 6.5) = P(Z 0.71) P(Z 1.18) = 0.761 0.119 = 0.642
e.- P(2 X < 6) P(1.5 XN 5.5) = P(Z 0.24) P(Z 1.65) = 0.595 0.049 = 0.546
f.- P(2 < X < 6) P(2.5 XN 5.5) = P(Z 0.24) P(Z 1.18) = 0.595 0.119 = 0.476
Ejemplo
Sea X ~ Po( = 9). (Media = Varianza = 9).
Calcular aproximadamente las siguientes probabilidades:
10.5 9

a.- P(X > 10) P(XN 10.5) = P Z


= P(Z 0.5) = 1 P(Z 0.5) = 0.691
3

9.5 9

b.- P(X 10) P(XN 9.5) = P Z


= P(Z 0.17) = 1 P(Z 0.17) = 0.433
3

c.- P(7 X 11) P(6.5 XN 11.5) =


d.- P(7 < X 11) P(7.5 XN 11.5) =
e.- P(7 X < 11) P(6.5 XN 10.5) =
f.- P(7 < X < 11) P(7.5 XN 10.5) =

14

Modelos de probabilidad continuos. La distribucin normal

Ejercicios
1. Un profesor de Estadstica muy perezoso decide puntuar a sus alumnos al azar, de manera
que les pone calificaciones aleatorias entre 3 y 9, segn una distribucin uniforme
continua.
a. Si aprueban los alumnos cuya nota es mayor o igual que 5, qu porcentaje de alumnos
resultar aprobado, en promedio?
b. Si obtienen un notable los alumnos cuya nota est entre 6,75 y 8,5, qu porcentaje de
alumnos obtendr un notable, en promedio?
c. Qu nota se debe exigir para aprobar si se desea que apruebe el 75% de los alumnos?
2. Las calificaciones de los alumnos de estadstica, X, puede suponerse que se ajustan a una
distribucin normal, con media 6 y desviacin tpica 3.
a. Hallar el porcentaje de alumnos suspendidos (menos de 5).
c. Hallar el porcentaje de alumnos con aprobado (desde 5 hasta 6.5).
c. Hallar el porcentaje de alumnos con notable (desde 6.5 hasta 8.5).
d. Hallar el porcentaje de alumnos con sobresaliente (desde 8.5).
3. En una fbrica se considera la variable aleatoria X=tiempo necesario para montar una
pieza, llegando a la conclusin de que X es normal, con media =75 segundos y
desviacin tpica =6 segundos.
a. Hallar la probabilidad de que un trabajador de la fbrica tarde menos de 70 segundos en
montar la pieza.
b. Hallar la probabilidad de que un trabajador de la fbrica tarde entre 72 y 81 segundos en
montar la pieza.
c. Halla el percentil 95 de X e interpreta el significado del mismo.
4. Una planta envasadora de cereales mezcla maz tostado con arroz inflado, para elaborar su
producto estrella. En la mezcla final el contenido de azcar debe estar entre 10 y 11
gramos por paquete para superar el control de calidad. Si el proceso de llenado es tal que la
cantidad de azcar en cada paquete verifica una distribucin normal con media 10,2
gramos y desviacin tpica 0,20 gramos:
a. Qu proporcin de paquetes tendrn un exceso de azcar?
b. Qu proporcin de paquetes tendrn defecto de azcar?
c. Si queremos que slo se rechace el 2% de la produccin por exceso de azcar, qu
lmite superior se debera establecer?
5. Segn un estudio, la altura de los varones de cierta ciudad es una variable aleatoria X
normal, con media 175 cm y desviacin tpica 10 cm. Se pide encontrar un intervalo
centrado de tal manera que la estatura del 50 % de los varones de la ciudad est
comprendida en l.
6. La estatura de los jvenes aspirantes a entrar en el servicio militar sigue una distribucin
normal con media 172 y varianza 81. Hay 200.000 mozos y slo se precisan 120.000
reclutas, de manera que se decide eliminar a los ms altos y a los ms bajos, eliminando a
la misma cantidad de mozos en cada una de las dos categoras. Qu estaturas lmite se
debe exigir para seleccionar a los reclutas?
15

Modelos de probabilidad continuos. La distribucin normal


7. Las puntuaciones en una oposicin se distribuyen segn una normal con media 80 y
desviacin tpica 16. Si slo queremos seleccionar al 40% de los candidatos con mayor
puntuacin, qu nota mnima debemos exigir?
8. El nmero de llamadas entrantes en la centralita de una empresa sigue una distribucin de
Poisson con un promedio de 40 llamadas cada hora. Hallar la probabilidad de que durante
media hora se registren ms de 30 llamadas.
9. En un examen tipo test hay 50 preguntas, cada una con 10 opciones, siendo que el alumno
debe seleccionar en cada pregunta la nica opcin que es correcta. Un alumno contesta al
azar a las 50 preguntas. Hallar la probabilidad de que acierte exactamente 10 de las 50
preguntas.
10. Un proceso de fabricacin de chips produce un 2% de chips defectuosos. Suponga que los
chips son independientes y que cada lote contiene 1000 chips.
a. Hallar la probabilidad de que el lote contenga entre 20 y 30 chips defectuosos.
b. Hallar la probabilidad de que el lote contenga exactamente 20 chips defectuosos.
11. Supongamos que tenemos 10 variables aleatorias independientes N(=5; 2=4), X1, X2, ...,
X10. Si definimos Y como la media de las 10 variables aleatorias, cul es la distribucin
de Y?
12. El tiempo de reaccin de un conductor a un estmulo visual tiene una distribucin normal
con media 0.4 segundos y desviacin tpica de 0.05 segundos.
a. Cul es la probabilidad de que un conductor reaccione en ms de 0.5 segundos?
b. Cul es la probabilidad de que un el tiempo de reaccin est entre 0.4 y 0.5
segundos?
c. Cul es el tiempo de reaccin que se espera exceder el 90 % de las veces?
13. Una mquina de llenado automtico de botellas de refresco deposita en cada botella una
cantidad de lquido que se distribuye segn una normal con media 1 litro y desviacin
tpica 0,01 litros.
En un control de calidad se aceptan slo las botellas cuyo contenido est comprendido
entre 0,99 y 1,02 litros.
Qu porcentaje de botellas sern rechazadas?
14. Remigio Carrascal Castaete es alrgico a un determinado tipo de polen, lo que le
provoca frecuentes estornudos durante el mes de mayo. Remigio comprueba que el
nmero de estornudos que le provoca su alergia verifica una distribucin de Poisson con
un promedio de 2 estornudos cada minuto. Hallar:
a. La probabilidad de que Remigio pase 2 minutos seguidos sin estornudar.
X = N de estornudos en 2 minutos X~Po( = 4)
P X 0

e 4 4 0
e 4 0,0183
0!

b. La probabilidad de que en un periodo de 8 minutos estornude entre 14 y 17 veces.


X = N de estornudos en 8 minutos X~Po( = 16); Construimos XN~N( = 16; 2 =
16)

16

Modelos de probabilidad continuos. La distribucin normal

17,5 16
13,5 16
P14 X 17 P13,5 X N 17,5 P
Z
P 0,625 Z 0,375
4
4

PZ 0,38 PZ 0,63 PZ 0,38 1 PZ 0,63 0,648 1 0,736 0,384


c. Cunto tiempo tiene que esperar Remigio para que la probabilidad de tener al menos
un estornudo sea del 95 %?

X = N de estornudos en 1 minuto X~Po( = 2)


T = Tiempo hasta el prximo estornudo, en minutos T~Ex( = 2)
Queremos hallar t tal que: P T t 0,95
1 e 2t 0,95 e 2t 0,05 2t ln 0,05 t

ln 0,05
1,4979
2

minutos,

es

decir, un minuto y medio.


15. Los sueldos de los trabajadores de cierta industria se distribuyen normalmente, con media
12 por hora y desviacin tpica 0,5. Calcula:
a. Qu proporcin de trabajadores recibe un salario entre 12 y 13 por hora?

13 12
12 12
P12 X 13 P
Z
P0 Z 2 PZ 2 PZ 0
0,5
0,5
0,977 0,5 0,477
b. Qu proporcin de trabajadores recibe un salario entre 11 y 14 por hora?

14 12
11 12
P11 X 14 P
Z
P 2 Z 4 PZ 4 PZ 2
0,5
0,5
PZ 4 1 PZ 2 1 1 0,977 0,977
c. Cunto debe ganar por hora un trabajador para superar al 95% de los trabajadores de
la industria?

P 12

Se pide el percentil 95, es decir: P X P95 0,95 P Z 95


0,95 y,
0,5

P 12
1,645 P95 12,8225
consultando en la tabla, obtenemos: 95
0,5

17

Você também pode gostar