Você está na página 1de 58

3

Captulo I
Aspectos general es de
Probabilidades y Variables Aleatorias
|5]
Probabilidades
En este captulo se introduce el concepto de la probabilidad, t-
pico necesario para la compresin de temas a desarrollarse en
los captulos posteriores.
Bernoulli fue el primero en estudiar la teora de la probabili-
dad en forma sistemtica con un enfoque cientfico; observando
los resultados del lanzamiento de una moneda un nmero gran-
de de veces, not que el nmero de caras y el nmero de sellos
tendan a ser iguales. Es decir, que la frecuencia relativa de la
obtencin de caras se acercaba ms a la frecuencia relativa de
sellos, cuanto mayor era el nmero de lanzamientos. O bien,
ambas frecuencias relativas se parecan cada vez ms a 0.5. Otro
tanto le ocurra en el lanzamiento de dados: la frecuencia relati-
va de un 4 tenda a 1/ 6. Repiti una y otra vez este tipo de expe-
rimentos con monedas, dados y cartas, y siempre llegaba a la
misma conclusin. Imagin haber encontrado un fenmeno ms
general y as dio comienzo a la teora de probabilidades. Sus re-
sultados tericos se correspondan razonablemente con la reali-
dad. Sin embargo, debe marcarse siempre una clara distincin
entre los resultados empricos y los tericos. El uso de la teora de
la probabilidad se inici en los albores del siglo XVII, hacindose
popular entre los geometras de aquel entonces, hoy se emplea
en el campo de los seguros, control de calidad, gentica, mecni-
ca estadstica y muchos ms.
4
La teora de la Probabilidad se constituye en el fundamento
de la inferencia estadstica, en este captulo se estudiarn slo
los conceptos bsicos, con el objetivo de brindar al lector los m-
todos fundamentales y necesarios para comprender la inferen-
cia estadstica.
Puede sealarse que el concepto de probabilidad est impl-
cito en distintas situaciones. Por ejemplo: en las encuestas de opi-
nin donde se indican las posibilidades que tendra determinado
candidato de ganar las elecciones; en el campo de la educacin
primaria se puede afirmar que la desercin escolar es de un 65%
en zonas marginales; la posibilidad de que un alimento est con-
taminado es del 50%; la posibilidad de que una estudiante de se-
cundaria quede embarazada es del 20%, etc.
Los investigadores del rea de educacin y de ciencias so-
ciales continuamente se preguntan si los resultados de sus inves-
tigaciones se deben a la casualidad o son el producto de la in-
fluencia de diversos factores. Por ejemplo, se emplean dos mto-
dos de enseanza, el mtodo A y el mtodo B con la finalidad de
comparar el nmero de alumnos desaprobados; al trmino del
curso se conoce que el grupo que estudi con el mtodo A, tres de
cada diez estudiantes desaprueban y el grupo que estudi con el
mtodo B uno de cada diez estudiantes desaprueban. Puede afir-
marse que el mtodo A es mejor que el mtodo B?. Esta y otras
preguntas pueden responderse a travs de la aplicacin de los
conceptos y leyes de la probabilidad.
A continuacin se definirn algunos trminos importantes:
Experi mento al eatori o
Es todo proceso que se puede repetir indefinidamente obte-
nindose resultados no previsibles. Por ejemplo, el experimento
de elegir un estudiante al azar y observar el grado de instruccin
del padre.
Espaci o muestral
El espacio muestral asociado a un experimento aleatorio, es
el conjunto de todos los posibles resultados de un experimento.
5
El espacio muestral lo denotaremos por . Por ejemplo, en el caso
del experimento de seleccionar un nio al azar y observar el gra-
do de instruccin del padre los resultados posibles se pueden re-
presentar en el conjunto:
={sin instruccin, primaria, secundaria,
superior universitaria}
Evento o suceso
Cada uno de los resultados de un experimento aleatorio, es
denominado evento o suceso. Un evento E es un elemento o sub-
conjunto de elementos del espacio muestral . Por ejemplo, al se-
leccionar un alumno y registrar el grado de instruccin del padre
en este caso una de las posibilidades es que el padre tenga ins-
truccin superior , en este caso se define el evento: E1={padre con
instruccin superior}.
Eventos mutuamente excl uyentes
Dos o ms eventos son mutuamente excluyentes, si la ocu-
rrencia de un evento implica la no ocurrencia de cualquier otro
evento. Por ejemplo, en el espacio muestral , los eventos
E1={padre con instruccin superior}y E2={padre con instruccin
primaria}, son eventos mutuamente excluyentes.
A continuacin se presentar el concepto de probabilidad
en tres perspectivas: probabilidad clsica, probabilidad como fre-
cuencia relativa, probabilidad subjetiva .
Probabi l i dad cl si ca
La probabilidad clsica se remonta al siglo XVII en los trabajos
de los matemticos Pascal y Fermat, y se presenta a travs de la
siguiente definicin.
Si un experimento aleatorio produce N resultados igualmen-
te probables y mutuamente excluyentes, y si dentro de estos N
resultados el evento E ocurre m veces, la probabilidad de ocu-
rrencia del evento E es igual a m/ N.
(
Esta definicin se expresa como
( )
N
m
E P
Se lee: la probabilidad de que ocurra el evento E es igual a m
entre N.
Probabilidad segn el concepto de frecuencia relativa
El enfoque de frecuencia relativa de probabilidad est relaciona-
do a un nmero grande de veces que se repite un experimento
digamos, n veces, y si algn evento E ocurre un nmero m de
veces la frecuencia relativa de la ocurrencia del evento E
n
m
,
estima la probabilidad de ocurrencia del evento E.
La expresin es la siguiente: ( )
n
m
E P
Esta interpretacin de probabilidad como frecuencia relati-
va depende de la idea de regularidad estadstica, que establece
que las frecuencias relativas tienden a estabilizarse y a aproxi-
marse a un valor fijo despus de repetir el experimento un gran
nmero de veces. Por ejemplo, en un Centro de Salud de Lima
nacieron 2,000 nios, intuitivamente puede decirse que la pro-
babilidad de nacimiento de un nio es igual a la probabilidad de
nacimiento de una nia, es decir 0.50. El experimento consiste en
observar en forma secuencial los nacimientos. En base a esta in-
formacin se organiza la siguiente tabla, en la cual la segunda
columna contiene el nmero de nias nacidas en cada 100 naci-
mientos. Se define el evento E:{nacimiento de una nia}.
Puede observarse que las frecuencias relativas tienden a "es-
tabilizarse" y a aproximarse a 0,50 despus de un gran nmero
de repeticiones de un experimento, aun cuando al inicio de la
secuencia se observa una considerable fluctuacin. Este compor-
tamiento de las frecuencias relativas se ha comprobado experi-
mentalmente muchas veces.
7
Nmero de nias observada en una secuencia de 2,000 nacimientos
NMERO DE NMERO DE NMERO
NACIMIENTOS NIAS ACUMULADO ni/N
X ni
1-100 55 55 0,5500
101-200 46 101 0,5050
201-300 47 148 0,4933
301-400 50 198 0,4950
401-500 41 239 0,4780
501-600 51 290 0,4833
601-700 51 341 0,4871
701-800 42 383 0,4788
801-900 46 429 0,4767
901-1000 55 484 0,4840
1001-1100 50 534 0,4855
1101-1200 56 590 0,4917
1201-1300 50 640 0,4923
1301-1400 48 688 0,4914
1401-1500 51 739 0,4927
1501-1600 52 791 0,4938
1601-1700 45 836 0,4918
1701-1800 56 892 0,4956
1801-1900 58 950 0,5000
1901-2000 40 990 0,4950
8
Probabilidad subjetiva
Existen diversas situaciones en las cuales la probabilidad de ocu-
rrencia de un evento no puede ser calculada de acuerdo a los
mtodos anteriores. A travs de estos mtodos no es posible por
ejemplo calcular la probabilidad de que en los prximos 10 aos
se reduzca la contaminacin ambiental en la Tierra o que se eli-
mine la hepatitis B en los escolares de la selva peruana. La mag-
nitud de la probabilidad que una persona asigna subjetivamente
a un evento est en relacin al grado de seguridad que esa perso-
na tiene en la ocurrencia del evento. La probabilidad subjetiva
no depende de la posibilidad de repeticin de un experimento.
Axi omas de probabi l i dad
Los axiomas de probabilidad garantizan que las probabilidades
asignadas a los eventos puedan interpretarse como frecuencias
relativas. Los axiomas no determinan las probabilidades, estas
se asignan de acuerdo al conocimiento del sistema estudiado. Los
siguientes axiomas propuestos por Kolmogorov, facilitan el cl-
culo de probabilidades de algunos eventos a partir del conoci-
miento de las probabilidades de otros eventos.
Si es el espacio muestral asociado a un experimento y E es
cualquier evento del espacio muestral, se cumple:
i) P()=1
ii) 0P(E) 1
iii) Para dos eventos E1 y E2 definidos en W, con E1 E2 =,
se cumple que:
P(E1 E2 ) = P(E1)+P(E2).
Los axiomas de probabilidad y las propiedades derivadas de
estos se limitan a la asignacin de probabilidades de manera tal
que es concordante interpretar stas como frecuencia relativa.
Como consecuencia de los axiomas anteriores se presentan las
siguientes propiedades.
9
Propiedades
1. P(f)=0, donde f es el conjunto vaco.
2. Para cualquier evento E P(E
c
)=1-P(E), donde E
c
es el
complemento del evento E.
3. Si el evento E
1
E
2
P(E
1
) P(E
2
).
Ejemplo 1.1
Un centro educativo convoca a concurso la plaza de director del
colegio y recibe 25 solicitudes para desempear este cargo. Quin-
ce de los postulantes al cargo son hombres y diez son mujeres.
Cinco de ellos tienen el grado de doctor y veinte el grado de ma-
gister. Un postulante es elegido aleatoriamente entre los veinti-
cinco. Los evaluadores se formulan las siguientes preguntas:
a) Cul es la probabilidad de que el postulante seleccionado
sea una mujer?
b) Cul es la probabilidad de que el postulante seleccionado
tenga el grado de doctor?
c) Cul es la probabilidad de que postulante seleccionado ten-
ga el grado de magister y sea hombre?
Vamos a responder las preguntas planteadas.
Sol uci n
La informacin relacionada al sexo y grado acadmico de los
postulantes es la siguiente:
Distribucin de los 25 postulantes al cargo de director por sexo y grado acadmico
Grado acadmico
Sexo Total
Magister Doctor
Femenino 8 2 10
Masculino 12 3 15
Total 20 5 25
0
a) El experimento consiste en seleccionar aleatoriamente a un
postulante y observar su sexo, los posibles resultados son hom-
bre o mujer. Entonces
1
= {E
1
, E
2
}donde:
E
1
: Mujer y E
2
: Hombre.
La probabilidad de que el postulante seleccionado sea mu-
jer es,
b) El experimento consiste en seleccionar aleatoriamente a un
postulante y observar su grado acadmico. Los posibles re-
sultados son magister o doctor. Entonces
2
={F
1
, F
2
}don-
de: F
1
: Magister y F
2
: Doctor.
La probabilidad de que el postulante seleccionado tenga el
grado de doctor es,
c) El experimento consiste en seleccionar aleatoriamente a un
postulante y observar sexo y grado acadmico simultnea-
mente.
E
1
F
1
: Mujer con grado de magster n(E
1
F
1
)=8
E
1
F
2
: Mujer con grado de doctor n(E
1
F
2
)=2
E
2
F
1
: Hombre con grado de magster n(E
2
F
1
)=12
E
2
F
2
: Hombre con grado de doctor n(E
2
F
2
)= 3
La probabilidad de que el postulante seleccionado sea hom-
bre y tenga el grado de magister es,
48 . 0
25
12 ) (
) (
1 2
1 2


n
F E n
F E P
4 . 0
25
10 ) (
) (
1
1

n
E n
E P
2 . 0
25
5 ) (
) (
1
1

n
F n
F P

Variables aleatorias
Dado un experimento aleatorio al que se le asocia un espacio mues-
tral , una funcin X que asigna a cada elemento de en uno y
slo un nmero real X()=x es llamada variable aleatoria. Esa de-
cir, el dominio de la funcin es el espacio muestral y el rango es
el conjunto de nmeros reales.
Las variables aleatorias pueden ser clasificadas como dis-
cretas o continuas. Se dice que es discreta si tiene un rango finito
o infinito numerable y es continua si tiene un rango que contiene
un intervalo de nmeros reales. Este intervalo puede ser finito o
infinito
Ejemplos de variables aleatorias discretas:
X: Nmero de libros solicitados en una biblioteca.
X: Nmero de cursos a implementarse en un semestre acad-
mico.
X: Nmero de alumnos matriculados en el curso de Filosofa.
X: Nmero de computadoras en red del laboratorio de infor-
mtica.
Ejemplos de variables aleatorias continuas:
X: Tiempo dedicado a la revisin bibliogrfica.
X: Dimetro de un disco compacto.
X: Tiempo de espera en el banco para efectuar el pago de ma-
trcula.
Ej empl o 1.2
Un alumno es seleccionado aleatoriamente y se observa si es-
t aprobado o desaprobado. El espacio muestral es = {apro-

bado, desaprobado}= {A,D}. Consideremos X como una fun-
cin definida sobre tal que X(D) = 0 y X(A) = 1. As, X es
una funcin real valorada que tiene como dominio al espacio
muestral y como rango al conjunto de nmeros reales {x:
x=0,1}.
Variable aleatoria discreta y su distribucin de probabilidad
La distribucin de probabilidad de una variable aleatoria discre-
ta,
X
, es el conjunto de pares( ) ) ( , x p x
; donde:
x representa a un valor observado de la variable aleatoria y
( ) x X P x p ) (
representa la correspondiente probabilidad y
es la fraccin de veces que puede esperarse que
x
ocurra y cum-
ple con las siguientes propiedades:



1 ) ( )
1 ) ( 0 )
x p ii
x p i
Ejemplo 1.3
Una biblioteca que cuenta con un total de 4270 libros, clasifica es-
tos libros segn el nmero de hojas deterioradas.
En este caso la variable aleatoria en estudio es X: Nmero de
hojas deterioradas encontradas en un libro. Esta es una variable
aleatoria discreta y el rango de posibles valores de
X
puede ser
{ } 12 ,...., 2 , 1 , 0
x
R si el nmero mximo de hojas deterioradas es
12. Vamos a encontrar la distribucin de probabilidad del nme-
ro de hojas deterioradas.
En la siguiente tabla se presenta las frecuencias encontradas
segn el nmero de hojas deterioradas.
3
Por ejemplo, puede decirse que de un total de 4.270 libros se
han encontrado, 1.394 que no contienen ninguna hoja deteriora-
da, 36 libros con 6 hojas deterioradas, etc.
Sol uci n
Vamos a presentar la distribucin de probabilidad de la variable
aleatoria, nmero de hojas deterioradas.
Las probabilidades ( ) x X P x p ) (
, son calculadas divi-
diendo sus respectivas frecuencias absolutas entre el total. Por
ejemplo,
( )
( )
( ) 0002 , 0
270 . 4
1
12 ) 12 (
.
.
3206 , 0
270 . 4
369 . 1
1 ) 1 (
3265 , 0
270 . 4
394 . 1
0 ) 0 (



X P p
X P p
X P p
Nmero de hojas Nmero de
deterioradas libros
X
i
f
0 1.394
1 1.369
2 803
3 357
4 201
5 71
6 36
7 18
8 9
9 5
10 3
11 3
12 1
TOTAL 4.270
4
Solucin: Se observa la ltima tabla y la probabilidad es:
( ) 0471 , 0 4 X P
ii) Cul es la probabilidad de que un libro seleccionado alea-
toriamente contenga exactamente 6 hojas deterioradas?.
Solucin: Se observa la ltima tabla y la probabilidad es:
( ) 0084 , 0 6 X P
Funcin de distribucin
La funcin de distribucin est definida como la probabilidad de
que la variable aleatoria X tome un valor inferior o igual a
x
, es
decir:
( ) x X P x F ) (
Los resultados se presentan en la siguiente tabla
En base al conocimiento de la distribucin de probabilidad,
pueden formularse algunas preguntas, las que respondemos di-
rectamente.
i) Cul es la probabilidad de que un libro seleccionado alea-
toriamente contenga exactamente 4 hojas deterioradas?.
Nmero de hojas ) ( P x X
deterioradas
0 0,3265
1 0,3206
2 0,1881
3 0,0836
4 0,0471
5 0,0166
6 0,0084
7 0,0042
8 0,0021
9 0,0012
10 0,0007
11 0,0007
12 0,0002
TOTAL 1,0000
5
A continuacin se presenta la funcin de distribucin y su
respectiva representacin grfica para el Ejemplo 1.3.
Fig. 2. Representacin grfica de la funcin de distribucin
As,
Nmero de hojas ) ( ) ( x X P x F
deterioradas
0 0,3265
1 0,6471
2 0,8352
3 0,9188
4 0,9659
5 0,9825
6 0,9909
7 0,9951
8 0,9972
9 0,9984
10 0,9991
11 0,9998
12 1,0000
1 ) 12 ( )... 1 ( ) 0 ( ) 12 ( ) 12 (
.
.
.
6471 . 0 ) 1 ( ) 0 ( ) 1 ( ) 1 (
3265 . 0 ) 0 ( ) 0 (
+ +
+

X P X P X P X P F
X P X P X P F
X P F
0 4 8 12
n libros
F
u
n
c
i

n

d
e

d
i
s
t
r
i
b
u
c
i

n
F
(
x
)
1.0000
0.8000
0.6000
0.4000
(
La funcin de distribucin es expresada de la siguiente forma:

'

<
<
<
<
<
<
<
<
<
<
<
<
<

12 , 0000 . 1
12 11 , 9998 . 0
11 10 , 9991 . 0
10 9 , 9984 . 0
9 8 , 9972 . 0
8 7 , 9951 . 0
7 6 , 9909 . 0
6 5 , 9825 . 0
5 4 , 9659 . 0
4 3 , 9188 . 0
3 2 , 8352 . 0
2 1 , 6471 . 0
1 0 , 3265 . 0
0 , 0
) ( ) (
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x X P x F
) ( F x , tambin es llamada funcin escalera.
Ej empl o 1.4
En base a la distribucin de probabilidad encontrada vamos a
responder algunas preguntas.
i) Cul es la probabilidad de que un libro seleccionado aleato-
riamente a lo ms contenga dos hojas deterioradas?
Solucin: Observamos la tabla anterior y la probabilidad
es:
( ) 2 X P ( ) ( ) ( ) 188 . 0 3206 . 0 3265 . 0 2 1 0 + + + + X P X P X P
8352 . 0
i i ) Cul es la probabilidad de que un libro seleccionado alea-
7
toriamente tenga entre 4 y 7 hojas deterioradas inclusive?
Solucin: Para obtener la probabilidad se calcula:
( ) ( ) ( )
0763 . 0
9188 . 0 9951 . 0
3 7 7 4

X P X P X P
Media, varianza y desviacin estndar
La media de una variable aleatoria discreta X (media de la distri-
bucin) se define por:

) ( ) ( x xp X E
La varianza de una variable aleatoria discreta X (varianza
de la distribucin) se define por:
( )
2
2
) ( X E X Var
La desviacin estndar es la raz cuadrada de la varianza,
( ) [ ]
2
) ( X E X Var
Ej empl o 1.5
En relacin al ejemplo 1.3 se obtendr la media, la varianza y la
desviacin estndar.
Solucin
Media:
3435 . 1 ) 0002 . 0 ( 12 ... ) 3206 . 0 ( 1 ) 3265 . 0 ( 0 ) (
12
0
+ + +

x
x xp
y puede decirse que el nmero promedio es de 1 hoja dete-
8
riorada.
Varianza: En la siguiente tabla se presentan los clculos auxi-
liares para encontrar el valor de la varianza
118 . 2 ) 3435 . 1 ( 923 . 3
2 2

y el valor de la desviacin estn-
dar
455 . 1
.
A continuacin se presentan las distribuciones especiales:
Bernoulli y Binomial.
Distribucin de Bernoulli
La distribucin de Bernoulli caracteriza a una variable aleatoria
con dos posibles resultados y con probabilidad de ocurrencia cons-
tante. Tpicamente cada uno de estos resultados, representan un
xito (x=1) o un fracaso (x=0).
Definicin. Una variable aleatoria X, tiene una distribucin
Nmero de hojas p(x) p(x) x p(x) x
2
deterioradas
x
0 0.3265 0.0000 0.0000
1 0.3206 0.3206 0.3206
2 0.1881 0.3762 0.7522
3 0.0836 0.2508 0.7525
4 0.0471 0.1884 0.7532
5 0.0166 0.0830 0.4157
6 0.0084 0.0504 0.3035
7 0.0042 0.0294 0.2066
8 0.0021 0.0168 0.1349
9 0.0012 0.0108 0.0948
10 0.0007 0.0070 0.0703
11 0.0007 0.0077 0.0850
12 0.0002 0.0024 0.0288
TOTAL 1.0000 1.3435 3.9230
9
de Bernoulli si su distribucin de probabilidad est dada por:

'


caso otro cualquier ;
p , x ;
x
p) (
x
p
x) X P
0
1 0 1 0
1
1
(
donde p es la probabilidad de xito y 1-p la probabilidad
de fracaso, es decir:
p p) ( p ) X P
p p) ( p ) X P

1 1 0 (
1 1 (
0 1 0
1 1 1
Una variable aleatoria con distribucin Bernoulli puede ser
utilizada para modelar situaciones como la siguiente:
Ante una promocin de becas de estudios de computacin
un individuo puede aceptar o no la promocin.
Un analista clnico evala a un paciente y podr clasificarlo
como inmune o no a una determinada enfermedad.
Un artculo puede ser clasificado como defectuoso o no
defectuoso despus de haber sido sometido a un control de
calidad.
Esperanza y vari anza
La media y varianza de una variable aleatoria con distribucin
de Bernoulli estn definidas por:
pq p p X Var
p p X E


) 1 ( ) (
1 0 , ) (
Distribucin binomial
La distribucin Binomial es de importancia porque sirve para
modelar muchas situaciones de la vida real. Se basa en
n
ensa-
yos independientes de Bernoulli, cada ensayo con dos posibles
resultados y la probabilidad de xito
p
permanece constante en
cada prueba o ensayo. La variable aleatoria estudiada es el n-
3 0
mero de xitos en
n
pruebas independientes.
Formalizando, se dice que una variable aleatoria, tiene una
distribucin Binomial si su distribucin de probabilidad est dada
por:

'

,
_

;c.c
, x ; p) ( p
x
n
x) X P
x n x
0
n ,.., 1 0 1
(
donde:
X
: representa el nmero total de xitos en los
n
ensayos.
La media y varianza de la variable aleatoria son:
npq X Var
np X E

) (
) (
Ej empl o 1.6
Histricamente, la probabilidad de que un alumno de maestra
en educacin desapruebe el curso de metodologa de la investi-
gacin es . 45 . 0 p Se obtiene una muestra aleatoria de 6 estu-
diantes de maestra que llevan el curso de metodologa de la in-
vestigacin y vamos a encontrar:
a) El nmero esperado de alumnos que desaprueban el curso.
b) La probabilidad de que exactamente tres alumnos desaprue-
ben el curso.
c) La probabilidad que a lo ms dos alumnos desaprueben el
curso.
d) Por lo menos cinco alumnos desaprueben el curso
Sol uci n
6 n
45 . 0 p
X
: nmero de alumnos desaprobados{ } 6 ,..., 1 , 0 y la distribucin
de probabilidad de la variable es:
3
( ) ( )
x
x
x
x X P

,
_


6
55 . 0 45 . 0
6
x { } 6 ,..., 1 , 0 As:
( ) ( )
( ) ( )
( ) ( )
( ) ( )
( ) ( )
( ) ( )
( ) ( ) 0083 . 0 55 . 0 45 . 0
6
6
6
0609 . 0 55 . 0 45 . 0
5
6
5
1861 . 0 55 . 0 45 . 0
4
6
4
3032 . 0 55 . 0 45 . 0
3
6
3
2780 . 0 55 . 0 45 . 0
2
6
2
1359 . 0 55 . 0 45 . 0
1
6
1
0277 . 0 55 . 0 45 . 0
0
6
0
6 6
6
5 6 5
4 6 4
3 6 3
2 6
2
1 6
1
0 6 0

,
_

,
_

,
_

,
_

,
_

,
_

,
_

X P
X P
X P
X P
X P
X P
X P
a) El nmero esperado de alumnos desaprobados es:
) 6 ( 6 ) 5 ( 5 ) 4 ( 4 ) 3 ( 3 ) 2 ( 2 ) 1 ( 1 ) 0 ( 0
6
0
) ( ) (
p p p p p p p
x
x X xP X E
+ + + + + +


= 0(0.0277) + 1(0.1359) + 2(0.2780) + 3(0.3032) + 4(0.1861)
+ 5(0.0609) + 6(0.0083)
= 0 + 0.1359 + 0.5560 + 0.9096 + 0.7444 + 0.3045 + 0.04898
= 2.7002
Se espera encontrar aproximadamente tres desaprobados.
b) P(X=3) = 0.3032
c) P(X2) = P(X=0)+P(X=1)+P(X=2)=0.0277+0.1359+0.2780 = 0.4416
d) P(X5) = 1-P(X4) =1-[ P(X=0)+P(X=1)+P(X=2)+P(X=3)+ P(X=4)]
= 1 - [0.0277+0.1359+0.2780+0.3032+0.1861]
= 1-0.9309
3
= 0.0691
Distribucin de probabilidad de una variable continua
Una variable aleatoria continua es aquella que puede asumir
cualquier valor en un intervalo especfico de valores. En conse-
cuencia, entre dos valores cualesquiera asumidos por la variable
aleatoria continua existe un nmero infinito de valores.
Defi ni ci n
Una funcin no negativa (x) se llama funcin de densidad de
probabilidad de la variable aleatoria X, s el rea total delimita-
da por su curva y el eje de las x, es igual a 1 y s la subrea delimi-
tada por la curva, el eje de las x, y por las lneas perpendiculares
levantadas sobre dos puntos cualesquiera a y b da la probabili-
dad de que X est entre los puntos a y b.
Distribucin normal
Una de las distribuciones tericas ms estudiadas en los textos
de estadstica y ms utilizada en la prctica es la distribucin
normal, tambin llamada distribucin gaussiana. Su impor-
tancia se debe fundamentalmente a la frecuencia con la que dis-
tintas variables asociadas a fenmenos naturales y cotidianos
siguen, aproximadamente, esta distribucin. Caracteres morfo-
lgicos (como la talla o el peso), o psicolgicos (como el cociente
intelectual) son ejemplos de variables de las que frecuentemente
se asume que siguen una distribucin normal. El uso extendido
de la distribucin normal en las aplicaciones estadsticas puede
explicarse, adems, por otras razones. Muchos de los procedimien-
tos estadsticos habitualmente utilizados suponen normalidad de
los datos observados. La simple exploracin visual de los datos
puede sugerir la forma de su distribucin. No obstante, existen
otras medidas, grficos de normalidad y contrastes de hiptesis
que pueden ayudarnos a decidir, de un modo ms riguroso, si la
3 3
muestra de la que se dispone procede o no de una distribucin
normal. Cuando los datos no siguen una distribucin normal, po-
dremos o bien transformarlos o emplear mtodos estadsticos no
paramtricos.
Defi ni ci n
Una variable aleatoria continua, tiene una distribucin normal
si su funcin de densidad de probabilidad est dada por:
0 , x , e x
x
> < < < <

,
_

,
2
2
1
2
1
) ( f

que determina la curva en forma de campana. As, se dice


que una variable aleatoria X sigue una distribucin normal con
media y varianza
2
.
Notacin:
( )
2
, ~ N X
La distribucin normal posee ciertas propiedades importan-
tes destacando las siguientes:
El rea total bajo la curva y por encima del eje horizontal es
igual a 1.
La distribucin es simtrica respecto de su media.
La media, mediana y moda son iguales.
3 4
Corresponde a una variable con distribucin normal con media 0
y varianza 1:
2
2
1
2
1
) (
z
e z f

y cuyas probabilidades P(Z z) estn tabuladas en la deno-


minada tabla normal.
Estandarizacin de una variable con distribucin normal
Una variable aleatoria X con distribucin normal con media y
varianza
2
puede ser transformada en una variable normal es-
tndar:
La distancia entre la recta x = y el punto de inflexin de la
curva es igual a .
La distribucin normal constituye realmente una familia
de distribuciones, puesto que para cada valor de y existe
una distribucin diferente.
La curva de la distribucin normal se extiende de - hasta +.
Si levantamos perpendiculares entre:
Si una variable aleatoria X tiene una distribucin normal, pue-
den calcularse las probabilidades de que X tome valores entre a y
b, P(a X b). Puesto que X es una variable aleatoria continua P(a
X b) = P(a < X < b)
Distribucin normal estndar
- y - corresponde aproximadamente al 68.3% del rea total.
- 2 y - 2 corresponde aproximadamente 95.4% del rea total.
- 3 y - 3 corresponde aproximadamente 99.7% del rea total.
3 5
) 1 , 0 ( ~

) , ( ~ N
X
Z N X



Las reas de la distribucin normal estndar corresponden
a probabilidades que se encuentran tabuladas. En la Tabla A del
Apndice se presentan las reas bajo la curva entre - y z
0
, es
decir P(Z z
0
).
Ej empl o 1.7
Vamos a determinar las siguientes probabilidades:
a) P(Z<1.45)
b) P(-1.2< Z < 2.1)
c) P( Z > 1.75)
d) Cul es el valor de z
0
si P( Z < z
0
) = 0.9505
Sol uci n
a) En la Tabla A se encuentra el rea acumulada hasta 1.45,
esta corresponde al valor de la siguiente probabilidad
P(Z<1.45) = 0.9265.
Asimismo, el SPSS nos proporciona estas probabilidades:
Ingresar al EDITOR DATA y accesar a TRANSFORM y lue-
go COMPUTE
Muestra la pantalla COMPUTE VARIABLE y se escoge la fun-
cin CDF.Normal(zvalue) con parmetros media 0 y varian-
za 1.
3 (
Se obtiene la probabilidad requerida.
b) P(-1.2< Z < 2.1) = P(Z< 2.1) - P(Z<-1.2) = P(Z< 2.1) + P(Z<1.2) - 1
= 0.9821 + 0.8849 1
= 0.8670.
c) P( Z > 1.75) = 1- P( Z < 1.75) = 1- 0.9599 = 0.0401.
Z = 1.45

2
= 1
= 0

3 7
d) En la Tabla A, para obtener z
0
donde P(Z< z
0
) =0.9265, se ubi-
ca el valor de la probabilidad en este caso 0.9505 y el cuantil
correspondiente es 1.65.
Ej empl o 1.8
Supongamos que se sabe que el peso de una poblacin de alum-
nos que practican natacin sigue una distribucin normal, con
una media de 63 Kg y una desviacin estndar de 10 Kg.si se
elige aleatoriamente un estudiante, vamos a responder las siguien-
tes preguntas:
a) Cul es la probabilidad que tenga ms de 69 Kg de peso?.
b) Cul es la probabilidad que tenga menos de 58 Kg de peso?.
c) Cul es la probabilidad que un alumno elegido al azar, ten-
ga entre 60 y 65 Kg?.
Sol uci n
La variable aleatoria en estudio es X : Peso y X ~ N( 63, 10
2
),
donde = 63
2
= 100 = 10
Estandarizando la variable aleatoria
) 1 , 0 ( ~
10
63
N
X
Z

a)
( ) ( )
( )
2743 . 0
7257 . 0 1
6 . 0 1
10
63 69
10
63
1
69 1 69

,
_


>
Z P
X
P
X P X P
b)
3 8
( )
( )

6915 . 0
5 . 0
10
63 58
10
63
58

,
_


Z P
X
P X P
c)
( )
( ) ( )
( ) ( )
0.1972
1 - 0.6179 0.5793
1 - 3 . 0 2 . 0
3 . 0 2 . 0
2 . 0
10
63
3 . 0
10
63 65
10
63
10
63 60
65 60

+
< + <
< <

,
_

<

,
_

<

<
Z P Z P
Z P Z P
X
P
X
P X P
Distribucin Ji cuadrado, t de Student y F de Snedecor
Distribucin Ji cuadrado
Si la variable aleatoria tiene funcin de densidad de probabili-
dad dada por,
( )
0
2
2
1
) (
2
1
2
2 /
>

,
_


x si e x
n
x f
x n
n
Se dice que la variable aleatoria tiene distribucin ji cuadra-
Normal
0.6915
3 9
do con grados n de libertad. La distribucin ji cuadrado es una
distribucin asimtrica y se denota como
2
) (
~
n
X
Funcin de densidad de probabilidad
de la distribucin ji cuadrado
Esperanza y varianza
. 2n Var(X) y n E(X)
La distribucin ji cuadrado y su relacin con la distribucin nor-
mal
Si
( )
1
2
2

n
X X
S
i
Es la varianza de una muestra aleatoria
n
X X X ,..., ,
2 1
de tama-
o n, seleccionada de una poblacin distribuida normalmente con
media y
2
, entonces:
2
2
) 1 (

S n
Tiene distribucin ji cuadrado con n - 1 grados de libertad.
4 0
El nmero de grados de libertad en toda operacin estadsti-
ca es igual al nmero de observaciones menos toda restriccin
impuesta a tales observaciones. Una restriccin es cualquier va-
lor que deba calcularse en base a dichas observaciones.
La variable que sigue una distribucin ji cuadrado se re-
presenta por la letra griega
2

y toma solamente valores no


negativos.
En la tabla C del Apndice se tienen tabuladas las probabili-
dades para una variable aleatoria ji cuadrado para diferentes
grados de libertad.
Ej empl o 1.9
Un grupo de investigadores conoce que los coeficientes intelec-
tuales de una poblacin de nios, sigue una distribucin normal
con varianza igual a 4. Seleccionan una muestra aleatoria de ta-
mao 17 de esta poblacin y desean conocer la probabilidad de
que la varianza muestral sea a lo ms 4.86.
Sol uci n
En este caso: n =17,
2
= 4 y
) 16 (
2
2
~
) 1 (

S n

,
_

,
_

,
_


4 . 19
2
) 16 (

85 . 4
4
16
2
) 16 (

85 . 4
2
) 1 (
2
2
) 1 (
) 85 . 4
2
(
P
P
n S n
P S P

Se ingresa a la Tabla C con 16 grados de libertad y la abscisa
19.4 encontrndose el valor de la probabilidad igual a 0.75, es
decir: 75 . 0 ) 85 . 4
2
( S P
Propiedades
4
Si elevamos al cuadrado una variable aleatoria con distribucin
N(0,1) se genera una variable ji cuadrado con un grado de liber-
tad, es decir:
2
) 1 (
~
2
) 1 , 0 ( ~
i
Z N
i
X
i
Z

Si se tiene n variables aleatorias independientes con distri-


bucin N(0,1), la suma de los cuadrados de dichas variables tie-
ne distribucin ji cuadrado con n grados de libertad.
2
) (
~
2
1 1
2
n
n
i
i
X n
i
i
Z

,
_

Distribucin t de Student
Si la variable aleatoria X tiene funcin de densidad dada por:
( )
< <
+

+

+
1
1
1
1
]
1

,
_

,
_

x
n
x
n
n
n
x f
n
,
2
1
1
2

2
1
) (
2
1
se dice que tiene distribucin t de Student con n grados de
libertad.
Notacin: X ~ ) (n t
Y los parmetros poblacionales son la media y la varianza:
4

2
0


n
n
Var(X) y E(X)
En 1908, W.S. Goset, quien escriba bajo el seudnimo de Stu-
dent, describi la distribucin de la variable:
n S
X
t

Como una variable con distribucin t con n-1 grados de li-


bertad, cuando la muestra es seleccionada desde una poblacin
normal con media y varianza
2
. Esta distribucin permitir
realizar inferencias relacionadas a la medias poblacionales cuan-
do la varianza es desconocida. Se debe notar que el denomina-
dor de la variable t, contiene la desviacin estndar muestral S
en lugar de .
En la tabla B del anexo se tienen tabuladas las probabili-
dades para una variable aleatoria t para diferentes grados de
libertad.
Ej empl o 1.10
Si X es una variable aleatoria con distribucin t con 10 grados de
libertad se obtendr las siguientes probabilidades:
a) P(X
(10)
2.228)
b) P(X
(10)
2.228)
c) P(|X
(10)
| 2.228)
Sol uci n
a) En la fila 10 de la Tabla B se encuentra que el valor de la
probabilidad es 0.975, es decir P(X 2.228) = 0.975.
b) P(X 2.228) = 1- P(X 2.228) = 1- 0.975 = 0.025
c) P(|X| 2.228) = P(-2.228 X 2.228) = P(X 2.228) - P(X - 2.228)
4 3
= P(X 2.228) [ 1 - P(X - 2.228) ]
= 2 P(X 2.228) - 1
= 2 (0.975) 1
= 0.95
Utilizando el SPSS, ejecutar los comandos Transform/ Com-
pute/ escoger la funcin CDF.T(2.228,10)/ OK.
en el Editor del SPSS:
Funcin de distribucin
Cuantil: q = 2.228
Grados de libertad
4 4
Distribucin F de Snedecor
Si la variable aleatoria X tiene funcin de densidad por
0 ,
1
2 2
2
) (
2
1
2
2
>
1
]
1

,
_

,
_

,
_

,
_

x
x
n
m
x
n
m
n m
n m
x f
n m
m
m
Se dice que X tiene distribucin F con m y n grados de libertad.
Notacin: X ~ F(m, n)
Ejemplo 1.11
4 5
Se encontrarn algunas probabilidades para ilustrar el uso de la
Tabla D del anexo.
a) Si X tiene una distribucin F con m = 9 y n = 10 grados de
libertad, encontraremos
P(X 3.14).
b) Si tiene una distribucin F con m = 7 y n = 15 grados de liber-
tad, encontraremos
P(X 4.57).
c) Si tiene una distribucin F con m = 8 y n = 5 grados de liber-
tad, encontraremos
P(X 6.63).
Sol uci n
a) En la Tabla D ubicamos la interseccin de la fila correspon-
diente a m = 10 y la columna correspondiente n = 9 y se en-
cuentra el cuantil 3.14 al que le corresponde una probabili-
dad de 0.95.
Es decir, X ~ F(10, 9) P( 3.14) = 0.95.
b) P(X 4.57) = 1- P(X < 4.57) = 1- 0.975 = 0.025
Es decir, X ~ F(15, 7) P(X 4.57) = 0.025
c) Si X ~ F(5, 8) P(X 6.63) = 0.99
Utilizando el SPSS para resolver el item a) ejecutar los si-
guientes comandos:
Transform/ Compute/ escoger la funcin CDF.F(3.14,9,10)/
4 (
OK.
Se obtiene la probabilidad deseada.
Distribuciones muestrales
Cuantil: 1 = 3.14 m = 9 n = 10
4 7
El estudio de determinadas caractersticas de una poblacin se efec-
ta a travs de diversas muestras que pueden extraerse de ella y
las estadsticas obtenidas de las muestras permiten estimar los
parmetros de la poblacin. Por ello, en el proceso de hacer infe-
rencias respecto a una poblacin en estudio, basndonos en infor-
macin muestral, es necesario conocer la relacin que se establece
entre estadsticas y parmetros. Esta se realiza a travs de la dis-
tribucin muestral de una estadstica.
Definicin La distribucin muestral de una estadstica es la dis-
tribucin de todos los posibles valores que puede tomar la estads-
tica, calculada en base a muestras del mismo tamao, selecciona-
das aleatoriamente de una misma poblacin.
El conocimiento de las distribuciones muestrales permite
conocer mnimamente la media y la varianza de la estadstica.
En el caso de considerar poblaciones finitas y discretas, se
puede construir empricamente una distribucin de probabilidad
de la siguiente manera:
Se seleccionan aleatoriamente todas las muestras posibles
de tamaon de una poblacin finita de tamao N.
Se calcula la estadstica de inters para cada una de las
muestras.
Se organizan los valores observados de la estadstica y se
obtienen sus respectivas frecuencias.
En aquellos casos en los cuales la poblacin no es finita, se
obtiene un gran nmero de muestras del mismo tamao de esta
poblacin y as se obtiene una aproximacin de la distribucin
muestral.
Algunas estadsticas de importancia son la media mues-
4 8
tral(
X
), la varianza muestral(
2
S
), la diferencia de medias mues-
trales en el caso de dos muestras (
2
1
X X ), el cociente de varian-
zas muestrales
) (
2
2
2
1
S
S
.
Cabe establecer la diferencia entre la distribucin poblacio-
nal de la variable, la distribucin muestral de la estadstica y la
distribucin de la muestra observada, para lo cual se toma el si-
guiente ejemplo, que por razones estrictamente metodolgicas,
la poblacin es de tamao 5.
Ej empl o 1.12
En una poblacin conformada por 5 docentes donde la variable
en estudio es el nmero de aos de experiencia docente (
X
).
Encontraremos:
a) la distribucin poblacional de la variable.
b) La distribucin muestral de la estadstica media muestral
( X ).
c) La distribucin de una de las muestras observadas.
Sol uci n
a) La distribucin de la variable aleatoria aos de experiencia
docente es la siguiente, donde se obtiene la media y la va-
rianza poblacional:
DOCENTE AOS DE EXPERIENCIA
DOCENTE (X)
1 x
1
=2
2 x
2
=3
3 x
3
=4
4 x
4
=5
5 x
5
=6
4 9

( ) ( )
2

5
4
4
5
1
2
1
2
2
5
1 1






N
i
i
N
i
i
i
i
N
i
i
X X
X X
N
N

b) Distribucin muestral de la estadstica: media muestral (


X
).
A continuacin se presenta todas las posibles muestras de
tamao n=2 seleccionadas desde la poblacin de tamao N=5 y
sus respectivas medias muestrales. Las muestras que aparecen
sombreadas indican que son muestras obtenidas en base a un
muestreo con reemplazamiento. Las restantes son resultado de
un muestreo sin reemplazamiento
Segunda seleccin
Primera 2 3 4 5 6
seleccin
Muestra
x
Muestra
x
Muestra
x
Muestra
x
Muestra
x
2 (2,2) 2 (2,3) 2.5 (2,4) 3 (2,5) 3.5 (2,6) 4
3 (3,2) 2.5 (3,3) 3 (3,4) 3.5 (3,5) 4 (3,6) 4.5
4 (4,2) 3 (4,3) 3.5 (4,4) 4 (4,5) 4.5 (4,6) 5
5 (5,2) 3.5 (5,3) 4 (5,4) 4.5 (5,5) 5 (5,6) 5.5
6 (6,2) 4 (6,3) 4.5 (6,4) 5 (6,5) 5.5 (6,6) 6
Se organizaran el conjunto de todos los posibles valores obteni-
dos en base a las muestras de tamao dos, considerando el mues-
treo con reemplazamiento y el muestreo sin reemplazamiento.
Si el muestreo es con reemplazamiento el nmero total de
posibles muestras es N
n
, para este ejemplo N=5 y n=2 obte-
nindose 5
2
=25 muestras.
5 0
Se obtiene el valor (
x
) de la media muestral (
x
) para cada
una de las muestras.
En una tabla se organizan los valores (
x
) obtenidos para las
muestras de tamao 2 y sus respectivas frecuencias.
En una tabla se organizan los valores
x
obtenidos para las
25 muestras de tamao 2 y sus respectivas frecuencias.
x
x
Frecuencia Frecuencia
absoluta Relativa
i
f
2.0 1 1/25
2.5 2 2/25
3.0 3 3/25
3.5 4 4/25
4.0 5 5/25
4.5 4 4/25
5.0 3 3/25
5.5 2 2/25
6.0 1 1/25
Total 25 1.00
5
Para el muestreo con reemplazamiento:
La media y la varianza de la media muestral
x
son:
4
25
100
25
6 ) 5 . 5 ( 2 ... ) 5 . 2 ( 2 2
25
8
1

+ + + +



i
i
i f x
X
donde la media de la distribucin muestral de
x
tiene el mis-
mo valor que la media poblacional.
1
25
25
25
4 6 4 5 . 2 4 2
25
4
2 2 2
8
1
2
... 2
2


,
_

+ +
,
_

+
,
_

,
_

i
i
f
i
x
X

donde la varianza de la distribucin muestral de xes igual


a la varianza poblacional dividida entre el tamao de la mues-
tra, es decir
1
2
2
2
2

n
X
X

Los resultados obtenidos en este ejemplo conducen a sealar


que cuando el muestreo se realiza con reemplazamiento desde
una poblacin finita:
La media de la estadstica xes igual a la media de la po-
blacin.
La varianza de la estadstica xes igual a la varianza de la
poblacin dividida entre el tamao de la muestra.
xtiene media y varianza
n
2

.
c) Distribucin de la muestra
Esta distribucin se refiere a la distribucin de la variable X
en la muestra observada.
Si la muestra observada es el par (5,2), entonces para el n-
mero de aos en la docencia tenemos:
su
5 . 3
2
2 5

+
x
y su varianza:
( )
n
x x
s
i
i

2
1
2
2
=
( ) ( )
2
5 . 1 5 . 1
2 2
+
=2.25,
Valores con los que en la prctica estimamos la media po-
blacional y la varianza poblacional de la variable.
5
Para el muestreo sin reemplazamiento
El nmero total de posibles muestras es:

)! ( !
!
n N n
N
n
N

,
_

Y para este ejemplo N=5 y n=2 se obtienen


( )
10
)! 2 5 ( ! 2
! 5
2
5

muestras.
Se obtiene el valor ( x) de la media muestral para cada una
de las muestras.
En una tabla se organizan los valores ( x) obtenidos para las
10 muestras de tamao 2 y sus respectivas frecuencias.
x
Frecuencia Frecuencia
Absoluta relativa
i
f
2.5 1 1/10
3.0 1 1/10
3.5 2 2/10
4.0 2 2/10
4.5 2 2/10
5.0 1 1/10
5.5 1 1/10
Total 10 1.00
5 3
Se deja como ejercicio obtener la media y la varianza de la
media muestra.
Distribucin de la media muestral
Formalizando la presentacin hecha previamente tenemos que:
Si X es una variable aleatoria con distribucin normal con
media y varianza conocida
2
y desde dicha poblacin se toma
una muestra aleatoria
n
X X ,...,
1
de tamao n; se prueba que la
variable estandarizada:
n
u X
Z

tiene distribucin N(0,1) (1.1)


donde es la media muestral.
La expresin (1.1) ser usada en el siguiente captulo para
construir el intervalo de confianza y en el captulo 4 para postu-
lar hiptesis para la media poblacional. En el siguiente ejemplo
vamos a ilustrar otro uso de la distribucin muestral de la media
muestral.
Ej empl o 1.13
Se tiene conocimiento que el gasto semanal de los adolescentes
que juegan en la internet sigue una distribucin normal con me-
5 4
dia igual a S/ . 18.00 y una desviacin estndar igual a S/ . 6.00.
Cul es la probabilidad de que una muestra aleatoria de 36 ado-
lescentes tenga un gasto semanal promedio entre S/ . 16.00 y S/ .
20.00?
Sol uci n
X: gasto semanal de los adolescentes en la internet
X
: media muestral de los gastos semanales de los adolescentes
en la internet
= 18 = 6
2
=36
2
/ n = 36/ 36 = 1
( ) 20 16 < < X P
=
( ) 18 20 18 16 < < X P
=
( ) 1 2 2 < X P
= 2(0.9772)-1 = 0.9544.
Puede decirse que la probabilidad de que el gasto semanal
promedio se encuentre entre S/ .16 y S/ . 20 es de 0.9544.
Distribucin de la media muestral cuando la varianza
poblacional es desconocida
Supongamos que la variable aleatoria X tiene distribucin nor-
mal con media y varianza

2
desconocida. Si desde dicha po-
blacin se toma la muestra aleatoria
n
X X ,....,
1
, la variable
aleatoria
n
S
u X
t

tiene distribucin t-Student con n -1 grados de


libertad, donde X y S son la media muestral y la desviacin
estandar muestral respectivamente.
En los siguientes captulos la estadstica:
n
S
u X
t

(1.2)
se usar para construir intervalos de confianza y postular
hiptesis respecto a la media poblacional, con el supuesto de que
la varianza poblacional es desconocida.
5 5
Distribucin de la media muestral en poblaciones no normales
(muestras grandes)
En la prctica en diversas investigaciones nos enfrentamos a
aquellos casos en los cuales la variable aleatoria en estudio no
sigue una distribucin normal. Puede visualizarse los datos ex-
ploratoriamente y comprobar este hecho o aplicar una prueba
que nos permita decidir con una probabilidad de error si se pue-
de afirmar que la variable sigue una distribucin normal. En el
caso de que la variable aleatoria no tenga una distribucin nor-
mal, se plantea como solucin: seleccionar una muestra de ta-
mao grande desde la poblacin en estudio y utilizar el teorema
de lmite central. Este teorema es uno de los ms importantes de
la estadstica y cumple un rol fundamental en las aplicaciones.
Teorema de Lmite Central: Sin tener en cuenta la forma fun-
cional de la poblacin de donde se selecciona la muestra, la me-
dia muestral calculada en base a una muestra extrada desde una
poblacin con media y varianza finita
2
, sigue una distribucin
aproximadamente normal con media y varianza
2
/ n, cuando
el tamao de muestra es grande. Es decir, la media muestral X de
una muestra aleatoria procedente de cualquier distribucin con
media y varianza finita
2
, se distribuye aproximadamente
como una variable normal con media y varianza
2
/ n.
Puede expresarse este resultado de la siguiente manera:

,
_

n
N
n
X f X
2
2
, ) , ( ~
As, cuando el tamao de muestra que se toma es suficiente-
mente grande (mayor que 30), an cuando no se conozca la dis-
tribucin de la variable X, por el teorema del lmite central, las
variables:
n
X
Z

y
n
S
X
t

(1.3)
5 (
Tienen distribucin aproximadamente normal, donde es una
muestra aleatoria de tamao n y
X
es la medial muestral.
Cabe indicar que dichas estadsticas pueden usarse para
construir intervalos de confianza para la media poblacional o
realizar pruebas de hiptesis para el mismo parmetro.
Ej empl o 1.14
En una poblacin de jvenes alcohlicos con edades entre 16 y 21
aos se conoce que el tiempo promedio de consumo de alcohol es
de 4 aos con una desviacin estndar de 2 aos. Cul es la pro-
babilidad de que en una muestra aleatoria de 100 jvenes alco-
hlicos de esta poblacin se obtenga un tiempo medio que fluc-
te entre 2 y 6 aos?.
Sol uci n
X: tiempo ( aos) de consumo de alcohol
= 4
2
= 4 = 2
2
/ n

= 4/ 100 = 0.04
100
2
4

X
Z
=
2 . 0
4

X
Z tiene distribucin y podemos calcular la
siguiente probabilidad:
( )

,
_

<

<

< <
2 . 0
4 6
2 . 0
4 2
6 2
n
X
P X P

= ( ) 10 10 < < Z P =1.


En base a una muestra aleatoria de tamao 100, la probabi-
lidad de promedio de aos de consumo de alcohol en jvenes entre
16 y 21 aos es 1.0.
Distribucin de la proporcin muestral P para un tamao de
muestra grande
En algunas situaciones el parmetro sobre el que se trata de eva-
luar hiptesis es la proporcin de elementos con cierta caracte-
5 7
rstica A ()en una poblacin. Por ejemplo, la proporcin de estu-
diantes que llegan temprano a la clase de estadstica, la propor-
cin de estudiantes provenientes de colegios privados que postu-
laron al proceso de admisin 2004-I a la UNMSM, la proporcin
de estudiantes motivados con la carrera profesional que han esco-
gido, etc. Estas situaciones implican el uso de la distribucin de la
proporcin muestral, P, a partir de la cual haremos inferencias.
Si
n
X X ,....,
1
es una muestra aleatoria de tamao n desde una
poblacin donde es la proporcin de elementos con cierta carac-
terstica A (en la muestra aleatoria),entonces, en muestras gran-
des tiene distribucin aproximadamente N(
n
) 1 (
,


), donde:

n
i
i
X
n
P
1
1
,

'

tica caracters la posee no elemento el si 0


tica caracters la posee elemento el si 1
i
X
. Luego, la estadstica:
n
P
Z
) 1 (

tiene distribucin aproximadamente N(0,1) (1.4)


y se usar para construir intervalos de confianza y postular
hiptesis para el parmetro poblacional .
Ej empl o 1.15
Se conoce que el 60% de los postulantes a la Universidad Nacio-
nal Mayor de San Marcos, proceden de distintas provincia del
pas. Si se selecciona aleatoriamente una muestra de 150 alum-
nos de esta poblacin. Cul es la probabilidad de que la propor-
cin muestral de estudiantes que proceden de provincias se en-
cuentre entre 0.50 y 0.70
Sol uci n
Debido a que se cuenta con una muestra de tamao grande pue-
de afirmarse que la distribucin de P se aproxima a una distri-
bucin normal con media p=0.60 y desviacin estndar:
n / ) 1 ( .
5 8
La probabilidad de que la proporcin muestral se encuentre
entre 0.50 y 0.70, puede ser obtenida de la siguiente forma:
( )
( )
( ) ( )
( )
98758 . 0
1 ) 993790 . 0 ( 2
1 5 . 2 2
5 . 2 5 . 2
5 . 2 5 . 2
04 . 0
10 . 0
04 . 0
10 . 0
0016 . 0
10 . 0
0016 . 0
10 . 0
150 ) 60 . 0 1 ( 60 . 0
60 . 0 70 . 0
150 ) 60 . 0 1 ( 60 . 0
60 . 0
150 ) 60 . 0 1 ( 60 . 0
60 . 0 50 . 0
70 . 0 50 . 0


<
< <
< <

,
_

< <

,
_

< <

,
_

<

<

< <
Z P
Z P Z P
Z P
Z P
Z P
P
P P P
La probabilidad que en una muestra de 150 postulantes, el
porcentaje de postulantes que proceden de provincias est entre
el 50% y 705 es 0.98758.
En muchos estudios educativos, es necesario comparar cier-
tas caractersticas en dos o ms grupos de sujetos; as por ejem-
plo, si pensamos aplicar un nuevo mtodo de enseanza como
aquel que puede tener un porcentaje mayor de alumnos aproba-
dos que otro mtodo de enseanza tradicional, o cuando nos
planteamos la pregunta si los nios de las distintas comunidades
rurales tienen la misma estatura.
Distribucin de la diferencia de medias cuando las varianzas
poblacionales son conocidas
Si X e Y son variables aleatorias independientes con distribucio-
nes
( )
2
1 1
, N
y
( )
2
2 2
, N
respectivamente; entonces, las medias
muestrales
1
X y
2
X , correspondientes a las muestras aleatorias
independientes
1
, 1 11
,...,
n
X X y
2
, 2 21
,...,
n
X X de tamao
1
n
y
2
n
tie-
nen distribuciones

,
_

1
2
1
1
,
n
N

y

,
_

2
2
2
2
,
n
N

respectivamente.
5 9
Con los supuestos anteriores, la diferencia de medias mues-
trales
2 1 X X
tiene distribucin

,
_

+
2
2
2
1
2
1
2 1
,
n n
N

y luego la
variable aleatoria estandarizada,
( ) ( )
2
2
2
1
2
1
2 1 2 1
n n
X X
Z


+

, tiene distribucin (1.5)


que tambin se usar para obtener intervalos de confianza y
pruebas de hiptesis para la diferencia de medias poblacionales:
2 1
.
Ej empl o 1.16
Un psiclogo tiene conocimiento que los temas relacionados con
la inteligencia emocional influyen en las expectativas profesio-
nales de los jvenes. Este profesional, recibe informacin que una
poblacin de jvenes capacitados sobre este tema obtuvieron una
nota promedio de 16 y una varianza de 4, y que otra poblacin
de jvenes que no recibieron capacitacin relacionada a este tema,
obtuvieron una nota promedio de 12 y una varianza de 3. Poste-
riormente selecciona dos muestras: una muestra de tamao 10
de la poblacin de jvenes capacitados (muestra 1) y otra mues-
tra de tamao 12 de aquellos que no recibieron capacitacin so-
bre este tema (muestra 2) y se pregunta por la probabilidad que
la diferencia entre la nota promedio de la muestra 1 con respecto
a la de la muestra 2 sea ms de 5 puntos.
Sol uci n
3 0 12 12
4 0 16 10
2
2 2 2
2
1 1 1




.
.
n
n
( ) ( )
) , ( ~ 1 0
12
3
10
4
12 16 2 1
N
X X
Z
+

( 0
( )
( ) ( ) ( )
1075 0
8925 0 1
24 1 1
65 0
1
12
3
10
4
12 16 5
12
3
10
4
12 16
2 1
5
2 1
.
.
) . (
.


<

,
_

>
+

>
+

>

,
_





Z P
Z P
X X
P X X P
La probabilidad que la diferencia entre las notas promedios
de aquellos jvenes que recibieron capacitacin con respecto a
los que no recibieron, supere los cinco puntos es de 0.1075.
Distribucin de la diferencia de medias muestrales cuando las
varianzas poblacionales son desconocidas e iguales
Si X e Y son variables aleatorias independientes con distribucio-
nes ( )
2
1
, N y ( )
2
2
, N respectivamente; entonces, las medias
muestrales
1 X y
2 X
correspondientes a las muestras aleatorias
independientes
1
, 1 11
,...,
n
X X y
2
, 2 21
,...,
n
X X de tamao n
1
y n
2
tienen
distribuciones de tamao n
1
y n
2
, tienen las siguientes distribu-
ciones

,
_

1
2
1
,
n
N

,
_

2
2
2
,
n
N

. Luego, la variable aleatoria


1 X y
2 X
estandarizada
( ) ( )
2
2
1
2
2 1 2 1
n n
X X
Z


+

, tiene distribucin ( ) 1 , 0 N
.
Como la varianza poblacional es desconocida, tiene que ser
estimada y en lugar de la variable estandarizada Z, se tiene la
variable aleatoria:
( )

1 1
) (
2 1
2
2 1
2
1

,
_

n n
p
S
X X
t

(1.6)
(
cuya distribucin es t-student con ( ) 2
2 1
+ n n y se denota
con
t
n n
( ) 2
2 1
+
, donde
( ) ( )
2
1 1
2 1
2
2
1
2
1
1
2
+
+

n n
n n
S S
S
p
es el estimador de la varianza pobla-
cional
2
.
Ej empl o 1.17
Un psiclogo tiene conocimiento que los temas relacionados a la
inteligencia emocional influyen en las expectativas profesiona-
les de los jvenes. Este profesional, recibe informacin que una
poblacin de jvenes capacitados sobre este tema obtuvieron una
nota promedio de 18, y que otra poblacin de jvenes que no re-
cibieron capacitacin relacionada a este tema, obtuvieron una
nota promedio de 11 y desconoce los valores de las varianzas,
pero considera razonable suponer que son iguales. Selecciona
muestras de tamao 14 de cada una de las poblaciones y en las
muestras obtiene
928 . 1
2
1
s

864 . 2
2
2
s
. El psiclogo desea de-
terminar la probabilidad que la diferencia entre las notas pro-
medios sea menor que 6.
Sol uci n
Se cuenta con la siguiente informacin:
14
2 1
n n
928 . 1
2
1
s

864 . 2
2
2
s
18
1
11
2

2
2
2
1

desconocidos
y se obtiene:
( ) ( )
5479 1
26
864 2 13 928 1 13
.
. .

p
S
( ) ( )

,
_

+
+

2 14 14
14
1
14
1
5479 1
11 18
2 1
t t
X X
~
) . (

( )

,
_

26 5851 0
7
2 1
t t
X X
~
.
(
( )
( )
( )
( )
. 05 . 0
95 . 0 1
) 709 . 1 ( 1
) 709 . 1 (
5851 . 0
1

14
1
14
1
5479 . 1
7 6
14
1
14
1
5479 . 1
11 18
2 1
6
2 1
26
26
26


<
<

,
_


<
+

<
+

<

,
_

,
_

,
_

t P
t P
t P
X X
P X X P
La probabilidad que la diferencia entre las notas promedios
de aquellos jvenes que recibieron capacitacin con respecto a
los que no recibieron, sea inferior a 6 puntos es de 0.05.
Distribucin de la diferencia de medias cuando las varianzas
poblacionales son desconocidas y diferentes
Si
1
X e
2
X son variables aleatorias independientes con distribu-
ciones
( )
2
1 1
, N
y ( )
2
2 2
, N
respectivamente, entonces, las me-
dias muestrales
1
X
y
2
X
, correspondientes a muestras de tama-
o n
1
y n
2
, tienen las siguientes distribuciones

,
_

1
2
1
1
,
n
N

,
_

2
2
2
2
,
n
N

y la estadstica


) (
2
2
2
1
2
1
2 1

,
_

n n
S S
X X
t
tiene distribucin
) (k
t , donde: (1.7)
los grados de libertad de la estadstica son

2
1 1
2
2
2
1
2
1
2
2
2
2
2
1
2
1
2
1
2

,
_

+
+

,
_

1
]
1

,
_

+
,
_

n
n
S
n
n
S
k
n
S
n
S
.
( 3
Si
30 k
, la estadstica tiene distribucin aproximadamente
normal. Si las muestras son suficientemente grande ( 30
1
n y
30
2
n ) e independientes, la estadstica
( )
2
2
2
1
2
1
2
1
n
S
n
S
X X
Z
+

tiene dis-
tribucin aproximadamente normal estndar.
Estos resultados se usarn posteriormente para abordar el
tpico de pruebas de hiptesis.
Distribucin de la diferencia de dos proporciones muestrales
En las poblaciones 1 y 2, con respectivas proporciones poblacio-
nales
1

y
2
( de estudiantes, profesores, etc.,para ser ms gen-
ricos, de unidades), con determinados atributos. Los parme-
tros que son las proporciones poblacionales tienen como esti-
madores en cada una de las muestras:
1
1
n
A
P
y
1
2
n
B
P
, donde
es el nmero de elementos con el atributo de inters en la prime-
ra muestra y es el nmero de elementos con el mismo atributo en
la segunda muestra. Cuando las muestras son suficientemente
grandes, la estadstica
( )
( )
1
]
1

+

2 1
2 1 2 1
1 1
1
) (
n n
P P
P P
tiene distribucin aproximadamente ) 1 , 0 ( N
donde
2 1
2 2 1 1
n n
P n P n
P
+
+
.
Ej empl o 1.18
Se conoce que el 50% de profesores de educacin superior de la
Regin Sur y el 33% de profesores de educacin superior de la
Regin Norte acreditan tener una maestra. De cada una de estas
( 4
poblaciones se seleccionan muestras de tamao 100 (no necesaria-
mente las muestras deben ser del mismo tamao). Cul es la pro-
babilidad que la diferencia entre las proporciones muestrales
sea inferior al 30%?.
Sol uci n
Poblacin 1

profesores de la Regin Sur mues-
tra de tamao 100
Poblacin 2 profesores de la Regin Norte mues-
tra de tamao 100
Caracterstica de inters: estudios de maestra.
Proporcin de profesores con estudios de maestra en la po-
blacin 1 0.50
Proporcin de profesores con estudios de maestra en la po-
blacin 2 0.33
Se supone que
2 1
P P , sigue aproximadamente una distri-
bucin normal con media
17 . 0 33 . 0 50 . 0
2 1
2
1


p p
y varianza
( ) ( )
004711 . 0
100
33 . 0 1 33 . 0
100
50 . 0 1 50 . 0
2
2 1

p
p

y
) 1 , 0 (
004711 . 0
17 . 0 ) (
100
2
100 1
2 1
N
P P
Z
n
n

La probabilidad buscada es:


( )

,
_


<

<
004711 . 0
17 . 0 30 . 0
004711 . 0
17 . 0 ) (
30 . 0
2 1
2 1
P P
P P P P
( )
9706 . 0
8940 . 1

< Z P
( 5
Distribucin muestral del cociente de varianzas
Si
1
X e
2
X son variables aleatorias independientes con distribu-
ciones
( )
2
1 1
, N
y
( )
2
2 2
, N
respectivamente, la estadstica F se
construye en base al cociente entre dos estadsticas ji cuadrados.

2
) (
2
) (

1 2
2
1
1 1
2
2
2
2
1
2
2
2
2
1
2
1
2
1
1
2
1
2
1
1
2
2
1
1
1
1

n
n

n
n
F

S n
S n
S n
S n
~
) (
) (
) (
~
) (


) , ( ~ 1
2
1
1
n n f
1.8940
( )
2
2 2
, N
La estadstica
2
2
2
1
S
S
F
tienen distribucin F-Sne-
decor con ( ) 1
1
n y ( ) 1
2
n grados de libertad.
Es decir,
) , ( ~ 1
2
1
1
2
2
2
2
2
1
2
1
n n f
S
S
F

(1.9)
( (
Ej empl o 1.19
Un asesor supone que la variabilidad en el nmero diario de ho-
ras de estudio es la misma en alumnos del ltimo ao de la carre-
ra profesional de lingstica y los alumnos del ltimo de bibliote-
cologa. El asesor selecciona una muestra aleatoria de 16 estu-
diantes del ltimo ao de lingstica independiente de una mues-
tra de 21 estudiantes de bibliotecologa y se quiere conocer la
probabilidad de que el cociente entre las varianzas muestrales
sea inferior a 1.84. Suponga varianzas poblacionales iguales.
Sol uci n
2
) 1 (21
~
2
2
2
) 20 (
2
2
2
) 1
2
(
2
) 1 (16
~
2
2
1
) 15 (
2
2
1
) 1
1
(

S S n

S S n


Funcin de densidad de probabilidad F
2
2
2
1
20
2
2
2
) 20 (
15
2
2
1
) 15 (
1
2
2
2
2
) 1
2
(
1
1
2
2
1
) 1
1
(
S
S
S
S
n
S n
n
S n
F

( 7
Ejercicios
1.1. Se conoce que 1000 estudiantes universitarios fueron clasi-
ficados de acuerdo con los puntajes que obtuvieron en el exa-
men de ingreso a la universidad y el colegio de procedencia.
La informacin es la siguiente:
En la tabla F_Snedecor con 15 y 20 grados de libertad para

,
_

< 84 . 1
2
2
2
1
S
S
P se encuentra el valor 0.90. Es decir:

,
_

< 84 . 1
2
2
2
1
S
S
P 90 . 0 ) 84 . 1 (
) 20 , 15 (
< F P .
La probabilidad de que el cociente entre las varianzas mues-
trales sea inferior a 1.84 es 0.90.
f(15,20)
0.90
1.84
Colegio de Procedencia
Puntaje Total
Estatal Privado
150 o menos 150 50 200
De 151-190 150 250 400
191 o ms 190 210 400
Total 490 510 1000
( 8
a) Calcular la probabilidad que un estudiante elegido al azar
haya obtenido un puntaje entre 151 y 190.
b) Calcular la probabilidad que un estudiante elegido al
azar haya obtenido un puntaje de 190 o menos.
c) Calcular la probabilidad que un estudiante elegido al
azar proceda de un colegio estatal.
d) Calcular la probabilidad que un estudiante elegido al
azar que haya obtenido un puntaje de 191 o ms y pro-
ceda de un colegio privado.
e) Calcular la probabilidad que un estudiante elegido al
azar que haya obtenido un puntaje de 150 o menos y
proceda de un colegio estatal.
1.2 Usted es un inspector de escuelas pblicas y realiza un expe-
rimento para investigar si la habilidad en lectura de estu-
diantes de primer ao de secundaria ha mejorado o no. Las
notas nacionales sobre la habilidad en lectura, para los estu-
diantes de primer ao de secundaria muestran una distribu-
cin normal con media de 80 palabras por minuto y una des-
viacin estndar igual a 12 palabras por minuto. En base a
una muestra aletoria de 185 estudiantes de esta poblacin:
a) Determine la probabilidad de que la media muestral sea
inferior a 82 palabras por minuto.
b) Determine la probabilidad de que la varianza muestral
sea superior a 100.
1.3 Aos de experiencia han demostrado que un examen de ad-
misin a la Facultad de Educacin de una Universidad, los
estudiantes obtienen en media 140 puntos con una desvia-
cin estndar de 10 puntos. En base a una muestra aleatoria
de 25 postulantes a la Facultad de Educacin se desea deter-
minar las siguientes probabilidades:
a)
( ) 145 < X P
b)
( ) 142 138 < < X P
c)
( ) 143 > X P
( 9
1.4 Hace tres aos el ministro de Educacin afirm que histrica-
mente la proporcin de alumnos que estudian en zonas rura-
les y abandonan sus estudios al culminar el tercer ao de pri-
maria es de 0.30. En los ltimos dos aos el gobierno ha reali-
zado inversiones en infraestructura y docencia en dichas zo-
nas rurales con la esperanza de revertir el resultado plantea-
do por el ministro. Con el fin de evaluar los cambios, despus
de dos aos se tomo una muestra aleatoria de 500 estudian-
tes. Determine la probabilidad que la proporcin muestral de
alumnos que estudian en zonas rurales abandonen sus estu-
dios al culminar el tercer ao de primaria sea inferior a 0.28.
1.5 Un investigador en el campo educativo sostiene que el m-
dulo didctico empelado en la enseanza de las Matemti-
cas es uno de los factores que influyen y determina en el pro-
ceso de enseanza-aprendizaje y por lo tanto, el mdulo
adoptado incidir en el rendimiento acadmico de los estu-
diantes. Se decide realizar el siguiente experimento: Duran-
te un semestre se llev a cabo el trabajo lectivo en dos gru-
pos independientes de estudiantes de la misma carrera en la
misma Universidad, empleando dos mtodos (A y B) de ca-
ractersticas bien diferenciadas. Al final del curso se aplic
el mismo examen a todos los estudiantes que obtuvieron las
siguientes notas.
Suponiendo que las muestras provienen de poblaciones nor-
Mtodo A 15 16 15 13 13 16 16 14 17
Mtodo B 13 14 14 11 12 14 13
males con media 15
1
y varianza
4
2
1

; con media 13
1
y
varianza
4
2
2

, respectivamente. Determine las siguientes pro-
babilidades:
a)
( ) 0 2 1
> X X P
7 0
b)
( ) 2 2 1 < X X P
c)

,
_

< 2
2
2
2
1
S
S
P
1.6 Para determinar el efecto que tiene sobre el desarrollo psico-
lgico de los escolares el hecho de que tiene que viajar al
colegio en mnibus de servicio publico, se tom una prueba
de ansiedad a una muestra de 40 escolares que usan este sis-
tema de transporte y a otra muestra de 30 escolares que van
caminando al colegio. Se sabe que la media de la poblacin 1
es de 144 puntos y la media de la poblacin 2 es de 139 pun-
tos, as como las varianzas poblacionales 9 y 6 respectiva-
mente. Suponga que las distribuciones se distribuyen nor-
malmente.
a) Cul es la probabilidad que la media de la muestra 1
sea inferior a la media de la muestra 2?.
b) Cul es la probabilidad que el cociente de la varianza
de la muestra 1 entre la varianza de la muestra 2 sea
inferior?

Você também pode gostar