Você está na página 1de 61

2

Factor de continuidad
de correccin
UNIDAD 1: DISTRIBUCIONES FUNDAMENTALES
PARA EL MUESTREO
Conceptos bsicos:
Estadstica descriptiva: recopila, ordena, agrupa, analiza y representa datos.
Estadstica Inferencial: infiere en muestras en base a N para la toma de decisiones.
Parmetro: medida para describir cualquier caracterstica con respecto a la poblacin.
Estadstico: medida para describir cualquier caracterstica con respecto a la muestra.
Parmetro Estadstico
=media poblacional
x =media muestral
o =Desviacin poblacional s =desviacin muestral
2
o =Varianza poblacional
2
s =varianza muestral

DIFERENCIAS ENTRE PROPORCIONES POBLACIONALES VS
PROPORCIONES MUESTRALES
Formulas:
N
x
P =
n
Pq
= o
1
) (
2
2 2
1
1 1
2 1

+ =
N
n N
n
q P
n
q P
P P
n
x
p = (Proporcin muestral) Cota de error de la proporcin:

Problemas:
1. Estudios realizados demuestran que el uso de gasolina para autos compactos
vendidos en estados unidos esta normalmente distribuidos con una
Qu porcentaje de autos compactos recorre 30 millas por galn o ms? P=?
o
M x
Z

= 1
5 . 4
5 . 25 30
=

= Z



rea de Z:
0.5
P E o
2

Z =
n
Pq
E
2

Z =
2
2
E
Pq
n

Z
=
1 = Z
5 . 25 = M
0.5
30 68%
1 = Z 1 = Z
0.341
3
0.341
3
158 . 0 3413 . 0 5 . 0 ) 1 ( ) ( = A Z A
3

2. Se toma como muestra aleatoria de n=36 de una distribucin de con una M=75 y
con una o =12.
a) La distribucin muestral de la media x ser aproximadamente _80__ con una
M=_75__ y o = __2___
b) Para hallar la probabilidad de que la media muestral x exceda de 80, anote el
evento de inters__0.62%___

USO DE LA t DE STUDENT
Con
2
o conocida con o conocida
30 > n
n
x
Z
o

=
N
x


=
2
) (
o
Con
2
o desconocida con o desconocida
30 < n
n
s
x
t
x
=

=
o


1
) (
2

=

n
x
s

1 n =grados de libertad (gl,D,v, df)

DISTRIBUCIN MUESTRAL DE LA PROPORCIN MUESTRAL
Formulas:
1

=
N
n N
n
x
Z
x
o
o

np = = npq = o npq =
2
o
1

=
N
n N
n
pq
P p
Z
p
o





4

Problemas:
1. Muestras aleatorias de tamao n se seleccionaron en poblaciones binomiales con
parmetros P poblacionales dados aqu. Encuentre la media y la desviacin estndar
de la distribucin muestral p en cada caso para n=100 y P=0.3; n=400 y P=0.1
? = ? = o

30 ) 3 . 0 ( 100 = = = np 40 ) 1 . 0 )( 400 ( = =
56 . 4 ) 7 . 0 )( 3 . 0 )( 100 ( = = npq o 6 ) 9 . 0 )( 1 . 0 )( 400 ( = = o

DEFINICIN DE LA DISTRIBUCIN DE LA MEDIA MUESTRAL
Supongamos que cada una de nuestras muestras consta de 10 ingenieros industriales
de 25 aos de edad que viven en una cuidad de 100 mil habitantes (una poblacin
infinita, de acuerdo con nuestro tratamiento). Al calcular la altura media y la
desviacin estndar de esa altura, para que cada uno de estos ingenieros, rpidamente
observaran que la media y la desviacin estndar de la muestra serian diferentes. Una
distribucin de probabilidad de todas las medias posibles de las muestras, es una
distribucin de las medias de las muestras. Los estadsticos la conocen como
distribucin de muestreo de la media.
Sugerencia
El conocimiento de la distribucin de muestreo permite a los estadsticos planear
muestras de tal forma que los resultados sean significativos. Como sabemos que
resulta caro recabar y analizar muestras grandes, por eso nosotros como ingenieros
siempre procuramos obtener las muestras ms pequeas que proporcionen un
resultado confiable.
Problemas:
1. La hall corporation fabrica grandes sistemas de computo y siempre se ocupado con
la confiabilidad de sus unidades de procesamiento centros de sistemas 666. De hecho
la experiencia pasada ha mostrado que el tiempo improductivo mensual de los CPU
666 promedio 41min. Con la desviacin estndar de 8 min. El centro de cmputo de
una gran universidad estatal mantiene una instalacin formada por 6 CPU del sistema
666 James Kitchen, el director del centro siente que se proporciona un nivel
satisfactorio de servicio a la comunidad universitaria si el tiempo improductivo
5

promedio de las 6 CPU es menor de 50 min. Al mes. Dado cualquier mes cual es la
probabilidad se sienta satisfecho con la red de servicio?
m 41 = min 8 = o 6 = n ) 50 ( < x p
% 7 . 99 997 . 0 5 . 0 497 . 0 755 . 2
6
8
41 50
= = + =

= area
n
x
Z
o


2. El costo de las prescripciones de patentes se fija para dar apoyo a investigaciones y n
desarrollo de estos medicamentos, que se pueden tardar hasta 20 aos. Sin embargo
una mayora de personas de cierto pas dice que los costos de medicamento de
patentes (66%), los costos de hospital (64%) y las visitas de mdicos (55%) son
irracionalmente altos. Suponga que se toma una muestra aleatoria de 1000 adultos. Se
la p (proporcin muestral) la proporcin de adultos que dicen que los precios de
medicinas con recetas son irracionalmente altos.
a) Cul es la probabilidad de que p exceda de 68%? ) 68 . 0 ( > p p
Datos:
1000 = n p =660 (66%) P=680
335 . 1
1000
) 320 )( 680 (
680 660
=

=
n
pq
P p
Z

3. Utilizar las tablas de reas bajo la curva normal entre los valores dados:
a) 3 . 0 = Z y 56 . 1 = Z
=0.1179 =0.4406----------0.4406-0.1179=0.3227= 32.27%

b) 3 . 1 = Z y 74 . 1 = Z
=0.4032 =0.4591-----------0.4032+0.4591=0.8623=86.23%

c) Encuentre la probabilidad de que ( ) 75 . 0 > Z P :
Para z=0.75=> rea=0.2734-------0.2734+0.5=0.7734=77.34%




6

4. Se diseo un nuevo sistema para el control de inventario de un pequeo fabricante,
con el propsito de reducir el mismo para un motor elctrico en particular, a menos de
3 000 motores por da. Se llevo a cabo un muestreo de inventario en reserva al final de
cada uno de 8 das, seleccionados aleatoriamente; los resultados son los que se
muestran en la siguiente tabla.
Numero de motores
2905 2895
2725 3005
2835 2835
3065 2605

Utilizando la distribucin de muestreo respectivo seale o indique mediante una
grafica si hay evidencia que seale el promedio del numero de motores en el
inventario es menor que 3 000 utilizando un coeficiente de confianza de 95% y un nivel
de significancia de 5%
Datos:
8 = n 05 . 0 = 025 . 0
2
=

3000 = 7 1= = n gl
Condicin: 3000 ( < x p ) 76 . 146 2859 75 . 2858 = = = s x
7172 . 2
8
76 . 146
3000 2859
=

=
n
s
x
t


Aumento la confianza y disminuyo la significancia, si hay suficiente evidencia a la
pregunta.






05 . 0 =
9 . 1 =

t
7172 . 2 =

t
7

5. Los costos variables, principalmente de la mano de obra, hacen que los precios de la
construccin varen de una con respecto a otra.
Un constructor necesita tener una ganancia media arriba de 8500 DLL para alcanzar
una ganancia mensual establecida como meta. Las ganancias por cada una de las 5
construcciones ms recientes del constructor, son de 8760 DLL, 6370 DLL, 9620 DLL,
8200DLL y 10350DLL, respectivamente.
Proporcionan los datos evidencia que indique que el constructor estaba trabajando al
nivel de ganancia deseado con un nivel de significancia de 05 . 0 = o ?

Datos:
5 = n 05 . 0 = 8500 = 4 1 5 1 = = = n gl
Condicin: 8500 ( > x p ) 148 . 1520 8660 = = s x
2353 . 0
5
148 . 1520
8500 8660
=

=
n
s
x
t




El nivel de significancia
Se encuentra entre 40% y 45%



DISTRIBUCIN DE MUESTREO DE LA DIFERENCIA DE MEDIAS:

( )
2
2
2
1
2
1
2
1
2
2
2
1
2
1
2
1
n
S
n
S
x x
n n
x x
Z

=
o o

Para muestras pequeas:
2 1
2 1
2 1
2 1
2
2
1
2
2 1
1 1 1 1
n n
x x
n n
x x
n n
x x
t
+

=
+

=
+

=
o
o o

13 . 2 =

t
2353 . 0 =

t
95 . 0
8


o = Estimador ponderativo de la desviacin
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1
+
+
=
n n
s n s n
o
2
) ( ) (
2 1
2
2
1
2
1
1
+
+
=
= =
n n
x x x x
i
n
i
i
n
i
o

1
) (
1
2
1
1
1


=
=
n
x x
i
n
i
o
1
) (
2
2
2
1
2


=
=
n
x x
i
n
i
o

Problemas:
1. Se seleccionaron dos muestras aleatorias independientes de las poblaciones:
80
1
= n 80
2
= n
Los parmetros de las poblaciones y las medias muestrales as como las variables de
2
o muestrales se indican en la tabla:
Parmetros y estadsticos
Poblacin
1 2
Media poblacional
1

2

Varianza poblacional
1
o
2
o
Tamao de la muestra 80 80
Media muestral 11.6 9.7
Varianza muestral 27.9 38.4

Observe los datos y por intuicin diga si los datos proporcionan Suficiente
evidencia para que
2 1
M M > y realice la prueba utilizando un nivel de
significacin de 0.10 y sacar conclusiones:

Condicin:

2 1
>




Conclusin: si existe suficiente evidencia de que si hay un incremento de la madia
poblacional 1 con respecto a la 2. Con nivel de significancia de 0.10
( ) ( )
087 . 2
80
4 . 38
80
9 . 27
7 . 9 6 . 11
2
2
2
1
2
1
2
1
=

=
n
S
n
S
x x
Z
90 . 0
29 . 1 =

z
08 . 2 =

z
9

DISTRIBUCIN DE MUESTREO CON RESPECTO A 2 PROPORCIONES
POBLACIONALES
2
2 2
1
1 1
2 1
n
q p
n
q p
p p
Z
+

=
1
1
1
n
x
p =
2
2
2
n
x
p =
2 1
2 1
n n
x x
P
+
+
=
.

|
|
.
|

\
|
+

=
. .
2 1
2 1
1 1
n n
q p
p p
Z
Problemas:
1. El administrador de un hospital conjetura que el porcentaje de cuentas hospitalarias
no pagadas, aumento durante el ao anterior; los registros del hospital muestran que
las cuentas de 48 de 1284 personas admitidas en el mes de abril no haban liquidado
despus de 90 das; este nmero es similar a las 34 cuentas de 1002 pacientes
admitidas durante el mismo mes del ao anterior con estos datos hay suficiente
evidencia que indique un incremento en el porcentaje de cuentas liquidadas despus
de ms de 90 das? Utilice nivel de significancia de 0.10
Datos:
1284
1
= n 1002
2
= n
48
1
= x 48
2
= x
037 . 0
1284
48
1
1
1
= = =
n
x
p 034 . 0
1002
34
2
2
2
= = =
n
x
p 965 . 0 1 = =
.
p q
035 . 0
1002 1284
34 48
2 1
2 1
=
+
+
=
+
+
=
.
n n
x x
P

387 . 0
1002
1
1284
1
) 965 . 0 )( 035 . 0 (
034 . 0 037 . 0
=
|
.
|

\
|
+

= Z

385 . 0
1002
) 966 . 0 ( ) 034 . 0 (
1284
) 965 . 0 ( ) 037 . 0 (
034 . 0 037 . 0
=
+

= Z

La significancia aumento, por lo tanto los datos no son suficientes para indicar que la
proporcin de cuentas excede al % correspondiente al ao anterior.
29 . 1 =

Z
385 . 0 =

Z
90 . 0
10

2. Un fabricante modifico una lnea de produccin para reducir el promedio de la
fraccin de defectuosos. Para determinar si la modificacin fue efectiva, el fabricante
saco una muerta aleatoria de 400 artculos antes de la modificacin de la lnea de
produccin, y otra muestra aleatoria de 400 artculos despus de tal cambio. Los
porcentajes de defectuosos en las muestras eran: antes 5.25%, despus 3.5%, lleve a
cabo la prueba y saque sus conclusiones, si la modificacin no pudiera incrementar la
fraccin de defectuosos, utilice un nivel de significancia de 0.05:
Datos:
400
1
= n 400
2
= n
21
1
= x 14
2
= x
0525 . 0
1
= p 035 . 0
2
= p
95625 . 0 04375 . 0
400 400
14 21
2 1
2 1
= =
+
+
=
+
+
=
.
q
n n
x x
P
2 . 1
400
) 965 . 0 )( 035 . 0 (
400
) 9475 . 0 )( 0525 . 0 (
035 . 0 0525 . 0
=
+

= Z
Nuestra significancia aument.

DISTRIBUCIN DE MUESTREO PARA LA PROPORCIN POBLACIONAL:
Parte de
n
x
Z
o

=
n
pq
p p
Z

=

Problemas:

1. Aproximadamente uno de cada 10 favorece el refresco de cola de marca A. Despus
de una campaa de promocin en una regin de ventas dadas, se seleccionaron
aleatoriamente 200 bebedores de ese producto, de los consumidores en el rea del
mercado, y se les entrevisto para determinar la efectividad de la campaa. El resultado
de la encuesta mostro que un total de 26 personas expresaron su preferencia a la
bebida de la marca A.
65 . 1 =

Z
2 . 1 =

Z
90 . 0
11

Son los datos suficientes para indicar un aumento en la aceptacin de la marca en la
regin? Nivel de significancia de 0.10:
Datos:
200
1
= n
13 . 0
200
26
= = p
10 . 0
10
1
1
= = p
4121 . 1
200
) 10 . 0 )( 10 . 0 (
10 . 0 13 . 0
=

=
n
pq
p p
Z
Conclusin:
Significancia disminuyo:
Hay suficiente evidencia.


DISTRIBUCIN DE MUESTRA PARA UNA VARIANZA PROPORCIONAL
(CHI-CUADRADA)
2
X
Problemas:

1. Un fabricante de cemento afirmo que el concreto preparado con su producto
tendra una resistencia a la compresin relativamente estable y que, medida en
2
KNC
se ubicara en una amplitud de 40. Una muestra de 10 mediciones arrojo una media
312 = x y una varianza 195
2
= o .
Son suficientes los datos para rechazar la afirmacin del fabricante?
Datos:
10
1
= n 9 1= = n gl 10
2
= o
55 . 17
100
) 95 )( 1 10 (
2
=

= X
c

Regla de decisin:
91 . 16 55 . 17
2 2
> X > X
c
si, aumento confiabilidad y disminuyo significancia.
29 . 1 =

Z
4142 . 1 =

Z
91 . 16 =
12

PRUEBAS DE LA RAZN DE VARIANZA:
DISTRIBUCIN DE MUESTREO (ENTRE DOS VARIANZAS) f DE FISHER:

Problemas:

1. La variabilidad en la cantidad de impurezas presentes en un lote de productos
qumicos, utilizado para un proceso particular, depende del tiempo que tarda el
proceso.
Un fabricante que emplea 2 lneas de produccin 1 y 2 hizo un pequeo ajuste al
proceso 2 con la esperanza de reducir la variabilidad, as como la cantidad media de
impurezas en los productos qumicos. Muestras de 25
1
= n y 25
2
= n , mediciones de 2
lotes produjeron los siguientes medias y varianzas.
2 . 3 1 = x y 04 . 1
2
1
= S 0 . 3 2 = x y 51 . 0
2
2
= S
Presentan los datos evidencia suficiente para indicar que las variaciones de proceso
son menores para el 2? Nivel de significacin 10 . 0 = o

Formulas:
2
2
2
1
s
s
Fc =
(razn de varianzas) (numerador)
2
2
2
1
s s >
(numerador)
2
1
2
2
s s >

24
25
=
=
gl
gl
70 . 1 (Terica)
03 . 2
05 . 0
04 . 1
= = Fc


Se redujo el nivel de significancia





1
1
2 2
1 1
= =
= =
n gl v
n gl v
70 . 1 = f
03 . 2 = fc
13

UNIDAD 2: INTERVALOS
FORMULAS A UTILIZAR:
Intervalo de confianza para cuando o y
2
o conocido 30 > n

n
Z x
n
Z x
o

o
o o
2 2
+ < <
n
S
Z x
n
S
Z x
2 2
o o
+ < <
Intervalo de confianza para cuando o y
2
o desconocidos

n
S
t x
n
S
t x
2 2
o o
+ < <
Intervalo de confianza para proporcin poblacional
n
q p
Z p P
n
q p
Z p
2 2
o o
< <
n
q p
t p P
n
q p
t p
2 2
o o
< <
Diferencias de
2 1
(Muestras) poblacionales
2
2
2
1
2
1
2
2 1
2 1
2
2
2
1
2
1
2
2 1
n n
Z x x
n n
Z x x
o o

o o
o o
+ + < < +

2
2
2
1
2
1
2
2 1
2 1
2
2
2
1
2
1
2
2 1
n
S
n
S
t x x
n
S
n
S
t x x + + < < +
o o
Varianza diferente
|
|
.
|

\
|
+ + < <
|
|
.
|

\
|
+
2 1 2
2 1
2 1
2 1 2
2 1
1 1 1 1
n n
Sp t x x
n n
Sp t x x
o o
Varianza igual
Estimador ponderativo------
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1
+
+
=
n n
s n s n
Sp
Diferencias entre proporciones poblacionales
|
|
.
|

\
|
+

< <
|
|
.
|

\
|
+


2
2 2
1
1 1
2
2 1 2 1
2
2 2
1
1 1
2
2 1
n
q p
n
q p
Sp t p p P P
n
q p
n
q p
Sp t p p
o o

( ) ( )
erior h erior h X
S n
X
S n
inf 1
2
2
2
sup
2
2
1 1
o o
o

< <

Para la varianza
( ) ( )
hi h X
S n
X
S n
o o
o

< <

1
2
2
2
2
1 1
Para la desviacin
14

2 1
2 1
2
2
2
1
2
2
2
1
2
2
2
1
1
V V
V V
f
S
S
f S
S
< <
o
o
Para la razn de varianza

Cota del Error mximo permisible
n
Z E
o
o
2
=
n
Pq
Z E
2
o
=
Determinacin del tamao de la muestra
2
2 2
2
E
Z
n
o

=
Determinacin del tamao de la muestra para proporciones
2
2
E
Pq Z
n
h o
=


INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL
Problemas:
1. Encuentre un intervalo de confianza ) 1 ( 100% para una media poblacional en los
siguientes casos:
a) Cuando 01 . 0 =

38 = n

34 = x

12
2
= s

42 . 3 = s
Al 99% con rea de 0.4950 58 . 2
2
=

z

n
Z x
n
Z x
o

o
o o
2 2
+ < <

44 . 35 55 . 32
38
46 . 3
) 58 . 2 ( 34
38
46 . 3
) 58 . 2 ( 34 < < + < <
b) 10 . 0 =

65 = n

1049 = x

51
2
= s


Al 90% con rea de 0.45 65 . 1
2
=

z

5 . 1050 49 . 1047
61
1414 . 7
) 65 . 1 ( 1049
61
1414 . 7
) 65 . 1 ( 1049 < < + < <

15

c) 05 . 0 =

89 = n

3 . 63 = x

48 . 2
2
= s


Al 95% con rea de 0.475 96 . 1
2
=

z

627 . 63 97 . 62
89
548 . 1
) 96 . 1 ( 3 . 63
89
548 . 1
) 96 . 1 ( 3 . 63 < < + < <

2. Una muestra aleatoria de n=6 observaciones de una poblacin normal gener los
siguientes datos: 3.7, 6.4, 8.1, 8.8, 4.9, 5.0
10 . 0 =

6 = n

15 . 6 = x

95 . 3
2
= s

98 . 1 = s

5 1 6 1 = = n gl
a. Encontrar un intervalo de confianza al 90% para
n
S
t x
n
S
t x
2 2
o o
+ < <

6
98 . 1
) 02 . 2 ( 15 . 6
6
98 . 1
) 02 . 2 ( 15 . 6 + < <
78 . 7 5 . 4 < <

3. Se encuentra que la concentracin promedio de Zinc que se saca del agua a partir de
una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6g/ml, encuentre los
intervalos de confianza de 95% y 99% para la concentracin media de zinc en el sitio.
Su pngase que 3 . 0 = o

a. 3 . 0 = o
b. Qu tan grande se requiere una muestra si queremos tener 95% de confianza
de que nuestra estimacin de difiera al menos de 0.05
Datos:
36 = n

ml g x / 6 . 2 =

09 . 0
2
= o

3 . 0 = o

n
Z x
n
Z x
o

o
o o
2 2
+ < <

Al 95% con rea de 0.475 96 . 1
2
=

z

69 . 2 50 . 2
36
3 . 0
) 96 . 1 ( 6 . 2
36
3 . 0
) 96 . 1 ( 6 . 2 < < + < <


96 . 1
2
=

z 96 . 1
2
=

z
95 . 0
02 . 2
2
=

t 02 . 2
2
=

t
90 . 0
16

Al 99% 58 . 2
2
=

z

73 . 2 47 . 2
36
3 . 0
) 58 . 2 ( 6 . 2
36
3 . 0
) 58 . 2 ( 6 . 2 < < + < <
Para determinar la muestra:
Calcular: 098 . 0
36
3 . 0
96 . 1
2
= =
n
Z E
o
o
pero al ser intervalo--
5 . 0
2
098 . 0
~
De:
n
Z E
o
o
2
=
despejar
36
098 . 0
) 3 . 0 ( 96 . 1
2
2
2
=
|
.
|

\
|
=
|
|
|
.
|

\
|
=
E
Z
n
o
o

Para obtener muestra mxima al 95%:
138
) 5 . 0 (
) 3 . 0 ( ) 96 . 1 (
2
2 2
2
2 2
2
= = =

E
S Z
n


INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
Problemas:
1. Los siguientes datos representan el nmero de artculos producidos por el mtodo 1
y mtodo 2.
Mtodo 1
103 94 110 87 98

Mtodo 2
97 82 123 92 175 88 118

Calcule un intervalo de confianza del 90% para la diferencia entre los tiempos de proporcin
de duracin promedio de los 2 mtodos.
21 . 76
73 . 8
4 . 98
5
1
2
1
1
1
=
=
=
=
S
S
x
n
Metodo

5 . 103
18 . 32
7 . 110
7
2
2
2
1
2
2
=
=
=
=
S
x
n
Metodo

10 2 12
12 5 7
= =
= + =
gl
gl

58 . 2
2
=

z 58 . 2
2
=

z
99 . 0
17

2
2
2
1
2
1
2
2 1
2 1
2
2
2
1
2
1
2
2 1
n
S
n
S
t x x
n
S
n
S
t x x + + < < +
o o


( )
( ) ( )
( )
( ) ( )
7
55 . 1035
5
21 . 76
81 . 1 7 . 110 4 . 98
7
55 . 1035
5
21 . 76
81 . 1 7 . 110 4 . 98
2 1
+ + < < +


8 . 10 42 . 35
12 . 23 3 . 12 13 . 23 3 . 12
2 1
2 1
< <
+ < <




2. Encontrar un intervalo de confianza para la diferencia para la diferencia entre dos
medias poblaciones con un coeficiente de confianza de 0.95
5 . 5
36 . 2
25 . 12
2
2
1
=
=
=
S
S
x

66 . 1
29 . 1
5 . 9
2
2
2
=
=
=
S
S
x


2
2
2
1
2
1
2
2 1
2 1
2
2
2
1
2
1
2
2 1
n
S
n
S
t x x
n
S
n
S
t x x + + < < +
o o


4
66 . 1
4
58 . 5
45 . 2 5 . 9 25 . 12
4
66 . 1
4
58 . 5
45 . 2 5 . 9 25 . 12
2 1
+ + < < +


04 . 6 54 .
29 . 3 75 . 2 29 . 3 75 . 2
2 1
2 1
< <
+ < <







9.5 12.25
6.04
0.5
4
18

INTERVALO DE CONFIANZA PARA LA PROPORCIN POBLACIONAL
Problemas:
1. En una muestra aleatoria de 500 familias que se tienen televisiones en una ciudad
x se encuentran que 340 estn suscritas en mega cable, se encuentra un intervalo de
confianza de 99% para la proporcin real en familias que estn suscritas a mega cable.

% 99
68 . 0
500
340
300
500
=
= = =
=
=
n
x
p
x
n

( )( )
500
32 . 0 68 . 0
58 . 2 68 . 0
2
+ < <

p
n
q p
Z p
7338 . 0 626 . 0 < < p
Qu tan grande se sugiere que sea una muestra si queremos tener un 99% de confianza de
que muestra estimacin P este entre 0.02?
( ) ( )( )
( )
3621
02 . 0
32 . 0 68 . 0 58 . 2
2
2
2
2
2
= =

=
E
q p Z
n

( )
( )( )
05 . 0
500
32 . 0 68 . 0
58 . 2
2
=

=
n
q p
Z E 2 . 0
2
05 . 0
= = E

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES
Problemas:

1. Encontrar el intervalo de confianza para la diferencia entre dos proporciones
poblacionales con un coeficiente de confianza de 0.95.

5 . 620
73 . 0
73 . 0
1
1
=
=
=
x
n
p

5 . 569
850
67 . 0
1
1
=
=
=
x
n
p

19

|
|
.
|

\
|
+

< <
|
|
.
|

\
|
+


2
2 2
1
1 1
2
2 1 2 1
2
2 2
1
1 1
2
2 1
n
q p
n
q p
Sp t p p P P
n
q p
n
q p
Sp t p p
o o

( ) ( )
|
.
|

\
|
+

+ < <
|
.
|

\
|
+


850
33 . 0 67 . 0
850
27 . 0 73 . 0
96 . 1 67 . 73 .
850
33 . 0 67 . 0
850
27 . 0 73 . 0
96 . 1 67 . 73 .
2 1
P P


104 . 0 016 . 0
2 1
< < p p




INTERVALOS DE CONFIANZA PARA LA RAZN DE VARIANZAS
Dados los siguientes datos obtener un intervalo de confianza para la razn de
varianzas:
51 . 0
04 . 1
% 90
8
10
2
2
2
1
2
1
=
=
=
=
=
S
S
n
n

7 1 8 1
9 1 10 1
2 2
1
= = =
= = =
n v
v
n

2 1
2 1
2
2
2
1
2
2
2
1
2
2
2
1
1
V V
V V
f
S
S
f S
S
< <
o
o

29 . 3
51 . 0
04 . 1
68 . 3
1
51 . 0
04 . 1
2
2
2
1
|
.
|

\
|
< <
|
.
|

\
|
|
.
|

\
|
o
o

5541 . 0 =


0.67
0.73
0.16 0.104
0.95
0.05
6.70
20

INTERVALOS DE CONFIANZA PARA LA VARIANZA
Dados los siguientes datos, obtener un intervalo de confianza para la varianza con la
distribucin de
2
Chi
10 = n

9 = gl

195
2
= s

05 . 0 =

Al 95% 19
2
2
=

X
( ) ( )
erior h erior h X
S n
X
S n
inf 1
2
2
2
sup
2
2
1 1
o o
o

< <


( ) ( )
650 3 . 92
7 . 2
195 1 10
19
195 1 10
2 2
< < =

< <

o o


















19
2
2
=

X
99 . 0
7 . 2 )
2
1 (
2
=

X
21

UNIDAD 3 PRUEBAS DE HIPOTESIS
Ho: Hipotesis nula
Ha: Hipotesis alternativa
No existe
No hay riesgo
No hay verificacin

I (B)
Si hay evidencia
Si hay significacin
Si hay riesgo

Error de tipo I () Rechazar (Ho)
Error de tipo II (B) Aceptacin (Ho)
Prueba unilateral o de una cola pero superior








Prueba unilateral o de una cola pero superior
Una hiptesis estadstica
Una hiptesis estadstica: es una aseveracin o conjetura con respecto a una o ms
poblaciones.

0.95
Regin
aceptada
-1.96 +1.96
(-) Regin de rechazo (+)
0.95

0.5000 0.4500
0.95

0.4500 0.5000
1ra 2do
I ()
=0.05
1.65 -1.65
(+) I (-)
22

La verdad o falsedad de una hiptesis estadstica nunca se sabe con absoluta
incertidumbre a menos que examinemos toda la poblacin. Esto, por supuesto, sera
poco prctico en l mayora de las situaciones. En su lugar, tomamos una muestra
aleatoria de la poblacin de inters y utilizamos los datos contenidos en esta muestra
para proporcionar evidencia que apoye o no la hiptesis. La evidencia de la muestra
que es inconsistente con la hiptesis que se establece conduce al rechazo de esta,
mientras que la evidencia que la apoya conduce a su aceptacin.
Debe quedar claro que el diseo de un procedimiento que decisin se debe hacer con
la idea en mente de la probabilidad de una conclusin errnea.
Debemos acostumbrarnos a comprender Que la aceptacin de una hiptesis
simplemente implica que los datos no dan suficiente evidencia para rechazarla. Por
otro lado, el rechazo implica que la evidencia muestra la recluta. Dicho de otra forma
el rechazo significa que hay una pequea probabilidad de obtener la informacin
muestra observada cuando, la hiptesis es verdadera.
Hiptesis Nula: Esta se refiere a cualquier hiptesis que deseamos probar y se denota
(Ho). El rechazo de la hiptesis nula conduce a la aceptacin de una hiptesis
alternativa, que se denota (HA). Una hiptesis nula con respecto a un parmetro
poblacional siempre se establecer de modo que especifique un valor exacto del
parmetro mientras que la hiptesis alternativa permite la probabilidad de varios
valores.

PRUEBA DE HIPOTESIS PARA LA MEDIA CUANDO
2
o ES CONOCIDA. n 30=
- Ho: M=Mo Desconocidas 0 02
- Analiza si es una prueba t= estudent
Dos extremos Un extremo
Ho: M=Mo Ho: MMo
HA: MMo HA: M>Mo , HA: M<Mo
- Establecer tu nivel de significancia





/2

+/2

-/2

(3) (2) (1)
-/2
HA: M<Mo HA: M>Mo
23

- Estadstico de prueba.
Para c= =
n
O
M X
=
n
S
M X

- Regla de decisin / Regin de Rechazo
Dos extremos Un extremo
c>/2 c>/2
tc>t/2 tc>t/2
c</2 gl= n-1 c</2
tc<t/2 tc<t/2

Problemas:
1. Una empresa elctrica fabrica focos que tienen una duracin que se distribuyen de
forma aproximadamente con una media de 800 hrs, 0=40 hrs. Pruebe la hiptesis de
que la Mo= 800 contra la M800 si una muestra aleatoria de 30 focos tiene una
duracin promedio de 788 hrs. Utilice un nivel de significancia de =.04
Datos
M: 800 hrs media poblacional
O: 40 hrs
Ho: M=800
HA: M800
n: 30
X : 788 media muestral
= 0.04

Ho: M=800 HA= M800



Para=t t=
24


- Un Extremo Dos Extremo








- Zc=
n
O
M X
=
30
40
800 788
= -1.64

- Regla de decisin

Zc >
2

Z
1.64 >2.06 NO

Zc <
2

Z
-1.64<-2.06 NO
Se acepta Ho

2. Pruebe la hiptesis de que el contenido promedio de los envases de un lubricante
particular es de 10 Lts, si los contenidos de una muestra aleatoria de 10 envases son
10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 Lts. Utilice un nivel de significancia
de =0.01 y suponga que la distribucin contenido es normal.
N 30
H=10 1- Ho: M=10
n= 10 2- HA: M10
X =10.06
S=0.24
2

=
2
04 . 0
=0.02
0.96
0.4800
2
=
2
04 . 0
=-0.02
0.4800
c=-1.64
2.06
2
Z

1.64
2

=
2
04 . 0
=0.02
302967 . 7
12

25

=0.01
2

=
2
01 . 0
= 0.005






- tc=
n
S
M X
=
10
24 . 0
10 06 . 10
= 0.79
075894 . 0
06 . 0
=0.79
4- Tc >
2

t 0.79>3.25
tc>
2

t -0.79<-3.25 SE ACEPTA : Ho



Se lleva a cabo el desgaste por abrasibo de 2 diferentes materiales arribados se
prueban 12 piezas del material 1 mediante la exposicin de cada pieza a una mquina
para medir el desgaste 10 piezas de prueba 2 se de manera similar. En cada caso se
mide la profundidad del desgaste las muestras del material 1 da un desgaste promedio
codificado de 85 unidades con una S=4, mientras que las muestras de material 2 dan
un promedio de 81 y una desviacin estndar de 5 podemos concluir con un nivel de
significancia =0.05 que el desgaste abrasivo del material 1 excede el del material 2
en ms de 2 unidades. Suponga las poblaciones son aproximadamente normales con
varianzas iguales.
Datos Datos
n=12 n=10
X = 85 unidades X = 81 unidades
S=4 S=5
=0.05

n1=12 n2=10
X 1=85 X 2=81
2
=0.005

0.99
2
t
-3.25

3.25
2
t


26

S1=4 S2=5

RESOLVER
1.- Ho: M1-M2=2 gl=10+12-2
2.- HA: M1-M2>2 gl=20
3.- =0.05 t=1.72
gl= n1+n2-2
gl=
2
2 2
2
2 2
1 2
2
2
1 1
1
S1
2
2
1
S1
|
|
|
|
.
|

\
|

|
.
|

\
|
+
n
n
S
n
n
n
S
n

4.- t=
( )
2
1
1
1
2 1
n n
Sp
do X X
+

Sp=
( )( ) ( )( )
10 12
5 1 10 4 1 12 2
+
+
= 4.478
t=
( )
10
1
12
1
478 . 4
2 81 85
+

= 1.04


- Regla de decisin, regin critica lado derecho
Tc>t
1.04>1.725 NO Se acepto Ho
Como son las predicciones en el incremento del producto nacional bruto en estados
unidos para el prximo ao hechas por ejecutivos de corporaciones y analistas del
mercado accionario. Se muestran las predicciones en porcentajes de 5 ejecutivos de
corporaciones y de 5 analistas de mercados, seleccionados aleatoriamente.
Ejecutivos de empresas
3.4 2.8 3.9 3.7 3.4
Analista de mercado
3.3 3.9 3.4 3.8 4.0

Ejecutivos Analistas
0.95
Para sacar gl REAL
1.04 1.72
27

n1=5 n2=5
X =3.44 X =3.68
S= 0.41 0.31
S2= 0.1681 0.10 S2=0.0961


3. Proporciona los datos evidencias suficiente que seale una diferencia en el
incremento medio diagnostico para PNB, hechas por ejecutivos de corporaciones y
analistas del mercado accionario realice la prueba con =0.10 obtenga el valor de P
aproximado para la prueba interprete. Encuentre un intervalo de confianza de 90%
para la diferencia entre las predicciones del producto nacional Bruto (PNB) promedio
de los ejecutivos de corporaciones y analistas de mercado accionario.
n1=5
X =3.44
S=0.41
S2= 0.1681 =0.10
gl= n1+n2-2
gl= 5+5-2
gl= 8
- Ho: M1-M2 =Do
HA: HA M1-M2<Do
Sp
( ) ( )
2 2 1
1 1 2 1 1 2 2
+
+
n n
S n S n

Sp
( ) ( )
2 5 5
1 5 1 5 0961 . 0 1681 . 0
+
+

Sp= 0.36


n1=5
X =3.44
S=0.41
S2= 0.1681

t=1.40
Porque nada ms es una
cola
= 0.10
t= -1.40
28

- t=
( )
2
1
1
1
2 1
n n
Sp
Do X X
+

=
( )
5
1
5
1
36 . 0
0 68 . 3 44 . 3
+

= 1.05

- Regla de decisin regin de rechazo

tc<t
-1.05<-1.40 NO
Se acepta Ho No se rechaza

gl=8 0.20
1.40 .889
P= 0.889
B) 0.10<P<0.20
C)
2
1
1
1
2
2 1
n n
Sp t X X +


2
2 1 2 1

+ < < t X X M M
2
1
1
1
n n
+
3.44-3.68-(1.86)(0.36)
5
1
5
1
+ <M1-M2<3.44-3.68+(1.86) (0.36)
5
1
5
1
+
-0.66<M1-M2<0.18


4. Se dan las 2 siguientes muestras aleatorias independientes, la muestra 1 y la muestra 2
Muestra 1 12 3 8 5
Muestra 2 14 7 7 9 6
Pruebe la Ho vs HA
Muestra 1
X=7 X=8.6
S=3.91=S2=15.28 S=3.20 S2=10.24
n=4 n=5

29

Pruebe Ho:M1-M2=0 contra la alternativa HA: (M1-M2)>0 para =0.05.
Encuentre un intervalo de confianza de 90% (M1-M2).
1.- Ho: (M1-M2)=0
2.- HA: (M1-M2)>0
3.-








2 1
2 1
2
2
2
1
n
S
n
S
t X X + <M1-M2<
2 1 2
2 1
2
2
2
1
n
S
n
S
t X X +

+
5
24 . 10
4
28 . 15
90 . 1 6 . 8 7 + <M1-M2<
5
24 . 10
4
28 . 15
90 . 1 6 . 8 7 + +
-6.20<M1-M2<3

gl=7
05 . 0
2
10 . 0
2
= =









gl= n1+n2-2
gl= 4+5-2
gl= 7 1.90
=0.05
=0.05
=0.05

=0.05

t=-1.90
Tc=-0.06
4.-
66 . 0
5
24 . 10
4
) 28 . 15 (
6 . 1 0 ) 6 . 8 7 (
2
2
1
1
0 ) 2 1 ( 1
2 2
=
+

=
+
=
n
S
n
S
X X t
5.-Regla de decisin
-tc<-t
-0.66<1.90 No Se Acepta Ho
L.C.I -6.20 3.0 L.C.S
30

PRUEBA DE HIPOTESIS PARA UN PROPORCIN POBLACIONAL.
1.- establece tu hipotesis o Ho: P=Po
1. Ho: P=Po
Un extremo 2 colas
Unilateral Bilateral
2.- HA: P>Po HA: PPo
HA: P<Po
3.-





ESTADISTICO DE PRUEBA
4.- =
n
Poqo
Po P

tc=
n
Poqo
Po P


5.- REGIN DE RECHAZO O REGLA DE DECISIN
Un extremo Dos colas






+ /2

/2
-
Zc > Z
Tc > t
Zc < -Z

2
2

=<

=>
Z Zc
Z Zc

31

Problemas:
1. Aproximadamente uno de cada 10 consumidores favorecen el refresco de colo
marca A. Despus de una campaa de promocin en una regin de ventas dada, se
seleccionaron aleatoriamente bebedores de ese producto de los consumidores en el
rea del mercado, y se les entrevisto para determinar la efectividad de la campaa. El
resultado de la encuesta mostro que un total de 26 personas expreso su preferencia
para la bebida marca A. Son los datos suficientes para indicar un aumento en la
aceptacin de la marca A en la regin.
Datos
n= 200
P= 10 . 0
10
1
=
P = 13 . 0
200
26
=
= 0.05



- Ho: P=0.10 un extremo
- HA: P>.10
- 41 . 1
200
) 90 . 0 )( 10 . 0 (
10 . 0 13 . 0
=

n
qo Po
Po P

REGLA DE DECISION
Zc > Z
1.41 > 1.65 No
Se Acepta Ho






0.95
0.5000 0.4500
=0.05
1.65
0.5000 0.4200
Z= 1.41
0.92
= 0.08
32

2. Una muestra aleatoria de n=1400 observaciones de una poblacin binomial produjo
529.
a) Que escoger como H
o
(hiptesis nula) y como H
A
(hiptesis alternativa). Si la
hiptesis de investigacin es que P difiere de 0.4
P0.4
b) Implica la hiptesis alternativa del inciso anterior una prueba de un extremo o
2 extremos.
c) Es esta evidencia suficiente para indicar que P difiere de 0.4. realice la prueba
con



10 . 0
4 . 0
37 . 0
1400
529
2
=
=
= =
p
p




n
q p
p p
Zc
0 0

=
( )( )
~ =

3 . 2
1400
62 . 0 4 . 0
4 . 0 37 . 0

65 . 1 3 . 2
2
>

> Z Zc
65 . 1 < Zc Se rechaza hiptesis nula








Datos
N= 1400
X= 529
4 . 0 :
4 . 0 :
=
=
P Ha
P Ho


0.90
-1.65
1.65
0.05
0.05
33

PRUEBA DE UNA HIPTESIS PARA UNA DIFERENCIA DE
PROPORCIONES POBLACIONALES.
H
o
: (P
1
P
2
) = Do
H
A
: (P
1
P
2
) > Do
H
A
: (P
1
P
2
) < Do


)

Se seleccionaron muestras aleatorias independientes n1 = 140 observaciones de 2
poblaciones binomiales, respectivamente. El numero de xitos en las muestras y los
parmetros poblacionales se muestran en la tabla siguiente y parmetros.
Estadstico y parmetro 1 2
Tamao de la muestra 140 140
No exitosos 74 81
Parmetro Binomial P1 P2

a) Supngase que no tiene una medida preconcedida acerca de cul de los parmetros P
1

o bien P
2
es el mayor, y que solamente quiere detectar una diferencia entre los dos
parmetros si existe.
Qu tendra que escoger como HA para una prueba estadstica?
Qu para la H
o
?
b) Implica su HA en el inciso a) una prueba de 1 o de 2 colas
c) Lleve a cabo la prueba y saque conclusiones 05 . 0 o
n
1
= 140 n
2
= 140
X
1
= 74 X
2
= 81



( )
( )( ) ( )( )
84 . 0
140
43 . 0 57 . 0
140
48 . 0 52 . 0
0 57 . 0 52 . 0
=
+








-1.96 1.96
0.025

-0.84 0.84
Regla de decisin
96 . 1 84 . 0
96 . 1 84 . 0
2
<
>

> Z Zc
Se acepto hiptesis nula
34

PRUEBA DE HIPOTESIS CON CHI- CUADRADA
Prueba de hiptesis acerca una varianza poblacional (chi- cuadrada)
2 2
: o o = Ho
Un extremo Dos extremos
2 2
: o o > Ha
2 2
o o =
2 2
o o <
Un extremo Dos extremos


Estadstico de prueba
( )
2
2
2
1
o
_
S n
c

=

Regla de decisin











( ) 1 x
2
2

x ( )
2
1
2

x
Regin de Rechazo
Un extremo

o bien


Cuando la
H
A
:
2
<

donde

son los valores de la cola


superior e inferior
respectivamente de

, que ponen
en las reas de las colas.

Dos extremos

o bien


Donde

y
o

son los
valores de la cola superior e
inferior, respectivamente de


que ponen

en las reas de las


colas y los gl=(n-1).

35

Problemas:
Una muestra aleatoria de n= 25 observadores de una poblacin normal produjo una
varianza muestral de =21.4
Proporciona los datos evidencia suficiente que indiquen que la 15
2
> o lleve
acabo la prueba con un nivel de significancia de 0.05?

15 :
15 :
2
2
>
=
o
o
Ha
Ho

( )
2
2
2
1
o
_
S n
c

=

( )
24 . 34
15
4 . 21 1 25
=



Se acepta la hiptesis nula
NO 41 . 36 24 . 34
2 2
>
> _ _









Gl= n-1
Gl = 25 1= 24

= 36.41
0.95
0.05
36

UNIDAD 4: PRUEBAS DE BONDAD DE AJUSTE Y
PRUEBAS NO PARAMETRICAS

PRUEBA DE X
2
PARA BONDAD DE AJUSTE

La hiptesis ms sencilla acerca de las probabilidades multinomiales de las celdas es la que
especifica los valores numricos para cada una de ellas.
Por ejemplo: Si en el experimento multinomial intervienen K= 4 celdas, podramos querer
probar la hiptesis nula como:
H
o
:P
1
=0.2
H
o
:P
2
=0.4
H
o
:P
3
=0.1
H
o
:P
4
=0.3
Contra la hiptesis alternativa de que por lo menos 2 de las probabilidades de las
celdas difieren de los valores especificados de la hiptesis nula.
Teorema
Una prueba de bondad de ajuste entre las frecuencias observadas y esperadas se basa
en la cantidad de las 5 frecuencias observadas menos las observadas al cuadrado.


Donde

es un valor de una variable aleatoria, cuya distribucin muestral se aproxima


muy de cerca con la distribucin

.
La prueba se basa en que tan buen ajuste tenemos entre la frecuencia de ocurrencia
de las observaciones en una muestra observada y las frecuencias esperadas que se
obtienen a partir de la distribucin hipottica.

Ejemplo: supngase que los clientes pueden escoger entre 3 marcas de leche en un
supermercado. En un estudio para determinar si hay preferencia para una marca, se
registran los resultados de una muestra de n=300 compras de leche. Se muestran los
datos en la tabla siguiente:
Marca 1 Marca 2 Marca 3
Fo Fe
78 100
Fo Fe
117 100
Fo Fe
105 100

37

Con los datos hay evidencia suficiente que indique preferencia por una a ms marcas?
H
o
:P
1
= P
2
= P
3

H
A
:P
1
P
2
FE=np = (

)
=np
P=



Se acepta H
o
*Si existe suficiente evidencia que indique a un nivel de significancia de 0.95.
Concluimos que las 3 marcas de leche no tienen la misma preferencia.

Ejercicio: Los funcionarios de una comunidad en particular, buscan un programa
federal con el cual esperan que aumenten los niveles de ingresos locales. Como
justificacin, los pobladores de la ciudad afirman que la distribucin de los ingresos
locales difiere sustancialmente de la distribucin nacional y que los ingresos tienden a
ser menores de lo esperado. Se clasificaron y se compararon los ingresos de una
muestra aleatoria de 2000 familias, con los porcentajes nacionales que se muestran en
la tabla siguiente:
Datos de los Ingresos
Ingreso Porcentajes Nacionales Salario en la ciudad
Ms de $50,000 2 27
$25,000 hasta $50,000 16 193
$20,000 hasta $25,000 13 234
$15,000 hasta $20,000 19 322
$10,000 hasta $15,000 20 568
$5,000 hasta $10,000 19 482
Menos de $5,000 11 174
Total 100 2000

0.95
0.05
5.99
38

Es esta suficiente evidencia para indicar que la distribucin de los ingresos por familia de la
ciudad difieren e la distribucin nacional. =0.05
H
o
:P
1
= P
2
= P
3
=P
4
= P
5
= P
6
= P
7

H
A
:P
1
P
3



Se rechaza H
o
Si existe suficiente evidencia a

=0.05 que los ingresos difieren de los de la ciudad.



PRUEBA DE INDEPENDENCIA (TABAS DE CONTINGENCIA)
Un problema que se encuentra frecuentemente en el anlisis de datos de cuentas o en
numerativos trata de la independencia de dos mtodos de clasificacin de los eventos
observados. Por ejemplo, si queremos clasificar los defectos encontrados en muebles
producidos en una planta manufacturera, primero, segn el turno de produccin.
Aparentemente queremos investigar una contingencia es decir, una dependencia entre
las dos clasificaciones.
Anlisis de


HO: P
ij
=P
i
P
j
para todos los i y j.
Donde
P
ij
=probablidad de que una observacin este en el rengln i y columna j.
A= 0.5
12.6
39

P
i
=Probabilidad de que una observacin caiga en el rengln i.
P
j
=Probabilidad de que una observacin caiga en la columna j.

HA: P
ij
P
i
P
j
Para por lo menos una celda de la tabla.
Estadistica de prueba



Donde:
nij= Es la frecuencia para la celda del rengln
i y columnas j.
Ri= Total para rengln i.
Cj: Total para columna j.
N= Total de todas las observaciones.




Ejemplo: Una compaa de alfombras se interes en comparar en tres areas de una
Ciudad la fraccin de constructores de casas que prefieren alfombras sobre otras
cubiertas para pisos. El objetivo fue decidir cmo distribuir los esfuerzos de ventas
sobre las reas. Se realiz una encuesta y los datos se muestran en la tabla siguiente:
reas
Cubierta para piso. 1 2 3 totales
Alfombra 69 74.73 126 114.40 16 21.86 211
Otros Materiales 78 72.26 99 110.60 27 21.14 204
147 147 225 225 43 43 415

40

Proporciona los datos evidencia suficiente para indicar que existe una diferencia
entre las reas en las fracciones de constructores de casas que prefieren alfombras?
=0.05.
HO: P
ij
=P
i
P
j
HA: P
ij
P
i
P
j






GL:(r-1)(c-1)
Gl=2


Estadstico de Prueba:


Regin de Rechazo/ Regla de decisin.

6.48 Se acepta H
o.







0.025
7.38
41

Ejercicio: Suponga que se desee determinar si existe diferencia entre tres diferentes
mercados de productos respecto de sus actitudes acerca de una manera particular de
la publicidad de los productos. Supongamos que tuviramos que muestrear
aleatoriamente a 600 personas como se muestra en la tabla siguiente.
Opinin: FO FE FO FE FO FE Total
A favor 124 124 111 124 137 124 372
No a favor 55 45.6 44 45.6 38 45.6 137
Sin opinin 21 30.4 45 30.4 25 30.4 91
Total 200 200 200 200 200 200 600

Ofrece los datos de la tabla evidencia suficiente para indicar que las proporciones de
las respuestas en las categoras a favor, en contra y sin opinin, difieren entre
los tres mercados de productos? =0.05.
H
o
:P
ij
=P
i
P
j
H
A
:P
ij
P
i
P
j
=0.05


Regla de decisin.


16.8
Se rechaza H
o.
*Hay suficiente evidencia para indicar que las respuestas de los consumidores difieren en los 3
mercados a un =0.05




42

MTODOS ESTADSTICOS CONTRA NO PARAMTRICOS.
Estadstica Paramtrica.
La mayora de las pruebas de hiptesis analizadas hasta ahora han hecho
inferencia respecto a los parmetros de la poblacin, como la media y la
proporcin. Estas pruebas paramtricas han utilizado la estadstica paramtrica de
muestras que han venido de la poblacin que se estaba probando. Para formular
estas pruebas hicimos suposiciones restrictivas sobre las poblaciones de las que
extraamos nuestras muestras. Como vimos en cada caso en los temas anteriores
en la que supusimos que nuestras muestras eran grandes o provenan de
poblaciones normalmente distribuidas. Pero las poblaciones no son siempre
normales, e incluso si una prueba de bondad de ajuste vista anteriormente indica
que una poblacin es aproximadamente normal no siempre podemos estar seguros
que tenemos razn, porque la prueba no es 100% confiable. Claramente, existen
ciertas situaciones en las que el uso de la curva normal no es apropiado. Para estos
casos, requerimos alternativas a la estadstica alternativa y a las pruebas de
hiptesis que hemos estado utilizando hasta ahora.

Estadstica No paramtrica.
Por fortuna, los estadsticos recientemente han desarrollado tcnicas tiles que no
hacen suposiciones restrictivas respecto a la forma de las distribuciones de las
poblaciones. Estas se conocen como pruebas sin distribucin o ms comnmente,
pruebas no paramtricas.
Es decir, las hiptesis de una probabilidad no paramtrica se refieren a algo
distinto del valor de un parmetro de poblacin. Existe un gran nmero de esas
pruebas, para nuestro estudio examinaremos solo unas cuentas de las mejor
conocidas y ms ampliamente utilizadas.
1.- La prueba de signos: para datos apareados, en la que los signos positivos o
negativos se sustituyen por valores cuantitativos.
2.- Una prueba de sumas de rango, a menudo llamada la prueba de U. Mann
Whitney que puede usarse para determinar si dos muestras independientes han
sido extradas de la misma poblacin. Emplea ms informacin que la prueba de
signos.
3.- Otra prueba de suma de rangos es la prueba de Kruskal Wallis que generaliza el
anlisis de varianza discutido en temas anteriores, para permitirnos prescindir de
la suposicin de que las poblaciones estn normalmente distribuidas.
4.- La prueba de corridas de una sola muestra; un mtodo para determinar la
aleatoriedad con la que se han seleccionado los elementos muestreados.
43

5.- Correlacin de Rangos; es un mtodo para hacer el anlisis de correlacin
cuando no se dispone de los datos para usarlos de manera numrica, pero cuando
la informacin es suficiente para clasificar los datos como 1ro, 2do, 3ro etc..
6.- Otro mtodo para la bondad de ajuste entre una muestra observada y una
distribucin de probabilidad terica (Kolmogorov-Smirnov).

Ventajas de los mtodos no paramtricos.
Los mtodos no paramtricos tienen un nmero de ventajas claras sobre los mtodos
paramtricos:
1.- no requieren que hagamos la suposicin de que una poblacin est distribuida de
forma de curva normal u otra forma especfica.
2.-Generalmente son ms fciles de efectuar y comprender.
3.- Algunas veces ni siquiera se requiere del ordenamiento o clasificacin normal.

Desventajas de los mtodos paramtricos:
Dos desventajas que acompaan el uso de pruebas no paramtricas.
1.- Ignoran una cierta cantidad de informacin. Ej. Conversin de valores paramtricos
a rangos no paramtricos.
2.- a menudo no son tan eficientes o agudos como las pruebas paramtricas. La
estimacin de un intervalo de confianza al 95%usando una prueba no paramtrica
puede ser el doble del tamao de la estimacin al utilizar una prueba paramtrica vista
anteriormente. Cuando usamos pruebas no paramtricas, efectuamos un trueque.
Perdemos agudeza al estimar intervalos, pero ganamos la habilidad de usar menos
informacin y calcular ms rpidamente.







PRUEBA DE SIGNOS
44

Use la prueba de signos para ver si hay una diferencia entre el nmero de das requeridos para
saldar una cuenta por cobrar antes y despus de una nueva poltica de cobro. = 0.05.
Antes 33 36 41 32 39 47 34 29 32 34 40 42 33 36 29
Despus 35 29 38 34 37 47 36 32 30 34 41 38 37 35 28
- + + - + 0 - - + 0 - + - + +


P
HO
=0.5
P
HO
=0.5

N= tamao de la nuestra.
P= proporcin de xitos en la muestra.
Q= proporcin de fracasos en la muestra.
Error estndar=


Lmites de la regin de aceptacin:


H
O
: P
HO
=0.5
H
A
: P
HA
0.5
P
HO
=0.5
q
HO
=0.5
Nmero de signos + : 7
Nmero de signos -: 6
Nmero de ceros: 2
Tamao total de : 15
La muestra
P=0.53
Q=0.47


Lmites:


*Se acepta H
O
Nota: las pruebas no paramtricas son muy convenientes cuando el mundo real presenta
datos sin distribucin a partir de los cuales se deben tomar una decisin. Pero observe la
prueba de signos es solo otra aplicacin de la familiar aproximacin normal a la binomial,
usando un signo positivo y un signo negativo, en vez de xito o fracaso.


Ejemplo: Los siguientes datos muestran las ndices de trabajos defectuosos de los
empleados antes y despus de un cambio de en el plan de un incentivo de sueldos.
-1.96 1.96
.95
0.5
0.77 0.23
45

Compare los siguientes dos conjunto de datos para ver si el cambio disminuy las
unidades defectuosas producidas. . =0.10.
Antes 8 7 6 9 7 10 8 6 5 8 10 8
Despus 6 5 8 6 9 8 10 7 5 6 9 5
+ + - + - + - - 0 + + +

H
O
: P
HO
=0.5 P
HO
=0.5
H
A
: P
HA
<0.5 q
HO
=0.5

Nmero de signos + : 7

N=11
Nmero de signos -: 4 P=
Nmero de ceros: 1 Q= 0.36
Tamao total 12


Lmites:


*Se acepta H
o.



Prueba de sumas de Rango.





PRUEBAS DE SUMAS DE RANGOS


-1.65 1.65
0.5
0.25
0.74
46

Anteriormente vimos como usar el anlisis de variacin n para probar la hiptesis de
que varias medias de poblacin son iguales. Asimismo en tales pruebas que las
poblaciones estaban normalmente distribuidas con varianzas iguales, muchas veces
estas suposiciones no se pueden satisfacer, y en tales casos, podemos utilizar dos
pruebas no paramtricas, ninguna de las cuales depende de las suposiciones de la
normalidad. Estas dos pruebas son llamadas pruebas de suma de rangos porque la
prueba depende de los rangos de las observaciones de las muestras.
Las pruebas de suma de rangos son una familia completa de pruebas. Solo nos
concentraremos en dos miembros de estas familias, la prueba de U. Mann Whitney y la
prueba de Kruskal Wallis. Usaremos la prueba de U. Mann Whitney cuando solo estn
involucradas dos poblaciones y la prueba de Kruskal Wallis cuando se trate de ms de
dos poblaciones.
El uso de estas pruebas nos permitir determinar si las muestras independientes han
sido extradas de la misma poblacin (o de distintas poblaciones con la misma
distribucin).

Prueba de U. Mann Whitney.


Media de la Estadstica


Error Estndar de la Estadstica


Pruebas de las hiptesis
H
o
:
1
=
2

H
A
:
1

2
Lmites


Ejercicio: Supongamos que la junta de regentes de una institucin estatal desea probar la
hiptesis de que las calificaciones medias en dos planteles de la universidad son iguales. La
47

junta mantiene estadsticas de todos los estudiantes en todos los planteles del sistema. Una
muestra aleatoria de 15 estudiantes de cada plantel ha producido los datos que se muestran a
continuacin:
Calificaciones (SAT) de estudiantes en dos planteles de la universidad estatal.
Plantel A 1000, 1100, 800, 750, 1300, 950, 1050, 1250, 1400, 850, 1150, 1200, 1500, 600, 775.
Plantel B 920, 1120, 830, 1360, 650, 725, 890, 1600, 900, 1140, 1550, 550, 1240, 925, 500.
1.- Ordenar todas las calificaciones en orden ascendente indicando en cada uno el smbolo del
plantel.
n
1
= numero de elementos de la muestra 1, numero de estudiantes del plantel A
n
2
= numero de elementos de la muestra 2, numero de estudiantes del plantel S
R
1
= Suma de los rangos de los elementos de la muestra 1, suma de todas las calificaciones del
plantel A.
R
2
= Suma de los rangos de los elementos de la muestra 2, suma de todas las calificaciones del
plantel B.
Rango Calificacin Plantel
1 500 B
2 550 B
3 600 A
4 650 B
5 725 B
6 750 A
7 775 A
8 800 A
9 830 B
10 850 A
11 890 B
12 900 B
13 920 B
14 925 B
15 950 A
16 1000 A
17 1050 A
18 1100 A
19 1120 B
20 1140 B
21 1150 A
22 1200 A
23 1240 B
24 1250 A
25 1300 A
26 1360 B
27 1400 A
28 1500 A
29 1550 B
30 1600 B


Plantel A:


48

Plantel B:


Lmites:
112.5+1.44(24.10)=147.2
112.5-1.44(24.10)=77.8
Como podemos observar que la estadstica demuestra si cae dentro de la regin de
aceptacin. En consecuencia, aceptaramos la H
0
de ninguna diferencia y concluir que las
distribuciones, y por lo tanto, las calificaciones medias en las dos escuelas son iguales.

Kruskal Wallis



Smbolos utilizados para una prueba de Kruskal-Wallis
n
j
= Nos indica el nmero de elementos en la muestra j.
R
j
= Suma de los rangos de todos los elementos en la muestra.
K
j
= El numero de muestras.
n= n
1
+ n
2
+ + n
k
: Nmero total de observaciones en todas las muestras


Formulacin de la Hiptesis
H
0
:
1
=
2
=
3

H
A
:
1
,
2
,
3

Sugerencia: A menudo ocurren empates al clasificar los datos para realizar una prueba de U.
Mann Whitney o una prueba de Kruskal Wallis. Siempre que se encuentre tales empates
recuerde que cada valor empatado obtiene un rango promedio, por lo tanto, si los elementos
49

octavo y noveno etan empatados cada uno obtienen un rango de 8.5 y si esto sucede con el
cuarto, quinto y sexto, cada uno obtiene un rango de 5.

Ejercicio: En la tabla siguiente se muestran las calificaciones de 20 pilotos estudiantes en su
examen escrito de la Agencia Federal de Aviacin, dispuestas segn por el mtodo que se
empleo en su entrenamiento.
Video casete 74, 88, 82, 93, 55, 70. R
1
=61 n
1
=6
Audio casete 78, 80, 65, 57, 89. R
2
=42 n
2
=5
Saln 68, 83, 50, 91, 84, 77, 94, 81, 92 R
3
=107 n
3
=9

H
0
:
1
=
2
=
3

H
A
:
1
,
2
,
3

= 0.10

N=20

)



Rango calificacin Prueba
1 50 S
2 55 V
3 57 A
4 65 A
5 68 S
6 70 V
7 74 V
8 77 S
9 78 A
10 80 A
11 81 S
12 82 V
13 83 S
14 84 S
15 88 V
16 89 A
17 91 S
18 92 S
19 93 V
20 94 S

Se acepta La H
o.

*no hay diferencia en el resultado de las 3 pruebas en sus medias.

Prueba de las Hiptesis
50

La distribucin de muestreo de la estadstica K puede aproximarse por una distribucin Chi-
Cuadrada. Cuando los tamaos de todas las muestras son al menos 5. Como nuestro problema
satisface esta condicin podemos utilizar la distribucin Chi-Cuadrada.

Pruebe la hiptesis de no diferencia entre las edades de los empleados dentro de una
empresa, masculinos y femeninos, utilizando la prueba de U. Mann Whitney para los datos de
la muestra se utiliza =0.10.
Hombres 31, 25, 38, 33, 42, 40, 44, 26, 43, 35.
mujeres 44, 30, 34, 47, 35, 32, 35, 47, 48, 34.

Rango Edad
1 25 H
2 26 H
3 30 M
4 31 H
5 32 M
6 33 H
7.5 34 M
7.5 34 M
10 35 H
10 35 M
10 35 M
12 38 H
13 40 H
14 42 H
15 43 H
16.5 44 H
16.5 44 M
18.5 47 M
18.5 47 M
20 48 M
R
1
=93.5
R
2
=116.5
H
0
:
1
=
2



H
A
:
1



Limites:
Lmite superior: 50+(1.65)(13.22)=71.8
Lmite inferior: 50-(1.65)(13.22)=28.22






Ejercicio: Una compaa de artculos que atiende sus pedidos por internet tiene los
siguientes datos de muestras de ventas en dlares, separados de acuerdo con la forma
0.90
50
-1.73 1.73
0.05
51

de pago del pedido. Pruebe la hiptesis de que no existe diferencia en la cantidad de
dlares recibidos por pagos en efectivo, cheque o tarjeta de crdito. Use la prueba de
Kruskal Wallis. =0.05.
Pedidos con tarjeta de crdito 78, 64, 75, 45, 82, 69, 60 n
1
=7
Pedidos con cheque. 110, 70, 58, 51, 61, 68 n
2
=6
Pedidos en efectivo 90, 68, 70, 54, 74, 65, 59 n
3
=7

rango Cantidad
1 45 T
2 51 C
3 53 C
4 54 E
5 59 E
6 60 T
7 61 C
8 64 T
9 65 E
10 68 E
11 68 C
12 69 T
13 70 E
14 70 C
15 74 E
16 75 T
17 78 T
18 82 T
19 90 E
20 110 C
R
T
=78
R
E
=76

R
C
=56
H
0
: n
1
= n
2
= n
3

H
A
: n
1
, n
2
, n
3



)
k-1
gL:3-1=2






*Se rechaza
H
A.

*Se Acepta H
o.









PRUEBA DE CORRIDAS DE UNA SOLA MUESTRA.

0.05
0.3415
5.99
52

Una corrida es una secuencia de ocurrencias idnticas precedidas y seguidas de
distintas ocurrencias o por ninguna en absoluto.
La distribucin de muestreo de la estadstica R. El nmero de corridas r, es una
estadstica con su propia distribucin de muestreo especial y su propia prueba,
obviamente, las corridas pueden ser de diferentes longitudes y en una muestra
pueden ocurrir diversos nmeros de corridas. Las estadsticas pueden probar que
demasiadas corridas o muy pocas en una muestra indican que intervino algo ms que
el azar cuando se seleccionaran los elementos. Una prueba de corridas de una sola
muestra, entonces, est basada en la idea de que muy pocas o demasiadas corridas
muestran que los elementos no fueron escogidos aleatoriamente.
Media y Error estndar de la estadstica

Media de La estadstica r.



Error estndar de la estadstica r.



H
o
: En una prueba de corridas de una sola muestra, no es conveniente una
H
A
: formulacin simblica de la hiptesis.


H
o
: nmero de artculos estn mezclados aleatoriamente.
H
A
: Nmero de artculos no estn mezclados aleatoriamente

Ejemplo: Pruebe la aleatoriedad de la siguiente muestra usando el nivel de significancia de
=0.05

A B A A A B B A B B A A B A B A A B B B B A B B
A A A B A B A A B B A B B A A A B B A A B A A A

Sugerencia: La prueba de corridas a menudo pueden ser tiles en situaciones de
administracin de calidad donde intentamos separar la variacin sistemtica de la variacin
aleatoria. La variacin sistemtica puede ocasionar los tipos de patrones que las pruebas de
corrida detectan.


H
o
: Los artculos son escogidos aleatoriamente.
H
A
: Los artculos no son escogidos aleatoriamente.

53

N
1
= 26(A)
N
2
= 22(b)

Nmero de corridas:27


[ ]







Lim inf: 24.83-1.96(3.40)=18.166
Lim sup: 24.83+1.96(3.40)= 31.49

Se acepta H
o.



Ejercicio: Una secuencia de productos o artculos de vidrio fue inspeccionada para detectar
daos ocasionados en el envo. La secuencia de estos artculos aceptables y daados fue la
siguiente:
D A A A D D D D D A A D D A A A A D A A D D D D D
Pruebe la aleatoriedad de los daos ocasionados en el envo usando el =0.05.
H
o
: Los artculos son escogidos aleatoriamente.
H
A
: Los artculos no son escogidos aleatoriamente.
N
1
= 11
N
2
= 14

Nmero de corridas:9


[ ]




0.95
-1.96 18.16 31.49 1.96
24.83
54




Lim inf: 13.32-1.96(2.41)=8.59
Lim sup: 13.32+1.96(2.41)=18.04

Se acepta H
o.




CORRELACIN DE RANGOS

La funcin del coeficiente de rangos es una medida de la cercana de la asociacin
entre dos variables.
Esta es una medida de la correlacin que existe entre los dos conjuntos de rangos, una
medida del grado de asociacin entre las variables que no podramos calcular de otra
manera.
Una ventaja del uso de la correlacin de rangos es la razn para aprender el mtodo
de la correlacin de rango es la posibilidad de simplificar el proceso de clculo de un
coeficiente de correlacin a partir de un conjunto de datos muy grande para cada una
de las dos variables.

Spearman.
Para calcular el coeficiente de rangos utilizaremos la siguiente frmula:
Coeficiente de correlacin de rangos:


Rs: es el coeficiente de rangos.
N: nmero de observaciones apareadas.
= Sigma (suma)
D: Diferencia entre los rangos para cada pareja de observaciones.
0.95
-1.96 8.59
13.32
18.09 1.96
0.025 0.025
55


Nota: Si el coeficiente de correlacin de rangos es igual a 1 muestra que existe una asociacin
perfecta o correlacin perfecta entre las 2 variables. Y si tenemos un coeficiente de relacin de
-1 representa una correlacin inversa perfecta.

Ejercicio:
ciudad Rango de la
calidad de aire.
Rango de enfermedad
pulmonar.
Diferencia entre los
Rangos.
Diferencia
cuadrada.
A 4 5 -1 1
B 7 4 3 9
C 9 7 2 4
D 1 3 -2 4
E 2 1 1 1
F 10 11 -1 1
G 3 2 1 1
H 5 10 -5 25
I 6 8 -2 4
J 8 6 2 4
K 11 9 2 4


Conclusin: La calidad del aire es positiva en relacin al rango.
Un coeficiente de correlacin de rango de 0.736 sugiere una asociacin positiva sustancial
entre cantidad de aire promedio y la ocurrencia de enfermedades pulmonares, al menos en las
once ciudades muestreadas. Esto es, altos niveles de contaminacin van acompaados de
enfermedades pulmonares.



56

Prueba de hiptesis: acerca de la correlacin de rangos para pequeos valores de la
distribucin de rs no es normal, y a diferencia de otras estadsticas de muestras pequeas que
hemos encontrado, no es apropiado usar la distribucin para probar hiptesis, acerca del
coeficiente de correlacin de rangos. La cual utilizaremos la tabla #7 que son los valores para la
correlacin de rangos de Spearman para reas combinadas en los dos extremos. Para el caso
de nuestro ejercicio utilizaremos un nivel de significancia de 0.05. Por lo que estableceremos
nuestra formulacin de las hiptesis.

H
o
:P
s
=0 No existe correlacin en los datos clasificados de la poblacin.
H
A
:P
s
0 Existe correlacin en los datos clasificados de la poblacin.


*Se rechaza H
O.

* Se acepta H
A.

Por consiguiente, rechazaramos la H
o
de no correlacin y concluiramos que existe asociacin
entre los niveles de calidad del aire y la incidencia de enfermedades pulmonares en las
ciudades.

La distribucin apropiada de .
Si el tamao de la muestra es mayor de 30, ya no podemos utilizar la tabla 7 del apndice. Sin
embargo, cuando , la distribucin de muestreo de rs es aproximadamente normal, con
una de 0 y una

por lo tanto para calcular el error estndar del coeficiente de


correlacin de rangos:
Error rs=


Sugerencia: La correlacin de rango es til cuando los datos estn distribuidos anormalmente.


0.6091
0.6091 0.736
57

Ejercicio: Un supervisor de planta clasifica una muestra de 8 trabajadores segn el nmero de
horas extras trabajadas y la antigedad del empleo. La correlacin de rango entre las 2
mediciones es significativa al nivel de 0.01?
Cantidad de horas
5.0 8.0 2.0 4.0 3.0 7.0 1.0 6.0
Aos de empleo
1.0 6.0 4.5 2.0 7.0 8.0 4.5 3.0


Cantidad Horas Rango
5.0 5
8.0 8
2.0 2
4.0 4
3.0 3
7.0 7
1.0 1
6.0 6

Cantidad de Horas Rango Diferencia de Rangos Elevado al cuadrado
5 1 4 16
8 6 2 4
2 4.5 -2.5 6.25
4 2 2 4
3 7 -4 16
7 8 -1 1
1 4.5 -3.5 12.25
6 3 3 9

= 5 . 68
2
d
( )
( )
815 . 0
1 64 8
5 . 68 6
1 =

= Rs


Aos Empleo Rango
1.0 1
6.0 6
4.5 4.5
2.0 2
7.0 7
8.0 8
4.5 4.5
3.5 3

0.99
-0.8571 -0.815 0.815 0.8571
Se acepto la hiptesis nula, no
existe correlacin en los datos
clasificados.
58

La prueba por consiguiente otra medida de ajuste de una distribucin terica como lo es la
prueba de CHI- CUADRADA. Sin embargo, la prueba de K-S tiene varias ventajas sobre la
prueba de chi- cuadrada es una prueba mas poderosa y mas fcil de utilizar, pues que no
quiere que los datos se agrupan de alguna manera.
Una ventaja especial de la estadstica K-S Dn es particularmente til para juzgar que tan cerca
esta la distribucin de frecuencia observada de la distribucin de frecuencia esperada, por que
la distribucin de probabilidad Dn depende del tamao de muestra n pero es
independiente de la distribucin de frecuencia esperada (Dn es una estadstica de distribucin
libre)

Ejemplo: La central telefnica de x estado ha estado llevando un registro del nmero
de transmisores, usados en un instante dado. Las observaciones se hicieron en 3754
ocasiones distintas. Para propsitos de planeacin de inversin de capital, el
funcionario de presupuestos de esta compaa piensa que el patrn de uso sigue una
distribucin de poisson con una media de 8.5. Si desea aprobar esta hiptesis con un
nivel de significancia de 0.01 pueden emplear la prueba K-S
5 . 8 =

Ho: Una distribucin de poisson, es una buena descripcin del patrn de uso.
5 . 8 = =
No es una buena descripcin del patrn de uso. 01 . 0 = o
( )
( )
= =

! 0
5 . 8
5 , 8 0
e
O P
( )
Fe
Fe Fo
2
2

= _

( )
! ! x
e M
x
e
x P
M x x x
=

=









59

Numero ocupado Frecuencia
Observada
Frecuencia
Acumulada
Observada
Frecuencia
Acumulada
Observada
Relativa
Frecuencia
Acumulada
Esperada
Desviacin
Absoluta
0 0 0 0.0002 0.002 0.0002
1 5 5 0.0013 0.0019 0.0006
2 14 19 0.0051 0.0093 0.0092
3 24 43 0.0114 0.0301 0.0186
4 57 100 0.0266 0.0741 0.0478
5 111 211 0.0562 0.1499 0.0934
6 197 408 0.1086 0.2562 0.1475
7 278 686 0.1827 0.3856 0.2029
8 378 1064 0.2834 0.5231 0.2397
9 418 1482 0.3948 0.6530 0.2582
10 461 1943 0.5176 0.7634 0.2458
11 433 2376 0.6329 0.8487 0.2158
12 413 2789 0.7429 0.9091 0.1672
13 358 3147 0.8383 0.9486 0.1103
14 219 3366 0.8966 0.9726 0.0760
15 145 3511 0.9353 0.9862 0.0509
16 108 3620 0.9646 0.9939 0.0291
17 57 3677 0.9795 0.9975 0.0175
18 43 3720 0.9909 0.9987 0.0078
19 16 3736 0.9952 0.9995 0.0043
20 7 3743 0.9971 0.9998 0.0027
21 8 3751 0.9992 0.9999 0.0007
22 3 3754 1 1 0


CALCULO DE LA ESTADITICA DE K-S
Dn = MAX l Fe Fo l =
Calcular el valor de una prueba de K-S siempre debe ser una prueba de un extremo. Los valores
crticos para Dn sern tabulados y pueden encontrarse en la tabla 8 de la pendiente que dice
valores crticos de D para la prueba de bondad de ajuste de K-S.
Para nuestro ejercicio si buscamos en la fila de n= 3754 (tamao de la muestra) y tomando el
nivel de significancia de 0.01 encontramos que el valor critico de Dn debe calcularse usando
la formula.
Mas de 35, un nivel de significancia de 0.01
Formula 026 . 0
3754
63 . 1 63 . 1
= =
n

60

Nuestra conclusin: El siguiente paso es comparar el valor calculado de Dn con el valor
crtico de Dn que se encuentra en la tabla. Si el valor de la tabla para el nivel de significancia
elegido es mayor que el valor calculado de Dn entonces aceptamos la hiptesis nula


Recuerde que a menudo buscamos las no paramtricas cuando no sabemos o no podemos
suponer, que la distribucin de poblacin subyacente es normal. La prueba de K- S nos
proporciona una forma de verificar nuestros datos de muestra para ver si una suposicin de
normalidad es razonable.
Al nivel de significancia de 0.05 Podemos concluir que los siguientes datos provienen de una
distribucin de poisson con 3 =
Numero de
llegadas por
dia
Numero de
das
Frecuencia
Acumulada
Observada
Frecuencia
Acu. Obs.
Relativa
Frec. Acu.
Observada
Esperada
Desviacion
Abasoluta
0 6 6 0.06 0.0498 0.0102
1 18 24 0.24 0.1991 0.0409
2 30 54 0.54 0.4232 0.1168
3 24 78 0.78 0.6472 0.1328
4 11 89 0.89 0.8153 0.0747
5 2 91 0.91 0.9161 0.0061
6 9 100 1 0.9665 0






Ejercicio: En una empresa se tiene un registro del sexo de las personas que llamaban a la
oficina de circulacin para quejarse de los problemas de entrega en el boletn de dicha
informacin de la empresa y si estos datos fueran los siguientes:
M,FFF,MM,F,M,FFFF,MMM,F,M,F,M,FFFF,MMMMM
Con un nivel de significancia de 0.05, pruebe esta secuencia para aleatoriedad. Hay algo
respecto a la naturaleza de este problema que lo indujera a creer que una secuencia
semejante no fuera aleatoria?

1
2
2 1
2 1
+
+
=
n n
n n
r


O.026 < 0.2586 Se acepta Ha
Se rechaza Ho
0.163 > 0.1328 Se acepta hiptesis alternativa
Se rechaza hiptesis nula

N1 =14
N2= 14
Corridas = 13
61



( )( )
15 1
14 14
14 14 2
= +
+
=
r


( )( ) ( )( ) ( )
( ) ( )
59 . 2
1 14 14 14 14
14 14 14 14 2 14 14 2
2
=
+ +

= r o

15+ (1.96) (2.59) = 20.07 SE ACEPTA HIPOTESIS NULA
15- (1.96) (2.59) = 9.92


Ejercicio: Una gran empresa en el rea de Ingeniera Industrial contrata a la mayora de sus
empleados de 2 importantes instituciones. Durante el ao pasado, han estado haciendo un
examen a los empleados recin graduados que entran a la empresa para determinar que
escuela, si a caso, parece preparar mejor a sus empleados basndose en las siguientes
calificaciones (de 100 puntos posibles) ayude a la oficina del personal del hospital a determinar
si las escuelas difieren en calidad. Use la prueba de Mann Whitney, con un nivel de
significancia de 0.6 %
Calificaciones de Exmenes
Escuela A Escuela B
97 2.5 88 1
69 5 99 2.5
73 6 65 4
84 8 69 8
76 8 97 10
92 11.5 84 11.5
90 13.5 85 13.5
88 16.5 89 15
84 20 91 16.5
87 21 90 18.5
93 22.5 87 18.5
91 22.5
72 24.5
15
-1.96 9.9 20.07 1.96
62

5 . 134

5 . 165
| |
R
n
n n U
R

+
+ =
2
1
1
2 1 2

( )( ) ( )
| | ( )
( )( ) ( )
| | ( )
5 . 43 5 . 165
2
1 11 11
13 11
5 . 74 5 . 134
2
1 11 11
13 11
2
1
=
+
+ =
=
+
+ =
R
R
U
U

| |
12
1
2 1 2 1
+ +
=
n n n n
u o
( )( ) ( )| |
26 . 17
12
1 13 11 13 11
=
+ +
= u o
( )( ) ( )
5 . 71
2
13 11
= = MU

Limites
| |( )
| |( ) 87 . 38 26 . 17 89 . 1 5 . 71
12 . 104 26 . 17 89 . 1 5 . 71
=
= +










-1.89 1.89 71.5
38.87 104.12
Se acepta la hiptesis
nula, por que cae en
el rango de
aceptacin
0.6/2= 0.3

0.3
94%

Você também pode gostar