Você está na página 1de 56

TECNOLGICO DE ESTUDIOS SUPERIORES DEL

ORIENTE DEL ESTADO DE MXICO

DIVISIN DE CONTADURA

ELABORACIN DE CUADERNILLO DE APUNTES:


ESTADSTICA ADMINISTRATIVA II

ELABORADO POR:
ING. MIRIAM MEDINA DELGADO

LOS REYES, LA PAZ, ESTADO DE MXICO AGOSTO 2010

INDICE

Unidad 1 Pruebas de la bondad del ajuste y anlisis de varianza


1.1 Anlisis Ji-Cuadrada . ............................................................................ 1
1.2 Prueba de independencia . .................................................................... 1
1.3 Prueba de la bondad del ajuste . ............................................................ 1
1.4 Tablas de contingencia . ........................................................................ 4
1.4.1 mtodo para obtener el estadstico x2 de una tabla de contingencia
con dos renglones. ................................................................................. 4
1.4.2 mtodo para obtener el estadstico x2 de una tabla de contingencia
con ms de dos renglones. .................................................................... 6
1.5 Anlisis de varianza . ............................................................................. 9
1.5.1 Aplicaciones de ANOVA . ................................................................... 9
1.5.2 Inferencia sobre una varianza de poblacin (Anova). . ....................... 14
1.5.3 Inferencia sobre la varianza de dos poblaciones (Anova). . ................ 15

Unidad 2. Anlisis de regresin, correlacin lineal simple y mltiple


2.1 Estimacin mediante la lnea de regresin . ......................................... 16
2.1.1 Diagrama de dispersin. ................................................................... 16
2.1.2 Mtodo de mnimos cuadrados. ........................................................ 17
2.1.3 Interpretacin del error estndar de la estimacin. ............................. 18
2.1.4 Intervalos de prediccin aproximados................................................ 19
2.1.5 Anlisis de correlacin. ..................................................................... 22
2.1.6 Paquete computacional para la solucin de problemas. ..................... 22
2.1.7 Regresin mltiple y anlisis de correlacin. ..................................... 22
2.1.8 Usos de variables ficticias. ................................................................ 25
2.1.9 Residuales y grficas de residuales. ................................................. 25

Unidad 3. Nmeros ndice


3.1 Elaboracin de ndices simples. ........................................................... 27
3.2 ndices agregados de precio. ............................................................... 27
3.3 Relativos eslabonados . ....................................................................... 28
3.4 Cambio de periodo base. ..................................................................... 28
3.5 Fusin de dos series de nmeros ndice. ............................................. 29
3.6 ndice de precios al consumidor (IPC).. ................................................ 29
3.7 Deflacin de los valores de series de tiempo. ....................................... 30
3.8 ndice de precios al productor (IPP).. ................................................... 31
3.9 Promedios de precios burstiles de DowJones. .................................... 31
3.10 Indice de produccin insustrial. .......................................................... 31

Unidad 4. Estadstica no paramtrica


4.1 Escala de medicin. ............................................................................ 33
4.2 Mtodos estadsticos contra no paramtricos. ...................................... 33
4.3 Prueba de corridas para aleatoriedad................................................... 35
4.3.1 Concepto de aleatoriedad. ................................................................ 35
4.3.2 Teora de corridas. ........................................................................... 35
4.3.2.1 Prueba de corridas de una sola muestra. ....................................... 36
4.3.2.2 Distribucin de muestreo del estadstico r...................................... 36
4.4 Una muestra: prueba de signos. .......................................................... 38
4.5 Una muestra: prueba de Wilcoxon. ...................................................... 40
4.6 Dos muestras: prueba de Mann-Whitney. ............................................. 42
4.7 Observaciones apareadas: prueba de Wilcoxon. .................................. 45
4.8 Varias muestras independientes: prueba de Krauskal-Wallis. ............... 46

INTRODUCCIN

La estadstica administrativa es una materia importante en contadura ya que


permite recopilar, organizar, representar, analizar datos y tomar decisiones, as
mismo nos da las herramientas necesarias para utilizar el mtodo adecuado
conforme a la situacin que se est analizando y aplicarlo en el rea contable.
Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiante
durante el curso de la materia, el cual consta de 4 unidades en donde se
proponen algunas prcticas para la aplicacin de los temas estudiados y est
desarrollado conforme al temario. Sin embargo es importante que el alumno
consulte ms fuentes de informacin con el objetivo de retroalimentar.
A continuacin se hace una breve semblanza de los temas que se tratan en las
unidades.

Unidad 1. Pruebas de la bondad del ajuste y anlisis de varianza. En esta


unidad se analizan los siguientes temas: anlisis ji-cuadrada, pruebas de
independencia, bondad de ajuste, tablas de contingencia y anlisis de
varianza para hacer inferencias a partir de una o dos poblaciones.
Unidad 2. Anlisis de regresin correlacin lineal simple y mltiple. En
esta unidad realiza el diagrama de dispersin, se aplica el mtodo de mnimos
cuadrados para interpretar el error estndar y determinar los intervalos de
prediccin, as como la solucin de ejercicios de anlisis de correlacin en
Excel. Asimismo se recaban datos de una empresa para aplicar la regresin
lineal y hacer estimaciones futuras.
Unidad 3. Nmeros ndice. En esta unidad se realizan ejercicios para la
elaboracin de
nmeros ndice: simple, precio agregado y precio al
consumidor. Asimismo se elaboran ndices de precio y cantidad con datos
recabados en revistas y otras fuentes.
Unidad 4. Estadstica no paramtrica. En esta unidad se contrasta la
estadstica paramtrica contra la no paramtrica, as mismo se analizan temas
de prueba de corrida de aleatoriedad, de una o dos muestras y observaciones
apareadas. Tambin se recopilan datos para efectuar comparacin y anlisis
entre la estadstica y la estadstica no paramtrica.

Estadstica Administrativa II
1

Unidad 1. Pruebas de la bondad del ajuste y anlisis de


varianza
1.1Anlisis Ji-Cuadrada
Las pruebas Ji-Cuadrada nos permite probar si ms de dos proporciones de
poblacin pueden ser consideradas iguales.
Si clasificamos una poblacin en diferentes categoras respecto a dos atributos
(por ejemplo, edad y desempeo en el trabajo), entonces podemos utilizar una
prueba Ji-Cuadrada para los dos atributos son independientes entre s.

1.2 Prueba de independencia


Los administradores necesitan saber si las diferencias que observan entre
varias proporciones de la muestra son significativas o slo se deben al azar.

1.3 Prueba de la bondad del ajuste


La prueba ji- cuadrada puede utilizarse tambin para decidir si una
distribucin de probabilidad en particular, como la binomial, la de Poisson o la
normal, es la apropiada. Esta es una habilidad importante, porque como
tomadores de decisiones que utilizamos la estadstica, necesitamos escoger
cierta distribucin de probabilidad para representar la distribucin de los datos
que tengamos que analizar.
La prueba ji- cuadrada nos permite hacernos la pregunta de cul distribucin
podemos utilizar, y probar si existe una diferencia significativa entre una
distribucin de frecuencias observadas y una distribucin de frecuencias
terica.

Clculo de frecuencias observadas y esperadas


Ejemplo

La compaa x requiere que los estudiantes del ltimo ao de la universidad


que buscan trabajo sean entrevistados por tres ejecutivos diferentes. Esto
permite a la compaa obtener una evaluacin por consenso de candidatos.
Cada ejecutivo califica al candidato como positivo o negativo.
Con el propsito de planear la contratacin, el director de seleccin del
personal de la compaa piensa que el proceso de entrevistas puede ser
aproximado por una distribucin binomial con p= 0.40, es decir del 40 % de de
posibilidad de que cualquier candidato obtenga una calificacin positiva en
cualquiera de las entrevistas.
Si el director desea probar una hiptesis a un nivel de significancia de 0.20.
Cmo debe proceder?

Estadstica Administrativa II
2

Ho: una distribucin binomial con p= 0.40


proceso de entrevista.
Hi: una distribucin binomial con p= 0.40
proceso de entrevista.

Es una buena descripcin del

No es una buena descripcin del

= 0.20 nivel de significancia para probar la hiptesis


Calificaciones positivas
posibles en las tres
entrevistas

Nmero de
candidatos que
obtienen cada
calificacin

0
1
2
3

18
47
24
11
100

Calificaciones positivas
posibles en las tres
entrevistas

Probabilidades
binomiales para
esos resultados

0
1
2
3

.2160
.4320
.2880
.0640
1.0000

Resultados
de las entrevistas
de 100 candidatos

Posibilidad binomial

Frecuencias
observadas,
Probabilidades
binomiales
adecuadas
y frecuencias
esperada

Calificaciones
positivas
posibles en las tres
entrevistas

Frecuencia
observada de
candidatos que
obtienen estas
calificaciones

Probabilidades
binomiales de
resultados
posibles

Nmero de
candidatos
entrevistados

Frecuencia
esperada de
candidatos
que obtienen
estas
calificaciones

0
1
2
3

18
47
24
11
100

.2160
.4320
.2880
.0640
1.0000

100
100
100
100

21.6
43.2
28.8
6.4
100.0

Estadstico ji- cuadrada


x2 = (fo-fe)2
fe

fo= frecuencia observada


fe= frecuencia esperada

Estadstica Administrativa II
3

Calculo del
estadstico x2

Frecuencia
observada
fo

Frecuencia
esperada
fe

fo-fe

(fo-fe)

18
47
24
11

21.6
43.2
28.8
6.4

-3.6
3.8
-4.8
4.6

12.96
14.44
23.04
21.16

(fo-fe)
fe

0.6000
0.3343
0.8000
3.3063
2
X =5.0406

Determinacin de los grados de libertad


Antes de calcular el nmero adecuado de grados de libertad para una prueba jicuadrada de bondad de ajuste, es necesario contar el nmero de clases
(denotado por K) para las que se compararon las frecuencias observadas y
esperadas.

Grados de libertad = k-1


K= 0,1,2,3

k= 4

gl= 4-1

gl= 3

Regin de aceptacin

Distribucin x2

0.20 del rea


Regin de rechazo
4.642

5.0406

Valor de tabla

Valor x2

Rechazamos la hiptesis nula y llegamos a la conclusin de que la distribucin


binomial con p=0.40 no proporciona una buena descripcin de nuestras
frecuencias observadas
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadstica para administradores. Editorial: Prentice-Hall.

Nmero

Pgina

11-16
11-17
11-18

466
466
466

Estadstica Administrativa II
4

1.4Tablas de contingencia
Describimos las dimensiones de una tabla de contingencia estableciendo
primero el nmero de renglones y luego el nmero de columnas. La columna y
el rengln con el total no cuentan como parte de las dimensiones. Los
renglones corren de manera horizontal y las columnas de manera vertical.
Tabla de contingencia de 2 x 4( 2 renglones, 4 columnas)

1.4.1 Mtodo para obtener el estadstico x2 de una tabla de


contingencia con 2 renglones.
Ejemplo
En cuatro regiones se muestrean las actitudes de los empleados respecto a la
evaluacin del desempeo en el trabajo. Los trabajadores eligen entre el
mtodo actual (dos evaluaciones al ao) y un mtodo propuesto (evaluaciones
trimestrales). A continuacin se presentan los datos.

Tabla de contingencia de 2x4

Respuesta de
la muestra
concerniente
a los
programas de
evaluacin de
empleados

Nmero de empleados que


prefieren el mtodo actual
Nmero de empleados que
prefieren el mtodo nuevo
Total de empleados
muestreados en cada
regin

Noreste

Sureste

Central

Costa
oeste

Total

68

75

57

79

279

32

45

33

31

141

100

56

90

110

420

Planteamiento del problema

Hiptesis nula
Ho: PN=PS=PC=PW
Hiptesis alternativa
Hi: PN, PS, PC, PW no son iguales
PN= proporcin de empleados en el noreste que prefieren el plan actual
PS= proporcin de empleados en el sureste que prefieren el plan actual
PC= proporcin de empleados en la regin central que prefieren el plan actual
PW= proporcin de empleados de la regin de la costa que prefieren el plan
actual.

Estadstica Administrativa II
5

Frecuencias observadas y esperadas

Proporcin de
empleados
muestreados
en cada
regin que se
espera
prefieren los
dos mtodos
de evaluacin

Comparacin
de las
frecuencias
observadas y
esperadas de
trabajadores
muestreados

Nmero total muestreado


Proporcin estimada que
prefieren el mtodo actual
Nmero que se espera
prefiera el mtodo actual
Nmero total muestreado
Proporcin estimada que
prefieren el mtodo nuevo
Nmero que se espera
prefiera el mtodo nuevo

Frecuencia con que


prefieren el mtodo actual:
Frecuencia observada (real)
Frecuencia esperada
(terica)
Frecuencia con que
prefieren el mtodo nuevo:
Frecuencia observada (real)
Frecuencia esperada
(terica)

Noreste

Sureste

Central

Costa
oeste

100
x 0.6643

120
x 0.6643

90
x 0.6643

110
x 0.6643

66.43

79.72

59.79

73.07

100
x 0.3357

120
x 0.3357

90
x 0.3357

110
x 0.3357

33.57

40.28

30.21

36.93

Noreste

Sureste

Central

Costa
oeste

68

75

57

79

66.43

79.72

59.79

73.07

32

45

33

31

33.57

40.28

30.21

36.93

Estadstico ji- cuadrada


=

( )

fo= frecuencia observada


fe= frecuencia esperada

Calculo del
estadstico
2
x

fo
68
75
57
79
32
45
33
31

fe
66.43
79.72
59.79
73.07
33.57
40.28
30.21
36.93

Paso 1
fo-fe

Paso 2
2
(fo-fe)

1.57
-4.72
-2.79
5.93
-1.57
4.72
2.79
-5.93

2.46
22.28
7.78
35.16
2.46
22.28
7.78
35.16
2

X=

Paso 3
2
(fo-fe)
fe
0.0370
0.2795
0.1301
0.4812
0.0733
0.5531
0.2575
0.9521
2.7638

Estadstica Administrativa II
6

Determinacin de los grados de libertad


Grados de libertad en una prueba ji- cuadrada
Nmero
grados
libertad

de
de

= (nmero de renglones -1 )(nmero de columnas -1)

Tabla de 2x4

(2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de .10


Buscar en tablas x2 3 grados de libertad con un nivel de significancia de .10 y
graficar
Regin de aceptacin

Distribucin x2
con 3 grados de
libertad

0.10 del rea


Regin de rechazo
2.764
Valor x2

6.251
Valor de tabla

Interpretacin de los resultados y la grfica.

1.4.2 Mtodo para obtener el estadstico x2 de una tabla de


contingencia con ms de 2 renglones.
Estadstico ji- cuadrada
x2 = (fo-fe)2
fe

fo= frecuencia observada


fe= frecuencia esperada

Determinacin de los grados de libertad de una tabla de


contingencia de ms de tres renglones
Grados de libertad en una prueba ji- cuadrada
Nmero
de
grados
de
libertad de una
tabla de ms de
tres renglones

= (nmero de renglones -1 )(nmero de columnas -1)

Estadstica Administrativa II
7

Tabla de contingencia

Nmero de
renglones

Nmero de
columnas

r-1

c-1

A
B
C

3
5
6

4
7
9

3-1=2
5-1=4
6-1=5

4-1=3
7-1=6
9-1=8

Grados de
libertad
(r-1)(c-1)
(2)(3)=6
(4)(6)=24
(5)(8)=40

El presidente de una compaa de seguros de salud, se opone al seguro


nacional. Argumenta que su implementacin sera muy costosa, en particular,
debido a que la existencia de este sistema tendera a fomentar permanencias
hospitalarias ms prolongadas, adems de otros efectos. El presidente piensa
que el tiempo de hospitalizacin depende del tipo de seguro de salud que
tengan las personas.
Los siguientes datos se obtuvieron de una muestra aleatoria de 660
hospitalizaciones.

Datos de
hospitalizaciones
Calificados segn
el tipo de
cobertura del
seguro y el tiempo
de estancia

Fraccin de costos
cubiertos por el seguro

<25%
25 -50%
>50%
Total

Das en el hospital
<5
5-10
40
75
30
45
40
100

>10
65
75
190

Total
180
150
330

110

330

660

220

Planteamiento del problema


Hiptesis nula
Ho: el tiempo de estancia y tipo de seguro son independientes
Hiptesis alternativa
Hi: el tiempo de estancia depende del tipo de seguro
= 0.01 nivel de significancia para probar la hiptesis

Calculo de la frecuencia esperada

Frecuencia esperada para cualquier celda


fe= RT X CT
n

fe= frecuencia esperada en una celda dada


RT= total por rengln para el rengln que contiene esa celda
CT= total por columna para la columna que contiene esa celda.
n= nmero total de observaciones

Estadstica Administrativa II
8

Estadstico ji- cuadrada


fo= frecuencia observada
fe= frecuencia esperada
x2 = (fo-fe)2
fe

Calculo
de las
frecuencia
s
esperadas
y jicuadrada

(fo-fe)
fe

Rengln

Columna

fo

fe

= RT X CT
n

fo-fe

(fo-fe)

40

30

10

100

3.333

75

60

15

225

3.750

65

90

-25

625

6.944

30

25

25

1.000

45

50

-5

25

0.500

75

75

0.000

40

55

-15

225

4.091

100

110

-10

100

0.909

190

165

180 X 110
660
180 X 220
660
180 X 330
660
150 X 110
660
150 X 220
660
150 X 330
660
330 X 110
660
330 X 220
660
330 X 330
660

25

625

3.788
2

X =24.315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de .10 y


graficar
Regin de aceptacin
Distribucin x2

0.10 del rea


Regin de rechazo
13.277
Valor de tabla

Interpretacin de resultados

x2= 24.315

Estadstica Administrativa II
9

Ejercicios
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadstica para administradores. Editorial: Prentice-Hall.

Nmero

Pgina

11-1
11-2
11-7
11-8
11-9
11-10
11-11
11-12
11-13

459
460
460
460
460
460
461
461
461

1.5 Anlisis de varianza


El anlisis de varianza nos permite probar si ms de dos medias de poblacin
pueden considerarse iguales. A menudo se abrevia ANOVA: analysis of
variance.

ANOVA Es un mtodo de prueba de igualdad de tres o ms medias


poblacionales. 1
Hiptesis nula tpica
HO= 1= 2= 3
El mtodo ANOVA nos sirve para evitar el error tipo I (rechazar una hiptesis
nula verdadera,), si utilizamos una prueba de igualdad de varias medias.

1.5.1 Aplicaciones de ANOVA


Se utiliza cuando:
Se asevera que los supermercados colocan los cereales con alto contenido de
azcar en estantes que estn a la altura De los ojos de los nios, de manera
que eso nos permite probar la aseveracin de que los cereales en los estantes
tienen
el
mismo
contenido
de
azcar.

Mario F. Triola, Estadstica, Pearson, Mxico,2006

Estadstica Administrativa II
10

Tambin en casos como: la comparacin del kilometraje logrado por cinco


clases diferentes de gasolina, la prueba de cul de cuatro mtodos de
capacitacin produce el aprendizaje ms rpido, etc.

Los mtodos de ANOVA requieren de la distribucin F.


Propiedades de la distribucin F:
1. Es no simtrica; se sesga hacia la derecha
2. Los valores F son 0 o positivo, pero no negativos
3. Hay una distribucin F para cada par de grados de libertad para el
numerador y el denominador.

Figura 1. Fuente: (Triola, 2006:605)

Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2

22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hiptesis
Ho: 1= 2= 3
H1: 1, 2 y 3 no son todas iguales

Estadstica Administrativa II
11

Clculo de la media
Mtodo 1

Mtodo 2

Mtodo 3

15
18
19
22
11

22
27
18
21
17

85
5
17

105
5
21

18
24
19
16
22
15
114
6

n1=5

n2=5

n3=6

Produccin diaria

1=

17

2=

21

3=

Sumatoria
Tamao de
la muestra
Media
muestral

19

19

Clculo de la gran media


= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19

16

Clculo de la varianza entre columnas


2b = nj (

Clculo de la
varianza
entre columnas

2b = nj (

5
5
6

)2 =

k-1

17
21
19

- )2 = 40=
k-1
3-1

19
19
19

40
2

17-19=-2
21-19=2
19-19=0

= 20

)2

(-2) =4
(2)2=4
(0)2=0
nj( - )2

n(

5x4=20
5x4=20
6x0 = 0
=40

varianza entre columnas

Estadstica Administrativa II
12

Estimacin de la varianza dentro de columnas


Mtodo de capacitacin 1
Media muestral =17

Estimacin
de la varianza
dentro de columnas

s21= (

- )2
n-1

= 70
5-1

= 17.5

15-17=-2
18-17=1
19-17=2
22-17=5
11-17=-6
( - )2

( - )2
(-2)2=4
(1)2=1
(2)2=4
(5)2=25
(-6)2=36
=70

varianza de la muestra

Mtodo de capacitacin 2
Media muestral =21

Estimacin
de la varianza
dentro de columnas

s22= (

- )2
n-1

= 62
5-1

= 15.5

22-21=1
27-21=6
18-21=-3
21-21=0
17-21=-4
( - )2

( - )2
(1)2=1
(6)2=36
(-3)2=9
(0)2=0
(-4)2=16
=62

varianza de la muestra

Mtodo de capacitacin 3
Media muestral =19

Estimacin
de la varianza
dentro de columnas

18-19=-1
24-19=5
19-19=0
16-19=-3
22-19=3
15-19=-4
( - )2

( - )2
(-1)2=1
(5)2=25
(0)2=0
(-3)2=9
(-32=9
(-4)2=16
=60

Estadstica Administrativa II
13

s23= (

2w =

- )2
n-1

= 60
6-1

= 12.0

varianza de la muestra

nj - 1 s2j = (4/13)(17.5) + (4/13)(15.5) + (5/13)(12.0) = 193 = 14.769


nt - k
13

Estadstico F
F = varianza entre columnas
= 2b
Varianza dentro de columnas
2w
F=

20
=
14.769

1.354 cociente F

Determinacin de los grados de libertad


Grados de libertad del numerador
Nmero de grados de libertad en el
= (nmero de muestras-1)
numerador del cociente F

Grados de libertad del denominador


Nmero de grados de libertad en el
= (nj-1)= nt-k
denominador del cociente F

Grfica
Regin de aceptacin
Distribucin f

0.05 del rea


Regin de rechazo
F= 1.354

3.81
Valor de tabla

Se acepta la hiptesis nula.

Estadstica Administrativa II
14

Ejercicios
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadstica para administradores. Editorial: Prentice-Hall.

Nmero

Pgina

11-5
11-6
11-26
11-27
11-28
11-29
11-30

479
479
480
480
480
480
480

1.5.2 Inferencia sobre una varianza de poblacin (Anova).

Estadstico ji- cuadrada para inferencias sobre una


varianza
X2=(n-1)s2

Intervalo de confianza para 2


Lmite inferior de confianza

2L=(n-1)s2

Lmite superior de confianza

2U=(n-1)s2

X2U
X2L

Estadstica Administrativa II
15

Ejercicio.
Con los siguientes datos obtener el estadstico ji- cuadrada Y el intervalo de
confianza del 95%

Tiempo x
50
45
27
66
43
96
45
90
69

1.5.3 Inferencia sobre la varianza de dos poblaciones (Anova).


Adems de comparar la varianza de dos poblaciones, el principal objetivo de
este tema es analizar el cociente que se obtiene al aplicar la frmula
correspondiente.
Coeficiente F para inferencias acerca de dos varianzas.
F=S21
S22

Estadstica Administrativa II
16

Unidad 2. Anlisis de regresin, correlacin lineal simple y


mltiple
2.1 Estimacin mediante la lnea de regresin
El anlisis de regresin y correlacin permiten determinar tanto la naturaleza
como la fuerza de una relacin entre dos variables.
En el anlisis de regresin se desarrollar una ecuacin de estimacin, a travs
de una frmula matemtica que relaciona las variables conocidas con la
variable desconocida.
La variable conocida.- variable independiente X
La variable que tratamos de predecir se llama variable dependiente Y

Y
Pendiente negativa

Pendiente positiva
Emisor
de
contaminacin

Ventas

Publicidad

Gastos contra la contaminacin

a) Relacin directa

b) Relacin directa

Figura 2. Fuente: (Levin, 2004:511)

2.1.1 Diagrama de dispersin


El primer paso para determinar si existe una relacin entre dos variables es
examinar la grfica de datos observados. A esta grfica se le llama diagrama
de dispersin.
Un diagrama de dispersin se puede identificar visualmente patrones que
indique si las variables estn relacionadas.

Estadstica Administrativa II
17

Figura 3. Fuente: (Levin, 2004:503)

2.1.2 Mtodo de mnimos cuadrados


Lnea de estimacin
Y= a+bx

Y= variable dependiente
a=variable ordenada y
b=pendiente de la recta
x=variable independiente

Pendiente de la recta de regresin de mejor ajuste


b = XY - n X Y
X2 - n X2

b=pendiente de la lnea de estimacin de mejor ajuste


X= valores de la variable independiente
Y= variable valores de la variable dependiente
X= media de los valores de la variable independiente
Y= media de los valores de la variable dependiente
n= nmero de puntos

Estadstica Administrativa II
18

Lnea de estimacin
a = Y - bX

a= ordenada Y
b= pendiente de la ecuacin
X= media de los valores de la variable independiente
Y= media de los valores de la variable dependiente
Error estndar de la estimacin
Se= (Y-Y)2
n-2

Y= valores de la variable dependiente


Y=valores estimados con la ecuacin de estimacin que corresponden a cada
valor de Y
n= nmero de puntos utilizados para ajustar la lnea de regresin
Para medir la confiabilidad de la ecuacin de estimacin, los especialistas en
estadstica han desarrollado el error estndar de estimacin. Este error
estndar se simboliza por Se y es similar a la desviacin estndar, en cuanto a
que ambas son medidas de dispersin.
El error estndar de la estimacin, por otra parte, mide la variabilidad, o
dispersin de los valores observados alrededor de la recta de regresin.

2.1.3 Interpretacin del error estndar de la estimacin


Como ocurrira en el caso de la desviacin estndar, mientras ms grande sea
el error estndar de la estimacin, mayor ser la dispersin de los puntos
alrededor de la lnea de regresin. De manera inversa, si Se= 0, esperamos que
la ecuacin de estimacin sea un estimador perfecto de la variable
dependiente. En este caso, todos los puntos caeran directamente sobre la
lnea de regresin y no habra puntos dispersos alrededor.
Usaremos el error estndar de la estimacin como una herramienta, de la
misma forma que podemos usar la desviacin estndar. Esto es, suponiendo
que los puntos observados siguen una distribucin normal alrededor de la recta
de regresin, podemos esperar encontrar el 68% de los puntos dentro de 1Se,
el 95.5 % de los puntos dentro de 2Se, y el 99.7 % de los puntos dentro de
3Se.

Estadstica Administrativa II
19

Figura 4. Fuente: (Levin, 2004:529)

Debemos observar que el error estndar de la estimacin se mide a lo largo del


eje Y, y no perpendicularmente desde la recta de regresin.

2.1.4 Intervalos de prediccin aproximados


Podemos concebir al error estndar de la estimacin como una herramienta
estadstica que podemos usar para hacer afirmaciones de probabilidad acerca
del intervalo alrededor del valor estimado de Y, dentro del cual cae el valor real
de Y.

Ejemplo
Y= 3.75 + 0.75 X
Sustituyendo 4 en X
Y= 3.75 + 0.75 (4)
= 3.75 + 3.00
= 6.75

Estadstica Administrativa II
20
Intervalo

1 error

2 errores

3 errores

Y 2 Se.

Y 1 Se.

Y 3 Se.

En donde Se = 86.60
Sustitucin
Y +1 Se =

Y +2 Se =

675 + (1) (86.60) = 761.40

675 + (2) (86.60) = 848.20

Lmite superior del intervalo de


prediccin

Lmite superior del intervalo de


prediccin

Y -1 Se =

Y - 2 Se =

675 - (1) (86.60) = 588.40

675 - (2) (86.60) = 501.80

Lmite inferior del intervalo de


prediccin

Lmite inferior del intervalo de


prediccin

Ejemplo
A menudo quienes hacen la contabilidad de costos estiman los gastos
generales con base en el nivel de produccin. Se ha reunido informacin
acerca de los gastos generales y las unidades producidas en diferentes
plantas, y ahora desean estimar una ecuacin de regresin para predecir los
gastos generales futuros.

Gastos generales
Unidades

a)
b)
c)
d)

191
40

170
42

272
53

155
35

280
56

173
39

234
48

116
30

153
37

Determine la variable dependiente e independiente


Desarrolle una ecuacin de regresin para contabilidad de costos
Pronostique los gastos generales cuando se producen 50 unidades
Calcule el error estndar de estimacin

178
40

Estadstica Administrativa II
21

X=

XY

X2

Y2

40
42
53
35
56
39
48
30
37
40
420

191
170
272
155
280
173
234
116
153
178
1922

7640
7140
14416
5425
15680
6747
11232
3480
5661
7120
84541

1600
1764
2809
1225
3136
1521
2304
900
1369
1600
18228

36481
28900
73984
24025
78400
29929
54756
13456
23409
31684
395024

Y=

XY=

X2=

Y2=

b = XY - n X Y = 84541 - 10(42)(192.2) = 6.4915


X2 - n X2
18228 - 10(42)2

a = Y bX = 192.2 6.4915 (42) = - 80.4430

Y= a+bx = -80.4430 + 6.4915 (50) = 244.1320


Se= Y2 aY b XY =
n-2

Ejercicios
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadstica para administradores. Editorial: Prentice-Hall.

Nmero

Pgina

12-2
12-3
12-13
12-14
12-15

531
531
531
531
531

Estadstica Administrativa II
22

2.1.5 Anlisis de correlacin


El anlisis de correlacin es la herramienta estadstica que podemos usar para
describir el grado en el que una variable est linealmente relacionada con otra.

El coeficiente de determinacin es la principal forma en que podemos medir el


grado, o fuerza, de la asociacin que existe entre dos variables, X y Y. debido a
que usamos una muestra de puntos para desarrollar rectas de regresin.

Coeficiente de determinacin de la muestra


r2= aY+bXY-nY2
Y2 n Y2

Coeficiente de correlacin de la muestra


r= r2

Ejercicio
Con los datos de los ejercicios anteriores obtn el coeficiente de determinacin
y el coeficiente de correlacin.

2.1.6 Paquete computacional para la solucin de problemas


Resolver ejercicios en excel

2.1.7 Regresin mltiple y anlisis de correlacin


Podemos utilizar ms de una variable independiente para estimar la variable
dependiente e intentar, aumentar la precisin de la estimacin. Este proceso se
conoce como anlisis de regresin mltiple y correlacin.
La principal ventaja de la regresin mltiple es que nos permite utilizar ms
informacin disponible para estimar la variable dependiente. En algunas
ocasiones la correlacin entre dos variables puede resultar insuficiente para
determinar una ecuacin de estimacin confiable; sin embargo, si agregamos
los datos de ms variables independientes, podemos determinar una ecuacin
de estimacin que describa la relacin con mayor precisin.

Estadstica Administrativa II
23
Ecuacin de estimacin que describe la relacin entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacin
na + b1 X1 + b2 X2 = Y
aX1 + b1 X21 + b2 X1X2 = X1Y
aX2 + b1 X1X2 + b2 X22 = X2Y

Ejemplo
a) Calcular el plano de regresin mltiple
b) Prediga Y cuando X1=28 y x2=10
Y
10
177
18
26
35
8
Sumatoria 114

X1

X2

X1y

X2y

X1X2

X1 2

X2 2

8
21
14
17
36
9
105

4
9
11
20
13
28
85

80
357
252
442
1260
72
2463

40
153
198
520
455
224
1590

32
189
154
340
468
252
1435

64
441
196
289
1296
81
2367

166
81
121
400
169
784
1571

Matriz
6
105
85

105
2367
1435

85
1435
1571

114
2463
1590

1
0
0

17.5 14.167
529.5 -52.535
-52.5 366.805

19
468
-25

1
0
0

17.5 14.167
1
-.099
0 361.608

19
.884
21.410

361.608

b2
b2

=
=

b2

21.410
21.410
361.608
.059

Estadstica Administrativa II
24

1 b1
1 b1

1a
1a

-.099
b2
-.099 (.059)
-.006
1b1
b1

= .884
= .884
.884
= .884 +.006
= .890

+17.5b1
+14.167b2
+17.5(.890) +14.167 (.059)
1a +16.411
1a

=
=
=
=

19
19
19
19-16.411

2.589

Y= a + b1 X1 + b2 X2

y=2.589+.890(28)+.059(10)=28.099

Estadstica Administrativa II
25

2.1.8 Usos de variables ficticias


La regresin mltiple nos permitir tambin ajustar tanto curvas como rectas.
Usando las tcnicas de variables ficticias, podemos incluir factores cualitativos
en la regresin mltiple. Las variables ficticias y las curvas de ajuste son
solamente dos de las muchas tcnicas de modelado que se pueden utilizar en
la regresin mltiple para aumentar la precisin de las ecuaciones de
estimacin.

2.1.9 Residuales y grficas de residuales


Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y, es
decir (Y - Y)
Cuando los residuos permanecen constantes para todos los valores de Y, esta
condicin se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresin


lineal general y est dentro de sus supuestos clsicos bsicos.
Se dice que existe homocedasticidad cuando la varianza de los errores
estocsticos de la regresin es la misma para cada observacin i (de 1 a n
observaciones), es decir:

donde
es un escalar constante para todo i. Lo que significara que habra
una distribucin de probabilidad de idntica amplitud para cada variable
aleatoria.
Esta cualidad es necesaria, segn el Teorema de Gauss-Mrkov, para que en
un modelo los coeficientes estimados sean los mejores o eficientes, lineales e
insesgados.
Cuando no se cumple esta situacin, decimos que existe heterocedasticidad,
que es cuando la varianza de cada termino de perturbacin (ui) no es un
nmero constante
.
Este fenmeno suele ser muy comn en datos de Corte Transversal y tambin
se presenta, menos frecuentemente, en series de tiempo.

Estadstica Administrativa II
26

Figura 5. Distribucin Homocedstica.

Figura 6. Distribucin Heterocedstica.

Prctica 1
Con los datos histricos de ventas de una empresa, aplicar la regresin
lineal, para hacer estimaciones futuras.

Estadstica Administrativa II
27

Unidad 3. Nmeros ndice


Un nmero ndice mide cunto ha cambiado una variable con el tiempo. Se
calcula encontrando el cociente del valor actual entre el valor base, luego se
multiplica el nmero resultante por cien, por lo tanto se expresa en porcentaje.

Tipos de nmeros ndice


Existen tres tipos principales de nmeros ndice: ndice de precios, ndice de
cantidad e ndice de valor.

ndice de precios

Compara niveles de precio de un periodo a otro. El ndice de


precios al consumidor (IPC) clasificado por los gobiernos de los
pases, mide los cambios globales de precios de un conjunto
de bienes y servicios al consumidor, y se usa para definir el
costo de vida.

ndice de cantidad Mide cunto cambia el nmero o la cantidad de una variable


con el tiempo.

ndice de valor

Mide los cambios del valor monetario total, es decir, mide el


cambio del valor en dinero de una variable.

El ndice de valor combina los cambios de precio y cantidad para presentar un


ndice con ms informacin.
Los nmeros ndice, como el IPC, a menudo se citan en informes noticiosos
como indicadores generales de la condicin econmica de un pas.

Factores que pueden distorsionar los nmeros ndice.

Nmero limitado de datos o dificultad para encontrar datos adecuados.

Falta de comparacin de ndices.

Ponderacin no apropiada de los factores.

Seleccin de una base no apropiada.

Estadstica Administrativa II
28

3.1 Elaboracin de ndices simples

3.2 ndices agregados de precio


El ndice de agregados no ponderados es un ndice compuesto. No ponderado
significa que todos los valores considerados tienen la misma importancia de
agregados quiere decir que sumamos todos los valores.
ndice de cantidad de agregados no ponderados
Qi x 100
Qo

Qi=cantidad de cada elemento del compuesto en el ao para el que se desea


el ndice.
Qo= cantidad de cada elemento del compuesto en el ao base.
Ejemplo
El vicepresidente de ventas de la empresa X est examinando la tasa de
comisin para los empleados durante los ltimos 3 aos. En la siguiente tabla
se muestran las ganancias por comisiones de los cinco mejores vendedores
de la compaa.

Empleado A
Empleado B
Empleado C
Empleado D
Empleado E

1993
48,500
41,900
38,750
36,300
33,850

1994
55,100
46,200
43,500
45,400
38,300

1995
63,800
60,150
46,700
39,900
50,200

Considerando a 1993 como el periodo base, exprese las ganancias por


comisiones de 1994 y 1995 en trminos de un ndice de agregado no
ponderado.

Empleado A
Empleado B
Empleado C
Empleado D
Empleado E

1993

1994

1995

Qo

Q1

Q2

48,500
41,900
38,750
36,300
33,850
199,300

55,100
46,200
43,500
45,400
38,300
228,500

63,800
60,150
46,700
39,900
50,200
260,750

19,930,000
199,300

22,850,000
199,300

26,075,000
199,300

=100%

=114.7%

=130.8%

Estadstica Administrativa II
29

ndice de agregados ponderado


Cuando se calcula un ndice se tiene que asignar una importancia mayor a los
cambios en algunas variables que en otras. Esta ponderacin permite mejorar
la precisin de la estimacin del nivel general de precios basado en una
muestra.

ndice de precios de agregados ponderados


PiQ x 100
PoQ

Pi=precio de cada elemento del compuesto en del ao actual


Po= precio de cada elemento del compuesto en del ao actual ao base.
Q= factor de ponderacin de cantidad seleccionado

3.3 Relativos eslabonados


"Son ndices cuya base es siempre periodo anterior. En consecuencia, respecto
de un conjunto de relativos eslabonados de valores anuales de ventas, cada
numero ndice representa una comparacin porcentual con el ao anterior.
Estos relativos son tiles para destacar comparaciones entre un ao y otro,
pero resultan inconvenientes como base de comparaciones a largo plazo"

3.4 Cambio de periodo base


"La base de una serie establecida de nmeros ndices suele cambiarse a un
ao ms reciente para que las comparaciones actuales sean ms significativas.
Partiendo del supuesto de que no se dispone de las cantidades originales en
las que se apoya la serie de nmeros ndices, el periodo base de un numero
ndice puede cambiarse dividiendo cada ndice (original) entre el ndice del ao
base recin determinado y multiplicando el resultado por 100:"
Cambio de periodo base
I nuevo =

ndice antiguo
ndice antiguo de la nueva base

x100

Estadstica Administrativa II
30

3.5 Fusin de dos series de nmeros ndice


"Es frecuente que un nmero ndice sufra cambios a causa de la adiccin de
ciertos productos nuevos o de la exclusin de ciertos productos antiguos, as
como de cambios en el ao base. Sin embargo, para efectos de continuidad
histrica es deseable contar con una serie uniforme de nmeros ndices. Para
fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie
continua de nmeros ndices, debe haber un ao de empalme de las dos series
en relacin con el cual se hayan calculado ambos nmeros ndices.
Generalmente el ao de empalme es tambin la nueva base, porque es el ao
en que se ha aadido y/o eliminado productos del ndice agregado. Los
nmeros ndices que deben modificarse en el proceso de fusin son los ndices
de la antigua serie. Este cambio se realiza dividiendo el nuevo numero ndice
del ao de empalme, entre el antiguo ndice de ese ao y multiplicando
despus por este cociente cada uno de los nmeros ndices de la antigua serie
de los nmeros ndices."

3.6 ndice de precios al consumidor (IPC).


"Es el ndice ms conocido de los que se han publicado, dada su utilidad como
indicador de la tasa de inflacin y del costo de vida se trata de un ndice
agregado de precios sobre una canasta bsica de varios cientos de bienes y
servicios, cuya ponderaciones son reflejo de los patrones de compra de los
consumidores urbanos."
Para que las variaciones en el ndice se deban slo a modificaciones en los
precios y no a otros factores, como por ejemplo el cambio en los hbitos de
compra de los consumidores, es necesario que las ponderaciones de los
bienes y servicios sean las mismas en los perodos cuyos precios se comparan
y, a su vez, que las especificaciones de esos bienes y servicios de la canasta
deben ser comparables.
Aislar la evolucin de los precios es una tarea complicada. La variacin
temporal en el gasto que un hogar destina para la compra de determinado bien
o servicio se origina conjuntamente por factores de precio y por factores de
volumen fsico.
Los ndices de precios tratan de medir el efecto de los factores de precio, esto
es, la cantidad de dinero pagada por una unidad de bien o servicio, de
determinada calidad. Sera ptimo, entonces, que los ndices de precios no
estuvieran distorsionados por cambios en la calidad de los productos o
servicios.
El proceso de elaboracin de un ndice puro de precios conlleva mucho trabajo,
debido a la dificultad que implica separar los factores que no se deben en
forma exclusiva a los precios pero que tambin inciden en el valor de los bienes
y servicios (cantidad, volumen, caractersticas fsicas y funcionales, durabilidad,
calidad, prestigio que otorga su consumo, lugar de adquisicin, momento y
volumen de la adquisicin, etctera).

Estadstica Administrativa II
31

Por otra parte, debido a los cambios en los patrones de consumo de la


poblacin de referencia existe la necesidad de revisar, y modificar si fuera
necesario, la canasta de consumo, as como la poblacin de referencia y los
negocios informantes, para que el ndice se mantenga actualizado, sea
representativo y til en la prctica.

3.7 Deflacin de los valores de series de tiempo


Situacin opuesta a la inflacin en la que aumenta el valor de la unidad
monetaria como resultante de la baja de los precios. Se produce deflacin
cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes
y servicios.
En la prctica esto casi nunca sucede, pues los gobiernos aumentan la oferta
monetaria a un ritmo suficiente como para compensar ese crecimiento: de no
hacerlo podran darse bajas en los salarios nominales, con el consiguiente
malestar social que esto producira.
La deflacin de series monetarias consiste en eliminar el efecto que los
cambios en los precios de los bienes tienen sobre las series de valores.
Cuando queremos conocer la evolucin de una serie de valores a lo largo del
tiempo, por ejemplo, beneficios de una empresa, produccin de una industria,
salarios de los empleados de una empresa, ingresos de los hogares, etc., nos
encontramos habitualmente con los valores estn en unidades monetarias de
cada periodo, esto es, los valores se refieren a unidades monetarias corrientes.
Esto va a hacer que los valores no sean directamente comparables puesto que
las alteraciones de los precios de un periodo a otro confieren distinto poder
adquisitivo a las unidades monetarias. En otras palabras, el efecto de la
inflacin (o deflacin) modifica la capacidad de compra del dinero.
Para conocer los cambios reales experimentados por la serie a lo largo del
periodo de inters tendremos que expresar todos los valores de dicha serie en
unidades monetarias de un mismo periodo, es decir, en unidades monetarias
constantes.
Los valores expresados en unidades monetarias corrientes se conocen como
valores nominales.
Los valores expresados en unidades monetarias constantes se conocen como
valores reales.

Estadstica Administrativa II
32

3.8 ndice de precios al productor (IPP).


"Incluye tres ndices diferentes: de materias primas, materias intermedias y
bienes terminados. Se le considera un importante indicador lder de la tasa de
inflacin, debido a la probabilidad de que incrementos en los precios de los
bienes terminados den origen a subsecuentes incrementos en precios al
consumidor."
Es el producto resultante de una investigacin estadstica de carcter
estratgico, que permite medir la variacin porcentual promedio de los precios
al por menor de un conjunto de bienes y servicios. Para entender mejor la
naturaleza del IPP, se debe pensar en el ndice como una medida del
porcentaje de cambio, a travs del tiempo, del costo promedio de una gran
canasta de bienes y servicios comprados por los hogares de Colombia,
manteniendo constante la calidad y la cantidad de los bienes. La diferencia con
el IPC radica en las agrupaciones en las que est dividido el ndice. El IPP
tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos,
bebidas y tabaco, materias primas no combustibles y lubricantes, aceites y
grasas vegetales y animales, productos qumicos, artculos manufacturados,
maquinaria y equipo de transporte, artculos manufacturados diversos.

3.9 Promedios de precios burstiles de DowJones


"Los promedios de precios burstiles de Dow Jones, muestra los promedios de
las acciones en el ramo de la industria, el transporte y de servicios pblicos,
toma como muestra 30 mercados. Se trata de un promedio ponderado cuyas
ponderaciones ha sido revisadas varias veces a causa de cambios en el valor
nominal de las acciones y modificaciones en las compaas incluidas en el
ndice."
Este ndice es representativo de las 30 mayores compaas industriales de
Estados Unidos y se compila sumando los precios de sus acciones y luego
dividindolos por una constante. El divisor del Dow Jones se ajusta
peridicamente a fin de reflejar el fraccionamiento o divisin de las acciones
(ver Split). Este promedio empez a compilarse en 1896 con los ttulos de 12
firmas, entre ellas las entonces American Tobaco, Tennessee Coal and Iron,
Chicago Gas, American Sugar, y la nica sobreviviente hoy: General Electric.
En 1916 ya eran 20. Y a partir de 1928 pasaron a ser 30, sin que hasta ahora
haya
variado
esa
cantidad.
A continuacin las compaas comprendidas en el Dow Jones y los smbolos
bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE):

Estadstica Administrativa II
33
Smbolo
AA

Nombre de la
compaa
Alcoa

ALD

Allied Signal

AXP

American Express

BA

Boeing

CAT

Caterpillar

CHV

Chevron

CitiGroup

DIS

Disney

DD

Dupont

EK

Eastman Kodak

GE

General Electric

GM

General Motors

GT

Goodyear Tire

HWP

Hewlett-Packard

IBM

International Business
Machines

IP

International Paper

JNJ

Johnson & Johnson

JPM

JP Morgan Bank

KO

Coca Cola

Figura 5. Compaas comprendidas en el Dow Jones

3.10 ndice de produccin industrial


"Es un ndice agregado de cantidad y es una medida de la produccin de
fbricas, minas y plantas elctricas y gaseras del pas. Por lo tanto, es un
indicador importante del estado de la economa. Se trata de un promedio
ponderado de relativos de cantidad."
El ndice de Produccin Industrial (IPI) es un indicador coyuntural que mide la
evolucin mensual de la actividad productiva de las ramas industriales, excluida
la construccin, contenidas en la Clasificacin Nacional de Actividades
Econmicas 2009 (CNAE-2009). Mide, por tanto, la evolucin conjunta de la
cantidad y de la calidad, eliminando la influencia de los precios.
Para su obtencin se realiza una encuesta continua de periodicidad mensual
que investiga todos los meses ms de 13.200 establecimientos.
Prctica 2
Con datos investigados en revistas al consumidor o del Banco de Mxico,
elaborar los ndices simples de precio y cantidad, as como agregado
de precios.

Estadstica Administrativa II
34

Unidad 4. Estadstica no paramtrica


4.1 Escala de medicin
Las escalas de medicin son una sucesin de medidas que permiten organizar
datos en orden jerrquico. Las escalas de medicin, pueden ser clasificadas de
acuerdo a una degradacin de las caractersticas de las variables. Estas
escalas son: nominales, ordinales o racionales. Segn pasa de una escala a
otra el atributo o la cualidad aumenta. Las escalas de medicin ofrecen
informacin sobre la clasificacin de variables discretas o continuas. Toda vez
que dicha clasificacin determina la seleccin de la grfica adecuada.
En la estadstica descriptiva y con el fin de realizar pruebas de significancia, las
variables se clasifican de la siguiente manera de acuerdo con su nivel de
medida:

Nominal (tambin categrica o discreta)


Ordinal
De intervalo (continua)
De razn o racional (continua)

4.2 Mtodos estadsticos contra no paramtricos


Las tcnicas estadsticas de estimacin de parmetros, intervalos de confianza
y prueba de hiptesis son, en conjunto, denominadas estadstica paramtrica y
son aplicadas bsicamente a variables contnuas. Estas tcnicas se basan en
especificar una forma de distribucin de la variable aleatoria y de los
estadsticos derivados de los datos.
En estadstica paramtrica se asume que la poblacin de la cual la muestra es
extrada es normal o aproximadamente normal. Esta propiedad es necesaria
para que la prueba de hiptesis sea vlida.
Sin embargo, en un gran nmero de casos no se puede determinar la
distribucin original ni la distribucin de los estadsticos por lo que en realidad
no tenemos parmetros a estimar. Tenemos solo distribuciones que comparar.
Esto se llama estadstica no-paramtrica.
Las hiptesis de una prueba no paramtrica se refiere a algo distinto del valor
de un parmetro de la poblacin.

Las principales pruebas no paramtricas son las siguientes:

Prueba de Pearson
Prueba binomial
Prueba de Anderson-Darling
Prueba de Cochran
Prueba de Cohen kappa
Prueba de Fisher

Estadstica Administrativa II
35

Prueba de Friedman
Prueba de Kendall
Prueba de Kolmogrov-Smirnov
Prueba de Kruskal-Wallis
Prueba de Kuiper
Prueba de Mann-Whitney o prueba de Wilcoxon
Prueba de McNemar
Prueba de la mediana
Prueba de Siegel-Tukey
Coeficiente de correlacin de Spearman
Tablas de contingencia
Prueba de Wald-Wolfowitz
Prueba de los signos de Wilcoxon

Caractersticas de algunas pruebas no paramtricas.


1. Prueba de signo para datos pares: los signos positivo o negativo
sustituyen a valores cuantitativos.
2. Prueba de suma de rangos: tambin llamada prueba U de MannWhitney, que puede usarse para determinar si dos muestras
independientes de sacaron de la misma poblacin.
3. Prueba de suma de rangos Kruskal Wallis: generaliza el anlisis de
varianza para poder prescindir de la suposicin de que las poblaciones
tienen distribucin normal.
4. Prueba de corridas de una sola muestra: es un mtodo para
determinar la aleatoriedad con la que se han seleccionado los elementos
muestreados.
5. Correlacin de rango: mtodo para hacer el anlisis de correlacin
cuando no se dispone de los datos para usar la forma numrica, pero
cuando la informacin es suficiente para clasificar los datos como
primero, segundo, tercero, etc.
6. Prueba de Kolmogorov: mtodo para determinar la bondad de ajuste
entre una muestra observada y una distribucin de probabilidad terica.

Prueba

Caracterstica

Mann- Whitney.

2 muestras independientes.

Wilcoxon.

2 muestras asociadas.

Kruskal-Wallis.

+ de 2 muestras independientes

Friedman.

+ de 2 muestras asociadas.

Tabla1. Caractersticas de pruebas no paramtricas.

Estadstica Administrativa II
36

Las pruebas no paramtricas, no requieren asumir normalidad de la poblacin y


la mayora se basan en el ordenamiento de los datos. El parmetro que se usa
para hacer las pruebas estadsticas es la Mediana y Media.

Ventajas y desventajas de los mtodos paramtricos


Desventajas
Ventajas
Ignoran cierta cantidad de
No requieren la suposicin de que
informacin.
una poblacin est distribuida en
forma de curva normal u otra forma
especfica.
A menudo no son tan eficientes o
Generalmente es ms sencillo
claras como las pruebas
realizarlas y entenderlas.
paramtricas.
Algunas veces no se requiere un
ordenamiento o clasificacin formal.

Tabla1. Ventajas y desventajas de los mtodos no paramtricas.

4.3 Prueba de corridas para aleatoriedad


4.3.1 Concepto de aleatoriedad.
Aleatorio se asocia a todo proceso cuyo resultado no es previsible ms que en
razn de la intervencin del azar. El trmino aleatoriedad se usa a menudo
como sinnimo con un nmero de propiedades estadsticas medibles, tales
como la carencia de tendencias o correlacin.
El resultado de todo suceso aleatorio no puede determinarse en ningn caso
antes de que este se produzca. El estudio de los fenmenos aleatorios queda
dentro del mbito de la teora de la probabilidad y, en un marco ms amplio, en
el de la estadstica.

4.3.2 Teora de corridas.


Una corrida es una secuencia de ocurrencias idnticas precedidas y seguidas
de ocurrencias diferentes.
Ejemplo
M,H,H,H,H,M,
1ra.

2ra.

3ra.

Estadstica Administrativa II
37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes
smbolos:
n1= nmero de ocurrencias del tipo 1
n2= nmero de ocurrencias del tipo 2
r= nmero de corridas

4.3.2.1 Prueba de corridas de una sola muestra


Un fabricante de cereal para el desayuno usa una mquina para introducir
aleatoriamente uno de los dos tipos de muecos en cada caja. La compaa
desea una aleatoriedad tal que no todos los nios de un vecindario terminen
con el mismo mueco. Los probadores eligen muestras de 60 cajas sucesivas
para ver si la mquina est mezclando adecuadamente los dos tipos de
muecos. Usado los smbolos A y B para representar los dos tipos de
muecos, un probador report que uno de estos lotes se present como sigue:
B,A,B,B,B,A,A,A,B,B,A,B,B,B,B,A,A,A,A,B,A,B,A,A,B,B,B,A,A,B,A,A,A,A,B,B,A,
B,B,A,A,A,A,B,B,A,B,B,B,B,A,A,B,B,A,B,A,A,B,B
Valores de la prueba:
n1= 29
n2= 31
r= 29

4.3.2.2 Distribucin de muestreo del estadstico r


El nmero de corridas r es un estadstico con su propia distribucin de
muestreo especial y su propia prueba.
Una prueba de corridas de una sola muestra, est basada en la idea de que
muy pocas o demasiadas corridas muestran que los elementos no fueron
elegidos aleatoriamente.

Media de la distribucin muestral del estadstico r


r=2n1n2 +1
n1+n2

Estadstica Administrativa II
38
r = 2(29)(31) +1
29+31
r = 1798 +1
60
r = 29.97 +1
r = 30.97

Error estndar del estadstico r


r= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)

r= 2(29)(31) ( 2(29)(31) - 29- 31)


(29+31)2(29+31-1)
r= (1798) (1738)
(60)2(59)
r= 14.71
r= 3.84

Ejercicios
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadstica para administradores. Editorial: PrenticeHall.

Nmero

Pgina

14-24
14-25
14-26
14-27
14-28

643
643
643
644
644

Estadstica Administrativa II
39

4.4 Una muestra: prueba de signos


Una de las pruebas no paramtricas ms fciles es la de prueba de signos. Su
nombre se debe a que est basada en la direccin (o signo de ms o menos)
de un par de observaciones y no en su magnitud numrica.
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evala la efectividad
de dos tipos de clases. Conferencias grandes de profesores de tiempo
completo sesiones pequeas con ayudantes de posgrado.

Miembro del panel

Evaluacin de los
dos tipos de
clases

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Calificacin
para
conferencias
grandes
2
1
4
4
3
3
4
2
4
1
3
3
4
4
4
1
1
2
2
4

Calificacin
para
sesiones
pequeas.
3
2
2
3
4
2
2
1
3
1
2
3
4
4
3
2
3
2
3
3

Signo de la
calificacin

+
+
+
+
+
+
0
+
0
0
0
+
0
+

La calificacin 4 es excelente y la 1 es mala. El signo + significa que el


estudiante prefiere las conferencias grandes, un signo menos indica una
preferencia por sesiones pequeas un 0 representa un empate (sin preferencia)
Nmero de signos +
Nmero de signos Nmero de ceros
Tamao total de la muestra

9
6
5
20

Estadstica Administrativa II
40

Establecimiento de las hiptesis


Ho: p = 0.5
H1: p 0.5
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho: = 0.5
q H0: = 0.5
n= 15
p= 0.600

(9/15)

q= 0.400

(6/15)

Prueba de hiptesis de que no hay diferencia.


Regin de aceptacin
Valor crtico
Z=-1.96

Valor crtico
Z=1.96

0.025

0.025
0.475 del rea

0.475 del rea

Error estndar del la proporcin


p=

p=

pq
n

(0.5)(0.5)
15

p= 0.129

Estadstica Administrativa II
41

4.5 Una muestra: prueba de Wilcoxon


Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza ms
informacin que la prueba de signos, tiende a proporcionar conclusiones que
reflejan mejor la verdadera naturaleza de los datos.
La prueba de rangos con signo de Wilcoxon es una prueba no paramtrica que
utiliza rangos ordenaos de datos maestrales consistentes en datos apareados.
Se usa para probar las diferencias en las distribuciones poblacionales, por lo
que la hiptesis nula y alternativa son las siguientes:
Ho: las dos muestras provienen de poblaciones con la misma distribucin.
H1: las dos muestras provienen de poblaciones con la misma distribucin.

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1. Para cada par de datos, calcule la diferencia d restando, el segundo


valor del primero. Guarde los signos, pero descarte cualquier par para el que
d=0
Paso 2. Ignore los signos de las diferencias, luego acomode las diferencias de
la ms baja a la ms alta y remplace las diferencias por el valor del rango
correspondiente. Cuando las diferencias tengan el mismo valor numrico,
asgneles la media de los rangos implicados en el empate.
Paso 3. Adjunte a cada rango el si el signo de la diferencia de la que provino.
Esto es, inserte aquellos signos que se ignoraron e el paso dos.
Paso 4. Calcule la suma de los valores absolutos de los rangos negativos.
Tambin la suma de los rangos positivos.
Paso 5. Permita que T sea la ms pequea de las dos sumas que se calcularon
en el paso 4. Es posible utilizar cualquier suma, aunque para simplificar el
procedimiento seleccionamos arbitrariamente

la ms pequea de las dos

sumas.
Paso 6. Permita que n sea el nmero de pares de datos para los que la
diferencia d no es 0.

Estadstica Administrativa II
42

Paso 7. Determine el estadstico de prueba y los valores crticos con base en el


tamao muestral.
Paso 8. Cundo Plantee la conclusin rechace la hiptesis nula si los datos
muestrales le llevan a un estadstico de prueba que est en la regin crtica,
esto es, cuando el estadstico de prueba es menor que o igual al valor crtico.

1.
2.

Supuestos
Los datos consisten en datos apareados que se seleccionaron aleatoriamente.
La poblacin de las diferencias (calculadas de los pares de datos) tiene una
distribucin que es aproximadamente simtrica, lo que quiere decir que la mitad
izquierda de su histograma es aproximadamente una imagen de espejo de la mitad
derecha.
Notacin
T= la ms pequea de las siguientes dos sumas:
1. La suma de los valores absolutos de los rangos negativos de las diferencias d que
no sean 0.
La suma de los rangos positivos de las diferencias d que no sean 0.
Estadstico de prueba
Si n < o igual a 30, el estadstico de prueba es T.

Estadstica Administrativa II
43

4.6 Dos muestras: prueba de Mann-Whitney


A esta prueba se le llama suma de rangos porque depende de los rangos o
clasificaciones de las observaciones de muestra.
La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones.
El uso de esta prueba permite determinar si las muestras independientes se
obtuvieron de la misma poblacin.

Simbologa
n1= nmero de elementos de la muestra 1
n2= nmero de elementos de la muestra 2
R1= suma de los rangos de los elementos de la muestra 1
R2= suma de los rangos de los elementos de la muestra 2
Rango
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

Calificacin
500
550
600
650
725
750
775
800
830
850
890
900
920
925
950
1000
1050
1100
1120
1140
1150
1200
1240
1250
1300
1360
1400
1500
1550

Plantel
S
S
A
S
S
A
A
A
S
A
S
S
S
S
A
A
A
A
S
S
A
A
S
A
A
S
A
A
S

Estadstica Administrativa II
44
30

1600

Estadstica Administrativa II
45

Nota: no necesariamente el nmero de muestras debe ser igual.


Ejemplo
La junta directiva de una gran universidad desea probar la hiptesis de que las
calificaciones promedio de una prueba de dos planteles de la universidad son
iguales.
Se deben clasificar las calificaciones en orden ascendente, indicando junto a
cada una el smbolo del plantel.
Plantel
A
B

1000
920

1100
1120

800
830

750
1360

1300
650

950
725

1050
890

1250
1600

1400
900

850
1140

1150
1550

n1= 15
n2= 15
R1= 247
R2= 218
Estadstico U
U=
n1n2 + n1(n1 +1) -R1
2

U=

(15)(15) + (15)(16) -247


2
U=
225+120-247
U=

98

Media de la distribucin muestral U


u =

u =

(15)(15)
2

u =112.5

n1n2
2

1200
550

1500
1240

600
925

775
500

Estadstica Administrativa II
46
Estadstico U
U =

U =

n1n2 + (n1n2 +1)


12

(15)(15)(15+15+1)
12
U = 6975
12
U = 581.25
U = 24.1

Prueba de hiptesis
La distribucin muestral del estadstico U puede aproximarse por la distribucin
normal cuando tanto n1 como n2 son mayores que 10, por lo tanto se usar la
tabla de la distribucin normal estndar para hacer la prueba.
La junta de directores desea probar al nivel de significancia de .15 la hiptesis
de que estas muestras fueron extradas de poblaciones idnticas.
H0: 1= 2
H1: 1 2
= 0.15
Estandarizacin del estadstico U
z=

z=

U-u
U

98 - 112.5
24.1

z=

-0.602

Regin de aceptacin
Valor
estandarizado de
la muestra U

-1.44

-0.602

1.44

Estadstica Administrativa II
47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no paramtrica para


comparar la mediana de dos muestras relacionadas y determinar si existen
diferencias entre ellas. Se utiliza como alternativa a la prueba t de Student
cuando no se puede suponer la normalidad de dichas muestras.
Debe su nombre a Frank Wilcoxon, que la public en 1945. Asimismo se utiliza
cuando la variable subyacente es continua pero presupone ningn tipo de
distribucin particular.
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos,
y sea X1, X2 .. Xn los valores observados. Se calcula las diferencias X1-M0,
X2-M0, ..., Xn-M0. Si la hiptesis nula fuera cierta estas diferencias se
distribuiran de forma simtrica en torno a cero.
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y
se ordenan de menor a mayor, asignndoles su rango (nmero de orden). Si
hubiera dos o ms diferencias con igual valor (empates), se les asigna el rango
medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna
el valor 2.5 a ambas). Ahora calculamos R+ la suma de todos los rangos de las
diferencias positivas, aquellas en las que Xi es mayor que M0 y R- la suma de
todos los rangos correspondientes a las diferencias negativas. Si la hiptesis
nula es cierta ambos estadsticos debern ser parecidos, mientras que si
nuestros datos tienen a ser ms altos que la mediana M0, se reflejar en un
valor mayor de R+, y al contrario si son ms bajos. Se trata de contrastar si la
menor de las sumas de rangos es excesivamente pequea para ser atribuida al
azar, o, lo que es equivalente, si la mayor de las dos sumas de rangos es
excesivamente grande.
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de
parejas de valores, por ejemplo antes y despus del tratamiento, que podemos
denominar (X1,Y1), (X2,Y2), ... ,(Xn,Yn). De la misma forma, ahora
calcularemos las diferencias X1-Y1, X2-Y2, ... , Xn-Yn y las ordenaremos en
valor absoluto, asignndoles el rango correspondiente. Calculamos R+ la suma
de rangos positivos (cuando Xi es mayor que Yi), y la suma de rangos
negativos R-. Ahora la hiptesis nula es que esas diferencias proceden de una
distribucin simtrica en torno a cero y si fuera cierta los valores de R+ y Rsern parecidos.

Estadstica Administrativa II
48

4.9 Varias muestras independientes: prueba de Krauskal-Wallis


La prueba de Krauskal-Wallis es una extensin de la prueba Mann-Whitney
para casos en que estn involucradas ms de dos poblaciones. Esta prueba
tambin depende de los rangos de las observaciones de la muestra.

Ejemplo
Rango calificaciones
Calificaciones
del examen
escrito

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

50
55
57
65
68
70
74
77
78
80
81
82
83
84
88
89
91
92
93
94

Estadstico K
K=
12
n(n+1)
K= 12
20(20+1)

Mtodo de
capacitacin
S
VC
AC
AC
S
VC
VC
S
AC
AC
S
VC
S
S
VC
AC
S
S
VC
S

nR

2
j

-3 (n+1)

+ (42) + (107) -3(20+1)


[ (61)
]
6
5
9
2

K = 1.143

Estadstica Administrativa II
49

Prueba de hiptesis
La distribucin muestral del estadstico K puede aproximarse por una
distribucin ji-cuadrada cuando los tamaos de todas las muestras son al
menos 5.
Grados de libertad k-1

(3-1)= 2

H0: 1= 2= 3
H1: 1, 2, 3 no todas son iguales
= 0.10
Regin de aceptacin

0.10 de rea

4.605
Valor de la muestra
K= 1.143

Ejercicios

Realizar los siguientes ejercicios del libro:


1) Levin I. Richard. Estadstica para administradores. Editorial: Prentice-Hall.

Nmero

Pgina

14-14
14-55
14-16
14-17
14-18

637
637
637
637
637

Estadstica Administrativa II
50

Prctica 3
Recopilar datos econmicos, de diversas fuentes, para efectuar
comparacin y anlisis entre la estadstica y la estadstico no
paramtrica, efectuando adems una prueba de hiptesis.

BIBLIOGRAFIA

Levin, Richard I. y Rubin, David S. (2004). Estadstica para administracin y


economa (7a.ed.). Mxico: 2004

Levin, Richard I. y Rubin, David S. (2004). Ji-cuadrada y anlisis de varianza.


En estadstica para administracin y economa (pp. 447-508). Mxico: Pearson
educacin.

Triola, Mario F. (2004). Estadstica. Mxico: Pearson educacin

Mongomery, Douglas C. (2007). Probabilidad y estadstica aplicadas a la


ingeniera. Mxico: Limusa Wiley.

Referencias de internet.
http:// math.uprm edu ~edgar uprm/edu/
http://es.wikipedia.org/wiki/Nivel_de_medida#Escalas_de_medici.C3.B3n
http://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9trica
http://www.estadisticafacil.com/

StAta

Você também pode gostar