Escolar Documentos
Profissional Documentos
Cultura Documentos
Curso
: ESTADSTICA
DECISIONES
PARA
LA
TOMA
Integrante
Ciclo
: IV
Aula
: 304
Turno
DE
: MAANA
DEDICATORIA:
Dedicado a mis padres
que siempre me orientan
a tomar decisiones acertadas
INTRODUCCIN
MARCO TERICO
ANLISIS DE CORRELACIN.- Grupo de tcnicas para medir la
asociacin entre dos variables. La idea bsica del anlisis de correlacin
es reportar la asociacin entre dos variables. El primer paso habitual es
trazar los datos en un diagrama de dispersin.
COEFICIENTE DE CORRELACIN.- Medida de la fuerza de la relacin
lineal entre dos variables. Su signo indica la direccin de la relacin
entre dos variables, directa o inversa.
ECUACIN
DE
ESTIMACIN.-
Frmula
matemtica
que
MTODO
DE
MNIMOS
ORDENADA Y.- Constante para cualquier lnea recta dada cuyo valor
representa el valor de la variable Y cuando el valor de la variable X es 0.
Se expresa por la letra a:
PENDIENTE.cualquier
lnea
Constante
para
DE
lnea ajustada a
REGRESIN.-
Una
un conjunto de datos
RELACIN
DIRECTA.Relacin
entre
dos
variables
en
al
aumentar el
valor de
la
donde,
variable
RESOLUCIN DE EJERCICIOS
12-16 Las ventas de lnea blanca varan segn el estado del mercado de casas
nuevas: cuando las ventas de casas nuevas son buenas, tambin lo son las de
lavaplatos, lavadoras de ropa, secadoras y refrigeradores. Una asociacin de
comercio compil los siguientes datos histricos (en miles de unidades) de las
ventas de lnea blanca y la construccin de casas.
a) Desarrolle una ecuacin para la relacin entre las ventas de lnea blanca
(en miles) y la construccin de casas (en miles).
-
Diagrama de dispersin
a=
y . x 2 x . x . y =
2
n x 2 ( x )
(75.5147.18)(37.2289.2)
=
(1037.2)37.22
1.168145
x 2
n
n . x . y x . y
b=
^y =a+bx
^y =1.168145+1.715553 X
1.715553
Y 2a Y b XY
nk
Nos piden:
Y^ t c S yx ; Y^ t c S yx >
1 PASO: Hallar ^y para X = 8000
^y =1.168145+1.715553(8000) = 13725.59215
2 PASO: n = 10 , =0.1 , utilizamos la t ( nk ) g. l .=t ( 8) g .l .
Y 2a Y b XY
nk
= 0.3737
4 PASO:
13725.592151.86(0.3737); 2.7215591.86 (0.3737)>
13724.89707; 13726.28723>
Estamos 90% seguros que las ventas de lneas blancas estarn entre 13 724
897 y 13 726 287 unidades, cuando la construccin de nuevas casas sea de 8
millones.
12-17 Durante partidos recientes de tenis, Diane ha observado que sus
lanzamientos no han sido eficaces, pues sus oponentes le han regresado
algunos de ellos. Algunas de las personas con las que juega son bastante
altas, as que se pregunta si la estatura de su contrincante podra explicar el
nmero de lanzamientos no regresados durante un partido. Los siguientes
datos se sacaron de cinco partidos recientes.
a=
y . x 2 x . x . y =
2
n x 2 ( x )
(25158.5)(28131)
=
(5158.5)282
34.647059
x 2
n
n . x . y x . y
b=
-5.294118
^y =a+bx
^y =34.6470595.294118 X
25 30 35 40 45 50 55 60
800 80 780 660 640 600 620 620
Y X 2 X XY 550015500340227200
a=
=
=952.619048
2
8155003402
n x2 ( x )
n XY X Y 82272003405500
b=
=
=6.238095
2
2
2
815500340
n x ( x )
Y^ =952.6190486.238095 x
c) Pronostique el nmero de pasajeros/100millas si el precio del boleto fuera de 50
centavos. Utilice un intervalo de prediccin del 95% de aproximacin.
Y^ t i S xy , Y^ + t i S xy >
#1 Paso
Y^ =952.6190486.23809550=640.7143
Y^ =641
#2 Paso
n = 8,
=5
#3 Paso
S yx =
y 2a yb xy =
nk
3830800952.6190485500(6.238095)227200
=38.05802
6
Y^ t i S xy , Y^ + t i S xy >
6412.47738 , 641+ 2.47738> < 547,735>
5
58
10
41
10
45
15
27
15
26
20
12
20
16
25
3
Y X 2 X XY 22821001202580
a=
=
=70.5
2
821001202
n x2 ( x )
n XY X Y 82580120228
b=
=
=2.8
2
2
82100120
n x 2( x )
a) Graficar
b) Ecuacin de proyeccin
Y^ =70.52.8 x
c) Interrumpido 18 veces
^ =70.52.8 ( 18 )=20.1
Y
La calificacin esperada de la prueba si el trabajador es
interrumpido 18 veces es de
20.1
12-20 El editor en jefe de un importante peridico metropolitano ha
intentado convencer al dueo para que mejore las condiciones de trabajo en
la imprenta. Est convencido de que, cuando trabajan las prensas, el grado
de ruido crea niveles no saludables de tensin t ansiedad. Recientemente
hizo que un siclogo realizara una prueba durante la cual situaron a los
prensistas en cuadros con niveles variables de ruido y luego les hicieron otra
prueba para medir niveles de humor y ansiedad.
a) Grafique estos datos
DIAGRAMA DE DISPERSIN
50
f(x) = 4.57x + 16.52
R = 0.72
40
DIAGRAMA DE
DISPERSIN
30
Linear (DIAGRAMA DE
DISPERSIN)
20
10
0
0
y . x 2 x . x . y (260128)(281047)
a=
=
=
2
(8128)282
n x 2 ( x )
16.516667
2
x
n
n . x . y x . y
b=
4.566667
^y =a+bx
^y =16.516667+ 4.566667 x
c) Pronostique el grado de ansiedad que podramos esperar
cuando el nivel de ruido sea 5.
^y =16.516667+ 4.566667(5)
^y =39.350002
Interpretacin= El grado de ansiedad que podramos esperar cuando el
nivel de ruido es 5 es de 39.350002.
12-21 Una compaa administra a sus vendedores en capacitacin una
prueba de ventas antes de salir a trabajar. La administracin de la compaa
est interesada en determinar la relacin entre las calificaciones de la
prueba y las ventas logradas por esos vendedores al final de un ao de
trabajo. Se recolectaron los siguientes datos de 10 agentes de ventas que
han estado en el campo un ao.
y . x 2 x . x . y (260128)(281047)
a=
=
=
2
(8128)282
n x 2 ( x )
16.516667
2
x
n
n . x . y x . y
b=
4.566667
^y =a+bx
^y =16.516667+ 4.566667 x
b) En cunto se incrementa el nmero esperado de unidades
vendidas por cada incremento de 1 punto en una calificacin
de la prueba?
Por cada punto adiciona, el nmero de unidades vendidas aumentar en
41.680912
c) Utilice la recta de regresin de mnimos cuadrados para
predecir el nmero de unidades que vendera un capacitado
que obtuvo una calificacin promedio en la prueba.
Nmero de unidades que vendera un capacitado que obtuvo una
calificacin promedio en la prueba.
Calif.
promedio
=3.4
10
^y =16.516667+ 4.566667(3.4)
^y =137.100001
Interpretacin: El nmero de unidades que vendera un capacitado que
obtuvo una calificacin promedio en la prueba es de 137.100001
a=
y . x 2 x . x . y =
2
n x 2 ( x )
(483550)(1461101)
=
(73550)1462
2.731749
x 2
n
n . x . y x . y
b=
0.197793
^y =a+bx
^y =2.73174 +0.197793 X
Y 2a Y b XY
nk
Cantida
d
vendida
(Q) Y
125
156
183
190
212
238
Precio (P)
X
20
17.5
16
14
12.05
10
X.Y
2500
2730
2928
2660
2554.6
2380
X2
400
306.25
256
196
145.2025
100
Y2
15625
24336
33489
36100
44944
56644
250
276
8
6.5
2000
1794
Y =
X =
X . Y =
1630
x
y
104.05
x
= 8 =
104.05
8
1630
8
y
= 8 =
19546.6
64
42.25
62500
76176
X =
150
Y =
3
9.7025
49814
= 13.00625
= 203.75
DIAGRAMA DE DISPERSIN
300
250
DIAGRAMA DE
DISPERSIN
200
150
100
50
0
4
10 12 14 16 18 20 22
y . x 2 x . x . y =
a=
n x 2 x2
341.262886
104.05
(81509.70)( 2)=
(16301509.70)(104.0519546.6)
104.05
x 2
n
n . x . y x . y
b=
-10.572831
Ecuacin de regresin:
^y =341.2610.57 x
c. Trace la recta de regresin ajustada en la grfica:
DIAGRAMA DE DISPERSIN
300
f(x) = - 10.57x + 341.26
R = 0.99
250
200
DIAGRAMA DE
DISPERSIN
150
Linear (DIAGRAMA
DE DISPERSIN )
100
50
0
4
8 10 12 14 16 18 20 22
35.9
10.2
31.8
16.5
24.7
21.7
25.2
9.4
36.8
8.3
35.8
11.5
33.4
x=
8
Y =
223.6
(y-y*) 2
X.Y
X
= 7 =
x
= 7 =
Y*
301.56
70.56
1288.81
35.543515
324.36
104.04
1011.24
33.875563
407.55
272.25
610.09
28.037731
546.84
470.89
635.04
23.219203
345.92
88.36
1354.24
34.616875
297.14
68.89
1281.64
35.636179
132.25
1115.56
32.670931
384.1
x . y=
260
7.47
x =
1207
86
7 = 12.285714
223.6
= 31.942857
7
.24
y =
729
6.62
22
3.599997
0.1270815
6
4.3079617
7
11.140448
2
3.9235567
6
4.7660347
7
0.0268373
2
0.5315416
1
24.82
3462
b=
x . yn . x . y
x 2n . x2
12.285714
1207.247 ( 2)=
2607.47(7)(12.285714)(31.942857)
-0.926640
a= y b x =
Ecuacin de regresin:
^y =43.3272910.926640 x
DIAGRAMA DE DISPERSIN
40
35
30
25
DIAGRAMA DE
DISPERSIN
Linear (DIAGRAMA DE
DISPERSIN)
20
15
10
5
0
6
10 12 14 16 18 20 22 24
y=43.3272910.926640(20)
Y = 24.79
24.79 es el porcentaje de contaminantes eliminados si se gastan 20,000 en
medidas de control.
c. Calcule el error estndar de estimacin:
S yx =
(Y Y )2
nk
24.82
S yx=
72
S yx =2.228
B. Compaa 2:
Dinero
gastado Porcentaje de
(miles de contaminados
dlares)
Y
X
(y-y*) 2
X.Y
Y2
X2
Y*
25.4
31.4
27.4
15.8
31.5
28.9
467.36
524.38
528.82
448.72
148.05
355.47
645.16
985.96
750.76
249.64
992.25
835.21
338.56
278.89
372.49
806.56
22.09
151.29
y=
160.
x . y=
24
y 2=
4458
x 2=
1969.
18.4
16.7
19.3
28.4
4.7
12.3
x=
99.8
72.8
.98
88
24.9394282
26.5696041
24.0763939
15.3501582
38.0767281
30.7888829
159
.801195
0.21212638
23.3327246
11.0463575
0.20235765
43.2533525
3.56787861
x
= 6 =
y
= 6 =
99.8
6
160.4
6
x . yn . x . y =
b=
x 2n . x2
a= y b x =
= 16.633333
= 26.7333333
16.633333
1969.886( 2)=
2472.5( 6)(16.633333)(27.733333)
-0.952927
Ecuacin de regresin:
^y =42.5836850.958927 x
DIAGRAMA DE DISPERSIN
35
30
DIAGRAMA DE
DISPERSIN
25
20
Linear (DIAGRAMA DE
DISPERSIN )
15
10
5
0
0
10
15
20
25
30
y=42.5836850.958927 (20)
Y= 23.41
81.61
47972
(Y Y )2
nk
81.61
S yx=
62
S yx =4.52
12-34 Neds Beds est considerando contratar a una compaa de publicidad para
estimular el negocio. Fred, el hermano de Ned, investigo el campo de la
publicidad de camas y recolecto los siguientes datos de la cantidad de
ganancias (Y) Que logra una compaa de camas y la cantidad gastada en
publicidad (X).Si Fred calcula la ecuacin de regresin, la pendiente de la
recta indicara el incremento en la ganancia por dlar gastado en publicidad.
Ned har la publicidad solo si la gaancina de cada $1 invertido excede $ 1.50.
Calcule la pendiente de la ecuacin y pruebe si es mayor que 1.50. Para un
nivel de significancia de 0.05.
Y X 2 X XY = 306.951633.41128.73786.029 =4.646752
2
2
121633.41128.7
n x2 ( x )
n XY X Y 123786.029128.7306.95
b=
=
=1.951740
2
2
2
121633.41128.7
n x ( x )
a=
t ( nk ) g. l .=t (10 ) g .l .
Y 2a Y b XY
nk
8838.5924.646756306.951.9517403786.029
S yx =
=9.659993
10
S b=
S yx
X n X 2
2
9.659993
=0.607196
1633.4112(10.725)2
b 1.9517401.5
=
=0.743977
Sb
0.607196
5 PASO: Conclusiones y recomendaciones
Rechazar H 0 y aceptar H 1 , por lo tanto Ned no har la publicidad.
t 0=
0.0
Y^ =a+2.9 x
S b=0.18
n= 15
=3.2
b = 2.9
PRUEBA DE HIPOTESIS
1 PASO: FORMULACION DE HIPOTESIS
H0:
=3.2
H1:
3.2
2 PASO
n= 15 y se conoce = 5%, utilizamos t 13 g. l
0.025
3 PASO: REGLA DE DECISION
Rechazar H0 si y solo si t 0<2.160 t 0 >2.160
4 PASO: CLCULO DEL ESTADSTICO
b 2.93.2
=
Sb
0.18
t 0= 1.67
t 0=
5 PASO:CONCLUSIONES Y RECOMENDACIONES
Aprobamos H0 y rechazamos H1 por lo tanto la pendiente de la recta de regresin de
la poblacin sigue siendo 3.2 con un nivel de significacin de 0.05. Por ello decimos
que cada unidad adicional al incremento del precio del oro aumenta las peticiones de
los clientes 3.2 aprox.
^y =a+50 x
1paso: Formulacin de hiptesis
H0: = 1.50
H1: 1.50
2paso: n = 25,
=5
-tc= -2.069
3paso: Regla de decisin
t0
Rechazar H0
tc=2.069
-2.069 o t0 2.069
S b=
t0
S yx
( x x )
b
=
Sb
=0.11
1681818
5 Conclusiones y recomendaciones:
- Aceptar H0 y rechazar H1, por lo tanto compruebo la veracidad de B= 0.150 y no ha
cambiaodo al nivel de significacin 5%
y . x 2 x . x . y
a=
=
2
n x 2 ( x )
15.970818
2
x
n
n . x . y x . y
b=
55.957580
Recta de regresin:
^y =a+bx
^y =15.970818+55.957580 x
Error estndar de estimacin:
S yx=
B)
Y 2a Y b XY
nk
= 3.447674
^y =a+50 x
=1
-tc= -1.833
3paso: Regla de decisin
Rechazar H0
t0
tc=1.833
-1.833 o t0 1.833
S b=
t0
S yx
( x x )2
b
=
Sb
=4.424115
11.301605
5 Conclusiones y recomendaciones:
- Aceptar H1 y rechazar H0, por lo tanto existe una relacin negativa entre el rea y el valor.
-tc= -1.746
=1
tc=1.746
t0
Rechazar H0
-1.746o t0 1.746
S b=
t0
S yx
( x x )
b
=
Sb
=5.424115
13.4721
Por lo tanto :
72.81+394.4405 >
12-39 La compaa local de telfonos siempre ha supuesto que el nmero promedio de las
llamadas diarias aumenta en un1.5 por cada persona adicional en una casa. Se ha sugerido
que la gente es ms platicadora que lo que esto refleja. Se tom una muestra de 64
personas y se calcul que la pendiente de regresin de Y (numero promedio de las
llamadas diarias) sobre X (tamao de la casa) era 1.8 con un error estndar del coeficiente
de la pendiente de regresin de 0.2. Pruebe si se hacen significativamente ms llamadas
por persona adicional de lo que la compaa de telfonos supone: = 0.05. Establezca las
hiptesis y las conclusiones explicitas.
DATOS:
= 1.5
b =1.8
Sb
n= 64
=0.2
=5
; utilizamos la z/2
2.22
z/2 =1.96
8
z/22.22
=-1.96
t0
-1.96
t0
1.96
z0
b
=
Sb
1.81.5
0.2
= 1.5
5 CONCLUSIONES Y RECOMENDACIONES:
- Aceptar H0 y rechazar H1, por lo tanto existe una relacin entre las horas y las unidades
producidas.
12- 40. Los funcionarios universitarios responsables de la admisin
constantemente buscan variables con las cuales predecir los promedios de las
calificaciones de los aspirantes. Una variable de uso comn es el promedio de
calificaciones del bachillerato. Para la universidad, los datos anteriores
indicaban que la pendiente era 0.85. Un pequeo estudio reciente de 20
estudiantes encontr que la pendiente de la muestra era 0.70 y que el error
2
X 2n X
era igual que 0.25. al
Y^ =a+0.70 x
n = 20 b = 0.70
( X 2 )n X 2=0.25
S YX =0.60
= 0.85
5
PRUEBA DE HIPOTESIS
0.00
2 PASO
n= 20 y se conoce = 1%, utilizamos
t 18 g .l
0.005
3 PASO: REGLA DE DECISION
Rechazar H0 si y solo si t 0<2.878 t 0 >2.878
4 PASO: CLCULO DEL ESTADSTICO
b 0.700.85
=
Sb
1.2
t 0= 1.29
t 0=
S b=
SYX
( X )n X
2
0.60
=1.2
0.25
5 PASO:CONCLUSIONES Y RECOMENDACIONES
Aprobamos H0 y rechazamos H1 por lo tanto la pendiente de la recta de regresin de
la poblacin sigue siendo 0.85 con un nivel de significacin de 0.01. Por ello decimos
EJERCICIOS DE LA DIAPOSITIVAS
PRIMER EJERCICIO DE LA DIAPOSITIVA
1. Construir la Tabla Bidimensional, con la muestra de 20 familias donde estamos
interesados en conocer nmero de hijos y el ingreso familiar mensual en miles
de dlares siendo los datos los siguientes: (X: Hijos; Y:Ingreso familiar) (3;21),
(5;45), (4;50),(2;35), (1;20), (2;53), (1;32), (2;44), (2;22), (1;32), (3;54), (3;28),
(3;40), (2;34), (4;28), (1;33), (4;60), (2;25), (3;25), (3;53) Calcular frecuencia
absoluta, relativa, porcentual, conjunta y marginal., frecuencias condicionales,
existencia de independencia, COVARIANZA.
FRECUENCIA ABSOLUTA BIDIMENSIONAL
FRECUENCIA
MARGINAL
MARGINAL
FRECUENCIA MARGINAL
FRECUENCIA
CONJUNTA
FRECUENCIA
CONJUNTA
Media de x:
14 +26+36+43+51
x =
=2.55
20
Media de y:
245+327+401+483+564
y =
=37.6
20
Covarianza:
H IJ
%=
N IJ
N
* 100%
x =
I=1
xi .
=
n
5
y =
14 +26 +36+43+ 51
20
.j
=
yin
n
j=1
= 2.55
= 37.6
.
n . j
N
n ij
=
N
N
n 2.
n .3
N
n 23
=
N
N
0.30 * 0.05 0
Por lo tanto, no hay existencia de independencia
Y X 2 X XY =60.033531
2
n x2 ( x )
n XY X Y 123786.029128.7306.95
b=
=
=0.04071
2
2
2
121633.41128.7
n x ( x )
a=
DIAGRAMA DE DISPERSIN
50
40
DIAGRAMA DE
DISPERSIN
30
20
10
0
400
500
600
700
800
900
1000
Cuadro ANOVA
S yx =
(Y Y )2
nk
S yx =5.138
Coeficiente de determinacin ( r 2 :
r 2=
SCR
=0.66
SCT
Coeficiente de correlacin( r :
r=+ r 2
r=0.81
.
=5
t0
Rechazar H0
-2.306 o t0 2.306
S b=
t0
S yx
( xx )
b
=
Sb
=0.000001
40710
=5
t0
-2.306 o t0 2.306
Sr =
t0
1r 2
=0.206155
nk
r
=
Sr
3.93
Fc
5.32
SCR
k 1
F0 =
SCE
nk
= 15.52
Y: Unidades
X*Y
X2
Y2
80
300
24000
6400
90000
79
302
23858
6241
91204
83
315
26145
6889
99225
84
330
27720
7056
108900
78
300
23400
6084
90000
60
250
15000
3600
62500
82
300
24600
6724
90000
85
340
28900
7225
115600
79
315
24885
6241
99225
84
330
27720
7056
108900
80
310
24800
6400
96100
62
240
14880
3844
57600
936
3632
285908
73760
1109254
x
=
=
12
936
12
3632
12
y
= 12 =
= 302.666667
78
7376012( 2)=
285908(12)(78)(302.666667)
x . yn . x . y =
b=
x 2n . x2
a= y b x =
= 78
3.473404
Ecuacin de regresin:
^y =31.741155+ 3.473404 x
DIAGRAMA DE DISPERSION
400
350
300
250
DIAGRAMA DE
DISPERSION
Linear (DIAGRAMA DE
DISPERSION)
200
150
100
50
0
55
60
65
CUADRO ANOVA
Concepto
70
75
80
85
90
suma cuadrado
g.l.
cuadrado medio
SCR
9072.457397
9072.457397
SCE
896.206848
10
73.8356737
SCT
9968.664245
11
98.70744282
S yx =
(Y Y )2
nk
896.206848
S yx =
10
S yx =9.466820
Coeficiente de determinacin ( r 2 :
r 2=
SCR
=0.91
SCT
r=+ r 2
r=+ 0.91
r=+ 0.95
Hay un alto grado de asociacin entre las las horas y unidades producidas
Prueba de hiptesis de la existencia de la regresin ( )
Nivel de significacin = 5%
1PASO: FORMULACIN DE HIPTESIS
H0: = 0
H1: 0
2PASO: n = 12,
=5
2.22
3PASO: REGLA DE DECISIN
Rechazar H0
t0
2.22
8
-2.228 o t0 2.228
S b=
t0
S yx
9.466824
( x x ) 7376012( 78 )
b
=
Sb
3.4734040
0.345219
= 0.345219
= 10.061451
5 CONCLUSIONES Y RECOMENDACIONES:
- Rechazar H0 y aceptar H1, por lo tanto no existe una relacin negativa entre las horas y las
unidades producidas.
=5
2PASO: n = 12,
2.22
3PASO: REGLA DE DECISIN
Rechazar H0
t0
2.22
8
2.228 o t0 2.228
Sr =
t0
1r 2
10.91
=
nk
10
r
=
Sr
0.910
0.094817
0.094817
= 10.019300
5 CONCLUSIONES Y RECOMENDACIONES:
- Rechazamos H0 y aceptamos H1, por lo tanto existe linealidad negativa entre las horas de
produccin y las unidades producidas.
- Recomendamos hacer la prueba de hiptesis de la confiabilidad del modelo para hacer el
pronstico.
Prueba de hiptesis de la confiabilidad del modelo ( )
Nivel de significacin = 5%
1PASO: FORMULACIN DE HIPTESIS
H0: el modelo no es confiable.
H1: el modelo es confiable .
2PASO: n = 12,
=5
; utilizamos la tabla F
(V 1 ,V 2 )
g.l.
F(1, 10)
4.96
3PASO: REGLA DE DECISIN
Rechazar H0
Fc
4.96
SCR
k 1
F0 =
SCE
nk
9072.457397/1
=101.231735
596.206848 /10
5 CONCLUSIONES Y RECOMENDACIONES:
- Rechazamos H0 y aceptamos H1, por lo tanto existe confiabilidad del modelo.
- Recomendamos utilizar el modelo dado para hacer los pronsticos.
CONCLUSIONES
r2
RECOMENDACIONES
BIBLIOGRAFA