Escolar Documentos
Profissional Documentos
Cultura Documentos
Ciclo: IV
2017
Dedicatoria
Covarianza:
La covarianza es un valor que indica el grado de variacin conjunta de dos variables
aleatorias respecto a sus medias. Es el dato bsico para determinar si existe una
dependencia entre ambas variables y adems es el dato necesario para estimar
otros parmetros bsicos, como el coeficiente de correlacin lineal o la recta.
Coeficiente de correlacin:
El coeficiente de correlacin de Pearson es una medida de la relacin lineal entre
dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlacin
de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlacin de Pearson
como un ndice que puede utilizarse para medir el grado de relacin de dos variables
siempre y cuando ambas sean cuantitativas.
T de Student:
la prueba t de
Student, prueba t-Student, o Test-T es cualquier prueba en la que
el estadstico utilizado tiene una distribucin t de Student si la hiptesis nula es
cierta. Se aplica cuando la poblacin estudiada sigue una distribucin normal pero
el tamao muestral es demasiado pequeo como para que el estadstico en el que
est basada la inferencia est normalmente distribuido, utilizndose una estimacin
de la desviacin tpica en lugar del valor real. Es utilizado en anlisis discriminante.
Objetivos
Objetivos generales:
Objetivos especficos
X: nmero de pasajeros
Y: peso total en libras del equipaje almacenado en el comportamiento
n= 25
r: 0.94
1 paso: Formulacin de hiptesis
= 0.05
p= 2.069
Zona de aceptacin
de Ho
Zona de rechazo de
Zona de rechazo de
Ho
Ho
4paso: Calculo de t0
2
=
1 2
t0=13.21
Se rechaza con un nivel de significancia de 0.05, se puede concluir que si hay una
asociacin positiva entre ambas variables.
X: Tamao familiar
Y: Cantidad gastada en diversin
n: 20
r: 0.40
1 paso: Formulacin de hiptesis
H0: =0 (No existe una relacin positiva)
H1: 0 (Existe una relacin positiva)
2paso: Como n<30 utilizamos t student para establecer los puntos crticos.
= 0.01
t=1.860
Zona de aceptacin
de H0
Zona de rechazo
Zona de rechazo
de H0
de H0
4paso: Calculo de t0
2
=
1 2
t0= 1.85
2paso: Como n<30 utilizamos t student para establecer los puntos crticos.
t (n-k) student = t10
= 0.01
t= 3.169
Zona de aceptacin
de H0
Zona de rechazo
de H0
4paso: Calculo de t0
t0= 0.47*(10)1/2/((1-(0.47)2)1/2
t0= 1.6838
Diagrama de Dispersin
1550
1500
1450
1400
1350
1300
0 10 20 30 40 50 60 70
Nos damos cuenta que hay una asociacin dbil entre las variables.
2paso: Como n<30 utilizamos t student para establecer los puntos crticos.
t (n-k) student = t23
= 0.10
t= 1.714
Zona de aceptacin
de H0
Zona de rechazo
de H0
Zona de rechazo
de H0
4paso: Calculo de t0
t0= 0.422978909*(23)1/2/((1-(2.23865176)2)1/2
t0=2.23865176
18
14
12
10
2
0
0 10 20 30 40 50 60
Porcentaje de General Motors
( )( ) 335.29
= = = .
( 1) (12 1)(8.18494553)(4.21752297)
Valor r indica una relacin inversa muy fuerte entre las variables debido a su
cercana al 1.
n k=
12 10= 2
= 1%
-2.764
2 0.882987724 12 2
= = = 5.948606424
1 2 10.8829877242
Para poder concluir si existe una asociacin negativa entre las dos variables
poblaciones se realizara la Prueba de hiptesis del coeficiente de correlacin
(o de la linealidad del modelo)
1.64
2 0.363 32 2
= = = 2.133779844
1 2 1 (0.363)2
)(
( ) .
= = = .
( ) . .
= (. ) = .
n k=
10 2= 8
= 5%
1.860
2 0.589 10 2
= = = 2.06147
1 2 10.5892
Diagrama de dispersin
12
10
4
y = -0.6368x + 9.9393
2 R = 0.6838
0
0 2 4 6 8 10 12 14
(
)( )
= = = . 9
( )( ) . .
2 0.826910 2
= = = 1.804
1 2 1 (0.8269)2
-2.355 0 +2.355
= 15 5X
Fuente gl SS MS
Regresin 1 300 300
Error 20 2 100 16.666667
Total 20 1 400
300
2 = = = 0.75
400
c) Determine el coeficiente de correlacin. (Precaucin: cuidado con el signo!)
= = 0.75 = 0.866
47. Una tabla ANOVA comprende:
FUENTE DF SS MS F
Regresin 1 50 SSR/1 SSR/(SSE/n-
2)
Error n-2 SSE SSE/n-2
Total 24 SS total* 500
=
= => =
10350
. = = = 21.213
2 23
d) Establezca el coeficiente de determinacin.
50
2 = = = 0.004807
10400
48. Emily Smith decide comprar un auto que consuma poco combustible.
Considera varios vehculos, con base en el costo estimado de compra y la
edad del vehculo.
a) Trace estos datos en un diagrama de dispersin, con el costo de
estimado como variable dependiente.
Diagrama de dispersin
25,000.00
20,000.00
15,000.00
10,000.00
5,000.00
y = -1533.6x + 18358
R = 0.6763
0.00
0 2 4 6 8 10 12
Formulacin de la hiptesis
0 : 1 0
1 : 1 < 0
Tamao de la muestra
: = 8
: = 10%
Regla de decisin
Rechazar H0 si y solo si: -1.943 < t < 1.943
t= 1.943
-1.943 0 +1.943
1,534 0
= = = 5.008
306.25
Conclusin y recomendacin.
Se rechaza H0 y se acepta la H1 , llegando a la conclusin que el coeficiente
de correlacin de la muestra -0.822 es demasiado grande como para
provenir de una poblacin sin correlacin. Existiendo una relacin negativa
o inversa entre ambas variables, y la relacin entre ambas variables es
fuerte.
49. La National Highway Association estudia la relacin entre el nmero de
licitadores en un proyecto para una carretera y la licitacin ms alta (menor
costo) del proyecto. De inters particular resulta saber si el nmero de
licitadores aumenta o disminuye la cantidad de la oferta ganadora.
R^2 = 0.50302688
50. El seor William Profit estudia compaas que se hacen pblicas por primera
vez. Le interesa en particular la relacin entre el tamao de la oferta y el
precio por accin. Una muestra de 15 compaas que recin se hicieron
pblicas revel la siguiente informacin.
a) Determine la ecuacin de regresin.
Diagrama de dispersin
11.4
11.2
11
10.8
10.6
y = 0.0031x + 10.66
R = 0.2106
10.4
10.2
0 20 40 60 80 100 120 140 160 180 200
Y = 0.0031x + 10.66
R^2 = 0.21721278
El seor no est satisfecho con que el tamao de la oferta sea una variable independiente.
51. Bardi Trucking Co., ubicada en Cleveland, Ohio, hace entregas en la regin de
los Grandes Lagos, en el lado sur y en el lado norte. Jim Bardi, el presidente,
estudia la relacin entre la distancia de recorrido de un embarque y el
tiempo, en das, que dura en llegar a su destino. Para investigar esta cuestin, el
seor Bardi seleccion una muestra aleatoria de 20 embarques del mes
pasado. La distancia de envo es la variable independiente y el tiempo de
envo es la variable dependiente. Los
resultados son los siguientes:
a) Trace un diagrama de dispersin. Con base en estos datos, parece haber una
relacin entre la cantidad de millas que debe recorrer el embarque y el tiempo que
tarda en llegar a su destino?
R^2 = 0.47900854
a = 2.41
b = 26.8
Ecuacin de regresin:
5057.6
r2 = = 0.6858
7682.7
r = 0.658 = 0.811
0.811 30 2
t= = 7.34
1 (0.811)^2
Y como t se rechaza cuando t >1.701. La correlacin de la poblacin es positiva.
n = 20
= 670 = 25.89
0.67920 2 2.880
= = = 3.92
1 (0.679)^2 0.734
n=35
0.63530 2
t= = 4.35
1 (0.635)^2
Diagrama de dispersin
y = 0.1489x - 22.581
350 R = 0.8823
300
250
200
150
100
50
0
0 500 1000 1500 2000 2500
2.101
rn2 0.93928707202
t0= = = 11.6137623
1r2 10.88226019
Rechazar H0 y aceptar H1, por lo tanto, existe linealidad entre los vatios y el rea.
Se recomienda hacer la prueba de hiptesis de la confiabilidad del modelo para
hacer pronsticos.
b= r * sy/sx
a= y- bx
y = 0.1489x - 22.581
R = 0.8823
ANLISIS DE VARIANZA
Grados de libertad
Regresin 1
Residuos 18
Total 19
Coeficiente de correlacin
mltiple 0.98720335
HALLAMOS CON NIVEL DE SIGNIFICACION AL 5%
H 0 : 1 0
H 1 : 1 0
1.746
rn2 0.98720335182
t0=1r2 = = 24.564
10.974570462
Rechazar H0 y aceptar H1, por lo tanto, existe linealidad entre el peso y las
raciones.
Se recomienda hacer la prueba de hiptesis de la confiabilidad del modelo para
hacer pronsticos.
b) Elabore la ecuacin de regresin de las tazas con base en el peso del can.
Cunto cambia el peso estimado del perro cada taza adicional del
alimento?
Empezamos hallando la pendiente de la ecuacin:
b= r * sy/sx
a= y- bx
a= 92.611111122.933 (5.33333333)
a= -29.7
y = 22.933x - 29.7
a=12.3601 y= 12.3601+4.7956 x
b=4.7956
n = 30
T/2 = 2.763
Primer paso:
Esta prueba es de una sola cola porque lo que nos interesa es confirmar si la asociacin es
positiva entre las variables.
Segundo paso:
Hallamos los grados de libertad n-2, entonces tendramos: 30-2=28, adems de saber que
el nivel de significancia es 0.05. La regla de decisin nos dice que debemos rechazar la
hiptesis nula si el valor calculado del estadstico de prueba es mayor a 1.812.
r(n 2) 0.103830 2
t= = = 0.329
1 r 2 1 0.10382
Respuesta:
y = 0.0489x + 787.77
2500 R = 0.0005
2000
1500
1000
500
0
0 200 400 600 800 1000 1200
Estadsticas de la regresin
Coeficiente de 0.023112044
correlacin mltiple
Coeficiente de 0.000534167
determinacin R^2
R^2 ajustado -0.020288038
Error tpico 369.8022244
Observaciones 50
Respuesta: