Escolar Documentos
Profissional Documentos
Cultura Documentos
Grupo No. 12
INTRODUCCIN i
CAPITULO I 1
REGRESIN Y CORRELACIN 1
1.1 Regresin 1
1.1.1Tipos de Regresin 1
1.2 Ecuacin Lineal 2
1.3 Determinacin de la ecuacin matemtica 3
1.4 Mtodos de mnimos cuadrados 3
1.5 Inferencia en el anlisis de regresin 4
1.6 El error estndar de estimacin 4
1.7 Inferencia de acerca de la pendiente de una lnea de regresin 5
1.9 Anlisis de Correlacin 6
1.9.1 Tipos de Correlacin 7
1.9.2 Propiedades de la correlacin lineal 8
1.9.3 Coeficientes de correlacin 9
1.10 Datos Continuos: r de Pearson 9
1.10.1 Tipos de variables con las que se puede utilizar el coeficiente r de
Pearson 10
1.11 Carcter de r 10
1.12 Mtodo practicar para calcular r 11
1.13 Inferencia acerca del coeficiente de correlacin 11
1.13.1 Intervalo de confianza para la correlacin de la poblacin 11
1.14 Prueba de significacin de r 12
1.15 Datos jerarquizados de: r Spearman 12
1.16 Datos nominales: el coeficiente de contingencia 13
1.17 Ventajas: 14
1.18 Limitaciones 14
1.19 Diferencia entre Regresin y Correlacin 15
1
CAPITULO II
CASO PRCTICO 17
CONCLUSIONES 22
RECOMENDACIONES 23
WEBGRAFA 24
2
INTRODUCCIN
1
CAPITULO I
REGRESIN Y CORRELACIN
1.1 Regresin
1.1.1Tipos de Regresin
1
b. Regresin mltiple: Cuando la variable Y depende de varias variables (X1,
X2, ..., Xr)
c. Regresin lineal:
d.
e. La regresin lineal simple comprende el intento de desarrollar una lnea
recta o ecuacin matemtica lineal que describe la reaccin entre dos
variables.
f.
g. La regresin puede utilizadas de diversas formas. Se emplean en
situaciones en la que las dos variables miden aproximadamente lo mismo,
pero en las que una variable es relativamente costosa, o, por el contrario,
es poco interesante trabajar con ella, mientras que con la otra variable no
ocurre lo mismo.
h. La finalidad de una ecuacin de regresin seria estimar los valores de una
variable con base en los valores conocidos de la otra.
i.
j. Otra forma de emplear una ecuacin de regresin es para explicar los
valores de una variable en trmino de otra. Es decir se puede intuir una
relacin de causa y efecto entre dos variables. El anlisis de regresin
nicamente indica qu relacin matemtica podra haber, de existir una. Ni
con regresin ni con la correlacin se pude establecer si una variable tiene
causa ciertos valores de otra variable.
k.
l. 1.2 Ecuacin Lineal
m.
n. Dos caractersticas importantes de una ecuacin lineal:
o.
1) la independencia de la recta
2) la localizacin de la recta en algn punto. Una ecuacin lineal tiene la forma
p.
q. y = a + bx
r.
2
s. En la que a y b son valores que se determina a partir de los datos de la
muestra; a indica la altura de la recta en x= 0, y b seala su pendiente. La
variable y es la que se habr de predecir, y x es la variable predictora.
aw. y b x
ax. a=
ay. n
az.
ba.
4
bk. n-2
bl. en la cual:
bm. yi = cada valor de y
bn. yc = valor de lnea de regresin correspondiente a partir de la ecuacin de
regresin.
bo. n = nmeros de observaciones.
bp.
bq. La formula anterior no se utiliza por lo general para clculos reales, es
ms fcil trabajar con la formula simplificada
br.
bs. Se y2 a y b xy
bt. n2
bu.
5
cg.La regresin mltiple comprende tres o ms variables. Existe solo una
variable dependiente, pero hay dos o ms tipo independiente. Esta
operacin al desarrollo de una ecuacin que se puede utilizar para predecir
valore de y, respecto a valores dados de la diferencia variables
independientes adicionales es incrementar la capacidad predicativa sobre la
de la regresin lineal simple.
ch.
ci. Las tcnicas de los mnimos cuadrados se utilizan para obtener ecuaciones
de regresin.
cj. Yc= a +b1x1+b2x2+bkxk
ck.
6
diagramas ya sean de dispersin que muestran diferentes relaciones entre
variables independientes o de entrada (x) y variables independientes o de
salida (Y) se dice que no hay correlacin o relacin entre X y Y.
cx.
cy. Si a medida que crece x hay un cambio en los valores de y existe una
correlacin. La correlacin es positiva cuando Y tiende a crecer y es
negativa cuando Y tiende a decrecer.
cz.
da.Si los pares ordenados (x,y) tienden a seguir un patrn de lnea recta, se
tiene una correlacin lineal. La correlacin lineal perfecta ocurre cuando
todos los puntos estn exactamente sobre una recta. Esta correlacin
puede ser positiva o negativa dependiendo de si Y crece o decrece a
medida que x se incrementa. Si los datos forman una recta horizontal o
vertical no hay correlacin, ya que una variable no afecta a la otra.
db.
df.
b. Correlacin inversa
dg. La correlacin inversa se da cuando al aumentar una de las variables
la otra disminuye. La recta correspondiente a la nube de puntos de la
distribucin es una recta decreciente.
7
dh.
di.
c. Correlacin nula
dj. La correlacin nula se da cuando no hay dependencia de ningn tipo entre
las variables. En este caso se dice que las variables son incorreladas y la
nube de puntos tiene una forma redondeada.
dk.
dl.
1.9.2 Propiedades de la correlacin lineal
a. El coeficiente de correlacin no vara al hacerlo la escala de medicin.
dm. Es decir, si expresamos la altura en metros o en centmetros el
coeficiente de correlacin no vara.
b. El signo del coeficiente de correlacin es el mismo que el de la covarianza.
dn. Si la covarianza es positiva, la correlacin es directa. Si la covarianza
es negativa, la correlacin es inversa. Si la covarianza es nula, no existe
correlacin.
do.
8
c. El coeficiente de correlacin lineal es un nmero real comprendido entre
menos 1 y 1.
d. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la
correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.
e. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la
correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.
f. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la
correlacin es dbil.
g. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o
decreciente. Entre ambas variables hay dependencia funcional.
dp.
1.9.3 Coeficientes de correlacin
dq.
dr. Existen diversos coeficientes que miden el grado de correlacin, adaptados
a la naturaleza de los datos. El ms conocido es el coeficiente de
correlacin de Pearson (introducido en realidad por Francis Galton), que se
obtiene dividiendo la covarianza de dos variables por el producto de sus
desviaciones estndar. Otros coeficientes son:
ds.
a. Coeficiente de correlacin de Spearman
b. Correlacin cannica
c. Coeficiente de Correlacin Intraclase
9
a. Tanto x como y son variables continuas aleatorias. Es decir, a diferencia del
anlisis de referencia de regresin, no es aceptable seleccionar ciertos valores
de x, y despus medir y; tanto y como x deben de variar libremente.
b. La distribucin conjunta de frecuencia es normal. Esto recibe el nombre de de
distribucin normal divariada.
dx.
10
em.
en.1.12 Mtodo practicar para calcular r
eo.
ep.Dado que los clculos necesarios pueden requerir mucho tiempo
especialmente cuando se resta las medias del grupo de cada observacin
se elevan a cuadrado esas diferencias. Existe una versin, la cual simplifica
los clculos:
eq.
er. r= n (xy)-(x)(y) _
es. n(x2)-(x)2 n(y2)(y)2
et.
eu.Existen 3 formas posibles para obtener el valor de r en el caso de datos de
medicin: estandarizar cada conjunto y hallar el producto medio, calcular el
coeficiente de determinacin r2 y obtener su raz cuadrada como utilizar la
formula. Para un conjunto de datos los tres mtodos producirn el mismo
valor para r no obstante cada mtodo agrega algo a la comprensin del
significado del trmino correlacin.
ev.
12
ft.
fu. El procedimiento es como el siguiente:
fv.
a. Obtener la diferencia en rango para cada par de observaciones
b. Como comprobaciones, verificar que la diferencias se sumen a 0
c. elevar el cuadrado la diferencias
d. sumar los cuadrados de la diferencia para obtener d 2
e. Calcular rsp
fw.
fx. Si el valor rsp es pequeo para situaciones en donde n es mayor que 10, la
hiptesis nula de rsp = 0 puede ser probada utilizndola la frmula
fy.
fz. rsp - 0
ga. t=
gb. (1- rsp 2) (n -2)
gc.
13
gn. Un aspecto interesante de una tabla ji cuadrada es que l tamao
mximo posible de x2 es funcin de N, de las observaciones y del
tamao de la tabla.
go.
gp. En el caso de tabla con los valores cuadrado, esto lleva obtener un
valor mximo de C de.
gq.
gr. K 1
gs. C max =
gt. k
gu.
gv.En el cual k es el nmero de fila o columnas. La comprar C con
C max se pude obtener una idea de la intensidad de la asociacin entre la
variables.
gw.
gx.Esta es una relacin moderada, no muy intensa. Su interpretacin exacta
en parte de la naturaleza de los datos y de los resultados comparables que
se obtengan de otros estudios, por lo que es difcil establecer valores
definitivos d intensidades.
gy.
gz. Se bebe observar que la formula no frmula no produce automticamente el
signo del coeficiente de contingencia. DE ah que no siempre resulte
evidente el existe aun relacin positiva o negativa.
ha.
hb. 1.17 Ventajas:
hc.
1. Nos e requiere de supuestos con respectos a la formula de poblacin
2. Solamente se necesita una medicin nominal ( categoras)
hd.
he.1.18 Limitaciones
hf.
14
1. El lmite superior de C es menor que 1.00 incluso Para un correlacin
perfecta.
2. El lmite superior depende del tamao de la tabla, por lo que no son
comparables los coeficientes de contingencia de tablas de tamao
diferente
3. El coeficiente de contingencia no es directamente comprable con otras
medidas de correlacin, como la r de Pearson y la r de Spearman, o incluso
con otras tablas de contingencia de tamao diferente.
4. Cada casilla deber tener una frecuencia esperada por lo menos 5.
5. C max solamente se puede calcular a partir de tabla de valores al cuadrado
hg.
hh.
hi. 1.19 Diferencia entre Regresin y Correlacin
hj.
hk.La Regresin y la Correlacin son dos medidas que estn estrechamente
relacionadas pero son totalmente diferentes, los conceptos expuestos a
continuacin aclaran la diferencia entre los dos trminos.
hl.
hm. El concepto de Correlacin dice que es la medida en la cual se
relacionan dos variables diferentes por ejemplo como se relaciona la
cantidad de fumadores con la cantidad de enfermos de cncer del pulmn o
la relacin que tienen las notas de cursos de estudiantes de diferentes
universidades o diferentes niveles econmicos
hn. .
ho. Por otra parte la Regresin es la ecuacin matemtica que describe
el comportamiento de dos medidas, es decir, con la regresin podemos
construir una frmula que nos d el nmero de enfermos de cncer de
pulmn en funcin de los fumadores o el nmero de cursos aprobados en
funcin de la universidad o del estatus social del estudiante.
hp.
hq. La correlacin se torna interesante cuando el analista o la persona
quien est ejecutando el anlisis de la relacin entre las variables necesita
15
saber con qu fuerza influye una variable con el comportamiento de la
segunda variable, es decir, cuando medimos la correlacin nos interesa
saber que tan importante es una variable y que tanto influye en el resultado.
hr.
hs.En la otra mano tenemos la Regresin que por definicin sabemos que es
la construccin de una ecuacin matemtica que describe el
comportamiento de dos variables a partir de datos mustrales capturados,
entonces, la regresin es til cuando saber una prediccin del resultado en
base a un valor que resulta ser la variable de la ecuacin calculada por
medio de la regresin de datos por ejemplo si yo tengo el nmero de
alumnos en una clase de matemtica y quiero saber la cantidad de alumnos
que aprobaran, lo puedo lograr gracias a datos estadsticos que me han
generado una ecuacin que describa el comportamiento del nmero de
alumnos aprobados en funcin del nmero de alumnos inscritos de el curso
de matemtica.
ht.
hu.
hv.
hw.
hx.
hy.
hz.
ia.
ib.
ic.
id.
ie.
if.
ig.
ih.
ii.
ij.
ik.
il.
im.
in.
io.
ip.
iq.
16
ir.
is.
it.
iu.
iv.
iw.
ix.
iy.
17
iz.
ja.
jb.
jc.CAPITULO II
jd. CASO PRCTICO
je.
jf. Ejercicio # 1
jg.
jh.
ji.
jj.
jk.
jl.
jm.
jn.
jo.
jp.
jq.
jr.
js.
jt.
ju.
jv.
jw.
jx.
jy.
jz.
ka.
kb.
kc.
kd.
ke.
kf.
kg.
kh.
ki.
kj.
kk.
kl.
km.
kn.
17
ko.
18
kp.
kq.
kr. Ejercicio # 3
ks. Los datos de la siguiente tabla representan las alturas (X) y los pesos (Y)
de varios hombres. Se escogieron las alturas de antemano y se observaron
los pesos de un grupo de hombres al azar que tenian las alturas escogidas,
resultando:
kt. X(cm) 152 72 84 82 155 152 155 157 152 157 165 162 178 183 178
kv. Se asume que existe una relacin funcional entre X e Y, obtener la ecuacin
de regresin.
kw. Solucin: En primer lugar se observa que Y=f(x), por tanto se asume
que la variable altura (X) es independiente y la variable peso (Y) es la
dependiente, luego se afirma que Y = bo + b1X. Para ello se efectan los
sgtes clculos:
19
le. y = 75.446 + .0 8676X
lf. Ejercicio # 4
lg. En una muestra de 1.500 individuos se recogen datos sobre dos medidas
antropomtricas X e Y. Los resultados se muestran resumidos en los
siguientes estadsticos:
lh.
li.
Obtener el modelo de regresin lineal que mejor aproxima Y en funcin
de X. Utilizando este modelo, calcular de modo aproximado la
cantidad Y esperada cuandoX=15.
lj. Solucin:
lk.
ll. Lo que se busca es la recta, , que mejor aproxima los valores de Y (segn
el criterio de los mnimos cuadrados) en la nube de puntos que resulta de
representar en un plano (X,Y) las 1.500 observaciones. Los coeficientes de
esta recta son:
lm.
ln.
lo.
lp.
As, el modelo lineal consiste en:
lq.
20
lr.
Por tanto, si x=15, el modelo lineal predice un valor de Y de:
ls.
lt.
lu.
lv.
lw.
lx.
ly.
lz.
ma.
mb.
mc.
md.
me.
mf.
mg.
mh.
mi.
mj.
mk.
ml.
mm.
mn.
mo.
mp.
mq.
mr.
ms.
mt.
mu.
mv.
mw.
mx.
my.
mz.
na.
nb.
nc.
nd.
ne.
nf.
ng.
21
nh.
ni.
nj.
nk.
nl.
nm.
nn.
no.
np.
nq.
nr.
ns.
nt.
nu.
nv.
nw.
nx.
ny.
nz.
oa.
ob.
oc.
od.
oe.
of.
og.
oh.
oi.
oj.
ok.
ol.
om.
on.
oo.
op.
oq.
or.
os.
ot.
ou.
ov.
ow. CONCLUSIONES
ox.
oy.
22
oz.
pa.
pb.
pc.
pd.
pe.
pf.
pg.
ph.
pi.
pj.
pk.
pl.
pm.
pn.
po. RECOMENDACIONES
pp.
pq.
pr.
ps.
pt.
pu.
pv.
pw.
px.
py.
pz.
qa.
qb.
qc.
qd.
qe.
qf.
qg.
23
qh.
qi.
qj. WEBGRAFA
qk.
ql.
qm.
24