Você está na página 1de 29

Universidad de San Carlos de Guatemala

Facultad de Ciencias Econmicas

Seminario de Integracin Profesional

Lic. Luis Oscar Ricardo de la Rosa

Licda. Auxiliar Marilyn Contreras Milin


Edificio S-12
Saln 207

12TI REGRESIN Y CORRELACIN

Grupo No. 12

200013540 Alarcn Mendoza, Ofelia de Mara


200713373 Ochoa Guerra, Israel Bernab
200912483 Herrera, Analy Arleth
200920293 Marroqun Andrade, Stephanie Noem
200921477 Chvez Revolorio, Mara Fernanda
201010535 Segura Paul, Veronica Paola
201010910 Bailn Blanco, Nelson Anbal
201011099 Paredes Tucux, Elsa Carolina

Guatemala, Febrero de 2017


INDICE

INTRODUCCIN i
CAPITULO I 1
REGRESIN Y CORRELACIN 1
1.1 Regresin 1
1.1.1Tipos de Regresin 1
1.2 Ecuacin Lineal 2
1.3 Determinacin de la ecuacin matemtica 3
1.4 Mtodos de mnimos cuadrados 3
1.5 Inferencia en el anlisis de regresin 4
1.6 El error estndar de estimacin 4
1.7 Inferencia de acerca de la pendiente de una lnea de regresin 5
1.9 Anlisis de Correlacin 6
1.9.1 Tipos de Correlacin 7
1.9.2 Propiedades de la correlacin lineal 8
1.9.3 Coeficientes de correlacin 9
1.10 Datos Continuos: r de Pearson 9
1.10.1 Tipos de variables con las que se puede utilizar el coeficiente r de
Pearson 10
1.11 Carcter de r 10
1.12 Mtodo practicar para calcular r 11
1.13 Inferencia acerca del coeficiente de correlacin 11
1.13.1 Intervalo de confianza para la correlacin de la poblacin 11
1.14 Prueba de significacin de r 12
1.15 Datos jerarquizados de: r Spearman 12
1.16 Datos nominales: el coeficiente de contingencia 13
1.17 Ventajas: 14
1.18 Limitaciones 14
1.19 Diferencia entre Regresin y Correlacin 15
1
CAPITULO II
CASO PRCTICO 17
CONCLUSIONES 22
RECOMENDACIONES 23
WEBGRAFA 24

2
INTRODUCCIN

1
CAPITULO I

REGRESIN Y CORRELACIN

La regresin y la correlacin son dos tcnicas estrechamente relacionadas y


comprenden una forma de estimacin.

En forma ms especifica el anlisis de correlacin y regresin comprende el


anlisis de los datos muestrales para saber qu es y cmo se relacionan entre s
dos o ms variables en una poblacin. El anlisis de correlacin produce un
nmero que resume el grado de la correlacin entre dos variables; y el anlisis de
regresin da lugar a una ecuacin matemtica que describe dicha relacin.

El anlisis de correlacin generalmente resulta til para un trabajo de exploracin


cuando un investigador o analista trata de determinar que variables son
potenciales importantes, el inters radica bsicamente en la fuerza de la relacin.
La correlacin mide la fuerza de una entre variables; la regresin da lugar a una
ecuacin que describe dicha relacin en trminos matemticos

Los datos necesarios para anlisis de regresin y correlacin provienen de


observaciones de variables relacionadas.

1.1 Regresin

1.1.1Tipos de Regresin

Podemos clasificar los tipos de regresin segn diversos criterios.


En primer lugar, en funcin del nmero de variables independientes:

a. Regresin simple: Cuando la variable Y depende nicamente de una nica


variable X.

1
b. Regresin mltiple: Cuando la variable Y depende de varias variables (X1,
X2, ..., Xr)
c. Regresin lineal:
d.
e. La regresin lineal simple comprende el intento de desarrollar una lnea
recta o ecuacin matemtica lineal que describe la reaccin entre dos
variables.
f.
g. La regresin puede utilizadas de diversas formas. Se emplean en
situaciones en la que las dos variables miden aproximadamente lo mismo,
pero en las que una variable es relativamente costosa, o, por el contrario,
es poco interesante trabajar con ella, mientras que con la otra variable no
ocurre lo mismo.
h. La finalidad de una ecuacin de regresin seria estimar los valores de una
variable con base en los valores conocidos de la otra.
i.
j. Otra forma de emplear una ecuacin de regresin es para explicar los
valores de una variable en trmino de otra. Es decir se puede intuir una
relacin de causa y efecto entre dos variables. El anlisis de regresin
nicamente indica qu relacin matemtica podra haber, de existir una. Ni
con regresin ni con la correlacin se pude establecer si una variable tiene
causa ciertos valores de otra variable.
k.
l. 1.2 Ecuacin Lineal
m.
n. Dos caractersticas importantes de una ecuacin lineal:
o.
1) la independencia de la recta
2) la localizacin de la recta en algn punto. Una ecuacin lineal tiene la forma
p.
q. y = a + bx
r.
2
s. En la que a y b son valores que se determina a partir de los datos de la
muestra; a indica la altura de la recta en x= 0, y b seala su pendiente. La
variable y es la que se habr de predecir, y x es la variable predictora.

t. 1.3 Determinacin de la ecuacin matemtica


u.
v. En la regresin, los valores de y son predichos a partir de valores de x
dados o conocidos. La variable y recibe el nombre variable dependiente y la
variable x, el de variable independiente.

w. 1.4 Mtodos de mnimos cuadrados


x.
y. EL procedimiento ms utilizado por adaptar una recta aun conjunto de
punto se le que conoce como mtodo de mnimos cuadrados. La recta
resultante presenta 2 caracterstica importantes
z.
1) es nula la suma desviaciones verticales en los puntos a partir de la recta
2) es mnima la suma de los cuadrados de dicha desviaciones
aa.
ab.
ac.
(yi yc)2
ad.
ae. En el cual
af.
ag.Yi = valor esperado de y
ah. Yc= valor calculado de y utilizando la ecuacin de mnimos cuadrados con
el valor correspondientes x para yi
ai.

aj. Los valores de a y b para la recta es Yc = a + bx que minimiza la suma de


los cuadrados de la desviacin ecuaciones normales
ak.
al. y = na + (x)
am. xy= a (x) +b (x2)
3
an.
ao.En las que n es el numero de pares de observaciones. Evaluando las
cantidades x, y, etc. Se puede resolver estas dos ecuaciones
simultneamente para determinar a b. la ecuaciones puede despejarse. Se
obtuvieron dos formulas aun para a y otra para b.
ap.
aq.
ar. n(xy)- (x)(y)
as. b=
at.
n(x2)-(x)2
au.
av.

aw. y b x
ax. a=
ay. n
az.
ba.

bb. 1.5 Inferencia en el anlisis de regresin


bc.
bd. Los supuestos para el anlisis de regresin son como:
a) Existen datos de medicin para a x y z.
b) la variable dependiente es una variable aleatoria.
c) para cada valor de x, existe una distribucin condicional de la qu es de
naturaleza normal
d) la desviacin estndar de toda las distribuciones condicionales son iguales
be.

bf. 1.6 El error estndar de estimacin


bg.
bh. La determinante primaria de la exactitud es el grado de dispersin de
la poblacin: cuanto ms dispersa este, menor ser la exactitud de la
estimacin. El grado de dispersin en la poblacin se puede estimar a partir
del grado de dispersin en las observaciones de la muestra con respecto a
la lnea de regresin calculada, utilizando la formula.
bi.
bj. Se = (yi yc)

4
bk. n-2
bl. en la cual:
bm. yi = cada valor de y
bn. yc = valor de lnea de regresin correspondiente a partir de la ecuacin de
regresin.
bo. n = nmeros de observaciones.
bp.
bq. La formula anterior no se utiliza por lo general para clculos reales, es
ms fcil trabajar con la formula simplificada
br.
bs. Se y2 a y b xy
bt. n2
bu.

bv.1.7 Inferencia de acerca de la pendiente de una lnea de regresin


bw.
bx.Aun cuando es muy poca o nula relacin entre dos variables de aun
poblacin, es posible obtener valores maestrales que hacen que parezca
que la variables estn relacionadas, es importantes probar los resultados
tales de caculo, a fin determinar si son significativos (es decir si los
parmetros verdaderos no son cero), Si no existe ninguna relacin se
esperara obtener aun pendiente cero, se pone a prueba la hiptesis nula
contra la hiptesis alternativa.
by.
bz. La significacin del coeficiente de regresin se puede probar comparndolo
con su desviacin estndar
ca.
cb.t = valor de la muestra valor esperado
cc. Desviacin estndar
cd.
ce. 1.8 Anlisis de regresin lineal mltiple
cf.

5
cg.La regresin mltiple comprende tres o ms variables. Existe solo una
variable dependiente, pero hay dos o ms tipo independiente. Esta
operacin al desarrollo de una ecuacin que se puede utilizar para predecir
valore de y, respecto a valores dados de la diferencia variables
independientes adicionales es incrementar la capacidad predicativa sobre la
de la regresin lineal simple.
ch.
ci. Las tcnicas de los mnimos cuadrados se utilizan para obtener ecuaciones
de regresin.
cj. Yc= a +b1x1+b2x2+bkxk
ck.

cl. a = ordenada en el origen


cm. b1= pendiente
cn. k = numero de variables independientes
co.
cp.Un anlisis de regresin simple de dos variable da lugar a la ecuacin de
una recta, un problema de tres variables produce un plano, y un problema
de k variables implica un hiperplano de a
cq.(k +1) dimensiones.
cr.
cs. 1.9 Anlisis de Correlacin
ct.
cu.EL objetivo de un estudio de correlacin es determinar la consistencia de
una relacin entre observaciones por partes. EL trmino correlacin
significa relacin mutua, ye que indica el grado en el que los valores de
una variable se relacionan con los valores de otra. Se considera tres
tcnicas de correlacin uno para datos de medicin, otro para datos
jerarquizados y el ltimo para clasificaciones nominales.
cv.
cw. El objetivo primordial del anlisis de correlacin lineal es medir la
intensidad de una relacin lineal entre dos variables. Se analizaran algunos

6
diagramas ya sean de dispersin que muestran diferentes relaciones entre
variables independientes o de entrada (x) y variables independientes o de
salida (Y) se dice que no hay correlacin o relacin entre X y Y.
cx.
cy. Si a medida que crece x hay un cambio en los valores de y existe una
correlacin. La correlacin es positiva cuando Y tiende a crecer y es
negativa cuando Y tiende a decrecer.
cz.
da.Si los pares ordenados (x,y) tienden a seguir un patrn de lnea recta, se
tiene una correlacin lineal. La correlacin lineal perfecta ocurre cuando
todos los puntos estn exactamente sobre una recta. Esta correlacin
puede ser positiva o negativa dependiendo de si Y crece o decrece a
medida que x se incrementa. Si los datos forman una recta horizontal o
vertical no hay correlacin, ya que una variable no afecta a la otra.
db.

dc.1.9.1 Tipos de Correlacin


dd.
a. Correlacin Directa
de.La correlacin directa se da cuando al aumentar una de las variables la otra
aumenta. La recta correspondiente a la nube de puntos de la distribucin es
una recta creciente.

df.
b. Correlacin inversa
dg. La correlacin inversa se da cuando al aumentar una de las variables
la otra disminuye. La recta correspondiente a la nube de puntos de la
distribucin es una recta decreciente.

7
dh.
di.
c. Correlacin nula
dj. La correlacin nula se da cuando no hay dependencia de ningn tipo entre
las variables. En este caso se dice que las variables son incorreladas y la
nube de puntos tiene una forma redondeada.

dk.
dl.
1.9.2 Propiedades de la correlacin lineal
a. El coeficiente de correlacin no vara al hacerlo la escala de medicin.
dm. Es decir, si expresamos la altura en metros o en centmetros el
coeficiente de correlacin no vara.
b. El signo del coeficiente de correlacin es el mismo que el de la covarianza.
dn. Si la covarianza es positiva, la correlacin es directa. Si la covarianza
es negativa, la correlacin es inversa. Si la covarianza es nula, no existe
correlacin.
do.

8
c. El coeficiente de correlacin lineal es un nmero real comprendido entre
menos 1 y 1.
d. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la
correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.
e. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la
correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.
f. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la
correlacin es dbil.
g. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o
decreciente. Entre ambas variables hay dependencia funcional.
dp.
1.9.3 Coeficientes de correlacin
dq.
dr. Existen diversos coeficientes que miden el grado de correlacin, adaptados
a la naturaleza de los datos. El ms conocido es el coeficiente de
correlacin de Pearson (introducido en realidad por Francis Galton), que se
obtiene dividiendo la covarianza de dos variables por el producto de sus
desviaciones estndar. Otros coeficientes son:
ds.
a. Coeficiente de correlacin de Spearman
b. Correlacin cannica
c. Coeficiente de Correlacin Intraclase

dt. 1.10 Datos Continuos: r de Pearson


du.
dv.EL grado de relacin entre dos variables continuas se resume mediante un
coeficiente de correlacin que se conoce como r de Pearson en honor del
gran matemtico Kart Pearson, quien ideo este mtodo. Esta tcnica es
vlida mientras si es posible establecer ciertos supuestos bastante
estrictos. Tales supuestos son los siguientes:
dw.

9
a. Tanto x como y son variables continuas aleatorias. Es decir, a diferencia del
anlisis de referencia de regresin, no es aceptable seleccionar ciertos valores
de x, y despus medir y; tanto y como x deben de variar libremente.
b. La distribucin conjunta de frecuencia es normal. Esto recibe el nombre de de
distribucin normal divariada.
dx.

dy.1.10.1 Tipos de variables con las que se puede utilizar el coeficiente r


de Pearson
dz.
ea. Para poder utilizar el coeficiente de correlacin r de Pearson: las dos
variables deben ser:
eb.
ec. a) Las dos continuas,
ed.b) Una continua y otra dicotmica (1 0).
ee. c) Las dos dicotmicas (1 0).
ef.
eg.La correlacin entre una variable continua y otra dicotmica se denomina
correlacin biserial puntual (rbp) pero el clculo y la interpretacin son los
mismos que cuando las dos variables son continuas (y podemos utilizar
calculadoras y programas que tienen ya programada la correlacin r de
Pearson).
eh.
ei. 1.11 Carcter de r
ej.
ek. El coeficiente de relacin presenta dos propiedades que establecen la
naturaleza de una relacin entre dos variables. Una es su signo (+ o -) y la
otra, es su magnitud. El signo es igual al de la pendiente de una recta que
podra ajustarse a los datos si estos se graficaran en un diagrama de
dispersin, y la magnitud de r indica cuan cerca esta de la recta tales
puntos.
el.

10
em.
en.1.12 Mtodo practicar para calcular r
eo.
ep.Dado que los clculos necesarios pueden requerir mucho tiempo
especialmente cuando se resta las medias del grupo de cada observacin
se elevan a cuadrado esas diferencias. Existe una versin, la cual simplifica
los clculos:
eq.
er. r= n (xy)-(x)(y) _
es. n(x2)-(x)2 n(y2)(y)2
et.
eu.Existen 3 formas posibles para obtener el valor de r en el caso de datos de
medicin: estandarizar cada conjunto y hallar el producto medio, calcular el
coeficiente de determinacin r2 y obtener su raz cuadrada como utilizar la
formula. Para un conjunto de datos los tres mtodos producirn el mismo
valor para r no obstante cada mtodo agrega algo a la comprensin del
significado del trmino correlacin.
ev.

ew. 1.13 Inferencia acerca del coeficiente de correlacin

ex. 1.13.1 Intervalo de confianza para la correlacin de la poblacin


ey.
ez. El valor del coeficiente de correlacin de la muestra se puede utilizar como
un estimado de la correlacin verdadera de poblacin existen varios
mtodos para obtener un mtodo de confianza para pero quizs la forma
ms directa es usar un diagrama.
fa.
fb. Si se examinan el diagrama se observara que el intervalo de los valores
potenciales (no conocidos) se indica a lo largo de la escala vertical los
posibles valores r de la muestra se indica en la escala inferior una serie de
curvas representan tamao de muestras seleccionadas.
fc.
11
fd.
fe. 1.14 Prueba de significacin de r
ff.
fg. Puede ser necesario evaluar una aseveracin con respecto al valor de . La
forma ms sencilla es obtener un intervalo de confianza para r y observar si
el valor propuesto est incluido en el intervalo de ser as se rechaza a Ho y
se acepta la alternativa.
fh.
fi. 1.15 Datos jerarquizados de: r Spearman
fj.
fk. Es una tcnica no paramtrica que utiliza para medir la fuerza de una
relacin por pares de 2 variables cuando los datos se encuentran en forma
jerarquizados. El objeto de calcular un coeficiente de correlacin estos
ejemplos es determinar el grado en el que dos conjuntos de jerarquizacin
concuerdan o no. Esta tcnica tambin se puede extender a calificaciones u
otro tipo de medicin si estas se convierten a rangos.
fl.
fm. Las medidas del grado de concordancia son los cuadrados de las
diferencias entre los dos conjuntos de rangos: si la suma de stos es
pequea, esto significa que hay acuerdo; si la suma es grande, esto indica
lo contrario. EL clculo real de la correlacin comprende la formula.
fn.
fo. rsp = 1 - 6d2
fp. n(n2 -1)
fq. En la cual n es el nmero de observaciones y d2 es la suma de los
cuadrados de la diferencia entre los rangos. El coeficiente de correlacin de
jerarqua obtenido recibe el nombre de r Spearman. La suma de la
diferencia es cero. Esto no sirve como una comprobacin til de los
clculos aunque no es necesaria en la frmula.
fr.
fs.

12
ft.
fu. El procedimiento es como el siguiente:
fv.
a. Obtener la diferencia en rango para cada par de observaciones
b. Como comprobaciones, verificar que la diferencias se sumen a 0
c. elevar el cuadrado la diferencias
d. sumar los cuadrados de la diferencia para obtener d 2
e. Calcular rsp
fw.
fx. Si el valor rsp es pequeo para situaciones en donde n es mayor que 10, la
hiptesis nula de rsp = 0 puede ser probada utilizndola la frmula
fy.
fz. rsp - 0
ga. t=
gb. (1- rsp 2) (n -2)
gc.

gd. 1.16 Datos nominales: el coeficiente de contingencia


ge.
gf. Cuando ambas variables se miden en escalas nominales ( es decir ,
categoras ) , el anlisis es fcilmente mediante el desarrollo de una tabla
de contingencia semejante a la que se utilizo en el anlisis de k
proporciones ( prueba de ji cuadrada ), el procedimiento en realidad de aun
extensin del anlisis de una tabla r * k.
gg.
gh. Una medida de relacin es calcular el coeficiente de contingencia en C,
donde
gi.
gj. x2
gk. C=
gl. X2 + N
gm.

13
gn. Un aspecto interesante de una tabla ji cuadrada es que l tamao
mximo posible de x2 es funcin de N, de las observaciones y del
tamao de la tabla.
go.
gp. En el caso de tabla con los valores cuadrado, esto lleva obtener un
valor mximo de C de.
gq.
gr. K 1
gs. C max =
gt. k
gu.
gv.En el cual k es el nmero de fila o columnas. La comprar C con
C max se pude obtener una idea de la intensidad de la asociacin entre la
variables.
gw.
gx.Esta es una relacin moderada, no muy intensa. Su interpretacin exacta
en parte de la naturaleza de los datos y de los resultados comparables que
se obtengan de otros estudios, por lo que es difcil establecer valores
definitivos d intensidades.
gy.
gz. Se bebe observar que la formula no frmula no produce automticamente el
signo del coeficiente de contingencia. DE ah que no siempre resulte
evidente el existe aun relacin positiva o negativa.
ha.
hb. 1.17 Ventajas:
hc.
1. Nos e requiere de supuestos con respectos a la formula de poblacin
2. Solamente se necesita una medicin nominal ( categoras)
hd.
he.1.18 Limitaciones
hf.

14
1. El lmite superior de C es menor que 1.00 incluso Para un correlacin
perfecta.
2. El lmite superior depende del tamao de la tabla, por lo que no son
comparables los coeficientes de contingencia de tablas de tamao
diferente
3. El coeficiente de contingencia no es directamente comprable con otras
medidas de correlacin, como la r de Pearson y la r de Spearman, o incluso
con otras tablas de contingencia de tamao diferente.
4. Cada casilla deber tener una frecuencia esperada por lo menos 5.
5. C max solamente se puede calcular a partir de tabla de valores al cuadrado
hg.
hh.
hi. 1.19 Diferencia entre Regresin y Correlacin
hj.
hk.La Regresin y la Correlacin son dos medidas que estn estrechamente
relacionadas pero son totalmente diferentes, los conceptos expuestos a
continuacin aclaran la diferencia entre los dos trminos.
hl.
hm. El concepto de Correlacin dice que es la medida en la cual se
relacionan dos variables diferentes por ejemplo como se relaciona la
cantidad de fumadores con la cantidad de enfermos de cncer del pulmn o
la relacin que tienen las notas de cursos de estudiantes de diferentes
universidades o diferentes niveles econmicos
hn. .
ho. Por otra parte la Regresin es la ecuacin matemtica que describe
el comportamiento de dos medidas, es decir, con la regresin podemos
construir una frmula que nos d el nmero de enfermos de cncer de
pulmn en funcin de los fumadores o el nmero de cursos aprobados en
funcin de la universidad o del estatus social del estudiante.
hp.
hq. La correlacin se torna interesante cuando el analista o la persona
quien est ejecutando el anlisis de la relacin entre las variables necesita

15
saber con qu fuerza influye una variable con el comportamiento de la
segunda variable, es decir, cuando medimos la correlacin nos interesa
saber que tan importante es una variable y que tanto influye en el resultado.
hr.
hs.En la otra mano tenemos la Regresin que por definicin sabemos que es
la construccin de una ecuacin matemtica que describe el
comportamiento de dos variables a partir de datos mustrales capturados,
entonces, la regresin es til cuando saber una prediccin del resultado en
base a un valor que resulta ser la variable de la ecuacin calculada por
medio de la regresin de datos por ejemplo si yo tengo el nmero de
alumnos en una clase de matemtica y quiero saber la cantidad de alumnos
que aprobaran, lo puedo lograr gracias a datos estadsticos que me han
generado una ecuacin que describa el comportamiento del nmero de
alumnos aprobados en funcin del nmero de alumnos inscritos de el curso
de matemtica.
ht.
hu.
hv.
hw.
hx.
hy.
hz.
ia.
ib.
ic.
id.
ie.
if.
ig.
ih.
ii.
ij.
ik.
il.
im.
in.
io.
ip.
iq.

16
ir.
is.
it.
iu.
iv.
iw.
ix.
iy.

17
iz.
ja.
jb.
jc.CAPITULO II
jd. CASO PRCTICO
je.
jf. Ejercicio # 1

jg.
jh.
ji.
jj.
jk.
jl.
jm.
jn.
jo.
jp.
jq.
jr.
js.
jt.
ju.
jv.
jw.
jx.
jy.
jz.
ka.
kb.
kc.
kd.
ke.
kf.
kg.
kh.
ki.
kj.
kk.
kl.
km.
kn.

17
ko.

18
kp.

kq.

kr. Ejercicio # 3

ks. Los datos de la siguiente tabla representan las alturas (X) y los pesos (Y)
de varios hombres. Se escogieron las alturas de antemano y se observaron
los pesos de un grupo de hombres al azar que tenian las alturas escogidas,
resultando:

kt. X(cm) 152 72 84 82 155 152 155 157 152 157 165 162 178 183 178

ku.Y(kg) 50 61.5 54.5 57.5 63.5 59 61 72 66

kv. Se asume que existe una relacin funcional entre X e Y, obtener la ecuacin
de regresin.

kw. Solucin: En primer lugar se observa que Y=f(x), por tanto se asume
que la variable altura (X) es independiente y la variable peso (Y) es la
dependiente, luego se afirma que Y = bo + b1X. Para ello se efectan los
sgtes clculos:

kx. n = 12, JX = 1946, x = 162.167, JY = 783, y = 65.25

ky. SCX = JX-(JX)/12 = 316986- (1946)/12 = 1409.667

kz. SPXY = JXY-(JX)(JY)/12 = 128199.5-(1946x783)/12=1223

la. Luego, se calcula bo y b1:

lb. bo = 65.25-(0.8676)(162.167) = -75.446

lc. b1 = 1223/1409.667 = 0.8676

ld. Por tanto, la ecuacin buscada es:

19
le. y = 75.446 + .0 8676X

lf. Ejercicio # 4

lg. En una muestra de 1.500 individuos se recogen datos sobre dos medidas
antropomtricas X e Y. Los resultados se muestran resumidos en los
siguientes estadsticos:

lh.
li.
Obtener el modelo de regresin lineal que mejor aproxima Y en funcin
de X. Utilizando este modelo, calcular de modo aproximado la
cantidad Y esperada cuandoX=15.

lj. Solucin:

lk.

ll. Lo que se busca es la recta, , que mejor aproxima los valores de Y (segn
el criterio de los mnimos cuadrados) en la nube de puntos que resulta de
representar en un plano (X,Y) las 1.500 observaciones. Los coeficientes de
esta recta son:

lm.
ln.

lo.
lp.
As, el modelo lineal consiste en:

lq.

20
lr.
Por tanto, si x=15, el modelo lineal predice un valor de Y de:

ls.
lt.

lu.
lv.
lw.
lx.
ly.
lz.
ma.
mb.
mc.
md.
me.
mf.
mg.
mh.
mi.
mj.
mk.
ml.
mm.
mn.
mo.
mp.
mq.
mr.
ms.
mt.
mu.
mv.
mw.
mx.
my.
mz.
na.
nb.
nc.
nd.
ne.
nf.
ng.

21
nh.
ni.
nj.
nk.
nl.
nm.
nn.
no.
np.
nq.
nr.
ns.
nt.
nu.
nv.
nw.
nx.
ny.
nz.
oa.
ob.
oc.
od.
oe.
of.
og.
oh.
oi.
oj.
ok.
ol.
om.
on.
oo.
op.
oq.
or.
os.
ot.
ou.
ov.

ow. CONCLUSIONES
ox.
oy.

22
oz.
pa.
pb.
pc.
pd.
pe.
pf.
pg.
ph.
pi.
pj.
pk.
pl.
pm.
pn.

po. RECOMENDACIONES
pp.
pq.
pr.
ps.
pt.
pu.
pv.
pw.
px.
py.
pz.
qa.
qb.
qc.
qd.
qe.
qf.
qg.

23
qh.
qi.

qj. WEBGRAFA
qk.

a. Regresin Lineal. En Wiquipedia. Consultado el 02 de febrero de 2017, en


ttp://es.wikipedia.org/wiki/Regresin_lineal

ql.

b. Correlacin. En Wiquipedia. Consultado el 31 de enero de 2017, en


http://www.vitutor.com/estadistica/bi/correlacion.html

qm.

24

Você também pode gostar