Você está na página 1de 11

1 Correlacin y regresin lineal estadistica y probabilidades

Contenido
1. correlacin lineal
1.1 Concepto.............................................................................2
1.2 diagrama de dispersin......................................................2
1.4 coeficiente de correlacin...................................................3
1.5 coeficiente de determinacin..............................................4
1.6 coeficiente de no determinacin.........................................5
1.7 rango de spearman..............................................................6
1.8 ejercicio de aplicacion.........................................................7

2. regresin lineal
2.1 concepto..............................................................................8
2.2 ecuacin de regresin.........................................................9
2.3 ejercicio de aplicacion.......................................................10
2.4 pronosticar el valor de y estimada para cada uno de los
valores de x..............................................................................10

ORCCON AHUINLLA EDWARD 1


2 Correlacin y regresin lineal estadistica y probabilidades

1.correlacion lineal
1.1 concepto
Bajo el concepto de correlacin se recogen varios procedimientos e
indicadores estadsticos utilizados para determinar el grado de asociacin
entre dos variables; el ms sencillo de ellos es el de correlacin lineal que est
basado en la comparacin de la varianza asociada de dos variables
(covarianza) y las desviaciones estndar de cada uno a travs del clculo del
coeficiente r de Pearson. l trmino correlacin se utiliza generalmente para
indicar la correspondencia o la relacin recproca que se da entre dos o ms
cosas, ideas, personas, entre otras.
En tanto, en probabilidad y estadstica, la correlacin es aquello que indicar
la fuerza y la direccin lineal que se establece entre dos variables aleatorias. Se
considera que dos variables de tipo cuantitativo presentan correlacin la una
respecto de la otra cuando los valores de una ellas varen sistemticamente
con respecto a los valores homnimos de la otra.
Por ejemplo, si tenemos dos variables que se llaman A y B, existir el
mencionado fenmeno de correlacin si al aumentar los valores de A lo hacen
tambin los valores correspondientes a B y viceversa.
De todas maneras, vale aclarar que la correlacin que pueda darse entre dos
variables no implicar por si misma ningn tipo de relacin de causalidad. Los
principales elementos componentes de una correlacin de este tipo sern: la
fuerza, el sentido y la forma.

1.2 diagrama de dispersin


El diagrama de dispersin permite analizar si existe algn tipo de relacin
entre dos variables. Por ejemplo, puede ocurrir que dos variables estn
relacionadas de manera que al aumentar el valor de una, se incremente el de la
otra. En este caso hablaramos de la existencia de una correlacin positiva.
Tambin podra ocurrir que al producirse una en un sentido, la otra derive en
el sentido contrario; por ejemplo, al aumentar el valor de la variable x, se
reduzca el de la variable y. Entonces, se estara ante una correlacin negativa.
Si los valores de ambas variable se revelan independientes entre s, se
afirmara que no existe correlacin.

ORCCON AHUINLLA EDWARD 2


3 Correlacin y regresin lineal estadistica y probabilidades

Ejemplo de Diagrama de Dispersin

En el diagrama de dispersin de ejemplo las variables a analizar son las


puntuaciones medias obtenidas para los distintos factores del servicio, tanto
en percepcin (X) como en expectativas (Y), a partir de una muestra de
usuarios de un servicio administrativo a los que se les administr una encuesta
de satisfaccin.
El clculo del coeficiente de correlacin lineal efectuado para los datos del
ejemplo de diagrama de dispersin arroja un valor de 0,45. Se confirma que
existe una relacin positiva entre ambas variables, si bien la correlacin
existente entre ambas es moderada.

1.3 coeficiente de correlacin


El coeficiente de correlacin (r) es una medida de la intensidad de la relacin
lineal entre dos variables.
Requiere datos de nivel de razn.

Puede tomar cualquier valor de -1.00 a 1.00.

Los valores de -1.00 o 1.00 indican la correlacin perfecta y fuerte.

Los valores cerca de 0.0 indican la correlacin dbil.

ORCCON AHUINLLA EDWARD 3


4 Correlacin y regresin lineal estadistica y probabilidades

Los valores negativos indican una relacin inversa y los valores positivos
indican una relacin directa.
Calculamos el coeficiente de correlacin de las frmulas siguientes.

( X X )(Y Y )
r
( n 1) s x s y
n(XY ) (X )(Y )

n (X 2

) (X ) 2 n Y 2 Y
2

1.4 coeficiente de determinacin

El coeficiente de determinacin o coeficiente de correlacin mltiple al


cuadrado, es una medida descriptiva que sirve para evaluar la bondad de
ajuste del modelo a lo datos, ya que mide la capacidad predictiva del modelo
ajustado. Se define como el cociente entre la variabilidad explicada por la
regresin y la variabilidad total, esto es:

Algunas otras formas de presentar el coeficiente de determinacin son:

Algunas de las equivalencias anteriores pueden verse a partir de la

demostracin de .D

ORCCON AHUINLLA EDWARD 4


5 Correlacin y regresin lineal estadistica y probabilidades

Utilidad
Se utiliza para medir la reduccin en la variabilidad total de debido a la
inclusin de las variables regresoras . Un valor grande de no
necesariamente implica que el modelo es bueno. Adicionar variables al modelo
siempre incrementa el valor de , ya sea que las variables contribuyan o no al
modelo. Es posible que modelos con valor de grande sean malos en la
prediccin o estimacin.

OBSERVACIONES
1. mide la correlacin entre y y .
2. Si existe error puro, es imposible que alcance el valor de . La
nica manera en que podra dar , sera que se tuviera un
perfecto ajuste de los datos en el cual , lo cual es un improbable
evento en la prctica,
3. Si , esto es si (suponiendo que el
modelo ha sido ajustado), entonces .
4. es una medida de la utilidad de los trminos en el modelo
diferentes de .

1.5 coeficiente de no determinacin

El Coeficiente de no Determinacin, es justamente lo contrario del Coeficiente


de Determinacin. Indica la proporcin en la variacin total de la
variable "Y"(variable dependiente), que no se debe a la variacin de la
variable "X"(variable independiente).
El coeficiente de no determinacin, indica la proporcin, de la variacin total
de la variable "Y" que no es explicada por la variable "X".
O sea, la variacin que no es explicada por el modelo de regresin.
En este caso sera el 39% de la variacin de la variable dependiente, que no se
debe a la variacin de la variable independiente.

ORCCON AHUINLLA EDWARD 5


6 Correlacin y regresin lineal estadistica y probabilidades

1.6 rango de spearman


Este coeficiente se emplea cuando una o ambas escalas de medidas de las
variables son ordinales, es decir, cuando una o ambas escalas de medida son
posiciones. Ejemplo: Orden de llegada en una carrera y peso de los atletas.
Se calcula aplicando la siguiente ecuacin:

1.7 ejercicio de
aplicacin

1.Juan Escobedo,
presidente de la sociedad de alumnos de la Universidad de Toledo, se ocupa
de estudiar el costo de los libros de texto. l cree que hay una relacin entre el
nmero de pginas en el texto y el precio de venta del libro. Para proporcionar
una prueba, selecciona una muestra de ocho libros de texto actualmente en
venta en la librera. Dibuje un diagrama de dispersin. Compruebe el
coeficiente de correlacin.

Libro Pginas Precio ($)


Intr. a la Historia 500 84
Algebra 700 75
Intr.a la Psicologa 800 99
Intr. a la Sociologa 600 72
Mercadotecnia 400 69
Intr. a la Biologa 500 81
Fund. de Jazz 600 63

Intr.a la Enfermera 800 93

ORCCON AHUINLLA EDWARD 6


7 Correlacin y regresin lineal estadistica y probabilidades

Libro Pginas Precio ($)


X Y XY X2 Y2
Intr. a la Historia 500 84 42,000 250,000 7,056
lgebra 700 75 52,500 490,000 5,625
Intr. a la Psicologa 800 99 79,200 640,000 9,801
Intr. a la Sociologa 600 72 43,200 360,000 5,184
Mercadotecnia 400 69 27,600 160,000 4,761
Intr. a la Biologa 500 81 40,500 250,000 6,561
Fund. de Jazz 600 63 37,800 360,000 3,969
Intr. a la Enfermera 800 93 74,400 640,000 8,649
Total 4,900 636 397,200 3,150,000
51,606

n(XY ) (X )(Y )
r
n (X 2

) (X ) 2 n Y 2 Y
2

8(397,200) (4,900)(636)

8(3,150,000 (4,900) 8(51,606) (636)
2 2

0.614

Coeficiente de determinacin

R2= (0.614) (0.614)


R2=0.376996

ORCCON AHUINLLA EDWARD 7


8 Correlacin y regresin lineal estadistica y probabilidades

Coeficiente de no determinacin

1-R2=1-0.376996
1-R2=0.623004

2.La siguiente tabla muestra el rango u orden obtenido en la primera


evaluacin (X) y el rango o puesto obtenido en la segunda evaluacin (Y) de 8
estudiantes universitarios en la asignatura de Estadstica. Calcular el
coeficiente de correlacin por rangos de Spearman .

Estudiant X Y
e
Diana 1 3
Elizabeth 2 4
Mario 3 1
Orlando 4 5
Matas 5 6
Josu 6 2
Anita 7 8
Luca 8 7

Solucin:
Para calcular el coeficiente de correlacin por rangos de Spearman de se llena
la siguiente tabla:

Se aplica la frmula:

Por lo tanto existe una correlacin positiva moderada entre la primera y


segunda evaluacin de los 8 estudiantes.

ORCCON AHUINLLA EDWARD 8


9 Correlacin y regresin lineal estadistica y probabilidades

2. REGRESION LINEAL
2.1 Concepto

Permite determinar el grado de dependencia de las series de valores X e Y,


prediciendo el valor y estimado que se obtendra para un valor x que no est
en la distribucin.La regresin lineal simple se basa en estudiar los cambios en
una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir
una relacin funcional entre ambas variables que puede ser establecida por
una expresin lineal, es decir, su representacin grfica es una lnea recta. Es
decir, se esta en presencia de una regresin lineal simple cuando una variable
independiente ejerce influencia sobre otra variable dependiente.

Ejemplo: Y = f(x)

Aplicaciones de la regresin lineal

Lneas de tendencia

Una lnea de tendencia representa una tendencia en una serie de datos


obtenidos a travs de un largo perodo. Este tipo de lneas puede decir si un
conjunto de datos en particular (como por ejemplo, el PBI, el precio del
petrleo o el valor de las acciones) han aumentado o decrementado en un
determinado perodo. Las lneas de tendencia son generalmente lneas rectas,
aunque algunas variaciones utilizan polinomios de mayor grado dependiendo
de la curvatura deseada en la lnea.

Industria

En la industria tiene aplicacin para investigar la relacin entre el rendimiento


de la produccin y uno o ms factores del (o de los) que depende, como la
Temperatura, la humedad ambiental, la presin, la cantidad de insumos, etc.;
con base en este anlisis se puede pronosticar el comportamiento de una
variable que se desea estimar.

2.2 ecuacin de regresin


La ecuacin de regresin es: Y' = a + bX, donde:
Y' es el valor pronosticado de la variable Y para un valor seleccionado
de X.
a es la ordenada de la interseccin con el eje Y cuando X = 0. Es el
valor estimado de Y cuando X=0

ORCCON AHUINLLA EDWARD 9


10 Correlacin y regresin lineal estadistica y probabilidades

b es la pendiente de la recta, o el cambio promedio en Y' para cada


cambio de una unidad en X.
el principio de mnimos cuadrados se utiliza para obtener a y b.

El principio de mnimos cuadrados se utiliza para obtener a y b. Las


ecuaciones para determinar a y b son:

2.3 ejercicio de aplicacin(ejemplo anterior)

Desarrolle una ecuacin de regresin para la informacin dada en el Ejemplo 1


que se puede utilizar para estimar el precio de venta basado en el nmero de
pginas.

La ecuacin de regresin es:


Y' = 48.0 + .05143X

La ecuacin cruza al eje Y en $48. Un libro sin las pginas costara $48.
La pendiente de la lnea es .05143. El costo de cada pgina adicional es
de cinco cntimos.
El signo del valor de b y el signo del valor de r sern siempre iguales.

2.4 pronosticar el valor de x estimada para cada uno de los


valores de x.
Podemos utilizar la ecuacin de regresin para estimar valores de Y.

ORCCON AHUINLLA EDWARD 10


11 Correlacin y regresin lineal estadistica y probabilidades

El precio de venta estimado de un libro de 800 pginas es $89.14,


encontrado por:

ORCCON AHUINLLA EDWARD 11

Você também pode gostar