Você está na página 1de 21

REPBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA


EDUCACIN UNIVERSITARIA
INSTITUTO UNIVERSITARIO POLITCNICO
SANTIAGO MARINO
EXTENSIN COL-SEDE CIUDAD OJEDA

GRAFICO DE CORRELACIN

Autores
Moiss Mrquez
Anthony Durn
Rennys Pia
Ronald Urdaneta
Enrique Ekmeiro
Fernando Lugo
Daylex Hernndez
Jos Barbosa
Jos Madrid
Rubn Leal
Asesor Acadmico
Alexander Graterol

Ciudad Ojeda, 10 de Febrero del 2016.

DESARROLLO
GRFICOS DE CORRELACIN
Es una herramienta grfica que permite demostrar la relacin existente
entre dos clases de datos y cuantificar la intensidad de dicha relacin. Se
utiliza para conocer si efectivamente existe una correlacin entre dos
magnitudes o parmetros de un problema y, en caso positivo, de qu tipo es
la correlacin. El diagrama de dispersin es una herramienta de anlisis la
cual representa en forma grfica la relacin existente entre dos variables
pudiendo observar la dependencia o influencia que tiene una variable sobre
la otra, permitiendo visualizar de forma grfica su posible correlacin.
Adems conocidos tambin como grficos (x;y) es una herramienta de
anlisis utilizado generalmente en el rea de la gestin de calidad con el
objeto de encontrar las relaciones de las causas que producen un efecto. Tal
y como hemos citado en la definicin anterior el diagrama de dispersin nos
indica la relacin existente entre dos variables, y por lo tanto si traducimos
estas dos variables a grupos de datos, podemos relacionar grupos de datos
con el objeto de verificar o averiguar que existe una relacin entre ambos y
como es esta relacin de forma aproximada.

Para qu sirven los grficos de correlacin?

Observa el grado de intensidad en la relacin entre dos variables, esta


relacin puede ser entre un efecto y una de las supuestas causas que
lo producen o para ver la relacin entre dos causas que provocan un

mismo efecto.
Visualiza rpidamente cambios anmalos.
Analiza determinadas cuestiones mediante comparaciones.
Cmo se elabora?

Los pasos a seguir para construir un diagrama de dispersin son:


1. Seleccionar las 2 variables que se van relacionar.
2. Establecer una hiptesis de la posible relacin entre ambas.
3. Construir una tabla que nos relacione los valores de ambas variables
por parejas. Si no disponemos de dichos datos ser necesario realizar
una toma.
4. Dibujar el diagrama poniendo una variable en cada uno de los ejes
cartesianos (x,y) con una escala de valores que se ajuste a los datos
que se dispone.
5. Representar en el grfico cada par de valores por un punto.
6. Encontrar la correlacin analizando la tendencia de la nube de puntos
y la correlacin entre las variables.

Tipos de grficos de correlacin


Correlacin directa: La correlacin directa se da cuando al aumentar una
de las variables la otra aumenta. La recta correspondiente a la nube de
puntos de la distribucin es una recta creciente.

Correlacin inversa: La correlacin inversa se da cuando al aumentar


una de las variables la otra disminuye. La recta correspondiente a la nube de
puntos de la distribucin es una recta decreciente.

Correlacin nula: La correlacin nula se da cuando no hay dependencia


de ningn tipo entre las variables. En este caso se dice que las variables no
tienen correlacin y la nube de puntos tiene una forma redondeada.

Diagrama De Correlacin
Los beneficios que aporta la representacin de un diagrama de
correlacin es que puede proveer la relacin entre varios factores y la
respuesta de inters, por lo que nos va a ayudar a tomar decisiones con el
proceso bajo estudio y finalmente una mejora del proceso. Tiene habilidad
para describir comportamientos en respuesta a datos consistentes, comparar
diferentes grupos relacionados, y analizar posibles causa-efecto entre
variables. Este tipo de anlisis tambin puede contribuir a estimar la
magnitud de relacin entre variables y descubrir fuentes de influencia que no
haban sido bien medidos u omitidos anteriormente, por lo que esta
informacin ayuda a mejorar el sistema de medicin o el proceso.

Aunque este tipo de estudios presenta limitaciones, pues para realizar


dicho estudio se requieren conocimientos especiales para especificar el
anlisis de regresin adecuado. Algunas veces un problema encontrado al
desarrollar los modelos de regresin es la presencia de datos los
cuales su validez es cuestionable. Siempre y cuando sea posible la
validez de tales datos debe ser investigada ya que pueden influir en los
parmetros del mtodo, y por tanto en los resultados finales del
proceso.

Es

importante

simplificar

las

variables

explicativas

independientes, pues omitir una variable importante puede limitar seriamente


el modelo y utilidad de los resultados.

INTERPRETACIN DEL DIAGRAMA DE CORRELACIN


Una vez que hemos realizado el diagrama de dispersin la forma que
adquiera la nube de puntos nos permitir analizar la relacin entre las 2
variables o grupos de datos, pudiendo obtener las siguientes figuras e
interpretaciones:
-

Correlacin positiva: Se observa como la nube de puntos obtenida


adquiere una forma de recta creciente, cuando los puntos de la nube
se encuentra prximos a la recta se le conoce como fuerte, en el caso
que se encuentren distantes a la recta es conocida como dbil. Por
ejemplo: la relacin existente entre la altura y el peso de una persona
es positiva a mayor altura mayor peso.

Correlacin negativa: Al contrario del caso anterior se observa como


la nube de puntos obtenida adquiere una forma de recta decreciente,
cuando los puntos de la nube se encuentra prximos a la recta se le
conoce como fuerte, en el caso que se encuentren distantes a la recta
es conocida como dbil. Por ejemplo: la relacin existente para los
fumadores entre el nmero de paquetes de tabaco al mes y los aos
de vida es negativa dado que a mayor cantidad de tabaco fumado

menor esperanza de vida.


Correlacin compleja: La nube de puntos obtenidos adquiere forma

de curva, elipse u otra forma geomtrica.


Correlacin nula: Se observa una distribucin de la nube de puntos
con una forma circular, indicndonos la no existencia de relacin entre
ambas variables. Por ejemplo: la relacin existente entre el color de
los ojos y el tamao del pie es nula.

COEFICIENTE DE CORRELACIN
El coeficiente de correlacin sirve para medir la correlacin entre 2
variables. La ventaja que tiene este coeficiente sobre otras herramientas
para medir la correlacin, como puede ser la covarianza, es que los
resultados del coeficiente de correlacin estn acotados entre -1 y +1. Esta
caracterstica nos permite comparar diferentes correlaciones de una
manera ms estandarizada.
Coeficiente de Correlacin, Pearson

El coeficiente de correlacin es una medida de asociacin entre dos


variables y se simboliza con la literal (r). Los valores de la correlacin van de
+ 1 a - 1, pasando por el cero, el cual corresponde a ausencia de correlacin.
Los primeros dan a entender que existe una correlacin directamente
proporcional e inversamente proporcional, respectivamente.
De lo anterior referimos que:
-

+1 -1 = Correlacin perfecta.
0.95 = Correlacin fuerte.
80% = Correlacin significativa.
70% = Correlacin moderada.
50% = Existe una relacin parcial.
Las 3 grficas en coordenadas cartesianas posteriores, se muestra la

variable independiente (X) se ubica en las abscisas y la dependiente (Y) en


el eje de las ordenadas. Los coeficientes de correlacin significan esa
asociacin entre los cambios que se observan en la variable dependiente con
respecto a la variable independiente. La grfica (a) representa una
correlacin positiva, es decir, conforme los valores de X aumentan, tambin
aumentan los valores de Y. A su vez, la grfica (b) muestra una correlacin
negativa, de modo que al incrementarse los valores de la variable
independiente, los valores de la dependiente disminuyen. La grfica (c) no
indica correlacin.

El coeficiente de correlacin lineal de Pearson se define matemticamente


con la ecuacin siguiente:

Donde:
r = coeficiente de correlacin de Pearson.
xy = sumatoria de los productos de ambas variables.
x = sumatoria de los valores de la variable independiente.
y = sumatoria de los valores de la variable dependiente.
x2 = sumatoria de los valores al cuadrado de la variable independiente.
y2 = sumatoria de los valores al cuadrado de la variable dependiente.
N = tamao de la muestra en funcin de parejas.
Este procedimiento estadstico es aplicable cuando las observaciones se
miden segn una escala de intervalo, por otra parte, el fenmeno debe ser
lineal. Al igual que las otras pruebas paramtricas, la varianza de las
variables X y Y deben guardar homogeneidad.
Pasos.
-

Ordenar los valores de la variable dependiente (Y) con respecto a los

valores de la variable independiente (X).


Elevar al cuadrado cada valor X y de Y.
Obtener los productos de X y Y, para lo cual se deben multiplicar

independientemente ambos valores.


Efectuar las sumatorias x, y, x2, y2, y xy.
Calcular el tamao de la muestra en funcin de parejas de X y Y.
Aplicar la ecuacin.
Calcular los grados de libertad (gl): gl = N parejas -1.
Comparar el valor de r calculado en la tabla de valores crticos de t de

Kendall en funcin de la probabilidad.


Decidir si se acepta o rechaza la hiptesis.

Ejemplo:

Eleccin de la prueba estadstica para medir la asociacin o correlacin. Las


edades en das estn en escala de tipo intervalo, tenemos dos variables,
entonces aplicamos esta prueba.
Objetivo: Conocer que grado de asociacin existe entre la edad y peso
corporal de nios de edades desde el nacimiento hasta los 6 meses.
Hiptesis. Ha. Entre las observaciones de edad de los nios y peso corporal
existe correlacin significativa. Ho. Entre las observaciones de edad de los
nios y pero corporal no existe correlacin significativa.

Creamos ahora una grfica (hecha con el programa estadstico SPSS)


para representar la correlacin obtenida. Encontramos entonces una
correlacin positiva, es decir, conforme la edad aumenta, tambin aumenta el
peso corporal de los nios.

Coeficiente de correlacin de Spearman


(rho) es una medida de la correlacin(la asociacin o interdependencia)
entre dos variables aleatorias continuas. Para calcular , los datos son
ordenados y reemplazados por su respectivo orden.

El estadstico viene dado por la expresin:

Donde:
-

D es la diferencia entre los correspondientes estadsticos de orden


de x - y. N es el nmero de parejas.
La interpretacin de coeficiente de Spearman es igual que la

del coeficiente de correlacin de Pearson. Oscila entre -1 y +1, indicndonos


asociaciones negativas o positivas respectivamente, 0 cero, significa no
correlacin pero no independencia. La tau de Kendall es un coeficiente de
correlacin por rangos, inversiones entre dos ordenaciones de una
distribucin normal bivariante.
Los datos brutos usados en este ejemplo se ven debajo.

CI

Horas de TV a la
semana

10
6

86

10
0

28

10
0

50

99

28

10
3

28

97

20

113

12

113

110

17

El primer paso es ordenar los datos de la primera columna. Se


agregan dos columnas 'orden(i)' y 'orden(t)'

Para el orden i, se correspondern con el nmero de fila del cuadro,


para 99, orden(i) =3 ya que ocupa el 3.er lugar, ordenado de menor a
mayor
para el orden t, se debe hacer lo mismo pero ordenando por 'Horas de

TV a la semana', para no hacer otro cuadro, la secuencia ordenada


quedara
T = {0, 7, 7, 12, 17, 20, 28, 28, 28, 50}
Para este caso, el orden sera para cada elemento, respectivamente:
Orden (t) = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
Sin embargo, el valor de orden est dado por el valor promedio de sus
posiciones, as para:
-

7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.5


28 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 8
50 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10

Despus, se crean dos columnas ms, una columna "d" que muestra las
diferencias entre las dos columnas de orden y, otra columna "d 2". Esta ltima
es slo la columna "d" al cuadrado.
Despus de realizar todo esto con los datos del ejemplo, se debera
acabar con algo como lo siguiente:
CI (i)

Horas de TV a la semana (t)

orden(i)

orden(t)

d2

86

97

20

16

99

28

25

100

50

4.5

10

5.5

30.25

100

28

4.5

3.5

12.25

103

28

106

2.5

4.5

20.25

110

17

113

9.5

2.5

49

113

12

9.5

5.5

30.25

Ntese como el nmero de orden de los valores que son idnticos es la


media de los nmeros de orden que les corresponderan si no lo fueran. Los
valores de la columna d2 pueden ser sumados para averiguar d2i = 196. El
valor de n es 10. As que esos valores pueden ser sustituidos en la frmula.

De lo que resulta

SOLUCIN DEL PROBLEMA

Empresa: ENSAMBLADORA DE SILLA DE MADERA S.A

DIAGRAMA DE PROCESO

Llegada

Ensamblaj

Secado

Inspeccin
Enviar

Clasificacin

Pintur

DESCRIPCIN DEL DIAGRAMA PROCESO


Llegada. Materia prima
El ensamble. Consta de 4 a 6 sillas por cada nmero de ensamblaje
El secado. Las sillas se secan por un periodo de 24 horas
La pintura. rea donde se le aplica el color determinado a las sillas
Inspeccin. Seccin donde es puesto a prueba la silla y los detalles de
pintura y ensamblaje. Si el producto est elaborado perfectamente llevado a
la otra estacin, ya si el producto se le not una imperfeccin o algn detalle,
pues, el producto es llevado al rea correspondiente para que sea mejorado
el producto.
Clasificacin: una vez que se ha inspeccionado, el producto ya elaborado se
clasifica segn sus modelos fabricados
Enviar. Es la ltima estacin esta consiste en el distribuir los productos
finalizados, es decir, la venta de las sillas.

Notas.
Estas sillas son un producto elabora de madera de primera calidad (caoba
y cedro) donde as como la materia prima es de excelente calidad as la
fabricacin de tales sillas se realizan por expertos profesionales, donde el
producto ya finalizado es de excelente calidad. Con una durabilidad
promediad de 25 aos (teniendo en cuanta los factores que lo afecten, tales
como: el uso que la silla adquiera, la exposicin a condiciones climticas y
las tecinas de cuidado que se apliquen)

Los modelos de las sillas se mostraran en la siguiente hoja.

MODELOS DE SILLAS

Modelo #1

Modelo#2

Modelo #3

Modelo #4

Modelo#5

Modelo #6

Modelo #7

Modelo #8

EJERCICIO
En la Emsambladora de Sillas de Madera se desea aplicar un estudio de
grafico de correlacin, tal estudio se aplicara en el area de ventas y envio de
las sillas, donde los datos se observaran en la siguiente tabla.
X
23
17
25
20
18
19
22
28

Y
30
20
35
18
22
15
17
35

Nota.
Los valores de X son nuestra Variable de Independiente, Y es nuestra
variable dependiente, tengase en cuenta que los factores que modefican
nuestra V.D son el peso de las sillas y el modelo. En el cual tendre que
nuestra V.I es el peso de las sillas y la V.D es el precio de la misma.

Hallar
La media de (X;Y)
Graficar los datos e intrepetarlos
Varianza, covarianza y desviacin tpica
Recta de regresion
Coeficiente de correlacion aplicando el metodo de Pearson y
Spearman e interpretar su resultado

Grafico de Correlacin
f(x) = 1.76x - 13.73

PRECIO (BsF x 1000)

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
PESO (Kg)

Você também pode gostar