Você está na página 1de 8

www.monografias.

com

Coeficiente de correlacin de Karl Pearson


Dado dos variables, la correlacin permite hacer estimaciones del valor de una de ellas conociendo el valor
de la otra variable.
Los coeficientes de correlacin son medidas que indican la situacin relativa de los mismos sucesos
respecto a las dos variables, es decir, son la expresin numrica que nos indica el grado de relacin
existente entre las 2 variables y en qu medida se relacionan. Son nmeros que varan entre los lmites +1 y
-1. Su magnitud indica el grado de asociacin entre las variables; el valor r = 0 indica que no existe relacin
entre las variables; los valores 1 son indicadores de una correlacin perfecta positiva (al crecer o decrecer
X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).

Para interpretar el coeficiente de correlacin utilizamos la siguiente escala:


Valor
-1
-0,9 a -0,99
-0,7 a -0,89
-0,4 a -0,69
-0,2 a -0,39
-0,01 a -0,19
0
0,01 a 0,19

Significado
Correlacin negativa grande y perfecta
Correlacin negativa muy alta
Correlacin negativa alta
Correlacin negativa moderada
Correlacin negativa baja
Correlacin negativa muy baja
Correlacin nula
Correlacin positiva muy baja

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

0,2 a 0,39
0,4 a 0,69
0,7 a 0,89
0,9 a 0,99
1

Correlacin positiva baja


Correlacin positiva moderada
Correlacin positiva alta
Correlacin positiva muy alta
Correlacin positiva grande y perfecta

a) Para datos no agrupados se calcula aplicando la siguiente ecuacin:

Ejemplo ilustrativo:
Con los datos sobre las temperaturas en dos das diferentes en una ciudad, determinar el tipo de correlacin
que existe entre ellas mediante el coeficiente de PEARSON.
X
Y

18
13

17
15

15
14

16
13

14
9

12
10

9
8

15
13

16
12

14
13

16
10

18
8

X =180
Y= 138

Solucin:
Se calcula la media aritmtica

Se llena la siguiente tabla:

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

Se aplica la frmula:

Existe una correlacin moderada


En Excel se calcula de la siguiente manera:
a) Se inserta la funcin COEF.DE.CORREL y pulsar en Aceptar. En el cuadro de argumentos de la funcin,
en el recuadro de la Matriz 1 seleccionar las celdas de X, y en el recuadro de la Matriz 2 seleccionar las
celdas de Y. Pulsar en Aceptar.

b) Para datos agrupados, el coeficiente de Correlacin de Pearson se calcula aplicando la siguiente


frmula:

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

r=

n f dx dy( fx dx )( fy dy )

[n fx dx ( fx dx ) ][ n fy dy ( fy dy) ]
2

Donde
n = nmero de datos.
f = frecuencia de celda.
fx = frecuencia de la variable X.
fy = frecuencia de la variable Y.
dx = valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo central
le corresponda dx = 0, para que se hagan ms fciles los clculos.
dy = valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo central
le corresponda dy = 0, para que se hagan ms fciles los clculos.
Ejemplo ilustrativo:
Con los siguientes datos sobre los Coeficientes Intelectuales (X) y de las calificaciones en una prueba de
conocimiento (Y) de 50 estudiantes:
N de
estudiante
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

X
76
77
78
79
79
80
80
81
82
82
83
83
83
83
84
84
84
85
85
86
86
86
86
87
88

Y
28
24
18
41
43
45
34
18
40
35
30
21
22
23
25
11
15
31
35
26
30
24
16
20
36

N de
estudiante
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

X
88
88
88
88
89
89
90
90
90
91
92
92
93
93
93
94
96
97
98
99
100
101
101
102
102

Y
40
31
35
26
30
24
18
11
15
38
34
31
33
35
24
40
35
36
40
33
51
54
55
41
45

1) Elaborar una tabla de dos variables


2) Calcular el coeficiente de correlacin
Solucin:

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

1) En la tabla de frecuencias de dos variables, cada recuadro de esta tabla se llama una celda y
corresponde a un par de intervalos, y el nmero indicado en cada celda se llama frecuencia de celda. Todos
los totales indicados en la ltima fila y en la ltima columna se llaman totales marginales o frecuencias
marginales, y corresponden, respectivamente, a las frecuencias de intervalo de las distribuciones de
frecuencia separadas de la variable X y Y.
Para elaborar la tabla se recomienda:
- Agrupar las variables X y Y en un igual nmero de intervalos.
- Los intervalos de la variable X se ubican en la parte superior de manera horizontal (fila) y en orden
ascendente.
- Los intervalos de la variable Y se ubican en la parte izquierda de manera vertical (columna) y en orden
descendente.
Para elaborar los intervalos se procede a realizar los clculos respectivos:
En la variable X:
Calculando el Rango se obtiene:

R=x m x x m n=10276=26
Calculando el nmero de intervalos se obtiene:

ni=1+3,32 log ( n )=1+3,32 log50=6


Calculando el ancho se obtiene:

R 26
i= = =4,33
6
En la variable Y:
Calculando el Rango se obtiene:

R= y m x y m n =5511=44
Calculando el nmero de intervalos se obtiene:

ni=1+3,32 log ( n )=1+3,32 log50=6


Calculando el ancho se obtiene:

R 44
i= = =7,33
6
Nota: Para la variable X se tomar un ancho de intervalo igual a 5 y para la variable Y un ancho de intervalo
igual a 8 para obtener un nmero de intervalos igual a 6 para cada variable.
Contando las frecuencias de celda para cada par de intervalos de las variables X y Y se obtiene la siguiente
tabla de frecuencias de dos variables:

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

Interpretacin:
- El nmero 5 es la frecuencia de la celda correspondiente al par de intervalos 86-90 en Coeficiente
Intelectual y 19-26 en Calificacin obtenida en la prueba de conocimiento.
- El nmero 8 en la fila de fx es el total marginal o frecuencia marginal del intervalo 76-80 en Coeficiente
Intelectual.
- El nmero 14 en la columna de fy es el total marginal o frecuencia marginal del intervalo 35-42 en
Calificacin obtenida en la prueba de conocimiento.
- El nmero 50 es total de frecuencias marginales y representa al nmero total de estudiantes.
2) Realizando los clculos respectivos se obtiene la siguiente tabla:

Nota:
Los nmeros de las esquinas de cada celda en la anterior tabla representan el producto fdxdy, as por
ejemplo, para obtener el nmero el nmero -8 de los intervalos 76-80 en X y 43-50 en Y se obtiene
multiplicando 2(-2)(2) = -8. Para obtener el nmero 6 de los intervalos 96-100 en X y 51-58 en Y se obtiene
multiplicando 123 = 6.
Los nmeros de la ltima columna (24, -2, 7, 0, 5 y 12) se obtienen sumando los nmeros de las esquinas
en cada fila, as por ejemplo, para obtener el nmero 24 se suma 6 + 18 = 24.
Los nmeros de la ltima fila (0, 5, 0, 2, 12 y 27) se obtienen sumando los nmeros de las esquinas en
cada columna, as por ejemplo, para obtener el nmero 27 se suma 18 + 6 + 3 = 27.

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

Para obtener ltimo nmero de la ltima fila se obtiene sumando los resultados de la ltima fila
(46=0+5+0+2+12+27), y tiene que ser igual al ltimo nmero de la ltima columna como comprobacin que
los clculos de la tabla han sido correctos.
Observando los datos en la tabla anterior se reemplaza los valores en la ecuacin del Coeficiente de
Correlacin de Pearson para datos agrupados se obtiene:

Existe una correlacin positiva moderada


REFERENCIAS BIBLIOGRFICAS
BENALCZAR, Marco, (2002), Unidades para Producir Medios Instruccionales en Educacin, SUREZ,
Mario
Ed. Graficolor, Ibarra, Ecuador.
DAZA, Jorge, (2006), Estadstica Aplicada con Microsoft Excel, Grupo Editorial Megabyte, Lima,
Per.
GOVINDEN, Lincoyn, (1985), Introduccin a la Estadstica, Ed. McGraw Hill. Interamericana
Editores. S.A., Bogot, Colombia.
JOHNSON, Robert, (2003), Estadstica Elemental, Ed. Math Learning, Ed. Tercera, Mxico DF.
KUBY, Patricia.
KAZMIER, J. Leonard, (1990). Estadstica Aplicada a la Administracin y la Economa,
Ed. McGrawHill, Ed. Segunda, Bogot, Colombia.
LIND, Marchal, (2005), Estadstica Aplicada a los Negocios y a la Economa, Ed. McGraw- Hill,
MASON
Ed. Dcima., Mexico DF.
MARTINEZ, Bencardino, (1981), Estadstica Comercial, Ed. Norma, Bogot, Colombia.
MORENO, Francis, (1993), Estadstica Inferencial, Universidad Particular de Loja, Loja, Ecuador.
SNCHEZ, Jess, (2007), Introduccin a la Estadstica Empresarial, Madrid, Espaa.
SALTOS, Hctor, (1986), Estadstica de Inferencia, Ed. Po XII, Ambato, Ecuador.
SHAO, Stephen, (1980), Estadstica para Economistas y Administradores de Empresas, Ed. Herrero
Hnos, Mxico DF.

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

SPIEGEL, Murray, (2000), Estadstica, Serie de Compendios Schaum, Ed. McGraw-Hill, Mxico.
SUREZ, Mario, (2004), Interaprendizaje Holstico de Matemtica, Ed. Grficas Planeta, Ibarra,
Ecuador.
STEVENSON, William, (1981), Estadstica para Administracin y Economa, Ed. Harla S.A de C.V.
Mxico D.F.
WEBSTER, Allen, (2000), Estadstica Aplicada a los Negocios y a la Economa, Ed. McGraw Hill.
Interamericana Editores S.A. Bogot, Colombia
Autor:
Mario Orlando Surez Ibujes
mgsmariosuarez@gmail.com

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

Você também pode gostar