Você está na página 1de 3

10 DUDAS FRECUENTES QUE NUNCA NOS ANIMAMOS A PREGUNTAR

F. Penna; H. Cobos , S. Vzquez Ferrero & C. Ulagnero

10 DUDAS FRECUENTES QUE NUNCA


NOS ANIMAMOS A PREGUNTAR

Regresin y Correlacin lineal


simple

1.- Un coeficiente de correlacin significativo implica que entre las


variables X e Y existe una relacin causa efecto?
No!, en absoluto. Indica solamente que X e Y covaran; pero puede ser que
covaren simplemente por efecto de una tercera variable.
Por ejemplo, el nmero de canas y la presin arterial covaran no porque
una cause la otra sino por efecto de una tercera variable, que es la edad.

2.- Un coeficiente de correlacin no significativo implica que entre las


variables no existe una relacin causa efecto?
No necesariamente. Si no estn relacionadas es evidente que una no es causa
de la otra; pero puede ocurrir que exista relacin y no la detectemos en el
estudio por falta de informacin (por ejemplo, por un bajo tamao muestral) o
que la relacin exista pero no sea lineal.

3.- Un coeficiente de correlacin cero (o prximo a cero) implica que las


variables X e Y son independientes?
No. Lo recproco s es cierto: cuando dos variables son independientes el
coeficiente de correlacin de Pearson es cero; pero puede ser cero y que las
variables estn relacionadas segn otro modelo.

4.- Podemos fiarnos de una publicacin en la que aparece una recta de


regresin y no incluye ni el coeficiente de correlacin ni el coeficiente de
determinacin?
Podemos fiarnos, pero no es recomendable dada la insuficiencia de la
informacin presentada ya que no sabemos el poder explicativo del modelo: es
decir, qu porcentaje de puntos de la nube covarianza vienen bien
representados por dicho modelo.

1
10 DUDAS FRECUENTES QUE NUNCA NOS ANIMAMOS A PREGUNTAR
F. Penna; H. Cobos , S. Vzquez Ferrero & C. Ulagnero

5.- Un modelo de regresin lineal con alto valor explicativo (R2 prximo al
100%), es un buen modelo de prediccin?
Lo contrario s es cierto: si no tiene alto poder explicativo no es bueno para
predecir; pero puede tener alto poder explicativo y no ser bueno en la
prediccin debido a que el modelo se estudia en un rango de valores
delimitado y fuera de ese rango la relacin podra ser diferente.
Por ejemplo, para unas dosis determinadas de cierto fertilizante puede existir
un modelo lineal que explique adecuadamente la relacin entre la cantidad de
un nutriente y el crecimiento de una planta; pero si aumentamos
indefinidamente la dosis, la planta no crecer infinitamente (como
predeciramos con el modelo lineal) sino que podra incluso detener su
crecimiento, revertirlo y hasta morir.

6.- Por qu en las publicaciones se usa el coeficiente de correlacin en vez


de la covarianza, cuando en los textos de estadstica siempre se explica
primero la covarianza?
La covarianza es el estadstico que captura realmente la informacin acerca de
la relacin lineal entre las variables pero no est acotada y conserva las
unidades de medida de las dos variables, lo que hace difcil su interpretacin.
Por el contrario, el coeficiente de correlacin de Pearson recoge toda la
informacin capturada por la covarianza y, adems, es adimensional y est
acotado. Todo esto facilita considerablemente la interpretacin y es la razn
por la que es mucho ms utilizado en las publicaciones. Sin embargo, a nivel
didctico no tiene sentido explicar el coeficiente de correlacin sin haber
explicado la covarianza.

7.- Es lo mismo el coeficiente de correlacin que el coeficiente de


regresin?
No. Ambos se calculan a partir de la covarianza y tienen, por lo tanto, el
mismo signo pero transmiten informacin muy diferente.
El coeficiente de correlacin se calcula como la covarianza dividida por el
producto de las desviaciones estndar de las dos variables y se utiliza para
decidir si hay relacin lineal entre las variables, de qu tipo es (directa o
inversa) y qu magnitud tiene.
El coeficiente de regresin se calcula como la covarianza dividida por la
varianza de la variable independiente y se interpreta como el incremento (o
decremento) dado en la variable dependiente por cada incremento unitario en
la variable independiente.

8.- Una nube de puntos muy dispersa puede llevar asociado un coeficiente
de correlacin significativo?
S. Un coeficiente de correlacin significativo slo dice que existen indicios
suficientes para suponer que la relacin dada no es azarosa; pero esto no
equivale a afirmar que ser posible encontrar un buen modelo que nos
permita estimar la variable dependiente a partir del conocimiento de la
variable independiente.

2
10 DUDAS FRECUENTES QUE NUNCA NOS ANIMAMOS A PREGUNTAR
F. Penna; H. Cobos , S. Vzquez Ferrero & C. Ulagnero

9.- Puede ocurrir que al estudiar la relacin de una variable X1 con una
variable Y resulte significativa, al estudiar la relacin entre X2 e Y,
tambin sea significativa y al estudiar la relacin entre X1 y X2 e Y,
alguna de las dos variables X aparezca como no significativa?
Lamentablemente, s. Si X1 y X2 estn relacionadas entre s, una de las dos
(por ejemplo X2) aparecera como no significativa ya que no aportara
informacin diferente de la ya capturada al estudiar la relacin entre Y y la
variable X1.

10.- Puede ocurrir que, si las variables explicativas X1 y X2 estn


fuertemente relacionadas entre s, al estudiar el modelo de regresin que
relaciona Y con X1 y con X2 aparezca un signo para el coeficiente de
regresin contrario al real?
Lamentablemente, s. Cuando las variables explicativas estn fuertemente
relacionadas se dice que hay colinealidad. En presencia de colinealidad
pueden aparecer como no significativas variables que s estn realmente
relacionadas con la respuesta; y puede ocurrir que el signo que aparezca en el
modelo de regresin sea el contrario al esperado. Es debido a esto la
importancia de controlar la colinealidad.

Você também pode gostar