El coeficiente de correlación lineal

Llamamos correlación al grado de dependencia mutua entre las variables. La correlación trata, por tanto de medir la intensidad con que dos variables pueden estar relacionadas.

Coeficiente de correlación lineal calcula mediante:

r=\frac{COV(X,Y)}{\sqrt{Var(X)}*\sqrt{Var(Y)}}

El valor del coeficiente de correlación lineal siempre estará entre -1 y 1.

  • Si r=1: correlación lineal perfecta positiva y los valores teóricos coinciden con los observados, ya que todos los puntos de la nube están en la recta. Es decir, existe dependencia funcional que viene reflejada por una recta creciente.
  • Si r=-1, la correlación lineal es perfecta negativa y, aquí también, los valores teóricos coinciden con los observados, pero la recta es decreciente. De nuevo es un caso de dependencia funcional.
  • Si r=0, la correlación lineal es nula. Es decir, no hay asociación lineal y por mucho que varíe X, la variable Y no se verá afectada (de forma lineal).
  • Si -1<r<0, la correlación lineal será negativa y la recta será decreciente puesto que el signo de su pendiente coincide con el de la covarianza que es la que da el signo a r, luego al ser r negativo también lo será la pendiente.Si r es cercano a 0 diremos que la relación es débil, y cuanto más se acerque a -1 consideráremos que la relación es más fuerte.
  • Si 0<r<1, la correlación lineal es positiva. Esto indica que la recta es creciente y cuando los valores de una variable crecen lo de la otra también crecerán.

    Consideraremos también que cuanto más se acerque a 0 más débil es la relación entre las variables y si el valor es próximo a 1 la relación podrá considerarse fuerte.

    Cuando dos variables son estadísticamente independientes su covarianza es cero. Por consiguiente, si las variables son independientes, están también incorrelacionadas linealmente, al ser r=0.

    Sin embargo: Dos variables pueden estar incorrelacionadas linealmente y ser dependientes, puesto que cuando r=0 lo único que podemos decir es que la dependencia estadística lineal es nula, pero esas variables pueden depender según otro tipo de función (parabólica, exponencial, etc.)

    Además se puede demostrar la invarianza de r ante transformaciones lineales.

    Ejemplo.- 

    Calcule el coeficiente de correlación lineal para el modelo de regresión lineal simple planteado en el ejemplo 1.