El modelo de regresión lineal múltiple

El modelo de regresión múltiple tiene como objetivo explicar el comportamiento de una variable dependiente utilizando la información proporcionada por los valores de un conjunto de variables explicativas.

En este sentido, este modelo relaciona las variables explicativas con la variable explicada mediante una ecuación lineal con la siguiente estructura:

Y_i=\beta_0 + \beta_1 X_{1i}+ \beta_2 X_{2i} + ... + \beta_K X_{Ki} + \epsilon_i

Los coeficiente (parámetros) \beta_1\beta_2, …, \beta_k denotan la magnitud del efecto que las variables explicativas X_1, X_2, …, X_K tienen sobre la variable dependiente o explicada, considerando que el resto de variables permanece constante.

El coeficiente \beta_0 se denomina término constante o independiente del modelo.

El término \epsilon se denomina término de error del modelo.

Para poder aplicar el Modelo de Regresión Lineal simple se deben cumplir las siguientes hipótesis:

Hipótesis 1 (H1): La variable dependiente y las variables independientes (X_1, X_2, …, X_K) presentan una relación aleatoria y la variable dependiente es cuantitativa.

Hipótesis 2 (H2): Las variables independientes explican a la dependiente, es decir, (X_1, X_2, …, X_K) explican a Y y no al revés.

Hipótesis 3 (H3): La variable dependiente se relaciona linealmente con las variables dependientes, es decir Y se relaciona linealmente con (X_1, X_2, …, X_K).

Hipótesis 4 (H4): El modelo esta correctamente especificado, es decir:

No se omiten variables explicativas relevantes para explicar la variabilidad de Y.

No se incluyen variables explicativas superfluas para explicar la variabilidad de Y.

La muestra de datos se adecua a los requerimientos del modelo.

Hipótesis 5 (H5): Los parámetros \beta_i son constantes, lo que implica que las variaciones de Y ante cambios cada una de las X_i presentan un valor estable para las distintas muestras.

Hipótesis 6 (H6): El tamaño muestral es suficientemente grande para afrontar la estimación de los parámetros del modelo.

n >> K+1

Hipótesis 7 (H7): Las variables explicativas son deterministas, es decir, no son aleatorias y no existe incertidumbre sobre ellas. Esta hipótesis no siempre se cumple.

Un ejemplo de su incumplimiento son las series financieras donde en ocasiones es necesario incluir como variable explicativa la variable dependiente retardada.

Hipótesis 8 (H8):

Las variables explicativas son linealmente independientes entre sí. Esto garantiza que no haya variables redundantes.

Hipótesis 9 (H9):

El término error es un término completamente aleatorio que sigue una distribución normal, de esperanza 0 (E[\epsilon_i]=0).

Hipótesis 10 (H10): La varianza del error es constante a lo largo de las observaciones del modelo (Var[\epsilon_i]=\sigma^2).

Hipótesis 11 (H11): El término error no esta correlacionado entre los elementos del modelo y es independiente también de las variables explicativas.