Estimación del modelo de regresión lineal múltiple con Eviews

Ejemplo.-

Supongamos que un investigador pretende encontrar los factores que afectan al grado de estrés de los trabajadores. Esta será por tanto nuestra variable dependiente (Y) y lo mediremos mediante la tensión nerviosa.

Inicialmente nos plantearemos como variables explicativas el tamaño de la empresa en la que trabaja cada trabajador (tamanno), la antigüedad en el puesto actual, medida en años (antiguedad), el salario anual bruto (en miles) percibido por el trabajador (salario) y la edad del trabajador (edad).

Se dispone para el estudio de una muestra de 100 observaciones.

Antes de especificar el modelo debemos analizar las relaciones existentes entre las variables explicativas y la variable explicada, para confirmar si existe entre ellas una relación línea.

Para obtener los gráficos de dispersión en Eviews debemos agrupar las variables en un grupo, colocando la primera a la variable dependiente. Desde el grupo elegiremos la opción:

  Views -> Graph

Que nos llevará al siguiente cuadro de diálogo:

 

Scatterplot

Selecionando el gráfico de dispersión (Scatter plot) y la opción “Multiple graphs –First vs. All”, obtendremos los gráficos de dispersión de cada una de las variables explicativas frente a la variable dependiente.

Scatterplot_2

En nuestro caso tendremos:

matriz de correlaciones

La matriz de correlaciones muestra el coeficiente de correlación entre cada par de variables.

Nos interesa que las variables independientes estén muy relacionadas con la variable dependiente, para que puedan explicar adecuadamente su variabilidad.

Por otro lado nos interesa que las variables independientes no presenten fuertes correlaciones entre sí. Si así fuera tendríamos un problema de multicolinealidad en el modelo.

En este caso observando la matriz de correlaciones vemos que las variables más correlacionadas con el estrés son el tamaño de la empresa y el salario anual, aunque también existe cierta correlación entre el estrés y los años de trabajo en el puesto actual y la edad.

Por otro lado comprobamos que, como ya se observaba en los gráficos de dispersión, la correlación entre el estrés y todas las variables explicativas es positiva.

Entre las variables explicativas las correlaciones no son muy altas, salvo en el caso de las variables antigüedad en el puesto actual y edad, como era de esperar.

Eviews calcula los principales estadísticos descriptivos de las variables del grupo a través de su menú:

View -> Descriptive Stats -> Common Sample

estadisticos descriptivos

Plantearemos el modelo de regresión lineal:

Y_i=\beta_0 + \beta_1 X_{1i}+ \beta_2 X_{2i} + ... + \beta_K X_{Ki} + \epsilon_i

Podemos estimar el modelo  en Eviews de 3 formas distintas:

1.En los procedimientos del objeto grupo (Procs), seleccionando:

Procs -> Make Equation

2. Abriendo las variables (series) que intervienen como un objeto ecuación. En este caso, desde la ventana del Workfile, debemos seleccionar las series que intervienen en el modelo usando la tecla CTRL y con el botón derecho del ratón, hacemos doble clic en la selección y después Open Equation.

3. Seleccionando en el menú principal:

Quick -> Estimate Equation

Los tres caminos conducen al cuadro de diálogo de la especificación del modelo, que es el siguiente:

estimacion_modelo

La ecuación del modelo de regresión, puede expresarse de varias formas:

1.Como lista de variables, incluyendo primero la variable dependiente:

Ejemplo.- estres salario tamanno edad antiguedad  c

2.Como ecuación, nombrando a los coeficientes con C(1), C(2),… tal y como aparece en el título de la ventana para la especificación del modelo en el cuadro de diálogo.

Ejemplo.- estres=c(1)+c(2)*salario +(3)*tamanno+c(4)*edad+c(5)*antiguedad

Por defecto, si hemos accedido al cuadro de diálogo seleccionando previamente las variables, EViews utiliza la primera opción manteniendo el orden de la selección de las variables en el grupo e introduciendo siempre el término independiente al final.

Tras introducir la ecuación, podemos seleccionar el método de estimación.

Por defecto, EViews utiliza mínimos cuadrados ordinarios, LS – Least Squares (NLS and ARMA)

También podemos seleccionar la muestra con la que queremos que trabaje, indicando la primera observación que debe utilizar y la última. Por defecto aparecerá indicado que utilice todas las observaciones de la muestra.

El resultado de la estimación es el siguiente:

estimacion_modelo_2

En la parte superior aparece el nombre de la variable dependiente, el método de estimación empleado, la fecha y la hora de realización, el periodo muestral y el número de observaciones que abarca el mismo.

En segundo lugar encontramos la estimación de los coeficientes asociados a cada una de las variables explicativas junto con el error estándar de estimación, el contraste de significatividad individual para cada variable y la probabilidad de error de tipo I (p-valor) del mismo.

En la zona inferior hay un bloque de estadísticos de bondad de ajuste, que nos permiten evaluar parcialmente la regresión realizada.

La columna coefficient recoge el valor de los estimadores de los parámetros asociados a cada una de las variables explicativas, obtenidos en el caso de la estimación de mínimos cuadrados ordinarios, a partir de la expresión matricial:

\hat{\beta} = \left( X^t X \right)^{-1} X^t Y

Si se cumplen las hipótesis clásicas del modelo de regresión múltiple señaladas anteriormente, éstos estimadores son lineales, insesgados y óptimos (ELIO).

Estos estimadores miden la magnitud de influencia de cada variable sobre la variable dependiente, entendiendo que las demás permanecen constantes.

Podemos entender cada uno de estos coeficientes como la variación que experimenta la variable endógena ante un cambio unitario de la variable explicativa correspondiente, suponiendo que el resto de las variables permanecen constantes.

En nuestro ejemplo podemos decir que:

– Cuando la empresa en la que trabaja un individuo incluye un trabajador más, permaneciendo el resto de las variables constantes, el grado de estrés del individuo (su presión arterial) aumenta en 0,1286 unidades.

– Por cada año adicional del trabajador su presión arterial aumenta en 1,4693 y cada 1000€ más de salario anual bruto hacen subir la presión arterial del individuo en  1,3327.

– La antigüedad en el puesto también hace subir el estrés del trabajador, en caso cada año aumenta la presión arterial 0,0034 siempre teniendo en cuenta que el resto de variables permanece constante.

En esta situación la ecuación de nuestro modelo es:

ecuaciondelmodelo

Con esta ecuación podríamos predecir la presión arterial de un individuo, considerándola como la medida de su estrés, si tuviésemos la información de las 4 variables explicativas que incluye el modelo, asumiendo el modelo como válido.

El resto de la información que aparece en la pantalla del modelo nos ayudará a medir la bondad del ajuste.