Normalidad, inferencia y bondad de ajuste (parte 3)

Estadístico de Durbin-Watson

El estadístico de Durbin-Watson nos permite contrastar la hipótesis de incorrelación entre las perturbaciones aleatorias del modelo frente a la presencia de autocorrelación. Se calcula a partir de la siguiente expresión:

DW=\frac{\sum_{i=2}^n \left( \hat{\epsilon}_i  - \hat{\epsilon}_{i-1} \right)^2}{\sum_{i=2}^n\hat{\epsilon}_i ^2}

Lo estudiaremos en profundidad cuando analicemos los problemas de autocorrelación en el modelo.

En la siguiente columna tenemos primero algunas características básicas de la variable dependiente como su media (Mean dependent var) y su cuasi desviación típica muestral (S.D. dependent var).

Criterios de información de Akaike y Schwarz

Los criterios de información de Akaike y Schwarz proporcionan un método para la elección del mejor modelo a partir de una muestra dada.

Ambos son medidas de la perdida de información que tenemos al modelizar la variable con el modelo planteado.

Se calculan a partir de las siguientes expresiones:

AIC = -2*(L/N)+2*((k+1)/N)

BIC = -2*(L/N) + (k+1)*Ln(N)/N

Siendo L el valor máximo de la función de verosimilitud, k el número de variables explicativas del modelo y N el tamaño muestral.

En nuestro ejemplo tienen valores:

AIC=-2*(-271,0014/60) + 2*(4+1)/60 = 9,20

BIC = -2*(-271,0014/60) + (4+1)*Ln(60)/60 = 9,37

Contraste de significatividad global

El contraste de significatividad global (F-statistic),  se construye para contrastar si los parámetros asociados a las variables explicativas del modelo (exceptuando el término independiente) son todos iguales a cero. Permite por tanto comprobar si el modelo es válido o debemos especificarlo de nuevo.

H_0: \beta_1 = \beta_2 = ... = \beta_k = 0

H_1: \exists \beta_i \neq 0

El estadístico del contraste es:

F=\frac{SEC/k}{SCE/(n-k-1)}=\frac{R^2/k}{(1-R^2/(n-k-1))}

Bajo la hipótesis nula, el estadístico F sigue una distribución F-Snedecor (n-1;n-k-1), de modo que la región crítica será: F>F-Snedecor (n-1;n-k);α

Este contraste puede considerarse como un modo de determinar si el coeficiente de determinación del modelo es suficientemente elevado estadísticamente como para considerar que la capacidad explicativa del modelo es adecuada.