Ejemplo completo de análisis de multicolinealidad (Parte 2)

Significatividad individual y conjunta de las variables explicativas

Ya hemos visto que en presencia de multicolinealidad imperfecta los errores estándar de estimación de los parámetros se hacen anormalmente grandes.

En esta situación los contrastes de significatividad individual tienden a fallar, aceptando como variables no significativas a variables con capacidad explicativa sobre la variable dependiente.

Esto sucede porque el estadístico de contraste se calcula dividiendo el valor estimado del parámetro en cuestión entre su varianza y si la varianza es grande el resultado de esta división se acercará a cero, convirtiéndose así en un valor razonable para la distribución t-student que seguiría si la variable no es significativa.

Para detectar esta situación tenemos dos opciones:

  1. Observar si las variables que aparecen como no significativas en el modelo están altamente correlacionadas con la variable dependiente.
  2. Observar si las variables que aparecen como no significativas en el modelo generan por si solas modelos significativos.

estimación_modelo_ahorro

En nuestro modelo si tenemos en cuenta el contraste de significatividad individual diremos que las variables tamaño e impuestos no son significativas. Incluso en el caso de la variable renta familiar no podemos rechazar la hipótesis nula de no significatividad individual. Estamos entonces ante un modelo que explica un 94,69% de la variabilidad de la variable dependiente pero no incluye ninguna variable significativa a nivel de significación 0,05.

Además, observando las correlaciones con la variable dependiente veremos que todas las variables están muy relacionadas con esta:

correlaciones con la dependiente_ ahorro

Estamos claramente ante un caso de multicolinealidad, en el que los contrastes de significatividad individual están fallando debido a los altos valores de las varianzas de los estimadores de los parámetros.

Por otro lado, si plantemos modelo que expliquen el ahorro familiar con cada una de estas variables de forma individual encontraremos modelos significativos en ambos casos.

Modelo_impuestos_ahorromodelo_tamanno_ahorro

Vemos que ambos modelos explican suficientemente la variabilidad de la variable ahorro, por lo que no podemos considerar a ninguna de estas variables como no significativa.