El análisis de regresión es un método estadístico utilizado para encontrar una relación entre una variable dependiente y dos o más variables independientes. Es bajo tal análisis que se puede encontrar el factor de inflación de la varianza (VIF). 

VIF refleja la multicolinealidad en un modelo de regresión. 

Explicación del factor de inflación de la varianza

El significado del factor de inflación de la varianza surge de la correlación entre variables independientes dentro de un modelo de regresión. Esta correlación conduce a resultados erróneos, considerando que el coeficiente de regresión se inflará como resultado de la multicolinealidad entre los factores subyacentes. La multicolinealidad ocurre cuando las variables independientes en un modelo de regresión están correlacionadas.

VIF entra en juego para estimar la magnitud de esta varianza inflada. El factor es indicativo de la varianza mejorada de un coeficiente de regresión que existe debido a la asociación superpuesta entre las variables independientes del modelo.

¿Para qué sirve VIF?

En estadística, la varianza mide la variabilidad en un conjunto de datos. Refleja la dispersión entre los datos desde la media de los datos (el promedio). Cuanto mayor sea la dispersión, mayor será la varianza en relación con la media. En el análisis de regresión, VIF se utiliza para estimar cuánto se infla o influye el coeficiente como resultado de variables independientes dentro del análisis.

Fórmula VIF

VIF se expresa en números. Un VIF de 1,5 significa que la varianza es un 50% superior a lo que cabría esperar si no hubiera multicolinealidad entre las variables independientes. Como regla general, si el VIF es más de 5, se dice que el análisis de regresión está altamente correlacionado. 

Tenga en cuenta que un VIF más alto significaría menos confianza en los resultados de la regresión, ya que estarían sesgados debido a la multicolinealidad. Esto se debe a que cualquier pequeño cambio en los datos podría generar cambios mayores en los coeficientes estimados debido a la correlación entre las variables independientes.

El VIF se calcula mediante la siguiente fórmula:

 

‘Ri2’ representa el coeficiente de determinación no ajustado para la regresión de la variable independiente (i) sobre las variables restantes. El recíproco de VIF se refleja en ‘Tolerancia’, que también se puede utilizar para calcular el VIF.