Guía de análisis de regresión

Guía completa de análisis de regresión. Aprende cómo funciona la regresión lineal, cómo interpretar la pendiente y la intersección, R² y más.

¿Qué es el análisis de regresión?

El análisis de regresión es un método estadístico que examina la relación entre una variable dependiente (respuesta) y una o más variables independientes (predictoras). La regresión lineal simple modela una relación lineal entre dos variables: y = a + bx, donde a es la intersección, b es la pendiente, y x es la variable predictora. La regresión ayuda a cuantificar la fuerza y dirección de las relaciones, hacer predicciones e identificar qué factores influyen más en un resultado.

Interpretación de pendiente e intersección

La pendiente (b) indica cuánto cambia y por cada aumento unitario en x. Una pendiente de 2.5 significa que y aumenta 2.5 unidades por cada unidad que aumenta x. La intersección (a) es el valor predicho de y cuando x es cero. En muchos contextos, la intersección puede no tener un significado práctico (por ejemplo, predecir el peso cuando la altura es cero). Siempre interpreta los coeficientes en el contexto de tus datos y ten cuidado de extrapolar más allá del rango observado de x.

R-cuadrado: bondad de ajuste

R-cuadrado (R²) mide la proporción de varianza en la variable dependiente que es explicada por las variables independientes. Un R² de 0.85 significa que el 85% de la variación en y es explicada por el modelo. Un R² más alto generalmente indica un mejor ajuste, pero no garantiza que el modelo sea correcto. Agregar más variables siempre aumenta R², así que el R² ajustado penaliza por variables adicionales que no mejoran el modelo sustancialmente. Siempre examina los residuos además de R² para verificar los supuestos del modelo.

Supuestos y diagnósticos

La regresión lineal asume: linealidad (la relación verdadera es lineal), independencia de errores, homocedasticidad (varianza constante de los errores), normalidad de los errores y no multicolinealidad (para regresión múltiple). Verifica estos supuestos graficando residuos contra valores predichos (busca patrones), creando un gráfico Q-Q de residuos (busca desviaciones de la normalidad) y calculando factores de inflación de varianza (VIF) para detectar multicolinealidad. Violar estos supuestos puede hacer que las estimaciones de coeficientes sean sesgadas o ineficientes.

Calculadoras Relacionadas