¿Lineal o logística?

Hay cosas tan obvias que ni se plantea la alternativa. Pero luego va R. Gomila y escribe Logistic or Linear? Estimating Causal Effects of Treatments on Binary Outcomes Using Regression Analysis que se resume en lo siguiente: cuando te interese la explicación y no la predicción, aunque tu y sea binaria, usa regresión lineal y pasa de la logística.

Nota: La sección 4.2 de An Introduction to Statistical Learning de se titula precisamente Why Not Linear Regression?

Un comentario sobre “¿Lineal o logística?

  1. Emilio 14 febrero, 2020 19:38

    En algunos concursos de análisis de datos en los que la variable respuesta era dicotómica, al usar regresiones lineales para predecir se obtenían resultados muy parecidos a los de la regresión logística.

    El motivo de optar por la regresión lineal es que es mucho más rápida que la logística ( multiplicación de matrices versus método iterativo). Cuando quieres hacer muchos modelos (por ejemplo, uno por cada elemento del conjunto test y luego promediar las predicciones de alguna forma) a mí no me chirría mucho abordarlo desde la regresión lineal.

    Puedes optar por un modelo teórico que converge muy lentamente (logístico) o bien promediar modelos deficientes (lineal) que apenas cuestan calcularlos.

Los comentarios están desabilitados.