¿Lineal o logística?

Hay cosas tan obvias que ni se plantea la alternativa. Pero luego va R. Gomila y escribe Logistic or Linear? Estimating Causal Effects of Treatments on Binary Outcomes Using Regression Analysis que se resume en lo siguiente: cuando te interese la explicación y no la predicción, aunque tu y sea binaria, usa regresión lineal y pasa de la logística.

Nota: La sección 4.2 de An Introduction to Statistical Learning de se titula precisamente Why Not Linear Regression?

Un comentario sobre “¿Lineal o logística?

  1. Emilio 14 febrero, 2020 19:38

    En algunos concursos de análisis de datos en los que la variable respuesta era dicotómica, al usar regresiones lineales para predecir se obtenían resultados muy parecidos a los de la regresión logística.

    El motivo de optar por la regresión lineal es que es mucho más rápida que la logística ( multiplicación de matrices versus método iterativo). Cuando quieres hacer muchos modelos (por ejemplo, uno por cada elemento del conjunto test y luego promediar las predicciones de alguna forma) a mí no me chirría mucho abordarlo desde la regresión lineal.

    Puedes optar por un modelo teórico que converge muy lentamente (logístico) o bien promediar modelos deficientes (lineal) que apenas cuestan calcularlos.

Comenta

Your email address will not be published.

Puedes usar estas etiquetas y atributos de HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.