Modelo de regresión lineal simple

La regresión lineal simple es un modelo de regresión sencillo que se emplea cuando uno busca analizar la relación existente entre una variable dependiente continua y única variable independiente. Este modelo se basa en la suposición de la existencia de una relación lineal entre ambas variables, se encuentra la relación adecuada para definir una relación lineal de tal forma que los cambios sobre la variable independiente se asocian a variaciones proporcionales de la variable dependiente. Se utiliza cuando uno busca predecir o explicar una variable continua a partir de una única variable predictora. Es un modelo fácil de interpretar y visualizar, permite cuantificar la fuerza y la dirección de la relación existente entre las dos variables. Por el contrario, como desventaja se tiene que únicamente considera una variable explicativa, por lo que se pueden tener resultados incompletos si existen otros factores que influyan, además de que necesita que la relación existente sea lineal y que los residuos satisfagan los supuestos de normalidad y homocedasticidad. Ejemplo: la altura de una planta (Y) en función de la luz que le llega (X).

Modelo de regresión lineal múltiple

La regresión lineal múltiple es una extensión de la regresión lineal simple que permite estudiar la relación entre una variable dependiente continua y dos o más variables independientes. Este modelo permite observar el efecto individual de cada una de las variables explicativas de interés, además de estimar el efecto que una combinación de factores tiene sobre la variable respuesta. Se ejecuta en el momento en que se desea explicar o predecir la variable dependiente continua a partir de varios factores explicativos o independientes. Permite incorporar más variables predictoras y estudiar cuáles de ellas tiene una influencia significativa. Como desventaja se requieren cumplir con los supuestos estadísticos (no linealidad, independencia, normalidad y homocedasticidad de los residuos) y puede apreciar el fenómeno de la colinealidad si las variables explicativas se encuentran correlacionadas (relación entre las variables), lo que puede dificultar la interpretación de los coeficientes ajustados. Ejemplo: predecir el crecimiento de una especie de polilla a partir de su edad, longitud y temperatura.

Modelo de regresión logística

La regresión logística es un modelo lineal generalizado utilizado cuando la variable dependiente es binaria o categórica dicotómica. En lugar de predecir valores continuos, los resultados del modelo muestran cómo cada variable aumenta o disminuye esa probabilidad. Para interpretarlo, se pueden transformar los coeficientes en razones de probabilidades (odds ratios), que indican cuánto cambia la probabilidad del evento cuando una variable aumenta. Se usa cuando el objetivo es modelar la probabilidad de ocurrencia de un evento binario a partir de una o más variables.Permite a su vez trabajar con variables dependientes categóricas y tiene una interpretación clara de probabilidades. Puede también incorporar múltiples predictores y variables categóricas. Sin embargo, no es apropiado para variables de conteo o continuas; puede verse afectado por desequilibrio de clases (muchos ceros o pocos casos positivos), y la interpretación de los coeficientes en log-odds puede ser menos intuitiva. Ejemplo: predecir la probabilidad de que un felino tenga una enfermedad (sí/no) según su edad, índice de masa corporal y presión arterial.

Comparación entre modelos de regresión lineal simple, múltiple y logística.
Modelo Tipo_de_variable_respuesta Cuándo_se_usa Ventajas Desventajas Ejemplo
Regresión lineal simple Continua (numérica) Cuando se desea explicar una variable continua a partir de una sola variable independiente. Sencilla, fácil de interpretar y visualizar. Permite identificar la relación entre dos variables. Solo considera una variable explicativa, requiere relación lineal y supuestos de normalidad y homocedasticidad. Predecir la altura de una planta en función de la cantidad de luz que recibe.
Regresión lineal múltiple Continua (numérica) Cuando se busca predecir una variable continua a partir de varias variables independientes. Permite evaluar múltiples predictores a la vez. Puede presentar colinealidad. Predecir el crecimiento de una especie de polilla a partir de su edad, longitud y temperatura.
Regresión logística Binaria o dicotómica (0/1) Cuando se desea estimar la probabilidad de ocurrencia de un evento con una variable dependiente binaria. Adecuada para variables categóricas, ofrece interpretación de probabilidad y permite varios predictores. No apta para variables continuas o de conteo, puede ser afectada por desequilibrio de clases. Predecir la probabilidad de que un felino tenga una enfermedad según sus características.