Actividad de aprendizaje: selección del modelo adecuado en modelos lineales generalizados

Propósito de la actividad

El propósito de esta actividad es que el estudiante sea capaz de identificar la naturaleza de una variable dependiente y, con base en ello, seleccionar el modelo estadístico más adecuado dentro del marco de los Modelos Lineales Generalizados (GLM). Asimismo, se busca que el estudiante justifique metodológicamente su decisión y exprese en sintaxis de R el modelo correspondiente.

Instrucciones generales

A partir de los escenarios presentados a continuación, analiza cuidadosamente cada caso y responde lo siguiente:

  1. Identifica la variable dependiente.
  2. Señala qué tipo de variable es.
  3. Selecciona el modelo estadístico más adecuado.
  4. Justifica tu elección metodológica.
  5. Explica brevemente por qué no sería adecuado usar un modelo lineal clásico lm() en los casos donde no corresponda.
  6. Escribe la sintaxis en R para estimar el modelo correspondiente usando el dataset trabajado en clase (datos).

Formato de respuesta sugerido

Para cada caso responde con la siguiente estructura:

  • Variable dependiente:
  • Tipo de variable:
  • Modelo sugerido:
  • Justificación metodológica:
  • ¿Por qué no usar lm()?:
  • Sintaxis en R:

Caso 1. Índice de masa corporal

Un investigador desea analizar si el estrés, la actividad física diaria y la edad influyen en el Índice de Masa Corporal (IMC) de adultos jóvenes.

Respuesta del estudiante

  • Variable dependiente:
  • Tipo de variable:
  • Modelo sugerido:
  • Justificación metodológica:
  • ¿Por qué no usar lm()?:
  • Sintaxis en R:

Caso 2. Presencia de obesidad

Ahora el investigador no quiere analizar el valor exacto del IMC, sino únicamente si el participante presenta o no obesidad clínica, definida como:

Quiere usar como predictores el estrés, la impulsividad alimentaria y la actividad física.

Respuesta del estudiante

  • Variable dependiente:
  • Tipo de variable:
  • Modelo sugerido:
  • Justificación metodológica:
  • ¿Por qué no usar lm()?:
  • Sintaxis en R:

Caso 3. Número de snacks ultraprocesados

Se busca modelar el número de snacks ultraprocesados consumidos por semana en función del estrés y la impulsividad alimentaria.

Respuesta del estudiante

  • Variable dependiente:
  • Tipo de variable:
  • Modelo sugerido:
  • Justificación metodológica:
  • ¿Por qué no usar lm()?:
  • Sintaxis en R:

Caso 4. Tiempo diario en redes sociales

Un equipo de investigación estudia cómo el estrés y las horas de sueño influyen en el tiempo diario invertido en redes sociales, medido en minutos. Todos los participantes reportan valores positivos y la distribución presenta asimetría a la derecha.

Respuesta del estudiante

  • Variable dependiente:
  • Tipo de variable:
  • Modelo sugerido:
  • Justificación metodológica:
  • ¿Por qué no usar lm()?:
  • Sintaxis en R:

Caso 5. Episodios de comer emocional

Se analiza el número de episodios de comer emocional por semana. La mayoría de los participantes reporta pocos eventos, pero algunos sujetos presentan valores mucho más altos de lo esperado. Los predictores son estrés e impulsividad.

Respuesta del estudiante

  • Variable dependiente:
  • Tipo de variable:
  • Modelo sugerido:
  • Justificación metodológica:
  • ¿Por qué no usar lm()?:
  • Sintaxis en R:

Tabla resumen de apoyo

Completa la siguiente tabla como síntesis de tu análisis.

Caso Variable dependiente Tipo de variable Modelo sugerido Justificación breve
1
2
3
4
5

Pregunta final

Redacta una respuesta breve pero fundamentada a la siguiente pregunta:

¿Por qué en modelos lineales generalizados no basta con conocer las variables independientes, sino que también es indispensable analizar la naturaleza de la variable dependiente?

Respuesta del estudiante


Ejercicio complementario en R

Con base en el dataset trabajado en clase (datos), escribe el código necesario para estimar cada uno de los modelos seleccionados. No es necesario interpretar resultados en esta parte; el objetivo es verificar si puedes traducir correctamente una decisión metodológica a sintaxis en R.

# Caso 1


# Caso 2


# Caso 3


# Caso 4


# Caso 5