2024-08-23

I. Descripción del Problema

Identificación del problema o fenómeno:

La obesidad es un problema de salud pública a nivel mundial que afecta tanto a la salud física como mental de las personas. Esta enfermedad no solo incrementa el riesgo de desarrollar otras condiciones médicas graves, sino que también genera un impacto significativo en la calidad de vida de los individuos. La prevalencia de la obesidad ha ido en aumento, lo que subraya la necesidad de realizar investigaciones que analicen los factores que contribuyen a este problema. Este estudio se enfoca en la descripción de los niveles de obesidad en individuos de México, Perú y Colombia, a partir de sus hábitos alimentarios y condiciones físicas, con el fin de comprender mejor los patrones existentes.

II. Especificación de objetivos

Objetivo General

Describir los niveles de obesidad en individuos de México, Perú y Colombia basado en sus hábitos alimentarios y condiciones físicas, utilizando los datos disponibles.

Objetivos Específicos

  • Identificar y describir los factores más influyentes en la prevalencia de la obesidad entre los individuos de los tres países.
  • Clasificar y caracterizar a los individuos en diferentes niveles de obesidad utilizando técnicas estadísticas descriptivas.
  • Evaluar la distribución y tendencias de los hábitos alimentarios y actividades físicas en relación con los niveles de obesidad.
  • Proporcionar un análisis descriptivo que pueda servir como base para futuras investigaciones o intervenciones en los países analizados.

Descripción de los Datos

Método de recopilación de datos:

El conjunto de datos utilizado en este estudio contiene información relevante de 2,111 individuos de México, Perú y Colombia, recopilados tanto de forma directa como sintética. Los datos incluyen 17 atributos, de los cuales algunos son de carácter continuo y otros son categóricos. Los atributos principales incluyen edad, género, altura, peso, antecedentes familiares de sobrepeso, consumo de alimentos altos en calorías, frecuencia de consumo de vegetales, número de comidas principales al día, consumo entre comidas, hábito de fumar, consumo de agua, monitoreo de calorías, actividad física, uso de dispositivos tecnológicos, consumo de alcohol y transporte habitual. La variable objetivo es el nivel de obesidad, clasificado en siete categorías diferentes. (vea aquí).

## # A tibble: 2,111 × 17
##      Age Gender Height Weight CALC       FAVC   FCVC   NCP SCC   SMOKE  CH2O
##    <dbl> <chr>   <dbl>  <dbl> <chr>      <chr> <dbl> <dbl> <chr> <chr> <dbl>
##  1    21 Female   1.62   64   no         no        2     3 no    no        2
##  2    21 Female   1.52   56   Sometimes  no        3     3 yes   yes       3
##  3    23 Male     1.8    77   Frequently no        2     3 no    no        2
##  4    27 Male     1.8    87   Frequently no        3     3 no    no        2
##  5    22 Male     1.78   89.8 Sometimes  no        2     1 no    no        2
##  6    29 Male     1.62   53   Sometimes  yes       2     3 no    no        2
##  7    23 Female   1.5    55   Sometimes  yes       3     3 no    no        2
##  8    22 Male     1.64   53   Sometimes  no        2     3 no    no        2
##  9    24 Male     1.78   64   Frequently yes       3     3 no    no        2
## 10    22 Male     1.72   68   no         yes       2     3 no    no        2
## # ℹ 2,101 more rows
## # ℹ 6 more variables: family_history_with_overweight <chr>, FAF <dbl>,
## #   TUE <dbl>, CAEC <chr>, MTRANS <chr>, NObeyesdad <chr>

Tamaño de muestra:

El tamaño de la muestra en el archivo que se descargó es de 2111 registros. Esto significa que el conjunto de datos contiene información sobre 2111 individuos de Perú, México y Colombia.

La base de datos contiene 2111 datos.

Variables a tratar:

Variables Cualitativas

Variable Tipo Descripción
Gender Nominal Género.
FAVC Nominal Binario Consumo frecuente de alimentos altos en calorías.
SCC Nominal Binario Monitoreo de calorías.
SMOKE Nominal Binario Hábito de fumar.
family_history_with_overweight Nominal Binario Historial familiar con sobrepeso.

Variables Cualitativas

Variable Tipo Descripción
CAEC Nominal Categórico Consumo de alimentos entre comidas.
CALC Nominal Categórico Frecuencia de consumo de alcohol.
MTRANS Nominal Categórico Transporte habitual.
NObeyesdad Nominal Categórico Nivel de obesidad.

Variables Cuantitativas

Variable Tipo Descripción
Age Continua Numérica Edad.
Height Continua Numérica Altura.
Weight Continua Numérica Peso.
CH2O Continua Consumo de agua al día.

Variables Cuantitativas

Variable Tipo Descripción
FAF Continua Frecuencia de actividad física.
TUE Continua Tiempo de uso de dispositivos tecnológicos.
FCVC Discreta Frecuencia de consumo de vegetales.
NCP Discreta Número de comidas principales al día.

Formulación de preguntas de investigación:

  1. ¿Cuáles son los factores más determinantes en la prevalencia de la obesidad en individuos de México, Perú y Colombia?

  2. ¿Qué relación existe entre el consumo de alimentos altos en calorías y los diferentes niveles de obesidad en la muestra?

  3. ¿Cómo se distribuye el monitoreo de calorías entre los diferentes niveles de obesidad?

  4. ¿Qué patrones de actividad física y consumo de agua son observables en los individuos clasificados en diferentes niveles de obesidad?

  5. ¿Qué características en los hábitos alimentarios y de actividad física son comunes en los diferentes niveles de obesidad?

Crítica de datos

Evaluaremos la calidad de los datos, verificando si hay datos perdidos en nuestra muestra:

library(dplyr)
Obesidad %>% is.na() %>% sum()
## [1] 0

No hay datos nulos.

Obesidad %>% is.na() %>% colSums()

No hay variables con datos nulos.

Pregunta 1

¿Cuáles son los factores más determinantes en la prevalencia de la obesidad en individuos de México, Perú y Colombia?

Variable Elegida: Historial Familiar de Sobrepeso (family_history_with_overweight)

. Por qué Elegí Esta Variable:

El historial familiar de sobrepeso es un factor clave porque puede reflejar tanto predisposición genética como hábitos compartidos en el hogar que podrían influir en los niveles de obesidad. Es relevante comparar esta variable con NObeyesdad para entender cómo los antecedentes familiares pueden estar relacionados con la obesidad.

Gráfico de Barras Horizontales Agrupadas

library(ggplot2)
ggplot(Obesidad, aes(y = family_history_with_overweight, 
                     fill = NObeyesdad)) +
  geom_bar(position = "dodge") +
  labs(title = "Historial Familiar de Sobrepeso vs Nivel de Obesidad",
       y = "Historial Familiar de Sobrepeso",
       x = "Frecuencia Absoluta",
       fill = "Nivel de Obesidad") +
  scale_fill_manual(values = c("#FBB4AE", "#B3CDE3", "#CCEBC5", 
                               "#DECBE4", "#FED9A6", "#FFFFCC", 
                               "#E5D8BD")) +
  theme_minimal() +
  coord_flip()

Interpretación: El gráfico muestra que las personas con un historial familiar de sobrepeso tienen más probabilidades de estar en niveles más altos de obesidad. Esto indica que tanto los factores genéticos como los hábitos familiares pueden ser determinantes en la prevalencia de la obesidad.

En resumen el historial familiar de sobrepeso es un factor determinante importante en la obesidad, lo que sugiere que las intervenciones deben considerar tanto los aspectos genéticos como los comportamientos familiares para ser efectivas.

Pregunta 2

¿Qué relación existe entre el consumo de alimentos altos en calorías y los diferentes niveles de obesidad en la muestra?

Variable Elegida: Frecuencia de Consumo de Alimentos Altos en Calorías (FAVC)

. Por qué Elegí Esta Variable:

El consumo de alimentos altos en calorías está directamente relacionado con la ingesta calórica diaria, que es un factor clave en la ganancia de peso. Analizar cómo esta variable se relaciona con NObeyesdad nos permite entender cómo los hábitos alimenticios impactan los diferentes niveles de obesidad.

Diagrama de Pareto

library(ggplot2)
library(dplyr)
favc_frecuencias <- Obesidad %>%
  group_by(FAVC) %>%
  summarise(Frecuencia_Absoluta = n()) %>%
  arrange(desc(Frecuencia_Absoluta))

ggplot(favc_frecuencias, aes(y = reorder(FAVC, Frecuencia_Absoluta), 
                             x = Frecuencia_Absoluta, fill = FAVC)) +
  geom_bar(stat = "identity") +
  geom_line(aes(x = cumsum(Frecuencia_Absoluta)), 
            color = "red", group = 1) +
  geom_point(aes(x = cumsum(Frecuencia_Absoluta)), 
             color = "red", size = 2) +
  coord_flip() +
  labs(title = "Diagrama de Pareto para el Consumo de Alimentos 
       Altos en Calorías",
       x = "Frecuencia Absoluta",
       y = "Frecuencia de Consumo") +
  scale_fill_manual(values = c("#FBB4AE", "#B3CDE3", "#CCEBC5", 
                               "#DECBE4", "#FED9A6", "#FFFFCC", 
                               "#E5D8BD")) +
  theme_minimal()

Interpretación: El diagrama muestra que un alto porcentaje de la población consume alimentos calóricos con frecuencia. Las categorías más frecuentes de consumo están altamente correlacionadas con los niveles más altos de obesidad.

En resumen el consumo frecuente de alimentos altos en calorías es un factor crítico en la obesidad, lo que sugiere que la reducción de este tipo de alimentos en la dieta podría ser una estrategia efectiva para combatir la obesidad.

Pregunta 3

¿Cómo se distribuye el monitoreo de calorías entre los diferentes niveles de obesidad?

Variable Elegida: Monitoreo de Calorías (SCC)

. Por qué Elegí Esta Variable:

El monitoreo de calorías refleja el control consciente sobre la ingesta calórica diaria. Analizar cómo esta variable se distribuye entre los diferentes niveles de obesidad puede indicar si el control calórico es una estrategia efectiva para mantener un peso saludable.

Gráfico de Barras Verticales Agrupadas

library(ggplot2)
library(dplyr)
ggplot(Obesidad, aes(x = SCC, fill = NObeyesdad)) +
  geom_bar(position = "dodge") +
  labs(title = "Monitoreo de Calorías por Nivel de Obesidad",
       x = "Monitoreo de Calorías (SCC)",
       y = "Frecuencia Absoluta",
       fill = "Nivel de Obesidad") +
  scale_fill_manual(values = c("#FBB4AE", "#B3CDE3", "#CCEBC5", 
                               "#DECBE4", "#FED9A6", "#FFFFCC", 
                               "#E5D8BD")) +
  theme_minimal()

Interpretación: El gráfico indica que las personas en los niveles más altos de obesidad tienden a monitorear menos sus calorías. Esto sugiere que una falta de monitoreo calórico podría estar relacionada con un mayor riesgo de obesidad.

En resumen fomentar el monitoreo de calorías podría ser una herramienta útil en la gestión y prevención de la obesidad, ya que parece estar menos presente en los individuos con mayor obesidad.

Pregunta 4

¿Qué patrones de actividad física y consumo de agua son observables en los individuos clasificados en diferentes niveles de obesidad?

Variable Elegida: Frecuencia de Actividad Física (FAF) y Consumo de Agua (CH2O)

Por qué Elegí Esta Variable:

. Frecuencia de Actividad Física (FAF):

La actividad física es un componente crucial en la gestión del peso y la prevención de la obesidad. Al evaluar cómo la frecuencia de la actividad física varía entre los diferentes niveles de obesidad, podemos obtener información valiosa sobre cómo el ejercicio o la falta del mismo puede influir en la acumulación de peso.

. Consumo de Agua (CH2O):

El consumo de agua es otro factor importante en la salud general y el control del peso. La hidratación adecuada no solo es esencial para el funcionamiento óptimo del cuerpo, sino que también puede influir en la regulación del apetito y el metabolismo. Analizar esta variable junto con la actividad física proporciona una visión más completa de los hábitos de salud de los individuos.

Gráfico de Barras para la Media del Consumo de Agua

library(ggplot2)
library(dplyr)
library(tidyr)

habitos <- Obesidad %>%
  group_by(NObeyesdad) %>%
  summarise(FAF_media = mean(FAF, na.rm = TRUE),
            CH2O_media = mean(CH2O, na.rm = TRUE))

habitos_largo <- habitos %>%
  pivot_longer(cols = c(FAF_media, CH2O_media),
               names_to = "Hábito",
               values_to = "Media_Valor") %>%
  mutate(Hábito = recode(Hábito,
                         FAF_media = "Frecuencia de Actividad Física",
                         CH2O_media = "Consumo de Agua"))

ggplot(habitos_largo, aes(x = NObeyesdad, y = Media_Valor, fill = Hábito)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Relación entre Nivel de Obesidad, Frecuencia 
       de Actividad Física y Consumo de Agua",
       x = "Nivel de Obesidad",
       y = "Media del Valor",
       fill = "Hábito") +
  scale_fill_manual(values = c("Frecuencia de Actividad Física" = "#FBB4AE", 
                               "Consumo de Agua" = "#B3CDE3")) +  # Colores pastel
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 15, hjust = 1))

consumo_agua_media <- Obesidad %>%
  group_by(NObeyesdad) %>%
  summarise(CH2O_media = mean(CH2O, na.rm = TRUE))

ggplot(consumo_agua_media, aes(x = NObeyesdad, 
                               y = CH2O_media, 
                               fill = NObeyesdad)) +
  geom_bar(stat = "identity") +
  labs(title = "Media del Consumo de Agua por Nivel de Obesidad",
       x = "Nivel de Obesidad",
       y = "Consumo Medio de Agua (litros)") +
  scale_fill_manual(values = c("#FBB4AE", "#B3CDE3", "#CCEBC5", 
                               "#DECBE4", "#FED9A6", "#FFFFCC", 
                               "#E5D8BD")) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 15, hjust = 1))

Interpretación: El gráfico de barras agrupadas muestra las medias de la frecuencia de actividad física y el consumo de agua para cada nivel de obesidad. De este gráfico se puede observar cómo la frecuencia de actividad física tiende a disminuir a medida que aumenta el nivel de obesidad, lo que sugiere que las personas con mayor obesidad tienden a realizar menos actividad física. En cuanto al consumo de agua, las diferencias entre los niveles de obesidad no son tan marcadas, lo que sugiere que, aunque importante, el consumo de agua no muestra una relación tan fuerte con la obesidad como la actividad física.

Conclusión: La baja frecuencia de actividad física está claramente asociada con niveles más altos de obesidad, subrayando la importancia del ejercicio regular en la prevención y el manejo de la obesidad. Por otro lado, aunque el consumo de agua es crucial para la salud, su relación con los niveles de obesidad no es tan evidente en este análisis. Estos resultados sugieren que las estrategias para combatir la obesidad deben centrarse en fomentar la actividad física regular, sin descuidar la promoción de una hidratación adecuada como parte de un estilo de vida saludable.

Pregunta 5

¿Qué características en los hábitos alimentarios y de actividad física son comunes en los diferentes niveles de obesidad?

Variable Elegida: Consumo de Vegetales (FCVC) y Consumo de Agua (CH2O)

. Por qué Elegí Esta Variable:

Estos hábitos alimentarios son indicativos de una dieta saludable. Analizar cómo estos hábitos se relacionan con NObeyesdad permite entender si las personas con menor obesidad siguen patrones dietéticos más saludables.

Gráfico de Barras Horizontales Agrupadas

library(ggplot2)
library(dplyr)
library(tidyr)
habitos <- Obesidad %>%
  group_by(NObeyesdad) %>%
  summarise(FCVC_media = mean(FCVC, na.rm = TRUE),
            CH2O_media = mean(CH2O, na.rm = TRUE))
habitos_largo <- habitos %>%
  pivot_longer(cols = c(FCVC_media, CH2O_media),
               names_to = "Hábito",
               values_to = "Media_Consumo") %>%
  mutate(Hábito = recode(Hábito,
                         FCVC_media = "Consumo de Vegetales",
                         CH2O_media = "Consumo de Agua"))
ggplot(habitos_largo, aes(y = NObeyesdad, 
                          x = Media_Consumo, 
                          fill = Hábito)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Hábitos Alimentarios por Nivel de Obesidad",
       x = "Media de Consumo",
       y = "Nivel de Obesidad",
       fill = "Hábito Alimentario") +
  scale_fill_manual(values = c("Consumo de Vegetales" = "#FBB4AE", 
                               "Consumo de Agua" = "#B3CDE3")) +  
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 0, hjust = 1))

Interpretación: El gráfico muestra que los niveles más bajos de obesidad están asociados con un mayor consumo de vegetales y agua, mientras que estos hábitos disminuyen en los niveles más altos de obesidad. Promover una dieta saludable y una buena hidratación podría ser clave para la prevención y el control de la obesidad.

En Conclusión

A partir de las comparaciones realizadas entre diversas variables y el nivel de obesidad (NObeyesdad), se han identificado los siguientes puntos principales:

1. Historial Familiar de Sobrepeso:

Existe una clara relación entre tener un historial familiar de sobrepeso y niveles más altos de obesidad. Esto sugiere que tanto los factores genéticos como los hábitos compartidos dentro de las familias juegan un papel importante en la predisposición a la obesidad.

2. Consumo de Alimentos Altos en Calorías:

El análisis mostró que un alto consumo de alimentos ricos en calorías está estrechamente relacionado con mayores niveles de obesidad. Este hallazgo subraya la importancia de abordar los hábitos alimenticios en las estrategias de prevención y tratamiento de la obesidad.

3. Monitoreo de Calorías:

La frecuencia de monitoreo de calorías disminuye a medida que aumenta el nivel de obesidad, indicando que las personas con obesidad severa son menos propensas a controlar su ingesta calórica. Fomentar el monitoreo regular de calorías podría ser una estrategia útil para el control de peso.

4. Frecuencia de Actividad Física y Consumo de Agua:

La frecuencia de actividad física tiende a disminuir a medida que aumenta el nivel de obesidad, lo que sugiere que las personas con mayor obesidad realizan menos actividad física, contribuyendo a la acumulación de peso. Por otro lado, el consumo de agua no muestra una relación tan marcada con los niveles de obesidad, aunque la hidratación adecuada sigue siendo importante para la salud general.

5. Hábitos Alimentarios (Vegetales y Agua):

Los individuos que consumen más vegetales y agua tienden a tener niveles más bajos de obesidad. Esto resalta la importancia de una dieta balanceada y rica en nutrientes para la prevención de la obesidad.

Por lo tanto, el análisis realizado muestra que la obesidad es un fenómeno multifactorial influenciado por una combinación de factores genéticos, hábitos alimentarios, y comportamientos relacionados con el estilo de vida, como la actividad física, la hidratación y el monitoreo de la dieta. Estos hallazgos subrayan la necesidad de intervenciones integrales que incluyan la promoción de hábitos alimentarios saludables, la práctica regular de actividad física, el control de la ingesta calórica, y la consideración de factores familiares en la prevención y tratamiento de la obesidad.