La obesidad es un problema de salud pública en Colombia que está afectando a más de la mitad de la población colombiana (56,4%) centrándose principalmente en los departamentos de Amazonas, Vichada, Guainía y Meta. De acuerdo con el Ministerio de Salud esto se debe a causas como la mala alimentación y el sedentarismo en los hogares. Para determinar los grupos poblacionales con mayor vulnerabilidad de padecer sobrepeso y obesidad en una región de Colombia se entrevistaron a 110 personas de diferentes géneros y edades entre 12-102 años teniendo en cuenta la distribución de la obesidad por edades, géneros, índice de masa corporal, altura y peso de cada individuo. Cabe aclarar que los datos presentes en esta investigación fueron tomados del sitio oficial de Kaggle y se les ha otorgado un contexto para su mejor interpretación.
Realizar un análisis estadístico descriptivo de los datos recolectados en una muestra acerca de la obesidad en una región de Colombia en el periodo de Mayo del 2023.
El índice de masa corporal (IMC) es un método utilizado para estimar la cantidad de grasa corporal que tiene una persona, y determinar por tanto si el peso está dentro del rango normal, o por el contrario, se tiene sobrepeso o delgadez. Para ello, se pone en relación la estatura y el peso actual del individuo. Esta fórmula matemática fue ideada por el estadístico belga Adolphe Quetelet, por lo que también se conoce como índice de Quetelet o Body Mass Index (BMI). Se establece los siguientes rangos para determinar la categoria del IMC:Bajo peso<20, Sobrepeso >25 y <28.9, Peso normal 21-25, Obsesidad >28.9.
| VARIABLES | MEDIA | MEDIANA | DESVIACIÓN | VARIANZA | C.V |
|---|---|---|---|---|---|
| Edad | 46.55556 | 42.5 | 24.720620 | 611.1090 | 53.09918 |
| Altura | 166.57407 | 175.0 | 175.000000 | 776.9384 | 16.73347 |
| Peso | 59.49074 | 55.0 | 28.856233 | 832.6822 | 48.50542 |
| IMC | 20.54907 | 21.2 | 7.583818 | 57.5143 | 36.90589 |
Del contenido de la tabla se puede observar que el promedio de la población de la muestra, presentan caracteristicas que se asocian con la etiqueta de peso normal, cabe aclarar, que la media es un indicador de tendencia central que se puede afectar facilmete por la presencia de datos atipicos, esto lo podemos evidenciar con ayuda de la mediana la cual es mas precisa cuando se quiere buscar el centro de los datos.
Se evidencio que en la variable altura se presenta una mayor diferencia entre la media y la mediana lo que nos puede indicar que hay poca simetria en los datos, ademas si tenemos en cuenta su desviación estandar podemos decir que los datos se encuentran mas dispersos con respecto a la media, lo que puede suponer la presencia de un sesgo. De nuestras variables analizadas se contempla por medio de las medidas de tendencia central y de dispersión que la variable que presenta una mayor simetria es el indice de masa corporal (IMC).
Para observar mejor el comportamiento de los datos de la variables Peso e IMC se realizo un diagrama de densidad de frecuencia logrando asi visualizar la simetria o el tipo de asimetria presente en los datos.
| Variable | curtosis | C.Asimetria |
|---|---|---|
| Peso | 2.028601 | 0.1933355 |
| IMC | 2.599249 | -0.2799554 |
En ambos histogramas de densidad de frecuencias se presentaron sesgos de acuerdo al coeficiente de asimentria (ver tabla 2), en la Fig. 1 se da una sesgo positivo donde se aprecia que la mayoria de las personas pesan entre 30-80 kg y muy pocas tienen un peso mayor a 80 kg, ademas, respecto al indice de masa corporal de la muestra (Ver Fig.2) se evidencia un sesgo leve que es negativo, indicando que la mayoria de las personas tienen un IMC de 21.2 que se asocia a un Peso normal, con una menor concentración en IMC menores a 21.2. La distribuciones tienen una curtosis menor a 3 indicando una distribución platicurtica donde los datos estan menos concentrados alrededor de la media y se distribuyen a lo largo del rango, es decir dandose mayor dispersión entre los datos. Ademas, el grafico de IMC presenta un comportamiento mas simetrico que el peso, ya que, el valor de la curtosis es 2.5 estando mas cercano a 3, lo cual muestra concordancia con el comportamiento del analisis de tendencia central.
El gráfico de barras proporciona una representación visual de la frecuencia del género de los participantes en el estudio sobre la obesidad. En este gráfico, los participantes se dividen en dos categorías principales segun la muestra: “male” (hombres) y “female” (mujeres). De este grafico cabe resaltar que se obtuvieron con mayor frecuencia datos provenientes de hombres, del mismo modo se realizo el estudio de la frecuencia de las etiquetas que se asignaron para la clasificación respecto al peso,IMC, edad y altura de las personas en estudio y del grafico (ver Fig.4) se puede decir que la mayor parte de las personas se categorizan como de peso bajo y no se presenta con tanta frecuencia un caso de obesidad en la muestra recolectada. Cabe aclarar que el hecho de que se clasifiquen con mayor frecuencia los individuos con la etiqueta de peso bajo (Underweight) puede generar cierta discrepancia en los análisis hechos anteriormente, sin embargo se debe tener en cuenta que el análisis previo fue realizado bajo el criterio de las caracteristicas promedio y de la mediana.
Para complementar este análisis descriptivo se elaboro un diagrama de cajas y alambres para nuestras variables en estudio, con el fin de conocer la disperión de los datos con respecto al mayor y menor valor. De estos diagramas se observa que el indice de masa corporal (BMI) presenta una mayor simetria a comparación de la altura, edad y el peso, las cuales por medio del grafico se puede decir que si presentan sesgo debido a la distancia de la mediana a los cuartiles de los extremos (Q1 y Q2).
Finalmente, se realizo diferentes diagramas de dispersión para así analizar la relación entre dos variables cuantitativas, para ello se elaboro los graficos entre la Edad-Peso, Peso-Altura y el Peso-IMC (Indice de Masa Corporal):
| Cruce | C.Pearson |
|---|---|
| peso-edad | 0.4651065 |
| peso-altura | 0.4288899 |
| peso-IMC | 0.9728293 |
De acuerdo a los graficos y el valor de r (Coeficiente de correlación lineal de Pearson) se establece que los dos primeros graficos donde se relaciona Edad-Peso y Peso-Altura las variables presenta una correlacion positiva leve, ya que, el valor de r esta por debajo de 0.5, por ello en los graficos se observan una gran dispersion entre los datos sin presentar una tendencia lineal lo que indica que el peso depende debilmente de la edad y de la altura en cambio en el ultimo grafico del Peso y IMC estan corelacionadas de forma positiva e intensas porque su r = 0.97, permitiendo determinar que IMC depende fuertemente del peso.
Se puede concluir que la mayoria de las personas entrevistadas en una región de Colombia pertenecen al genero masculino y se caracterizan por ser de bajo peso o de peso normal, dado que, los valores de IMC presentan una mayor tendencia en el valor de 21.1 presentando gran variabilidad en los datos de peso, edad y altura.
Se observar tambien que se requiere realizar la implementación de diferentes indicadores y herramientas para un buen análisis descriptivo, debido a que un solo indicador no muestra con gran exactitud lo que nos dicen los datos.
Se concluye del estudio que la para el análisis de la causa de que muchos individuos se categoricen de bajo peso o con la etiqueta normal, se debe hacer uso de la inferencia estadistica, la cual no esta al alcance de este estudio.
Cadena, E. (2021, March 4). Obesidad, un factor de riesgo en el covid-19. Ministerio de Salud y Protección Social. Retrieved September 3, 2023, from https://www.minsalud.gov.co/Paginas/Obesidad-un-factor-de-riesgo-en-el-covid-19.as px
SUJITH K MANDALA. (2023, Mayo 10). Obesity Classification Dataset. Kaggle. Retrieved September 3, 2023, from https://www.kaggle.com/datasets/sujithmandala/obesity-classification-dataset