En el informe inicial que realicé,con la base de datos METABOLISMO llevé a cabo un proceso de depuración, validación estructural y análisis descriptivo, verificando que los registros fueran consistentes, completos y fisiológicamente plausibles, por lo cual en este proceso comprendí la arquitectura interna de la base, identifiqué los dominios clínicos, antropométricos y bioquímicos representados, y pude caracterizar la variabilidad de los indicadores metabólicos de los escolares incluidos, por lo que de esta manera consolidé una base depurada sobre la cual puedo avanzar con confianza hacia un análisis inferencial.

A partir de este fundamento, en el presente informe desarrollaré la fase de inferencia estadística, cuyo propósito central es que yo pueda utilizar la información muestral para hacer afirmaciones sobre parámetros poblacionales que no puedo observar directamente, por lo que a diferencia del análisis descriptivo, donde me limité a resumir lo observado, aquí en la inferencia puedo responder preguntas sobre la población estudiada mediante contrastes formales de hipótesis y estimaciones acompañadas de intervalos de confianza.

Para ello aplicaré pruebas estadísticas paramétricas, herramientas que requieren que la información cuantitativa se comporte de acuerdo con ciertos supuestos (normalidad, independencia y escala métrica) y que, cuando se cumplan, me permitirán evaluar diferencias reales y cuantificar la incertidumbre asociada a mis estimaciones.

En este informe realizaré dos tipos de comparaciones fundamentales, la primera es hacer una prueba de hipótesis para una muestra, en la que contrastaré la media de un marcador clínico frente a un valor teórico utilizado como punto de referencia fisiológico.

Luego realizaré, una prueba de hipótesis para dos muestras independientes, en la que evaluaré si existen diferencias en una medida antropométrica entre grupos definidos por una característica demográfica relevante.

Con estos procedimientos podré determinar si las diferencias observadas en los datos son atribuibles al azar o si representan patrones coherentes con el marco clínico, fisiopatológico y epidemiológico del riesgo metabólico infantil.

Considero que esta fase analítica es esencial, pues me permitirá integrar la estadística con la interpretación biológica, para poder avanzar del punto donde arranqué que fue“describir lo que veo” a “comprender por qué ocurre”, y extraer conclusiones que apoyarán la evaluación temprana de alteraciones metabólicas en una población pediátrica sana.

Estadística bivariada

En conjunto, este análisis inferencial me representa un paso super clave para poder hallar evidencia estadística que me ayude en la evaluación clínica de los perfiles metabólicos y su variabilidad en esta cohorte escolar.

Considero aplicar herramientas de estadística bivariada, las cuales según la literatura, se utilizan cuando, por ejemplo, el objetivo es analizar la relación entre dos variables al mismo tiempo, y a diferencia de la estadística univariada, que describe cada variable por separado, la estadística bivariada si me permite evaluar diferencias, asociaciones o patrones comparativos.

Para este análisis trabajaré con una variable dependiente continua (glucosa en ayunas o perímetro de cintura) y una variable independiente que define los grupos que deseo comparar (un valor teórico para la prueba de una muestra, o el sexo biológico para la comparación de dos grupos).

La estadística bivariada que aplicaré corresponde a pruebas de comparación de medias, que me permiten evaluar si las diferencias observadas entre grupos son reales o si puedo atribuirlas al azar del muestreo, por lo cual utilizaré pruebas paramétricas como la prueba t de Student, tanto para una muestra (cuando quiero evaluo frente a un valor de referencia) como para dos muestras independientes (cuando quiero comparar entre grupos).

Además, si los supuestos de normalidad no se cumplieran adecuadamente, recurriré a una alternativa no paramétrica como la prueba de Wilcoxon/Mann-Whitney, que me ayuda a evaluar diferencias en la ubicación central de las distribuciones sin exigir normalidad.

Planteamiento de la Hipótesis

Para avanzar hacia el análisis inferencial, primero debo formular las hipótesis estadísticas que voy a evaluar, pues considero fundamental establecerlas desde ahora, ya que una hipótesis estadística es una afirmación sobre un parámetro poblacional,por ejemplo, una media o una diferencia entre medias donde puede ser contrastada utilizando la información muestral disponible. Acontinuación desarrollaré dos hipótesis:

1. Hipótesis para una muestra: Realizaré una comparación de una media muestral con un valor teórico clínico, y en esta primera parte evaluaré si un parámetro metabólico de interés en mi base de datos,por ejemplo, la glucosa en ayunas o el perímetro de cintura, presenta un valor promedio que es coherente con un estándar clínico de referencia.

En términos de inferencia estadística, este procedimiento me permitirá determinar si la media observada en mi grupo de escolares refleja lo que se consideraría un comportamiento metabólico fisiológico o si, por el contrario, se aleja de lo esperado y me sugiere una tendencia que podría tener relevancia epidemiológica, por tanto, voy a plantear las siguientes hipótesis:

Hipótesis nula:

la media poblacional del marcador clínico que evaluaré será igual al valor teórico de referencia definido desde la literatura biomédica.

Con esta hipótesis nula, establezco la postura conservadora que asumo inicialmente, donde estoy diciendo que mi población no difiere de lo que sería esperado fisiológicamente.

Hipótesis alternativa:

la media poblacional del mismo marcador será diferente a ese valor teórico.

Esta alternativa me permitirá detectar si existe un incremento o una disminución significativa que podría interpretarse como un patrón metabólico alterado en esta cohorte.

Formular estas hipótesis me permite utilizar una prueba paramétrica de una muestra, como la prueba t de Student para una media, con el fin de evaluar de manera formal si la diferencia observada se debe únicamente al azar o si refleja un patrón real en la población escolar.

2. Hipótesis para dos muestras independientes:

Aquí haré una comparación de medias entre grupos definidos, pues en la segunda parte del análisis evaluaré si existe una diferencia en un parámetro antropométrico o metabólico entre dos grupos de estudiantes definidos por una característica demográfica, por ejemplo el sexo biológico (niñas versus niños) o algún nivel de desarrollo puberal.

El propósito de esta comparación será que yo identifique si los patrones metabólicos o clínicos se distribuyen de manera similar entre los grupos o si existen diferencias que podrían explicarse por factores biológicos, fisiológicos o sociales.

Las hipótesis que formularé son:

Hipótesis nula:

las medias poblacionales del parámetro que voy a estudiar serán iguales en ambos grupos.

Con esta hipótesis nula expreso que, desde el punto de vista estadístico y fisiológico, no existen diferencias reales entre los grupos, y cualquier variación observada se deberá únicamente al azar propio del muestreo.

Hipótesis alternativa:

las medias poblacionales serán diferentes entre los grupos.

Con esta alternativa evaluaré la posibilidad de que exista una diferencia real en la variabilidad metabólica o antropométrica entre ambos grupos, lo cual podría tener implicaciones fisiológicas y epidemiológicas relevantes.

La prueba estadística adecuada que emplearé, si se cumplen los supuestos de normalidad y homogeneidad de varianzas, será la prueba t de Student para dos muestras independientes, pues con esta herramienta me podré determinar si la diferencia observada entre los grupos puede atribuirse al azar o si representa un patrón consistente con diferencias biológicas o conductuales en la población.

Considero que formular estas hipótesis de manera explícita, razonada y contextualizada es esencial para garantizar un análisis coherente con los principios de la inferencia estadística, ya que cada hipótesis me guiará al método a utilizar, igualmente en la interpretación de los valores que obtenga y el alcance de las conclusiones que podré emitir sobre el riesgo metabólico en esta cohorte.

Objetivo del análisis

Mi objetivo es determinar si los marcadores metabólicos que he seleccionado de la base METABOLISMO presentan o no diferencias relevantes cuando los comparo con un valor teórico de referencia o entre dos grupos definidos por una característica demográfica.

Mi propósito es evaluar si las diferencias que observo en las medias son atribuibles al azar o si reflejan patrones coherentes con procesos fisiológicos propios de esta población escolar.

En primera instancia evaluaré si la glucosa en ayunas de los estudiantes se comporta de manera similar a un valor teórico considerado normal en población pediátrica, por medio de una prueba t para una muestra, luego analizaré si el perímetro de cintura difiere entre niños y niñas, aplicando una prueba t de dos muestras independientes y complementándola con alternativas no paramétricas si es necesario.

Con este proceso busco no solo contrastar hipótesis estadísticas, sino también comprender si estos patrones tienen sentido clínico y epidemiológico, y de esta forma acercarme a una interpretación integral del perfil metabólico infantil en esta cohorte.

Metodología

En esta sección describiré las decisiones analíticas que asumiré para llevar a cabo las pruebas paramétricas,por lo cual seleccionaré dos variables cuantitativas continuas de la base METABOLISMO y, a partir de ellas, ejecutaré dos tipos de contrastes de hipótesis, uno para una sola muestra y otro para dos muestras independientes.

Selección de variables

Seleccionaré dos variables que son clínicamente relevantes,porque poseen escala métrica adecuada y presentan variabilidad suficiente para un análisis paramétrico:

Variable 1: Glucosa en ayunas (glucemia)

Tipo de variable: Cuantitativa continua Dominio: Marcador bioquímico Unidad: mg/dL

Considero que la glucosa en ayunas es uno de los indicadores metabólicos más sensibles para evaluar riesgo cardiometabólico temprano, pues posee puntos de corte ampliamente establecidos en la literatura médica, lo cual me permite compararla con un valor teórico fisiológico (por ejemplo, 90 mg/dL como valor considerado normal en población pediátrica), por lo que la convierte en una variable ideal que puedo aplicar con una prueba t para una muestra.

Variable 2: Perímetro de cintura (per_cintura) Tipo de variable: Cuantitativa continua Dominio: Antropométrico Unidad: centímetros

El perímetro de cintura es un marcador clave de adiposidad central, ampliamente asociado con riesgo cardiometabólico incluso en edades tempranas,por lo que biológicamente puedo esperar que existan diferencias entre niños y niñas debido a variaciones en crecimiento, composición corporal y distribución grasa.

Por esta razón, lo considero ideal para el análisis entre dos grupos independientes,porque puedo clasificar a la población por sexo biológico, que es una variable nominal dicotómica incluida en la base.

library(knitr)
library(kableExtra)

variables <- data.frame(
Variable = c("Glucosa en ayunas", "Perímetro de cintura"),
Codigo = c("glucemia", "per_cintura"),
Dominio = c("Bioquímico", "Antropométrico"),
Tipo = c("Cuantitativa continua", "Cuantitativa continua"),
Objetivo_analisis = c("Prueba t para una muestra", "Prueba t para dos muestras independientes")
)

kable(variables, "html", caption = "Variables que he seleccionado para el análisis inferencial") %>%
kable_styling(full_width = FALSE, bootstrap_options = c("striped", "hover", "condensed"))
Variables que he seleccionado para el análisis inferencial
Variable Codigo Dominio Tipo Objetivo_analisis
Glucosa en ayunas glucemia Bioquímico Cuantitativa continua Prueba t para una muestra
Perímetro de cintura per_cintura Antropométrico Cuantitativa continua Prueba t para dos muestras independientes

Supuestos estadísticos que voy a verificar

Como utilizaré pruebas paramétricas, es fundamental asegurar que mis variables cumplan con los supuestos teóricos que sustentan estas técnicas:

a) Normalidad de los datos

Revisaré la forma en que se distribuye cada variable mediante:

-Pruebas formales como Shapiro-Wilk

-Análisis gráfico con:

-Histogramas -Curvas de densidad -Gráficos Q-Q

Todo esto dado que la normalidad es un requisito clave para que la estimación de la media y la desviación estándar tengan validez como resumen central de la población.

b) Homogeneidad de varianzas (solo para dos muestras)

Utilizaré para ello: -Prueba de Levene -Prueba de Bartlett (cuando la normalidad sea adecuada)

Considero que este paso es esencial para decidir si aplicaré la t con varianzas iguales, o la t de Welch con varianzas desiguales.

c) Independencia de las observaciones

Confirmaré que cada estudiante corresponde a una sola medición, y que los grupos (niños y niñas) no se superponen, cumpliendo la estructura que exige la prueba t.

Pruebas estadísticas a utilizar

Una vez verificados los supuestos, realizaré las siguientes pruebas de contraste, seleccionadas por su coherencia con las hipótesis definidas:

1-Prueba t de Student para una muestra

La aplicaré a glucosa en ayunas, con el objetivo de comparar la media muestral frente al valor teórico de 100 mg/dL, pues esta prueba, según laliteratura de Clifford (Capítulo 5),es la más indicada cuando quiero evaluar si una media observada es estadísticamente distinta a un estándar poblacional, por lo cual, me permitirá responder si los escolares se comportan como lo esperado fisiológicamente.

-2.Prueba t de Student para dos muestras independientes

La aplicaré a perímetro de cintura, comparando niñas vs. niños, pues según la literatura revisada en clase,esta prueba es adecuado cuando, la variable es cuantitativa continua,cuando los grupos son independientes,y cuando quiero evaluar si existe diferencia en las medias poblacionales.

Si las varianzas resultan no ser homogéneas,entonces utilizaré la versión t de Welch, que me corrige esta diferencia sin afectar la validez del contraste. IC de la diferencia de medias

Procedimiento general del análisis

Para cada prueba realizaré los siguientes pasos(5 pasos de contraste):

-Formulación de hipótesis nula y alternativa

-Elección de la prueba adecuada, justificada según la naturaleza de la variable y los supuestos

-Cálculo del estadístico de prueba R, y que pienso realizar dicho cálculo mediante la función t.test()

-Obtención del valor p e intervalo de confianza, pues estos dos elementos serán esenciales para interpretar si existe evidencia estadística suficiente para rechazar la hipótesis nula.

De esta forma,relacionaré los resultados estadísticos con el marco fisiológico y epidemiológico del análisis metabólico.

Verificación de supuestos estadísticos

# librerías
library(tidyverse)
# Cargo la base de datos 
BaseMetabolismo <- readxl::read_excel("BaseMetabolismo.xlsx")
# mis variables de interés
glucosa <- BaseMetabolismo$glicemia
perimetro <- BaseMetabolismo$per_cintura
sexo <- BaseMetabolismo$sexo

Normalidad de la variable 1 (Glucosa en ayunas)

# Normalidad de glucosa en ayunas

# Prueba de Shapiro-Wilk
shapiro_glucosa <- shapiro.test(glucosa)
shapiro_glucosa
## 
##  Shapiro-Wilk normality test
## 
## data:  glucosa
## W = 0.98615, p-value = 0.2352
# Histograma y curva de densidad
ggplot(BaseMetabolismo, aes(x = glicemia)) +
  geom_histogram(aes(y = ..density..), bins = 30, fill = "#69b3a2", color = "white") +
  geom_density(color = "red", size = 1.2) +
  theme_minimal() +
  labs(title = "Distribución de glucosa en ayunas",
       x = "Glucosa (mg/dL)", y = "Densidad")

# Gráfico Q-Q
ggplot(BaseMetabolismo, aes(sample = glicemia)) +
  stat_qq(color = "#3366CC") +
  stat_qq_line(color = "red") +
  theme_minimal() +
  labs(title = "Gráfico Q-Q para glucosa en ayunas")

Evaluación de normalidad en la variable Glucosa en ayunas

Para comenzar el análisis inferencial, primero evalué el supuesto de normalidad de la glucosa en ayunas, porque esta condición es esencial cuando deseo aplicar una prueba t de Student para una muestra.

La prueba de Shapiro–Wilk me permite determinar si la distribución observada se aleja o no de una distribución normal, mientras que los histogramas, las curvas de densidad y los gráficos Q-Q me permiten visualizar patrones como asimetrías o colas pronunciadas.

Histograma con curva de densidad,me muestra la forma general de la distribución de la glucosa en ayunas, donde observo una distribución unimodal, sin picos extremos ni asimetrías marcadas, y la curva de densidad se superpone de manera coherente a los datos,por lo que me sugiere que los valores siguen una forma cercana a la normal.

En el gráfico Q–Q los puntos se alinean de manera cercana a la línea diagonal, lo que me indica que los cuantiles que observo,se aproximan a los cuantiles teóricos de una distribución normal,por otro lado observo desviaciones leves en los extremos, lo cual creo que es esperable en datos reales y no sugiere una violación fuerte de normalidad.

En la prueba de Shapiro–Wilk, me ha arrojado un valor p mayor a 0.05 (p = 0.235), lo que significa que no hay evidencia estadística para rechazar la normalidad, por lo cual este resultado respalda lo que ya se observé en las gráficas.

En conjunto, las tres evaluaciones —histograma, gráfico Q–Q y prueba de Shapiro–Wilk— me muestran que la distribución de la glucosa en ayunas es compatible con una distribución normal, y me confirma que puedo aplicar pruebas paramétricas como la prueba t de una muestra sin violar el supuesto de normalidad.

-Procedo a evaluar normalidad del perímetro de cintura (per_cintura)

library(ggplot2)

ggplot(BaseMetabolismo, aes(x = per__cintura)) +
  geom_histogram(binwidth = 2, fill = "lightblue", color = "white", alpha = 0.8) +
  geom_density(color = "pink", size = 1.2) +
  labs(
    title = "Distribución del perímetro de cintura",
    x = "Perímetro de cintura (cm)",
    y = "Densidad"
  )

ggplot(BaseMetabolismo, aes(sample = per__cintura)) +
  stat_qq(color = "blue") +
  stat_qq_line(color = "red") +
  labs(
    title = "Gráfico Q-Q del perímetro de cintura"
  )

Al revisar las gráficas del perímetro de cintura observo que la distribución se concentra principalmente entre 65 y 75 cm, con un patrón unimodal claro y una ligera extensión hacia valores más altos, lo que me sugiere una asimetría positiva esperable en variables antropométricas pediátricas, donde algunos escolares presentan mayor adiposidad central.

Considero que, aunque el histograma no muestra una simetría perfecta, la forma general de la distribución no evidencia distorsiones extremas, pero sí me indica la posibilidad de que las colas se comporten de manera diferente a lo que asumiría una distribución normal estricta.

Al revisar el gráfico Q-Q encuentro que la mayoría de los puntos siguen adecuadamente la línea teórica en la parte central, lo que respalda una aproximación a la normalidad en el núcleo de la distribución; sin embargo, en las colas observo desviaciones más marcadas, especialmente hacia la derecha, donde los valores más altos se separan visiblemente de la recta, lo cual me confirma la presencia de cierta asimetría, y dado que la normalidad es un supuesto clave para la aplicación de pruebas paramétricas, considero que esta combinación de hallazgos me obliga a verificar formalmente la normalidad mediante la prueba de Shapiro-Wilk y a evaluar la homogeneidad de varianzas, pues estas desviaciones pueden afectar la comparación entre grupos.

En conjunto, interpreto que el perímetro de cintura presenta un comportamiento aproximadamente normal en el centro de la distribución, pero con colas que requieren una verificación estadística más rigurosa; por tanto, procederé con las pruebas formales para decidir si es apropiado aplicar la prueba t de Student tradicional o si debo emplear la versión de Welch, más robusta cuando hay varianzas desiguales.

Prueba de normalidad para perímetro de cintura

# Prueba de normalidad Shapiro-Wilk para perímetro de cintura
shapiro_per_cintura <- shapiro.test(BaseMetabolismo$per__cintura)
shapiro_per_cintura
## 
##  Shapiro-Wilk normality test
## 
## data:  BaseMetabolismo$per__cintura
## W = 0.94351, p-value = 5.246e-05

Al revisar el resultado de la prueba de Shapiro-Wilk para el perímetro de cintura encuentro que el valor p obtenido (p = 5.246e-05) es mucho menor que 0.05, por lo que considero que existe evidencia estadística suficiente para rechazar la hipótesis nula de normalidad.

Esto significa que, desde el punto de vista estrictamente estadístico, la distribución del perímetro de cintura en esta cohorte no sigue un patrón normal, además cuando comparo este resultado con lo que observé previamente en el histograma y en el gráfico Q-Q, confirmo que el comportamiento de los datos muestra asimetría hacia valores más altos y desviaciones visibles en los extremos, especialmente en la cola superior donde observo un grupo de escolares con perímetros de cintura más amplios, ahora dado que ambas evaluaciones me coinciden, considero que el perímetro de cintura presenta una distribución que se aleja de la simetría esperada en datos normales.

Esto implica que, para garantizar un contraste válido entre grupos, no debo asumir igual comportamiento estadístico que el observado en la glucemia, por lo que siendo esta una razón, y con el fin de no violar los supuestos paramétricos, debo verificar la homogeneidad de varianzas y, con base en ello, decidir si aplicaré la prueba t clásica o si optaré por la versión de Welch, que es más robusta cuando las distribuciones no son normales o las varianzas son desiguales.

Realizo un boxplot por sexo para evaluar gráficamente varianzas

library(ggplot2)

ggplot(BaseMetabolismo, aes(x = sexo, y = per__cintura, fill = sexo)) +
  geom_boxplot(alpha = 0.7) +
  scale_fill_manual(values = c("lightblue", "lightpink")) +
  labs(
    title = "Perímetro de cintura por sexo",
    x = "Sexo biológico",
    y = "Perímetro de cintura (cm)"
  ) +
  theme_minimal(base_size = 14)

Prueba de Levene para homogeneidad de varianzas

BaseMetabolismo$sexo <- as.factor(BaseMetabolismo$sexo)
library(car)

BaseMetabolismo$sexo <- as.factor(BaseMetabolismo$sexo)

leveneTest(per__cintura ~ sexo, data = BaseMetabolismo)
## Levene's Test for Homogeneity of Variance (center = median)
##        Df F value Pr(>F)
## group   1   1.707 0.1938
##       123

Al observar el diagrama de cajas del perímetro de cintura según sexo, noto que las distribuciones visualmente se superponen de manera importante y que la dispersión entre ambos grupos no me muestra diferencias marcadas; aunque existen algunos valores extremos hacia arriba y hacia abajo, estos parecen distribuidos sin un patrón que me sugiera una mayor variabilidad en un sexo específico,además, la amplitud del rango intercuartílico es similar, lo cual me hace pensar preliminarmente que las varianzas podrían ser comparables.

Esta impresión inicial que he tenido, se confirma estadísticamente con la prueba de Levene, cuyo valor p = 0.1938 es mayor que el umbral habitual de 0.05, por lo que concluyo que no tengo evidencia suficiente para rechazar la hipótesis de igualdad de varianzas.

En otras palabras, tanto visual como analíticamente encuentro que la variabilidad del perímetro de cintura es homogénea entre los grupos de sexo, lo cual es un elemento clave porque me indica que, a pesar de los valores atípicos presentes, el supuesto de homogeneidad de varianzas requerido para aplicar una prueba t clásica (Student) no se ve comprometido, y esta coherencia entre la evaluación gráfica y la evaluación estadística me da confianza para realizar un análisis comparativo entre los dos grupos.

# Prueba t para comparar perímetro de cintura entre sexos
t.test(per__cintura ~ sexo,
       data = BaseMetabolismo,
       var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  per__cintura by sexo
## t = -0.39127, df = 123, p-value = 0.6963
## alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
## 95 percent confidence interval:
##  -4.487676  3.006342
## sample estimates:
## mean in group 0 mean in group 1 
##        67.28200        68.02267

Al revisar los resultados de la prueba t de dos muestras independientes observo que la diferencia en el perímetro de cintura entre los dos sexos es mínima, con una media de 67.28 cm en el grupo 0 y 68.02 cm en el grupo 1, lo cual ya me dice que, a nivel descriptivo, ambos grupos son bastante similares.

El estadístico t que obtuve es de −0.391 con 123 grados de libertad y un valor p de 0.6963,por lo que considero que esta diferencia tan pequeña podría deberse fácilmente al azar y que no existe evidencia estadística para afirmar que los promedios difieran entre sí.

Al revisar el intervalo de confianza del 95 %, que va desde −4.49 hasta 3.01 cm, encuentro que el rango me incluye el cero, lo cual considero que hay ausencia de diferencia real entre los sexos, además en el mejor de los escenarios, la diferencia potencial sería muy pequeña y sin relevancia práctica, asi que esto es consistente con lo observado previamente en los gráficos exploratorios, donde las distribuciones me mostraban solapamiento considerable y medianas muy cercanas entre los grupos.

En conjunto, estos resultados me permiten concluir que el perímetro de cintura no varía de forma significativa entre los dos sexos de esta muestra y que cualquier diferencia observada es atribuible a variabilidad normal en los datos más que a un efecto real o clínicamente importante.

BaseMetabolismo %>%
  group_by(sexo) %>%
  summarise(
    n = n(),
    media = mean(per__cintura, na.rm = TRUE),
    sd = sd(per__cintura, na.rm = TRUE),
    mediana = median(per__cintura, na.rm = TRUE),
    IQR = IQR(per__cintura, na.rm = TRUE),
    min = min(per__cintura, na.rm = TRUE),
    max = max(per__cintura, na.rm = TRUE)
  )
## # A tibble: 3 × 8
##   sexo        n media    sd mediana   IQR   min   max
##   <fct>   <int> <dbl> <dbl>   <dbl> <dbl> <dbl> <dbl>
## 1 0          50  67.3  9.40    65.6  9.62  53     101
## 2 1          75  68.0 11.0     67   11.8   34.6    94
## 3 <NA>  1048448 NaN   NA       NA   NA    Inf    -Inf

las medidas descriptivas del perímetro de cintura según el sexo biológico, me muestra que el tamaño muestral es diferente entre los grupos, con 50 participantes en el grupo 0 y 75 en el grupo 1, donde esta diferencia de tamaños no me invalida la comparación, pero sí explica en parte la variabilidad ligeramente mayor que observo en el segundo grupo.

En términos de tendencia central, encuentro que las medias son prácticamente iguales entre ambos grupos:

67.28 cm en sexo 0 y 68.02 cm en sexo 1, una diferencia de menos de un centímetro que, clínicamente, parece irrelevante.

La mediana me confirma este patrón, con valores de 65.6 cm y 67 cm respectivamente, lo cual considero que la posición central de ambas distribuciones es muy similar y que no hay un desplazamiento notable de una distribución respecto a la otra.

Al examinar la dispersión, considero que las desviaciones estándar de 9.39 cm y 10.96 cm, junto con los rangos intercuartílicos de 9.63 cm y 11.75 cm, me dice que en ambos grupos se presenta una variabilidad comparable, aunque el grupo 1 muestra una dispersión ligeramente mayor, consistente con lo que vi en la prueba de Levene donde no se encontré diferencias significativas de varianza.

También observo que los valores mínimos y máximos (53–101 cm en sexo 0 y 34.6–94 cm en sexo 1) muestran amplitudes relativamente amplias, lo cual puede indicar la presencia de niños con perímetros muy pequeños o muy grandes, algo razonable con lo que observé en los boxplots y en el QQ-plot, por lo cual creo que la distribución no es completamente normal y que existen algunos valores extremos.

Cálculo del tamaño del efecto (Cohen’s d) Este cálculo me sirve para saber cuán grande es la diferencia real, independientemente del p-valor.

library(effsize)
cohen.d(per__cintura ~ sexo, data = BaseMetabolismo)
## 
## Cohen's d
## 
## d estimate: -0.07143639 (negligible)
## 95 percent confidence interval:
##      lower      upper 
## -0.4329414  0.2900687

Al calcular el tamaño del efecto mediante el estadístico d de Cohen encuentro que el valor obtenido es de –0.07, una magnitud considerada despreciable según los criterios clásicos de interpretación en la literaura, por lo cual este valor tan pequeño me indica que la diferencia entre los promedios del perímetro de cintura en los dos grupos de sexo es prácticamente nula cuando se expresa en unidades de desviación estándar, lo cual coincide con lo que hallé en los estadísticos descriptivos y en la prueba t, donde las medias fueron muy similares y el valor p no me mostró evidencia de diferencia estadísticamente significativa.

Además, cuando reviso el intervalo de confianza del 95%, que va desde –0.43 hasta 0.29, observo que este rango incluye valores negativos y positivos que siguen siendo pequeños y que atraviesan el cero, lo cual creo que no existe un efecto real consistente en ninguna dirección.

También me parece importante que los límites del intervalo nunca entran en la zona típica de efectos moderados o grandes, lo que me sugiere que incluso si existiera una diferencia verdadera en la población, esta sería muy pequeña y poco relevante desde una perspectiva clínica o epidemiológica.

Visualización del intervalo de confianza

Para complementar la interpretación numérica del t-test, elaboraré un gráfico del intervalo de confianza del 95 % para la diferencia de medias, pues es útil porque permite ver de forma intuitiva si la diferencia estimada podría incluir el valor cero.

# Calculo la diferencia de medias e intervalo de confianza
t_res <- t.test(per__cintura ~ sexo, data = BaseMetabolismo, var.equal = TRUE)

diferencia <- diff(t_res$estimate)   # media grupo1 - media grupo0
IC_inf <- t_res$conf.int[1]
IC_sup <- t_res$conf.int[2]

df_plot <- data.frame(
  dif = diferencia,
  IC_inf = IC_inf,
  IC_sup = IC_sup
)

library(ggplot2)

ggplot(df_plot, aes(x = 1, y = dif)) +
  geom_point(size = 5, color = "#2C699A") +
  geom_errorbar(aes(ymin = IC_inf, ymax = IC_sup),
                width = 0.1, color = "#F8961E", linewidth = 1.2) +
  geom_hline(yintercept = 0, linetype = "dashed", color = "red") +
  scale_x_continuous(breaks = NULL) +
  labs(title = "Intervalo de confianza del 95% para la diferencia de medias",
       y = "Diferencia de medias (cm)",
       x = "") +
  theme_minimal(base_size = 15)

En este caso, la barra del intervalo atraviesa el cero, por lo que no observo una diferencia significativa entre los grupos y cualquier variación parece atribuible al azar muestral.

Realizaré ahora una comparación con una prueba NO paramétrica (Mann-Whitney/Wilcoxon)

wilcox.test(per__cintura ~ sexo, data = BaseMetabolismo)
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  per__cintura by sexo
## W = 1755.5, p-value = 0.5486
## alternative hypothesis: true location shift is not equal to 0

Al aplicar la prueba no paramétrica de Wilcoxon para comparar el perímetro de cintura entre los dos grupos de sexo observo que el valor p es 0.5486, lo cual está muy por encima del umbral habitual de significación, por lo que incluso cuando utilizo un método que no exige normalidad y que trabaja con los rangos de los datos, no encuentro evidencia estadística que sugiera una diferencia real en la distribución del perímetro de cintura entre hombres y mujeres.

Al revisar el estadístico W y la forma en que esta prueba detecta cambios en la mediana y en la ubicación general de las observaciones, concluyo que los patrones de dispersión y ordenamiento de los valores son muy similares entre ambos grupos, lo que coincide con lo que observé previamente en los diagramas de caja, los estadísticos descriptivos y los resultados de la prueba t.

Este hallazgo me confirma aun más que ante cualquier diferencia aparente entre los grupos es mínima y puedo atribuirla al azar, y además me confirma que la conclusión es consistente tanto para métodos paramétricos como para métodos no paramétricos.

En conjunto, considero que el sexo biológico no introduce un desplazamiento significativo en la distribución del perímetro de cintura y que los datos apoyan la ausencia de un efecto real entre estas dos categorías.

Análisis de outliers

boxplot.stats(BaseMetabolismo$per__cintura)$out
## [1]  89.0  91.0  34.6  91.0 101.0  90.0  94.0  90.3

Al explorar los valores atípicos del perímetro de cintura observo que el algoritmo del diagrama de caja me identifica varias observaciones que se ubican fuera del rango esperado según ello que se conoe como criterio clásico de Tukey** , que utiliza la distancia de 1.5 veces el rango intercuartílico.

Este criterio no es más que una regla estadística que se utiliza según la literatura, para identificar valores atípicos en un conjunto de datos, propuesto por el estadístico John Tukey , siendo este el método estándar que se usan en los diagramas de caja (boxplots) para decidir qué puntos me quedan “por fuera” de lo esperado.

Por lo cual, se calculan tres elementos fundamentales de la distribución:

-Primer cuartil (Q1): que es el valor que deja el 25 % de los datos por debajo.

_Tercer cuartil (Q3): es el valor que deja el 75 % de los datos por debajo.

Rango intercuartílico (IQR): que es la diferencia entre Q3 y Q1, y representa el “cuerpo central” de los datos, donde se concentra la mayoría de valores.

Tukey plantea que un valor se considera atípico cuando está muy lejos del cuerpo central de la distribución, y para definir “muy lejos”, está el siguiente criterio:

#Límite inferior de Q1 – 1.5 × IQR # y el Límite superior: Q3 + 1.5 × IQR

Por lo cual todo valor menor al límite inferior o mayor al límite superior lo debo marcar como outlier (atípico).

Por tal motivo, si un dato está más allá de esa distancia multiplicada por 1.5, es poco probable que pertenezca al comportamiento típico del conjunto, asi que cuando en el boxplot me muestra puntos aislados por encima o por debajo de los “bigotes”, significa que el rango está fuera de lo normal según el criterio de Tukey”, pero además si tengo una dato atípico, no significa automáticamente que esta mal o que es un error, sino simplemente que el valor es inusual respecto al resto.

Por lo cual volviendo a los valores,encuentro mediciones superiores a 89, 90, 91, 94 y hasta 101 cm, además de un valor aislado de 34.6 cm en el extremo inferior, por lo que creo que corresponden más a variabilidad natural de la población que a errores de digitación, ya que todos permanecen dentro de rangos biológicamente plausibles para adolescentes.

También noto que estos valores, aunque extremos, no son suficientemente distantes como para distorsionar la media ni la desviación estándar, y esto coincide con la homogeneidad de varianzas que encontré previamente,además de la ausencia de diferencias significativas en las pruebas t y Wilcoxon.

Por tanto, concluyo que estos outliers representan casos reales que amplían ligeramente la dispersión del grupo, pero no alteran de manera importante el análisis ni me sugieren la necesidad de excluirlos.

library(ggplot2)

ggplot(BaseMetabolismo, aes(x = "", y = per__cintura)) +
  geom_boxplot(fill = "yellow",               # azul suave
               color = "#193441",             # gris oscuro elegante
               outlier.colour = "red",    # coral para los outliers
               outlier.size = 4,              # punticos más grandes
               outlier.shape = 19) +          # redonditos
  labs(
    title = "Perímetro de cintura y valores atípicos según Tukey",
    y = "Perímetro de cintura (cm)",
    x = ""
  ) +
  theme_minimal(base_size = 16)

**la mayoría de los valores del perímetro de cintura se concentran en la parte central del gráfico, alrededor de la mediana y dentro del rango intercuartílico, sin embargo, aparecen varios puntos rojos ubicados por encima de los 90 cm y uno claramente por debajo de los 40 cm.

Estos puntos representan valores atípicos según el criterio de Tukey, lo que significa que se alejan más de lo que normalmente se espera en comparación con el resto de la distribución, por lo que aunque son inusuales, no necesariamente me indican error; simplemente muestran que algunas personas presentan perímetros significativamente mayores o menores que la tendencia general del grupo.

Conclusión de mi análisis inferencial

Al finalizar este análisis inferencial considero que pude integrar, de manera coherente, cada uno de los elementos que componen una comparación paramétrica, pues es importante no solo evaluar el valor p, sino poder comprender qué implica cada prueba, qué evalúa, qué puedo asumir y por qué sus resultados tienen sentido o no dentro del comportamiento metabólico de esta cohorte escolar.

Cuando evalué la glucosa en ayunas como variable para una prueba t de una muestra, me planteé una hipótesis sobre si la media observada se alejaba o no de un valor teórico considerado fisiológicamente normal, por lo cual revisé el supuesto de normalidad mediante Shapiro–Wilk y estudios gráficos, y confirmé que era válido avanzar con una prueba paramétrica.

Este ejercicio me enseñó que la inferencia no se trata simplemente de “hacer una prueba”, sino de comprobar si mis datos cumplen las condiciones que le dan validez al procedimiento, asi que en este sentido, la prueba t de una muestra me permitió cuantificar si la glucosa real de los escolares se comportaba como lo esperado.

Luego, al comparar el perímetro de cintura entre sexos, pude ver cómo se integran varios conceptos al mismo tiempo, pues la normalidad no se cumplió estrictamente, pero también comprobé que la prueba t es robusta ante pequeñas desviaciones cuando el tamaño muestral es moderado, y que la homogeneidad de varianzas, evaluada con Levene, sí se cumplió, permitiéndome usar la versión clásica de la prueba.

Este proceso me hizo reflexionar sobre la importancia de los supuestos, dado que si la varianza hubiera sido desigual, la prueba adecuada habría sido la t de Welch, y si la distribución hubiera sido muy asimétrica, habría tenido que depender más del enfoque no paramétrico.

La t de Student me mostró un resultado claro, de que no existe una diferencia estadísticamente significativa entre los promedios de perímetro de cintura en niños y niñas, sin embargo,más allá de eso, el intervalo de confianza incluyó el cero, lo cual me refuerza que la diferencia no solo no es significativa, sino que incluso en el mejor de los escenarios posibles sigue siendo mínima.

Este detalle me ayudó a comprender por qué un intervalo de confianza aporta información más completa que un valor p aislado, además el tamaño del efecto mediante Cohen’s d me confirmó un aspecto fundamental, y es que incluso cuando una diferencia pudiera llegar a ser significativa en otras condiciones, su magnitud es tan pequeña que no tiene peso clínico.

Un d de –0.07 me dice, en palabras simples, que ambos grupos son prácticamente iguales cuando comparo su perímetro de cintura en unidades de desviación estándar, por lo que entendí que la relevancia clínica y la relevancia estadística no siempre van de la mano y que ambas deben analizarse juntas para tomar decisiones informadas.

El uso de la prueba no paramétrica de Wilcoxon me permitió verificar que mis conclusiones no dependían estrictamente de la normalidad, pues cuando observé que este método alternativo arrojaba el mismo resultado que la prueba paramétrica, comprendí la importancia de contrastar resultados desde más de una perspectiva, especialmente cuando tengo variables antropométricas que suelen tener más asimetrías y outliers que los marcadores bioquímicos.

Finalmente, el análisis de valores atípicos bajo el criterio de Tukey me ayudó a entender que la presencia de outliers no es equivalente a error, pues al contrario, estos valores pueden estar reflejando la variabilidad real de los escolares, lo cual permite identificar que, aunque existan perímetros de cintura más altos o más bajos de lo esperado, estos no distorsionaron el análisis ni violaron los supuestos fundamentales de la comparación.

Este hallazgo considero que tiene mucha importancia para evaluar si un valor atípico afecta o no la prueba, más allá de simplemente detectarlo.