Este documento presenta un análisis estadístico avanzado centrado en la relación entre el grado de severidad de la fibrosis hepática y los niveles de Albúmina (alb), actuando esta como un biomarcador no invasivo de la función hepática.
En esta sección se cargan los datos originales del fichero “fibrosis_1.sav” y se realiza una limpieza para asegurar que el análisis se base únicamente en registros completos.
datos <- read_sav("fibrosis_1.sav")
# Eliminamos valores nulos para garantizar la calidad del estudio:
datos_na <- na.omit(datos)
estado <- as.factor(datos_na$fibrosis)
# Estructura de la variable factor:
levels(estado) <- c("Ausencia", "Leve", "Moderada", "Importante")
Se ha transformado la variable fibrosis en un factor con cuatro niveles (0 a 3). Trabajaremos con un nivel de significatividad \(\alpha = 0.05\).
Calculamos los promedios de Albúmina desglosados por cada nivel de fibrosis para identificar patrones numéricos iniciales.
media_alb <- aggregate(alb ~ fibrosis, data = datos_na, FUN = mean)
media_alb$fibrosis <- c("Ausencia", "Leve", "Moderada", "Importante")
knitr::kable(media_alb, caption = "Medias de Albúmina por Categoría", digits = 2)
| fibrosis | alb |
|---|---|
| Ausencia | 4.37 |
| Leve | 4.24 |
| Moderada | 4.02 |
| Importante | 3.84 |
Para elegir la técnica estadística adecuada, analizamos la distribución de la Albúmina en cada grupo mediante histogramas y pruebas de normalidad.
alb0 <- subset(datos_na$alb, estado == "Ausencia")
alb1 <- subset(datos_na$alb, estado == "Leve")
alb2 <- subset(datos_na$alb, estado == "Moderada")
alb3 <- subset(datos_na$alb, estado == "Importante")
par(mfrow=c(2,2))
hist(alb0, col = "lightblue", main = "Ausencia", xlab = "Albúmina", prob=T)
lines(density(alb0), lwd=2)
hist(alb1, col = "lightgreen", main = "Leve", xlab = "Albúmina", prob=T)
lines(density(alb1), lwd=2)
hist(alb2, col = "orange", main = "Moderada", xlab = "Albúmina", prob=T)
lines(density(alb2), lwd=2)
hist(alb3, col = "tomato", main = "Importante", xlab = "Albúmina", prob=T)
lines(density(alb3), lwd=2)
shapiro.test(alb0)
##
## Shapiro-Wilk normality test
##
## data: alb0
## W = 0.77278, p-value = 1.663e-13
shapiro.test(alb1)
##
## Shapiro-Wilk normality test
##
## data: alb1
## W = 0.97423, p-value = 0.03264
shapiro.test(alb2)
##
## Shapiro-Wilk normality test
##
## data: alb2
## W = 0.97464, p-value = 0.329
shapiro.test(alb3)
##
## Shapiro-Wilk normality test
##
## data: alb3
## W = 0.96051, p-value = 0.5541
Los resultados de Shapiro-Wilk para los grupos de “Ausencia” (\(p < 0.001\)) y “Leve” (\(p = 0.032\)) indican que los datos no siguen una distribución normal. Al no cumplirse este supuesto, se descarta el ANOVA y se opta por la Prueba de Kruskal-Wallis. Dado que el p-valor en los grupos de “Ausencia” (\(p < 0.001\)) y “Leve” (\(p = 0.032\)) es menor a 0.05, se rechaza la hipótesis de normalidad.
Utilizamos la prueba no paramétrica de Kruskal-Wallis para determinar si existen diferencias significativas entre los rangos de albúmina.
# Prueba global
kruskal.test(datos_na$alb ~ estado)
##
## Kruskal-Wallis rank sum test
##
## data: datos_na$alb by estado
## Kruskal-Wallis chi-squared = 41.927, df = 3, p-value = 4.157e-09
# Prueba de Homocedasticidad (Levene)
leveneTest(datos_na$alb ~ estado)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 1.1239 0.3395
## 318
Dado que el test global resultó significativo (\(p < 0.05\)), realizamos comparaciones por parejas para identificar qué grupos difieren entre sí.
dunnTest(datos_na$alb ~ estado, method = "bonferroni")
## Comparison Z P.unadj P.adj
## 1 Ausencia - Importante 4.6074888 4.075611e-06 2.445367e-05
## 2 Ausencia - Leve 2.4619239 1.381940e-02 8.291639e-02
## 3 Importante - Leve -3.2349143 1.216793e-03 7.300755e-03
## 4 Ausencia - Moderada 5.3156837 1.062576e-07 6.375455e-07
## 5 Importante - Moderada -0.9063513 3.647499e-01 1.000000e+00
## 6 Leve - Moderada 3.2541076 1.137492e-03 6.824950e-03
Conclusión FinalEl análisis revela que los niveles de Albúmina disminuyen significativamente conforme aumenta la severidad de la fibrosis (\(p < 0.001\)). El análisis post-hoc indica que la caída más crítica ocurre entre el estado Leve y Moderado. No se encontraron diferencias significativas entre los estados Moderado e Importante (\(p = 1.00\)), sugiriendo que la albúmina es un marcador eficaz para detectar el inicio de una fibrosis avanzada, pero pierde capacidad de discriminación en las etapas terminales.