Se determinará la asociación lineal entre las variables asociadas al estado del paciente haciendo uso del ACP y el círculo de correlaciones.
Se usarán las siguientes variables para la construcción de los ejes factoriales:
v_act <- c('adlsc','scoma','sps','aps','hrt','resp','temp','sod')
v_sup <- setdiff(cuantitativas,v_act)
Y <- datos[,v_act]
acp <- dudi.pca(Y, scannf = FALSE, nf = 8)
# Ayudas para la interpretación
ayuda <- inertia.dudi(acp, col.inertia = TRUE)
fig <- fviz_screeplot(acp, addlabels = TRUE, ylim = c(0, 100))
fig
# Coordenadas en los ejes factoriales de las variables suplementarias
coord <- cor(datos[v_sup], acp$li)
ayuda$col.rel[,1:5]
## Axis1 Axis2 Axis3 Axis4 Axis5
## adlsc -5.117606 2.587589 -8.879645 75.78414000 -1.0180939
## scoma -26.081384 3.231133 -17.499671 0.07756204 -2.4462262
## sps -73.968749 7.445618 2.858768 -2.52651130 0.1245451
## aps -77.202443 4.499119 2.298538 -1.79414417 1.0102531
## hrt -12.953048 -42.364245 3.918229 0.73906588 -3.9530093
## resp -5.344080 -25.174488 12.316883 10.34677550 29.2633385
## temp -7.398965 -39.006543 -6.590921 -2.02775792 -22.5898897
## sod -1.231374 -6.883329 -52.127153 -4.41934001 29.0613311
fig <- fviz_pca_var(acp, col.var = "black")
fviz_add(fig, coord[,1:2], color = c(rep('blue',3),rep('red',2)), geom = 'arrow', labelsize = 2)
# Cosenos cuadrados
cosenos <- within(ayuda$col.rel, {
Plano <- abs(ayuda$col.rel[,1]) + abs(ayuda$col.rel[,2])
})
cosenos[,c('Axis1','Axis2','Plano')]
## Axis1 Axis2 Plano
## adlsc -5.117606 2.587589 7.705196
## scoma -26.081384 3.231133 29.312518
## sps -73.968749 7.445618 81.414367
## aps -77.202443 4.499119 81.701562
## hrt -12.953048 -42.364245 55.317293
## resp -5.344080 -25.174488 30.518569
## temp -7.398965 -39.006543 46.405508
## sod -1.231374 -6.883329 8.114703
Para el primer plano factorial, la primera componente está asociada a las variables sps y aps, que reflejan mayor gravedad en el estado fisiológico del paciente.
fig <- fviz_pca_var(acp, axes = c(2,5), col.var = "black")
fviz_add(fig, coord[4:5, c(2,5)], color = 'red', geom = 'arrow', labelsize = 2)
# Cosenos cuadrados
cosenos <- within(ayuda$col.rel, {
Plano <- abs(ayuda$col.rel[,2]) + abs(ayuda$col.rel[,5])
})
cosenos[,c('Axis2','Axis5','Plano')]
## Axis2 Axis5 Plano
## adlsc 2.587589 -1.0180939 3.605683
## scoma 3.231133 -2.4462262 5.677360
## sps 7.445618 0.1245451 7.570163
## aps 4.499119 1.0102531 5.509372
## hrt -42.364245 -3.9530093 46.317254
## resp -25.174488 29.2633385 54.437827
## temp -39.006543 -22.5898897 61.596432
## sod -6.883329 29.0613311 35.944660
datosaux <- within(datos, {
sex <- as.factor(datos$sex)
dzgroup <- as.factor(datos$dzgroup)
dzclass <- as.factor(datos$dzclass)
diabetes <- as.factor(datos$diabetes)
dementia <- as.factor(datos$dementia)
ca <- as.factor(datos$ca)
hospdead <- as.factor(datos$hospdead)
})
ggplot(data = acp$li, aes(x = Axis1, y = Axis2)) +
geom_point(colour = 'lightgreen', size = 0.1) +
scale_x_continuous(limits = c(-3, 3)) +
scale_y_continuous(limits = c(-2, 2)) +
geom_point(data = sup$coor, aes(x = Axis1, y = Axis2), colour = 'red', size = 2, shape = 17) +
geom_text(data = sup$coor, aes(x = Axis1, y = Axis2, label = rownames(sup$coor)), vjust = 1, hjust = 0.5, size = 3, color = 'red') +
geom_vline(xintercept = 0, linetype = "dashed", color = "black") +
geom_hline(yintercept = 0, linetype = "dashed", color = "black") +
labs(
title = 'Primer plano factorial',
x = paste0('F1 (', round(acp$eig[1] / 8 * 100, 2), '%)'),
y = paste0('F2 (', round(acp$eig[2] / 8 * 100, 2), '%)')
) +
theme_minimal()
## Warning: Removed 945 rows containing missing values or values outside the scale range
## (`geom_point()`).
fc$carac.cont[1]
## $`1`
## Test.Value Class.Mean Frequency Global.Mean
## surv2m 42.712 0.779 3417 0.636
## surv6m 37.527 0.649 3417 0.520
## age 3.362 63.360 3417 62.651
## num.co 2.911 1.922 3417 1.869
## diabetes -2.963 0.179 3417 0.195
## sod -9.068 136.829 3417 137.569
## dementia -10.017 0.008 3417 0.033
## resp -11.734 21.812 3417 23.330
## hday -15.751 2.456 3417 4.400
## scoma -28.266 2.642 3417 12.057
## hrt -28.417 85.032 3417 97.157
## hospdead -31.002 0.076 3417 0.259
## adlsc -36.859 0.890 3417 1.888
## temp -41.493 36.401 3417 37.103
## sps -43.435 19.713 3417 25.527
## aps -45.631 25.320 3417 37.600
fc$carac.cate[1]
## $`1`
## Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.Cancer 23.134 0 65.3 27.1 15.6 1420
## dzclass.COPD/CHF/Cirrhosis 21.102 0 53.5 44.8 31.4 2862
## ca.metastatic 16.902 0 54.7 29.7 20.4 1858
## ca.yes -8.437 0 27.1 9.9 13.8 1252
## ca.no -8.597 0 34.4 60.3 65.8 5995
## dzclass.Coma -14.677 0 11.6 2.0 6.5 596
## dzclass.ARF/MOSF -30.656 0 21.1 26.1 46.4 4227
El grupo 1 está caracterizado por tener valores altos en sps y aps.
fc$carac.cont[2]
## $`2`
## Test.Value Class.Mean Frequency Global.Mean
## aps 60.335 68.286 1311 37.600
## sps 57.959 40.187 1311 25.527
## hospdead 31.893 0.616 1311 0.259
## hday 16.571 8.265 1311 4.400
## hrt 12.481 107.221 1311 97.157
## resp 6.841 25.004 1311 23.330
## scoma 4.942 15.169 1311 12.057
## sod -2.012 137.259 1311 137.569
## num.co -3.171 1.760 1311 1.869
## dementia -4.144 0.014 1311 0.033
## adlsc -6.251 1.568 1311 1.888
## age -7.283 59.749 1311 62.651
## temp -9.988 36.784 1311 37.103
## surv6m -43.579 0.238 1311 0.520
## surv2m -47.840 0.332 1311 0.636
fc$carac.cate[2]
## $`2`
## Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.ARF/MOSF 27.071 0 24.9 80.2 46.4 4227
## ca.yes 9.569 0 23.7 22.7 13.8 1252
## dzclass.Coma -6.360 0 6.4 2.9 6.5 596
## ca.metastatic -8.828 0 8.3 11.8 20.4 1858
## dzclass.Cancer -14.861 0 3.3 3.6 15.6 1420
## dzclass.COPD/CHF/Cirrhosis -16.280 0 6.1 13.3 31.4 2862
El grupo 2 tiene mejor probabilidad de supervivencia.
fc$carac.cont[3]
## $`3`
## Test.Value Class.Mean Frequency Global.Mean
## temp 61.277 38.461 2364 37.103
## hrt 27.992 112.790 2364 97.157
## resp 12.651 25.474 2364 23.330
## sod 10.601 138.700 2364 137.569
## surv6m 9.098 0.561 2364 0.520
## surv2m 8.703 0.674 2364 0.636
## hday 5.090 5.222 2364 4.400
## aps -2.362 36.768 2364 37.600
## sps -3.004 25.000 2364 25.527
## hospdead -3.695 0.231 2364 0.259
## dementia -4.293 0.019 2364 0.033
## scoma -5.646 9.596 2364 12.057
## age -6.869 60.755 2364 62.651
## num.co -8.667 1.662 2364 1.869
## adlsc -16.357 1.308 2364 1.888
fc$carac.cate[3]
## $`3`
## Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.ARF/MOSF 13.567 0 32.6 58.4 46.4 4227
## ca.no 5.304 0 27.7 70.2 65.8 5995
## ca.metastatic -6.450 0 20.3 15.9 20.4 1858
## dzclass.Cancer -7.298 0 18.5 11.1 15.6 1420
## dzclass.COPD/CHF/Cirrhosis -8.630 0 20.2 24.5 31.4 2862
El grupo 3 está caracterizado por pacientes con fiebre, frecuencia cardíaca y respiratoria altas, y niveles altos de sodio sérico.
fc$carac.cont[4]
## $`4`
## Test.Value Class.Mean Frequency Global.Mean
## adlsc 68.187 5.078 1527 1.888
## dementia 20.617 0.118 1527 0.033
## num.co 14.200 2.314 1527 1.869
## age 10.149 66.346 1527 62.651
## diabetes 6.284 0.253 1527 0.195
## surv2m 3.476 0.656 1527 0.636
## sod -2.113 137.271 1527 137.569
## sps -2.217 25.014 1527 25.527
## aps -2.405 36.483 1527 37.600
## hday -2.538 3.859 1527 4.400
## resp -4.358 22.356 1527 23.330
## scoma -5.977 8.620 1527 12.057
## hrt -7.302 91.777 1527 97.157
## temp -11.691 36.762 1527 37.103
fc$carac.cate[4]
## $`4`
## Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.COPD/CHF/Cirrhosis 4.663 0.000 19.4 36.4 31.4 2862
## dzclass.ARF/MOSF 2.026 0.043 17.5 48.5 46.4 4227
## ca.metastatic -2.379 0.017 15.1 18.4 20.4 1858
## dzclass.Cancer -4.887 0.000 12.5 11.7 15.6 1420
## dzclass.Coma -5.767 0.000 8.9 3.5 6.5 596
El grupo 4 incluye pacientes con mala función neurológica y altos valores en sps y aps, generalmente con un desenlace fatal.
fc$carac.cont[5]
## $`5`
## Test.Value Class.Mean Frequency Global.Mean
## scoma 74.113 92.638 486 12.057
## hospdead 26.069 0.763 486 0.259
## aps 12.662 48.722 486 37.600
## sps 12.583 31.024 486 25.527
## adlsc 7.730 2.572 486 1.888
## sod 5.511 139.035 486 137.569
## temp 4.890 37.374 486 37.103
## hday 2.338 5.342 486 4.400
## dementia 2.156 0.049 486 0.033
## resp -2.842 22.130 486 23.330
## num.co -8.016 1.393 486 1.869
## surv6m -33.482 0.146 486 0.520
## surv2m -40.038 0.197 486 0.636
fc$carac.cate[5]
## $`5`
## Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.Coma 33.514 0 49.2 60.3 6.5 596
## ca.no 7.438 0 6.5 80.7 65.8 5995
## dzclass.ARF/MOSF -5.797 0 3.9 34.0 46.4 4227
## ca.metastatic -9.178 0 1.6 6.0 20.4 1858
## dzclass.Cancer -11.085 0 0.4 1.2 15.6 1420
## dzclass.COPD/CHF/Cirrhosis -15.160 0 0.8 4.5 31.4 2862
El grupo 5 está formado por pacientes con enfermedades crónicas graves y cáncer metastásico.