ACP

Se determinará la asociación lineal entre las variables asociadas al estado del paciente haciendo uso del ACP y el círculo de correlaciones.

Variables activas

Se usarán las siguientes variables para la construcción de los ejes factoriales:

  1. adlsc
  2. scoma
  3. sps
  4. aps
  5. hrt
  6. resp
  7. temp
  8. sod

Variables ilustrativas

  1. age
  2. num.co
  3. hday
  4. surv2m
  5. surv6m
v_act <- c('adlsc','scoma','sps','aps','hrt','resp','temp','sod')
v_sup <- setdiff(cuantitativas,v_act)
Y <- datos[,v_act]

acp <- dudi.pca(Y, scannf = FALSE, nf = 8)

# Ayudas para la interpretación
ayuda <- inertia.dudi(acp, col.inertia = TRUE)

fig <- fviz_screeplot(acp, addlabels = TRUE, ylim = c(0, 100))
fig

# Coordenadas en los ejes factoriales de las variables suplementarias
coord <- cor(datos[v_sup], acp$li)
ayuda$col.rel[,1:5]
##            Axis1      Axis2      Axis3       Axis4       Axis5
## adlsc  -5.117606   2.587589  -8.879645 75.78414000  -1.0180939
## scoma -26.081384   3.231133 -17.499671  0.07756204  -2.4462262
## sps   -73.968749   7.445618   2.858768 -2.52651130   0.1245451
## aps   -77.202443   4.499119   2.298538 -1.79414417   1.0102531
## hrt   -12.953048 -42.364245   3.918229  0.73906588  -3.9530093
## resp   -5.344080 -25.174488  12.316883 10.34677550  29.2633385
## temp   -7.398965 -39.006543  -6.590921 -2.02775792 -22.5898897
## sod    -1.231374  -6.883329 -52.127153 -4.41934001  29.0613311
fig <- fviz_pca_var(acp, col.var = "black")
fviz_add(fig, coord[,1:2], color = c(rep('blue',3),rep('red',2)), geom = 'arrow', labelsize = 2)

# Cosenos cuadrados
cosenos <- within(ayuda$col.rel, {
  Plano <- abs(ayuda$col.rel[,1]) + abs(ayuda$col.rel[,2])
})

cosenos[,c('Axis1','Axis2','Plano')]
##            Axis1      Axis2     Plano
## adlsc  -5.117606   2.587589  7.705196
## scoma -26.081384   3.231133 29.312518
## sps   -73.968749   7.445618 81.414367
## aps   -77.202443   4.499119 81.701562
## hrt   -12.953048 -42.364245 55.317293
## resp   -5.344080 -25.174488 30.518569
## temp   -7.398965 -39.006543 46.405508
## sod    -1.231374  -6.883329  8.114703

Para el primer plano factorial, la primera componente está asociada a las variables sps y aps, que reflejan mayor gravedad en el estado fisiológico del paciente.

fig <- fviz_pca_var(acp, axes = c(2,5), col.var = "black")
fviz_add(fig, coord[4:5, c(2,5)], color = 'red', geom = 'arrow', labelsize = 2)

# Cosenos cuadrados
cosenos <- within(ayuda$col.rel, {
  Plano <- abs(ayuda$col.rel[,2]) + abs(ayuda$col.rel[,5])
})

cosenos[,c('Axis2','Axis5','Plano')]
##            Axis2       Axis5     Plano
## adlsc   2.587589  -1.0180939  3.605683
## scoma   3.231133  -2.4462262  5.677360
## sps     7.445618   0.1245451  7.570163
## aps     4.499119   1.0102531  5.509372
## hrt   -42.364245  -3.9530093 46.317254
## resp  -25.174488  29.2633385 54.437827
## temp  -39.006543 -22.5898897 61.596432
## sod    -6.883329  29.0613311 35.944660

Variables cualitativas ilustrativas

Variables de estado del paciente

datosaux <- within(datos, {
  sex <- as.factor(datos$sex)
  dzgroup <- as.factor(datos$dzgroup)
  dzclass <- as.factor(datos$dzclass)
  diabetes <- as.factor(datos$diabetes)
  dementia <- as.factor(datos$dementia)
  ca <- as.factor(datos$ca)
  hospdead <- as.factor(datos$hospdead)
})
ggplot(data = acp$li, aes(x = Axis1, y = Axis2)) +
  geom_point(colour = 'lightgreen', size = 0.1) +
  scale_x_continuous(limits = c(-3, 3)) +
  scale_y_continuous(limits = c(-2, 2)) +
  geom_point(data = sup$coor, aes(x = Axis1, y = Axis2), colour = 'red', size = 2, shape = 17) +
  geom_text(data = sup$coor, aes(x = Axis1, y = Axis2, label = rownames(sup$coor)), vjust = 1, hjust = 0.5, size = 3, color = 'red') +
  geom_vline(xintercept = 0, linetype = "dashed", color = "black") +
  geom_hline(yintercept = 0, linetype = "dashed", color = "black") +
  labs(
    title = 'Primer plano factorial',
    x = paste0('F1 (', round(acp$eig[1] / 8 * 100, 2), '%)'),
    y = paste0('F2 (', round(acp$eig[2] / 8 * 100, 2), '%)')
  ) +
  theme_minimal()
## Warning: Removed 945 rows containing missing values or values outside the scale range
## (`geom_point()`).

Conglomerados

Caracterización de los grupos

fc$carac.cont[1]
## $`1`
##          Test.Value Class.Mean Frequency Global.Mean
## surv2m       42.712      0.779      3417       0.636
## surv6m       37.527      0.649      3417       0.520
## age           3.362     63.360      3417      62.651
## num.co        2.911      1.922      3417       1.869
## diabetes     -2.963      0.179      3417       0.195
## sod          -9.068    136.829      3417     137.569
## dementia    -10.017      0.008      3417       0.033
## resp        -11.734     21.812      3417      23.330
## hday        -15.751      2.456      3417       4.400
## scoma       -28.266      2.642      3417      12.057
## hrt         -28.417     85.032      3417      97.157
## hospdead    -31.002      0.076      3417       0.259
## adlsc       -36.859      0.890      3417       1.888
## temp        -41.493     36.401      3417      37.103
## sps         -43.435     19.713      3417      25.527
## aps         -45.631     25.320      3417      37.600
fc$carac.cate[1]
## $`1`
##                            Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.Cancer                 23.134       0      65.3      27.1   15.6   1420
## dzclass.COPD/CHF/Cirrhosis     21.102       0      53.5      44.8   31.4   2862
## ca.metastatic                  16.902       0      54.7      29.7   20.4   1858
## ca.yes                         -8.437       0      27.1       9.9   13.8   1252
## ca.no                          -8.597       0      34.4      60.3   65.8   5995
## dzclass.Coma                  -14.677       0      11.6       2.0    6.5    596
## dzclass.ARF/MOSF              -30.656       0      21.1      26.1   46.4   4227

El grupo 1 está caracterizado por tener valores altos en sps y aps.

fc$carac.cont[2]
## $`2`
##          Test.Value Class.Mean Frequency Global.Mean
## aps          60.335     68.286      1311      37.600
## sps          57.959     40.187      1311      25.527
## hospdead     31.893      0.616      1311       0.259
## hday         16.571      8.265      1311       4.400
## hrt          12.481    107.221      1311      97.157
## resp          6.841     25.004      1311      23.330
## scoma         4.942     15.169      1311      12.057
## sod          -2.012    137.259      1311     137.569
## num.co       -3.171      1.760      1311       1.869
## dementia     -4.144      0.014      1311       0.033
## adlsc        -6.251      1.568      1311       1.888
## age          -7.283     59.749      1311      62.651
## temp         -9.988     36.784      1311      37.103
## surv6m      -43.579      0.238      1311       0.520
## surv2m      -47.840      0.332      1311       0.636
fc$carac.cate[2]
## $`2`
##                            Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.ARF/MOSF               27.071       0      24.9      80.2   46.4   4227
## ca.yes                          9.569       0      23.7      22.7   13.8   1252
## dzclass.Coma                   -6.360       0       6.4       2.9    6.5    596
## ca.metastatic                  -8.828       0       8.3      11.8   20.4   1858
## dzclass.Cancer                -14.861       0       3.3       3.6   15.6   1420
## dzclass.COPD/CHF/Cirrhosis    -16.280       0       6.1      13.3   31.4   2862

El grupo 2 tiene mejor probabilidad de supervivencia.

fc$carac.cont[3]
## $`3`
##          Test.Value Class.Mean Frequency Global.Mean
## temp         61.277     38.461      2364      37.103
## hrt          27.992    112.790      2364      97.157
## resp         12.651     25.474      2364      23.330
## sod          10.601    138.700      2364     137.569
## surv6m        9.098      0.561      2364       0.520
## surv2m        8.703      0.674      2364       0.636
## hday          5.090      5.222      2364       4.400
## aps          -2.362     36.768      2364      37.600
## sps          -3.004     25.000      2364      25.527
## hospdead     -3.695      0.231      2364       0.259
## dementia     -4.293      0.019      2364       0.033
## scoma        -5.646      9.596      2364      12.057
## age          -6.869     60.755      2364      62.651
## num.co       -8.667      1.662      2364       1.869
## adlsc       -16.357      1.308      2364       1.888
fc$carac.cate[3]
## $`3`
##                            Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.ARF/MOSF               13.567       0      32.6      58.4   46.4   4227
## ca.no                           5.304       0      27.7      70.2   65.8   5995
## ca.metastatic                  -6.450       0      20.3      15.9   20.4   1858
## dzclass.Cancer                 -7.298       0      18.5      11.1   15.6   1420
## dzclass.COPD/CHF/Cirrhosis     -8.630       0      20.2      24.5   31.4   2862

El grupo 3 está caracterizado por pacientes con fiebre, frecuencia cardíaca y respiratoria altas, y niveles altos de sodio sérico.

fc$carac.cont[4]
## $`4`
##          Test.Value Class.Mean Frequency Global.Mean
## adlsc        68.187      5.078      1527       1.888
## dementia     20.617      0.118      1527       0.033
## num.co       14.200      2.314      1527       1.869
## age          10.149     66.346      1527      62.651
## diabetes      6.284      0.253      1527       0.195
## surv2m        3.476      0.656      1527       0.636
## sod          -2.113    137.271      1527     137.569
## sps          -2.217     25.014      1527      25.527
## aps          -2.405     36.483      1527      37.600
## hday         -2.538      3.859      1527       4.400
## resp         -4.358     22.356      1527      23.330
## scoma        -5.977      8.620      1527      12.057
## hrt          -7.302     91.777      1527      97.157
## temp        -11.691     36.762      1527      37.103
fc$carac.cate[4]
## $`4`
##                            Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.COPD/CHF/Cirrhosis      4.663   0.000      19.4      36.4   31.4   2862
## dzclass.ARF/MOSF                2.026   0.043      17.5      48.5   46.4   4227
## ca.metastatic                  -2.379   0.017      15.1      18.4   20.4   1858
## dzclass.Cancer                 -4.887   0.000      12.5      11.7   15.6   1420
## dzclass.Coma                   -5.767   0.000       8.9       3.5    6.5    596

El grupo 4 incluye pacientes con mala función neurológica y altos valores en sps y aps, generalmente con un desenlace fatal.

fc$carac.cont[5]
## $`5`
##          Test.Value Class.Mean Frequency Global.Mean
## scoma        74.113     92.638       486      12.057
## hospdead     26.069      0.763       486       0.259
## aps          12.662     48.722       486      37.600
## sps          12.583     31.024       486      25.527
## adlsc         7.730      2.572       486       1.888
## sod           5.511    139.035       486     137.569
## temp          4.890     37.374       486      37.103
## hday          2.338      5.342       486       4.400
## dementia      2.156      0.049       486       0.033
## resp         -2.842     22.130       486      23.330
## num.co       -8.016      1.393       486       1.869
## surv6m      -33.482      0.146       486       0.520
## surv2m      -40.038      0.197       486       0.636
fc$carac.cate[5]
## $`5`
##                            Test.Value p.Value Class.Cat Cat.Class Global Weight
## dzclass.Coma                   33.514       0      49.2      60.3    6.5    596
## ca.no                           7.438       0       6.5      80.7   65.8   5995
## dzclass.ARF/MOSF               -5.797       0       3.9      34.0   46.4   4227
## ca.metastatic                  -9.178       0       1.6       6.0   20.4   1858
## dzclass.Cancer                -11.085       0       0.4       1.2   15.6   1420
## dzclass.COPD/CHF/Cirrhosis    -15.160       0       0.8       4.5   31.4   2862

El grupo 5 está formado por pacientes con enfermedades crónicas graves y cáncer metastásico.