library(FactoMineR)
data = read.csv("suicidios.csv")
data
## X Poison Gas_home Alt_gas Hanging Drowning Shot Knives Jump Other
## 1 10-15 32 0 3 267 1 18 1 16 15
## 2 15-20 701 9 78 659 28 194 13 117 222
## 3 20-25 1348 36 249 810 68 325 44 187 356
## 4 25-30 1243 32 270 773 85 294 45 195 301
## 5 30-35 1446 19 286 1003 116 305 72 215 359
## 6 35-40 1806 32 357 1550 151 317 63 232 378
## 7 40-45 1492 17 274 1616 165 317 75 181 284
## 8 45-50 1571 15 227 1828 165 360 89 198 278
## 9 50-55 1626 21 162 1973 271 250 99 192 277
## 10 55-60 1225 9 91 1499 212 165 76 158 169
## 11 60-65 1336 13 82 1951 328 173 87 232 236
## 12 65-70 1253 16 35 2145 346 168 94 271 185
## 13 70-75 1049 11 25 1878 334 122 71 248 128
## 14 75-80 761 12 10 1286 224 80 59 208 69
## 15 80-85 451 5 4 702 117 18 28 130 42
## 16 85-90 183 5 0 342 30 10 15 52 12
## 17 90+ 42 1 1 95 8 2 6 13 2
data.ca = CA(data[,-1],graph = FALSE)
data.ca$eig
## eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.0694940744 86.0024055 86.00241
## dim 2 0.0048098640 5.9524481 91.95485
## dim 3 0.0028707094 3.5526469 95.50750
## dim 4 0.0016976121 2.1008802 97.60838
## dim 5 0.0007876981 0.9748160 98.58320
## dim 6 0.0005988141 0.7410625 99.32426
## dim 7 0.0003376145 0.4178148 99.74207
## dim 8 0.0002084166 0.2579260 100.00000
data.ca$row
## $coord
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## 1 -0.47076631 -0.602799748 0.117254482 0.154934627 0.0752564728
## 2 0.23423133 -0.099698051 0.175095295 -0.077734925 -0.0234733631
## 3 0.40504148 0.033638285 0.063332528 -0.011705489 -0.0109710727
## 4 0.39065198 0.057292230 0.025285887 0.041883278 0.0246992945
## 5 0.31742999 0.047709317 0.003336145 0.004568591 0.0120022369
## 6 0.22405294 0.003621894 -0.043241676 0.046289217 -0.0006998971
## 7 0.11705965 -0.055232530 -0.063722215 0.014743542 0.0189892216
## 8 0.06152602 -0.082971007 -0.036848912 -0.009336511 -0.0126956713
## 9 -0.06058114 -0.009446481 -0.049266377 -0.040417602 -0.0195263961
## 10 -0.11879646 0.007085884 -0.051141063 -0.039705948 -0.0460370831
## 11 -0.19999233 0.023765683 -0.003388599 -0.040010167 0.0212496206
## 12 -0.29487220 0.007980378 0.022833653 -0.015417128 0.0178361494
## 13 -0.34571862 0.031829127 0.015574098 -0.001416293 0.0402737870
## 14 -0.35037821 0.068602700 0.039278656 0.038901806 0.0008036997
## 15 -0.35584429 0.104678274 0.059322477 0.073243649 -0.0412911673
## 16 -0.37356795 -0.036754826 0.062593384 0.140606312 -0.1245937429
## 17 -0.42580855 -0.072999560 0.005254154 0.167838122 -0.0991075393
##
## $contrib
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## 1 2.1156131 50.11717875 3.177188379 9.380625772 4.769811129
## 2 2.9985209 7.84883923 40.562491018 13.519443247 2.656780674
## 3 15.1864657 1.51335349 8.988141452 0.519213705 0.982978094
## 4 13.3631150 4.15273370 1.355322282 6.288083381 4.712861738
## 5 10.4117502 3.39820227 0.027840456 0.088288020 1.313228154
## 6 6.6329324 0.02504326 5.980917997 11.589728527 0.005710322
## 7 1.6382712 5.26958204 11.751994997 1.063859573 3.803413993
## 8 0.4843077 12.72540047 4.205441960 0.456543670 1.819294665
## 9 0.4834414 0.16983376 7.739782093 8.808852657 4.430993140
## 10 1.3754431 0.07070313 6.170688730 6.290078168 18.223808304
## 11 4.8002603 0.97938552 0.033360841 7.864808319 4.781106471
## 12 10.6116713 0.11229957 1.540371573 1.187496689 3.425360561
## 13 12.4956308 1.53030182 0.613870883 0.008584766 14.960480611
## 14 8.9936087 4.98146637 2.736097610 4.538461579 0.004174797
## 15 5.1261652 6.40915378 3.448813500 8.890411601 6.089405289
## 16 2.4492590 0.34256203 1.664603929 14.204124056 24.036759596
## 17 0.8335439 0.35396082 0.003072301 5.301396270 3.983832462
##
## $cos2
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## 1 0.3500908 0.5740054926 0.0217184502 3.791988e-02 8.946592e-03
## 2 0.5325281 0.0964774701 0.2975784828 5.865229e-02 5.348145e-03
## 3 0.9610182 0.0066282715 0.0234955835 8.026232e-04 7.050676e-04
## 4 0.9557905 0.0205576795 0.0040044145 1.098662e-02 3.820777e-03
## 5 0.9524991 0.0215166700 0.0001052104 1.973028e-04 1.361736e-03
## 6 0.8909282 0.0002328161 0.0331853529 3.802779e-02 8.693803e-06
## 7 0.6338688 0.1411155074 0.1878307112 1.005515e-02 1.668012e-02
## 8 0.2619606 0.4763992578 0.0939653412 6.032365e-03 1.115398e-02
## 9 0.4163013 0.0101221543 0.2753176750 1.852994e-01 4.324910e-02
## 10 0.6853541 0.0024383502 0.1270127994 7.656303e-02 1.029256e-01
## 11 0.9207515 0.0130021848 0.0002643359 3.685161e-02 1.039485e-02
## 12 0.9841937 0.0007208749 0.0059015180 2.690419e-03 3.600934e-03
## 13 0.9746030 0.0082609821 0.0019778259 1.635644e-05 1.322596e-02
## 14 0.9311972 0.0356984928 0.0117025552 1.147908e-02 4.899538e-06
## 15 0.8416960 0.0728363805 0.0233923475 3.565950e-02 1.133312e-02
## 16 0.7694893 0.0074488996 0.0216033075 1.090117e-01 8.559647e-02
## 17 0.7627936 0.0224191320 0.0001161405 1.185112e-01 4.132299e-02
##
## $inertia
## [1] 0.0041995558 0.0039130223 0.0109817838 0.0097161181 0.0075963848
## [6] 0.0051738119 0.0017961153 0.0012847930 0.0008070192 0.0013946826
## [11] 0.0036230151 0.0074929180 0.0089100104 0.0067118171 0.0042323846
## [16] 0.0022119734 0.0007593976
data.ca$col
## $coord
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## Poison 0.12070936 0.03959891 -0.018011165 -0.01232056 -0.027972801
## Gas_home 0.35331891 0.15546898 0.132236812 0.15476639 -0.030483611
## Alt_gas 0.66685485 -0.01071186 -0.128157403 0.10569780 0.059556911
## Hanging -0.22564899 -0.06023821 -0.004266693 0.01018109 0.001922107
## Drowning -0.41881981 0.18015639 -0.040895139 -0.05774810 0.073383496
## Shot 0.37772108 -0.08829180 0.042991245 -0.05114832 0.027082479
## Knives -0.13879124 0.07641806 -0.101240563 -0.01433525 -0.042067206
## Jump -0.08154405 0.10500438 0.143810113 0.09524737 0.004063094
## Other 0.37601996 -0.01709111 0.092336497 -0.06126467 0.024335549
##
## $contrib
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## Poison 6.9211917 10.76168859 3.7302775 2.9516799 32.7913153
## Gas_home 0.8540929 2.38931719 2.8962405 6.7086314 0.5609086
## Alt_gas 25.9035407 0.09656971 23.1602076 26.6402149 18.2284099
## Hanging 28.0580740 28.89017197 0.2428468 2.3382395 0.1796115
## Drowning 12.5657149 33.59287004 2.9002450 9.7795183 34.0343537
## Shot 12.0301032 9.49691637 3.7726412 9.0302333 5.4562180
## Knives 0.4881064 2.13794929 6.2872112 0.2131623 3.9560856
## Jump 0.5115848 12.25639845 38.5185988 28.5725103 0.1120559
## Other 12.6675915 0.37811840 18.4917314 13.7658101 4.6810415
##
## $cos2
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## Poison 0.8341123 0.0897654263 0.0185706135 0.008689676 4.479345e-02
## Gas_home 0.4966324 0.0961587427 0.0695674394 0.095291588 3.696869e-03
## Alt_gas 0.9338817 0.0002409676 0.0344918611 0.023461789 7.448924e-03
## Hanging 0.9308649 0.0663382417 0.0003328148 0.001894997 6.754215e-05
## Drowning 0.8031954 0.1486161933 0.0076579081 0.015270109 2.465832e-02
## Shot 0.8862633 0.0484240451 0.0114810179 0.016251112 4.556141e-03
## Knives 0.3772276 0.1143592701 0.2007189883 0.004024297 3.465506e-02
## Jump 0.1370227 0.2272076016 0.4261739501 0.186945083 3.401902e-04
## Other 0.8963246 0.0018517575 0.0540493289 0.023793796 3.754273e-03
##
## $inertia
## [1] 0.0057663914 0.0011951374 0.0192759169 0.0209468616 0.0108721083
## [6] 0.0094330979 0.0008992052 0.0025946143 0.0098214701
tabla_data <- as.table(as.matrix(data[,-1]))
n <- sum(tabla_data)
nf <- min(dim(tabla_data)) - 1
tr <- sum(data.ca$eig[,1]) # compute the trace
ccor <- sqrt(data.ca$eig[,1]) # canonical correlations
malin <- n*(tr-cumsum(data.ca$eig[,1])) # Malinvaud test
dfm <- rep(0,nf) # degrees of freedom
for (i in 1:nf) { # iteración para test
dfm[i] <- (dim(tabla_data)[1]-1-i)*(dim(tabla_data)[2]-1-i)
}
peig <- pchisq(malin,dfm,lower.tail = FALSE) # valor p del chi-cuadrado
teig <- cbind(ccor,data.ca$eig,malin,dfm,peig) # tabla de autovalores
colnames(teig) <- c("Correlaciones","Autovalores","Inercia","Iner.Cumul.","Malinvaud","Df","valor-p")
teig
## Correlaciones Autovalores Inercia Iner.Cumul. Malinvaud Df
## dim 1 0.26361729 0.0694940744 86.0024055 86.00241 601.85518 105
## dim 2 0.06935318 0.0048098640 5.9524481 91.95485 345.91751 84
## dim 3 0.05357900 0.0028707094 3.5526469 95.50750 193.16420 65
## dim 4 0.04120209 0.0016976121 2.1008802 97.60838 102.83256 48
## dim 5 0.02806596 0.0007876981 0.9748160 98.58320 60.91835 33
## dim 6 0.02447068 0.0005988141 0.7410625 99.32426 29.05486 20
## dim 7 0.01837429 0.0003376145 0.4178148 99.74207 11.09006 9
## dim 8 0.01443664 0.0002084166 0.2579260 100.00000 0.00000 0
## valor-p
## dim 1 9.619658e-71
## dim 2 1.708775e-33
## dim 3 1.206768e-14
## dim 4 7.237679e-06
## dim 5 2.183622e-03
## dim 6 8.668476e-02
## dim 7 2.695865e-01
## dim 8 1.000000e+00
sr <- data.ca$row
tabrow <- list()
for (i in 1:1) {
rcum <- t(apply(sr$cos2,1,cumsum))
trow <- cbind(sr$inertia,sr$contrib[,i],sr$coord[,i],sr$cos2[,i],rcum[,i])
colnames(trow) <- c("inertia","contributions","coordinates","quality","cum.qual.")
tabrow[[i]] <- trow
}
tabrow
## [[1]]
## inertia contributions coordinates quality cum.qual.
## 1 0.0041995558 2.1156131 -0.47076631 0.3500908 0.3500908
## 2 0.0039130223 2.9985209 0.23423133 0.5325281 0.5325281
## 3 0.0109817838 15.1864657 0.40504148 0.9610182 0.9610182
## 4 0.0097161181 13.3631150 0.39065198 0.9557905 0.9557905
## 5 0.0075963848 10.4117502 0.31742999 0.9524991 0.9524991
## 6 0.0051738119 6.6329324 0.22405294 0.8909282 0.8909282
## 7 0.0017961153 1.6382712 0.11705965 0.6338688 0.6338688
## 8 0.0012847930 0.4843077 0.06152602 0.2619606 0.2619606
## 9 0.0008070192 0.4834414 -0.06058114 0.4163013 0.4163013
## 10 0.0013946826 1.3754431 -0.11879646 0.6853541 0.6853541
## 11 0.0036230151 4.8002603 -0.19999233 0.9207515 0.9207515
## 12 0.0074929180 10.6116713 -0.29487220 0.9841937 0.9841937
## 13 0.0089100104 12.4956308 -0.34571862 0.9746030 0.9746030
## 14 0.0067118171 8.9936087 -0.35037821 0.9311972 0.9311972
## 15 0.0042323846 5.1261652 -0.35584429 0.8416960 0.8416960
## 16 0.0022119734 2.4492590 -0.37356795 0.7694893 0.7694893
## 17 0.0007593976 0.8335439 -0.42580855 0.7627936 0.7627936
En este caso, se observa en la tabla de autovalores (teig) que las dos primeras dimensiones explican aproximadamente:
Juntas explican un 91.95% de la inercia total, lo cual sugiere que estas dos dimensiones son las más relevantes
Además, en el test de Malinvaud (valor-p), el valor p es menor a 0.05 para las primeras cinco dimensiones (Dim 1 a Dim 5), pero se hace no significativo a partir de la sexta dimensión. Esto indica que se podrían considerar como significativas las primeras cinco dimensiones, aunque las primeras dos son las más relevantes ya que explican la mayoría de la inercia.
De la tabla (teig), las correlaciones son:
La Dim 1 tiene la correlación más alta, lo que indica una fuerte asociación entre las filas y columnas en esta primera dimensión.
Para cada dimensión, observamos las columnas de “contribuciones” y “calidad” (cos2). La contribución indica cuánto aporta cada variable (fila o columna) a la dimensión, mientras que la calidad (cos2) indica qué tan bien está representada la variable en esa dimensión. A continuación, se resumen las variables más relevantes para las dos primeras dimensiones:
Para las filas:
Dim 1: Las edades que más contribuyen y están bien representadas son las filas 3, 4, 5, 12 y 13. Todas tienen un cos2 muy cercano a 1, lo que indica una excelente representación en la primera dimensión.
Dim 2: La fila 1 y las filas 8, 7 y 2 son las que más contribuyen a esta dimensión. La fila 1 tiene un cos2 de 0.5740 y contribuye con el 50.12% a esta dimensión.
Para las columnas:
Dim 1: Los métodos “Hanging”, “Alt_gas” y “Drowning” tienen las mayores contribuciones (28.06%, 25.90% y 12.56%, respectivamente), y están bien representados con un cos2 cercano a 1.
Dim 2: Las columnas con mayores contribuciones son “Drowning” y “Jump”, con contribuciones del 33.59% y 12.26%, respectivamente.
Con base en las coordenadas, contribuciones y la representación de las variables, es posible asignar significados a las dos primeras dimensiones:
Dim 1 parece diferenciar los métodos de suicidio que tienen mayores conteos entre las diferentes edades, como “Hanging”, “Alt_gas”, “Shot” y “Other”. Estas variables están muy asociadas en la primera dimensión y contribuyen significativamente, lo que podría interpretarse como un grupo de métodos con alta frecuencia en varios grupos de edad.
Dim 2 podría estar reflejando métodos menos comunes como “Drowning” y “Knives”, que aparecen más claramente en esta segunda dimensión
plot.CA(data.ca,graph.type = "classic")
El gráfico que presentas muestra el mapa de factores del análisis de correspondencias, donde se representan tanto las categorías de edad (números azules) como los métodos de suicidio (etiquetas rojas). La interpretación se basa en la posición relativa de estos puntos en las dos primeras dimensiones:
Dimensión 1 (86.00%): Es la dimensión que explica la mayor parte de la inercia (varianza), indicando que las asociaciones principales se encuentran a lo largo de esta dimensión.
Dimensión 2 (5.95%): Explica un porcentaje menor de la inercia, pero podría mostrar ciertas distinciones entre grupos específicos.
Asociaciones entre categorías de edad y métodos de suicidio:
“Hanging” (colgado), se ubica cerca del centro de ambas dimensiones, lo que indica que este método de suicidio se distribuye de manera uniforme entre varias categorías de edad
“Alt_gas”, “Other y”Shot” están ubicados hacia la derecha de la Dim 1. Esto sugiere que estas categorías están asociadas con edades más avanzadas en la Dim 1 (etiquetas de edad de 4 a 9, correspondientes a edades de 30-55 años).
“Drowning” se sitúa en la parte superior izquierda, destacando una asociación con la categoría 15 (edad de 40-45 años) en la segunda dimensión. Esto coincide con las contribuciones en la Dim 2 que indicaron una asociación entre “Drowning” y algunas categorías de edad menos comunes
Distribución de edades:
Las edades 1, 17 y 16 se sitúan lejos del centro de la Dim 2, lo que indica que estas edades tienen un comportamiento distinto al de las demás en cuanto a la frecuencia de los métodos de suicidio. Estas edades extremas corresponden a 10-15 años (1) y mayores de 50 años (16 y 17)
La mayoría de las categorías de edad están bastante centradas en ambas dimensiones, lo cual indica que estas edades no tienen un método de suicidio específico o dominante.
El análisis anterior había identificado a las dimensiones 1 y 2 como las más relevantes. Habíamos visto que la Dim 1 está altamente relacionada con métodos comunes como “Hanging” y “Alt_gas”, y en el gráfico observamos que efectivamente se encuentran ubicados cerca del centro de la dimensión 1, reflejando que estos métodos están distribuidos de forma más homogénea en las diferentes edades
En el análisis de las contribuciones, se destacó que la Dim 2 tenía contribuciones altas de métodos como “Drowning” y “Jump”, que en el gráfico están posicionados alejados del centro en esta segunda dimensión. Esto es consistente, ya que estas variables contribuyen significativamente a la Dim 2 y parecen estar asociadas a ciertas categorías de edad específicas
En resumen, los resultados del análisis de correspondencias indican que las dos primeras dimensiones explican la mayor parte de la inercia y muestran asociaciones claras entre los diferentes métodos de suicidio y las edades. La primera dimensión parece reflejar métodos de suicidio con alta frecuencia, mientras que la segunda dimensión destaca algunos métodos menos comunes.
El test de Malinvaud sugiere que las primeras cinco dimensiones son significativas, aunque la mayor parte de la información se concentra en las dos primeras dimensiones.