library(FactoMineR)

Suicidios.csv

data = read.csv("suicidios.csv")
data
##        X Poison Gas_home Alt_gas Hanging Drowning Shot Knives Jump Other
## 1  10-15     32        0       3     267        1   18      1   16    15
## 2  15-20    701        9      78     659       28  194     13  117   222
## 3  20-25   1348       36     249     810       68  325     44  187   356
## 4  25-30   1243       32     270     773       85  294     45  195   301
## 5  30-35   1446       19     286    1003      116  305     72  215   359
## 6  35-40   1806       32     357    1550      151  317     63  232   378
## 7  40-45   1492       17     274    1616      165  317     75  181   284
## 8  45-50   1571       15     227    1828      165  360     89  198   278
## 9  50-55   1626       21     162    1973      271  250     99  192   277
## 10 55-60   1225        9      91    1499      212  165     76  158   169
## 11 60-65   1336       13      82    1951      328  173     87  232   236
## 12 65-70   1253       16      35    2145      346  168     94  271   185
## 13 70-75   1049       11      25    1878      334  122     71  248   128
## 14 75-80    761       12      10    1286      224   80     59  208    69
## 15 80-85    451        5       4     702      117   18     28  130    42
## 16 85-90    183        5       0     342       30   10     15   52    12
## 17   90+     42        1       1      95        8    2      6   13     2
data.ca = CA(data[,-1],graph = FALSE)
data.ca$eig
##         eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.0694940744             86.0024055                          86.00241
## dim 2 0.0048098640              5.9524481                          91.95485
## dim 3 0.0028707094              3.5526469                          95.50750
## dim 4 0.0016976121              2.1008802                          97.60838
## dim 5 0.0007876981              0.9748160                          98.58320
## dim 6 0.0005988141              0.7410625                          99.32426
## dim 7 0.0003376145              0.4178148                          99.74207
## dim 8 0.0002084166              0.2579260                         100.00000
data.ca$row
## $coord
##          Dim 1        Dim 2        Dim 3        Dim 4         Dim 5
## 1  -0.47076631 -0.602799748  0.117254482  0.154934627  0.0752564728
## 2   0.23423133 -0.099698051  0.175095295 -0.077734925 -0.0234733631
## 3   0.40504148  0.033638285  0.063332528 -0.011705489 -0.0109710727
## 4   0.39065198  0.057292230  0.025285887  0.041883278  0.0246992945
## 5   0.31742999  0.047709317  0.003336145  0.004568591  0.0120022369
## 6   0.22405294  0.003621894 -0.043241676  0.046289217 -0.0006998971
## 7   0.11705965 -0.055232530 -0.063722215  0.014743542  0.0189892216
## 8   0.06152602 -0.082971007 -0.036848912 -0.009336511 -0.0126956713
## 9  -0.06058114 -0.009446481 -0.049266377 -0.040417602 -0.0195263961
## 10 -0.11879646  0.007085884 -0.051141063 -0.039705948 -0.0460370831
## 11 -0.19999233  0.023765683 -0.003388599 -0.040010167  0.0212496206
## 12 -0.29487220  0.007980378  0.022833653 -0.015417128  0.0178361494
## 13 -0.34571862  0.031829127  0.015574098 -0.001416293  0.0402737870
## 14 -0.35037821  0.068602700  0.039278656  0.038901806  0.0008036997
## 15 -0.35584429  0.104678274  0.059322477  0.073243649 -0.0412911673
## 16 -0.37356795 -0.036754826  0.062593384  0.140606312 -0.1245937429
## 17 -0.42580855 -0.072999560  0.005254154  0.167838122 -0.0991075393
## 
## $contrib
##         Dim 1       Dim 2        Dim 3        Dim 4        Dim 5
## 1   2.1156131 50.11717875  3.177188379  9.380625772  4.769811129
## 2   2.9985209  7.84883923 40.562491018 13.519443247  2.656780674
## 3  15.1864657  1.51335349  8.988141452  0.519213705  0.982978094
## 4  13.3631150  4.15273370  1.355322282  6.288083381  4.712861738
## 5  10.4117502  3.39820227  0.027840456  0.088288020  1.313228154
## 6   6.6329324  0.02504326  5.980917997 11.589728527  0.005710322
## 7   1.6382712  5.26958204 11.751994997  1.063859573  3.803413993
## 8   0.4843077 12.72540047  4.205441960  0.456543670  1.819294665
## 9   0.4834414  0.16983376  7.739782093  8.808852657  4.430993140
## 10  1.3754431  0.07070313  6.170688730  6.290078168 18.223808304
## 11  4.8002603  0.97938552  0.033360841  7.864808319  4.781106471
## 12 10.6116713  0.11229957  1.540371573  1.187496689  3.425360561
## 13 12.4956308  1.53030182  0.613870883  0.008584766 14.960480611
## 14  8.9936087  4.98146637  2.736097610  4.538461579  0.004174797
## 15  5.1261652  6.40915378  3.448813500  8.890411601  6.089405289
## 16  2.4492590  0.34256203  1.664603929 14.204124056 24.036759596
## 17  0.8335439  0.35396082  0.003072301  5.301396270  3.983832462
## 
## $cos2
##        Dim 1        Dim 2        Dim 3        Dim 4        Dim 5
## 1  0.3500908 0.5740054926 0.0217184502 3.791988e-02 8.946592e-03
## 2  0.5325281 0.0964774701 0.2975784828 5.865229e-02 5.348145e-03
## 3  0.9610182 0.0066282715 0.0234955835 8.026232e-04 7.050676e-04
## 4  0.9557905 0.0205576795 0.0040044145 1.098662e-02 3.820777e-03
## 5  0.9524991 0.0215166700 0.0001052104 1.973028e-04 1.361736e-03
## 6  0.8909282 0.0002328161 0.0331853529 3.802779e-02 8.693803e-06
## 7  0.6338688 0.1411155074 0.1878307112 1.005515e-02 1.668012e-02
## 8  0.2619606 0.4763992578 0.0939653412 6.032365e-03 1.115398e-02
## 9  0.4163013 0.0101221543 0.2753176750 1.852994e-01 4.324910e-02
## 10 0.6853541 0.0024383502 0.1270127994 7.656303e-02 1.029256e-01
## 11 0.9207515 0.0130021848 0.0002643359 3.685161e-02 1.039485e-02
## 12 0.9841937 0.0007208749 0.0059015180 2.690419e-03 3.600934e-03
## 13 0.9746030 0.0082609821 0.0019778259 1.635644e-05 1.322596e-02
## 14 0.9311972 0.0356984928 0.0117025552 1.147908e-02 4.899538e-06
## 15 0.8416960 0.0728363805 0.0233923475 3.565950e-02 1.133312e-02
## 16 0.7694893 0.0074488996 0.0216033075 1.090117e-01 8.559647e-02
## 17 0.7627936 0.0224191320 0.0001161405 1.185112e-01 4.132299e-02
## 
## $inertia
##  [1] 0.0041995558 0.0039130223 0.0109817838 0.0097161181 0.0075963848
##  [6] 0.0051738119 0.0017961153 0.0012847930 0.0008070192 0.0013946826
## [11] 0.0036230151 0.0074929180 0.0089100104 0.0067118171 0.0042323846
## [16] 0.0022119734 0.0007593976
data.ca$col
## $coord
##                Dim 1       Dim 2        Dim 3       Dim 4        Dim 5
## Poison    0.12070936  0.03959891 -0.018011165 -0.01232056 -0.027972801
## Gas_home  0.35331891  0.15546898  0.132236812  0.15476639 -0.030483611
## Alt_gas   0.66685485 -0.01071186 -0.128157403  0.10569780  0.059556911
## Hanging  -0.22564899 -0.06023821 -0.004266693  0.01018109  0.001922107
## Drowning -0.41881981  0.18015639 -0.040895139 -0.05774810  0.073383496
## Shot      0.37772108 -0.08829180  0.042991245 -0.05114832  0.027082479
## Knives   -0.13879124  0.07641806 -0.101240563 -0.01433525 -0.042067206
## Jump     -0.08154405  0.10500438  0.143810113  0.09524737  0.004063094
## Other     0.37601996 -0.01709111  0.092336497 -0.06126467  0.024335549
## 
## $contrib
##               Dim 1       Dim 2      Dim 3      Dim 4      Dim 5
## Poison    6.9211917 10.76168859  3.7302775  2.9516799 32.7913153
## Gas_home  0.8540929  2.38931719  2.8962405  6.7086314  0.5609086
## Alt_gas  25.9035407  0.09656971 23.1602076 26.6402149 18.2284099
## Hanging  28.0580740 28.89017197  0.2428468  2.3382395  0.1796115
## Drowning 12.5657149 33.59287004  2.9002450  9.7795183 34.0343537
## Shot     12.0301032  9.49691637  3.7726412  9.0302333  5.4562180
## Knives    0.4881064  2.13794929  6.2872112  0.2131623  3.9560856
## Jump      0.5115848 12.25639845 38.5185988 28.5725103  0.1120559
## Other    12.6675915  0.37811840 18.4917314 13.7658101  4.6810415
## 
## $cos2
##              Dim 1        Dim 2        Dim 3       Dim 4        Dim 5
## Poison   0.8341123 0.0897654263 0.0185706135 0.008689676 4.479345e-02
## Gas_home 0.4966324 0.0961587427 0.0695674394 0.095291588 3.696869e-03
## Alt_gas  0.9338817 0.0002409676 0.0344918611 0.023461789 7.448924e-03
## Hanging  0.9308649 0.0663382417 0.0003328148 0.001894997 6.754215e-05
## Drowning 0.8031954 0.1486161933 0.0076579081 0.015270109 2.465832e-02
## Shot     0.8862633 0.0484240451 0.0114810179 0.016251112 4.556141e-03
## Knives   0.3772276 0.1143592701 0.2007189883 0.004024297 3.465506e-02
## Jump     0.1370227 0.2272076016 0.4261739501 0.186945083 3.401902e-04
## Other    0.8963246 0.0018517575 0.0540493289 0.023793796 3.754273e-03
## 
## $inertia
## [1] 0.0057663914 0.0011951374 0.0192759169 0.0209468616 0.0108721083
## [6] 0.0094330979 0.0008992052 0.0025946143 0.0098214701
tabla_data <- as.table(as.matrix(data[,-1]))
n <- sum(tabla_data)
nf <- min(dim(tabla_data)) - 1


tr <- sum(data.ca$eig[,1]) # compute the trace
ccor <- sqrt(data.ca$eig[,1]) # canonical correlations
malin <- n*(tr-cumsum(data.ca$eig[,1])) # Malinvaud test
dfm <- rep(0,nf) # degrees of freedom
for (i in 1:nf) { # iteración para test
  dfm[i] <- (dim(tabla_data)[1]-1-i)*(dim(tabla_data)[2]-1-i)
  }
peig <- pchisq(malin,dfm,lower.tail = FALSE) # valor p del chi-cuadrado
teig <- cbind(ccor,data.ca$eig,malin,dfm,peig) # tabla de autovalores
colnames(teig) <- c("Correlaciones","Autovalores","Inercia","Iner.Cumul.","Malinvaud","Df","valor-p")
teig
##       Correlaciones  Autovalores    Inercia Iner.Cumul. Malinvaud  Df
## dim 1    0.26361729 0.0694940744 86.0024055    86.00241 601.85518 105
## dim 2    0.06935318 0.0048098640  5.9524481    91.95485 345.91751  84
## dim 3    0.05357900 0.0028707094  3.5526469    95.50750 193.16420  65
## dim 4    0.04120209 0.0016976121  2.1008802    97.60838 102.83256  48
## dim 5    0.02806596 0.0007876981  0.9748160    98.58320  60.91835  33
## dim 6    0.02447068 0.0005988141  0.7410625    99.32426  29.05486  20
## dim 7    0.01837429 0.0003376145  0.4178148    99.74207  11.09006   9
## dim 8    0.01443664 0.0002084166  0.2579260   100.00000   0.00000   0
##            valor-p
## dim 1 9.619658e-71
## dim 2 1.708775e-33
## dim 3 1.206768e-14
## dim 4 7.237679e-06
## dim 5 2.183622e-03
## dim 6 8.668476e-02
## dim 7 2.695865e-01
## dim 8 1.000000e+00
sr <- data.ca$row
tabrow <- list()
for (i in 1:1) {
  rcum <- t(apply(sr$cos2,1,cumsum))
  trow <- cbind(sr$inertia,sr$contrib[,i],sr$coord[,i],sr$cos2[,i],rcum[,i])
  colnames(trow) <- c("inertia","contributions","coordinates","quality","cum.qual.")
  tabrow[[i]] <- trow
}
tabrow
## [[1]]
##         inertia contributions coordinates   quality cum.qual.
## 1  0.0041995558     2.1156131 -0.47076631 0.3500908 0.3500908
## 2  0.0039130223     2.9985209  0.23423133 0.5325281 0.5325281
## 3  0.0109817838    15.1864657  0.40504148 0.9610182 0.9610182
## 4  0.0097161181    13.3631150  0.39065198 0.9557905 0.9557905
## 5  0.0075963848    10.4117502  0.31742999 0.9524991 0.9524991
## 6  0.0051738119     6.6329324  0.22405294 0.8909282 0.8909282
## 7  0.0017961153     1.6382712  0.11705965 0.6338688 0.6338688
## 8  0.0012847930     0.4843077  0.06152602 0.2619606 0.2619606
## 9  0.0008070192     0.4834414 -0.06058114 0.4163013 0.4163013
## 10 0.0013946826     1.3754431 -0.11879646 0.6853541 0.6853541
## 11 0.0036230151     4.8002603 -0.19999233 0.9207515 0.9207515
## 12 0.0074929180    10.6116713 -0.29487220 0.9841937 0.9841937
## 13 0.0089100104    12.4956308 -0.34571862 0.9746030 0.9746030
## 14 0.0067118171     8.9936087 -0.35037821 0.9311972 0.9311972
## 15 0.0042323846     5.1261652 -0.35584429 0.8416960 0.8416960
## 16 0.0022119734     2.4492590 -0.37356795 0.7694893 0.7694893
## 17 0.0007593976     0.8335439 -0.42580855 0.7627936 0.7627936

Análisis y Comentarios

¿Cuántos autovalores resultan significativos?

En este caso, se observa en la tabla de autovalores (teig) que las dos primeras dimensiones explican aproximadamente:

  1. Dim 1: 86.00% de la varianza
  2. Dim 2: 5.95% de la varianza

Juntas explican un 91.95% de la inercia total, lo cual sugiere que estas dos dimensiones son las más relevantes

Además, en el test de Malinvaud (valor-p), el valor p es menor a 0.05 para las primeras cinco dimensiones (Dim 1 a Dim 5), pero se hace no significativo a partir de la sexta dimensión. Esto indica que se podrían considerar como significativas las primeras cinco dimensiones, aunque las primeras dos son las más relevantes ya que explican la mayoría de la inercia.

¿Cuál es la correlación correspondiente?

De la tabla (teig), las correlaciones son:

  • Dim 1: 0.2636
  • Dim 2: 0.0694
  • Dim 3: 0.0536

La Dim 1 tiene la correlación más alta, lo que indica una fuerte asociación entre las filas y columnas en esta primera dimensión.

¿Cuáles son las variables que más contribuyen y que están mejor representadas?

Para cada dimensión, observamos las columnas de “contribuciones” y “calidad” (cos2). La contribución indica cuánto aporta cada variable (fila o columna) a la dimensión, mientras que la calidad (cos2) indica qué tan bien está representada la variable en esa dimensión. A continuación, se resumen las variables más relevantes para las dos primeras dimensiones:

Para las filas:

  1. Dim 1: Las edades que más contribuyen y están bien representadas son las filas 3, 4, 5, 12 y 13. Todas tienen un cos2 muy cercano a 1, lo que indica una excelente representación en la primera dimensión.

  2. Dim 2: La fila 1 y las filas 8, 7 y 2 son las que más contribuyen a esta dimensión. La fila 1 tiene un cos2 de 0.5740 y contribuye con el 50.12% a esta dimensión.

Para las columnas:

  1. Dim 1: Los métodos “Hanging”, “Alt_gas” y “Drowning” tienen las mayores contribuciones (28.06%, 25.90% y 12.56%, respectivamente), y están bien representados con un cos2 cercano a 1.

  2. Dim 2: Las columnas con mayores contribuciones son “Drowning” y “Jump”, con contribuciones del 33.59% y 12.26%, respectivamente.

¿Se consigue atribuir a una dimensión un significado real?

Con base en las coordenadas, contribuciones y la representación de las variables, es posible asignar significados a las dos primeras dimensiones:

Dim 1 parece diferenciar los métodos de suicidio que tienen mayores conteos entre las diferentes edades, como “Hanging”, “Alt_gas”, “Shot” y “Other”. Estas variables están muy asociadas en la primera dimensión y contribuyen significativamente, lo que podría interpretarse como un grupo de métodos con alta frecuencia en varios grupos de edad.

Dim 2 podría estar reflejando métodos menos comunes como “Drowning” y “Knives”, que aparecen más claramente en esta segunda dimensión

Análisis Gráfico:

plot.CA(data.ca,graph.type = "classic")

El gráfico que presentas muestra el mapa de factores del análisis de correspondencias, donde se representan tanto las categorías de edad (números azules) como los métodos de suicidio (etiquetas rojas). La interpretación se basa en la posición relativa de estos puntos en las dos primeras dimensiones:

  1. Dimensión 1 (86.00%): Es la dimensión que explica la mayor parte de la inercia (varianza), indicando que las asociaciones principales se encuentran a lo largo de esta dimensión.

  2. Dimensión 2 (5.95%): Explica un porcentaje menor de la inercia, pero podría mostrar ciertas distinciones entre grupos específicos.

Asociaciones entre categorías de edad y métodos de suicidio:

  • “Hanging” (colgado), se ubica cerca del centro de ambas dimensiones, lo que indica que este método de suicidio se distribuye de manera uniforme entre varias categorías de edad

  • “Alt_gas”, “Other y”Shot” están ubicados hacia la derecha de la Dim 1. Esto sugiere que estas categorías están asociadas con edades más avanzadas en la Dim 1 (etiquetas de edad de 4 a 9, correspondientes a edades de 30-55 años).

  • “Drowning” se sitúa en la parte superior izquierda, destacando una asociación con la categoría 15 (edad de 40-45 años) en la segunda dimensión. Esto coincide con las contribuciones en la Dim 2 que indicaron una asociación entre “Drowning” y algunas categorías de edad menos comunes

Distribución de edades:

  • Las edades 1, 17 y 16 se sitúan lejos del centro de la Dim 2, lo que indica que estas edades tienen un comportamiento distinto al de las demás en cuanto a la frecuencia de los métodos de suicidio. Estas edades extremas corresponden a 10-15 años (1) y mayores de 50 años (16 y 17)

  • La mayoría de las categorías de edad están bastante centradas en ambas dimensiones, lo cual indica que estas edades no tienen un método de suicidio específico o dominante.

El análisis anterior había identificado a las dimensiones 1 y 2 como las más relevantes. Habíamos visto que la Dim 1 está altamente relacionada con métodos comunes como “Hanging” y “Alt_gas”, y en el gráfico observamos que efectivamente se encuentran ubicados cerca del centro de la dimensión 1, reflejando que estos métodos están distribuidos de forma más homogénea en las diferentes edades

En el análisis de las contribuciones, se destacó que la Dim 2 tenía contribuciones altas de métodos como “Drowning” y “Jump”, que en el gráfico están posicionados alejados del centro en esta segunda dimensión. Esto es consistente, ya que estas variables contribuyen significativamente a la Dim 2 y parecen estar asociadas a ciertas categorías de edad específicas

Comentarios Finales :

En resumen, los resultados del análisis de correspondencias indican que las dos primeras dimensiones explican la mayor parte de la inercia y muestran asociaciones claras entre los diferentes métodos de suicidio y las edades. La primera dimensión parece reflejar métodos de suicidio con alta frecuencia, mientras que la segunda dimensión destaca algunos métodos menos comunes.

El test de Malinvaud sugiere que las primeras cinco dimensiones son significativas, aunque la mayor parte de la información se concentra en las dos primeras dimensiones.