library(ggplot2)
library(FactoMineR)
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

Decarid.csv

decarid = read.csv("Decarid.csv")
head(decarid)
##           X X100m Long.jump Shot.put High.jump X400m X110m.hurdle Discus
## 1    Sebrle 10.85      7.84    16.36      2.12 48.36        14.05  48.72
## 2      Clay 10.44      7.96    15.23      2.06 49.19        14.13  50.11
## 3    Karpov 10.50      7.81    15.93      2.09 46.81        13.97  51.65
## 4     Macey 10.89      7.47    15.73      2.15 48.97        14.56  48.34
## 5   Warners 10.62      7.74    14.48      1.97 47.97        14.01  43.73
## 6 Zsivoczky 10.91      7.14    15.31      2.12 49.40        14.95  45.62
##   Pole.vault Javeline X1500m
## 1        5.0    70.52 280.01
## 2        4.9    69.71 282.00
## 3        4.6    55.54 278.11
## 4        4.4    58.46 265.42
## 5        4.9    55.39 278.05
## 6        4.7    63.45 269.54
decarid.pca = PCA(decarid[,2:11],graph = FALSE)
decarid.pca$eig
##         eigenvalue percentage of variance cumulative percentage of variance
## comp 1   3.5446573              35.446573                          35.44657
## comp 2   1.9699560              19.699560                          55.14613
## comp 3   1.4217248              14.217248                          69.36338
## comp 4   0.9034912               9.034912                          78.39829
## comp 5   0.5636320               5.636320                          84.03461
## comp 6   0.5282270               5.282270                          89.31688
## comp 7   0.4328613               4.328613                          93.64550
## comp 8   0.3658102               3.658102                          97.30360
## comp 9   0.1634956               1.634956                          98.93855
## comp 10  0.1061447               1.061447                         100.00000
decarid.pca$var
## $coord
##                   Dim.1      Dim.2       Dim.3        Dim.4       Dim.5
## X100m        -0.7958383  0.2535993 -0.25277014  0.071298025  0.20112594
## Long.jump     0.7935059 -0.3249794  0.15521388 -0.005840942 -0.13320635
## Shot.put      0.6289690  0.6228005  0.02252512  0.133493731 -0.03352349
## High.jump     0.6259915  0.4719483 -0.01291630 -0.105515561  0.50265395
## X400m        -0.7341798  0.4946566  0.22972590  0.111158299  0.17870603
## X110m.hurdle -0.7089265  0.2324083 -0.04392919  0.109666171 -0.31580683
## Discus        0.5421042  0.6672824  0.01785549 -0.196002694 -0.25775785
## Pole.vault    0.1795989 -0.3263061  0.62447715  0.611344812  0.12913343
## Javeline      0.2864207  0.3389823 -0.52108731  0.655675756 -0.12255034
## X1500m       -0.2107444  0.4733570  0.78520075 -0.054465625 -0.14781289
## 
## $cor
##                   Dim.1      Dim.2       Dim.3        Dim.4       Dim.5
## X100m        -0.7958383  0.2535993 -0.25277014  0.071298025  0.20112594
## Long.jump     0.7935059 -0.3249794  0.15521388 -0.005840942 -0.13320635
## Shot.put      0.6289690  0.6228005  0.02252512  0.133493731 -0.03352349
## High.jump     0.6259915  0.4719483 -0.01291630 -0.105515561  0.50265395
## X400m        -0.7341798  0.4946566  0.22972590  0.111158299  0.17870603
## X110m.hurdle -0.7089265  0.2324083 -0.04392919  0.109666171 -0.31580683
## Discus        0.5421042  0.6672824  0.01785549 -0.196002694 -0.25775785
## Pole.vault    0.1795989 -0.3263061  0.62447715  0.611344812  0.12913343
## Javeline      0.2864207  0.3389823 -0.52108731  0.655675756 -0.12255034
## X1500m       -0.2107444  0.4733570  0.78520075 -0.054465625 -0.14781289
## 
## $cos2
##                   Dim.1      Dim.2        Dim.3        Dim.4       Dim.5
## X100m        0.63335866 0.06431263 0.0638927459 5.083408e-03 0.040451643
## Long.jump    0.62965167 0.10561160 0.0240913488 3.411661e-05 0.017743930
## Shot.put     0.39560205 0.38788051 0.0005073810 1.782058e-02 0.001123825
## High.jump    0.39186542 0.22273519 0.0001668307 1.113353e-02 0.252660992
## X400m        0.53901997 0.24468520 0.0527739910 1.235617e-02 0.031935844
## X110m.hurdle 0.50257681 0.05401360 0.0019297735 1.202667e-02 0.099733951
## Discus       0.29387697 0.44526574 0.0003188186 3.841706e-02 0.066439109
## Pole.vault   0.03225576 0.10647567 0.3899717143 3.737425e-01 0.016675443
## Javeline     0.08203680 0.11490897 0.2715319816 4.299107e-01 0.015018585
## X1500m       0.04441319 0.22406686 0.6165402187 2.966504e-03 0.021848652
## 
## $contrib
##                   Dim.1     Dim.2       Dim.3        Dim.4      Dim.5
## X100m        17.8679800  3.264673  4.49403047  0.562640595  7.1769603
## Long.jump    17.7634003  5.361115  1.69451561  0.003776086  3.1481412
## Shot.put     11.1605161 19.689806  0.03568771  1.972412810  0.1993898
## High.jump    11.0551003 11.306607  0.01173439  1.232279132 44.8272993
## X400m        15.2065469 12.420846  3.71196949  1.367602392  5.6660810
## X110m.hurdle 14.1784315  2.741869  0.13573467  1.331132942 17.6948711
## Discus        8.2907019 22.602827  0.02242477  4.252067486 11.7876756
## Pole.vault    0.9099826  5.404977 27.42947955 41.366476677  2.9585694
## Javeline      2.3143789  5.833073 19.09877220 47.583273953  2.6646083
## X1500m        1.2529614 11.374207 43.36565114  0.328337926  3.8764039
lv <- decarid.pca$var
tabvar <- list()
for (i in 1:2) {
  vcum <- t(apply(lv$cos2,1,cumsum))
  tvar <- cbind(lv$contrib[,i],lv$coord[,i],lv$cos2[,i],vcum[,i])
  colnames(tvar) <- c("contributions","correlations","quality","cum.qual.")
  tabvar[[i]] <- tvar
  }
tabvar
## [[1]]
##              contributions correlations    quality  cum.qual.
## X100m           17.8679800   -0.7958383 0.63335866 0.63335866
## Long.jump       17.7634003    0.7935059 0.62965167 0.62965167
## Shot.put        11.1605161    0.6289690 0.39560205 0.39560205
## High.jump       11.0551003    0.6259915 0.39186542 0.39186542
## X400m           15.2065469   -0.7341798 0.53901997 0.53901997
## X110m.hurdle    14.1784315   -0.7089265 0.50257681 0.50257681
## Discus           8.2907019    0.5421042 0.29387697 0.29387697
## Pole.vault       0.9099826    0.1795989 0.03225576 0.03225576
## Javeline         2.3143789    0.2864207 0.08203680 0.08203680
## X1500m           1.2529614   -0.2107444 0.04441319 0.04441319
## 
## [[2]]
##              contributions correlations    quality cum.qual.
## X100m             3.264673    0.2535993 0.06431263 0.6976713
## Long.jump         5.361115   -0.3249794 0.10561160 0.7352633
## Shot.put         19.689806    0.6228005 0.38788051 0.7834826
## High.jump        11.306607    0.4719483 0.22273519 0.6146006
## X400m            12.420846    0.4946566 0.24468520 0.7837052
## X110m.hurdle      2.741869    0.2324083 0.05401360 0.5565904
## Discus           22.602827    0.6672824 0.44526574 0.7391427
## Pole.vault        5.404977   -0.3263061 0.10647567 0.1387314
## Javeline          5.833073    0.3389823 0.11490897 0.1969458
## X1500m           11.374207    0.4733570 0.22406686 0.2684801
decarid.pca$ind
## $coord
##         Dim.1      Dim.2      Dim.3       Dim.4       Dim.5
## 1   3.7137993  1.5322950 -0.2202316  1.77673893  0.13446941
## 2   3.6694241  0.8694425  0.3255306  1.18539064 -0.94284426
## 3   4.2777869  0.4231920  0.3598208 -1.73611288 -0.70480348
## 4   1.9398690  1.3648941 -1.2612024 -1.11474009  0.59998068
## 5   1.9332924 -1.7282528  0.9048243 -0.50484828 -0.14878641
## 6   0.7080513  1.2703538 -1.0423616  0.54468020  0.52821610
## 7   0.7028964 -0.5161217 -0.7454531 -0.17514181  0.91262592
## 8   0.1810434 -1.7740266  1.0046854  2.00943377 -0.78677012
## 9   1.6023800  0.1363002 -0.1160893 -1.66517744  0.88257463
## 10 -0.0941915 -1.4777140  0.7343948  0.49954757  0.62338852
## 11  0.2604951  0.6162536  1.7807707 -0.23185015  1.32682505
## 12 -0.1233691 -0.2925685  0.5633155  1.01923917 -0.36567177
## 13 -0.2913438  0.3887147 -1.6832370  0.62175685  0.12903638
## 14  0.4832204  1.1290453 -1.5744282 -1.11555233 -0.72634210
## 15  0.2223001 -1.7428029  0.5162716 -0.29379472  0.22317623
## 16  0.1180785 -0.7941071 -0.1899505  0.10683142 -0.86340507
## 17 -0.6390413 -1.0659630 -1.2442395  0.32147361 -0.09809533
## 18 -0.7393929 -0.1883438 -1.0228135 -0.34943451 -0.26686355
## 19 -0.4231853 -3.1345388  0.8795653 -0.55572663  0.47403769
## 20 -1.3357151  1.8594601 -0.7313768  1.69679723  0.98605496
## 21 -0.9083758  0.2634176  2.3859305  0.25070761 -0.42081550
## 22 -0.6556984 -1.0951920 -1.5344755 -0.17250737 -0.56843218
## 23 -1.8363825  0.1960706  0.8296795  0.37500742  1.80864764
## 24 -2.6252844 -1.5626324 -1.6431662 -0.08604950 -0.81678412
## 25 -2.3592335 -0.1903765 -0.1377246 -1.19207313  0.42980284
## 26 -1.4844151  1.8232361  3.0027737 -0.90143153 -1.04568813
## 27 -2.9359804  0.1325051 -0.5305102  0.04163977 -0.75042372
## 28 -3.3610279  3.5574593  0.3896973 -0.35480381 -0.55311031
## 
## $cos2
##          Dim.1       Dim.2       Dim.3        Dim.4        Dim.5
## 1  0.669035920 0.113893074 0.002352728 0.1531298319 0.0008771211
## 2  0.684872300 0.038449930 0.005390107 0.0714721363 0.0452161626
## 3  0.807526493 0.007903026 0.005713353 0.1330069743 0.0219207077
## 4  0.365296925 0.180841922 0.154408343 0.1206280864 0.0349442502
## 5  0.469734621 0.375380751 0.102893033 0.0320316454 0.0027821723
## 6  0.085913115 0.276553647 0.186194481 0.0508408961 0.0478138026
## 7  0.164623173 0.088759044 0.185160775 0.0102208730 0.2775197588
## 8  0.003530089 0.338953770 0.108712735 0.4348781923 0.0666677731
## 9  0.368360586 0.002665231 0.001933423 0.3977985156 0.1117493493
## 10 0.002117182 0.521093330 0.128704546 0.0595509157 0.0927368518
## 11 0.011783936 0.065949318 0.550690190 0.0093348229 0.3057163388
## 12 0.005350540 0.030091230 0.111554784 0.3652052586 0.0470075565
## 13 0.018536581 0.032997425 0.618740779 0.0844227194 0.0036361563
## 14 0.021825530 0.119150811 0.231696770 0.1163199340 0.0493124620
## 15 0.008011492 0.492414129 0.043210615 0.0139933567 0.0080747635
## 16 0.002813447 0.127249309 0.007280783 0.0023030073 0.1504272481
## 17 0.105413948 0.293308394 0.399620921 0.0266766253 0.0024839161
## 18 0.159601801 0.010355946 0.305407841 0.0356466594 0.0207905401
## 19 0.014763754 0.809996269 0.063778145 0.0254599841 0.0185251387
## 20 0.158131897 0.306454161 0.047410457 0.2551829622 0.0861775258
## 21 0.071263379 0.005992732 0.491644168 0.0054283815 0.0152939182
## 22 0.066720146 0.186135544 0.365400119 0.0046181078 0.0501425127
## 23 0.339699139 0.003872514 0.069340801 0.0141660203 0.3295156651
## 24 0.503874434 0.178518505 0.197393373 0.0005413353 0.0487735288
## 25 0.577048807 0.003757487 0.001966500 0.1473250138 0.0191517845
## 26 0.126805942 0.191299889 0.518888596 0.0467621421 0.0629264543
## 27 0.857528056 0.001746657 0.027998158 0.0001724879 0.0560215511
## 28 0.450004772 0.504141868 0.006049613 0.0050147517 0.0121869881
## 
## $contrib
##           Dim.1       Dim.2       Dim.3        Dim.4       Dim.5
## 1  13.896472718  4.25667207  0.12183879 12.478583027  0.11457591
## 2  13.566366232  1.37046272  0.26620124  5.554449503  5.63282515
## 3  18.437668318  0.32468361  0.32523627 11.914448816  3.14762091
## 4   3.791512875  3.37740675  3.99572873  4.912078298  2.28097685
## 5   3.765848145  5.41501879  2.05662407  1.007487819  0.14027261
## 6   0.505123020  2.92573389  2.72937503  1.172738593  1.76794852
## 7   0.497794814  0.48293619  1.39594113  0.121254458  5.27754497
## 8   0.033024268  5.70565731  2.53563429 15.961196069  3.92231131
## 9   2.587013828  0.03368047  0.03385408 10.960719825  4.93570541
## 10  0.008939045  3.95882420  1.35483238  0.986442407  2.46243031
## 11  0.068370188  0.68850078  7.96603923  0.212487210 11.15510518
## 12  0.015334884  0.15518173  0.79713121  4.106485050  0.84728440
## 13  0.085522257  0.27393487  7.11732807  1.528126098  0.10550443
## 14  0.235265509  2.31104393  6.22690381  4.919239127  3.34294154
## 15  0.049790581  5.50658088  0.66954990  0.341197634  0.31560380
## 16  0.014047826  1.14325620  0.09063735  0.045114489  4.72362639
## 17  0.411458048  2.06001181  3.88896838  0.408515646  0.06097377
## 18  0.550830837  0.06431140  2.62796365  0.482669233  0.45125795
## 19  0.180438327 17.81282299  1.94340179  1.220788555  1.42387577
## 20  1.797609753  6.26843595  1.34372003 11.380934728  6.16096282
## 21  0.831378555  0.12579836 14.30019672  0.248458059  1.12209545
## 22  0.433187509  2.17453292  5.91488543  0.117634126  2.04740455
## 23  3.397770397  0.06969640  1.72920767  0.555901396 20.72785108
## 24  6.944171406  4.42689362  6.78249358  0.029269465  4.22727907
## 25  5.608020249  0.06570709  0.04764855  5.617251120  1.17053635
## 26  2.220130040  6.02658464 22.65017943  3.212059105  6.92868315
## 27  8.685084058  0.03183105  0.70699096  0.006853852  3.56828430
## 28 11.381826314 22.94379938  0.38148824  0.497616293  1.93851807
## 
## $dist
##        1        2        3        4        5        6        7        8 
## 4.540396 4.433974 4.760370 3.209589 2.820793 2.415655 1.732391 3.047122 
##        9       10       11       12       13       14       15       16 
## 2.640152 2.047070 2.399686 1.686583 2.139887 3.270867 2.483608 2.226134 
##       17       18       19       20       21       22       23       24 
## 1.968248 1.850787 3.482829 3.358954 3.402768 2.538491 3.150764 3.698411 
##       25       26       27       28 
## 3.105737 4.168555 3.170509 5.010298
li <- decarid.pca$ind
tabind <- list()
for (i in 1:2) {
  icum <- t(apply(li$cos2,1,cumsum))
  tind <- cbind(li$dist,li$contrib[,i],li$coord[,i],li$cos2[,i],icum[,i])
  colnames(tind) <- c("distance","contributions","correlations","quality","cum.qual.")
  tabind[[i]] <- tind
  }
tabind
## [[1]]
##    distance contributions correlations     quality   cum.qual.
## 1  4.540396  13.896472718    3.7137993 0.669035920 0.669035920
## 2  4.433974  13.566366232    3.6694241 0.684872300 0.684872300
## 3  4.760370  18.437668318    4.2777869 0.807526493 0.807526493
## 4  3.209589   3.791512875    1.9398690 0.365296925 0.365296925
## 5  2.820793   3.765848145    1.9332924 0.469734621 0.469734621
## 6  2.415655   0.505123020    0.7080513 0.085913115 0.085913115
## 7  1.732391   0.497794814    0.7028964 0.164623173 0.164623173
## 8  3.047122   0.033024268    0.1810434 0.003530089 0.003530089
## 9  2.640152   2.587013828    1.6023800 0.368360586 0.368360586
## 10 2.047070   0.008939045   -0.0941915 0.002117182 0.002117182
## 11 2.399686   0.068370188    0.2604951 0.011783936 0.011783936
## 12 1.686583   0.015334884   -0.1233691 0.005350540 0.005350540
## 13 2.139887   0.085522257   -0.2913438 0.018536581 0.018536581
## 14 3.270867   0.235265509    0.4832204 0.021825530 0.021825530
## 15 2.483608   0.049790581    0.2223001 0.008011492 0.008011492
## 16 2.226134   0.014047826    0.1180785 0.002813447 0.002813447
## 17 1.968248   0.411458048   -0.6390413 0.105413948 0.105413948
## 18 1.850787   0.550830837   -0.7393929 0.159601801 0.159601801
## 19 3.482829   0.180438327   -0.4231853 0.014763754 0.014763754
## 20 3.358954   1.797609753   -1.3357151 0.158131897 0.158131897
## 21 3.402768   0.831378555   -0.9083758 0.071263379 0.071263379
## 22 2.538491   0.433187509   -0.6556984 0.066720146 0.066720146
## 23 3.150764   3.397770397   -1.8363825 0.339699139 0.339699139
## 24 3.698411   6.944171406   -2.6252844 0.503874434 0.503874434
## 25 3.105737   5.608020249   -2.3592335 0.577048807 0.577048807
## 26 4.168555   2.220130040   -1.4844151 0.126805942 0.126805942
## 27 3.170509   8.685084058   -2.9359804 0.857528056 0.857528056
## 28 5.010298  11.381826314   -3.3610279 0.450004772 0.450004772
## 
## [[2]]
##    distance contributions correlations     quality  cum.qual.
## 1  4.540396    4.25667207    1.5322950 0.113893074 0.78292899
## 2  4.433974    1.37046272    0.8694425 0.038449930 0.72332223
## 3  4.760370    0.32468361    0.4231920 0.007903026 0.81542952
## 4  3.209589    3.37740675    1.3648941 0.180841922 0.54613885
## 5  2.820793    5.41501879   -1.7282528 0.375380751 0.84511537
## 6  2.415655    2.92573389    1.2703538 0.276553647 0.36246676
## 7  1.732391    0.48293619   -0.5161217 0.088759044 0.25338222
## 8  3.047122    5.70565731   -1.7740266 0.338953770 0.34248386
## 9  2.640152    0.03368047    0.1363002 0.002665231 0.37102582
## 10 2.047070    3.95882420   -1.4777140 0.521093330 0.52321051
## 11 2.399686    0.68850078    0.6162536 0.065949318 0.07773325
## 12 1.686583    0.15518173   -0.2925685 0.030091230 0.03544177
## 13 2.139887    0.27393487    0.3887147 0.032997425 0.05153401
## 14 3.270867    2.31104393    1.1290453 0.119150811 0.14097634
## 15 2.483608    5.50658088   -1.7428029 0.492414129 0.50042562
## 16 2.226134    1.14325620   -0.7941071 0.127249309 0.13006276
## 17 1.968248    2.06001181   -1.0659630 0.293308394 0.39872234
## 18 1.850787    0.06431140   -0.1883438 0.010355946 0.16995775
## 19 3.482829   17.81282299   -3.1345388 0.809996269 0.82476002
## 20 3.358954    6.26843595    1.8594601 0.306454161 0.46458606
## 21 3.402768    0.12579836    0.2634176 0.005992732 0.07725611
## 22 2.538491    2.17453292   -1.0951920 0.186135544 0.25285569
## 23 3.150764    0.06969640    0.1960706 0.003872514 0.34357165
## 24 3.698411    4.42689362   -1.5626324 0.178518505 0.68239294
## 25 3.105737    0.06570709   -0.1903765 0.003757487 0.58080629
## 26 4.168555    6.02658464    1.8232361 0.191299889 0.31810583
## 27 3.170509    0.03183105    0.1325051 0.001746657 0.85927471
## 28 5.010298   22.94379938    3.5574593 0.504141868 0.95414664

Análisis

  1. ¿Cuántos autovalores se necesitan para explicar el 90% de la inercia?

Para explicar el 90% de la varianza acumulada, necesitas las primeras 6 componentes. El porcentaje acumulado hasta la sexta componente es del 89.32%, lo que está muy cerca del 90%.

  1. ¿Cuántos autovalores son mayores que 0.7? Vemos que los primeros 04 autovalores (Comp 1, Comp 2, Comp 3 y Comp 4) son mayores a 0.7

  2. ¿Cuáles son las variables que más contribuyen en cada dimensión?

Dimensión 1: X100m(17.87%), Long.jump(17.76%),X400m(15.21%)

Dimensión 2: Discus(22.6%), Shot.put(19.69%), X400m(12.42%)

  1. ¿Se puede atribuir un significado real a las dimensiones?

Dimensión 1: Las variables relacionadas con carreras rápidas (X100m, X400m) y saltos (Long.jump) dominan. Podría interpretarse como una “dimensión de velocidad y salto”.

Dimensión 2: Esta dimensión está influenciada por variables de fuerza, como el lanzamiento de disco (Discus) y el lanzamiento de peso (Shot.put). Podría interpretarse como una “dimensión de fuerza”.

plot.PCA(decarid.pca,axes=c(1,2), choix="var",graph.type="classic") 

plot.PCA(decarid.pca,axes=c(1,2), choix="ind",graph.type="classic") 

Decathlon.csv

decathlon = read.csv("Decathlon_cpl.csv")
decathlon
##              X X100m Long.jump Shot.put High.jump X400m X110m.hurdle Discus
## 1       SEBRLE 11.04      7.58    14.83      2.07 49.81        14.69  43.75
## 2         CLAY 10.76      7.40    14.26      1.86 49.37        14.05  50.72
## 3       KARPOV 11.02      7.30    14.77      2.04 48.37        14.09  48.95
## 4      BERNARD 11.02      7.23    14.25      1.92 48.93        14.99  40.87
## 5       YURKOV 11.34      7.09    15.19      2.10 50.42        15.31  46.26
## 6      WARNERS 11.11      7.60    14.31      1.98 48.68        14.23  41.10
## 7    ZSIVOCZKY 11.13      7.30    13.48      2.01 48.62        14.17  45.67
## 8     McMULLEN 10.83      7.31    13.76      2.13 49.91        14.38  44.41
## 9    MARTINEAU 11.64      6.81    14.57      1.95 50.14        14.93  47.60
## 10       HERNU 11.37      7.56    14.41      1.86 51.10        15.06  44.99
## 11      BARRAS 11.33      6.97    14.09      1.95 49.48        14.48  42.10
## 12        NOOL 11.33      7.27    12.68      1.98 49.20        15.29  37.92
## 13 BOURGUIGNON 11.36      6.80    13.46      1.86 51.16        15.67  40.49
## 14      Sebrle 10.85      7.84    16.36      2.12 48.36        14.05  48.72
## 15        Clay 10.44      7.96    15.23      2.06 49.19        14.13  50.11
## 16      Karpov 10.50      7.81    15.93      2.09 46.81        13.97  51.65
## 17       Macey 10.89      7.47    15.73      2.15 48.97        14.56  48.34
## 18     Warners 10.62      7.74    14.48      1.97 47.97        14.01  43.73
## 19   Zsivoczky 10.91      7.14    15.31      2.12 49.40        14.95  45.62
## 20       Hernu 10.97      7.19    14.65      2.03 48.73        14.25  44.72
## 21        Nool 10.80      7.53    14.26      1.88 48.81        14.80  42.05
## 22     Bernard 10.69      7.48    14.80      2.12 49.13        14.17  44.75
## 23    Schwarzl 10.98      7.49    14.01      1.94 49.76        14.25  42.43
## 24   Pogorelov 10.95      7.31    15.10      2.06 50.79        14.21  44.60
## 25  Schoenbeck 10.90      7.30    14.77      1.88 50.30        14.34  44.41
## 26      Barras 11.14      6.99    14.91      1.94 49.41        14.37  44.83
## 27       Smith 10.85      6.81    15.24      1.91 49.27        14.01  49.02
## 28   Averyanov 10.55      7.34    14.44      1.94 49.72        14.39  39.88
## 29    Ojaniemi 10.68      7.50    14.97      1.94 49.12        15.01  40.35
## 30     Smirnov 10.89      7.07    13.88      1.94 49.11        14.77  42.47
## 31          Qi 11.06      7.34    13.55      1.97 49.65        14.78  45.13
## 32       Drews 10.87      7.38    13.07      1.88 48.51        14.01  40.11
## 33 Parkhomenko 11.14      6.61    15.69      2.03 51.04        14.88  41.90
## 34       Terek 10.92      6.94    15.15      1.94 49.56        15.12  45.62
## 35       Gomez 11.08      7.26    14.57      1.85 48.61        14.41  40.95
## 36        Turi 11.08      6.91    13.62      2.03 51.67        14.26  39.83
## 37     Lorenzo 11.10      7.03    13.22      1.85 49.34        15.38  40.22
## 38   Karlivans 11.33      7.26    13.30      1.97 50.54        14.98  43.34
## 39 Korkizoglou 10.86      7.07    14.81      1.94 51.16        14.96  46.07
## 40       Uldal 11.23      6.99    13.53      1.85 50.95        15.09  43.01
## 41     Casarsa 11.36      6.68    14.92      1.94 53.20        15.39  48.66
##    Pole.vault Javeline X1500m Rank Points Competition
## 1        5.02    63.19 291.70    1   8217    Decastar
## 2        4.92    60.15 301.50    2   8122    Decastar
## 3        4.92    50.31 300.20    3   8099    Decastar
## 4        5.32    62.77 280.10    4   8067    Decastar
## 5        4.72    63.44 276.40    5   8036    Decastar
## 6        4.92    51.77 278.10    6   8030    Decastar
## 7        4.42    55.37 268.00    7   8004    Decastar
## 8        4.42    56.37 285.10    8   7995    Decastar
## 9        4.92    52.33 262.10    9   7802    Decastar
## 10       4.82    57.19 285.10   10   7733    Decastar
## 11       4.72    55.40 282.00   11   7708    Decastar
## 12       4.62    57.44 266.60   12   7651    Decastar
## 13       5.02    54.68 291.70   13   7313    Decastar
## 14       5.00    70.52 280.01    1   8893    OlympicG
## 15       4.90    69.71 282.00    2   8820    OlympicG
## 16       4.60    55.54 278.11    3   8725    OlympicG
## 17       4.40    58.46 265.42    4   8414    OlympicG
## 18       4.90    55.39 278.05    5   8343    OlympicG
## 19       4.70    63.45 269.54    6   8287    OlympicG
## 20       4.80    57.76 264.35    7   8237    OlympicG
## 21       5.40    61.33 276.33    8   8235    OlympicG
## 22       4.40    55.27 276.31    9   8225    OlympicG
## 23       5.10    56.32 273.56   10   8102    OlympicG
## 24       5.00    53.45 287.63   11   8084    OlympicG
## 25       5.00    60.89 278.82   12   8077    OlympicG
## 26       4.60    64.55 267.09   13   8067    OlympicG
## 27       4.20    61.52 272.74   14   8023    OlympicG
## 28       4.80    54.51 271.02   15   8021    OlympicG
## 29       4.60    59.26 275.71   16   8006    OlympicG
## 30       4.70    60.88 263.31   17   7993    OlympicG
## 31       4.50    60.79 272.63   18   7934    OlympicG
## 32       5.00    51.53 274.21   19   7926    OlympicG
## 33       4.80    65.82 277.94   20   7918    OlympicG
## 34       5.30    50.62 290.36   21   7893    OlympicG
## 35       4.40    60.71 269.70   22   7865    OlympicG
## 36       4.80    59.34 290.01   23   7708    OlympicG
## 37       4.50    58.36 263.08   24   7592    OlympicG
## 38       4.50    52.92 278.67   25   7583    OlympicG
## 39       4.70    53.05 317.00   26   7573    OlympicG
## 40       4.50    60.00 281.70   27   7495    OlympicG
## 41       4.40    58.62 296.12   28   7404    OlympicG
str(decathlon)
## 'data.frame':    41 obs. of  14 variables:
##  $ X           : chr  "SEBRLE" "CLAY" "KARPOV" "BERNARD" ...
##  $ X100m       : num  11 10.8 11 11 11.3 ...
##  $ Long.jump   : num  7.58 7.4 7.3 7.23 7.09 7.6 7.3 7.31 6.81 7.56 ...
##  $ Shot.put    : num  14.8 14.3 14.8 14.2 15.2 ...
##  $ High.jump   : num  2.07 1.86 2.04 1.92 2.1 1.98 2.01 2.13 1.95 1.86 ...
##  $ X400m       : num  49.8 49.4 48.4 48.9 50.4 ...
##  $ X110m.hurdle: num  14.7 14.1 14.1 15 15.3 ...
##  $ Discus      : num  43.8 50.7 49 40.9 46.3 ...
##  $ Pole.vault  : num  5.02 4.92 4.92 5.32 4.72 4.92 4.42 4.42 4.92 4.82 ...
##  $ Javeline    : num  63.2 60.1 50.3 62.8 63.4 ...
##  $ X1500m      : num  292 302 300 280 276 ...
##  $ Rank        : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ Points      : int  8217 8122 8099 8067 8036 8030 8004 7995 7802 7733 ...
##  $ Competition : chr  "Decastar" "Decastar" "Decastar" "Decastar" ...
decathlon$Competition <- as.factor(decathlon$Competition)
# Ejecutar el PCA sobre todas las columnas
pca_result <- PCA(decathlon[, 2:14],    # Incluye todas las variables numéricas, Rank, Points, y Competition
                  quanti.sup = c(11, 12),    # Columnas de Rank y Points (11 y 12)
                  quali.sup = 13,            # Competition está en la columna 13
                  graph = FALSE)
print(pca_result$quanti.sup) 
## $coord
##             Dim.1       Dim.2       Dim.3      Dim.4      Dim.5
## Rank   -0.6705104  0.05139812 -0.05834304 -0.1614077 -0.3500257
## Points  0.9561543 -0.01651613 -0.06635212  0.2360079  0.1136256
## 
## $cor
##             Dim.1       Dim.2       Dim.3      Dim.4      Dim.5
## Rank   -0.6705104  0.05139812 -0.05834304 -0.1614077 -0.3500257
## Points  0.9561543 -0.01651613 -0.06635212  0.2360079  0.1136256
## 
## $cos2
##            Dim.1        Dim.2       Dim.3      Dim.4      Dim.5
## Rank   0.4495841 0.0026417671 0.003403910 0.02605246 0.12251798
## Points 0.9142310 0.0002727826 0.004402604 0.05569973 0.01291077
print(pca_result$quali.sup) 
## $coord
##               Dim.1       Dim.2      Dim.3       Dim.4      Dim.5
## Decastar -0.6001211 -0.03765491  0.2889044 -0.13955756  0.4013710
## OlympicG  0.2786276  0.01748264 -0.1341342  0.06479458 -0.1863508
## 
## $cos2
##              Dim.1       Dim.2      Dim.3      Dim.4     Dim.5
## Decastar 0.4027688 0.001585701 0.09334399 0.02178135 0.1801648
## OlympicG 0.4027688 0.001585701 0.09334399 0.02178135 0.1801648
## 
## $v.test
##              Dim.1      Dim.2     Dim.3      Dim.4     Dim.5
## Decastar -1.429753 -0.1231198  1.050392 -0.5850181  2.090235
## OlympicG  1.429753  0.1231198 -1.050392  0.5850181 -2.090235
## 
## $dist
##  Decastar  OlympicG 
## 0.9456076 0.4390321 
## 
## $eta2
##                  Dim.1        Dim.2     Dim.3       Dim.4     Dim.5
## Competition 0.05110487 0.0003789623 0.0275831 0.008556153 0.1092271
# Gráfico de las variables principales (eventos deportivos) junto con las variables cuantitativas suplementarias
fviz_pca_var(pca_result, col.var = "cos2", repel = TRUE)

# Gráfico de los individuos, coloreando según la variable cualitativa suplementaria (Competition)
fviz_pca_ind(pca_result, habillage = "Competition", addEllipses = TRUE, repel = TRUE)

Análisis

¿Ayudan estas variables para interpretar los resultados?

  1. Variables Cuantitativas (Rank y Points):

Puntos (Points) está fuertemente asociado con la Dimensión 1 (correlación de 0.956), lo que confirma que la primera componente principal representa el rendimiento general de los atletas en las pruebas del decatlón.

Rango (Rank) tiene una correlación negativa con la Dimensión 1 (-0.670), lo cual es coherente con la interpretación de la Dimensión 1: un mejor rendimiento general (mayores puntajes) está asociado con un rango más bajo (mejor posición).

Conclusión de Rank y Points: Estas variables nos permiten decir que la Dimensión 1 captura el rendimiento general de los atletas. Un atleta con un valor alto en Dim 1 tiene mejor puntaje y posición. Esto es claramente visible en el gráfico de las variables: las flechas de Rank y Points apuntan en direcciones opuestas, lo que visualmente refleja esta relación.

  1. Variable Cualitativa (Competition):

La variable Competition nos ayuda a distinguir entre los atletas de diferentes competiciones (Decastar y OlympicG). Los resultados muestran que los atletas de OlympicG tienen valores más altos en la Dimensión 1, lo que indica un rendimiento promedio superior en comparación con los de Decastar.

El gráfico de individuos confirma esto visualmente: los atletas de OlympicG están más concentrados hacia el lado derecho del gráfico (valores más altos en Dim 1), mientras que los de Decastar están más dispersos y tienden a estar en la parte izquierda (valores más bajos en Dim 1)

Conclusión de Competition: La inclusión de la variable cualitativa ayuda a visualizar las diferencias entre los atletas de las dos competiciones y confirmar que los de OlympicG tienden a tener un mejor rendimiento general

¿Ha cambiado algo mucho, incluyendo las pruebas de Decastar?

Como se mencionó, los atletas de OlympicG tienen, en promedio, mejores rendimientos que los de Decastar, como lo muestra la Dimensión 1. Esto está confirmado tanto por las coordenadas y valores-test como por los gráficos de individuos, donde los atletas de OlympicG se agrupan más en el lado positivo de Dim 1

En el gráfico de individuos, se observa una leve diferencia en la dispersión de los atletas de Decastar. Estos atletas tienden a estar más dispersos en el espacio de las primeras dos dimensiones, mientras que los atletas de OlympicG están más concentrados y cercanos a los extremos positivos de la Dimensión 1. Esto sugiere que los atletas de OlympicG tienen un rendimiento más consistente (más altos en general), mientras que los de Decastar son un poco más diversos en sus rendimientos

Aunque los atletas de Decastar están en promedio por debajo de los de OlympicG, la diferencia no es extremadamente grande. Los resultados sugieren que Decastar presenta un grupo de atletas más diverso, algunos con rendimientos altos y otros más bajos. Esto puede verse en cómo algunos atletas de Decastar están presentes en el centro y hacia el lado izquierdo del gráfico de individuos

Conclusión final:

Las variables suplementarias ayudan a interpretar los resultados del PCA, ya que confirman que la Dimensión 1 está asociada con el rendimiento general de los atletas, mientras que la Dimensión 2 puede capturar variaciones adicionales menos importantes

Sí ha cambiado algo, particularmente en las pruebas de Decastar, donde los atletas tienen una mayor dispersión y tienden a tener rendimientos ligeramente más bajos que los de OlympicG. Sin embargo, estas diferencias no son dramáticas, pero revelan una consistencia mayor en el grupo de atletas de los Juegos Olímpicos en comparación con Decastar