O pentatlo para mulheres foi realizado pela primeira vez na Alemanha, em 1928. Inicialmente isto consistia do arremesso de peso, salto em distância, 100m, salto em altura e eventos de lançamento de dardo realizaram durante dois dias. O pentatlo foi introduzido pela primeira vez em Jogos Olímpicos em 1964, em que ele consistia os 80 m com barreiras, tiros, salto em altura, salto em comprimento e 200 m. Em 1977, a 200 m foi substituído pelos 800 m e em 1981 a IAAF trouxe o heptatlo sete-eventos no lugar do pentatlo. Um sistema de pontuação é utilizado para atribuir pontos aos resultados de cada evento, e o vencedor é a mulher que acumula mais pontos durante os dois dias. O evento fez sua primeira aparição olímpica em 1984. Nos Jogos Olímpicos de 1988, em Seul, o heptatlo foi vencido por uma das estrelas do atletismo feminino, nos EUA, Jackie Joyner-Kersee. Os resultados para todas as 25 concorrentes são dadas aqui. O pacote “HSAUR”contém os dados de 25 competidoras do heptatlo com 8 variáveis.
Variáveis:
Será aplicado a Análise de Componentes Principais visando a exploração da estrutura dos dados e avaliar como os escores dos componentes principais se relacionam com os escores do sistema oficial de pontuação.
Em algumas aplicações, as componentes principais pode ser um fim em si e podem ser passíveis de interpretação de uma forma similar como os fatores de uma análise fatorial (exploratória).
Observe as variáveis hurdles, run200m e run800m.
Para estas variáveis, são bons os resultados menores, e,para as demais variáveis, são bons resultados maiores.
Será feita uma transformação na escala das variáveis hurdles, run200m e run800m
obtendo o máximo valor e subtraindo dele os resultados finais das competidoras para ter a mesma direção das demais variáveis.
vars n mean sd median trimmed mad min max range skew kurtosis se
hurdles 1 25 2.58 0.74 2.67 2.65 0.47 0.00 3.73 3.73 -1.55 3.65 0.15
highjump 2 25 1.78 0.08 1.80 1.79 0.04 1.50 1.86 0.36 -1.87 4.25 0.02
shot 3 25 13.12 1.49 12.88 13.10 1.63 10.00 16.23 6.23 0.17 -0.44 0.30
run200m 4 25 1.96 0.97 1.78 1.95 0.99 0.00 4.05 4.05 0.16 -0.59 0.19
longjump 5 25 6.15 0.47 6.25 6.17 0.22 4.88 7.27 2.39 -0.45 0.94 0.09
javelin 6 25 41.48 3.55 40.28 41.46 3.71 35.68 47.50 11.82 0.15 -1.26 0.71
run800m 7 25 27.38 8.29 28.69 28.13 4.86 0.00 39.23 39.23 -1.31 2.43 1.66
hurdles highjump shot run200m longjump javelin run800m
hurdles 1.00 0.81 0.65 0.77 0.91 0.01 0.78
highjump 0.81 1.00 0.44 0.49 0.78 0.00 0.59
shot 0.65 0.44 1.00 0.68 0.74 0.27 0.42
run200m 0.77 0.49 0.68 1.00 0.82 0.33 0.62
longjump 0.91 0.78 0.74 0.82 1.00 0.07 0.70
javelin 0.01 0.00 0.27 0.33 0.07 1.00 -0.02
run800m 0.78 0.59 0.42 0.62 0.70 -0.02 1.00
Bartlett's test of sphericity
data: dados
X-squared = 141.69, df = 21, p-value < 2.2e-16
A análise de componentes principais será baseada na matriz de correlações amostral
hurdles highjump shot run200m longjump javelin run800m
hurdles 1.0000 0.8114 0.6513 0.7737 0.9121 0.0078 0.7793
highjump 0.8114 1.0000 0.4408 0.4877 0.7824 0.0022 0.5912
shot 0.6513 0.4408 1.0000 0.6827 0.7431 0.2690 0.4196
run200m 0.7737 0.4877 0.6827 1.0000 0.8172 0.3330 0.6168
longjump 0.9121 0.7824 0.7431 0.8172 1.0000 0.0671 0.6995
javelin 0.0078 0.0022 0.2690 0.3330 0.0671 1.0000 -0.0200
run800m 0.7793 0.5912 0.4196 0.6168 0.6995 -0.0200 1.0000
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] 0.453 -0.158 0.045 0.027 -0.095 -0.783 -0.380
[2,] 0.377 -0.248 0.368 0.680 0.019 0.099 0.434
[3,] 0.363 0.289 -0.676 0.124 0.512 -0.051 0.218
[4,] 0.408 0.260 -0.084 -0.361 -0.650 0.025 0.453
[5,] 0.456 -0.056 -0.139 0.111 -0.184 0.590 -0.612
[6,] 0.075 0.842 0.472 0.121 0.135 -0.027 -0.173
[7,] 0.375 -0.224 0.396 -0.603 0.504 0.156 0.098
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
hurdles 0.9564 -0.1726 0.0326 0.0179 -0.0470 -0.2116 -0.0842
highjump 0.7966 -0.2711 0.2655 0.4598 0.0093 0.0268 0.0961
shot 0.7668 0.3163 -0.4881 0.0841 0.2534 -0.0137 0.0482
run200m 0.8614 0.2846 -0.0603 -0.2441 -0.3218 0.0067 0.1004
longjump 0.9635 -0.0611 -0.1006 0.0752 -0.0913 0.1594 -0.1355
javelin 0.1593 0.9198 0.3404 0.0817 0.0669 -0.0074 -0.0383
run800m 0.7919 -0.2453 0.2857 -0.4080 0.2498 0.0420 0.0218
a comunalidade é a soma dos quadrados das correlações entre cada variável i e a componente principal j (ou o mesmo que o índice cos2). A soma limite-se ao número do componenentes retidos. Em nosso exemplo ilustrativo retemos todos os componentes que é igual ao número de variáveis.
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
hurdles 0.9148 0.0298 0.0011 0.0003 0.0022 0.0448 0.0071
highjump 0.6346 0.0735 0.0705 0.2114 0.0001 0.0007 0.0092
shot 0.5880 0.1000 0.2382 0.0071 0.0642 0.0002 0.0023
run200m 0.7421 0.0810 0.0036 0.0596 0.1036 0.0000 0.0101
longjump 0.9284 0.0037 0.0101 0.0057 0.0083 0.0254 0.0184
javelin 0.0254 0.8461 0.1159 0.0067 0.0045 0.0001 0.0015
run800m 0.6271 0.0602 0.0816 0.1665 0.0624 0.0018 0.0005
Quando um subespaço projetivo bidimensional determinado por duas direções principais escolhidas (CP), sua imagem geométrica plana com os pontos projetados e o círculo de correlações é denominada MAPA FATORIAL
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
hurdles 0.96 -0.17 0.03 0.02 -0.05 -0.21 -0.08
highjump 0.80 -0.27 0.27 0.46 0.01 0.03 0.10
shot 0.77 0.32 -0.49 0.08 0.25 -0.01 0.05
run200m 0.86 0.28 -0.06 -0.24 -0.32 0.01 0.10
longjump 0.96 -0.06 -0.10 0.08 -0.09 0.16 -0.14
javelin 0.16 0.92 0.34 0.08 0.07 -0.01 -0.04
run800m 0.79 -0.25 0.29 -0.41 0.25 0.04 0.02
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
hurdles 0.91 0.03 0.00 0.00 0.00 0.04 0.01
highjump 0.63 0.07 0.07 0.21 0.00 0.00 0.01
shot 0.59 0.10 0.24 0.01 0.06 0.00 0.00
run200m 0.74 0.08 0.00 0.06 0.10 0.00 0.01
longjump 0.93 0.00 0.01 0.01 0.01 0.03 0.02
javelin 0.03 0.85 0.12 0.01 0.00 0.00 0.00
run800m 0.63 0.06 0.08 0.17 0.06 0.00 0.00
As variáveis que são correlacionadas com PC1 e PC2 são as mais importantes para explicar a variabilidade no conjunto de dados. Variáveis que não se correlacionam com nenhum PC ou correlacionadas com as últimas dimensões são variáveis com baixa contribuição e podem ser removidas para simplificar a análise geral. As contribuições das variáveis na contabilização da variabilidade em uma determinada componente principal são (em porcentagem): (variável.cos2 * 100) / (cos2 total da componente)
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
hurdles 20.51 2.49 0.20 0.07 0.90 61.36 14.46
highjump 14.23 6.15 13.53 46.24 0.04 0.99 18.83
shot 13.18 8.38 45.72 1.55 26.18 0.26 4.74
run200m 16.64 6.78 0.70 13.04 42.23 0.06 20.56
longjump 20.81 0.31 1.94 1.24 3.40 34.83 37.46
javelin 0.57 70.84 22.24 1.46 1.83 0.07 2.99
run800m 14.06 5.04 15.67 36.41 25.43 2.42 0.97
[1] 100
$quanti
correlation p.value
longjump 0.9635326 1.156112e-14
hurdles 0.9564348 8.630823e-14
run200m 0.8614484 3.214339e-08
highjump 0.7966208 1.893903e-06
run800m 0.7918903 2.406103e-06
shot 0.7667860 7.798313e-06
$quanti
correlation p.value
javelin 0.919843 7.987602e-11
NULL
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
Joyner-Kersee (USA) 4.21 1.27 -0.38 0.02 -0.43 0.35 -0.36
John (GDR) 2.94 0.53 -0.92 -0.49 0.72 -0.24 -0.15
Behmer (GDR) 2.70 0.69 0.47 -0.69 -0.11 0.24 0.13
Sablovskaite (URS) 1.37 0.71 -0.61 -0.14 0.46 -0.09 0.50
Choubenkova (URS) 1.39 1.79 0.15 -0.85 0.70 -0.13 -0.24
Schulz (GDR) 1.07 -0.08 0.69 -0.21 0.75 0.36 0.11
Fleming (AUS) 1.12 -0.33 0.07 -0.50 -0.78 -0.09 0.15
Greiner (USA) 0.94 -0.82 -0.83 -0.03 0.09 0.15 -0.03
Lajbnerova (CZE) 0.54 0.15 -0.16 0.63 0.58 -0.27 0.25
Bouraga (URS) 0.78 -0.54 -0.19 -0.68 -1.04 -0.40 0.02
Wijnsma (HOL) 0.57 -1.43 0.14 0.41 0.30 0.35 0.19
Dimitrova (BUL) 1.21 -0.36 0.08 -0.49 -0.80 -0.24 0.07
Scheider (SWI) -0.02 0.82 2.01 0.75 -0.02 0.00 -0.04
Braun (FRG) 0.00 0.73 0.33 1.09 -0.19 -0.28 -0.05
Ruotsalainen (FIN) -0.09 0.78 0.97 0.27 -0.19 -0.14 -0.14
Yuping (CHN) 0.14 -0.55 -1.09 1.67 -0.22 0.29 0.17
Hagger (GB) -0.17 -1.78 -0.60 0.48 -0.06 -0.15 -0.53
Brown (USA) -0.53 0.74 0.32 1.32 -0.51 0.07 0.01
Mulliner (GB) -1.15 -0.65 -0.74 -0.59 -0.16 0.44 -0.08
Hautenauve (BEL) -1.11 -1.89 -0.01 -0.26 0.20 0.10 -0.09
Kytola (FIN) -1.48 -0.94 0.66 -0.22 0.51 0.07 0.13
Geremias (BRA) -2.06 -0.09 -0.66 0.03 0.25 -0.65 0.22
Hui-Ing (TAI) -2.94 -0.68 0.76 -1.14 -0.48 0.18 0.21
Jeong-Mi (KOR) -3.03 -0.98 0.58 -0.12 0.59 -0.19 -0.39
Launa (PNG) -6.40 2.90 -1.06 -0.25 -0.17 0.26 -0.06
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
Joyner-Kersee (USA) 0.890 0.081 0.007 0.000 0.010 0.006 0.006
John (GDR) 0.816 0.027 0.079 0.022 0.049 0.006 0.002
Behmer (GDR) 0.852 0.056 0.026 0.056 0.001 0.007 0.002
Sablovskaite (URS) 0.580 0.154 0.114 0.006 0.066 0.003 0.076
Choubenkova (URS) 0.298 0.497 0.004 0.113 0.076 0.003 0.009
Schulz (GDR) 0.479 0.003 0.200 0.019 0.239 0.056 0.005
Fleming (AUS) 0.559 0.048 0.002 0.109 0.269 0.003 0.009
Greiner (USA) 0.388 0.296 0.300 0.000 0.004 0.010 0.001
Lajbnerova (CZE) 0.242 0.018 0.022 0.326 0.278 0.061 0.054
Bouraga (URS) 0.228 0.109 0.013 0.176 0.412 0.062 0.000
Wijnsma (HOL) 0.115 0.728 0.007 0.061 0.032 0.044 0.012
Dimitrova (BUL) 0.577 0.051 0.003 0.095 0.250 0.022 0.002
Scheider (SWI) 0.000 0.128 0.765 0.106 0.000 0.000 0.000
Braun (FRG) 0.000 0.274 0.057 0.610 0.018 0.040 0.001
Ruotsalainen (FIN) 0.005 0.357 0.549 0.044 0.021 0.012 0.011
Yuping (CHN) 0.004 0.068 0.267 0.625 0.011 0.018 0.007
Hagger (GB) 0.007 0.773 0.088 0.056 0.001 0.006 0.069
Brown (USA) 0.096 0.188 0.035 0.591 0.088 0.002 0.000
Mulliner (GB) 0.461 0.147 0.192 0.122 0.009 0.067 0.002
Hautenauve (BEL) 0.250 0.724 0.000 0.014 0.008 0.002 0.002
Kytola (FIN) 0.569 0.232 0.113 0.013 0.068 0.001 0.004
Geremias (BRA) 0.811 0.002 0.084 0.000 0.012 0.082 0.009
Hui-Ing (TAI) 0.765 0.040 0.052 0.115 0.021 0.003 0.004
Jeong-Mi (KOR) 0.832 0.087 0.031 0.001 0.032 0.003 0.014
Launa (PNG) 0.809 0.166 0.022 0.001 0.001 0.001 0.000
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
Joyner-Kersee (USA) 15.87 5.39 1.09 0.00 3.08 6.58 10.29
John (GDR) 7.76 0.96 6.44 2.06 8.40 3.24 1.76
Behmer (GDR) 6.56 1.61 1.69 4.21 0.19 3.27 1.43
Sablovskaite (URS) 1.69 1.67 2.83 0.18 3.50 0.48 20.13
Choubenkova (URS) 1.73 10.72 0.18 6.37 8.02 0.91 4.88
Schulz (GDR) 1.02 0.02 3.64 0.39 9.25 7.23 0.91
Fleming (AUS) 1.13 0.37 0.04 2.16 9.89 0.41 1.74
Greiner (USA) 0.80 2.27 5.28 0.01 0.14 1.31 0.10
Lajbnerova (CZE) 0.26 0.07 0.21 3.46 5.49 4.02 5.30
Bouraga (URS) 0.54 0.97 0.27 4.06 17.73 8.97 0.04
Wijnsma (HOL) 0.29 6.80 0.15 1.50 1.45 6.78 2.84
Dimitrova (BUL) 1.32 0.44 0.05 2.11 10.36 3.12 0.42
Scheider (SWI) 0.00 2.27 30.96 4.90 0.01 0.00 0.11
Braun (FRG) 0.00 1.78 0.84 10.36 0.57 4.25 0.17
Ruotsalainen (FIN) 0.01 2.03 7.15 0.66 0.58 1.14 1.55
Yuping (CHN) 0.02 1.01 9.08 24.26 0.76 4.48 2.49
Hagger (GB) 0.03 10.60 2.76 2.02 0.06 1.24 22.99
Brown (USA) 0.25 1.84 0.78 15.15 4.21 0.29 0.00
Mulliner (GB) 1.18 1.41 4.21 3.06 0.41 10.44 0.57
Hautenauve (BEL) 1.10 11.90 0.00 0.60 0.62 0.57 0.62
Kytola (FIN) 1.96 2.98 3.34 0.42 4.25 0.30 1.34
Geremias (BRA) 3.79 0.03 3.36 0.01 1.02 23.44 3.95
Hui-Ing (TAI) 7.75 1.53 4.49 11.41 3.82 1.86 3.66
Jeong-Mi (KOR) 8.24 3.21 2.61 0.12 5.73 1.93 12.39
Launa (PNG) 36.73 28.12 8.55 0.53 0.47 3.73 0.32
Parallel analysis (see Hayton, Allen, and Scarpello, 2004 for more details)
A rotação pode facilitar a interpretação dos componentes
Parallel analysis suggests that the number of factors = NA and the number of components = 1
Loadings:
PC1 PC2
hurdles 0.956 -0.173
highjump 0.797 -0.271
shot 0.767 0.316
run200m 0.861 0.285
longjump 0.964
javelin 0.159 0.920
run800m 0.792 -0.245
PC1 PC2
SS loadings 4.460 1.194
Proportion Var 0.637 0.171
Cumulative Var 0.637 0.808
Loadings:
RC1 RC2
hurdles 0.970
highjump 0.839
shot 0.668 0.492
run200m 0.767 0.484
longjump 0.950 0.174
javelin 0.931
run800m 0.828
RC1 RC2
SS loadings 4.269 1.385
Proportion Var 0.610 0.198
Cumulative Var 0.610 0.808
Os resultados das 25 competidoras nos 7 eventos indicam que a maioria dos pares são correlacionados com exceção do evento dardo (javelin) Análise de Componentes Principais. Para obter os escores das componentes principais é necessário deixar os dados numa escala apropriada, pois estamos utilizando a matriz de correlação. os autovalores são entendidos como variâncias explicadas pelas componentes. A primeira componente principal representa 81% da variância.