Assignment 10

Principal Component Analysis

姓名:宋春林

Group 2; ID: 201328006310005

Question Description

某森林生态系统观测站的4项气象要素指标的主成分分析:对某样地进行为期一个月的观测,观测指标分别是:气压(X1),气温(X2),湿球温度(X3),0cm地温(X4),数据见R Code部分。

R Code

ggf <- data.frame(read.table("GGF201205.txt"))
colnames(ggf) <- c("X1", "X2", "X3", "X4")
ggf
##       X1   X2   X3   X4
## 1  711.9  5.4  5.4  8.1
## 2  707.7  5.7  5.5  8.4
## 3  709.0  9.6  8.1 11.5
## 4  713.0  8.0  7.8 10.4
## 5  712.9  8.4  8.2 10.6
## 6  709.8 11.8 10.6 13.6
## 7  709.9 13.4 11.6 14.3
## 8  712.9  9.2  9.0 11.1
## 9  714.7 11.4 11.1 14.4
## 10 712.1 14.5 12.1 15.4
## 11 710.0 11.0 10.8 12.5
## 12 711.8  7.6  7.4 10.3
## 13 709.1  7.5  7.3  9.5
## 14 715.0  0.3  0.2  1.0
## 15 714.7  3.8  3.5  7.5
## 16 713.0  4.4  4.2  7.3
## 17 708.9  8.8  7.2 11.0
## 18 713.7 11.8 10.4 13.9
## 19 715.6 10.8  9.6 12.7
## 20 709.2 13.4 12.3 15.0
## 21 711.0 11.1 10.8 12.5
## 22 711.7  6.4  6.3  9.3
## 23 709.2  7.3  7.1 10.4
## 24 713.0  4.8  4.6  7.5
## 25 713.3  7.0  6.9  9.8
## 26 711.2 11.0  9.6 13.5
## 27 712.7  9.2  9.1 10.5
## 28 711.0 10.0  9.8 11.5
## 29 717.2  7.0  6.8 10.0
## 30 714.7  8.6  8.4 11.8
## 31 713.6  7.1  7.0  8.9
ggf.cr <- princomp(ggf, cor = TRUE)
summary(ggf.cr, loadings = TRUE)
## Importance of components:
##                        Comp.1 Comp.2  Comp.3   Comp.4
## Standard deviation     1.7457 0.9491 0.19266 0.120419
## Proportion of Variance 0.7619 0.2252 0.00928 0.003625
## Cumulative Proportion  0.7619 0.9871 0.99637 1.000000
## 
## Loadings:
##    Comp.1 Comp.2 Comp.3 Comp.4
## X1  0.216  0.976              
## X2 -0.567  0.103  0.260  0.775
## X3 -0.564  0.128  0.540 -0.611
## X4 -0.560  0.143 -0.800 -0.160
loadings(ggf.cr)
## 
## Loadings:
##    Comp.1 Comp.2 Comp.3 Comp.4
## X1  0.216  0.976              
## X2 -0.567  0.103  0.260  0.775
## X3 -0.564  0.128  0.540 -0.611
## X4 -0.560  0.143 -0.800 -0.160
## 
##                Comp.1 Comp.2 Comp.3 Comp.4
## SS loadings      1.00   1.00   1.00   1.00
## Proportion Var   0.25   0.25   0.25   0.25
## Cumulative Var   0.25   0.50   0.75   1.00
plot(ggf.cr, type = "lines")

plot of chunk unnamed-chunk-1

biplot(ggf.cr)

plot of chunk unnamed-chunk-1

Conclusion Statement

上述结果中:

Standard deviation:主成分的标准差,即相应特征值的开方;

Proportion of Variance:方差的贡献率;

Cumulative Proportion:方差的累计贡献率。

前两个主成分方程为:

Y1=0.216X1+0.976X2

Y2=-0.567X1+0.103X2+0.260X3+0.775X4

这两个主成分的累计贡献率已经达到98.71%,取前两个主成分来降维。

第一主成分中X2系数达到0.976,因此第一主成分是表示气温的因子;第二主成分X1为负值,其他三项即气温(X2)、湿球温度(X3)、0cm地温(X4)均为正值,因此第二主成分是表示温度的综合因子。

See All Assignments by 宋春林