{r} library(tidyverse) library(psych)

导入包

{r} data<- read.csv("C:/Users/Chen/Documents/WeChat Files/wxid_c0ncguohpnhf22/FileStorage/File/2023-12/soccer.csv", header = T, stringsAsFactors = F) view(data)

读入数据

{r} predictor<-data[3:16] M <- cor(predictor) par(family='STHeiti') corrplot::corrplot(M, tl.srt = 60,tl.col = "black")

绘制相关系数图,这里的自变量考虑了身价,因为任务3题干中有句除身价外,所以认为这里的包括身价,首先构建一个只有自变量的数据框predictor,效果如下,可以看到部分变量之间正相关较强,而且能够看出防守类型的变量之间相关性较强,进攻类型变量之间相关性较强

{r} predictor<-data[4:16] par(family='STHeiti') result1 <- scree(predictor, factors = F, pc = T, main = "主成分分析崖底碎石图", hline = -1) cumvar <- round(cumsum(result1$pcv)/sum(result1$pcv),2) cat('前三个主成分累计方差贡献率为:', cumvar[1:3])

使用scree函数来绘制碎石图,根据图片与方差贡献率,选择主成分为3个
pc <- principal(predictor, nfactors = 3)
pc
pc <- principal(predictor, nfactors = 3, scores = TRUE)
pc$scores

RC1,RC2RC3分别代表3个成分的载荷,可以看出第一主成分解释了射门56%的方差。

如图可见第一主成分多和进攻性的技术有关,第2主成分多和防守性的技术有关,第3主成分多和射门技术有关,所以将第一主成分成为进攻因子,第二主成分成为防守因子,第3主成分成为射门因子

这里以第一个球员为例,他的进攻因子和防守因子得分都不太高但射门得分挺高的,所以可以让这个球员专门踢点球。