首先,请检查电脑,C盘在装完所需的软件后,至少空出20G的空间。
其次,请修改你的计算机名字,不要有特殊字符,不要有空格,不要用连字符,如果需要连接,请使用”_“符号连接前后。
第三,请设置你的数据分析盘,并将盘的名字修改为英文,规则如计算机名字修改,请注意,数据分析盘必须有足够的空间。
第四,建议基于编号的文件夹顺序,并且每个项目甚或每组分析单独设置文件夹,方便后期的管理。
第五,确保每个需要处理数据的文件夹中必须有“Rproj”文件(随意copy,改名即可)
为了更好的理解这个Directory,我们用word做个例子
打开桌面固定的word文件—保存也会在桌面
程序打开word,再想打开文件就需要选择或者会有记忆功能,暂存上次退出时的word文档。
同样,保存也是一个道理。
理解这个Directory之后,就可以理解我们为什么要在文件夹里面单独运行我们的Rstudio(Rproj)
我们可以查看当前的目录中有什么,所以直接使用dir()即可
dir()
## [1] "Day01_R_Basic.R" "expression_data.Rdata"
## [3] "gene_expression_data.csv" "Mydata.txt"
## [5] "R-basic.html" "R-basic.Rmd"
## [7] "R basic.Rmd" "R basic.Rproj"
## [9] "我的数据.xlsx"
wd主要是工作目录,也就代表了我们当前需要针对那个目录(文件夹进行操作)
查看工作目录
## [1] "C:/Users/Administrator/Desktop/RCode/Day01/Basic"
如果不是我们想要操作的目录空间,我们重新设置一下:
设置完再运行getwd检验一下即可
注:反斜杠的使用,在R中,路径的分割用反斜杠/或者两个正斜杠\
#### 载入保存文件
1.load直接载入文件用
load(file = "expression_data.Rdata") ##load的文件如果不写路径,默认当前的目录
save(expression_data,file = "expression_data.Rdata") ## save的路径,如果不写路径,默认当前的目录
write.csv(expression_data, file = "gene_expression_data.csv")## 同save
2.read.table/read.csv的使用
注:read.table可以通用,但要注意数据的格式。尤其是当下载的数据为txt格式的时候(后面再强调)
Mydata <- read.table("Mydata.txt")
注:load数据和read数据的区别在哪里?
3.还有其他rds的数据,后续遇到了慢慢学习。
### R语言数据处理过程中的基本操作 (我们结合AI进行讲解) #### 增加列
$的使用
使用“我的数据”excel文件进行相关数据的操作和练习
替换 增加 修改内容 以及分组 判断 排序等基本操作