\[ \textbf{赵炜 统计Q1141} \]
[摘要] R 软件是免费、开源、专业、前沿的统计分析软件,分析数据的功能强大,拥有出色的绘图功,可用于多个平台。R官方网站拥有世界各地统计学家贡献的大量最新的软件包(packages),这些软件包以飞快的速度增加很更新。它们代表了统计学家创造的崭新的统计方法。这些软件的代码都是公开的。R软件所有的这些特性非常有I利于统计学专业的学生对统计算法的学习计算。本篇论文以实验设计的数据的分析为背景,介绍R软件在具体的例子中如何进行运用。
[关键字] R软件 实验设计数据处理
二战后,日本工业高速发展的奥秘之一就是实验设计,“实验设计画”在日本是工程师的共同语言。实验设计课程是统计学与工程技术想结合的学科,包括 两部分内容,第一是对实验进行科学有效的设计,第二是对实验数据进行正确的分析。作为统计学专业的,数据的分析成了我们必须研究的问题。当前,试验设计和数据分析处理几乎全部采用软件完成。商业软件诸如SAS、SPSS、Matlab等在试验设计与数据处理中应用较多。鉴于该类软件价格不菲,需要较大的成本,因此探索自由软件在试验设计的数据处理中的应用,对培养我们数据分析和创新能力、实践能力具有重要意义。
R软件[1]是具有强大统计分析、绘图功能的软件系统,它是由新 西兰奥克兰大学的Robert Gentleman和Ross Ihaka及其他志愿人员基 于AT&T贝尔实验室所创S语言开发的一个GNU项目,S语言主要 内容包含在Insightful公司的S-Plus软件中,R也可以当作S语言的 一种实现。R软件具有强大的数据处理功能和丰富的图形展示功能, 可快速、精确的处理试验统计分析中复杂的数据。R软件中大多数功能是以“包(package)” 的形式提供,有二十多个基础包随R一并安装,并随R的启动自动 加载,额外的包可从R官方网站CRAN自由下载并安装,此后只需 加载即可使用。这些软件包以飞快的速度增加更新,已从2009年底的大约1000个增加到 2012年8月底的4009个,仅2012年8月份就增加了449个。它们代表了统计学家的崭新的统计方法。 由于统计正以前所未有的速度发展,R网站及其各个软件包也在不断更新,R的实用范围也会 越来越广,将会成为主流的数据分析软件。
3.1 正交设计 我们采用《实验设计》[2]书中例子 L9(3^4) 说明正交实验设计 因素与水平表
library(DoE.base)
## Loading required package: grid
## Loading required package: conf.design
##
## Attaching package: 'DoE.base'
##
## 下列对象被屏蔽了from 'package:stats':
##
## aov, lm
##
## 下列对象被屏蔽了from 'package:graphics':
##
## plot.design
oa.design(ID=L9.3.4)
## A B C D
## 1 3 2 1 3
## 2 2 1 3 3
## 3 3 3 3 1
## 4 1 1 1 1
## 5 3 1 2 2
## 6 1 3 2 3
## 7 2 2 2 1
## 8 1 2 3 2
## 9 2 3 1 2
## class=design, type= oa
从上文可以看出,R软件可以非常高效的解决各类试验设计 与数据处理中的问题。文章仅简单介绍了R软件几个有关试验设 计的包,但R软件并不局限于某一类问题,配合不同功能的扩展 包,R软件可应用的范围相当广泛。利用R软件丰富的扩展资源, 其简洁和易操作性是其它类似软件难以比拟的,它将成为试验设 计和试验数据处理的得力工具。
[1] R Core Team:A language and environment for statistical computing.R Foundation for Statistical Computing,Vienna,Austria.http://www.r-project.org/
[2] 实验设/刘文卿编著. ——北京:清华大学出版社,2005.2(2007重印)(应用统计系列教材)ISBN 978-7-302-10141-3
[3] R in Action:Data analysis and graphics with R/ ROBERT I. KABACOF (c)2011 by Manning Publications ISBN: 9781935182399
[4] 复杂数据统计方法——基于R的应用(第二版)/ 吴喜之编著 ——北京:中国人民大学出版,2013 ISBN 978-7-300-18141-7