Base R チートシート日本語版

RStudio公式サイトからの翻訳です．

ヘルプの参照

ヘルプ・ファイルを見る

?mean 特定の関数のヘルプを表示
help.search(‘weighted mean’) 語句でヘルプ・ファイルを検索
help(package = ‘dplyr’) 特定のパッケージのヘルプを表示

###オブジェクトの情報を調べる

str(irs) オブジェクトのstructureを調べる．
class(iris) オブジェクトのクラスを調べる．

パッケージを使う

install.packages(‘dplyr’) CRANからパッケージのダウンロードとインストールを行う
library(dplyr) 毎セッション時に当該パッケージのすべての関数を使えるようにしておく
dplyr::select library()宣言をせずにインストール済みのパッケージから関数を使う
data(iris) ビルトインされたデータセットをenvironmentに導入する

ワーキングディレクトリ

getwd() working directoryを調べる
setwd(‘c://file/path') wdをsetしなおす

ベクトル

ベクトルを作る

c(2, 4, 6) ベクトルに要素を追加する 2 4 6を得る
2:6 整数のシークエンスを作る 2 3 4 5 6を得る
seq(2, 3, by=0.5) より複雑なsequence 2.0 2.5 3.0を得る
rep(1:2, times=3) ベクトルをrepeatする 1 2 1 2 1 2を得る
rep(1:2, each=3) ベクトルの各要素をrepeatする 1 1 1 2 2 2を得る

ベクトルの関数

sort(x) xをsortする
rev(x) xをreverseさせる
table(x) 値の総数をtable=一覧にする
unique(x) 値の種類の数を数えるたとえばunique(c(2, 2, 4, 6))は3

ベクトルの要素を選ぶ

ベクトルの位置に関するもの

x[4] 4番目の要素
x[-4] 4番目を除く要素
x[2:4] 2番目から4番目までの要素
x[-(2:4)] 2番目から4番目までの要素を除く要素
x[c(1,5)] 1番目と5番目の要素

ベクトルの値に関するもの

x[x==10] 10に等しい要素
x[x<0] 0より小さい要素
x[x %in% c(1,2,5)] 1,2,5のセットに含まれる要素

文字を持つベクトルに関するもの

x[‘apple’] ‘apple’の名前を持つ要素

プログラミング

forループ

for (variable in sequence){
  Do something
}

例

for (i in 1:4){
  j <- i + 10
  print (j)
}

whileループ

while (condition){
  Do something
}

例

while (i < 5){
  print(i)
  i <- i + 1
}

ifステートメント

if (condition){
  Do something
} else {
  Do something different
}

例

if (i > 3){
  print('Yes')
} else {
  print('No')
}

新しい関数

function_name <- function(var){
  Do something
  return(new_variable)
}

例

square <- function(x){
  squared <- x*x
  return(squared)
}

データの読み込みと書き出し

※readrパッケージも参照．

インプット	アウトプット	何をしているか
`df<-read.table(‘file.txt')`	`write.table(df, ‘file.txt')`	テキストファイルの読み込みと書き出し
`df<-read.csv(‘file.csv')`	`write.csv(df, ‘file.csv')`	カンマ区切りcsvファイルの読み込みと書き出し（read.tableおよびwrite.tableの特殊パターン）
`load(‘file.RData')`	`save(df, file = ‘file.Rdata')`	Rでしか扱えないRdata形式のファイルの読み込みと書き出し

## データ型

データ型は下の表の上の型から下の型へは必ず変換できる．

型	中身	説明
`as.logical`	TRUE, FALSE, TRUE	ブール値(T or F)
`as.numeric`	1,0,1	整数または小数
`as.character`	‘1’,’0’,’1’	文字列．factorより好まれる
`as.factor`	‘1’,’0’,’1’ levels: ‘1’,’0’	レベルを伴う文字列．なんらかの統計モデルのもとで使われる

## 数学関係の関数

log(x) natural log自然対数を返す
exp(x) exponential指数を返す
max(x) xのうち最大の要素の値を返す
min(x) xのうち最小の要素の値を返す
round(x, n) xを小数nまでroundする＝丸める
significant(x, n) xをn桁のsignificant figures有効数字まで丸める
cor(x, y) xとyの相関係数を返す
sum(x) xの総和
mean(x) xの平均
median(x) xの中央値
quantile(x) 四分位の値を返す
rank(x) 変数xにおける各要素の昇順の順位を返す
var(x) xのvariance分散を返す
sd(x) standard deviation標準偏差を返す

変数の割当

以下のように行う．

> a <- 'apple'
> a
[1] 'apple'

環境

RStudioの環境パネルも使える．

ls() ls()は環境にあるdfすべてをlistする，ls(iris)はirisの変数すべてをlist
rm(x) xを環境からremoveする
rm(list = ls()) すべてのdfを環境からremoveする，rm(list = ls(iris)) はirisの変数すべてをremove

行列matrices

ベクトルxから行列をつくるのは関数matrixで．

m <- matrix(x, nrow = 3, ncol = 3)

このとき3×3の表が生成される．

2行目を選ぶなら m[2, ]
1列目を選ぶならm[ ,1]
2行3列目のセルを選ぶならm[2, 3]
t(m) 行列を転置transposeさせる
m %*% n 行列mと行列nの積を求める
solve(m, n) mを係数, nを答えとしたときの連立方程式の解を出力（参考）

データフレーム

※dplyrパッケージも参照．

data.frame関数はデータフレームをつくる．データフレームとは，リストのうち，すべての要素が同じ長さ（行数）をもつものをいう．例は以下のようなもの．

df <- data.frame(x = 1:3, y = c('a', 'b', 'c'))

データフレームで部分集合subsetをつくるときは，行列とリスト両方の指定のしかたができる．例えば，

2列目を指定するとき df[ , 2] , df[[2]] , df$y
1行目を指定するとき df[1, ] , df$x

データフレームの構造を知りたいときは，以下の関数が使える．

View(df) すべてのデータを表示
head(df) 最初の6行を表示

そのほか基本的な関数として以下のようなものがある．

nrow(df) number of rows 行数を表示
ncol(df) number of columns 列数を表示
dim(df) dfのdimension 次元を表示，すなわち行数と列数を同時に表示
cbind(df, sth) 行数の同じdf, list, matrix同士の結合
rbind(df, sth) 列数の同じdf, list, matrix同士の結合

文字列strings

※stringrパッケージも参照．

paste(x, y, sep = '') 複数のベクトルを結合させる
paste(x, collapse = '') 複数のベクトルを結合させる
grep(pattern, x) xにおける正規表現を検索，表示
gsub(pattern, replace, x) xをreplace引数の文字列で置き換える
toupper(x) xを大文字に
tolower(x) xを小文字に
nchar(x) 文字列xのなかの文字数を表示

統計学

lm(y ~ x, data=df) 線形回帰モデル linear model
glm(y ~ x, data=df) 一般化線形モデル generalized linear model
summary(x) xの記述統計量を表示
t.test(x, y) 母平均のt検定
pairwise.t.test(x, y) ペアになった値での平均値のt検定
prop.test(x, y) 母比率のt検定
aov(x) 分散分析

分布

確率分布に関係する関数

	乱数発生 random variates	xの確率密度density function の値を返す	任意の確率密度から確率probabilityを返す	任意の下側確率から確率密度を返す
正規分布 normal	`rnorm(n, mean, sd)`	`dnorm(x, mean, sd)`	`pnorm(density, mean, sd)`	`qnorm(p ,mean, sd)`
ポワソン分布 poisson	`rpois`	`dpois`	`ppois`	`qpois`
二項分布 binomial	`rbinom`	`dbinom`	`pbinom`	`qbinom`
一様分布 uniform	`runif`	`dunif`	`punif`	`qunif`

## 作図

※ggplot2パッケージも参照のこと

plot(x) xの値を順番に並べて図示
plot(x, y) yに対するxの値を図示
hist(x) xのhistgramを図示

日時

lubridateパッケージを参照