#今日使うデータセットの読み込み
library(datasets)
head(infert)
#パッケージの読み込み
library(dplyr)
library(tidyr)
データの概要:
自然流産と人工流産後の不妊症に関するデータ
学歴(Education),年齢(age),出産回数(parity),人工流産回数(induced),case,過去の自然流産回数(spontaneous),matched set number(stratum),stratum number(pooled.stratum)
今日用いる手法
1つまたは複数の列に対して条件を指定し,その条件にあう行を抽出する.
filter()
指定した行を切り出す.
slice()
指定した列の中身を昇順にして並び替える.
arrange()
必要な列だけを取り出す.
select()
列の名前を変更する.
rename()
新しい列を追加する.
mutate()
filter()
“data39”というデータフレームにageが39である人たちのデータを代入する.
data39 <- filter(infert, age == 39)
data39
slice()
“infert”の中から5行目から8行目を切り出す.切り出したデータを dataslice に入れて表示させる.
dataslice <- slice(infert, 5:8)
dataslice
arrange()
データを年齢順に並び替えます.並び替えたデータを dataage に入れて,最初の20行を表示させる.
dataage <- arrange(infert, age)
head(dataage, 20)
arrange()
データを年齢順に並び替えるが,今度は降順に並べ替える.そのためにはdesc()を用いる.
dataage <- arrange(infert, desc(age))
head(dataage, 20)
select()
age, case, stratum を取り出し,“datacut” に入れて最初のほうを表示させる. 最初にデータセットの名前を入れると,あとは“$”で指定しなくてもデータの名前を入れればよい.
datacut <- select(infert, age, case, stratum)
head(datacut)
rename()
列名を変更するときに使う.「rename(データセット, 新しい列名 = 既存の列名)」という使い方でよい. ここでは“datacut”から取り出す. 新しい名前が左辺に来ていることに注意.
dataarename <- rename(datacut, 年齢 = age, ケース = case, 層 = stratum)
head(dataarename)
クロス集計
educationとinducedでクロス集計をする.
eduage <- count(infert, education, induced)
eduage
mutate()
違うデータセットを用います.
head(airquality)
華氏を摂氏に計算し直す.
df <- mutate(airquality, TempC = (5 / 9) * (Temp - 32))
head(df)
四捨五入をして小数点第二位で丸める.
df <- mutate(df, TempC = round(TempC, 1))
head(df)
Tempの列を削除する
df2 <- select(df, -Temp)
head(df2)
順番の並べ替え
df3 <- select(df2, Ozone, Solar.R, Wind, TempC, Month, Day)
head(df3)
LS0tCnRpdGxlOiAiMjAxNjEyMjboo5zotrPos4fmlpkiCm91dHB1dDogaHRtbF9ub3RlYm9vawotLS0KCgpgYGB7cn0KI+S7iuaXpeS9v+OBhuODh+ODvOOCv+OCu+ODg+ODiOOBruiqreOBv+i+vOOBvwpsaWJyYXJ5KGRhdGFzZXRzKQpoZWFkKGluZmVydCkKI+ODkeODg+OCseODvOOCuOOBruiqreOBv+i+vOOBvwpsaWJyYXJ5KGRwbHlyKQpsaWJyYXJ5KHRpZHlyKQpgYGAKCiPjg4fjg7zjgr/jga7mpoLopoHvvJoKCuiHqueEtua1geeUo+OBqOS6uuW3pea1geeUo+W+jOOBruS4jeWmiueXh+OBq+mWouOBmeOCi+ODh+ODvOOCvwoK5a2m5q20KEVkdWNhdGlvbinvvIzlubTpvaIoYWdlKe+8jOWHuueUo+WbnuaVsChwYXJpdHkp77yM5Lq65bel5rWB55Sj5Zue5pWwKGluZHVjZWQp77yMY2FzZe+8jOmBjuWOu+OBruiHqueEtua1geeUo+WbnuaVsChzcG9udGFuZW91cynvvIxtYXRjaGVkIHNldCBudW1iZXIoc3RyYXR1bSnvvIxzdHJhdHVtIG51bWJlcihwb29sZWQuc3RyYXR1bSkgCgoKI+S7iuaXpeeUqOOBhOOCi+aJi+azlQoKMeOBpOOBvuOBn+OBr+ikh+aVsOOBruWIl+OBq+WvvuOBl+OBpuadoeS7tuOCkuaMh+WumuOBl++8jOOBneOBruadoeS7tuOBq+OBguOBhuihjOOCkuaKveWHuuOBmeOCi++8jgoKZmlsdGVyKCkKCuaMh+WumuOBl+OBn+ihjOOCkuWIh+OCiuWHuuOBme+8jgoKc2xpY2UoKQoK5oyH5a6a44GX44Gf5YiX44Gu5Lit6Lqr44KS5piH6aCG44Gr44GX44Gm5Lim44Gz5pu/44GI44KL77yOCgphcnJhbmdlKCkKCuW/heimgeOBquWIl+OBoOOBkeOCkuWPluOCiuWHuuOBme+8jgoKc2VsZWN0KCkg44CACgrliJfjga7lkI3liY3jgpLlpInmm7TjgZnjgovvvI4KCnJlbmFtZSgpCgrmlrDjgZfjgYTliJfjgpLov73liqDjgZnjgovvvI4KCm11dGF0ZSgp44CACgojZmlsdGVyKCkKCiJkYXRhMzki44Go44GE44GG44OH44O844K/44OV44Os44O844Og44GrYWdl44GMMznjgafjgYLjgovkurrjgZ/jgaHjga7jg4fjg7zjgr/jgpLku6PlhaXjgZnjgovvvI4KCmBgYHtyfQpkYXRhMzkgPC0gZmlsdGVyKGluZmVydCwgYWdlID09IDM5KQpkYXRhMzkKYGBgCgojc2xpY2UoKQoKImluZmVydCLjga7kuK3jgYvjgok16KGM55uu44GL44KJOOihjOebruOCkuWIh+OCiuWHuuOBme+8juWIh+OCiuWHuuOBl+OBn+ODh+ODvOOCv+OCkiBkYXRhc2xpY2Ug44Gr5YWl44KM44Gm6KGo56S644GV44Gb44KL77yOCgpgYGB7cn0KZGF0YXNsaWNlIDwtIHNsaWNlKGluZmVydCwgNTo4KSAKZGF0YXNsaWNlCmBgYAoKCiNhcnJhbmdlKCkgCgrjg4fjg7zjgr/jgpLlubTpvaLpoIbjgavkuKbjgbPmm7/jgYjjgb7jgZnvvI7kuKbjgbPmm7/jgYjjgZ/jg4fjg7zjgr/jgpIgZGF0YWFnZSDjgavlhaXjgozjgabvvIzmnIDliJ3jga4yMOihjOOCkuihqOekuuOBleOBm+OCi++8jgpgYGB7cn0KZGF0YWFnZSA8LSBhcnJhbmdlKGluZmVydCwgYWdlKQpoZWFkKGRhdGFhZ2UsIDIwKQoKYGBgCgoKI2FycmFuZ2UoKSAKCuODh+ODvOOCv+OCkuW5tOm9oumghuOBq+S4puOBs+abv+OBiOOCi+OBjO+8jOS7iuW6puOBr+mZjemghuOBq+S4puOBueabv+OBiOOCi++8juOBneOBruOBn+OCgeOBq+OBr2Rlc2MoKeOCkueUqOOBhOOCi++8jgpgYGB7cn0KZGF0YWFnZSA8LSBhcnJhbmdlKGluZmVydCwgZGVzYyhhZ2UpKQpoZWFkKGRhdGFhZ2UsIDIwKQoKYGBgCgoKI3NlbGVjdCgpCgphZ2UsIGNhc2UsIHN0cmF0dW0g44KS5Y+W44KK5Ye644GX77yMImRhdGFjdXQiIOOBq+WFpeOCjOOBpuacgOWIneOBruOBu+OBhuOCkuihqOekuuOBleOBm+OCi++8jgrmnIDliJ3jgavjg4fjg7zjgr/jgrvjg4Pjg4jjga7lkI3liY3jgpLlhaXjgozjgovjgajvvIzjgYLjgajjga8iJCLjgafmjIflrprjgZfjgarjgY/jgabjgoLjg4fjg7zjgr/jga7lkI3liY3jgpLlhaXjgozjgozjgbDjgojjgYTvvI4KCmBgYHtyfQpkYXRhY3V0IDwtIHNlbGVjdChpbmZlcnQsIGFnZSwgY2FzZSwgc3RyYXR1bSkKaGVhZChkYXRhY3V0KQoKYGBgCgojcmVuYW1lKCkgCgrliJflkI3jgpLlpInmm7TjgZnjgovjgajjgY3jgavkvb/jgYbvvI7jgIxyZW5hbWUo44OH44O844K/44K744OD44OILCDmlrDjgZfjgYTliJflkI0gPSDml6LlrZjjga7liJflkI0p44CN44Go44GE44GG5L2/44GE5pa544Gn44KI44GE77yOCuOBk+OBk+OBp+OBryJkYXRhY3V0IuOBi+OCieWPluOCiuWHuuOBme+8jgrmlrDjgZfjgYTlkI3liY3jgYzlt6bovrrjgavmnaXjgabjgYTjgovjgZPjgajjgavms6jmhI/vvI4KCmBgYHtyfQogZGF0YWFyZW5hbWUgPC0gcmVuYW1lKGRhdGFjdXQsIOW5tOm9oiA9IGFnZSwg44Kx44O844K5ID0gY2FzZSwg5bGkID0gc3RyYXR1bSkKIGhlYWQoZGF0YWFyZW5hbWUpCmBgYAoKI+OCr+ODreOCuembhuioiAplZHVjYXRpb27jgahpbmR1Y2Vk44Gn44Kv44Ot44K56ZuG6KiI44KS44GZ44KL77yOCmBgYHtyfQplZHVhZ2UgPC0gY291bnQoaW5mZXJ0LCBlZHVjYXRpb24sIGluZHVjZWQpCmVkdWFnZQpgYGAKCgoKCgoKI211dGF0ZSgpCgrpgZXjgYbjg4fjg7zjgr/jgrvjg4Pjg4jjgpLnlKjjgYTjgb7jgZnvvI4KYGBge3J9CmhlYWQoYWlycXVhbGl0eSkKYGBgCgoj6I+v5rCP44KS5pGC5rCP44Gr6KiI566X44GX55u044GZ77yOCmBgYHtyfQpkZiA8LSBtdXRhdGUoYWlycXVhbGl0eSwgVGVtcEMgPSAoNSAvIDkpICogKFRlbXAgLSAzMikpCiBoZWFkKGRmKQpgYGAKCiPlm5vmjajkupTlhaXjgpLjgZfjgablsI/mlbDngrnnrKzkuozkvY3jgafkuLjjgoHjgovvvI4KYGBge3J9CiBkZiA8LSBtdXRhdGUoZGYsIFRlbXBDID0gcm91bmQoVGVtcEMsIDEpKQogaGVhZChkZikKYGBgCgojVGVtcOOBruWIl+OCkuWJiumZpOOBmeOCiwoKYGBge3J9CiBkZjIgPC0gc2VsZWN0KGRmLCAtVGVtcCkKIGhlYWQoZGYyKQpgYGAKCiPpoIbnlarjga7kuKbjgbnmm7/jgYgKCmBgYHtyfQogZGYzIDwtIHNlbGVjdChkZjIsIE96b25lLCBTb2xhci5SLCBXaW5kLCBUZW1wQywgTW9udGgsIERheSkKIGhlYWQoZGYzKQpgYGAKCgoj5Y+C6ICD6LOH5paZCmh0dHA6Ly9oaWthcnUxMTIyLmhhdGVuYWRpYXJ5LmpwLw==