Iris データセットは R で非常にpopular です。 Iris データセットには、
iris 種の特性値 (Sepal.Length, Sepal.Width, Petal.Length, Petal.Width)
と種のラベ ル (species) が含まれています。以下は Iris
データを解析するための基本的なス テップです。
- R Studio で Iris データセットを読み込みます。
data("iris")
# RStudioでIrisデータセットを読み込む
data("iris")
- データの最初の few 行を表示します。
head(iris)
# データの最初の数行を表示する
head(iris)
- データの summary を表示します。summary()
は、データの平均値、標準偏差、
最大値、最小値を計算して、データの分布状況を示します。
summary(iris)
# データのsummaryを表示する
summary(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50
Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
- データの平均と標準偏差を表示します。
mean(iris$Sepal.Length)
sd(iris$Sepal.Length)
# データの平均と標準偏差を表示する
mean(iris$Sepal.Length)
[1] 5.843333
sd(iris$Sepal.Length)
[1] 0.8280661
- データの散布図を作成します。scatterplot()
は、2つの列間の関係を視覚化す るのに使用されます。
scatterplot(iris$Sepal.Length ~ iris$Petal.Length)
# データのscatterplotを作成する
scatterplot(iris$Sepal.Length ~ iris$Petal.Length)
Error in scatterplot(iris$Sepal.Length ~ iris$Petal.Length) :
could not find function "scatterplot"
エラーのためggplotで
library(ggplot2)
ggplot(iris, aes(x = Sepal.Length, y = Petal.Length)) + geom_point()
library(ggplot2)
ggplot(iris, aes(x = Sepal.Length, y = Petal.Length)) + geom_point()

- データの特性値の配列を分析します。summary()
は、データの平均、標準偏差、
最大値、最小値を計算して、データの分布状況を示します。
summary(iris[, c("Sepal.Length", "Petal.Length")])
# データの配列を分析する
summary(iris[, c("Sepal.Length", "Petal.Length")])
Sepal.Length Petal.Length
Min. :4.300 Min. :1.000
1st Qu.:5.100 1st Qu.:1.600
Median :5.800 Median :4.350
Mean :5.843 Mean :3.758
3rd Qu.:6.400 3rd Qu.:5.100
Max. :7.900 Max. :6.900
- データの特性値と種のラベルとの関係を分析します。summary()
は、データの平
均、標準偏差、最大値、最小値を計算して、データの分布状況を示します。
summary(iris[, c("Sepal.Length", "Petal.Width")],by = iris$Species)
# データの特性値と種のラベルの関係を分析する
summary(iris[, c("Sepal.Length", "Petal.Width")],by = iris$Species)
Sepal.Length Petal.Width
Min. :4.300 Min. :0.100
1st Qu.:5.100 1st Qu.:0.300
Median :5.800 Median :1.300
Mean :5.843 Mean :1.199
3rd Qu.:6.400 3rd Qu.:1.800
Max. :7.900 Max. :2.500
- データの特性値がどのように変化するかを探索します。 plot()
は、2つの列間 の関係を視覚化するのに使用されます。
plot(iris$Sepal.Length ~ iris$Petal.Length)
# データの特性値の変化を探索する
plot(iris$Sepal.Length ~ iris$Petal.Length)

- データの特性値と種のラベルとの関係に基づいて、 decision tree
を作成しま す。 rpart() は、 decision tree
を作成してデータの特性を推論するために使用さ れます。
library(rpart)
rpart(iris$Species ~ iris$Sepal.Length + iris$Petal.Length)
# データの特性値と種のラベルの関係に基づいてdecision treeを作成する
library(rpart)
rpart(iris$Species ~ iris$Sepal.Length + iris$Petal.Length)
n= 150
node), split, n, loss, yval, (yprob)
* denotes terminal node
1) root 150 100 setosa (0.33333333 0.33333333 0.33333333)
2) iris$Petal.Length< 2.45 50 0 setosa (1.00000000 0.00000000 0.00000000) *
3) iris$Petal.Length>=2.45 100 50 versicolor (0.00000000 0.50000000 0.50000000)
6) iris$Petal.Length< 4.75 45 1 versicolor (0.00000000 0.97777778 0.02222222) *
7) iris$Petal.Length>=4.75 55 6 virginica (0.00000000 0.10909091 0.89090909) *
上記は Irisデータセットを解析するための基本的なステップです。 R
Studio の GUI を使用して、簡単にデータの分析を実行できます。また、R
コマンドラインイン
ターフェイスで、簡単にデータを解析し、特定のタスクを実行できます。
LS0tCnRpdGxlOiAiUiBOb3RlYm9vayIKb3V0cHV0OiBodG1sX25vdGVib29rCmVkaXRvcl9vcHRpb25zOiAKICBtYXJrZG93bjogCiAgICB3cmFwOiA3MgotLS0KCklyaXMg44OH44O844K/44K744OD44OI44GvIFIg44Gn6Z2e5bi444GrcG9wdWxhciDjgafjgZnjgIIgSXJpcyDjg4fjg7zjgr/jgrvjg4Pjg4jjgavjga/jgIEKaXJpcyDnqK7jga7nibnmgKflgKQgKFNlcGFsLkxlbmd0aCwgU2VwYWwuV2lkdGgsIFBldGFsLkxlbmd0aCwgUGV0YWwuV2lkdGgpCuOBqOeoruOBruODqeODmSDjg6sgKHNwZWNpZXMpIOOBjOWQq+OBvuOCjOOBpuOBhOOBvuOBmeOAguS7peS4i+OBryBJcmlzCuODh+ODvOOCv+OCkuino+aekOOBmeOCi+OBn+OCgeOBruWfuuacrOeahOOBquOCuSDjg4bjg4Pjg5fjgafjgZnjgIIKCjEuICBSIFN0dWRpbyDjgacgSXJpcyDjg4fjg7zjgr/jgrvjg4Pjg4jjgpLoqq3jgb/ovrzjgb/jgb7jgZnjgIIKCmBgYCByCiAgICBkYXRhKCJpcmlzIikKYGBgCgpgYGB7cn0KICAgICAgIyBSU3R1ZGlv44GnSXJpc+ODh+ODvOOCv+OCu+ODg+ODiOOCkuiqreOBv+i+vOOCgAogICAgICBkYXRhKCJpcmlzIikKYGBgCgoyLiAg44OH44O844K/44Gu5pyA5Yid44GuIGZldyDooYzjgpLooajnpLrjgZfjgb7jgZnjgIIKCmBgYCByCiAgICBoZWFkKGlyaXMpCmBgYAoKYGBge3J9CiAgICAgICMg44OH44O844K/44Gu5pyA5Yid44Gu5pWw6KGM44KS6KGo56S644GZ44KLCiAgICAgIGhlYWQoaXJpcykKYGBgCgozLiAg44OH44O844K/44GuIHN1bW1hcnkg44KS6KGo56S644GX44G+44GZ44CCc3VtbWFyeSgpCiAgICDjga/jgIHjg4fjg7zjgr/jga7lubPlnYflgKTjgIHmqJnmupblgY/lt67jgIEKICAgIOacgOWkp+WApOOAgeacgOWwj+WApOOCkuioiOeul+OBl+OBpuOAgeODh+ODvOOCv+OBruWIhuW4g+eKtuazgeOCkuekuuOBl+OBvuOBmeOAggoKYGBgIHIKICAgICBzdW1tYXJ5KGlyaXMpCmBgYAoKYGBge3J9CiAgICAgICMg44OH44O844K/44Guc3VtbWFyeeOCkuihqOekuuOBmeOCiwogICAgICBzdW1tYXJ5KGlyaXMpCmBgYAoKNC4gIOODh+ODvOOCv+OBruW5s+Wdh+OBqOaomea6luWBj+W3ruOCkuihqOekuuOBl+OBvuOBmeOAggoKYGBgIHIKICAgICAgbWVhbihpcmlzJFNlcGFsLkxlbmd0aCkKICAgICAgc2QoaXJpcyRTZXBhbC5MZW5ndGgpCmBgYAoKYGBge3J9CiAgICAgICMg44OH44O844K/44Gu5bmz5Z2H44Go5qiZ5rqW5YGP5beu44KS6KGo56S644GZ44KLCiAgICAgIG1lYW4oaXJpcyRTZXBhbC5MZW5ndGgpCiAgICAgIHNkKGlyaXMkU2VwYWwuTGVuZ3RoKQpgYGAKCjUuICDjg4fjg7zjgr/jga7mlaPluIPlm7PjgpLkvZzmiJDjgZfjgb7jgZnjgIJzY2F0dGVycGxvdCgpCiAgICDjga/jgIEy44Gk44Gu5YiX6ZaT44Gu6Zai5L+C44KS6KaW6Kaa5YyW44GZIOOCi+OBruOBq+S9v+eUqOOBleOCjOOBvuOBmeOAggoKYGBgIHIKICAgICBzY2F0dGVycGxvdChpcmlzJFNlcGFsLkxlbmd0aCB+IGlyaXMkUGV0YWwuTGVuZ3RoKQpgYGAKCmBgYHtyfQogICAgICAjIOODh+ODvOOCv+OBrnNjYXR0ZXJwbG9044KS5L2c5oiQ44GZ44KLCiAgICAgIHNjYXR0ZXJwbG90KGlyaXMkU2VwYWwuTGVuZ3RoIH4gaXJpcyRQZXRhbC5MZW5ndGgpCiAgICAgIAogIApgYGAKCuOCqOODqeODvOOBruOBn+OCgWdncGxvdOOBpwoKYGBgIHIKbGlicmFyeShnZ3Bsb3QyKQpnZ3Bsb3QoaXJpcywgYWVzKHggPSBTZXBhbC5MZW5ndGgsIHkgPSBQZXRhbC5MZW5ndGgpKSArIGdlb21fcG9pbnQoKQpgYGAKCmBgYHtyfQpsaWJyYXJ5KGdncGxvdDIpCmdncGxvdChpcmlzLCBhZXMoeCA9IFNlcGFsLkxlbmd0aCwgeSA9IFBldGFsLkxlbmd0aCkpICsgZ2VvbV9wb2ludCgpCgpgYGAKCjYuICDjg4fjg7zjgr/jga7nibnmgKflgKTjga7phY3liJfjgpLliIbmnpDjgZfjgb7jgZnjgIJzdW1tYXJ5KCkKICAgIOOBr+OAgeODh+ODvOOCv+OBruW5s+Wdh+OAgeaomea6luWBj+W3ruOAgQogICAg5pyA5aSn5YCk44CB5pyA5bCP5YCk44KS6KiI566X44GX44Gm44CB44OH44O844K/44Gu5YiG5biD54q25rOB44KS56S644GX44G+44GZ44CCCgpgYGAgcgogICAgIHN1bW1hcnkoaXJpc1ssIGMoIlNlcGFsLkxlbmd0aCIsICJQZXRhbC5MZW5ndGgiKV0pCmBgYAoKYGBge3J9CiAgICAgICMg44OH44O844K/44Gu6YWN5YiX44KS5YiG5p6Q44GZ44KLCiAgICAgIHN1bW1hcnkoaXJpc1ssIGMoIlNlcGFsLkxlbmd0aCIsICJQZXRhbC5MZW5ndGgiKV0pCmBgYAoKNy4gIOODh+ODvOOCv+OBrueJueaAp+WApOOBqOeoruOBruODqeODmeODq+OBqOOBrumWouS/guOCkuWIhuaekOOBl+OBvuOBmeOAgnN1bW1hcnkoKQogICAg44Gv44CB44OH44O844K/44Gu5bmzCiAgICDlnYfjgIHmqJnmupblgY/lt67jgIHmnIDlpKflgKTjgIHmnIDlsI/lgKTjgpLoqIjnrpfjgZfjgabjgIHjg4fjg7zjgr/jga7liIbluIPnirbms4HjgpLnpLrjgZfjgb7jgZnjgIIKCmBgYCByCiAgICAgIHN1bW1hcnkoaXJpc1ssIGMoIlNlcGFsLkxlbmd0aCIsICJQZXRhbC5XaWR0aCIpXSxieSA9IGlyaXMkU3BlY2llcykKYGBgCgpgYGB7cn0KICAgICAgIyDjg4fjg7zjgr/jga7nibnmgKflgKTjgajnqK7jga7jg6njg5njg6vjga7plqLkv4LjgpLliIbmnpDjgZnjgosKICAgICAgc3VtbWFyeShpcmlzWywgYygiU2VwYWwuTGVuZ3RoIiwgIlBldGFsLldpZHRoIildLGJ5ID0gaXJpcyRTcGVjaWVzKQpgYGAKCjguICDjg4fjg7zjgr/jga7nibnmgKflgKTjgYzjganjga7jgojjgYbjgavlpInljJbjgZnjgovjgYvjgpLmjqLntKLjgZfjgb7jgZnjgIIgcGxvdCgpCiAgICDjga/jgIEy44Gk44Gu5YiX6ZaTIOOBrumWouS/guOCkuimluimmuWMluOBmeOCi+OBruOBq+S9v+eUqOOBleOCjOOBvuOBmeOAggoKYGBgIHIKCiAgICAgIHBsb3QoaXJpcyRTZXBhbC5MZW5ndGggfiBpcmlzJFBldGFsLkxlbmd0aCkKYGBgCgpgYGB7cn0KICAgICAgIyDjg4fjg7zjgr/jga7nibnmgKflgKTjga7lpInljJbjgpLmjqLntKLjgZnjgosKICAgICAgcGxvdChpcmlzJFNlcGFsLkxlbmd0aCB+IGlyaXMkUGV0YWwuTGVuZ3RoKQpgYGAKCjkuICDjg4fjg7zjgr/jga7nibnmgKflgKTjgajnqK7jga7jg6njg5njg6vjgajjga7plqLkv4Ljgavln7rjgaXjgYTjgabjgIEgZGVjaXNpb24gdHJlZQogICAg44KS5L2c5oiQ44GX44G+IOOBmeOAgiBycGFydCgpIOOBr+OAgSBkZWNpc2lvbiB0cmVlCiAgICDjgpLkvZzmiJDjgZfjgabjg4fjg7zjgr/jga7nibnmgKfjgpLmjqjoq5bjgZnjgovjgZ/jgoHjgavkvb/nlKjjgZUg44KM44G+44GZ44CCCgpgYGAgcgogICAgICBsaWJyYXJ5KHJwYXJ0KQogICAgICBycGFydChpcmlzJFNwZWNpZXMgfiBpcmlzJFNlcGFsLkxlbmd0aCArIGlyaXMkUGV0YWwuTGVuZ3RoKQpgYGAKCmBgYHtyfQogICAgICAjIOODh+ODvOOCv+OBrueJueaAp+WApOOBqOeoruOBruODqeODmeODq+OBrumWouS/guOBq+WfuuOBpeOBhOOBpmRlY2lzaW9uIHRyZWXjgpLkvZzmiJDjgZnjgosKICAgICAgbGlicmFyeShycGFydCkKICAgICAgcnBhcnQoaXJpcyRTcGVjaWVzIH4gaXJpcyRTZXBhbC5MZW5ndGggKyBpcmlzJFBldGFsLkxlbmd0aCkKYGBgCgrkuIroqJjjga8gSXJpc+ODh+ODvOOCv+OCu+ODg+ODiOOCkuino+aekOOBmeOCi+OBn+OCgeOBruWfuuacrOeahOOBquOCueODhuODg+ODl+OBp+OBmeOAgiBSIFN0dWRpbwrjga4gR1VJIOOCkuS9v+eUqOOBl+OBpuOAgeewoeWNmOOBq+ODh+ODvOOCv+OBruWIhuaekOOCkuWun+ihjOOBp+OBjeOBvuOBmeOAguOBvuOBn+OAgVIK44Kz44Oe44Oz44OJ44Op44Kk44Oz44Kk44OzCuOCv+ODvOODleOCp+OCpOOCueOBp+OAgeewoeWNmOOBq+ODh+ODvOOCv+OCkuino+aekOOBl+OAgeeJueWumuOBruOCv+OCueOCr+OCkuWun+ihjOOBp+OBjeOBvuOBmeOAggo=