Iris データセットは R で非常にpopular です。 Iris データセットには、 iris 種の特性値 (Sepal.Length, Sepal.Width, Petal.Length, Petal.Width) と種のラベ ル (species) が含まれています。以下は Iris データを解析するための基本的なス テップです。

  1. R Studio で Iris データセットを読み込みます。
    data("iris")
      # RStudioでIrisデータセットを読み込む
      data("iris")
  1. データの最初の few 行を表示します。
    head(iris)
      # データの最初の数行を表示する
      head(iris)
  1. データの summary を表示します。summary() は、データの平均値、標準偏差、 最大値、最小値を計算して、データの分布状況を示します。
     summary(iris)
      # データのsummaryを表示する
      summary(iris)
  Sepal.Length    Sepal.Width     Petal.Length    Petal.Width          Species  
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100   setosa    :50  
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300   versicolor:50  
 Median :5.800   Median :3.000   Median :4.350   Median :1.300   virginica :50  
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199                  
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800                  
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500                  
  1. データの平均と標準偏差を表示します。
      mean(iris$Sepal.Length)
      sd(iris$Sepal.Length)
      # データの平均と標準偏差を表示する
      mean(iris$Sepal.Length)
[1] 5.843333
      sd(iris$Sepal.Length)
[1] 0.8280661
  1. データの散布図を作成します。scatterplot() は、2つの列間の関係を視覚化す るのに使用されます。
     scatterplot(iris$Sepal.Length ~ iris$Petal.Length)
      # データのscatterplotを作成する
      scatterplot(iris$Sepal.Length ~ iris$Petal.Length)
Error in scatterplot(iris$Sepal.Length ~ iris$Petal.Length) : 
  could not find function "scatterplot"

エラーのためggplotで

library(ggplot2)
ggplot(iris, aes(x = Sepal.Length, y = Petal.Length)) + geom_point()
library(ggplot2)
ggplot(iris, aes(x = Sepal.Length, y = Petal.Length)) + geom_point()

  1. データの特性値の配列を分析します。summary() は、データの平均、標準偏差、 最大値、最小値を計算して、データの分布状況を示します。
     summary(iris[, c("Sepal.Length", "Petal.Length")])
      # データの配列を分析する
      summary(iris[, c("Sepal.Length", "Petal.Length")])
  Sepal.Length    Petal.Length  
 Min.   :4.300   Min.   :1.000  
 1st Qu.:5.100   1st Qu.:1.600  
 Median :5.800   Median :4.350  
 Mean   :5.843   Mean   :3.758  
 3rd Qu.:6.400   3rd Qu.:5.100  
 Max.   :7.900   Max.   :6.900  
  1. データの特性値と種のラベルとの関係を分析します。summary() は、データの平 均、標準偏差、最大値、最小値を計算して、データの分布状況を示します。
      summary(iris[, c("Sepal.Length", "Petal.Width")],by = iris$Species)
      # データの特性値と種のラベルの関係を分析する
      summary(iris[, c("Sepal.Length", "Petal.Width")],by = iris$Species)
  Sepal.Length    Petal.Width   
 Min.   :4.300   Min.   :0.100  
 1st Qu.:5.100   1st Qu.:0.300  
 Median :5.800   Median :1.300  
 Mean   :5.843   Mean   :1.199  
 3rd Qu.:6.400   3rd Qu.:1.800  
 Max.   :7.900   Max.   :2.500  
  1. データの特性値がどのように変化するかを探索します。 plot() は、2つの列間 の関係を視覚化するのに使用されます。

      plot(iris$Sepal.Length ~ iris$Petal.Length)
      # データの特性値の変化を探索する
      plot(iris$Sepal.Length ~ iris$Petal.Length)

  1. データの特性値と種のラベルとの関係に基づいて、 decision tree を作成しま す。 rpart() は、 decision tree を作成してデータの特性を推論するために使用さ れます。
      library(rpart)
      rpart(iris$Species ~ iris$Sepal.Length + iris$Petal.Length)
      # データの特性値と種のラベルの関係に基づいてdecision treeを作成する
      library(rpart)
      rpart(iris$Species ~ iris$Sepal.Length + iris$Petal.Length)
n= 150 

node), split, n, loss, yval, (yprob)
      * denotes terminal node

1) root 150 100 setosa (0.33333333 0.33333333 0.33333333)  
  2) iris$Petal.Length< 2.45 50   0 setosa (1.00000000 0.00000000 0.00000000) *
  3) iris$Petal.Length>=2.45 100  50 versicolor (0.00000000 0.50000000 0.50000000)  
    6) iris$Petal.Length< 4.75 45   1 versicolor (0.00000000 0.97777778 0.02222222) *
    7) iris$Petal.Length>=4.75 55   6 virginica (0.00000000 0.10909091 0.89090909) *

上記は Irisデータセットを解析するための基本的なステップです。 R Studio の GUI を使用して、簡単にデータの分析を実行できます。また、R コマンドラインイン ターフェイスで、簡単にデータを解析し、特定のタスクを実行できます。

LS0tCnRpdGxlOiAiUiBOb3RlYm9vayIKb3V0cHV0OiBodG1sX25vdGVib29rCmVkaXRvcl9vcHRpb25zOiAKICBtYXJrZG93bjogCiAgICB3cmFwOiA3MgotLS0KCklyaXMg44OH44O844K/44K744OD44OI44GvIFIg44Gn6Z2e5bi444GrcG9wdWxhciDjgafjgZnjgIIgSXJpcyDjg4fjg7zjgr/jgrvjg4Pjg4jjgavjga/jgIEKaXJpcyDnqK7jga7nibnmgKflgKQgKFNlcGFsLkxlbmd0aCwgU2VwYWwuV2lkdGgsIFBldGFsLkxlbmd0aCwgUGV0YWwuV2lkdGgpCuOBqOeoruOBruODqeODmSDjg6sgKHNwZWNpZXMpIOOBjOWQq+OBvuOCjOOBpuOBhOOBvuOBmeOAguS7peS4i+OBryBJcmlzCuODh+ODvOOCv+OCkuino+aekOOBmeOCi+OBn+OCgeOBruWfuuacrOeahOOBquOCuSDjg4bjg4Pjg5fjgafjgZnjgIIKCjEuICBSIFN0dWRpbyDjgacgSXJpcyDjg4fjg7zjgr/jgrvjg4Pjg4jjgpLoqq3jgb/ovrzjgb/jgb7jgZnjgIIKCmBgYCByCiAgICBkYXRhKCJpcmlzIikKYGBgCgpgYGB7cn0KICAgICAgIyBSU3R1ZGlv44GnSXJpc+ODh+ODvOOCv+OCu+ODg+ODiOOCkuiqreOBv+i+vOOCgAogICAgICBkYXRhKCJpcmlzIikKYGBgCgoyLiAg44OH44O844K/44Gu5pyA5Yid44GuIGZldyDooYzjgpLooajnpLrjgZfjgb7jgZnjgIIKCmBgYCByCiAgICBoZWFkKGlyaXMpCmBgYAoKYGBge3J9CiAgICAgICMg44OH44O844K/44Gu5pyA5Yid44Gu5pWw6KGM44KS6KGo56S644GZ44KLCiAgICAgIGhlYWQoaXJpcykKYGBgCgozLiAg44OH44O844K/44GuIHN1bW1hcnkg44KS6KGo56S644GX44G+44GZ44CCc3VtbWFyeSgpCiAgICDjga/jgIHjg4fjg7zjgr/jga7lubPlnYflgKTjgIHmqJnmupblgY/lt67jgIEKICAgIOacgOWkp+WApOOAgeacgOWwj+WApOOCkuioiOeul+OBl+OBpuOAgeODh+ODvOOCv+OBruWIhuW4g+eKtuazgeOCkuekuuOBl+OBvuOBmeOAggoKYGBgIHIKICAgICBzdW1tYXJ5KGlyaXMpCmBgYAoKYGBge3J9CiAgICAgICMg44OH44O844K/44Guc3VtbWFyeeOCkuihqOekuuOBmeOCiwogICAgICBzdW1tYXJ5KGlyaXMpCmBgYAoKNC4gIOODh+ODvOOCv+OBruW5s+Wdh+OBqOaomea6luWBj+W3ruOCkuihqOekuuOBl+OBvuOBmeOAggoKYGBgIHIKICAgICAgbWVhbihpcmlzJFNlcGFsLkxlbmd0aCkKICAgICAgc2QoaXJpcyRTZXBhbC5MZW5ndGgpCmBgYAoKYGBge3J9CiAgICAgICMg44OH44O844K/44Gu5bmz5Z2H44Go5qiZ5rqW5YGP5beu44KS6KGo56S644GZ44KLCiAgICAgIG1lYW4oaXJpcyRTZXBhbC5MZW5ndGgpCiAgICAgIHNkKGlyaXMkU2VwYWwuTGVuZ3RoKQpgYGAKCjUuICDjg4fjg7zjgr/jga7mlaPluIPlm7PjgpLkvZzmiJDjgZfjgb7jgZnjgIJzY2F0dGVycGxvdCgpCiAgICDjga/jgIEy44Gk44Gu5YiX6ZaT44Gu6Zai5L+C44KS6KaW6Kaa5YyW44GZIOOCi+OBruOBq+S9v+eUqOOBleOCjOOBvuOBmeOAggoKYGBgIHIKICAgICBzY2F0dGVycGxvdChpcmlzJFNlcGFsLkxlbmd0aCB+IGlyaXMkUGV0YWwuTGVuZ3RoKQpgYGAKCmBgYHtyfQogICAgICAjIOODh+ODvOOCv+OBrnNjYXR0ZXJwbG9044KS5L2c5oiQ44GZ44KLCiAgICAgIHNjYXR0ZXJwbG90KGlyaXMkU2VwYWwuTGVuZ3RoIH4gaXJpcyRQZXRhbC5MZW5ndGgpCiAgICAgIAogIApgYGAKCuOCqOODqeODvOOBruOBn+OCgWdncGxvdOOBpwoKYGBgIHIKbGlicmFyeShnZ3Bsb3QyKQpnZ3Bsb3QoaXJpcywgYWVzKHggPSBTZXBhbC5MZW5ndGgsIHkgPSBQZXRhbC5MZW5ndGgpKSArIGdlb21fcG9pbnQoKQpgYGAKCmBgYHtyfQpsaWJyYXJ5KGdncGxvdDIpCmdncGxvdChpcmlzLCBhZXMoeCA9IFNlcGFsLkxlbmd0aCwgeSA9IFBldGFsLkxlbmd0aCkpICsgZ2VvbV9wb2ludCgpCgpgYGAKCjYuICDjg4fjg7zjgr/jga7nibnmgKflgKTjga7phY3liJfjgpLliIbmnpDjgZfjgb7jgZnjgIJzdW1tYXJ5KCkKICAgIOOBr+OAgeODh+ODvOOCv+OBruW5s+Wdh+OAgeaomea6luWBj+W3ruOAgQogICAg5pyA5aSn5YCk44CB5pyA5bCP5YCk44KS6KiI566X44GX44Gm44CB44OH44O844K/44Gu5YiG5biD54q25rOB44KS56S644GX44G+44GZ44CCCgpgYGAgcgogICAgIHN1bW1hcnkoaXJpc1ssIGMoIlNlcGFsLkxlbmd0aCIsICJQZXRhbC5MZW5ndGgiKV0pCmBgYAoKYGBge3J9CiAgICAgICMg44OH44O844K/44Gu6YWN5YiX44KS5YiG5p6Q44GZ44KLCiAgICAgIHN1bW1hcnkoaXJpc1ssIGMoIlNlcGFsLkxlbmd0aCIsICJQZXRhbC5MZW5ndGgiKV0pCmBgYAoKNy4gIOODh+ODvOOCv+OBrueJueaAp+WApOOBqOeoruOBruODqeODmeODq+OBqOOBrumWouS/guOCkuWIhuaekOOBl+OBvuOBmeOAgnN1bW1hcnkoKQogICAg44Gv44CB44OH44O844K/44Gu5bmzCiAgICDlnYfjgIHmqJnmupblgY/lt67jgIHmnIDlpKflgKTjgIHmnIDlsI/lgKTjgpLoqIjnrpfjgZfjgabjgIHjg4fjg7zjgr/jga7liIbluIPnirbms4HjgpLnpLrjgZfjgb7jgZnjgIIKCmBgYCByCiAgICAgIHN1bW1hcnkoaXJpc1ssIGMoIlNlcGFsLkxlbmd0aCIsICJQZXRhbC5XaWR0aCIpXSxieSA9IGlyaXMkU3BlY2llcykKYGBgCgpgYGB7cn0KICAgICAgIyDjg4fjg7zjgr/jga7nibnmgKflgKTjgajnqK7jga7jg6njg5njg6vjga7plqLkv4LjgpLliIbmnpDjgZnjgosKICAgICAgc3VtbWFyeShpcmlzWywgYygiU2VwYWwuTGVuZ3RoIiwgIlBldGFsLldpZHRoIildLGJ5ID0gaXJpcyRTcGVjaWVzKQpgYGAKCjguICDjg4fjg7zjgr/jga7nibnmgKflgKTjgYzjganjga7jgojjgYbjgavlpInljJbjgZnjgovjgYvjgpLmjqLntKLjgZfjgb7jgZnjgIIgcGxvdCgpCiAgICDjga/jgIEy44Gk44Gu5YiX6ZaTIOOBrumWouS/guOCkuimluimmuWMluOBmeOCi+OBruOBq+S9v+eUqOOBleOCjOOBvuOBmeOAggoKYGBgIHIKCiAgICAgIHBsb3QoaXJpcyRTZXBhbC5MZW5ndGggfiBpcmlzJFBldGFsLkxlbmd0aCkKYGBgCgpgYGB7cn0KICAgICAgIyDjg4fjg7zjgr/jga7nibnmgKflgKTjga7lpInljJbjgpLmjqLntKLjgZnjgosKICAgICAgcGxvdChpcmlzJFNlcGFsLkxlbmd0aCB+IGlyaXMkUGV0YWwuTGVuZ3RoKQpgYGAKCjkuICDjg4fjg7zjgr/jga7nibnmgKflgKTjgajnqK7jga7jg6njg5njg6vjgajjga7plqLkv4Ljgavln7rjgaXjgYTjgabjgIEgZGVjaXNpb24gdHJlZQogICAg44KS5L2c5oiQ44GX44G+IOOBmeOAgiBycGFydCgpIOOBr+OAgSBkZWNpc2lvbiB0cmVlCiAgICDjgpLkvZzmiJDjgZfjgabjg4fjg7zjgr/jga7nibnmgKfjgpLmjqjoq5bjgZnjgovjgZ/jgoHjgavkvb/nlKjjgZUg44KM44G+44GZ44CCCgpgYGAgcgogICAgICBsaWJyYXJ5KHJwYXJ0KQogICAgICBycGFydChpcmlzJFNwZWNpZXMgfiBpcmlzJFNlcGFsLkxlbmd0aCArIGlyaXMkUGV0YWwuTGVuZ3RoKQpgYGAKCmBgYHtyfQogICAgICAjIOODh+ODvOOCv+OBrueJueaAp+WApOOBqOeoruOBruODqeODmeODq+OBrumWouS/guOBq+WfuuOBpeOBhOOBpmRlY2lzaW9uIHRyZWXjgpLkvZzmiJDjgZnjgosKICAgICAgbGlicmFyeShycGFydCkKICAgICAgcnBhcnQoaXJpcyRTcGVjaWVzIH4gaXJpcyRTZXBhbC5MZW5ndGggKyBpcmlzJFBldGFsLkxlbmd0aCkKYGBgCgrkuIroqJjjga8gSXJpc+ODh+ODvOOCv+OCu+ODg+ODiOOCkuino+aekOOBmeOCi+OBn+OCgeOBruWfuuacrOeahOOBquOCueODhuODg+ODl+OBp+OBmeOAgiBSIFN0dWRpbwrjga4gR1VJIOOCkuS9v+eUqOOBl+OBpuOAgeewoeWNmOOBq+ODh+ODvOOCv+OBruWIhuaekOOCkuWun+ihjOOBp+OBjeOBvuOBmeOAguOBvuOBn+OAgVIK44Kz44Oe44Oz44OJ44Op44Kk44Oz44Kk44OzCuOCv+ODvOODleOCp+OCpOOCueOBp+OAgeewoeWNmOOBq+ODh+ODvOOCv+OCkuino+aekOOBl+OAgeeJueWumuOBruOCv+OCueOCr+OCkuWun+ihjOOBp+OBjeOBvuOBmeOAggo=