Statistika Deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu data sehingga memberikan informasi yang berguna (Walpole, 1995). Statistika Desktiptif berfungsi untuk mendeskripsikan atau memberi gambaran terhadap objek yang diteliti melalui data sampel atau populasi (Sugiyono, 2007).Sebelum menganalisis sebuah data lebih lanjut, akan lebih baik jika kita melakukan *eksplorasi data* terlebih dahulu. Dengan ini, kita akan mengetahui apa saja atribut pada dataset, bagaimana nilai-nilainya yang ada dalam dataset, distribusi data, atau keterhubungan suatu atribut dengan atribut lain. Disini saya akan mencoba untuk Eksplorasi data Analysis dan visualisasi datanya dengan menggunakan dataset `iris.csv`.
library(datasets)
data("iris")
iris
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
## 7 4.6 3.4 1.4 0.3 setosa
## 8 5.0 3.4 1.5 0.2 setosa
## 9 4.4 2.9 1.4 0.2 setosa
## 10 4.9 3.1 1.5 0.1 setosa
## 11 5.4 3.7 1.5 0.2 setosa
## 12 4.8 3.4 1.6 0.2 setosa
## 13 4.8 3.0 1.4 0.1 setosa
## 14 4.3 3.0 1.1 0.1 setosa
## 15 5.8 4.0 1.2 0.2 setosa
## 16 5.7 4.4 1.5 0.4 setosa
## 17 5.4 3.9 1.3 0.4 setosa
## 18 5.1 3.5 1.4 0.3 setosa
## 19 5.7 3.8 1.7 0.3 setosa
## 20 5.1 3.8 1.5 0.3 setosa
## 21 5.4 3.4 1.7 0.2 setosa
## 22 5.1 3.7 1.5 0.4 setosa
## 23 4.6 3.6 1.0 0.2 setosa
## 24 5.1 3.3 1.7 0.5 setosa
## 25 4.8 3.4 1.9 0.2 setosa
## 26 5.0 3.0 1.6 0.2 setosa
## 27 5.0 3.4 1.6 0.4 setosa
## 28 5.2 3.5 1.5 0.2 setosa
## 29 5.2 3.4 1.4 0.2 setosa
## 30 4.7 3.2 1.6 0.2 setosa
## 31 4.8 3.1 1.6 0.2 setosa
## 32 5.4 3.4 1.5 0.4 setosa
## 33 5.2 4.1 1.5 0.1 setosa
## 34 5.5 4.2 1.4 0.2 setosa
## 35 4.9 3.1 1.5 0.2 setosa
## 36 5.0 3.2 1.2 0.2 setosa
## 37 5.5 3.5 1.3 0.2 setosa
## 38 4.9 3.6 1.4 0.1 setosa
## 39 4.4 3.0 1.3 0.2 setosa
## 40 5.1 3.4 1.5 0.2 setosa
## 41 5.0 3.5 1.3 0.3 setosa
## 42 4.5 2.3 1.3 0.3 setosa
## 43 4.4 3.2 1.3 0.2 setosa
## 44 5.0 3.5 1.6 0.6 setosa
## 45 5.1 3.8 1.9 0.4 setosa
## 46 4.8 3.0 1.4 0.3 setosa
## 47 5.1 3.8 1.6 0.2 setosa
## 48 4.6 3.2 1.4 0.2 setosa
## 49 5.3 3.7 1.5 0.2 setosa
## 50 5.0 3.3 1.4 0.2 setosa
## 51 7.0 3.2 4.7 1.4 versicolor
## 52 6.4 3.2 4.5 1.5 versicolor
## 53 6.9 3.1 4.9 1.5 versicolor
## 54 5.5 2.3 4.0 1.3 versicolor
## 55 6.5 2.8 4.6 1.5 versicolor
## 56 5.7 2.8 4.5 1.3 versicolor
## 57 6.3 3.3 4.7 1.6 versicolor
## 58 4.9 2.4 3.3 1.0 versicolor
## 59 6.6 2.9 4.6 1.3 versicolor
## 60 5.2 2.7 3.9 1.4 versicolor
## 61 5.0 2.0 3.5 1.0 versicolor
## 62 5.9 3.0 4.2 1.5 versicolor
## 63 6.0 2.2 4.0 1.0 versicolor
## 64 6.1 2.9 4.7 1.4 versicolor
## 65 5.6 2.9 3.6 1.3 versicolor
## 66 6.7 3.1 4.4 1.4 versicolor
## 67 5.6 3.0 4.5 1.5 versicolor
## 68 5.8 2.7 4.1 1.0 versicolor
## 69 6.2 2.2 4.5 1.5 versicolor
## 70 5.6 2.5 3.9 1.1 versicolor
## 71 5.9 3.2 4.8 1.8 versicolor
## 72 6.1 2.8 4.0 1.3 versicolor
## 73 6.3 2.5 4.9 1.5 versicolor
## 74 6.1 2.8 4.7 1.2 versicolor
## 75 6.4 2.9 4.3 1.3 versicolor
## 76 6.6 3.0 4.4 1.4 versicolor
## 77 6.8 2.8 4.8 1.4 versicolor
## 78 6.7 3.0 5.0 1.7 versicolor
## 79 6.0 2.9 4.5 1.5 versicolor
## 80 5.7 2.6 3.5 1.0 versicolor
## 81 5.5 2.4 3.8 1.1 versicolor
## 82 5.5 2.4 3.7 1.0 versicolor
## 83 5.8 2.7 3.9 1.2 versicolor
## 84 6.0 2.7 5.1 1.6 versicolor
## 85 5.4 3.0 4.5 1.5 versicolor
## 86 6.0 3.4 4.5 1.6 versicolor
## 87 6.7 3.1 4.7 1.5 versicolor
## 88 6.3 2.3 4.4 1.3 versicolor
## 89 5.6 3.0 4.1 1.3 versicolor
## 90 5.5 2.5 4.0 1.3 versicolor
## 91 5.5 2.6 4.4 1.2 versicolor
## 92 6.1 3.0 4.6 1.4 versicolor
## 93 5.8 2.6 4.0 1.2 versicolor
## 94 5.0 2.3 3.3 1.0 versicolor
## 95 5.6 2.7 4.2 1.3 versicolor
## 96 5.7 3.0 4.2 1.2 versicolor
## 97 5.7 2.9 4.2 1.3 versicolor
## 98 6.2 2.9 4.3 1.3 versicolor
## 99 5.1 2.5 3.0 1.1 versicolor
## 100 5.7 2.8 4.1 1.3 versicolor
## 101 6.3 3.3 6.0 2.5 virginica
## 102 5.8 2.7 5.1 1.9 virginica
## 103 7.1 3.0 5.9 2.1 virginica
## 104 6.3 2.9 5.6 1.8 virginica
## 105 6.5 3.0 5.8 2.2 virginica
## 106 7.6 3.0 6.6 2.1 virginica
## 107 4.9 2.5 4.5 1.7 virginica
## 108 7.3 2.9 6.3 1.8 virginica
## 109 6.7 2.5 5.8 1.8 virginica
## 110 7.2 3.6 6.1 2.5 virginica
## 111 6.5 3.2 5.1 2.0 virginica
## 112 6.4 2.7 5.3 1.9 virginica
## 113 6.8 3.0 5.5 2.1 virginica
## 114 5.7 2.5 5.0 2.0 virginica
## 115 5.8 2.8 5.1 2.4 virginica
## 116 6.4 3.2 5.3 2.3 virginica
## 117 6.5 3.0 5.5 1.8 virginica
## 118 7.7 3.8 6.7 2.2 virginica
## 119 7.7 2.6 6.9 2.3 virginica
## 120 6.0 2.2 5.0 1.5 virginica
## 121 6.9 3.2 5.7 2.3 virginica
## 122 5.6 2.8 4.9 2.0 virginica
## 123 7.7 2.8 6.7 2.0 virginica
## 124 6.3 2.7 4.9 1.8 virginica
## 125 6.7 3.3 5.7 2.1 virginica
## 126 7.2 3.2 6.0 1.8 virginica
## 127 6.2 2.8 4.8 1.8 virginica
## 128 6.1 3.0 4.9 1.8 virginica
## 129 6.4 2.8 5.6 2.1 virginica
## 130 7.2 3.0 5.8 1.6 virginica
## 131 7.4 2.8 6.1 1.9 virginica
## 132 7.9 3.8 6.4 2.0 virginica
## 133 6.4 2.8 5.6 2.2 virginica
## 134 6.3 2.8 5.1 1.5 virginica
## 135 6.1 2.6 5.6 1.4 virginica
## 136 7.7 3.0 6.1 2.3 virginica
## 137 6.3 3.4 5.6 2.4 virginica
## 138 6.4 3.1 5.5 1.8 virginica
## 139 6.0 3.0 4.8 1.8 virginica
## 140 6.9 3.1 5.4 2.1 virginica
## 141 6.7 3.1 5.6 2.4 virginica
## 142 6.9 3.1 5.1 2.3 virginica
## 143 5.8 2.7 5.1 1.9 virginica
## 144 6.8 3.2 5.9 2.3 virginica
## 145 6.7 3.3 5.7 2.5 virginica
## 146 6.7 3.0 5.2 2.3 virginica
## 147 6.3 2.5 5.0 1.9 virginica
## 148 6.5 3.0 5.2 2.0 virginica
## 149 6.2 3.4 5.4 2.3 virginica
## 150 5.9 3.0 5.1 1.8 virginica
str(iris)
## 'data.frame': 150 obs. of 5 variables:
## $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
## $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
## $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
## $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
## $ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
head(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
iris.num <- iris[,1:4]
iris.num
## Sepal.Length Sepal.Width Petal.Length Petal.Width
## 1 5.1 3.5 1.4 0.2
## 2 4.9 3.0 1.4 0.2
## 3 4.7 3.2 1.3 0.2
## 4 4.6 3.1 1.5 0.2
## 5 5.0 3.6 1.4 0.2
## 6 5.4 3.9 1.7 0.4
## 7 4.6 3.4 1.4 0.3
## 8 5.0 3.4 1.5 0.2
## 9 4.4 2.9 1.4 0.2
## 10 4.9 3.1 1.5 0.1
## 11 5.4 3.7 1.5 0.2
## 12 4.8 3.4 1.6 0.2
## 13 4.8 3.0 1.4 0.1
## 14 4.3 3.0 1.1 0.1
## 15 5.8 4.0 1.2 0.2
## 16 5.7 4.4 1.5 0.4
## 17 5.4 3.9 1.3 0.4
## 18 5.1 3.5 1.4 0.3
## 19 5.7 3.8 1.7 0.3
## 20 5.1 3.8 1.5 0.3
## 21 5.4 3.4 1.7 0.2
## 22 5.1 3.7 1.5 0.4
## 23 4.6 3.6 1.0 0.2
## 24 5.1 3.3 1.7 0.5
## 25 4.8 3.4 1.9 0.2
## 26 5.0 3.0 1.6 0.2
## 27 5.0 3.4 1.6 0.4
## 28 5.2 3.5 1.5 0.2
## 29 5.2 3.4 1.4 0.2
## 30 4.7 3.2 1.6 0.2
## 31 4.8 3.1 1.6 0.2
## 32 5.4 3.4 1.5 0.4
## 33 5.2 4.1 1.5 0.1
## 34 5.5 4.2 1.4 0.2
## 35 4.9 3.1 1.5 0.2
## 36 5.0 3.2 1.2 0.2
## 37 5.5 3.5 1.3 0.2
## 38 4.9 3.6 1.4 0.1
## 39 4.4 3.0 1.3 0.2
## 40 5.1 3.4 1.5 0.2
## 41 5.0 3.5 1.3 0.3
## 42 4.5 2.3 1.3 0.3
## 43 4.4 3.2 1.3 0.2
## 44 5.0 3.5 1.6 0.6
## 45 5.1 3.8 1.9 0.4
## 46 4.8 3.0 1.4 0.3
## 47 5.1 3.8 1.6 0.2
## 48 4.6 3.2 1.4 0.2
## 49 5.3 3.7 1.5 0.2
## 50 5.0 3.3 1.4 0.2
## 51 7.0 3.2 4.7 1.4
## 52 6.4 3.2 4.5 1.5
## 53 6.9 3.1 4.9 1.5
## 54 5.5 2.3 4.0 1.3
## 55 6.5 2.8 4.6 1.5
## 56 5.7 2.8 4.5 1.3
## 57 6.3 3.3 4.7 1.6
## 58 4.9 2.4 3.3 1.0
## 59 6.6 2.9 4.6 1.3
## 60 5.2 2.7 3.9 1.4
## 61 5.0 2.0 3.5 1.0
## 62 5.9 3.0 4.2 1.5
## 63 6.0 2.2 4.0 1.0
## 64 6.1 2.9 4.7 1.4
## 65 5.6 2.9 3.6 1.3
## 66 6.7 3.1 4.4 1.4
## 67 5.6 3.0 4.5 1.5
## 68 5.8 2.7 4.1 1.0
## 69 6.2 2.2 4.5 1.5
## 70 5.6 2.5 3.9 1.1
## 71 5.9 3.2 4.8 1.8
## 72 6.1 2.8 4.0 1.3
## 73 6.3 2.5 4.9 1.5
## 74 6.1 2.8 4.7 1.2
## 75 6.4 2.9 4.3 1.3
## 76 6.6 3.0 4.4 1.4
## 77 6.8 2.8 4.8 1.4
## 78 6.7 3.0 5.0 1.7
## 79 6.0 2.9 4.5 1.5
## 80 5.7 2.6 3.5 1.0
## 81 5.5 2.4 3.8 1.1
## 82 5.5 2.4 3.7 1.0
## 83 5.8 2.7 3.9 1.2
## 84 6.0 2.7 5.1 1.6
## 85 5.4 3.0 4.5 1.5
## 86 6.0 3.4 4.5 1.6
## 87 6.7 3.1 4.7 1.5
## 88 6.3 2.3 4.4 1.3
## 89 5.6 3.0 4.1 1.3
## 90 5.5 2.5 4.0 1.3
## 91 5.5 2.6 4.4 1.2
## 92 6.1 3.0 4.6 1.4
## 93 5.8 2.6 4.0 1.2
## 94 5.0 2.3 3.3 1.0
## 95 5.6 2.7 4.2 1.3
## 96 5.7 3.0 4.2 1.2
## 97 5.7 2.9 4.2 1.3
## 98 6.2 2.9 4.3 1.3
## 99 5.1 2.5 3.0 1.1
## 100 5.7 2.8 4.1 1.3
## 101 6.3 3.3 6.0 2.5
## 102 5.8 2.7 5.1 1.9
## 103 7.1 3.0 5.9 2.1
## 104 6.3 2.9 5.6 1.8
## 105 6.5 3.0 5.8 2.2
## 106 7.6 3.0 6.6 2.1
## 107 4.9 2.5 4.5 1.7
## 108 7.3 2.9 6.3 1.8
## 109 6.7 2.5 5.8 1.8
## 110 7.2 3.6 6.1 2.5
## 111 6.5 3.2 5.1 2.0
## 112 6.4 2.7 5.3 1.9
## 113 6.8 3.0 5.5 2.1
## 114 5.7 2.5 5.0 2.0
## 115 5.8 2.8 5.1 2.4
## 116 6.4 3.2 5.3 2.3
## 117 6.5 3.0 5.5 1.8
## 118 7.7 3.8 6.7 2.2
## 119 7.7 2.6 6.9 2.3
## 120 6.0 2.2 5.0 1.5
## 121 6.9 3.2 5.7 2.3
## 122 5.6 2.8 4.9 2.0
## 123 7.7 2.8 6.7 2.0
## 124 6.3 2.7 4.9 1.8
## 125 6.7 3.3 5.7 2.1
## 126 7.2 3.2 6.0 1.8
## 127 6.2 2.8 4.8 1.8
## 128 6.1 3.0 4.9 1.8
## 129 6.4 2.8 5.6 2.1
## 130 7.2 3.0 5.8 1.6
## 131 7.4 2.8 6.1 1.9
## 132 7.9 3.8 6.4 2.0
## 133 6.4 2.8 5.6 2.2
## 134 6.3 2.8 5.1 1.5
## 135 6.1 2.6 5.6 1.4
## 136 7.7 3.0 6.1 2.3
## 137 6.3 3.4 5.6 2.4
## 138 6.4 3.1 5.5 1.8
## 139 6.0 3.0 4.8 1.8
## 140 6.9 3.1 5.4 2.1
## 141 6.7 3.1 5.6 2.4
## 142 6.9 3.1 5.1 2.3
## 143 5.8 2.7 5.1 1.9
## 144 6.8 3.2 5.9 2.3
## 145 6.7 3.3 5.7 2.5
## 146 6.7 3.0 5.2 2.3
## 147 6.3 2.5 5.0 1.9
## 148 6.5 3.0 5.2 2.0
## 149 6.2 3.4 5.4 2.3
## 150 5.9 3.0 5.1 1.8
Diketahui pada dataset iris terdapat atribut Sepal Length, Sepal Width, Petal Length, dan Petal Width dengan tipe data number, serta terdapat atribut Species yang memiliki tiga nilai yaitu setosa, versicolor, dan virginica sesuai dengan deskripsi pada laman resminya. Berdasarkan informasi tersebut, saya memisah empat atribut pertama ke variabel iris.num, keempat atribut ini akan menentukan spesies.
colnames(iris)
## [1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species"
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
iris %>%
filter(Species == "setosa")
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
## 7 4.6 3.4 1.4 0.3 setosa
## 8 5.0 3.4 1.5 0.2 setosa
## 9 4.4 2.9 1.4 0.2 setosa
## 10 4.9 3.1 1.5 0.1 setosa
## 11 5.4 3.7 1.5 0.2 setosa
## 12 4.8 3.4 1.6 0.2 setosa
## 13 4.8 3.0 1.4 0.1 setosa
## 14 4.3 3.0 1.1 0.1 setosa
## 15 5.8 4.0 1.2 0.2 setosa
## 16 5.7 4.4 1.5 0.4 setosa
## 17 5.4 3.9 1.3 0.4 setosa
## 18 5.1 3.5 1.4 0.3 setosa
## 19 5.7 3.8 1.7 0.3 setosa
## 20 5.1 3.8 1.5 0.3 setosa
## 21 5.4 3.4 1.7 0.2 setosa
## 22 5.1 3.7 1.5 0.4 setosa
## 23 4.6 3.6 1.0 0.2 setosa
## 24 5.1 3.3 1.7 0.5 setosa
## 25 4.8 3.4 1.9 0.2 setosa
## 26 5.0 3.0 1.6 0.2 setosa
## 27 5.0 3.4 1.6 0.4 setosa
## 28 5.2 3.5 1.5 0.2 setosa
## 29 5.2 3.4 1.4 0.2 setosa
## 30 4.7 3.2 1.6 0.2 setosa
## 31 4.8 3.1 1.6 0.2 setosa
## 32 5.4 3.4 1.5 0.4 setosa
## 33 5.2 4.1 1.5 0.1 setosa
## 34 5.5 4.2 1.4 0.2 setosa
## 35 4.9 3.1 1.5 0.2 setosa
## 36 5.0 3.2 1.2 0.2 setosa
## 37 5.5 3.5 1.3 0.2 setosa
## 38 4.9 3.6 1.4 0.1 setosa
## 39 4.4 3.0 1.3 0.2 setosa
## 40 5.1 3.4 1.5 0.2 setosa
## 41 5.0 3.5 1.3 0.3 setosa
## 42 4.5 2.3 1.3 0.3 setosa
## 43 4.4 3.2 1.3 0.2 setosa
## 44 5.0 3.5 1.6 0.6 setosa
## 45 5.1 3.8 1.9 0.4 setosa
## 46 4.8 3.0 1.4 0.3 setosa
## 47 5.1 3.8 1.6 0.2 setosa
## 48 4.6 3.2 1.4 0.2 setosa
## 49 5.3 3.7 1.5 0.2 setosa
## 50 5.0 3.3 1.4 0.2 setosa
iris %>%
filter(Species == "versicolor")
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 7.0 3.2 4.7 1.4 versicolor
## 2 6.4 3.2 4.5 1.5 versicolor
## 3 6.9 3.1 4.9 1.5 versicolor
## 4 5.5 2.3 4.0 1.3 versicolor
## 5 6.5 2.8 4.6 1.5 versicolor
## 6 5.7 2.8 4.5 1.3 versicolor
## 7 6.3 3.3 4.7 1.6 versicolor
## 8 4.9 2.4 3.3 1.0 versicolor
## 9 6.6 2.9 4.6 1.3 versicolor
## 10 5.2 2.7 3.9 1.4 versicolor
## 11 5.0 2.0 3.5 1.0 versicolor
## 12 5.9 3.0 4.2 1.5 versicolor
## 13 6.0 2.2 4.0 1.0 versicolor
## 14 6.1 2.9 4.7 1.4 versicolor
## 15 5.6 2.9 3.6 1.3 versicolor
## 16 6.7 3.1 4.4 1.4 versicolor
## 17 5.6 3.0 4.5 1.5 versicolor
## 18 5.8 2.7 4.1 1.0 versicolor
## 19 6.2 2.2 4.5 1.5 versicolor
## 20 5.6 2.5 3.9 1.1 versicolor
## 21 5.9 3.2 4.8 1.8 versicolor
## 22 6.1 2.8 4.0 1.3 versicolor
## 23 6.3 2.5 4.9 1.5 versicolor
## 24 6.1 2.8 4.7 1.2 versicolor
## 25 6.4 2.9 4.3 1.3 versicolor
## 26 6.6 3.0 4.4 1.4 versicolor
## 27 6.8 2.8 4.8 1.4 versicolor
## 28 6.7 3.0 5.0 1.7 versicolor
## 29 6.0 2.9 4.5 1.5 versicolor
## 30 5.7 2.6 3.5 1.0 versicolor
## 31 5.5 2.4 3.8 1.1 versicolor
## 32 5.5 2.4 3.7 1.0 versicolor
## 33 5.8 2.7 3.9 1.2 versicolor
## 34 6.0 2.7 5.1 1.6 versicolor
## 35 5.4 3.0 4.5 1.5 versicolor
## 36 6.0 3.4 4.5 1.6 versicolor
## 37 6.7 3.1 4.7 1.5 versicolor
## 38 6.3 2.3 4.4 1.3 versicolor
## 39 5.6 3.0 4.1 1.3 versicolor
## 40 5.5 2.5 4.0 1.3 versicolor
## 41 5.5 2.6 4.4 1.2 versicolor
## 42 6.1 3.0 4.6 1.4 versicolor
## 43 5.8 2.6 4.0 1.2 versicolor
## 44 5.0 2.3 3.3 1.0 versicolor
## 45 5.6 2.7 4.2 1.3 versicolor
## 46 5.7 3.0 4.2 1.2 versicolor
## 47 5.7 2.9 4.2 1.3 versicolor
## 48 6.2 2.9 4.3 1.3 versicolor
## 49 5.1 2.5 3.0 1.1 versicolor
## 50 5.7 2.8 4.1 1.3 versicolor
iris %>%
filter(Species == "virginica")
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 6.3 3.3 6.0 2.5 virginica
## 2 5.8 2.7 5.1 1.9 virginica
## 3 7.1 3.0 5.9 2.1 virginica
## 4 6.3 2.9 5.6 1.8 virginica
## 5 6.5 3.0 5.8 2.2 virginica
## 6 7.6 3.0 6.6 2.1 virginica
## 7 4.9 2.5 4.5 1.7 virginica
## 8 7.3 2.9 6.3 1.8 virginica
## 9 6.7 2.5 5.8 1.8 virginica
## 10 7.2 3.6 6.1 2.5 virginica
## 11 6.5 3.2 5.1 2.0 virginica
## 12 6.4 2.7 5.3 1.9 virginica
## 13 6.8 3.0 5.5 2.1 virginica
## 14 5.7 2.5 5.0 2.0 virginica
## 15 5.8 2.8 5.1 2.4 virginica
## 16 6.4 3.2 5.3 2.3 virginica
## 17 6.5 3.0 5.5 1.8 virginica
## 18 7.7 3.8 6.7 2.2 virginica
## 19 7.7 2.6 6.9 2.3 virginica
## 20 6.0 2.2 5.0 1.5 virginica
## 21 6.9 3.2 5.7 2.3 virginica
## 22 5.6 2.8 4.9 2.0 virginica
## 23 7.7 2.8 6.7 2.0 virginica
## 24 6.3 2.7 4.9 1.8 virginica
## 25 6.7 3.3 5.7 2.1 virginica
## 26 7.2 3.2 6.0 1.8 virginica
## 27 6.2 2.8 4.8 1.8 virginica
## 28 6.1 3.0 4.9 1.8 virginica
## 29 6.4 2.8 5.6 2.1 virginica
## 30 7.2 3.0 5.8 1.6 virginica
## 31 7.4 2.8 6.1 1.9 virginica
## 32 7.9 3.8 6.4 2.0 virginica
## 33 6.4 2.8 5.6 2.2 virginica
## 34 6.3 2.8 5.1 1.5 virginica
## 35 6.1 2.6 5.6 1.4 virginica
## 36 7.7 3.0 6.1 2.3 virginica
## 37 6.3 3.4 5.6 2.4 virginica
## 38 6.4 3.1 5.5 1.8 virginica
## 39 6.0 3.0 4.8 1.8 virginica
## 40 6.9 3.1 5.4 2.1 virginica
## 41 6.7 3.1 5.6 2.4 virginica
## 42 6.9 3.1 5.1 2.3 virginica
## 43 5.8 2.7 5.1 1.9 virginica
## 44 6.8 3.2 5.9 2.3 virginica
## 45 6.7 3.3 5.7 2.5 virginica
## 46 6.7 3.0 5.2 2.3 virginica
## 47 6.3 2.5 5.0 1.9 virginica
## 48 6.5 3.0 5.2 2.0 virginica
## 49 6.2 3.4 5.4 2.3 virginica
## 50 5.9 3.0 5.1 1.8 virginica
summary(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width
## Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
## 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
## Median :5.800 Median :3.000 Median :4.350 Median :1.300
## Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
## 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
## Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
## Species
## setosa :50
## versicolor:50
## virginica :50
##
##
##
range(iris.num)
## [1] 0.1 7.9
modus
mode <- function(iris){
uqx <- unique(iris)
tab <- table(iris)
sort(uqx)[tab == max(tab)]
}
mode(iris$Sepal.Length)
## [1] 5
mode(iris$Sepal.Width)
## [1] 3
mode(iris$Petal.Length)
## [1] 1.4 1.5
mode(iris$Petal.Width)
## [1] 0.2
rata-rata geometrik
mean.geom <- function(iris){
exp(mean(log(iris)))
}
mean.geom(iris$Sepal.Length)
## [1] 5.78572
mean.geom(iris$Sepal.Width)
## [1] 3.026598
mean.geom(iris$Petal.Length)
## [1] 3.238267
mean.geom(iris$Petal.Width)
## [1] 0.8417075
rata-rata harmoni
mean.harm <- function(iris){
1/(mean(1/iris))
}
mean.harm(iris$Sepal.Length)
## [1] 5.728905
mean.harm(iris$Sepal.Width)
## [1] 2.995815
mean.harm(iris$Petal.Length)
## [1] 2.694166
mean.harm(iris$Petal.Width)
## [1] 0.4946708
nilai skewness dan kurtosis
library(e1071)
skewness(iris$Sepal.Length)
## [1] 0.3086407
skewness(iris$Sepal.Width)
## [1] 0.3126147
skewness(iris$Petal.Length)
## [1] -0.2694109
skewness(iris$Petal.Width)
## [1] -0.1009166
kurtosis(iris$Sepal.Length)
## [1] -0.6058125
kurtosis(iris$Sepal.Width)
## [1] 0.1387047
kurtosis(iris$Petal.Length)
## [1] -1.416857
kurtosis(iris$Petal.Width)
## [1] -1.358179
var(iris.num)
## Sepal.Length Sepal.Width Petal.Length Petal.Width
## Sepal.Length 0.6856935 -0.0424340 1.2743154 0.5162707
## Sepal.Width -0.0424340 0.1899794 -0.3296564 -0.1216394
## Petal.Length 1.2743154 -0.3296564 3.1162779 1.2956094
## Petal.Width 0.5162707 -0.1216394 1.2956094 0.5810063
jk <- function(iris){
as.numeric(quantile(iris, 0.75) - quantile(iris, 0.25))
}
Qd <- function(iris){
as.numeric(0.5*(quantile(iris, 0.75) - quantile(iris, 0.25)))
}
jk(iris$Sepal.Length)
## [1] 1.3
jk(iris$Sepal.Width)
## [1] 0.5
jk(iris$Petal.Length)
## [1] 3.5
jk(iris$Petal.Width)
## [1] 1.5
Qd(iris$Sepal.Length)
## [1] 0.65
Qd(iris$Sepal.Width)
## [1] 0.25
Qd(iris$Petal.Length)
## [1] 1.75
Qd(iris$Petal.Width)
## [1] 0.75
aggregate(iris$Sepal.Length, list(iris$Petal.Length), Qd)
## Group.1 x
## 1 1.0 0.0000
## 2 1.1 0.0000
## 3 1.2 0.2000
## 4 1.3 0.3750
## 5 1.4 0.1500
## 6 1.5 0.1500
## 7 1.6 0.1000
## 8 1.7 0.0750
## 9 1.9 0.0750
## 10 3.0 0.0000
## 11 3.3 0.0250
## 12 3.5 0.1750
## 13 3.6 0.0000
## 14 3.7 0.0000
## 15 3.8 0.0000
## 16 3.9 0.1500
## 17 4.0 0.2500
## 18 4.1 0.0500
## 19 4.2 0.0375
## 20 4.3 0.0500
## 21 4.4 0.2625
## 22 4.5 0.2500
## 23 4.6 0.1250
## 24 4.7 0.3000
## 25 4.8 0.1875
## 26 4.9 0.1000
## 27 5.0 0.2375
## 28 5.1 0.2750
## 29 5.2 0.0500
## 30 5.3 0.0000
## 31 5.4 0.1750
## 32 5.5 0.1000
## 33 5.6 0.0500
## 34 5.7 0.0500
## 35 5.8 0.1750
## 36 5.9 0.0750
## 37 6.0 0.2250
## 38 6.1 0.1250
## 39 6.3 0.0000
## 40 6.4 0.0000
## 41 6.6 0.0000
## 42 6.7 0.0000
## 43 6.9 0.0000
aggregate(iris$Sepal.Width, list(iris$Petal.Width), Qd)
## Group.1 x
## 1 0.1 0.3000
## 2 0.2 0.1500
## 3 0.3 0.2250
## 4 0.4 0.1750
## 5 0.5 0.0000
## 6 0.6 0.0000
## 7 1.0 0.1250
## 8 1.1 0.0250
## 9 1.2 0.1000
## 10 1.3 0.1000
## 11 1.4 0.1250
## 12 1.5 0.1500
## 13 1.6 0.2000
## 14 1.7 0.1250
## 15 1.8 0.0750
## 16 1.9 0.0000
## 17 2.0 0.1750
## 18 2.1 0.0375
## 19 2.2 0.2500
## 20 2.3 0.1000
## 21 2.4 0.1500
## 22 2.5 0.0750
aggregate(iris$Petal.Length, list(iris$Sepal.Length), Qd)
## Group.1 x
## 1 4.3 0.0000
## 2 4.4 0.0250
## 3 4.5 0.0000
## 4 4.6 0.0625
## 5 4.7 0.0750
## 6 4.8 0.1000
## 7 4.9 0.7125
## 8 5.0 0.1000
## 9 5.1 0.1000
## 10 5.2 0.3125
## 11 5.3 0.0000
## 12 5.4 0.1000
## 13 5.5 0.7250
## 14 5.6 0.2375
## 15 5.7 0.6125
## 16 5.8 0.5750
## 17 5.9 0.2250
## 18 6.0 0.2250
## 19 6.1 0.1125
## 20 6.2 0.2500
## 21 6.3 0.3500
## 22 6.4 0.3250
## 23 6.5 0.2000
## 24 6.6 0.0500
## 25 6.7 0.3875
## 26 6.8 0.2750
## 27 6.9 0.2125
## 28 7.0 0.0000
## 29 7.1 0.0000
## 30 7.2 0.0750
## 31 7.3 0.0000
## 32 7.4 0.0000
## 33 7.6 0.0000
## 34 7.7 0.1000
## 35 7.9 0.0000
aggregate(iris$Petal.Width, list(iris$Sepal.Width), Qd)
## Group.1 x
## 1 2.0 0.0000
## 2 2.2 0.1250
## 3 2.3 0.2375
## 4 2.4 0.0250
## 5 2.5 0.2875
## 6 2.6 0.1000
## 7 2.7 0.3000
## 8 2.8 0.3375
## 9 2.9 0.0875
## 10 3.0 0.3625
## 11 3.1 0.8750
## 12 3.2 0.9000
## 13 3.3 0.8125
## 14 3.4 0.2500
## 15 3.5 0.0500
## 16 3.6 0.3000
## 17 3.7 0.0500
## 18 3.8 0.6500
## 19 3.9 0.0000
## 20 4.0 0.0000
## 21 4.1 0.0000
## 22 4.2 0.0000
## 23 4.4 0.0000
pie(table(iris$Species))
#mengatur pelatakan grafik
par(mfrow=c(2,2),oma=c(1,1,1,1))
#membuat histogram tiap atribut
hist(iris$Sepal.Length,col = "lightblue")
hist(iris$Sepal.Width,col = "lightblue")
hist(iris$Petal.Length,col = "lightblue")
hist(iris$Petal.Width,col = "lightblue")
#atur peletakan grafik
par(mfrow=c(2,2),mar=c(2,2,2,2))
#membuat boxplot tiap atribut terhadap spesies
boxplot(Sepal.Length ~ Species, main = "Box Plot Sepal Length - Species", data = iris, xlab = "Species", ylab = "Sepal.Length", col = "lightblue")
boxplot(Sepal.Width ~ Species, main = "Box Plot Sepal Width - Species", data = iris, xlab = "Species", ylab = "Sepal.Width", col = "lightblue")
boxplot(Petal.Length ~ Species, main = "Box Plot Petal Length - Species", data = iris, xlab = "Species", ylab = "Petal.Length", col = "lightblue")
boxplot(Petal.Length ~ Species, main = "Box Plot Petal Width - Species", data = iris, xlab = "Species", ylab = "Petal.Width", col = "lightblue")
#membuat pairs plot tiap atribut terhadap spesies
iris.jitter <- apply(iris.num,2,function(o){jitter(o)})
iris.jitter <- apply(iris.num,2,function(o){jitter(o)})
pairs(iris.jitter,main="Pairs Plot of Iris Data",pch=21,bg = c("red", "green", "blue")[unclass(iris$Species)])
with(iris, plot(Sepal.Length, Sepal.Width, col=Species,pch=as.numeric(Species)))
Dari gambar diatas kita dapat melihat hasil plot data label (species) dari fitur sepal.length dan sepal.width. Kita bisa menarik beberapa informasi dari plot tersebut yaitu :
Iris Sentosa secara umum terpisah secara linier (linear separated) dengan Iris Versicolor dan Iris Virginica. Iris Versicolor dan Iris Virginica mengalami ovelap sehingga sulit dipisahkan secara linier sehingga lebih sulit dipisahkan dibandingkan dengan Iris Sentosa. Dari dua fitur diatas sudah cukup baik memisahkan label Iris Sentosa tapi belum cukup baik untuk dua label lainnya (Iris Versicolor dan Iris Virginica).
with(iris, plot(Petal.Length, Petal.Width, col=Species,pch=as.numeric(Species)))
Dari gambar diatas kita dapat melihat hasil plot data label (species) dari fitur petal.length dan petal.width. Kita bisa menarik beberapa informasi dari plot tersebut yaitu :
Iris Sentosa secara umum terpisah secara linier (linear separated) dengan Iris Versicolor dan Iris Virginica. Iris Versicolor dan Iris Virginica mengalami sedikit ovelap sehingga sulit dipisahkan secara linier sehingga lebih sulit dipisahkan dibandingkan dengan Iris Sentosa. Dari dua fitur diatas sudah cukup baik memisahkan label Iris Sentosa tapi belum cukup baik untuk dua label lainnya (Iris Versicolor dan Iris Virginica). Overlap yang terjadi pada plot dari petal.length dan petal.width cenderung lebih sedikit dibandingkan dengan overlap yang terjadi pada plot dari sepal.Length dan sepal.width.