Apa itu Statistika Deskriptif ?

Statistika Deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu data sehingga memberikan informasi yang berguna (Walpole, 1995). Statistika Desktiptif berfungsi untuk mendeskripsikan atau memberi gambaran terhadap objek yang diteliti melalui data sampel atau populasi (Sugiyono, 2007).Sebelum menganalisis sebuah data lebih lanjut, akan lebih baik jika kita melakukan *eksplorasi data* terlebih dahulu. Dengan ini, kita akan mengetahui apa saja atribut pada dataset, bagaimana nilai-nilainya yang ada dalam dataset, distribusi data, atau keterhubungan suatu atribut dengan atribut lain. Disini saya akan mencoba untuk Eksplorasi data Analysis dan visualisasi datanya dengan menggunakan dataset `iris.csv`.

Berikut adalah tahapan dalam mengeksplorasi data analysisis pada statistika deskriptif :

1. Menyiapkan Data

library(datasets)
data("iris")
iris
##     Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1            5.1         3.5          1.4         0.2     setosa
## 2            4.9         3.0          1.4         0.2     setosa
## 3            4.7         3.2          1.3         0.2     setosa
## 4            4.6         3.1          1.5         0.2     setosa
## 5            5.0         3.6          1.4         0.2     setosa
## 6            5.4         3.9          1.7         0.4     setosa
## 7            4.6         3.4          1.4         0.3     setosa
## 8            5.0         3.4          1.5         0.2     setosa
## 9            4.4         2.9          1.4         0.2     setosa
## 10           4.9         3.1          1.5         0.1     setosa
## 11           5.4         3.7          1.5         0.2     setosa
## 12           4.8         3.4          1.6         0.2     setosa
## 13           4.8         3.0          1.4         0.1     setosa
## 14           4.3         3.0          1.1         0.1     setosa
## 15           5.8         4.0          1.2         0.2     setosa
## 16           5.7         4.4          1.5         0.4     setosa
## 17           5.4         3.9          1.3         0.4     setosa
## 18           5.1         3.5          1.4         0.3     setosa
## 19           5.7         3.8          1.7         0.3     setosa
## 20           5.1         3.8          1.5         0.3     setosa
## 21           5.4         3.4          1.7         0.2     setosa
## 22           5.1         3.7          1.5         0.4     setosa
## 23           4.6         3.6          1.0         0.2     setosa
## 24           5.1         3.3          1.7         0.5     setosa
## 25           4.8         3.4          1.9         0.2     setosa
## 26           5.0         3.0          1.6         0.2     setosa
## 27           5.0         3.4          1.6         0.4     setosa
## 28           5.2         3.5          1.5         0.2     setosa
## 29           5.2         3.4          1.4         0.2     setosa
## 30           4.7         3.2          1.6         0.2     setosa
## 31           4.8         3.1          1.6         0.2     setosa
## 32           5.4         3.4          1.5         0.4     setosa
## 33           5.2         4.1          1.5         0.1     setosa
## 34           5.5         4.2          1.4         0.2     setosa
## 35           4.9         3.1          1.5         0.2     setosa
## 36           5.0         3.2          1.2         0.2     setosa
## 37           5.5         3.5          1.3         0.2     setosa
## 38           4.9         3.6          1.4         0.1     setosa
## 39           4.4         3.0          1.3         0.2     setosa
## 40           5.1         3.4          1.5         0.2     setosa
## 41           5.0         3.5          1.3         0.3     setosa
## 42           4.5         2.3          1.3         0.3     setosa
## 43           4.4         3.2          1.3         0.2     setosa
## 44           5.0         3.5          1.6         0.6     setosa
## 45           5.1         3.8          1.9         0.4     setosa
## 46           4.8         3.0          1.4         0.3     setosa
## 47           5.1         3.8          1.6         0.2     setosa
## 48           4.6         3.2          1.4         0.2     setosa
## 49           5.3         3.7          1.5         0.2     setosa
## 50           5.0         3.3          1.4         0.2     setosa
## 51           7.0         3.2          4.7         1.4 versicolor
## 52           6.4         3.2          4.5         1.5 versicolor
## 53           6.9         3.1          4.9         1.5 versicolor
## 54           5.5         2.3          4.0         1.3 versicolor
## 55           6.5         2.8          4.6         1.5 versicolor
## 56           5.7         2.8          4.5         1.3 versicolor
## 57           6.3         3.3          4.7         1.6 versicolor
## 58           4.9         2.4          3.3         1.0 versicolor
## 59           6.6         2.9          4.6         1.3 versicolor
## 60           5.2         2.7          3.9         1.4 versicolor
## 61           5.0         2.0          3.5         1.0 versicolor
## 62           5.9         3.0          4.2         1.5 versicolor
## 63           6.0         2.2          4.0         1.0 versicolor
## 64           6.1         2.9          4.7         1.4 versicolor
## 65           5.6         2.9          3.6         1.3 versicolor
## 66           6.7         3.1          4.4         1.4 versicolor
## 67           5.6         3.0          4.5         1.5 versicolor
## 68           5.8         2.7          4.1         1.0 versicolor
## 69           6.2         2.2          4.5         1.5 versicolor
## 70           5.6         2.5          3.9         1.1 versicolor
## 71           5.9         3.2          4.8         1.8 versicolor
## 72           6.1         2.8          4.0         1.3 versicolor
## 73           6.3         2.5          4.9         1.5 versicolor
## 74           6.1         2.8          4.7         1.2 versicolor
## 75           6.4         2.9          4.3         1.3 versicolor
## 76           6.6         3.0          4.4         1.4 versicolor
## 77           6.8         2.8          4.8         1.4 versicolor
## 78           6.7         3.0          5.0         1.7 versicolor
## 79           6.0         2.9          4.5         1.5 versicolor
## 80           5.7         2.6          3.5         1.0 versicolor
## 81           5.5         2.4          3.8         1.1 versicolor
## 82           5.5         2.4          3.7         1.0 versicolor
## 83           5.8         2.7          3.9         1.2 versicolor
## 84           6.0         2.7          5.1         1.6 versicolor
## 85           5.4         3.0          4.5         1.5 versicolor
## 86           6.0         3.4          4.5         1.6 versicolor
## 87           6.7         3.1          4.7         1.5 versicolor
## 88           6.3         2.3          4.4         1.3 versicolor
## 89           5.6         3.0          4.1         1.3 versicolor
## 90           5.5         2.5          4.0         1.3 versicolor
## 91           5.5         2.6          4.4         1.2 versicolor
## 92           6.1         3.0          4.6         1.4 versicolor
## 93           5.8         2.6          4.0         1.2 versicolor
## 94           5.0         2.3          3.3         1.0 versicolor
## 95           5.6         2.7          4.2         1.3 versicolor
## 96           5.7         3.0          4.2         1.2 versicolor
## 97           5.7         2.9          4.2         1.3 versicolor
## 98           6.2         2.9          4.3         1.3 versicolor
## 99           5.1         2.5          3.0         1.1 versicolor
## 100          5.7         2.8          4.1         1.3 versicolor
## 101          6.3         3.3          6.0         2.5  virginica
## 102          5.8         2.7          5.1         1.9  virginica
## 103          7.1         3.0          5.9         2.1  virginica
## 104          6.3         2.9          5.6         1.8  virginica
## 105          6.5         3.0          5.8         2.2  virginica
## 106          7.6         3.0          6.6         2.1  virginica
## 107          4.9         2.5          4.5         1.7  virginica
## 108          7.3         2.9          6.3         1.8  virginica
## 109          6.7         2.5          5.8         1.8  virginica
## 110          7.2         3.6          6.1         2.5  virginica
## 111          6.5         3.2          5.1         2.0  virginica
## 112          6.4         2.7          5.3         1.9  virginica
## 113          6.8         3.0          5.5         2.1  virginica
## 114          5.7         2.5          5.0         2.0  virginica
## 115          5.8         2.8          5.1         2.4  virginica
## 116          6.4         3.2          5.3         2.3  virginica
## 117          6.5         3.0          5.5         1.8  virginica
## 118          7.7         3.8          6.7         2.2  virginica
## 119          7.7         2.6          6.9         2.3  virginica
## 120          6.0         2.2          5.0         1.5  virginica
## 121          6.9         3.2          5.7         2.3  virginica
## 122          5.6         2.8          4.9         2.0  virginica
## 123          7.7         2.8          6.7         2.0  virginica
## 124          6.3         2.7          4.9         1.8  virginica
## 125          6.7         3.3          5.7         2.1  virginica
## 126          7.2         3.2          6.0         1.8  virginica
## 127          6.2         2.8          4.8         1.8  virginica
## 128          6.1         3.0          4.9         1.8  virginica
## 129          6.4         2.8          5.6         2.1  virginica
## 130          7.2         3.0          5.8         1.6  virginica
## 131          7.4         2.8          6.1         1.9  virginica
## 132          7.9         3.8          6.4         2.0  virginica
## 133          6.4         2.8          5.6         2.2  virginica
## 134          6.3         2.8          5.1         1.5  virginica
## 135          6.1         2.6          5.6         1.4  virginica
## 136          7.7         3.0          6.1         2.3  virginica
## 137          6.3         3.4          5.6         2.4  virginica
## 138          6.4         3.1          5.5         1.8  virginica
## 139          6.0         3.0          4.8         1.8  virginica
## 140          6.9         3.1          5.4         2.1  virginica
## 141          6.7         3.1          5.6         2.4  virginica
## 142          6.9         3.1          5.1         2.3  virginica
## 143          5.8         2.7          5.1         1.9  virginica
## 144          6.8         3.2          5.9         2.3  virginica
## 145          6.7         3.3          5.7         2.5  virginica
## 146          6.7         3.0          5.2         2.3  virginica
## 147          6.3         2.5          5.0         1.9  virginica
## 148          6.5         3.0          5.2         2.0  virginica
## 149          6.2         3.4          5.4         2.3  virginica
## 150          5.9         3.0          5.1         1.8  virginica

2. Mengenal Struktur Dataset

2.1 Menampilkan strutur dataset
str(iris) 
## 'data.frame':    150 obs. of  5 variables:
##  $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
##  $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
##  $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
##  $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
##  $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
2.2 Menampilkan data teratas
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
2.3 Memisah atribut numerik dengan atribut spesies
iris.num <- iris[,1:4] 
iris.num
##     Sepal.Length Sepal.Width Petal.Length Petal.Width
## 1            5.1         3.5          1.4         0.2
## 2            4.9         3.0          1.4         0.2
## 3            4.7         3.2          1.3         0.2
## 4            4.6         3.1          1.5         0.2
## 5            5.0         3.6          1.4         0.2
## 6            5.4         3.9          1.7         0.4
## 7            4.6         3.4          1.4         0.3
## 8            5.0         3.4          1.5         0.2
## 9            4.4         2.9          1.4         0.2
## 10           4.9         3.1          1.5         0.1
## 11           5.4         3.7          1.5         0.2
## 12           4.8         3.4          1.6         0.2
## 13           4.8         3.0          1.4         0.1
## 14           4.3         3.0          1.1         0.1
## 15           5.8         4.0          1.2         0.2
## 16           5.7         4.4          1.5         0.4
## 17           5.4         3.9          1.3         0.4
## 18           5.1         3.5          1.4         0.3
## 19           5.7         3.8          1.7         0.3
## 20           5.1         3.8          1.5         0.3
## 21           5.4         3.4          1.7         0.2
## 22           5.1         3.7          1.5         0.4
## 23           4.6         3.6          1.0         0.2
## 24           5.1         3.3          1.7         0.5
## 25           4.8         3.4          1.9         0.2
## 26           5.0         3.0          1.6         0.2
## 27           5.0         3.4          1.6         0.4
## 28           5.2         3.5          1.5         0.2
## 29           5.2         3.4          1.4         0.2
## 30           4.7         3.2          1.6         0.2
## 31           4.8         3.1          1.6         0.2
## 32           5.4         3.4          1.5         0.4
## 33           5.2         4.1          1.5         0.1
## 34           5.5         4.2          1.4         0.2
## 35           4.9         3.1          1.5         0.2
## 36           5.0         3.2          1.2         0.2
## 37           5.5         3.5          1.3         0.2
## 38           4.9         3.6          1.4         0.1
## 39           4.4         3.0          1.3         0.2
## 40           5.1         3.4          1.5         0.2
## 41           5.0         3.5          1.3         0.3
## 42           4.5         2.3          1.3         0.3
## 43           4.4         3.2          1.3         0.2
## 44           5.0         3.5          1.6         0.6
## 45           5.1         3.8          1.9         0.4
## 46           4.8         3.0          1.4         0.3
## 47           5.1         3.8          1.6         0.2
## 48           4.6         3.2          1.4         0.2
## 49           5.3         3.7          1.5         0.2
## 50           5.0         3.3          1.4         0.2
## 51           7.0         3.2          4.7         1.4
## 52           6.4         3.2          4.5         1.5
## 53           6.9         3.1          4.9         1.5
## 54           5.5         2.3          4.0         1.3
## 55           6.5         2.8          4.6         1.5
## 56           5.7         2.8          4.5         1.3
## 57           6.3         3.3          4.7         1.6
## 58           4.9         2.4          3.3         1.0
## 59           6.6         2.9          4.6         1.3
## 60           5.2         2.7          3.9         1.4
## 61           5.0         2.0          3.5         1.0
## 62           5.9         3.0          4.2         1.5
## 63           6.0         2.2          4.0         1.0
## 64           6.1         2.9          4.7         1.4
## 65           5.6         2.9          3.6         1.3
## 66           6.7         3.1          4.4         1.4
## 67           5.6         3.0          4.5         1.5
## 68           5.8         2.7          4.1         1.0
## 69           6.2         2.2          4.5         1.5
## 70           5.6         2.5          3.9         1.1
## 71           5.9         3.2          4.8         1.8
## 72           6.1         2.8          4.0         1.3
## 73           6.3         2.5          4.9         1.5
## 74           6.1         2.8          4.7         1.2
## 75           6.4         2.9          4.3         1.3
## 76           6.6         3.0          4.4         1.4
## 77           6.8         2.8          4.8         1.4
## 78           6.7         3.0          5.0         1.7
## 79           6.0         2.9          4.5         1.5
## 80           5.7         2.6          3.5         1.0
## 81           5.5         2.4          3.8         1.1
## 82           5.5         2.4          3.7         1.0
## 83           5.8         2.7          3.9         1.2
## 84           6.0         2.7          5.1         1.6
## 85           5.4         3.0          4.5         1.5
## 86           6.0         3.4          4.5         1.6
## 87           6.7         3.1          4.7         1.5
## 88           6.3         2.3          4.4         1.3
## 89           5.6         3.0          4.1         1.3
## 90           5.5         2.5          4.0         1.3
## 91           5.5         2.6          4.4         1.2
## 92           6.1         3.0          4.6         1.4
## 93           5.8         2.6          4.0         1.2
## 94           5.0         2.3          3.3         1.0
## 95           5.6         2.7          4.2         1.3
## 96           5.7         3.0          4.2         1.2
## 97           5.7         2.9          4.2         1.3
## 98           6.2         2.9          4.3         1.3
## 99           5.1         2.5          3.0         1.1
## 100          5.7         2.8          4.1         1.3
## 101          6.3         3.3          6.0         2.5
## 102          5.8         2.7          5.1         1.9
## 103          7.1         3.0          5.9         2.1
## 104          6.3         2.9          5.6         1.8
## 105          6.5         3.0          5.8         2.2
## 106          7.6         3.0          6.6         2.1
## 107          4.9         2.5          4.5         1.7
## 108          7.3         2.9          6.3         1.8
## 109          6.7         2.5          5.8         1.8
## 110          7.2         3.6          6.1         2.5
## 111          6.5         3.2          5.1         2.0
## 112          6.4         2.7          5.3         1.9
## 113          6.8         3.0          5.5         2.1
## 114          5.7         2.5          5.0         2.0
## 115          5.8         2.8          5.1         2.4
## 116          6.4         3.2          5.3         2.3
## 117          6.5         3.0          5.5         1.8
## 118          7.7         3.8          6.7         2.2
## 119          7.7         2.6          6.9         2.3
## 120          6.0         2.2          5.0         1.5
## 121          6.9         3.2          5.7         2.3
## 122          5.6         2.8          4.9         2.0
## 123          7.7         2.8          6.7         2.0
## 124          6.3         2.7          4.9         1.8
## 125          6.7         3.3          5.7         2.1
## 126          7.2         3.2          6.0         1.8
## 127          6.2         2.8          4.8         1.8
## 128          6.1         3.0          4.9         1.8
## 129          6.4         2.8          5.6         2.1
## 130          7.2         3.0          5.8         1.6
## 131          7.4         2.8          6.1         1.9
## 132          7.9         3.8          6.4         2.0
## 133          6.4         2.8          5.6         2.2
## 134          6.3         2.8          5.1         1.5
## 135          6.1         2.6          5.6         1.4
## 136          7.7         3.0          6.1         2.3
## 137          6.3         3.4          5.6         2.4
## 138          6.4         3.1          5.5         1.8
## 139          6.0         3.0          4.8         1.8
## 140          6.9         3.1          5.4         2.1
## 141          6.7         3.1          5.6         2.4
## 142          6.9         3.1          5.1         2.3
## 143          5.8         2.7          5.1         1.9
## 144          6.8         3.2          5.9         2.3
## 145          6.7         3.3          5.7         2.5
## 146          6.7         3.0          5.2         2.3
## 147          6.3         2.5          5.0         1.9
## 148          6.5         3.0          5.2         2.0
## 149          6.2         3.4          5.4         2.3
## 150          5.9         3.0          5.1         1.8
Diketahui pada dataset iris terdapat atribut Sepal Length, Sepal Width, Petal Length, dan Petal Width dengan tipe data number, serta terdapat atribut Species yang memiliki tiga nilai yaitu setosa, versicolor, dan virginica sesuai dengan deskripsi pada laman resminya. Berdasarkan informasi tersebut, saya memisah empat atribut pertama ke variabel iris.num, keempat atribut ini akan menentukan spesies.
2.4 Menggunakan fungsi colnames
colnames(iris)
## [1] "Sepal.Length" "Sepal.Width"  "Petal.Length" "Petal.Width"  "Species"
2.5 Menggunakan package dplyr
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
2.6 Menggunakan fungsi filter
iris %>%
  filter(Species == "setosa")
##    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1           5.1         3.5          1.4         0.2  setosa
## 2           4.9         3.0          1.4         0.2  setosa
## 3           4.7         3.2          1.3         0.2  setosa
## 4           4.6         3.1          1.5         0.2  setosa
## 5           5.0         3.6          1.4         0.2  setosa
## 6           5.4         3.9          1.7         0.4  setosa
## 7           4.6         3.4          1.4         0.3  setosa
## 8           5.0         3.4          1.5         0.2  setosa
## 9           4.4         2.9          1.4         0.2  setosa
## 10          4.9         3.1          1.5         0.1  setosa
## 11          5.4         3.7          1.5         0.2  setosa
## 12          4.8         3.4          1.6         0.2  setosa
## 13          4.8         3.0          1.4         0.1  setosa
## 14          4.3         3.0          1.1         0.1  setosa
## 15          5.8         4.0          1.2         0.2  setosa
## 16          5.7         4.4          1.5         0.4  setosa
## 17          5.4         3.9          1.3         0.4  setosa
## 18          5.1         3.5          1.4         0.3  setosa
## 19          5.7         3.8          1.7         0.3  setosa
## 20          5.1         3.8          1.5         0.3  setosa
## 21          5.4         3.4          1.7         0.2  setosa
## 22          5.1         3.7          1.5         0.4  setosa
## 23          4.6         3.6          1.0         0.2  setosa
## 24          5.1         3.3          1.7         0.5  setosa
## 25          4.8         3.4          1.9         0.2  setosa
## 26          5.0         3.0          1.6         0.2  setosa
## 27          5.0         3.4          1.6         0.4  setosa
## 28          5.2         3.5          1.5         0.2  setosa
## 29          5.2         3.4          1.4         0.2  setosa
## 30          4.7         3.2          1.6         0.2  setosa
## 31          4.8         3.1          1.6         0.2  setosa
## 32          5.4         3.4          1.5         0.4  setosa
## 33          5.2         4.1          1.5         0.1  setosa
## 34          5.5         4.2          1.4         0.2  setosa
## 35          4.9         3.1          1.5         0.2  setosa
## 36          5.0         3.2          1.2         0.2  setosa
## 37          5.5         3.5          1.3         0.2  setosa
## 38          4.9         3.6          1.4         0.1  setosa
## 39          4.4         3.0          1.3         0.2  setosa
## 40          5.1         3.4          1.5         0.2  setosa
## 41          5.0         3.5          1.3         0.3  setosa
## 42          4.5         2.3          1.3         0.3  setosa
## 43          4.4         3.2          1.3         0.2  setosa
## 44          5.0         3.5          1.6         0.6  setosa
## 45          5.1         3.8          1.9         0.4  setosa
## 46          4.8         3.0          1.4         0.3  setosa
## 47          5.1         3.8          1.6         0.2  setosa
## 48          4.6         3.2          1.4         0.2  setosa
## 49          5.3         3.7          1.5         0.2  setosa
## 50          5.0         3.3          1.4         0.2  setosa
iris %>%
  filter(Species == "versicolor")
##    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1           7.0         3.2          4.7         1.4 versicolor
## 2           6.4         3.2          4.5         1.5 versicolor
## 3           6.9         3.1          4.9         1.5 versicolor
## 4           5.5         2.3          4.0         1.3 versicolor
## 5           6.5         2.8          4.6         1.5 versicolor
## 6           5.7         2.8          4.5         1.3 versicolor
## 7           6.3         3.3          4.7         1.6 versicolor
## 8           4.9         2.4          3.3         1.0 versicolor
## 9           6.6         2.9          4.6         1.3 versicolor
## 10          5.2         2.7          3.9         1.4 versicolor
## 11          5.0         2.0          3.5         1.0 versicolor
## 12          5.9         3.0          4.2         1.5 versicolor
## 13          6.0         2.2          4.0         1.0 versicolor
## 14          6.1         2.9          4.7         1.4 versicolor
## 15          5.6         2.9          3.6         1.3 versicolor
## 16          6.7         3.1          4.4         1.4 versicolor
## 17          5.6         3.0          4.5         1.5 versicolor
## 18          5.8         2.7          4.1         1.0 versicolor
## 19          6.2         2.2          4.5         1.5 versicolor
## 20          5.6         2.5          3.9         1.1 versicolor
## 21          5.9         3.2          4.8         1.8 versicolor
## 22          6.1         2.8          4.0         1.3 versicolor
## 23          6.3         2.5          4.9         1.5 versicolor
## 24          6.1         2.8          4.7         1.2 versicolor
## 25          6.4         2.9          4.3         1.3 versicolor
## 26          6.6         3.0          4.4         1.4 versicolor
## 27          6.8         2.8          4.8         1.4 versicolor
## 28          6.7         3.0          5.0         1.7 versicolor
## 29          6.0         2.9          4.5         1.5 versicolor
## 30          5.7         2.6          3.5         1.0 versicolor
## 31          5.5         2.4          3.8         1.1 versicolor
## 32          5.5         2.4          3.7         1.0 versicolor
## 33          5.8         2.7          3.9         1.2 versicolor
## 34          6.0         2.7          5.1         1.6 versicolor
## 35          5.4         3.0          4.5         1.5 versicolor
## 36          6.0         3.4          4.5         1.6 versicolor
## 37          6.7         3.1          4.7         1.5 versicolor
## 38          6.3         2.3          4.4         1.3 versicolor
## 39          5.6         3.0          4.1         1.3 versicolor
## 40          5.5         2.5          4.0         1.3 versicolor
## 41          5.5         2.6          4.4         1.2 versicolor
## 42          6.1         3.0          4.6         1.4 versicolor
## 43          5.8         2.6          4.0         1.2 versicolor
## 44          5.0         2.3          3.3         1.0 versicolor
## 45          5.6         2.7          4.2         1.3 versicolor
## 46          5.7         3.0          4.2         1.2 versicolor
## 47          5.7         2.9          4.2         1.3 versicolor
## 48          6.2         2.9          4.3         1.3 versicolor
## 49          5.1         2.5          3.0         1.1 versicolor
## 50          5.7         2.8          4.1         1.3 versicolor
iris %>%
  filter(Species == "virginica")
##    Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
## 1           6.3         3.3          6.0         2.5 virginica
## 2           5.8         2.7          5.1         1.9 virginica
## 3           7.1         3.0          5.9         2.1 virginica
## 4           6.3         2.9          5.6         1.8 virginica
## 5           6.5         3.0          5.8         2.2 virginica
## 6           7.6         3.0          6.6         2.1 virginica
## 7           4.9         2.5          4.5         1.7 virginica
## 8           7.3         2.9          6.3         1.8 virginica
## 9           6.7         2.5          5.8         1.8 virginica
## 10          7.2         3.6          6.1         2.5 virginica
## 11          6.5         3.2          5.1         2.0 virginica
## 12          6.4         2.7          5.3         1.9 virginica
## 13          6.8         3.0          5.5         2.1 virginica
## 14          5.7         2.5          5.0         2.0 virginica
## 15          5.8         2.8          5.1         2.4 virginica
## 16          6.4         3.2          5.3         2.3 virginica
## 17          6.5         3.0          5.5         1.8 virginica
## 18          7.7         3.8          6.7         2.2 virginica
## 19          7.7         2.6          6.9         2.3 virginica
## 20          6.0         2.2          5.0         1.5 virginica
## 21          6.9         3.2          5.7         2.3 virginica
## 22          5.6         2.8          4.9         2.0 virginica
## 23          7.7         2.8          6.7         2.0 virginica
## 24          6.3         2.7          4.9         1.8 virginica
## 25          6.7         3.3          5.7         2.1 virginica
## 26          7.2         3.2          6.0         1.8 virginica
## 27          6.2         2.8          4.8         1.8 virginica
## 28          6.1         3.0          4.9         1.8 virginica
## 29          6.4         2.8          5.6         2.1 virginica
## 30          7.2         3.0          5.8         1.6 virginica
## 31          7.4         2.8          6.1         1.9 virginica
## 32          7.9         3.8          6.4         2.0 virginica
## 33          6.4         2.8          5.6         2.2 virginica
## 34          6.3         2.8          5.1         1.5 virginica
## 35          6.1         2.6          5.6         1.4 virginica
## 36          7.7         3.0          6.1         2.3 virginica
## 37          6.3         3.4          5.6         2.4 virginica
## 38          6.4         3.1          5.5         1.8 virginica
## 39          6.0         3.0          4.8         1.8 virginica
## 40          6.9         3.1          5.4         2.1 virginica
## 41          6.7         3.1          5.6         2.4 virginica
## 42          6.9         3.1          5.1         2.3 virginica
## 43          5.8         2.7          5.1         1.9 virginica
## 44          6.8         3.2          5.9         2.3 virginica
## 45          6.7         3.3          5.7         2.5 virginica
## 46          6.7         3.0          5.2         2.3 virginica
## 47          6.3         2.5          5.0         1.9 virginica
## 48          6.5         3.0          5.2         2.0 virginica
## 49          6.2         3.4          5.4         2.3 virginica
## 50          5.9         3.0          5.1         1.8 virginica

3. Statistik Data

3.1 Menampilkan mean, median, quantile, dan frekuensi spesies
summary(iris)
##   Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
##  Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
##  1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
##  Median :5.800   Median :3.000   Median :4.350   Median :1.300  
##  Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
##  3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
##  Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
##        Species  
##  setosa    :50  
##  versicolor:50  
##  virginica :50  
##                 
##                 
## 
range(iris.num)
## [1] 0.1 7.9

modus

mode <- function(iris){
  uqx <- unique(iris)
  tab <- table(iris)
  sort(uqx)[tab == max(tab)]
}
mode(iris$Sepal.Length)
## [1] 5
mode(iris$Sepal.Width)
## [1] 3
mode(iris$Petal.Length)
## [1] 1.4 1.5
mode(iris$Petal.Width)
## [1] 0.2

rata-rata geometrik

mean.geom <- function(iris){
  exp(mean(log(iris)))
}
mean.geom(iris$Sepal.Length)
## [1] 5.78572
mean.geom(iris$Sepal.Width)
## [1] 3.026598
mean.geom(iris$Petal.Length)
## [1] 3.238267
mean.geom(iris$Petal.Width)
## [1] 0.8417075

rata-rata harmoni

mean.harm <- function(iris){
  1/(mean(1/iris))
}
mean.harm(iris$Sepal.Length)
## [1] 5.728905
mean.harm(iris$Sepal.Width)
## [1] 2.995815
mean.harm(iris$Petal.Length)
## [1] 2.694166
mean.harm(iris$Petal.Width)
## [1] 0.4946708

nilai skewness dan kurtosis

library(e1071)
skewness(iris$Sepal.Length)
## [1] 0.3086407
skewness(iris$Sepal.Width)
## [1] 0.3126147
skewness(iris$Petal.Length)
## [1] -0.2694109
skewness(iris$Petal.Width)
## [1] -0.1009166
kurtosis(iris$Sepal.Length)
## [1] -0.6058125
kurtosis(iris$Sepal.Width)
## [1] 0.1387047
kurtosis(iris$Petal.Length)
## [1] -1.416857
kurtosis(iris$Petal.Width)
## [1] -1.358179
3.2 Menampilkan variansi atribut satu dengan lainnya
 var(iris.num)
##              Sepal.Length Sepal.Width Petal.Length Petal.Width
## Sepal.Length    0.6856935  -0.0424340    1.2743154   0.5162707
## Sepal.Width    -0.0424340   0.1899794   -0.3296564  -0.1216394
## Petal.Length    1.2743154  -0.3296564    3.1162779   1.2956094
## Petal.Width     0.5162707  -0.1216394    1.2956094   0.5810063
3.3 Jangkauan antar Kuartil dan Simpangan Kuartil
jk <- function(iris){
  as.numeric(quantile(iris, 0.75) - quantile(iris, 0.25))
}
Qd <- function(iris){
  as.numeric(0.5*(quantile(iris, 0.75) - quantile(iris, 0.25)))
}
jk(iris$Sepal.Length)
## [1] 1.3
jk(iris$Sepal.Width)
## [1] 0.5
jk(iris$Petal.Length)
## [1] 3.5
jk(iris$Petal.Width)
## [1] 1.5
Qd(iris$Sepal.Length)
## [1] 0.65
Qd(iris$Sepal.Width)
## [1] 0.25
Qd(iris$Petal.Length)
## [1] 1.75
Qd(iris$Petal.Width)
## [1] 0.75
aggregate(iris$Sepal.Length, list(iris$Petal.Length), Qd)
##    Group.1      x
## 1      1.0 0.0000
## 2      1.1 0.0000
## 3      1.2 0.2000
## 4      1.3 0.3750
## 5      1.4 0.1500
## 6      1.5 0.1500
## 7      1.6 0.1000
## 8      1.7 0.0750
## 9      1.9 0.0750
## 10     3.0 0.0000
## 11     3.3 0.0250
## 12     3.5 0.1750
## 13     3.6 0.0000
## 14     3.7 0.0000
## 15     3.8 0.0000
## 16     3.9 0.1500
## 17     4.0 0.2500
## 18     4.1 0.0500
## 19     4.2 0.0375
## 20     4.3 0.0500
## 21     4.4 0.2625
## 22     4.5 0.2500
## 23     4.6 0.1250
## 24     4.7 0.3000
## 25     4.8 0.1875
## 26     4.9 0.1000
## 27     5.0 0.2375
## 28     5.1 0.2750
## 29     5.2 0.0500
## 30     5.3 0.0000
## 31     5.4 0.1750
## 32     5.5 0.1000
## 33     5.6 0.0500
## 34     5.7 0.0500
## 35     5.8 0.1750
## 36     5.9 0.0750
## 37     6.0 0.2250
## 38     6.1 0.1250
## 39     6.3 0.0000
## 40     6.4 0.0000
## 41     6.6 0.0000
## 42     6.7 0.0000
## 43     6.9 0.0000
aggregate(iris$Sepal.Width, list(iris$Petal.Width), Qd)
##    Group.1      x
## 1      0.1 0.3000
## 2      0.2 0.1500
## 3      0.3 0.2250
## 4      0.4 0.1750
## 5      0.5 0.0000
## 6      0.6 0.0000
## 7      1.0 0.1250
## 8      1.1 0.0250
## 9      1.2 0.1000
## 10     1.3 0.1000
## 11     1.4 0.1250
## 12     1.5 0.1500
## 13     1.6 0.2000
## 14     1.7 0.1250
## 15     1.8 0.0750
## 16     1.9 0.0000
## 17     2.0 0.1750
## 18     2.1 0.0375
## 19     2.2 0.2500
## 20     2.3 0.1000
## 21     2.4 0.1500
## 22     2.5 0.0750
aggregate(iris$Petal.Length, list(iris$Sepal.Length), Qd)
##    Group.1      x
## 1      4.3 0.0000
## 2      4.4 0.0250
## 3      4.5 0.0000
## 4      4.6 0.0625
## 5      4.7 0.0750
## 6      4.8 0.1000
## 7      4.9 0.7125
## 8      5.0 0.1000
## 9      5.1 0.1000
## 10     5.2 0.3125
## 11     5.3 0.0000
## 12     5.4 0.1000
## 13     5.5 0.7250
## 14     5.6 0.2375
## 15     5.7 0.6125
## 16     5.8 0.5750
## 17     5.9 0.2250
## 18     6.0 0.2250
## 19     6.1 0.1125
## 20     6.2 0.2500
## 21     6.3 0.3500
## 22     6.4 0.3250
## 23     6.5 0.2000
## 24     6.6 0.0500
## 25     6.7 0.3875
## 26     6.8 0.2750
## 27     6.9 0.2125
## 28     7.0 0.0000
## 29     7.1 0.0000
## 30     7.2 0.0750
## 31     7.3 0.0000
## 32     7.4 0.0000
## 33     7.6 0.0000
## 34     7.7 0.1000
## 35     7.9 0.0000
aggregate(iris$Petal.Width, list(iris$Sepal.Width), Qd)
##    Group.1      x
## 1      2.0 0.0000
## 2      2.2 0.1250
## 3      2.3 0.2375
## 4      2.4 0.0250
## 5      2.5 0.2875
## 6      2.6 0.1000
## 7      2.7 0.3000
## 8      2.8 0.3375
## 9      2.9 0.0875
## 10     3.0 0.3625
## 11     3.1 0.8750
## 12     3.2 0.9000
## 13     3.3 0.8125
## 14     3.4 0.2500
## 15     3.5 0.0500
## 16     3.6 0.3000
## 17     3.7 0.0500
## 18     3.8 0.6500
## 19     3.9 0.0000
## 20     4.0 0.0000
## 21     4.1 0.0000
## 22     4.2 0.0000
## 23     4.4 0.0000

4. Visualisasi Data

4.1 Membuat pie chart untuk spesies
pie(table(iris$Species))

4.2 Membuat histogram tiap atribut
#mengatur pelatakan grafik
 par(mfrow=c(2,2),oma=c(1,1,1,1))

#membuat histogram tiap atribut
 hist(iris$Sepal.Length,col = "lightblue")
 hist(iris$Sepal.Width,col = "lightblue")
 hist(iris$Petal.Length,col = "lightblue")
 hist(iris$Petal.Width,col = "lightblue")

4.3 Membuat boxplot tiap atribut terhadap spesies
#atur peletakan grafik
 par(mfrow=c(2,2),mar=c(2,2,2,2))
#membuat boxplot tiap atribut terhadap spesies
 boxplot(Sepal.Length ~ Species, main = "Box Plot Sepal Length - Species", data = iris, xlab = "Species", ylab = "Sepal.Length", col = "lightblue")

 boxplot(Sepal.Width ~ Species, main = "Box Plot Sepal Width - Species", data = iris, xlab = "Species", ylab = "Sepal.Width", col = "lightblue")

 boxplot(Petal.Length ~ Species, main = "Box Plot Petal Length - Species", data = iris, xlab = "Species", ylab = "Petal.Length", col = "lightblue")

 boxplot(Petal.Length ~ Species, main = "Box Plot Petal Width - Species", data = iris, xlab = "Species", ylab = "Petal.Width", col = "lightblue")

4.4 Membuat pairs plot tiap atribut terhadap spesies
 #membuat pairs plot tiap atribut terhadap spesies
 iris.jitter <- apply(iris.num,2,function(o){jitter(o)})
 iris.jitter <- apply(iris.num,2,function(o){jitter(o)})
 pairs(iris.jitter,main="Pairs Plot of Iris Data",pch=21,bg = c("red", "green", "blue")[unclass(iris$Species)])

4.5 Membuat SCATTERPLOT
with(iris, plot(Sepal.Length, Sepal.Width,  col=Species,pch=as.numeric(Species)))

Dari gambar diatas kita dapat melihat hasil plot data label (species) dari fitur sepal.length dan sepal.width. Kita bisa menarik beberapa informasi dari plot tersebut yaitu :

Iris Sentosa secara umum terpisah secara linier (linear separated) dengan Iris Versicolor dan Iris Virginica. Iris Versicolor dan Iris Virginica mengalami ovelap sehingga sulit dipisahkan secara linier sehingga lebih sulit dipisahkan dibandingkan dengan Iris Sentosa. Dari dua fitur diatas sudah cukup baik memisahkan label Iris Sentosa tapi belum cukup baik untuk dua label lainnya (Iris Versicolor dan Iris Virginica).

with(iris, plot(Petal.Length, Petal.Width,  col=Species,pch=as.numeric(Species)))

Dari gambar diatas kita dapat melihat hasil plot data label (species) dari fitur petal.length dan petal.width. Kita bisa menarik beberapa informasi dari plot tersebut yaitu :

Iris Sentosa secara umum terpisah secara linier (linear separated) dengan Iris Versicolor dan Iris Virginica. Iris Versicolor dan Iris Virginica mengalami sedikit ovelap sehingga sulit dipisahkan secara linier sehingga lebih sulit dipisahkan dibandingkan dengan Iris Sentosa. Dari dua fitur diatas sudah cukup baik memisahkan label Iris Sentosa tapi belum cukup baik untuk dua label lainnya (Iris Versicolor dan Iris Virginica). Overlap yang terjadi pada plot dari petal.length dan petal.width cenderung lebih sedikit dibandingkan dengan overlap yang terjadi pada plot dari sepal.Length dan sepal.width.