Suatu bentuk analisis sederhana yang saya lakukan dengan RStudio dan mempublishnya ke RPubs.
Nama : Fairuz Ardhan Haunan
NIM : 220605110038
Mata Kuliah : Kalkulus
Prodi : Teknik Informatika UIN Maulana Malik Ibrahim Malang
Langkah pertama, kita import datanya dari internet. Kemudian baru bisa kita olah. Saya menggunakan fungsi “setwd” untuk mengatur lokasi dari data tempat saya ambil dan read.csv sebagai fungsi dari R untuk dapat membaca data yang saya import.
library(readxl)
setwd("D:/Kalkulus/")
data=read_excel('Bencana Data.xlsx')
data
## # A tibble: 66 × 3
## jenis_bencana Tahun jumlah_bencana
## <chr> <dbl> <dbl>
## 1 Angin Puting Beliung 2013 500
## 2 Angin Puting Beliung 2012 543
## 3 Angin Puting Beliung 2019 568
## 4 Angin Puting Beliung 2015 571
## 5 Angin Puting Beliung 2014 618
## 6 Angin Puting Beliung 2016 663
## 7 Angin Puting Beliung 2018 804
## 8 Angin Puting Beliung 2017 885
## 9 Banjir 2019 247
## 10 Banjir 2015 523
## # … with 56 more rows
Mari kita amati ada berapa banyak nama tabel didalam data tersebut.
names(data)
## [1] "jenis_bencana" "Tahun" "jumlah_bencana"
Dapat kita amati bahwasannya dalam data tersebut ada 3 tabel yang tersedia. Lalu kita
lihat struktur data kita dan variabel apa aja yang ada.
str(data)
## tibble [66 × 3] (S3: tbl_df/tbl/data.frame)
## $ jenis_bencana : chr [1:66] "Angin Puting Beliung" "Angin Puting Beliung" "Angin Puting Beliung" "Angin Puting Beliung" ...
## $ Tahun : num [1:66] 2013 2012 2019 2015 2014 ...
## $ jumlah_bencana: num [1:66] 500 543 568 571 618 663 804 885 247 523 ...
Kemudian, kita coba lihat 6 data teratas.
head(data)
## # A tibble: 6 × 3
## jenis_bencana Tahun jumlah_bencana
## <chr> <dbl> <dbl>
## 1 Angin Puting Beliung 2013 500
## 2 Angin Puting Beliung 2012 543
## 3 Angin Puting Beliung 2019 568
## 4 Angin Puting Beliung 2015 571
## 5 Angin Puting Beliung 2014 618
## 6 Angin Puting Beliung 2016 663
Lalu kita lihat 6 data terakhir
tail(data)
## # A tibble: 6 × 3
## jenis_bencana Tahun jumlah_bencana
## <chr> <dbl> <dbl>
## 1 Tanah Longsor 2014 598
## 2 Tanah Longsor 2016 598
## 3 Tanah Longsor 2017 844
## 4 Tsunami 2012 0
## 5 Tsunami 2014 2
## 6 Tsunami 2018 2
Fungsi summary dapat kita gunakan untuk melihat rangkuman statistik data.
summary(data)
## jenis_bencana Tahun jumlah_bencana
## Length:66 Min. :2012 Min. : 0.00
## Class :character 1st Qu.:2013 1st Qu.: 11.25
## Mode :character Median :2015 Median : 52.00
## Mean :2015 Mean :243.08
## 3rd Qu.:2018 3rd Qu.:517.75
## Max. :2019 Max. :973.00
Keterangan tersebut telah menampilan berbagai data statistik yang kita perlukan. Namun saat ini, kita coba melihatnya dengan lebih detail.
Rata-Rata Suatu Variabel
mean(data$jumlah_bencana)
## [1] 243.0758Niai Tengah Suatu Tabel
median(data$jumlah_bencana)
## [1] 52
Standar Deviasi
sd(data$Tahun)
## [1] 2.341478Mencari Skewness dan Kurtosis
Disini kita harus menggunakan package moments. Aoa itu skewness dan kurtosis ?
Skewness merupakan statistik yang digunakan dalam memberikan gambaran distribusi data apakah miring ke kiri, ke kanan atau simetris sedangkan kurtosis merupakan statistik yang digunakan dalam memberikan gambaran apakah distribusi data cenderung rata atau runcing.
library(moments)
skewness(data$Tahun)
## [1] 0.02155759
kurtosis = (data$Tahun)
Histogram Tahun
hist(data$Tahun)
2. Histogram Jumlah Bencana
hist(data$jumlah_bencana)
Sekian analisis sederhana yang dapat saya lakukan. Kurang lebihnya mohon maaf dan terimakasih.
Sumber Data : https://data.pu.go.id/sites/default/files/data-bencana-crostab.xlsx.