library(ggplot2)
library(ggridges)
datatugas<-read.csv('D:/Semester5/AED/List_of_Indonesian_provinces_by_GRP_per_capita.csv')
newdatatugas<-datatugas[-1:-9,]
head(newdatatugas, n = 5L)
## Rank Province Region GDP.in.billion.Rp. GDP.Nominal GDP.PPP
## 10 1 Jakarta Java 2840828 200.91 New Zealand
## 11 2 East Java Java 2352425 166.37 Kazakhstan
## 12 3 West Java Java 2125158 150.30 Ukraine
## 13 4 Central Java Java 1362457 96.35 Kenya
## 14 5 North Sumatra Sumatra 801733 56.70 Lebanon
ggplot(newdatatugas, aes(x = GDP.Nominal, y = Region, fill = Region)) +
geom_density_ridges() +
theme_ridges() +
theme(legend.position = "none")
## Picking joint bandwidth of 9.17
Data di Region Jawa tidak membentuk sebaran apapun karena nilai GDP
Nominal yang cukup jauh antar tiap provinsi. Berdasarkan Density Plot
dan tidak melibatkan Region Jawa, terlihat bahwa Region Sumatra memiliki
rata-rata GDP Nominal yang lebih besar dari Region lainnya.
hist(newdatatugas$GDP.Nominal, breaks=25, col="coral",
xlab="GDP Nominal",
main="Histogram GDP Nominal",
freq=FALSE)
Secara umum, data menyebar menjulur ke kanan dengan beberapa pencilan.
Banyak provinsi yang memiliki GDP Nominal diantara 0-10.
qqnorm(newdatatugas$GDP.Nominal, main="Normal Q-Q Plot GDP Nominal")
qqline(newdatatugas$GDP.Nominal, col = "red")
Terlihat bahwa data tidak menyebar normal, namun menjulur ke kanan.
boxplot(newdatatugas$GDP.Nominal ~ newdatatugas$Region,
col=c("coral", "green", "skyblue", "red", "yellow", "orange", "purple"),
ylab="GDP Nominal",
xlab="Region")
Terlihat bahwa tidak ada Region yang datanya menyebar normal karena
tidak ada nilai median Region yang ada di tengah masing-masing
boxplot.
Note: Proyek ini adalah hasil tugas individu mata kuliah Analisis Eksplorasi Data.