Memanggil library dan dataset

library(ggplot2)
library(ggridges)
datatugas<-read.csv('D:/Semester5/AED/List_of_Indonesian_provinces_by_GRP_per_capita.csv')
newdatatugas<-datatugas[-1:-9,]
head(newdatatugas, n = 5L)
##    Rank      Province  Region GDP.in.billion.Rp. GDP.Nominal     GDP.PPP
## 10    1       Jakarta    Java            2840828      200.91 New Zealand
## 11    2     East Java    Java            2352425      166.37  Kazakhstan
## 12    3     West Java    Java            2125158      150.30     Ukraine
## 13    4  Central Java    Java            1362457       96.35       Kenya
## 14    5 North Sumatra Sumatra             801733       56.70     Lebanon

Density Plot

ggplot(newdatatugas, aes(x = GDP.Nominal, y = Region, fill = Region)) +
  geom_density_ridges() +
  theme_ridges() +
  theme(legend.position = "none")
## Picking joint bandwidth of 9.17

Data di Region Jawa tidak membentuk sebaran apapun karena nilai GDP Nominal yang cukup jauh antar tiap provinsi. Berdasarkan Density Plot dan tidak melibatkan Region Jawa, terlihat bahwa Region Sumatra memiliki rata-rata GDP Nominal yang lebih besar dari Region lainnya.

Histogram

hist(newdatatugas$GDP.Nominal, breaks=25, col="coral",
     xlab="GDP Nominal",
     main="Histogram GDP Nominal",
     freq=FALSE)

Secara umum, data menyebar menjulur ke kanan dengan beberapa pencilan. Banyak provinsi yang memiliki GDP Nominal diantara 0-10.

Q-Q Plot

qqnorm(newdatatugas$GDP.Nominal, main="Normal Q-Q Plot GDP Nominal")
qqline(newdatatugas$GDP.Nominal, col = "red")

Terlihat bahwa data tidak menyebar normal, namun menjulur ke kanan.

Box Plot

boxplot(newdatatugas$GDP.Nominal ~ newdatatugas$Region,
        col=c("coral", "green", "skyblue", "red", "yellow", "orange", "purple"),
        ylab="GDP Nominal",
        xlab="Region")

Terlihat bahwa tidak ada Region yang datanya menyebar normal karena tidak ada nilai median Region yang ada di tengah masing-masing boxplot.

Note: Proyek ini adalah hasil tugas individu mata kuliah Analisis Eksplorasi Data.