title: “Tugas Praktikum 8 - Visualisasi Data”
author: "Kelompok 8:
- Afris Setiya Intan Amanda (G1401201018)
- Oksi Alhadi (G1401201045)
- Naura Tirza Ardhani (G1401201073)
- Muhammad Zhillan Zakiyyan (G1401201092)"
date: “4/14/2022”
output: html_document

Visualisasi Data Hubungan Antar Peubah Numerik

Packages yang digunakan

library(readxl)
## Warning: package 'readxl' was built under R version 4.1.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.1.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.1.3
## corrplot 0.92 loaded
library(plotly)
## Warning: package 'plotly' was built under R version 4.1.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.1.2
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(ggplot2)

Import Data

jabard <- read_excel("C:/Users/hp/Documents/MY DEPARTEMEN/#4/VISDAT/Data/Jabar Data (gabung).xlsx")
View(jabard)

###Data Frame Baru untuk Heatmap
dt.new <- jabard %>% select(j.miskin15,AHH2015,EYS2015,MYS2015,EXP2015)
View(dt.new)

Bentuk Visualiasi Data Korelasi

Scatterplot

#Plot
plot(jabard$p.miskin16 ~ jabard$AHH2016, pch = 19, col = "orange")

#Garis regresi
abline(lm(jabard$p.miskin16 ~ jabard$AHH2016), col = "red", lwd = 3)

#Menggunakan ggplot
ggplot(jabard) +
  aes(x = jabard$AHH2016, y = jabard$p.miskin16) +
  geom_point(colour = "orange") + 
  theme_minimal()
## Warning: Use of `jabard$AHH2016` is discouraged. Use `AHH2016` instead.
## Warning: Use of `jabard$p.miskin16` is discouraged. Use `p.miskin16` instead.

Plot di atas merupakan scatter plot yang memvisualisasikan antara dua peubah numerik. Berdasarkan analisis plot di atas, hubungan antara ‘AHH2016’ dengan ‘p.miskin16’ mempunyai hubungan linear negatif atau berbanding terbalik karena plot tervisualisasikan dari kiri atas menuju kanan bawah.Artinya, jika jumlah penduduk miskin semakin bertambah, angka harapan hidup akan berkurang.Begitu pula sebaliknya

Matrixplot

dataselect <- select(jabard,p.miskin15,AHH2015, EYS2015, MYS2015, EXP2015, APM.SMA15, APS.USIA15)
plot(dataselect)

Berdasarkan plot matriks di atas, terlihat bahwa angka partisipasi sekolah untuk usia 13-15 tahun (APS.USIA15) berkorelasi positif terhadap persentase penduduk miskin (p.miskin15) di Jawa Barat pada tahun 2015, walapun tidak terlalu signifikan. Sementara, angka harapan hidup (AHH2015), angka melek huruf (EYS2015), rata-rata lama sekolah (MYS2015), pengeluaran per kapita rill (EXP2015), dan angka partisipasi murni SMA (APM.SMA15) berkorelasi negatif terhadap persentase penduduk miskin di Jawa Barat pada tahun 2015. Selain itu, angka melek huruf (EYS2015) berkorelasi kuat dan positif terhadap angka partisipasi murni pada jenjang pendidikan SMA (APM.SMA15).

Correlation Heatmap

corrplot(cor(dt.new), method="number", type = "upper")

corrplot(cor(dt.new), order = 'AOE', type = 'upper', tl.pos = 'd')
corrplot(cor(dt.new), add = TRUE, type = 'lower', method = 'number', order = 'AOE',
         diag = FALSE, tl.pos = 'n', cl.pos = 'n')

Plot di atas merupakan correlation heatmap yang memvisualisasikan korelasi antara pasangan peubah numerik. Korelasi satu dengan yang lain diantara peubah angka harapan hidup (AHH2015), pengeluaran per kapita riil (EXP2015), rata-rata lama sekolah (MYS2015), dan angka melek huruf (EYS2015) pada tahun 2015 memiliki hubungan linier positif atau berbanding lurus, korelasi linier positif tertinggi antara peubah EXP2015 & MYS2015 sebesar 0,77. Namun, masing-masing dari keempat peubah bebas tersebut terhadap peubah jumlah penduduk miskin pada tahun 2015 (j.miskin15) memiliki hubungan linier negatif atau berbanding terbalik dengan korelasi linier negatif tertinggi sebesar -0,62 antara peubah j.miskin15 & EYS2015.

Bubbleplot

plot_ly(jabard, x=~AHH2016, y=~EYS2016,
        text=~KABKOT, type="scatter",
        mode="markers", color=~MYS2016,
        colors="Purples", marker=list(size=~MYS2016, opacity=0.7))

Kedua plot dia atas merupakan bubble plot dengan setiap titik plot/bubble mewakili suatu wilayah. Kedua Bubble plot ini memvisualisasikan hubungan antara angka harapan hidup sebagai sumbu-x, angka melek huruf sebagai sumbu-y, dan rata-rata lama tahun sekolah sebagai warnanya untuk masing-masing tahun 2015 dan 2016. Pada bubble plot berwarna merah untuk tahun 2015 dan bubble plot berwarna hijau. Terlihat pada kedua bubble plot menunjukkan bahwa hubungan antara AHH dan EYS cenderung memiliki hubungan linier positif, meskipun terbilang lemah. Sementara itu, berdasarkan sisi warna (peubah MYS) juga menunjukkan hubungan yang positif antara kedua tahun yang diamati (2015 dan 2016). hal ini menandakan bahwa semakin tinggi angka harapan hidup dan angka melek huruf di suatu wilayah, maka semakin tinggi juga rata-rata lama tahun sekolah di wilayah tersebut.