Kelompok 1
Oktaviani Aisyah Putri (G1401201005)
Faisal Arkan (G1401201077)
Muh. Raziv Zulfikar (G1401201083)
Alifa Shakila (G1401201087)

Pendahuluan

Library

library(readxl)
## Warning: package 'readxl' was built under R version 4.1.2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.1.2
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.1.2
## corrplot 0.92 loaded
library(RColorBrewer)
library(plotly)
## Warning: package 'plotly' was built under R version 4.1.3
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout

Input Data

DataJabar <- read_excel("D://Kuliah//Semester 4//STA1262 Visualisasi Data//Tugas P8//Jabar Data (gabung).xlsx",
                        sheet=1)
head(DataJabar,3)
## # A tibble: 3 x 32
##   PROVNO KABKOTNO KODE2010 PROVINSI   KABKOT   IDSP2010  Long   Lat p.miskin15
##    <dbl>    <dbl>    <dbl> <chr>      <chr>       <dbl> <dbl> <dbl>      <dbl>
## 1     32        1     3201 JAWA BARAT BOGOR        3201  107. -6.56       8.96
## 2     32        2     3202 JAWA BARAT SUKABUMI     3202  107. -7.07       8.96
## 3     32        3     3203 JAWA BARAT CIANJUR      3203  107. -7.13      12.2 
## # ... with 23 more variables: p.miskin16 <dbl>, j.miskin15 <dbl>,
## #   j.miskin16 <dbl>, AHH2015 <dbl>, AHH2016 <dbl>, EYS2015 <dbl>,
## #   EYS2016 <dbl>, MYS2015 <dbl>, MYS2016 <dbl>, EXP2015 <dbl>, EXP2016 <dbl>,
## #   APM.SD15 <dbl>, APM.SMP15 <dbl>, APM.SMA15 <dbl>, APM.PT15 <dbl>,
## #   APK.SD15 <dbl>, APK.SMP15 <dbl>, APK.SMA15 <dbl>, APK.PT15 <dbl>,
## #   APS.USIA15 <dbl>, APS.USIA2 <dbl>, APS.USIA3 <dbl>, APS.USIA4 <dbl>
str(DataJabar)
## tibble [26 x 32] (S3: tbl_df/tbl/data.frame)
##  $ PROVNO    : num [1:26] 32 32 32 32 32 32 32 32 32 32 ...
##  $ KABKOTNO  : num [1:26] 1 2 3 4 5 6 7 8 9 10 ...
##  $ KODE2010  : num [1:26] 3201 3202 3203 3204 3205 ...
##  $ PROVINSI  : chr [1:26] "JAWA BARAT" "JAWA BARAT" "JAWA BARAT" "JAWA BARAT" ...
##  $ KABKOT    : chr [1:26] "BOGOR" "SUKABUMI" "CIANJUR" "BANDUNG" ...
##  $ IDSP2010  : num [1:26] 3201 3202 3203 3204 3205 ...
##  $ Long      : num [1:26] 107 107 107 108 108 ...
##  $ Lat       : num [1:26] -6.56 -7.07 -7.13 -7.1 -7.36 ...
##  $ p.miskin15: num [1:26] 8.96 8.96 12.21 8 12.81 ...
##  $ p.miskin16: num [1:26] 8.83 8.13 11.62 7.61 11.64 ...
##  $ j.miskin15: num [1:26] 487 218 274 281 326 ...
##  $ j.miskin16: num [1:26] 491 199 261 273 299 ...
##  $ AHH2015   : num [1:26] 70.6 70 69.3 73.1 70.7 ...
##  $ AHH2016   : num [1:26] 70.7 70.1 69.4 73.1 70.8 ...
##  $ EYS2015   : num [1:26] 11.8 12.1 11.8 12.1 11.6 ...
##  $ EYS2016   : num [1:26] 12.1 12.2 11.9 12.4 11.7 ...
##  $ MYS2015   : num [1:26] 7.75 6.51 6.54 8.41 6.84 6.88 7.45 7.2 6.32 6.8 ...
##  $ MYS2016   : num [1:26] 7.83 6.74 6.61 8.5 6.88 6.94 7.55 7.34 6.41 6.89 ...
##  $ EXP2015   : num [1:26] 9368 7849 6877 9375 6875 ...
##  $ EXP2016   : num [1:26] 9537 8077 7074 9580 7079 ...
##  $ APM.SD15  : num [1:26] 96.3 99.7 99.9 98 98.1 ...
##  $ APM.SMP15 : num [1:26] 73 75.8 78.4 82.1 75.3 ...
##  $ APM.SMA15 : num [1:26] 55.1 43.9 37.2 55.5 44.6 ...
##  $ APM.PT15  : num [1:26] 11.84 9.92 3.86 17.04 5.71 ...
##  $ APK.SD15  : num [1:26] 109 113 109 110 112 ...
##  $ APK.SMP15 : num [1:26] 84.6 83 86 89.6 82.2 ...
##  $ APK.SMA15 : num [1:26] 67.9 54.9 43.9 66.2 51.5 ...
##  $ APK.PT15  : num [1:26] 12.64 10.45 4.12 19.74 6.17 ...
##  $ APS.USIA15: num [1:26] 99 99.7 100 99.9 98.8 ...
##  $ APS.USIA2 : num [1:26] 89.2 93.3 94 95 87.1 ...
##  $ APS.USIA3 : num [1:26] 62.2 53.7 46.2 60.6 51.7 ...
##  $ APS.USIA4 : num [1:26] 14.64 14.87 5.85 19.99 8.09 ...

Filter

data1 <- DataJabar %>%
  select(-PROVNO, -KABKOTNO,-KODE2010,-PROVINSI,-KABKOT)
dataselect <- select(DataJabar, p.miskin15, p.miskin16, AHH2015, 
                     AHH2016, EYS2015,EYS2016, MYS2015, MYS2016, 
                     EXP2015, EXP2016)

Visualisasi Data

Corrplot

M <-cor(dataselect)
corrplot(M, order = 'AOE', type = 'upper', tl.pos = 'd')
corrplot(M, add = TRUE, type = 'lower', method = 'number', order = 'AOE',
         diag = FALSE, tl.pos = 'n', cl.pos = 'n')

Interpretasi : Plot di atas menunjukkan korelasi antar peubah. Salah satu korelasi yang cukup tinggi ditunjukkan oleh hubungan antara angka melek huruf (EYS 2016) dengan rata-rata lama sekolah (MYS 2016) tahun 2016 yaitu sebesar 0,79.

ScatterPlot

ggplot(DataJabar, aes(x = MYS2016, y = EYS2016)) + 
  geom_point(color= "#cc7952") + 
  geom_smooth(method = "lm", color = "darkblue") +
  theme_minimal() + 
  labs(x = "Rata-rata Lama Sekolah (Tahun)", y = "Angka Melek Huruf (%)",
       title = "Scatterplot", 
       subtitle = "Hubungan antara peubah EYS2016 dan MYS2016")
## `geom_smooth()` using formula 'y ~ x'

Interpretasi : Scatter plot diatas menunjukkan hubungan positif antara peubah angka melek huruf (EYS2016) dengan peubah rata-rata lama sekolah tahun 2016 (MYS2016). Artinya, rata-rata lama sekolah akan meningkat seiring dengan meningkatnya angka melek huruf khususnya pada tahun 2016 ini. Plot juga menunjukkan adanya hubungan yang cukup erat antara kedua peubah.

Bubble Chart

colors <- c('#173f5f','#20639b','#3caea3','#f6d55c','#ed553b')
plot_ly(DataJabar, x = ~MYS2016, y = ~EYS2016, text = ~KABKOT, 
               type ="scatter", color=~j.miskin16, colors=colors, 
               mode = 'markers', size=~AHH2016, sizes = c(10,30),
               marker = list(opacity =0.9, sizemode="diameter")) %>% 
  layout(title = 'Bubble Chart antara peubah EYS2016 dan MYS2016',
                      xaxis = list(title="Rata-rata Lama Sekolah (Tahun)", 
                                   showgrid = FALSE),
                      yaxis = list(title="Angka Melek Huruf (%)", 
                                   showgrid = FALSE))
## Warning: `line.width` does not currently support multiple values.

Interpretasi : Bubble chart diatas menunjukkan hubungan positif antara angka melek huruf (EYS2016) dengan rata-rata lama sekolah tahun 2016 (MYS2016). Artinya, lamanya waktu tempuh pendidikan akan turut meningkatkan angka melek huruf khususnya pada tahun 2016 ini.

Selain itu, chart di atas juga menunjukkan data tiap-tiap kota dan kabupaten. Terlihat bahwa Kota Bogor memiliki jumlah penduduk miskin terbanyak pada tahun 2016. Sedangkan, Kota Banjar memiliki jumlah penduduk miskin tersedikit apabila dilihat berdasarkan indikator kepekatan warna.

Ukuran bubble kota Tasikmalaya sangat kecil, menandakan bahwa kota tersebut memiliki angka harapan hidup terendah pada tahun 2016. Sedangkan, ukuran bubble paling besar dimiliki oleh Kota Bekasi karena memiliki angka harapan hidup tertinggi pada tahun 2016.

Thank You