library(readxl)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.4.4 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.0
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(ggmosaic)
library(treemap)
library(treemapify)
library(ggridges)
library(GGally)
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
##
## Attaching package: 'GGally'
##
## The following object is masked from 'package:ggmosaic':
##
## happy
library(plotly)
##
## Attaching package: 'plotly'
##
## The following object is masked from 'package:ggplot2':
##
## last_plot
##
## The following object is masked from 'package:stats':
##
## filter
##
## The following object is masked from 'package:graphics':
##
## layout
library(dplyr)
data<- read_xlsx("C:\\Users\\MyBook Hype\\Downloads\\data susenas Jawa Barat 2023.xlsx")
ggplot(data)+
geom_density(aes(x=R407,fill= "Usia" ),color="white", alpha=0.4)+
labs(title="Density Plot Sebaran Usia Penduduk Jawa Barat Tahun 2023")+
xlab("Usia (tahun)")+
ylab("Frekuensi")+
xlim(1, 100)+
scale_x_continuous(breaks = seq(0, 100, by = 5))
## Scale for x is already present.
## Adding another scale for x, which will replace the existing scale.
Berdasarkan hasil analisis melalui Density Plot diatas dapat diketahui bahwa mayoritas penduduk Jawa Barat dalam sampel tahun 2023 memiliki usia sekitar 10 tahun dan sekitar 40-45 tahun. Density Plot ini memiliki distribusi bimodal karena memiliki dua kelompok utama atau dua puncak dalam sebarannya.
data <- data[!(data$R709 == 0), ]
ggplot(data, aes(x = "", y = R709)) +
geom_violin(fill = "pink", alpha = 0.5) +
geom_boxplot(width = 0.1, color = "deeppink", fill = "white", outlier.shape = NA) +
labs(title = "Violin Plot dan Boxplot: Distribusi Jumlah Keseluruhan Jam Kerja dalam Seminggu",
x = NULL,
y = "Jam (per minggu)") +
coord_flip() +
theme_minimal()
Dari hasil analisis melalui Violin dan Boxplot ini, kita mendapatkan beberapa informasi mengenai distribusinya dan statistik 5 serangkai, yaitu nilai maksimum, kuartil bawah, median, kuartil atas, dan nilai maksimum. Diketahui bahwa median waktu yang dihabiskan oleh mayoritas penduduk Jawa Barat dalam sampel untuk melakukan keseluruhan pekerjaannya adalah sekitar 48 jam per minggu
data %>%
count(R614) %>%
slice_max(n = 4, order_by = n) %>%
ggplot() +
geom_col(aes(x = fct_reorder(as.factor(R614), n), y = n), fill = "pink", width = 0.7) +
geom_text(aes(x = fct_reorder(as.factor(R614), n), y = n, label = n),
position = position_stack(vjust = 0.5), color = "black", size = 3) +
scale_y_continuous(expand = c(0, 0)) +
coord_flip() +
ggtitle("Top 4 Ijazah/STTB Tertinggi yang Dimiliki oleh Masyarakat Jawa Barat") +
xlab("Ijazah/STTB") +
ylab("") +
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 15))
Dari hasil analisis menggunakan bar chart di atas dapat diketahui bahwa dalam sampel penduduk Jawa Barat, jumlah penduduk dengan tingkat ijazah tertinggi adalah sebagai berikut: SD sebanyak 12.451 orang, SMA sebanyak 8.529 orang, SMP sebanyak 6.666 orang, dan S1 sebanyak 2.849 orang. Meskipun jumlah individu dengan tingkat ijazah tertinggi SD paling tinggi, kita tidak bisa langsung menyimpulkan bahwa masih banyak penduduk Jawa Barat yang tidak melanjutkan pendidikannya setelah lulus dari SD. Analisis lebih lanjut diperlukan untuk memahami faktor-faktor yang memengaruhi pilihan pendidikan mereka, termasuk faktor ekonomi dan faktor lainnya.
data<- read_xlsx("C:\\Users\\MyBook Hype\\Downloads\\data susenas Jawa Barat 2023.xlsx")
data_stacked <- data %>%
filter(R620 %in% c("SD", "MI", "SMP", "SMA", "SMK","D1/D2","D3","D4", "S1")) %>%
filter(R617%in% c("375000","400000","450000", "500000", "750000","900000", "950000","1000000", "4200000"))%>%
filter(R611 %in% c("Negeri", "Swasta"))%>%
filter(R615 %in% c("1"))
ggplot(data_stacked, aes(x = as.factor(R611), y = R617, fill = as.factor(R620))) +
geom_bar(stat = "identity") +
labs(fill = "Jenjang Pendidikan") +
ggtitle("Jumlah Uang PIP per Jenjang Pendidikan dan Kategori Sekolah") +
xlab("Kategori Sekolah") +
ylab("Jumlah Uang PIP") +
scale_fill_brewer(palette = "RdYlBu" ) +
theme_grey()
Berdasarkan hasil analisis stacked bar chart, disimpulkan bahwa alokasi jumlah uang PIP untuk sekolah negeri di Jawa Barat dalam sampel lebih besar daripada untuk sekolah swasta, yang terlihat dari tumpukan yang lebih tinggi pada bagian sekolah negeri dibandingkan sekolah swasta. Untuk sekolah negeri, jumlah uang PIP terbanyak diberikan kepada penerima jenjang SD, diikuti oleh jenjang SMP, S1, dan SMA, seperti yang terlihat dari tinggi tumpukan masing-masing jenjang. Sedangkan, untuk sekolah swasta, penerimaan uang PIP terbanyak adalah untuk jenjang S1, yang terlihat dari tumpukan S1 yang lebih tinggi dibandingkan dengan jenjang lainnya.
data$R812 <- as.numeric(data$R812)
data_pie <- data %>%
mutate(R812 = ifelse(R812 == 1, "Ya", "Tidak")) %>%
count(R812) %>%
mutate(percentage = prop.table(n) * 100)
ggplot(data_pie, aes(x = "", y = percentage , fill = R812)) +
geom_bar(stat = "identity", width = 1) +
coord_polar("y", start = 0) +
scale_fill_brewer(palette = "Set3") +
theme_void() +
theme(legend.position = "right") +
labs(title = "Komposisi Pengalaman Penduduk Jawa Barat Mempelajari TIK", fill = "kategori") +
geom_text(aes(label = paste0(round(percentage), "%")), position = position_stack(vjust = 0.5))
Berdasarkan hasil analisis melalui pie chart di atas, diperoleh informasi bahwa sebesar 84% dari penduduk Jawa Barat dalam sampel tahun 2023 tidak memiliki pengalaman dalam mempelajari keterampilan Teknologi Informasi dan Komunikasi (TIK). Hal ini mengindikasikan bahwa mayoritas dari sampel tersebut belum memiliki pengalaman atau akses terhadap pelatihan atau pendidikan terkait TIK. Interpretasi ini memberikan gambaran yang jelas tentang tingkat aksesibilitas TIK di daerah tersebut dan menyoroti perlunya upaya untuk meningkatkan kesadaran serta akses terhadap pelatihan TIK agar penduduk dapat lebih siap menghadapi perkembangan teknologi informasi dan komunikasi.
data$R801<- as.numeric(data$R801)
data <- data[!(data$R801 == 0), ]
data <- data[!(data$R409 == 0), ]
treemap(data,
index=c("R102", "R409"),
vSize="R801",
algorithm="pivotSize",
draw =TRUE,
title="Treemap: Penggunaan Telepon Seluler berdasarkan Wilayah dan Usia",
fontsize.title=14,
fontsize.labels=12,
fontcolor.labels="white")
Berdasarkan hasil analisi melalui treemap, terlihat bahwa ada pola penggunaan telepon seluler yang bervariasi di Jawa Barat. Di Bandung, mayoritas penduduk yang menikah pada usia 20 tahun cenderung menggunakan telepon seluler sebagai alat komunikasi sehari-hari. Secara khusus, terlihat bahwa mayoritas penduduk yang sudah menikah pada usia tersebut cenderung menggunakan telepon seluler sebagai alat komunikasi sehari-hari. Variasi ini dipengaruhi oleh faktor-faktor seperti infrastruktur dan demografi. Diperlukan analisis lebih lanjut untuk merancang kebijakan yang sesuai dengan kebutuhan masyarakat di setiap daerah.