Visualisasi Data Kategorik dan Numerik

Data yang Digunakan

Data yang digunakan adalah data Indeks Kualitas Air (IKA) Berdasarkan Provinsi Tahun 2020, 2021, 2022, 2023, dan 2024. Data tersebut bersumber dari Publikasi Badan Pusat Statistik Indonesia yang berjudul Statistik indonesia 2026. Alasan memilih data Indeks Kualitas Air (IKA) karena data ini dapat menggambarkan kondisi kualitas air di suatu wilayah secara jelas. Nilai indeks yang berbentuk angka memudahkan proses analisis dan perbandingan antar waktu maupun lokasi. Selain itu, kualitas air memiliki peran penting bagi lingkungan, kesehatan masyarakat, dan kelestarian ekosistem. Oleh karena itu, data Indeks Kualitas Air (IKA) dinilai relevan untuk digunakan serta mudah divisualisasikan dalam bentuk grafik. Berikut adalah link sumbernya: Indeks Kualitas Air (IKA)

setwd("D:/Semester 4/Eksplorasi dan Visualisasi Data/Tugas")

library(readxl)

ika <- read_xlsx("Indeks Kualitas Air - Kelompok 5 (4A Statistika).xlsx", sheet = "Sheet3")
DT::datatable(ika)

Visualisasi Data Kategorik

Bar Chart

Bar chart merupakan alat bantu visual yang digunakan untuk menampilkan persebaran data dalam bentuk batang atau balok. Berikut adalah Kode R untuk membut bar chart menggunakan data Indeks Kualitas Air (IKA) Berdasarkan Provinsi Tahun 2024:

# Input Data
library(ggplot2)
library(readxl)
library(dplyr)

df <- read_excel("Indeks Kualitas Air - Kelompok 5 (4A Statistika).xlsx", sheet = "Sheet1", skip = 1)

# Bar Chart
ggplot(data = df, mapping = aes(x = reorder(`Provinsi`, -`Indeks Kualitas Air`), 
                                y = `Indeks Kualitas Air`, 
                                fill = `Pulau`)) + 
  geom_bar(stat = "identity") +
  labs(
    title = "Indeks Kualitas Air Berdasarkan Provinsi Tahun 2024",
    x = "Provinsi", 
    fill = "Pulau",
    y = "Indeks Kualitas Air"
  ) +
  scale_fill_brewer(palette = "Set3") + 
  theme_light() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Berdasarkan bar chart yang ditampilkan, Indeks Kualitas Air (IKA) Berdasarkan Provinsi Tahun 2024 memperlihatkan perbedaan yang cukup besar antar wilayah di Indonesia. Sulawesi Tenggara terlihat memiliki nilai indeks tertinggi dengan skor yang mendekati 70. Secara visual, provinsi-provinsi di wilayah Sulawesi, Sumatera, dan Papua cenderung berada pada peringkat atas, yang menunjukkan kualitas air yang relatif lebih baik dibandingkan daerah lain. Sebaliknya, beberapa provinsi di Pulau Jawa seperti Jawa Barat, DI Yogyakarta, dan DKI Jakarta berada pada peringkat terendah dengan nilai indeks sekitar 40. Kondisi ini kemungkinan dipengaruhi oleh tingginya aktivitas industri serta kepadatan penduduk di wilayah tersebut.

Needle Chart

Needle Chart merupakan jenis grafik yang digunakan untuk menunjukkan nilai suatu data dengan menggunakan jarum atau penunjuk pada sebuah skala tertentu. Berikut adalah Kode R untuk membut needle chart menggunakan data Indeks Kualitas Air (IKA) Berdasarkan Provinsi Tahun 2024:

# Needle Chart

ggplot(data = df, mapping = aes(x = reorder(`Provinsi`, `Indeks Kualitas Air`), 
                                y = `Indeks Kualitas Air`)) + 
  geom_segment(aes(x = reorder(`Provinsi`, `Indeks Kualitas Air`), 
                   xend = reorder(`Provinsi`, `Indeks Kualitas Air`), 
                   y = 0, 
                   yend = `Indeks Kualitas Air`), 
               color = "skyblue", size = 1) + 
  geom_point(color = "navyblue", size = 3) + 
  geom_text(aes(label = `Indeks Kualitas Air`), hjust = -0.3, size = 3) + 
  coord_flip() + 
  labs(
    title = "Indeks Kualitas Air Berdasarkan Provinsi Tahun 2024",
    x = "Provinsi", 
    y = "Indeks Kualitas Air"
  ) +
  theme_light()

Berdasarkan needle chart Indeks Kualitas Air (IKA) Berdasarkan Provinsi Tahun 2024, terlihat adanya perbedaan kualitas lingkungan air yang cukup mencolok antar wilayah di Indonesia. Sulawesi Tenggara menempati posisi tertinggi dengan nilai indeks sebesar 65,32. Secara umum, provinsi-provinsi di wilayah Sulawesi, Papua, dan Sumatera berada pada peringkat atas dengan nilai yang relatif stabil di atas 55, yang menunjukkan kondisi kualitas air yang lebih baik dan terjaga. Sebaliknya, grafik tersebut juga menunjukkan tantangan besar di wilayah Pulau Jawa, di mana DKI Jakarta (41,22), DI Yogyakarta (42,94), dan Jawa Barat (46,86) berada pada tiga posisi terbawah secara nasional. Rendahnya nilai indeks di wilayah perkotaan tersebut kemungkinan dipengaruhi oleh tingginya aktivitas industri serta kepadatan penduduk yang berdampak pada kualitas sumber daya air permukaan.

Pie Chart

Pie chart merupakan jenis grafik yang menampilkan perbandingan atau proporsi data dalam bentuk lingkaran yang terbagi menjadi beberapa bagian sesuai dengan persentase tiap kategori. Berikut adalah Kode R untuk membut pie chart menggunakan data Indeks Kualitas Air (IKA) Berdasarkan Pulau Tahun 2024:

# Pie Chart

# 1. Menyiapkan data
df_pie <- df %>%
  group_by(Pulau) %>%
  summarise(avg_index = mean(`Indeks Kualitas Air`)) %>%
  mutate(prop = round(avg_index * 100 / sum(avg_index), 1))

# 2. Menghitung posisi label teks (kumulatif)
df_pie <- df_pie %>%
  arrange(desc(Pulau)) %>%
  mutate(lab.ypos = cumsum(prop) - 0.5 * prop)

# 3. Membuat Pie Chart
ggplot(df_pie, aes(x = "", y = prop, fill = Pulau)) +
  geom_bar(width = 1, stat = "identity", color = "white") +
  geom_text(aes(y = lab.ypos, label = paste0(prop, "%")), color = "white", size = 5) +
  coord_polar("y", start = 0) +
  scale_fill_brewer(palette = "Set3") + 
  theme_void() + 
  labs(title = "Proporsi Rata-Rata Indeks Kualitas Air Berdasarkan Pulau Tahun 2024")

Berdasarkan pie chart yang ditampilkan, Proporsi Rata-Rata Indeks Kualitas Air (IKA) Berdasaran Pulau Tahun 2024 memperlihatkan distribusi yang cukup merata meskipun masih terdapat perbedaan yang cukup jelas. Pulau Sulawesi menempati posisi tertinggi dengan kontribusi sebesar 15,3%. Data ini juga menunjukkan bahwa wilayah Papua (14,9%), Sumatera (14,7%), dan Maluku (14,7%) memiliki kualitas air yang cukup baik dan relatif lebih tinggi dibandingkan beberapa pulau lainnya. Sebaliknya, Pulau Jawa memiliki proporsi terendah yaitu sekitar 12,5%, yang menunjukkan bahwa kualitas air di wilayah tersebut masih berada di bawah wilayah Indonesia bagian tengah dan timur.

Peta Spasial

Peta spasial adalah bentuk visualisasi data yang digunakan untuk menunjukkan penyebaran suatu variabel berdasarkan wilayah geografis. Dalam penelitian ini, peta spasial dimanfaatkan untuk menggambarkan Indeks Kualitas Air (IKA) pada setiap provinsi di Indonesia. Proses pemetaan dilakukan menggunakan bahasa pemrograman R, dengan memanfaatkan packages ggplot2, sf, dan dplyr untuk menggabungkan data atribut Indeks Kualitas Air dengan data shapefile wilayah provinsi di Indonesia. Berikut merupakan kode R yang digunakan untuk membuat peta spasial Indeks Kualitas Air diIndonesia berdasarkan Provinsi Tahun 2024.

# Peta Spasial
# IMPORT DATA
library(readxl)
library(sf)
library(dplyr)
library(ggplot2)

# Import Data Excel
data_indeks_kualitas_air=read_xlsx("Indeks Kualitas Air - Kelompok 5 (4A Statistika).xlsx", sheet = "Sheet2")
head(data_indeks_kualitas_air)
## # A tibble: 6 × 4
##   Pulau    Provinsi         `Kode Provinsi` `Indeks Kualitas Air`
##   <chr>    <chr>                      <dbl>                 <dbl>
## 1 Sumatera Aceh                          11                  63.2
## 2 Sumatera Sumatera Utara                12                  61.1
## 3 Sumatera Sumatera Barat                13                  53.2
## 4 Sumatera Riau                          14                  52.7
## 5 Sumatera Jambi                         15                  55.6
## 6 Sumatera Sumatera Selatan              16                  59.5
# IMPORT PETA SHP
shp_provinsi=read_sf("SHP GADM IDN/gadm41_IDN_1.shp")

# Menggabungkan Data ke file SHP
gabung_provinsi=left_join(shp_provinsi,data_indeks_kualitas_air,by= c("NAME_1" = "Provinsi"))
head(gabung_provinsi)
## Simple feature collection with 6 features and 14 fields
## Geometry type: MULTIPOLYGON
## Dimension:     XY
## Bounding box:  xmin: 95.00971 ymin: -8.849262 xmax: 123.5523 ymax: 6.076941
## Geodetic CRS:  WGS 84
## # A tibble: 6 × 15
##   GID_1   GID_0 COUNTRY NAME_1 VARNAME_1 NL_NAME_1 TYPE_1 ENGTYPE_1 CC_1  HASC_1
##   <chr>   <chr> <chr>   <chr>  <chr>     <chr>     <chr>  <chr>     <chr> <chr> 
## 1 IDN.1_1 IDN   Indone… Aceh   NA        NA        Propi… Province  11    ID.AC 
## 2 IDN.2_1 IDN   Indone… Bali   NA        NA        Propi… Province  51    ID.BA 
## 3 IDN.3_1 IDN   Indone… Bangk… NA        NA        Propi… Province  19    ID.BB 
## 4 IDN.4_1 IDN   Indone… Banten NA        NA        Propi… Province  36    ID.BT 
## 5 IDN.5_1 IDN   Indone… Bengk… NA        NA        Propi… Province  17    ID.BE 
## 6 IDN.6_1 IDN   Indone… Goron… NA        NA        Propi… Province  75    ID.GO 
## # ℹ 5 more variables: ISO_1 <chr>, geometry <MULTIPOLYGON [°]>, Pulau <chr>,
## #   `Kode Provinsi` <dbl>, `Indeks Kualitas Air` <dbl>
# Pemetaan Indeks Kualitas Air
plot_indeks_kualitas_air = ggplot(data=gabung_provinsi) +
  geom_sf(aes(fill = `Indeks Kualitas Air`)) +
  scale_fill_distiller("Indeks Kualitas Air", palette = "YlGnBu")

plot_indeks_kualitas_air

Berdasarkan peta sebaran IKA tahun 2024 menunjukkan adanya pola geografis yang cukup jelas terkait kualitas air di Indonesia. Pulau Jawa didominasi oleh warna yang lebih gelap, yang merepresentasikan nilai IKA rendah. Sebaliknya, wilayah Kalimantan, Sulawesi, Maluku, dan Papua lebih banyak ditampilkan dengan warna hijau hingga biru yang menunjukkan nilai IKA menengah sampai tinggi, sehingga mencerminkan kondisi kualitas air yang relatif baik dan stabil. Pulau Sumatera memperlihatkan variasi warna yang cukup beragam, mulai dari biru muda hingga kuning, yang menunjukkan adanya perbedaan kualitas air antar provinsi dari rendah hingga tinggi. Selain itu, peta juga mengindikasikan bahwa wilayah pedalaman serta kawasan Indonesia bagian timur cenderung memiliki kualitas air yang lebih baik, sementara daerah dengan kepadatan penduduk tinggi di bagian barat Indonesia, khususnya Pulau Jawa, menunjukkan nilai IKA yang lebih rendah.

Visualisasi Data Numerik

Histogram

Histogram merupakan salah satu bentuk grafik yang digunakan untuk menampilkan distribusi frekuensi dari data numerik. Grafik ini memperlihatkan bagaimana data tersebar ke dalam beberapa interval nilai sehingga dapat memberikan gambaran mengenai pola penyebaran data tersebut. Dalam penelitian ini, histogram digunakan untuk menggambarkan distribusi Indeks Kualitas Air (IKA) pada berbagai provinsi di Indonesia. Berikut merupakan kode R yang digunakan untuk membuat histogram berdasarkan data Indeks Kualitas Air di Indonesia berdasarkan Provinsi Tahun 2024.

# Histogram
library(scales)
ggplot(data = data_indeks_kualitas_air, mapping = aes(x = `Indeks Kualitas Air`)) + 
  geom_histogram(bins = 30, color = "brown", fill = "beige") + 
  scale_x_continuous(labels = comma) + 
  scale_y_continuous(labels = comma) + 
  labs(x = "Indeks Kualitas Air", 
       y = "Frekuensi")

Berdasarkan histogram frekuensi IKA tahun 2024 menunjukkan bahwa sebagian besar lokasi di Indonesia berada pada kategori kualitas air menengah, terutama pada kisaran nilai IKA 52–57. Terdapat beberapa lokasi dengan nilai ekstrem, yaitu IKA di bawah 45 yang banyak ditemukan di Pulau Jawa dan menunjukkan kualitas air yang kurang baik. Di sisi lain, terdapat pula wilayah dengan nilai IKA di atas 60, yang umumnya ditemukan di Sumatera, Papua, dan Maluku, menandakan kualitas air yang sangat baik. Pola distribusi histogram tampak sedikit condong ke kiri, yang menunjukkan bahwa mayoritas wilayah memiliki nilai IKA pada tingkat menengah dibandingkan dengan nilai yang sangat rendah maupun sangat tinggi. Hal ini mengindikasikan bahwa secara umum kualitas air di Indonesia cukup stabil, meskipun masih terdapat beberapa wilayah dengan kondisi yang sangat rendah maupun sangat tinggi.

Density

Density plot adalah jenis grafik yang digunakan untuk menampilkan distribusi data numerik dalam bentuk kurva kepadatan. Grafik ini menunjukkan pola penyebaran data secara lebih halus dibandingkan histogram sehingga dapat menggambarkan kecenderungan nilai yang paling sering muncul. Dalam penelitian ini, density plot digunakan untuk memvisualisasikan distribusi Indeks Kualitas Air (IKA) di Indonesia berdasarkan kelompok pulau pada tahun 2024. Berikut merupakan kode R yang digunakan untuk membuat density plot berdasarkan data Indeks Kualitas Air di Indonesia menurut pulau pada tahun 2024.

# Density

# Density Per Kategori (Pulau)
ggplot(data = data_indeks_kualitas_air, mapping = aes(x = `Indeks Kualitas Air`, fill = Pulau, color = Pulau)) + 
  geom_density(alpha = 0.7) + 
  scale_x_continuous(labels = comma) + 
  scale_y_continuous(labels = comma) + 
  labs(x = "Indeks Kualitas Air")

Berdasarkan density plot Indeks Kualitas Air (IKA) tahun 2024, terlihat adanya perbedaan distribusi kualitas air antar pulau di Indonesia. Pulau Kalimantan menunjukkan puncak distribusi tertinggi pada kisaran IKA 53–56, yang mengindikasikan bahwa sebagian besar wilayah memiliki kualitas air pada tingkat sedang hingga baik. Pulau Sulawesi dan Maluku juga memperlihatkan distribusi IKA yang relatif tinggi, berada pada kisaran sekitar 55–60, sehingga mencerminkan kondisi kualitas air yang baik dan cukup konsisten. Sementara itu, Papua serta wilayah Nusa Tenggara dan Bali memiliki distribusi yang lebih sempit, berkisar antara 52–60, yang menandakan kondisi kualitas air yang relatif stabil. Berbeda dengan wilayah lainnya, Pulau Jawa menunjukkan nilai distribusi paling rendah dengan puncak pada kisaran 42–45, yang menunjukkan bahwa kualitas air di wilayah ini masih berada di bawah rata-rata dibandingkan pulau lain. Pulau Sumatera menampilkan variasi distribusi yang lebih luas, sekitar 48–62, yang menandakan adanya wilayah dengan kualitas air rendah hingga sangat baik.

Boxplot

Boxplot chart adalah jenis grafik statistik yang digunakan untuk memvisualisasikan distribusi data numerik serta mendeteksi adanya pencilan (outlier). Grafik ini menampilkan nilai minimum, kuartil pertama (Q1), median, kuartil ketiga (Q3), dan nilai maksimum dari data. Berikut adalah kode R untuk membuat boxplot menggunakan data Indeks Kualitas Air (IKA) berdasarkan pulau di Indonesia pada tahun 2024.

# Boxplot

ggplot(data = data_indeks_kualitas_air, mapping = aes(x = `Indeks Kualitas Air`, y = Pulau, fill = Pulau)) + 
  geom_boxplot() + 
  theme(legend.position = "none")

Boxplot Indeks Kualitas Air (IKA) berdasarkan pulau di Indonesia tahun 2024, menunjukkan bahwa terdapat perbedaan distribusi kualitas air antar wilayah. Pulau Sulawesi dan Papua menunjukkan nilai median IKA yang relatif lebih tinggi dibandingkan beberapa pulau lainnya, yang mengindikasikan kondisi kualitas air yang lebih baik. Pulau Sumatera serta Nusa Tenggara dan Bali memiliki sebaran nilai yang cukup lebar yang menunjukkan adanya variasi kualitas air antar provinsi di wilayah tersebut. Sebaliknya, Pulau Jawa memiliki nilai median IKA yang lebih rendah dibandingkan pulau lainnya, sehingga menunjukkan bahwa kualitas air di wilayah tersebut relatif lebih rendah. Secara keseluruhan, grafik ini menggambarkan adanya variasi kondisi kualitas air antar pulau di Indonesia pada tahun 2024.

Violin Plot

Violin chart adalah jenis grafik statistik yang digunakan untuk memvisualisasikan distribusi data numerik pada beberapa kelompok kategori serta menunjukkan kepadatan (density) data. Grafik ini merupakan kombinasi antara boxplot dan density plot, sehingga tidak hanya menampilkan nilai median dan penyebaran data, tetapi juga bentuk distribusi data pada setiap kategori. Semakin lebar bentuk violin pada suatu bagian, maka semakin banyak data yang terkonsentrasi pada nilai tersebut. Berikut adalah kode R untuk membuat violin chart menggunakan data Indeks Kualitas Air (IKA) pada tahun 2024.

# VIOLIN
library(scales)
ggplot(data = data_indeks_kualitas_air, mapping = aes(x = `Indeks Kualitas Air`, y = "all")) +
  geom_violin(fill="#8ecae6",alpha=0.5) +
  geom_boxplot(fill="#023047",width=0.1) +
  scale_x_continuous(labels = comma) 

Grafik violin Indeks Kualitas Air menunjukkan distribusi nilai Indeks Kualitas Air secara keseluruhan. Bentuk violin yang lebih lebar pada kisaran nilai sekitar 54–58 menunjukkan bahwa sebagian besar data terkonsentrasi pada rentang tersebut. Nilai median berada di sekitar 56, yang menunjukkan bahwa nilai tengah Indeks Kualitas Air berada pada tingkat menengah. Selain itu, terdapat beberapa titik pada bagian kiri yang menunjukkan adanya nilai yang relatif lebih rendah dibandingkan sebagian besar data lainnya. Secara keseluruhan, grafik ini menunjukkan bahwa distribusi nilai Indeks Kualitas Air cenderung terkonsentrasi pada kisaran 50–60, dengan variasi data yang tidak terlalu besar meskipun terdapat beberapa nilai yang lebih rendah.

QQ-Plot

Q–Q Plot (Quantile–Quantile Plot) merupakan grafik yang digunakan untuk menilai apakah suatu data mengikuti distribusi tertentu, umumnya distribusi normal. Grafik ini dibuat dengan membandingkan kuantil dari data sampel dengan kuantil dari distribusi normal teoritis. Apabila titik-titik data berada di sekitar garis diagonal, maka data cenderung mengikuti distribusi normal. Sebaliknya, jika titik-titik menyimpang jauh dari garis tersebut, maka data diduga tidak berdistribusi normal. Kode berikut digunakan untuk membuat Q–Q Plot dari variabel Indeks Kualitas Air dengan menggunakan paket ggplot2 pada R.

# QQ-Plot

ggplot(data = data_indeks_kualitas_air, aes(sample = `Indeks Kualitas Air`)) +
  stat_qq(col="blue", cex=0.9) +
  stat_qq_line(col="red", lwd=1)

Grafik Q–Q Plot dari data Indeks Kualitas Air menunjukkan bahwa sebagian besar titik data berada di sekitar garis diagonal merah. Hal ini menunjukkan bahwa distribusi nilai Indeks Kualitas Air cenderung mengikuti distribusi normal. Terdapat beberapa titik pada bagian ujung, terutama di bagian bawah, yang sedikit menyimpang dari garis diagonal. Penyimpangan tersebut menunjukkan adanya beberapa nilai Indeks Kualitas Air yang relatif lebih rendah dibandingkan sebagian besar data lainnya. Meskipun demikian, secara keseluruhan pola titik masih mengikuti garis diagonal sehingga distribusi data masih mendekati distribusi normal dan asumsi normalitas masih dapat diterima.

Scatter Plot

Scatter plot adalah jenis grafik yang digunakan untuk menampilkan hubungan atau persebaran data antara dua variabel numerik dalam bentuk titik-titik pada bidang koordinat. Setiap titik pada grafik merepresentasikan satu observasi data yang memiliki nilai pada sumbu X dan sumbu Y. Scatter plot umumnya digunakan untuk melihat pola penyebaran data, hubungan antara dua variabel, mengetahui kecenderungan data, serta mengidentifikasi adanya korelasi atau tidak. Misalkan ingin mengetahui persebaran nilai Indeks Kualitas Air (IKA) berdasarkan provinsi di Indonesia pada tahun 2024, kode R yang digunakan untuk membuat scatter plot adalah sebagai berikut:

# Sactter Plot

ggplot(data = ika, aes(x = `Kode Provinsi`, y = `2024`)) +
  geom_point(size = 3, color = "blue") +
  geom_text(aes(label = Provinsi), vjust = -0.7, size = 3) +
  labs(title = "Indeks Kualitas Air di Indonesia Tahun 2024",
       x = "Kode Provinsi",
       y = "Indeks Kualitas Air")

Pada grafik tersebut, setiap titik merepresentasikan satu provinsi dengan sumbu X sebagai kode provinsi dan sumbu Y sebagai nilai Indeks Kualitas Air (IKA). Dari grafik terlihat bahwa sebagian besar provinsi memiliki nilai IKA berkisaran antara 50 hingga 60. Selain itu terlihat bahwa Provinsi Sulawesi Tenggara memiliki nilai indeks tertinggi, sedangkan provinsi DKI Jakarta memiliki nilai indeks terendah. Grafik ini juga memperlihatkan kecenderungan dimana provinsi di wilayah Indonesia bagian timur memiliki nilai indeks kualitas air yang relatif lebih tinggi dibandingkan dengan beberapa provinsi di Pulau Jawa.

Line Chart

Line chart adalah jenis grafik yang digunakan untuk menampilkan perubahan atau perkembangan suatu data dari waktu ke waktu. Grafik ini menggunakan garis yang menghubungkan titik-titik data pada setiap periode tertentu sehingga memudahkan dalam melihat tren atau pola kenaikan dan penurunan nilai. Line chart biasanya digunakan untuk menganalisis data runtut waktu (time series) karena dapat menunjukkan bagaimana suatu variabel berubah secara berkelanjutan dari satu periode ke periode lainnya. Misalkan ingin mengetahui perubahan IKA di Pulau Jawa dari tahun 2020 hingga 2024, kode R yang digunakan untuk membuat line chart adalah sebagai berikut:

library(tidyr)

# Filter Pulau Jawa
ika_pulau.jawa <- ika %>%
  filter(Pulau == "Jawa")

# Ubah ke long format
ika_jawa <- ika_pulau.jawa %>%
  pivot_longer(
    cols = `2020`:`2024`,
    names_to = "Tahun",
    values_to = "Nilai"
  )

# Line chart
ggplot(ika_jawa, aes(x = Tahun, y = Nilai, group = Provinsi, color = Provinsi)) +
  geom_line(size = 1) +
  geom_point() +
  labs(
    title = "Indeks Kualitas Air di Pulau Jawa Tahun 2020-2024",
    x = "Tahun",
    y = "Indeks Kualitas Air"
  )

Berdasarkan grafik tersebut, terlihat bahwa setiap provinsi memiliki pola perubahan yang berbeda. Pada tahun 2021 Provinsi Banten menunjukkan peningkatan dari sebelumnya, namun sedikit turun pada 2022, dan mencapai nilai tertinggi pada tahun 2023, kemudian kembali turun pada 2024. Sementara itu, Provinsi Jawa Timur menunjukkan perubahan yang tidak terlalu ekstrem dengan nilai yang relatif tinggi dibandingkan provinsi lain. Provinsi Jawa Tengah dan DI Yogyakarta terlihat mengalami penurunan yang cukup tajam pada tahun 2021. Jawa Timur kembali naik pada tahun-tahun selanjutnya, namun DI Yogyakarta justru kembali mengalami penurunan pada tahun 2022, dan baru kembali naik pada tahun 2023 dan 2024. Provinsi Jawa Barat menunjukkan peningkatan dari tahun 2020 hingga 2022, dan cenderung stabil hingga tahun 2024. Sedangkan DKI Jakarta sempat mengalami kenaikan dari tahun 2020 ke 2021, namun kembali menurun pada tahun 2022 dan relatif stabil hingga tahun 2024.