Visualisasi Data Dasar

Exercises ~ Week 4

Logo


1 Pendahuluan

Dokumen ini membahas eksplorasi data sederhana tentang Konsumsi listrik rumah tangga, yang bertujuan untuk memahami hubungan antara cuaca dan penggunaan listrik. Kami akan menganalisis data harian seperti suhu udara, kondisi cuaca (seperti hujan atau panas), serta konsumsi listrik rumah tangga. Tujuannya adalah membantu kita melihat bagaimana faktor-faktor ini saling memengaruhi, misalnya, apakah suhu yang tinggi membuat penggunaan listrik meningkat.


2 Persiapan data

library(DT)
library(ggplot2)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggridges)

set.seed(123)  # Agar hasil acak selalu sama

# Membuat tanggal dari 1–30 Oktober 2023
tanggal_seq <- seq(as.Date("2023-10-01"), as.Date("2023-10-30"), by = "day")

# Membuat data utama
data <- data.frame(
  Tanggal = tanggal_seq,  # Kolom tanggal
  Suhu = round(runif(length(tanggal_seq), 20, 35), 1),  # Suhu harian acak (20–35 °C)
  
    # Mengulang nama hari agar sesuai panjang tanggal
    Hari = rep( 
    c("Senin", "Selasa", "Rabu", "Kamis", "Jumat", "Sabtu", "Minggu"),
    length.out = length(tanggal_seq)
  )
)

# Membuat Kolom Cuaca (Ordinal)
# klasifikasikan kondisi cuaca berdasarkan suhu (20-26.9 = Hujan, 27-31.9 = Cerah, 32 ke atas = Panas)
data$Cuaca <- cut(
  data$Suhu,
  breaks = c(-Inf, 26.9, 31.9, Inf),  # batas nilai suhu sesuai instruksi
  labels = c("Hujan", "Cerah", "Panas"), 
  ordered_result = TRUE  # menjadikan variabel ini menjadi Ordinal
)


# Tambahan Baru: Membuat Kolom Data Discrete untuk Jumlah Orang Rumah
data$Jumlah_Orang_Rumah <- sample(2:5, size = nrow(data), replace = TRUE)  # Hanya 2, 3, 4, 5
  # Penjelasan sederhana: sample() membuat angka acak dari 2 hingga 5, sebanyak baris di data.


# Jika suhu naik, maka konsumsi listrik naik juga,tapi seberapa besar kenaikannya tergantung kondisi cuaca:   Panas -> Tinggi, Cerah -> sedang, Hujan -> kecil.
# Menghitung Konsumsi Listrik (Continuous)
data$Konsumsi_kWh <- round( 
  ifelse(
    data$Cuaca == "Panas",  ## Jika cuaca 'Panas'
    40 + 0.7 * data$Suhu + rnorm(nrow(data), 0, 1.5),  # konsumsi tinggi, dipengaruhi Suhu
    # Jika penggunaan listrik dasar adalah 40 kWh, maka untuk setiap kenaikan suhu sebesar 1 °C, konsumsi         listrik akan bertambah 0.7 kWh. 
    
    ifelse(
      data$Cuaca == "Cerah",  ## Jika 'Cerah'
      30 + 0.6 * data$Suhu + rnorm(nrow(data), 0, 1.5),  # konsumsi sedang, dipengaruhi Suhu
      # Jika penggunaan listrik dasar adalah 30 kWh, maka setiap kenaikan suhu 1°C akan menambah konsumsi           listrik sebesar 0.6 kWh.
      
      20 + 0.5 * data$Suhu + rnorm(nrow(data), 0, 1.5)   ## Jika 'Hujan', konsumsi rendah, dipengaruhi Suhu
      #Jika penggunaan listrik dasar adalah 20 kWh, maka setiap kenaikan suhu 1°C akan menambah konsumsi          listrik sebesar 0.5 kWh.
      
    # rnorm itu untuk menambahkan nilai acak. nrow itu untuk mengisi berapa yang di perlukan pada data (30)
    )
  ),
  1
)

# Membuat Tingkat Penggunaan (Ordinal) berdasarkan Konsumsi_kWh
data$Tingkat_Penggunaan <- cut( 
  data$Konsumsi_kWh,  # Gunakan Konsumsi_kWh sebagai input
  breaks = c(-Inf, 30 , 50, Inf),  # Batas: di bawah 30 = Rendah, 30-50 = Sedang, 50+ = Tinggi
  labels = c("Rendah", "Sedang", "Tinggi"), 
  ordered_result = TRUE
) # Penjelasan sederhana: semuanya berhubungan Suhu -> Cuaca -> Konsumsi_kWh -> Tingkat_Penggunaan.

datatable(
  data,  # Hanya kolom yang diminta
  rownames = TRUE, # kalau TRUE dia jadi ada angkanya di bagian kiri. jika FALSE jadi tidak ada
  options = list(
    pageLength = 10,  # 10 baris per halaman
    autoWidth = TRUE, # untuk isi table itu automatis mengatur lebarnya
    scrollCollapse = TRUE 
  ),
  caption = "Tabel 1. Dataset Konsumsi Listrik Rumah Tangga Berdasarkan Cuaca"
)

3 Visualisasi

3.1 Bar Chart

ggplot(data, aes(x = Tanggal, y = Konsumsi_kWh, fill = Cuaca)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Konsumsi_kWh), vjust = -0.5, size = 3) +
  labs(title = "Konsumsi Listrik Harian Berdasarkan Cuaca",
       x = "Tanggal",
       y = "Konsumsi (kWh)",
       fill = "Cuaca") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  1. Penjelasan Code :
  • ggplot(data, aes(x = Tanggal, y = Konsumsi_kWh, fill = Cuaca)) → memanggil dataset data dan menentukan bahwa sumbu X berisi tanggal, sumbu Y berisi konsumsi listrik, serta warna batang diisi berdasarkan kategori cuaca.

  • geom_bar(stat = “identity”) → membuat grafik batang dengan tinggi batang sesuai nilai sebenarnya dari Konsumsi_kWh.

  • geom_text(aes(label = Konsumsi_kWh), vjust = -0.5, size = 3) → menambahkan label angka di atas tiap batang agar nilai konsumsi terlihat jelas.

  • labs(…) → menambahkan judul dan nama sumbu pada grafik agar mudah dibaca.

  • theme_minimal() → menggunakan tema sederhana agar tampilan grafik bersih.

  • theme(axis.text.x = element_text(angle = 45, hjust = 1)) → memiringkan teks tanggal di sumbu X agar tidak saling menumpuk.

  1. Penjelasan Visualisasi :

Grafik batang ini memperlihatkan perubahan konsumsi listrik rumah tangga setiap hari berdasarkan kondisi cuaca. Batang berwarna menunjukkan kategori cuaca, sedangkan tinggi batang menunjukkan besar penggunaan listrik. Dari grafik terlihat bahwa cuaca panas menyebabkan konsumsi listrik meningkat, sementara cuaca hujan cenderung menurunkan penggunaan energi. Visualisasi ini membantu mengenali pola hubungan antara faktor cuaca dan tingkat pemakaian listrik harian.

  1. Definisi :

Bar chart adalah grafik yang menampilkan data dalam bentuk batang vertikal atau horizontal, di mana panjang batang mewakili nilai suatu kategori. Grafik ini digunakan untuk menyoroti perbandingan nilai antar kelompok.

  1. Aturan Penggunaan :

Gunakan bar chart untuk membandingkan nilai antar kelompok data kategorikal seperti nominal atau ordinal, terhadap variabel numerik yang menggambarkan besarnya suatu nilai. Visualisasi ini efektif saat ingin menonjolkan perbedaan antar kategori secara jelas dan langsung.

  1. Kelebihan :
  • Mudah dibaca dan cepat menunjukkan perbedaan antar kategori.
  • Cocok untuk menampilkan data ringkasan atau hasil agregasi.
  • Warna dan label dapat memperjelas pesan yang ingin disampaikan.
  1. Kekurangan :
  • Kurang cocok untuk data kontinu atau deret waktu panjang.
  • Terlalu banyak kategori dapat membuat grafik sulit dibaca.
  • Tidak menunjukkan tren atau hubungan antarvariabel numerik.

3.2 Histogram

ggplot(data, aes(x = Konsumsi_kWh)) +
  geom_histogram(bins = 10, fill = "skyblue", color = "black") +
  labs(title = "Distribusi Konsumsi Listrik", x = "Konsumsi (kWh)", y = "Frekuensi") +
  theme_minimal()

  1. Penjelasan Code :
  • ggplot(data, aes(x = Konsumsi_kWh)) → Menetapkan data dan sumbu X sebagai nilai konsumsi listrik.

  • geom_histogram(bins = 10, fill = “skyblue”, color = “black”) → Membuat histogram dengan 10 batang (bin) berwarna biru muda dan garis tepi hitam.

  • labs(…) → Menambahkan judul dan label sumbu X serta Y.

  • theme_minimal() → Menggunakan tema sederhana agar tampilannya bersih.

  1. Penjelasan Visualisasi :

Histogram ini menampilkan distribusi konsumsi listrik rumah tangga dalam rentang nilai tertentu. Setiap batang menunjukkan jumlah hari yang memiliki konsumsi listrik pada kisaran tertentu. Dari grafik ini dapat dilihat apakah data konsumsi listrik cenderung merata atau berkumpul pada nilai tertentu.

  1. Definisi :

Histogram adalah grafik batang yang menunjukkan frekuensi data numerik dalam interval tertentu. Grafik ini digunakan untuk memahami sebaran nilai data kontinu, seperti konsumsi listrik atau suhu.

  1. Aturan Penggunaan :

Gunakan histogram untuk menggambarkan distribusi data numerik kontinu, agar dapat melihat pola sebaran dan kecenderungan nilai pada suatu rentang tertentu.

  1. Kelebihan :
  • Menampilkan distribusi data dengan jelas.
  • Mudah melihat pola, seperti data condong ke kanan/kiri.
  • Dapat mendeteksi nilai ekstrem (outlier).
  1. Kekurangan :
  • Tidak menampilkan hubungan antarvariabel.
  • Hasil bisa berbeda tergantung banyaknya interval (bin).
  • Kurang efektif jika data terlalu sedikit.

3.3 Boxplot

ggplot(data, aes(x = Cuaca, y = Konsumsi_kWh, fill = Cuaca)) +
  geom_boxplot() +
  labs(title = "Boxplot Konsumsi Listrik Berdasarkan Cuaca", x = "Cuaca", y = "Konsumsi (kWh)") +
  theme_minimal()

  1. Penjelasan Code :
  • ggplot(data, aes(x = Cuaca, y = Konsumsi_kWh, fill = Cuaca)) → Mengatur sumbu X berdasarkan kategori cuaca dan Y sebagai nilai konsumsi listrik.

  • geom_boxplot() → Membuat grafik boxplot yang menampilkan median, kuartil, dan outlier.

  • labs(…) → Menambahkan judul dan label sumbu X serta Y.

  • theme_minimal() → Menggunakan tema sederhana agar tampilannya bersih.

  1. Penjelasan Visualisasi :

Boxplot ini memperlihatkan variasi konsumsi listrik untuk setiap kondisi cuaca. Kotak menunjukkan rentang nilai tengah data, garis dalam kotak adalah median, dan titik di luar kotak adalah outlier. Visualisasi ini memudahkan kita membandingkan persebaran konsumsi listrik antar kategori cuaca.

  1. Definisi :

Boxplot adalah grafik yang menampilkan ringkasan statistik seperti median, kuartil, dan outlier untuk membandingkan beberapa kelompok data.

  1. Aturan Penggunaan :

Gunakan boxplot untuk menganalisis distribusi data numerik berdasarkan kategori (ordinal atau nominal), seperti perbedaan konsumsi listrik berdasarkan cuaca.

  1. Kelebihan :
  • Mudah menemukan persebaran data dan outlier.
  • Efektif membandingkan beberapa kelompok data.
  • Menunjukkan rentang dan simetri data.
  1. Kekurangan :
  • Tidak menampilkan nilai individual secara detail.
  • Sulit dipahami oleh pengguna awam tanpa penjelasan.
  • Tidak menunjukkan distribusi penuh seperti histogram.

3.4 Pie Chart

library(dplyr)
library(ggplot2)

# --- Buat data ringkasan untuk pie chart ---
pie_data <- data %>%
  count(Tingkat_Penggunaan) %>%
  mutate(
    prop = n / sum(n),
    label = paste0(Tingkat_Penggunaan, "\n", n, " hari\n(", round(prop * 100, 1), "%)")
  )

# --- Warna kategori ---
warna_kategori <- c(
  "Rendah" = "green3",
  "Sedang" = "dodgerblue3",
  "Tinggi" = "red3"
)

# --- Plot pie chart tanpa keterangan tambahan ---
ggplot(pie_data, aes(x = "", y = prop, fill = Tingkat_Penggunaan)) +
  geom_bar(stat = "identity", width = 1, color = "white") +
  coord_polar("y") +
  geom_text(aes(label = label),
            position = position_stack(vjust = 0.5),
            color = "black", size = 3) +
  scale_fill_manual(values = warna_kategori) +
  labs(
    title = "Proporsi Tingkat Penggunaan Listrik per Hari",
    subtitle = "Menunjukkan jumlah hari dan persentase setiap kategori penggunaan",
    fill = "Tingkat Penggunaan",
    caption = paste0(
      "Periode pengamatan: ",
      format(min(data$Tanggal), "%d %B %Y"), " – ",
      format(max(data$Tanggal), "%d %B %Y")
    )
  ) +
  theme_void(base_size = 13) +
  theme(
    plot.title = element_text(face = "bold", size = 15, hjust = 0.5),
    plot.subtitle = element_text(size = 11, hjust = 0.5, color = "gray30"),
    legend.position = "right",
    plot.caption = element_text(hjust = 0, size = 9, color = "gray30", lineheight = 1.3)
  )

  1. Penjelasan Code :
  • count(Tingkat_Penggunaan) → Menghitung jumlah data untuk setiap kategori tingkat penggunaan.

  • mutate(prop = n / sum(n), …) → Menghitung proporsi dan membuat label teks dengan jumlah hari dan persentase.

  • geom_bar(stat = “identity”) → Membuat batang untuk setiap kategori (akan diubah menjadi lingkaran).

  • coord_polar(“y”) → Mengubah grafik batang menjadi bentuk lingkaran (pie).

  • geom_text(…) → Menambahkan label teks pada setiap irisan.

  • scale_fill_manual(…) → Mengatur warna untuk tiap kategori.

  • theme_void() → Menghapus garis dan sumbu agar fokus pada pie chart.

  1. Penjelasan Visualisasi :

Pie chart ini memperlihatkan proporsi kategori tingkat penggunaan listrik rumah tangga. Setiap irisan mewakili persentase jumlah hari pada tiap tingkat penggunaan (rendah, sedang, tinggi). Grafik ini membantu memahami porsi kontribusi setiap kategori terhadap total keseluruhan hari.

  1. Definisi :

Pie chart adalah grafik berbentuk lingkaran yang dibagi menjadi beberapa irisan untuk menunjukkan proporsi dari total data.

  1. Aturan Penggunaan :

Gunakan pie chart untuk data kategorikal nominal atau ordinal, ketika ingin menunjukkan perbandingan bagian terhadap total keseluruhan.

  1. Kelebihan :
  • Menarik secara visual dan mudah dipahami.
  • Cocok untuk menunjukkan komposisi data.
  • Efektif untuk perbandingan sederhana antar kategori.
  1. Kekurangan :
  • Sulit dibandingkan jika ukuran irisan mirip.
  • Tidak akurat untuk analisis numerik rinci.
  • Tidak cocok jika jumlah kategori terlalu banyak.

3.5 Scatter Plot

ggplot(data, aes(x = Suhu, y = Konsumsi_kWh, color = Cuaca)) +
  geom_point(size = 3, alpha = 0.8) +
  labs(title = "Hubungan Suhu dan Konsumsi Listrik", x = "Suhu (\u00B0C)", y = "Konsumsi (kWh)") +
  theme_minimal() #\u00B0C itu unicode dari (°C)

  1. Penjelasan Code:
  • ggplot(data, aes(x = Suhu, y = Konsumsi_kWh, color = Cuaca)) → Menentukan suhu sebagai sumbu X, konsumsi listrik sebagai sumbu Y, dan warna berdasarkan cuaca.

  • geom_point(size = 3, alpha = 0.8) → Membuat titik-titik data dengan ukuran 3 dan transparansi 80%.

  • labs(…) → Memberikan judul dan label pada sumbu.

  • theme_minimal() → Menjaga tampilan tetap sederhana.

  1. Penjelasan Visualisasi :

Scatter plot ini menunjukkan hubungan antara suhu dan konsumsi listrik rumah tangga. Titik-titik berwarna merepresentasikan kondisi cuaca, memperlihatkan bahwa semakin tinggi suhu, konsumsi listrik juga meningkat. Grafik ini membantu mengidentifikasi pola korelasi antara dua variabel numerik.

  1. Definisi :

Scatter plot adalah grafik yang menampilkan hubungan antara dua variabel numerik menggunakan titik-titik data.

  1. Aturan Penggunaan :

Gunakan scatter plot untuk data numerik kontinu, ketika ingin melihat pola, hubungan, atau tren antara dua variabel seperti suhu dan konsumsi listrik.

  1. Kelebihan :
  • Efektif menunjukkan hubungan antarvariabel.
  • Dapat mengidentifikasi tren, korelasi, dan outlier.
  • Visualisasi sederhana namun informatif.
  1. Kekurangan :
  • Sulit dibaca jika data sangat banyak dan tumpang tindih.
  • Tidak cocok untuk data kategorikal.
  • Membutuhkan interpretasi statistik tambahan untuk analisis mendalam.

3.6 Line Plot

ggplot(data, aes(x = Tanggal, y = Konsumsi_kWh, color = Cuaca, group = 1)) +
  geom_line(linewidth = 1) +
  geom_point(size = 2) +
  labs(title = "Tren Konsumsi Listrik Harian",
       x = "Tanggal",
       y = "Konsumsi (kWh)") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  1. Penjelasan Code :
  • ggplot(data, aes(x = Tanggal, y = Konsumsi_kWh, color = Cuaca, group = 1)) → Menentukan tanggal sebagai sumbu X dan konsumsi listrik sebagai Y, dengan warna mengikuti cuaca.

  • geom_line(linewidth = 1) → Menghubungkan titik data dengan garis untuk menunjukkan tren waktu.

  • geom_point(size = 2) → Menambahkan titik di setiap tanggal agar lebih jelas.

  • labs(…) → Menambahkan judul dan label sumbu.

  • theme_minimal() → Mengatur tema sederhana.

  • theme(axis.text.x = element_text(angle = 45, hjust = 1)) → Memiringkan teks tanggal agar lebih terbaca.

  1. Penjelasan Visualisasi :

Line plot ini menampilkan perubahan konsumsi listrik dari waktu ke waktu. Setiap garis menggambarkan tren harian, menunjukkan bagaimana konsumsi listrik meningkat atau menurun sesuai kondisi cuaca. Grafik ini membantu mengenali pola musiman atau perubahan penggunaan energi seiring berjalannya waktu.

  1. Definisi :

Line plot adalah grafik yang menghubungkan titik-titik data dalam urutan tertentu untuk menampilkan perubahan atau tren dari waktu ke waktu.

  1. Aturan Penggunaan :

Gunakan line plot untuk data numerik yang diukur berdasarkan urutan waktu (time series), seperti tanggal, jam, atau bulan, guna memantau tren atau perubahan nilai secara berkelanjutan.

  1. Kelebihan :
  • Efektif menunjukkan tren dan fluktuasi dari waktu ke waktu.
  • Mudah diinterpretasikan untuk data berurutan.
  • Dapat menampilkan lebih dari satu seri data dengan warna berbeda.
  1. Kekurangan :
  • Tidak cocok untuk data kategori tanpa urutan waktu.
  • Sulit dibaca jika banyak garis tumpang tindih.
  • Tidak menunjukkan variasi dalam setiap titik data.

3.7 Density Plot

ggplot(data, aes(x = Konsumsi_kWh, fill = Cuaca)) +
  geom_density(alpha = 0.6) +
  labs(title = "Kepadatan Distribusi Konsumsi Listrik per Cuaca", x = "Konsumsi (kWh)", y = "Kepadatan") +
  theme_minimal()

  1. Penjelasan Code :
  • ggplot(data, aes(x = Konsumsi_kWh, fill = Cuaca)) → Menetapkan data konsumsi listrik dengan warna berdasarkan cuaca.

  • geom_density(alpha = 0.6) → Membuat kurva kepadatan dengan transparansi 60%.

  • labs(…) → Menambahkan judul dan label pada grafik.

  • theme_minimal() → Mengatur tampilan agar sederhana dan bersih.

  1. Penjelasan Visualisasi :

Density plot ini menampilkan sebaran konsumsi listrik untuk setiap kondisi cuaca dalam bentuk kurva halus. Setiap warna menunjukkan kategori cuaca, dan tinggi kurva menunjukkan kepadatan data di nilai tertentu. Grafik ini berguna untuk membandingkan bagaimana pola distribusi listrik berbeda antar cuaca.

  1. Definisi :

Density plot adalah grafik berbentuk kurva yang menunjukkan distribusi probabilitas data numerik secara halus, mirip histogram tetapi tanpa batang, sehingga bentuk sebaran data terlihat lebih mulus.

  1. Aturan Penggunaan :

Gunakan density plot untuk data numerik kontinu, terutama saat ingin membandingkan bentuk distribusi antara beberapa kelompok atau kategori.

  1. Kelebihan :
  • Menampilkan bentuk distribusi data dengan halus.
  • Mudah membandingkan pola antara beberapa kelompok.
  • Lebih rapi dibanding histogram saat data padat.
  1. Kekurangan :
  • Tidak menunjukkan jumlah data secara langsung.
  • Sulit ditafsirkan jika data terlalu sedikit.
  • Overlap antar kurva dapat mengurangi keterbacaan.

3.8 Riggeline

ggplot(data, aes(x = Konsumsi_kWh, y = Cuaca, fill = Cuaca)) +
  geom_density_ridges(alpha = 0.7) +
  labs(title = "Ridgeline Plot Konsumsi Listrik Berdasarkan Cuaca", x = "Konsumsi (kWh)", y = "Cuaca") +
  theme_minimal()
## Picking joint bandwidth of 0.764

  1. Penjelasan Code :
  • ggplot(data, aes(x = Konsumsi_kWh, y = Cuaca, fill = Cuaca)) → Menetapkan sumbu X untuk konsumsi listrik dan sumbu Y untuk kategori cuaca.

  • geom_density_ridges(alpha = 0.7) → Membuat kurva kepadatan bertumpuk untuk tiap kategori.

  • labs(…) → Menambahkan judul dan label sumbu.

  • theme_minimal() → Mengatur tampilan agar bersih dan profesional.

  1. Penjelasan Visualisasi :

Ridgeline plot ini menggambarkan perbandingan sebaran konsumsi listrik antar kondisi cuaca dalam bentuk kurva bertumpuk. Setiap kurva memperlihatkan kepadatan data untuk masing-masing kategori, sehingga perbedaan pola antar cuaca terlihat jelas. Grafik ini memberikan tampilan visual yang menarik untuk analisis perbandingan distribusi.

  1. Definisi :

Ridgeline plot adalah variasi dari density plot yang menampilkan beberapa kurva distribusi secara bertumpuk untuk membandingkan bentuk sebaran data dari berbagai kelompok kategori.

  1. Aturan Penggunaan :

Gunakan ridgeline plot untuk data numerik kontinu yang terbagi dalam beberapa kelompok kategori, seperti konsumsi listrik berdasarkan cuaca, untuk menyoroti perbedaan pola distribusi antar kelompok.

  1. Kelebihan :
  • Memberikan tampilan visual yang menarik dan informatif.
  • Mudah membandingkan banyak kategori dalam satu grafik.
  • Menunjukkan perbedaan bentuk distribusi dengan jelas.
  1. Kekurangan :
  • Sulit dibaca jika terlalu banyak kategori.
  • Bisa membingungkan bagi pengguna awam.
  • Membutuhkan ruang visual lebih besar agar tetap jelas.

4 Kesimpulan

Berdasarkan data yang dihasilkan, dapat diamati bahwa kondisi cuaca berperan penting terhadap tingkat konsumsi listrik. Saat cuaca panas, konsumsi listrik cenderung meningkat karena penggunaan alat pendingin seperti kipas angin dan AC lebih tinggi. Sebaliknya, pada saat hujan, konsumsi listrik relatif menurun karena suhu lingkungan sudah cukup sejuk, Asumsikan saja ketika cuaca sedang panas penggunaan alat pendingin ruangan 10 jam perhari, Cerah hanya 8,5 Jam, dan saat hujan menjadi 7 Jam.

Secara keseluruhan, dataset ini menunjukkan keterkaitan logis antara variabel suhu, cuaca, dan konsumsi listrik, serta dapat menjadi contoh praktis untuk memahami jenis data dan logika pengelompokan dalam analisis data dasar menggunakan bahasa R.

---
title: "Visualisasi Data Dasar" # Main title of the document
subtitle: "Exercises ~ Week 4"  # Subtitle or topic for week 4
author:
- "Kelompok 1"
- "Refantanur Hunsul Haqib"
- "Cahaya Medina Semidang"
- "Adinda Maiza Ishfahani"
- "Chandra Rizal Alamsyah"
- "Fityanandra Athar Adyaksa"
date:  "`r format(Sys.Date(), '%B %d, %Y')`" # Auto displays the current date
output:                         # Output section defines the format and layout 
  rmdformats::readthedown:      # https://github.com/juba/rmdformats
    self_contained: true        # Embeds all resources (CSS, JS, images) 
    thumbnails: true            # Displays image thumbnails in the doc
    lightbox: true              # Enables click to enlarge images
    gallery: true               # Groups images into an interactive gallery
    number_sections: true       # Automatically numbers all sections
    lib_dir: libs               # Directory where JavaScript/CSS libraries
    df_print: "paged"           # Displays data frames as interactive paged 
    code_folding: "show"        # Allows folding/unfolding R code blocks 
    code_download: yes          # Adds a button to download all R code
---

<img id="Foto" src="https://raw.githubusercontent.com/YanDraa/Week3Statistika/main/FOTO_KELOMPOK.jpg" alt="Logo" style="width:200px; display: block; margin: auto;">

---


# Pendahuluan
Dokumen ini membahas eksplorasi data sederhana tentang **Konsumsi listrik rumah tangga**, yang bertujuan untuk memahami hubungan antara cuaca dan penggunaan listrik. Kami akan menganalisis data harian seperti suhu udara, kondisi cuaca (seperti hujan atau panas), serta konsumsi listrik rumah tangga. Tujuannya adalah membantu kita melihat bagaimana faktor-faktor ini saling memengaruhi, misalnya, apakah suhu yang tinggi membuat penggunaan listrik meningkat.

---

# Persiapan data
```{r}
library(DT)
library(ggplot2)
library(dplyr)
library(ggridges)

set.seed(123)  # Agar hasil acak selalu sama

# Membuat tanggal dari 1–30 Oktober 2023
tanggal_seq <- seq(as.Date("2023-10-01"), as.Date("2023-10-30"), by = "day")

# Membuat data utama
data <- data.frame(
  Tanggal = tanggal_seq,  # Kolom tanggal
  Suhu = round(runif(length(tanggal_seq), 20, 35), 1),  # Suhu harian acak (20–35 °C)
  
    # Mengulang nama hari agar sesuai panjang tanggal
    Hari = rep( 
    c("Senin", "Selasa", "Rabu", "Kamis", "Jumat", "Sabtu", "Minggu"),
    length.out = length(tanggal_seq)
  )
)

# Membuat Kolom Cuaca (Ordinal)
# klasifikasikan kondisi cuaca berdasarkan suhu (20-26.9 = Hujan, 27-31.9 = Cerah, 32 ke atas = Panas)
data$Cuaca <- cut(
  data$Suhu,
  breaks = c(-Inf, 26.9, 31.9, Inf),  # batas nilai suhu sesuai instruksi
  labels = c("Hujan", "Cerah", "Panas"), 
  ordered_result = TRUE  # menjadikan variabel ini menjadi Ordinal
)


# Tambahan Baru: Membuat Kolom Data Discrete untuk Jumlah Orang Rumah
data$Jumlah_Orang_Rumah <- sample(2:5, size = nrow(data), replace = TRUE)  # Hanya 2, 3, 4, 5
  # Penjelasan sederhana: sample() membuat angka acak dari 2 hingga 5, sebanyak baris di data.


# Jika suhu naik, maka konsumsi listrik naik juga,tapi seberapa besar kenaikannya tergantung kondisi cuaca:   Panas -> Tinggi, Cerah -> sedang, Hujan -> kecil.
# Menghitung Konsumsi Listrik (Continuous)
data$Konsumsi_kWh <- round( 
  ifelse(
    data$Cuaca == "Panas",  ## Jika cuaca 'Panas'
    40 + 0.7 * data$Suhu + rnorm(nrow(data), 0, 1.5),  # konsumsi tinggi, dipengaruhi Suhu
    # Jika penggunaan listrik dasar adalah 40 kWh, maka untuk setiap kenaikan suhu sebesar 1 °C, konsumsi         listrik akan bertambah 0.7 kWh. 
    
    ifelse(
      data$Cuaca == "Cerah",  ## Jika 'Cerah'
      30 + 0.6 * data$Suhu + rnorm(nrow(data), 0, 1.5),  # konsumsi sedang, dipengaruhi Suhu
      # Jika penggunaan listrik dasar adalah 30 kWh, maka setiap kenaikan suhu 1°C akan menambah konsumsi           listrik sebesar 0.6 kWh.
      
      20 + 0.5 * data$Suhu + rnorm(nrow(data), 0, 1.5)   ## Jika 'Hujan', konsumsi rendah, dipengaruhi Suhu
      #Jika penggunaan listrik dasar adalah 20 kWh, maka setiap kenaikan suhu 1°C akan menambah konsumsi          listrik sebesar 0.5 kWh.
      
    # rnorm itu untuk menambahkan nilai acak. nrow itu untuk mengisi berapa yang di perlukan pada data (30)
    )
  ),
  1
)

# Membuat Tingkat Penggunaan (Ordinal) berdasarkan Konsumsi_kWh
data$Tingkat_Penggunaan <- cut( 
  data$Konsumsi_kWh,  # Gunakan Konsumsi_kWh sebagai input
  breaks = c(-Inf, 30 , 50, Inf),  # Batas: di bawah 30 = Rendah, 30-50 = Sedang, 50+ = Tinggi
  labels = c("Rendah", "Sedang", "Tinggi"), 
  ordered_result = TRUE
) # Penjelasan sederhana: semuanya berhubungan Suhu -> Cuaca -> Konsumsi_kWh -> Tingkat_Penggunaan.

datatable(
  data,  # Hanya kolom yang diminta
  rownames = TRUE, # kalau TRUE dia jadi ada angkanya di bagian kiri. jika FALSE jadi tidak ada
  options = list(
    pageLength = 10,  # 10 baris per halaman
    autoWidth = TRUE, # untuk isi table itu automatis mengatur lebarnya
    scrollCollapse = TRUE 
  ),
  caption = "Tabel 1. Dataset Konsumsi Listrik Rumah Tangga Berdasarkan Cuaca"
)
```
---

# Visualisasi
## Bar Chart
```{r}
ggplot(data, aes(x = Tanggal, y = Konsumsi_kWh, fill = Cuaca)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Konsumsi_kWh), vjust = -0.5, size = 3) +
  labs(title = "Konsumsi Listrik Harian Berdasarkan Cuaca",
       x = "Tanggal",
       y = "Konsumsi (kWh)",
       fill = "Cuaca") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

```

1. **Penjelasan Code :**

* **ggplot(data, aes(x = Tanggal, y = Konsumsi_kWh, fill = Cuaca))** → memanggil dataset data dan menentukan bahwa sumbu X berisi tanggal, sumbu Y berisi konsumsi listrik, serta warna batang diisi berdasarkan kategori cuaca.

* **geom_bar(stat = "identity")** → membuat grafik batang dengan tinggi batang sesuai nilai sebenarnya dari Konsumsi_kWh.

* **geom_text(aes(label = Konsumsi_kWh), vjust = -0.5, size = 3)** → menambahkan label angka di atas tiap batang agar nilai konsumsi terlihat jelas.

* **labs(...)** → menambahkan judul dan nama sumbu pada grafik agar mudah dibaca.

* **theme_minimal()** → menggunakan tema sederhana agar tampilan grafik bersih.

* **theme(axis.text.x = element_text(angle = 45, hjust = 1))** → memiringkan teks tanggal di sumbu X agar tidak saling menumpuk.


2. **Penjelasan Visualisasi :** 

Grafik batang ini memperlihatkan perubahan konsumsi listrik rumah tangga setiap hari berdasarkan kondisi cuaca. Batang berwarna menunjukkan kategori cuaca, sedangkan tinggi batang menunjukkan besar penggunaan listrik.
Dari grafik terlihat bahwa cuaca panas menyebabkan konsumsi listrik meningkat, sementara cuaca hujan cenderung menurunkan penggunaan energi. Visualisasi ini membantu mengenali pola hubungan antara faktor cuaca dan tingkat pemakaian listrik harian.


3. **Definisi :** 

Bar chart adalah grafik yang menampilkan data dalam bentuk batang vertikal atau horizontal,
di mana panjang batang mewakili nilai suatu kategori.
Grafik ini digunakan untuk menyoroti perbandingan nilai antar kelompok.

4. **Aturan Penggunaan :** 

Gunakan bar chart untuk membandingkan nilai antar kelompok data kategorikal seperti nominal atau ordinal,
terhadap variabel numerik yang menggambarkan besarnya suatu nilai.
Visualisasi ini efektif saat ingin menonjolkan perbedaan antar kategori secara jelas dan langsung.

5. **Kelebihan :**
* Mudah dibaca dan cepat menunjukkan perbedaan antar kategori.
* Cocok untuk menampilkan data ringkasan atau hasil agregasi.
* Warna dan label dapat memperjelas pesan yang ingin disampaikan.

6. **Kekurangan :**
* Kurang cocok untuk data kontinu atau deret waktu panjang.
* Terlalu banyak kategori dapat membuat grafik sulit dibaca.
* Tidak menunjukkan tren atau hubungan antarvariabel numerik.

---

## Histogram
```{r}
ggplot(data, aes(x = Konsumsi_kWh)) +
  geom_histogram(bins = 10, fill = "skyblue", color = "black") +
  labs(title = "Distribusi Konsumsi Listrik", x = "Konsumsi (kWh)", y = "Frekuensi") +
  theme_minimal()
```

1. **Penjelasan Code :**

* **ggplot(data, aes(x = Konsumsi_kWh))** → Menetapkan data dan sumbu X sebagai nilai konsumsi listrik.

* **geom_histogram(bins = 10, fill = "skyblue", color = "black")** → Membuat histogram dengan 10 batang (bin) berwarna biru muda dan garis tepi hitam.

* **labs(...)** → Menambahkan judul dan label sumbu X serta Y.

* **theme_minimal()** → Menggunakan tema sederhana agar tampilannya bersih.

2. **Penjelasan Visualisasi :**

Histogram ini menampilkan distribusi konsumsi listrik rumah tangga dalam rentang nilai tertentu.
Setiap batang menunjukkan jumlah hari yang memiliki konsumsi listrik pada kisaran tertentu.
Dari grafik ini dapat dilihat apakah data konsumsi listrik cenderung merata atau berkumpul pada nilai tertentu.

3. **Definisi :**

Histogram adalah grafik batang yang menunjukkan frekuensi data numerik dalam interval tertentu.
Grafik ini digunakan untuk memahami sebaran nilai data kontinu, seperti konsumsi listrik atau suhu.

4. **Aturan Penggunaan :**

Gunakan histogram untuk menggambarkan distribusi data numerik kontinu,
agar dapat melihat pola sebaran dan kecenderungan nilai pada suatu rentang tertentu.

5. **Kelebihan :**
* Menampilkan distribusi data dengan jelas.
* Mudah melihat pola, seperti data condong ke kanan/kiri.
* Dapat mendeteksi nilai ekstrem (outlier).

6. **Kekurangan :** 
* Tidak menampilkan hubungan antarvariabel.
* Hasil bisa berbeda tergantung banyaknya interval (bin).
* Kurang efektif jika data terlalu sedikit.

---

## Boxplot
```{r}
ggplot(data, aes(x = Cuaca, y = Konsumsi_kWh, fill = Cuaca)) +
  geom_boxplot() +
  labs(title = "Boxplot Konsumsi Listrik Berdasarkan Cuaca", x = "Cuaca", y = "Konsumsi (kWh)") +
  theme_minimal()

```

1. **Penjelasan Code :**

* **ggplot(data, aes(x = Cuaca, y = Konsumsi_kWh, fill = Cuaca))** → Mengatur sumbu X berdasarkan kategori cuaca dan Y sebagai nilai konsumsi listrik.

* **geom_boxplot()** → Membuat grafik boxplot yang menampilkan median, kuartil, dan outlier.

* **labs(...)** → Menambahkan judul dan label sumbu X serta Y.

* **theme_minimal()** → Menggunakan tema sederhana agar tampilannya bersih.


2. **Penjelasan Visualisasi :**

Boxplot ini memperlihatkan variasi konsumsi listrik untuk setiap kondisi cuaca.
Kotak menunjukkan rentang nilai tengah data, garis dalam kotak adalah median, dan titik di luar kotak adalah outlier.
Visualisasi ini memudahkan kita membandingkan persebaran konsumsi listrik antar kategori cuaca.

3. **Definisi :**

Boxplot adalah grafik yang menampilkan ringkasan statistik seperti median, kuartil, dan outlier untuk membandingkan beberapa kelompok data.

4. **Aturan Penggunaan :**

Gunakan boxplot untuk menganalisis distribusi data numerik berdasarkan kategori (ordinal atau nominal),
seperti perbedaan konsumsi listrik berdasarkan cuaca.

5. **Kelebihan :**
* Mudah menemukan persebaran data dan outlier.
* Efektif membandingkan beberapa kelompok data.
* Menunjukkan rentang dan simetri data.

6. **Kekurangan :** 
* Tidak menampilkan nilai individual secara detail.
* Sulit dipahami oleh pengguna awam tanpa penjelasan.
* Tidak menunjukkan distribusi penuh seperti histogram.

---

## Pie Chart
```{r}
library(dplyr)
library(ggplot2)

# --- Buat data ringkasan untuk pie chart ---
pie_data <- data %>%
  count(Tingkat_Penggunaan) %>%
  mutate(
    prop = n / sum(n),
    label = paste0(Tingkat_Penggunaan, "\n", n, " hari\n(", round(prop * 100, 1), "%)")
  )

# --- Warna kategori ---
warna_kategori <- c(
  "Rendah" = "green3",
  "Sedang" = "dodgerblue3",
  "Tinggi" = "red3"
)

# --- Plot pie chart tanpa keterangan tambahan ---
ggplot(pie_data, aes(x = "", y = prop, fill = Tingkat_Penggunaan)) +
  geom_bar(stat = "identity", width = 1, color = "white") +
  coord_polar("y") +
  geom_text(aes(label = label),
            position = position_stack(vjust = 0.5),
            color = "black", size = 3) +
  scale_fill_manual(values = warna_kategori) +
  labs(
    title = "Proporsi Tingkat Penggunaan Listrik per Hari",
    subtitle = "Menunjukkan jumlah hari dan persentase setiap kategori penggunaan",
    fill = "Tingkat Penggunaan",
    caption = paste0(
      "Periode pengamatan: ",
      format(min(data$Tanggal), "%d %B %Y"), " – ",
      format(max(data$Tanggal), "%d %B %Y")
    )
  ) +
  theme_void(base_size = 13) +
  theme(
    plot.title = element_text(face = "bold", size = 15, hjust = 0.5),
    plot.subtitle = element_text(size = 11, hjust = 0.5, color = "gray30"),
    legend.position = "right",
    plot.caption = element_text(hjust = 0, size = 9, color = "gray30", lineheight = 1.3)
  )

```

1. **Penjelasan Code :**

* **count(Tingkat_Penggunaan)** → Menghitung jumlah data untuk setiap kategori tingkat penggunaan.

* **mutate(prop = n / sum(n), ...)** → Menghitung proporsi dan membuat label teks dengan jumlah hari dan persentase.

* **geom_bar(stat = "identity")** → Membuat batang untuk setiap kategori (akan diubah menjadi lingkaran).

* **coord_polar("y")** → Mengubah grafik batang menjadi bentuk lingkaran (pie).

* **geom_text(...)** → Menambahkan label teks pada setiap irisan.

* **scale_fill_manual(...)** → Mengatur warna untuk tiap kategori.

* **theme_void()** → Menghapus garis dan sumbu agar fokus pada pie chart.


2. **Penjelasan Visualisasi :**

Pie chart ini memperlihatkan proporsi kategori tingkat penggunaan listrik rumah tangga.
Setiap irisan mewakili persentase jumlah hari pada tiap tingkat penggunaan (rendah, sedang, tinggi).
Grafik ini membantu memahami porsi kontribusi setiap kategori terhadap total keseluruhan hari.

3. **Definisi :**

Pie chart adalah grafik berbentuk lingkaran yang dibagi menjadi beberapa irisan untuk menunjukkan proporsi dari total data.

4. **Aturan Penggunaan :**

Gunakan pie chart untuk data kategorikal nominal atau ordinal,
ketika ingin menunjukkan perbandingan bagian terhadap total keseluruhan.

5. **Kelebihan :**
* Menarik secara visual dan mudah dipahami.
* Cocok untuk menunjukkan komposisi data.
* Efektif untuk perbandingan sederhana antar kategori.

6. **Kekurangan :** 
* Sulit dibandingkan jika ukuran irisan mirip.
* Tidak akurat untuk analisis numerik rinci.
* Tidak cocok jika jumlah kategori terlalu banyak.


---

## Scatter Plot
```{r}
ggplot(data, aes(x = Suhu, y = Konsumsi_kWh, color = Cuaca)) +
  geom_point(size = 3, alpha = 0.8) +
  labs(title = "Hubungan Suhu dan Konsumsi Listrik", x = "Suhu (\u00B0C)", y = "Konsumsi (kWh)") +
  theme_minimal() #\u00B0C itu unicode dari (°C)
```

1. **Penjelasan Code:**

* **ggplot(data, aes(x = Suhu, y = Konsumsi_kWh, color = Cuaca))** → Menentukan suhu sebagai sumbu X, konsumsi listrik sebagai sumbu Y, dan warna berdasarkan cuaca.

* **geom_point(size = 3, alpha = 0.8)** → Membuat titik-titik data dengan ukuran 3 dan transparansi 80%.

* **labs(...)** → Memberikan judul dan label pada sumbu.

* **theme_minimal()** → Menjaga tampilan tetap sederhana.

2. **Penjelasan Visualisasi :**

Scatter plot ini menunjukkan hubungan antara suhu dan konsumsi listrik rumah tangga.
Titik-titik berwarna merepresentasikan kondisi cuaca, memperlihatkan bahwa semakin tinggi suhu, konsumsi listrik juga meningkat.
Grafik ini membantu mengidentifikasi pola korelasi antara dua variabel numerik.

3. **Definisi :**

Scatter plot adalah grafik yang menampilkan hubungan antara dua variabel numerik menggunakan titik-titik data.

4. **Aturan Penggunaan :**

Gunakan scatter plot untuk data numerik kontinu,
ketika ingin melihat pola, hubungan, atau tren antara dua variabel seperti suhu dan konsumsi listrik.

5. **Kelebihan :**
* Efektif menunjukkan hubungan antarvariabel.
* Dapat mengidentifikasi tren, korelasi, dan outlier.
* Visualisasi sederhana namun informatif.

6. **Kekurangan :** 
* Sulit dibaca jika data sangat banyak dan tumpang tindih.
* Tidak cocok untuk data kategorikal.
* Membutuhkan interpretasi statistik tambahan untuk analisis mendalam.

---

## Line Plot
```{r}
ggplot(data, aes(x = Tanggal, y = Konsumsi_kWh, color = Cuaca, group = 1)) +
  geom_line(linewidth = 1) +
  geom_point(size = 2) +
  labs(title = "Tren Konsumsi Listrik Harian",
       x = "Tanggal",
       y = "Konsumsi (kWh)") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

```

1. **Penjelasan Code :**

* **ggplot(data, aes(x = Tanggal, y = Konsumsi_kWh, color = Cuaca, group = 1))** → Menentukan tanggal sebagai sumbu X dan konsumsi listrik sebagai Y, dengan warna mengikuti cuaca.

* **geom_line(linewidth = 1)** → Menghubungkan titik data dengan garis untuk menunjukkan tren waktu.

* **geom_point(size = 2)** → Menambahkan titik di setiap tanggal agar lebih jelas.

* **labs(...)** → Menambahkan judul dan label sumbu.

* **theme_minimal()** → Mengatur tema sederhana.

* **theme(axis.text.x = element_text(angle = 45, hjust = 1))** → Memiringkan teks tanggal agar lebih terbaca.


2. **Penjelasan Visualisasi :**

Line plot ini menampilkan perubahan konsumsi listrik dari waktu ke waktu.
Setiap garis menggambarkan tren harian, menunjukkan bagaimana konsumsi listrik meningkat atau menurun sesuai kondisi cuaca.
Grafik ini membantu mengenali pola musiman atau perubahan penggunaan energi seiring berjalannya waktu.

3. **Definisi :**

Line plot adalah grafik yang menghubungkan titik-titik data dalam urutan tertentu untuk menampilkan perubahan atau tren dari waktu ke waktu.

4. **Aturan Penggunaan :**

Gunakan line plot untuk data numerik yang diukur berdasarkan urutan waktu (time series),
seperti tanggal, jam, atau bulan, guna memantau tren atau perubahan nilai secara berkelanjutan.

5. **Kelebihan :**
* Efektif menunjukkan tren dan fluktuasi dari waktu ke waktu.
* Mudah diinterpretasikan untuk data berurutan.
* Dapat menampilkan lebih dari satu seri data dengan warna berbeda.

6. **Kekurangan :** 
* Tidak cocok untuk data kategori tanpa urutan waktu.
* Sulit dibaca jika banyak garis tumpang tindih.
* Tidak menunjukkan variasi dalam setiap titik data.

---

## Density Plot
```{r}
ggplot(data, aes(x = Konsumsi_kWh, fill = Cuaca)) +
  geom_density(alpha = 0.6) +
  labs(title = "Kepadatan Distribusi Konsumsi Listrik per Cuaca", x = "Konsumsi (kWh)", y = "Kepadatan") +
  theme_minimal()
```

1. **Penjelasan Code :**

* **ggplot(data, aes(x = Konsumsi_kWh, fill = Cuaca))** → Menetapkan data konsumsi listrik dengan warna berdasarkan cuaca.

* **geom_density(alpha = 0.6)** → Membuat kurva kepadatan dengan transparansi 60%.

* **labs(...)** → Menambahkan judul dan label pada grafik.

* **theme_minimal()** → Mengatur tampilan agar sederhana dan bersih.

2. **Penjelasan Visualisasi :**

Density plot ini menampilkan sebaran konsumsi listrik untuk setiap kondisi cuaca dalam bentuk kurva halus.
Setiap warna menunjukkan kategori cuaca, dan tinggi kurva menunjukkan kepadatan data di nilai tertentu.
Grafik ini berguna untuk membandingkan bagaimana pola distribusi listrik berbeda antar cuaca.

3. **Definisi :**

Density plot adalah grafik berbentuk kurva yang menunjukkan distribusi probabilitas data numerik secara halus,
mirip histogram tetapi tanpa batang, sehingga bentuk sebaran data terlihat lebih mulus.

4. **Aturan Penggunaan :**

Gunakan density plot untuk data numerik kontinu,
terutama saat ingin membandingkan bentuk distribusi antara beberapa kelompok atau kategori.

5. **Kelebihan :**
* Menampilkan bentuk distribusi data dengan halus.
* Mudah membandingkan pola antara beberapa kelompok.
* Lebih rapi dibanding histogram saat data padat.

6. **Kekurangan :** 
* Tidak menunjukkan jumlah data secara langsung.
* Sulit ditafsirkan jika data terlalu sedikit.
* Overlap antar kurva dapat mengurangi keterbacaan.

## Riggeline
```{r}
ggplot(data, aes(x = Konsumsi_kWh, y = Cuaca, fill = Cuaca)) +
  geom_density_ridges(alpha = 0.7) +
  labs(title = "Ridgeline Plot Konsumsi Listrik Berdasarkan Cuaca", x = "Konsumsi (kWh)", y = "Cuaca") +
  theme_minimal()
```

1. **Penjelasan Code :**

* **ggplot(data, aes(x = Konsumsi_kWh, y = Cuaca, fill = Cuaca))** → Menetapkan sumbu X untuk konsumsi listrik dan sumbu Y untuk kategori cuaca.

* **geom_density_ridges(alpha = 0.7)** → Membuat kurva kepadatan bertumpuk untuk tiap kategori.

* **labs(...)** → Menambahkan judul dan label sumbu.

* **theme_minimal()** → Mengatur tampilan agar bersih dan profesional.


2. **Penjelasan Visualisasi :**

Ridgeline plot ini menggambarkan perbandingan sebaran konsumsi listrik antar kondisi cuaca dalam bentuk kurva bertumpuk.
Setiap kurva memperlihatkan kepadatan data untuk masing-masing kategori, sehingga perbedaan pola antar cuaca terlihat jelas.
Grafik ini memberikan tampilan visual yang menarik untuk analisis perbandingan distribusi.

3. **Definisi :**

Ridgeline plot adalah variasi dari density plot yang menampilkan beberapa kurva distribusi secara bertumpuk
untuk membandingkan bentuk sebaran data dari berbagai kelompok kategori.

4. **Aturan Penggunaan :**

Gunakan ridgeline plot untuk data numerik kontinu yang terbagi dalam beberapa kelompok kategori,
seperti konsumsi listrik berdasarkan cuaca, untuk menyoroti perbedaan pola distribusi antar kelompok.

5. **Kelebihan :**
* Memberikan tampilan visual yang menarik dan informatif.
* Mudah membandingkan banyak kategori dalam satu grafik.
* Menunjukkan perbedaan bentuk distribusi dengan jelas.

6. **Kekurangan :** 
* Sulit dibaca jika terlalu banyak kategori.
* Bisa membingungkan bagi pengguna awam.
* Membutuhkan ruang visual lebih besar agar tetap jelas.

---

# Kesimpulan

Berdasarkan data yang dihasilkan, dapat diamati bahwa kondisi cuaca berperan penting terhadap tingkat konsumsi listrik. Saat cuaca panas, konsumsi listrik cenderung meningkat karena penggunaan alat pendingin seperti kipas angin dan AC lebih tinggi. Sebaliknya, pada saat hujan, konsumsi listrik relatif menurun karena suhu lingkungan sudah cukup sejuk, Asumsikan saja ketika cuaca sedang panas penggunaan alat pendingin ruangan 10 jam perhari, Cerah hanya 8,5 Jam, dan saat hujan menjadi 7 Jam.

Secara keseluruhan, dataset ini menunjukkan keterkaitan logis antara variabel suhu, cuaca, dan konsumsi listrik, serta dapat menjadi contoh praktis untuk memahami jenis data dan logika pengelompokan dalam analisis data dasar menggunakan bahasa R.