R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

Pendahuluan

Histogram adalah salah satu jenis visualisasi data yang digunakan untuk menunjukkan distribusi frekuensi dari sekumpulan data numerik. Dalam R, histogram dapat dibuat dengan fungsi dasar hist() maupun menggunakan paket visualisasi seperti ggplot2.

Dokumen ini akan memandu Anda dalam membuat histogram dari file Excel menggunakan fungsi khusus di R.

Membaca Data dari Excel

Untuk membaca data dari file Excel, kita menggunakan paket readxl. Pastikan file DataPopulasiJepang.xlsx berada dalam direktori kerja.

# Membaca file Excel
library(readxl)
DataPopulasiJepang <- read_excel("C:/Users/USER/Downloads/Taufiqurrahman/DataPopulasiJepang.xlsx", 
                                 sheet = "Sheet1", range = "A1:E25", col_types = c("numeric", 
                                                                                   "numeric", "numeric", "numeric", 
                                                                                   "numeric"))


# Menampilkan struktur data
str(DataPopulasiJepang)
## tibble [24 × 5] (S3: tbl_df/tbl/data.frame)
##  $ Tahun            : num [1:24] 2000 2001 2002 2003 2004 ...
##  $ TotalPopulation  : num [1:24] 127 127 127 128 128 ...
##  $ PopulationDensity: num [1:24] 340 341 342 342 343 ...
##  $ Population       : num [1:24] 0.1674 0.2412 0.2328 0.2142 0.0337 ...
##  $ UrbanPopulation  : num [1:24] 78.6 80 81.6 83.2 84.6 ...

Fungsi Membuat Histogram

Kita buat sebuah fungsi yang dapat digunakan untuk membuat histogram dari kolom tertentu:

buat_histogram <- function(data, kolom) {
  if (!kolom %in% colnames(data)) {
    stop("Kolom yang diminta tidak ditemukan dalam data.")
  }
  
  ggplot(data.frame(DataPopulasiJepang), aes(x = Population)) +
    geom_histogram(bins = 10, fill = "skyblue", color = "black") +
    labs(title = "Histogram")
}

Contoh Penggunaan Fungsi

Misalnya kita ingin membuat histogram dari kolom bernama Nilai:

library(ggplot2)
buat_histogram(DataPopulasiJepang,"Population")

Catatan: Ganti “Nilai” dengan nama kolom sebenarnya sesuai dengan dataset Anda.

Penutup

Dengan pendekatan ini, kita dapat dengan mudah membuat histogram dari berbagai kolom hanya dengan memanggil fungsi buat_histogram(). Ini sangat berguna untuk eksplorasi awal data dan analisis distribusi.