This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.
Histogram adalah salah satu jenis visualisasi data yang digunakan
untuk menunjukkan distribusi frekuensi dari sekumpulan data numerik.
Dalam R, histogram dapat dibuat dengan fungsi dasar hist()
maupun menggunakan paket visualisasi seperti ggplot2.
Dokumen ini akan memandu Anda dalam membuat histogram dari file Excel menggunakan fungsi khusus di R.
Untuk membaca data dari file Excel, kita menggunakan paket
readxl. Pastikan file DataPopulasiJepang.xlsx
berada dalam direktori kerja.
# Membaca file Excel
library(readxl)
DataPopulasiJepang <- read_excel("C:/Users/USER/Downloads/Taufiqurrahman/DataPopulasiJepang.xlsx",
sheet = "Sheet1", range = "A1:E25", col_types = c("numeric",
"numeric", "numeric", "numeric",
"numeric"))
# Menampilkan struktur data
str(DataPopulasiJepang)
## tibble [24 × 5] (S3: tbl_df/tbl/data.frame)
## $ Tahun : num [1:24] 2000 2001 2002 2003 2004 ...
## $ TotalPopulation : num [1:24] 127 127 127 128 128 ...
## $ PopulationDensity: num [1:24] 340 341 342 342 343 ...
## $ Population : num [1:24] 0.1674 0.2412 0.2328 0.2142 0.0337 ...
## $ UrbanPopulation : num [1:24] 78.6 80 81.6 83.2 84.6 ...
Kita buat sebuah fungsi yang dapat digunakan untuk membuat histogram dari kolom tertentu:
buat_histogram <- function(data, kolom) {
if (!kolom %in% colnames(data)) {
stop("Kolom yang diminta tidak ditemukan dalam data.")
}
ggplot(data.frame(DataPopulasiJepang), aes(x = Population)) +
geom_histogram(bins = 10, fill = "skyblue", color = "black") +
labs(title = "Histogram")
}
Misalnya kita ingin membuat histogram dari kolom bernama
Nilai:
library(ggplot2)
buat_histogram(DataPopulasiJepang,"Population")
Catatan: Ganti “Nilai” dengan nama kolom sebenarnya sesuai dengan dataset Anda.
Dengan pendekatan ini, kita dapat dengan mudah membuat histogram dari
berbagai kolom hanya dengan memanggil fungsi
buat_histogram(). Ini sangat berguna untuk eksplorasi awal
data dan analisis distribusi.