Pada latihan ini akan dibuat visualisasi histogram untuk nilai
(value) dari orders yang berasal dari negara-negara Nordic.
Negara Nordic yang digunakan dalam analisis ini adalah:
Histogram digunakan untuk melihat distribusi nilai order yang diterima dari negara-negara tersebut.
Langkah pertama adalah membangun koneksi antara RStudio dan database MySQL menggunakan fungsi dbConnect()
library(DBI)
## Warning: package 'DBI' was built under R version 4.5.2
library(odbc)
## Warning: package 'odbc' was built under R version 4.5.2
con <- dbConnect(
odbc(),
Driver = "MySQL ODBC 9.6 Unicode Driver",
Server = "127.0.0.1",
Database = "classicmodels",
UID = "root",
PWD = "password",
Port = 3306
)
Pada kode di atas:
library(DBI) digunakan untuk menyediakan fungsi koneksi
database di R.library(odbc) digunakan sebagai driver untuk
menghubungkan R dengan database melalui ODBC.dbConnect() digunakan untuk membuat koneksi ke database
MySQL dengan menentukan driver, server, nama database, username,
password, dan port.Setelah koneksi berhasil dilakukan, langkah berikutnya adalah mengambil data nilai pembayaran (value) dari tabel payments yang terkait dengan pelanggan dari negara Nordic.
query <- "
SELECT p.amount
FROM customers c
JOIN payments p
ON c.customerNumber = p.customerNumber
WHERE c.country IN ('Denmark','Finland','Norway','Sweden')
"
data_nordic <- dbGetQuery(con, query)
head(data_nordic)
## amount
## 1 50218.95
## 2 1491.38
## 3 17876.32
## 4 34638.14
## 5 36005.71
## 6 7674.94
str(data_nordic)
## 'data.frame': 27 obs. of 1 variable:
## $ amount: num 50219 1491 17876 34638 36006 ...
Penjelasan kode:
JOIN digunakan untuk menggabungkan tabel
customers dan payments melalui
customerNumber.WHERE digunakan untuk memfilter data hanya dari negara
Nordic.value adalah nilai pembayaran yang akan digunakan dalam
visualisasi.Setelah data diperoleh, langkah berikutnya adalah membuat histogram untuk melihat distribusi nilai pembayaran.
library(ggplot2)
ggplot(data_nordic, aes(x = amount)) +
geom_histogram(
bins = 10,
fill = "skyblue",
color = "black"
) +
labs(
title = "Histogram Nilai Orders dari Negara Nordic",
x = "Nilai (Value) Orders",
y = "Frekuensi"
) +
theme_minimal()
Penjelasan:
hist() digunakan untuk membuat histogram.data_nordic$value adalah data nilai pembayaran yang
divisualisasikan.main memberikan judul grafik.xlab adalah label sumbu X yang menunjukkan nilai
order.ylab adalah label sumbu Y yang menunjukkan frekuensi
jumlah order.col digunakan untuk memberi warna pada histogram.Histogram yang dihasilkan menunjukkan distribusi nilai order yang
berasal dari negara Nordic.
Dari visualisasi tersebut dapat diamati bagaimana penyebaran nilai
pembayaran, apakah lebih banyak pada nilai kecil, sedang, atau besar.
Histogram membantu memahami pola distribusi data order dari
negara-negara tersebut.