library(readxl)
library(ggplot2)
library(gridExtra)
data <- read_excel("C:/Users/DELL/OneDrive/Documents/impor-bahan-baku-dan-barang-penolong2.xlsx", sheet = "Sheet1", skip = 2)
## New names:
## • `` -> `...4`
## • `` -> `...6`
## • `` -> `...8`
## • `` -> `...10`
colnames(data) <- c("Tahun", "Jumlah", "Makanan Minuman Utama", "Makanan Minuman Olahan",
"Bahan Baku Utama", "Bahan Baku Olahan", "Bahan Bakar Utama", "Bahan Bakar Olahan",
"Suku Cadang Barang Modal", "Suku Cadang Alat Angkutan")
data$Tahun <- as.factor(data$Tahun)
data <- na.omit(data)
Dari data tersebut akan dijadikan visualisasi data dalam bentuk pie chart. Berikut terlampir hasil visualisasi data komposisi impor tahun terbaru
data_latest <- data[nrow(data), 3:10]
names <- colnames(data_latest)
values <- as.numeric(data_latest)
df_pie <- data.frame(Category = names, Value = values)
pie_chart <- ggplot(df_pie, aes(x = "", y = Value, fill = Category)) +
geom_bar(stat = "identity", width = 1) +
coord_polar("y", start = 0) +
theme_void() +
ggtitle("Komposisi Impor Tahun Terbaru")
pie_chart
Statistik Deskriptif:
Pie chart menunjukkan distribusi komposisi impor berdasarkan kategori barang dalam tahun terbaru. Dari visualisasi ini, dapat dilihat bahwa kategori Bahan Baku Olahan memiliki porsi terbesar dalam total impor, diikuti oleh Bahan Baku Utama dan Bahan Bakar Olahan. Sementara itu, kategori dengan porsi terkecil adalah Suku Cadang Barang Modal dan Suku Cadang Alat Angkutan.
Statistik Inferensia:
Dari tren distribusi ini, dapat disimpulkan bahwa sebagian besar impor berfokus pada bahan baku yang digunakan dalam industri manufaktur dan energi. Jika pola ini berlanjut, kemungkinan besar akan ada peningkatan permintaan terhadap bahan baku ini di tahun-tahun mendatang. Faktor-faktor eksternal seperti kebijakan impor, perubahan harga global, dan kebutuhan industri domestik dapat mempengaruhi komposisi impor ke depannya.
Dari data tersebut, akan disajikan visualisasi data dalam bentuk Bar Chart. Berikut terlampir hasil visualisasi data jumlah impor per kategori barang.
bar_chart <- ggplot(data, aes(x = Tahun, y = `Bahan Baku Utama`, fill = Tahun)) +
geom_bar(stat = "identity") +
theme_minimal() +
ggtitle("Tren Impor Bahan Baku Utama")
bar_chart
Statistik Deskriptif:
Bar chart menunjukkan jumlah impor berdasarkan kategori barang. Dari visualisasi ini, dapat diamati bahwa Bahan Baku Olahan memiliki jumlah impor tertinggi, diikuti oleh Bahan Bakar Olahan dan Bahan Baku Utama. Sebaliknya, Suku Cadang Alat Angkutan memiliki jumlah impor yang paling rendah dibandingkan kategori lainnya.
Statistik Inferensia:
Dari tren ini, dapat diinterpretasikan bahwa kebutuhan terhadap bahan baku industri tetap tinggi, yang mencerminkan ketergantungan sektor produksi terhadap bahan baku impor. Lonjakan impor pada kategori tertentu mungkin berkaitan dengan perubahan kebijakan perdagangan atau peningkatan permintaan industri domestik.
Dari data tersebut, akan disajikan visualisasi data dalam bentuk Histogram. Berikut terlampir hasil visualisasi distribusi jumlah impor.
histogram <- ggplot(data, aes(x = Jumlah)) +
geom_histogram(binwidth = 10000, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
ggtitle("Distribusi Jumlah Impor")
histogram
Statistik Deskriptif:
Histogram menunjukkan distribusi jumlah impor di berbagai kategori. Dari grafik ini, dapat terlihat bahwa jumlah impor sebagian besar terpusat dalam rentang tertentu, dengan beberapa kategori memiliki volume impor yang jauh lebih tinggi dibandingkan kategori lainnya.
Distribusi ini dapat menunjukkan pola tertentu dalam data, misalnya apakah jumlah impor tersebar merata atau cenderung terfokus pada nilai tertentu. Jika histogram menunjukkan distribusi normal, berarti mayoritas kategori memiliki jumlah impor yang hampir sama, sementara distribusi yang miring menunjukkan adanya dominasi pada beberapa kategori tertentu.
Statistik Inferensia:
Melalui analisis inferensia, kita dapat mengidentifikasi apakah distribusi jumlah impor ini mengikuti pola tertentu yang dapat diprediksi. Jika distribusi menunjukkan adanya beberapa kategori dengan volume impor yang jauh lebih tinggi dibandingkan kategori lain, maka hal ini dapat mengindikasikan adanya ketergantungan terhadap jenis barang tertentu.
Faktor eksternal seperti regulasi impor, perubahan harga global, atau kebutuhan industri dapat mempengaruhi distribusi ini. Jika distribusi sangat miring ke kanan, mungkin ada peningkatan kebutuhan impor pada sektor tertentu.
Dari data tersebut, akan disajikan visualisasi data dalam bentuk Density Plot. Berikut terlampir hasil visualisasi distribusi kepadatan jumlah impor.
density_plot <- ggplot(data, aes(x = Jumlah)) +
geom_density(fill = "red", alpha = 0.5) +
theme_minimal() +
ggtitle("Density Plot Jumlah Impor")
density_plot
Statistik Deskriptif:
Density Plot menunjukkan distribusi kepadatan jumlah impor untuk berbagai kategori barang. Dari grafik ini, dapat terlihat bagaimana nilai-nilai impor tersebar dalam skala kontinu, berbeda dengan histogram yang menggunakan interval diskrit. Jika terdapat satu puncak yang dominan, itu menunjukkan bahwa sebagian besar kategori memiliki jumlah impor yang berkisar di sekitar nilai tersebut. Jika terdapat lebih dari satu puncak, berarti terdapat beberapa kelompok kategori dengan pola impor yang berbeda.
Statistik Inferensia:
Analisis inferensia dari Density Plot dapat membantu mengidentifikasi apakah distribusi jumlah impor mengikuti pola tertentu. Jika kurva distribusi miring ke kanan atau ke kiri, ini bisa menunjukkan adanya ketimpangan dalam jumlah impor antara kategori yang lebih besar dan lebih kecil. Sebagai contoh, jika terdapat ekor panjang di sisi kanan, ini menandakan bahwa ada beberapa kategori barang dengan jumlah impor yang jauh lebih tinggi dibandingkan kategori lainnya. Hal ini bisa terjadi akibat permintaan pasar yang tinggi terhadap barang tertentu atau kebijakan impor yang mempengaruhi sektor tertentu.
Dari data tersebut, akan disajikan visualisasi data dalam bentuk Boxplot. Berikut terlampir hasil visualisasi distribusi jumlah impor per kategori.
box_plot <- ggplot(data, aes(x = "", y = `Bahan Baku Utama`)) +
geom_boxplot(fill = "green", alpha = 0.5) +
theme_minimal() +
ggtitle("Boxplot Bahan Baku Utama")
box_plot
Statistik Deskriptif:
Boxplot menunjukkan penyebaran jumlah impor berdasarkan kategori barang. Dari visualisasi ini, kita dapat mengamati median, kuartil pertama (Q1), kuartil ketiga (Q3), serta potensi adanya outlier (nilai pencilan) dalam data.
Median (garis dalam kotak) menunjukkan nilai tengah dari distribusi jumlah impor. Kotak (IQR – Interquartile Range) mewakili rentang antara kuartil pertama (Q1) dan kuartil ketiga (Q3), yaitu 50% data yang berada di tengah distribusi.
Garis (whiskers) menunjukkan rentang minimum dan maksimum yang tidak dianggap sebagai outlier. Titik di luar whiskers adalah outlier, yang merupakan kategori dengan jumlah impor yang jauh lebih tinggi atau lebih rendah dibandingkan kategori lainnya.
Dari boxplot ini, dapat terlihat apakah data memiliki distribusi yang seimbang atau condong ke satu sisi, serta apakah terdapat variasi yang signifikan antar kategori impor.
Statistik Inferensia:
Boxplot membantu dalam memahami apakah data memiliki distribusi simetris atau condong ke satu sisi (skewed distribution). Jika median tidak berada di tengah kotak atau whiskers lebih panjang di satu sisi, ini menunjukkan distribusi yang tidak simetris.
Jika terdapat outlier, ini bisa mengindikasikan adanya kategori barang yang mengalami lonjakan atau penurunan drastis dalam jumlah impor, yang bisa disebabkan oleh faktor-faktor eksternal seperti kebijakan perdagangan, perubahan permintaan, atau gangguan rantai pasokan.
Boxplot juga dapat digunakan untuk membandingkan variasi antar kategori. Jika satu kategori memiliki boxplot yang lebih panjang dibandingkan kategori lain, berarti variasi jumlah impornya lebih besar, menunjukkan fluktuasi yang lebih tinggi.
grid.arrange(pie_chart, bar_chart, histogram, density_plot,box_plot , ncol=2, nrow=3)
Laporan ini telah menyajikan berbagai visualisasi data impor bahan baku dan barang penolong dalam bentuk Pie Chart, Bar Chart, Histogram, Density Plot, dan Boxplot. Setiap visualisasi dilengkapi dengan statistik deskriptif untuk memberikan gambaran umum pola data serta statistik inferensia untuk menginterpretasikan tren dan kemungkinan penyebab di balik pola yang diamati. Secara keseluruhan, analisis ini dapat membantu dalam memahami bagaimana tren impor bahan baku berkembang, kategori mana yang mendominasi, serta potensi faktor yang memengaruhi perubahan jumlah impor di masa mendatang.
Berikut adalah rata-rata untuk setiap variabel numerik dalam dataset:
mean(data$`Jumlah`)
## [1] 163298.5
Berikut adalah median untuk setiap variabel numerik dalam dataset:
median(data$`Jumlah`)
## [1] 164042.3
Berikut adalah modus untuk setiap variabel numerik dalam dataset:
modus <- function(x) {
uniqx <- unique(x)
uniqx[which.max(tabulate(match(x, uniqx)))]
}
sapply(data[, 2:10], modus)
## Jumlah Makanan Minuman Utama Makanan Minuman Olahan
## "160316.1" "14048.3" "7111.1"
## Bahan Baku Utama Bahan Baku Olahan Bahan Bakar Utama
## "27390.9" "56295.7" "22290.5"
## Bahan Bakar Olahan Suku Cadang Barang Modal Suku Cadang Alat Angkutan
## "30651.5" "1304.7" "1223.4000000000001"
Berikut adalah varians untuk setiap variabel numerik dalam dataset:
sapply(data[, 2:10], var, na.rm = TRUE)
## Jumlah Makanan Minuman Utama Makanan Minuman Olahan
## 207837827.09 561118.34 208756.93
## Bahan Baku Utama Bahan Baku Olahan Bahan Bakar Utama
## 18446655.07 8050537.13 26730504.81
## Bahan Bakar Olahan Suku Cadang Barang Modal Suku Cadang Alat Angkutan
## 9680794.22 50525.08 46540.95
Berikut adalah standar deviasi untuk setiap variabel numerik dalam dataset:
sapply(data[, 2:10], sd, na.rm = TRUE)
## Jumlah Makanan Minuman Utama Makanan Minuman Olahan
## 14416.5817 749.0783 456.8993
## Bahan Baku Utama Bahan Baku Olahan Bahan Bakar Utama
## 4294.9569 2837.3468 5170.1552
## Bahan Bakar Olahan Suku Cadang Barang Modal Suku Cadang Alat Angkutan
## 3111.3975 224.7778 215.7335