Beberapa library yanng perlu diinstall sebagai berikut:
library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)
Setelah mengInstall Library. Kita akan melakukan Set Working
Directory atau setwd() untuk mengakses file Excel(.xlsx) di
dalam folder yang sudah disimpan. Lalu gunakan read_excel()
untuk membaca dataset dalam format Excel.
setwd("D:/Kuliah/Semester 2/Probabilitas dan Statistika/Pertemuan ke-2")
data <- read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
## Industri `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
## <chr> <chr> <chr> <chr>
## 1 Manufaktur Software Engineer Rendah Negatif
## 2 Keuangan Analis Keuangan Tinggi Positif
## 3 Teknologi Data Scientist Sedang Negatif
## 4 Teknologi Dosen Tinggi Positif
## 5 Teknologi Analis Keuangan Rendah Positif
## 6 Pendidikan Analis Keuangan Sedang Positif
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## # `Frekuensi Penggunaan AI per Minggu` <dbl>,
## # `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>
Kemudian gunakan head(data) untuk melihat beberapa baris
pertama dataset sebagai pratinjau awal.
Ini adalah hasil visualisasi menggunakan Pie Chart, yang menggambarkan distribusi industri berdasarkan tingkat penggunaan AI. Berikut adalah hasilnya:
pie_chart <- ggplot(data, aes(x = "", fill = Industri)) +
geom_bar(width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Distribusi Industri") +
theme(axis.text.x = element_blank())
pie_chart
Pada Pie Chart, terlihat bahwa industri dengan penggunaan AI terbanyak adalah Teknologi, diikuti oleh Keuangan dan Manufaktur. Hal ini menunjukkan bahwa sektor teknologi menjadi yang paling adaptif terhadap implementasi AI, sementara industri manufaktur dan keuangan juga mulai mengadopsi teknologi ini secara bertahap.
Ini adalah hasil visualisasi menggunakan Bar Chart, yang menunjukkan distribusi tingkat penggunaan AI di berbagai industri. Berikut adalah hasilnya:
bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
geom_bar() +
theme_minimal() +
labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")
bar_chart
Pada Bar Chart, dapat disimpulkan bahwa mayoritas responden memiliki tingkat penggunaan AI yang Sedang hingga Tinggi, dengan jumlah yang lebih sedikit pada kategori Rendah. Hal ini menunjukkan bahwa AI semakin umum digunakan dalam berbagai pekerjaan, terutama di bidang Teknologi dan Keuangan.
Ini adalah hasil visualisasi menggunakan Dot Plot, yang menggambarkan perbandingan antara lama bekerja dan efisiensi sebelum penggunaan AI. Berikut adalah hasilnya:
dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")
dot_plot
Dot Plot ini menunjukkan hubungan antara lama bekerja seseorang dengan efisiensi sebelum penerapan AI. Dari grafik, dapat dilihat bahwa pegawai dengan masa kerja lebih lama cenderung memiliki efisiensi yang lebih stabil, tetapi tidak selalu lebih tinggi dibandingkan pegawai yang lebih baru. Beberapa titik menunjukkan bahwa ada pekerja dengan pengalaman singkat namun memiliki efisiensi yang hampir setara dengan mereka yang sudah bekerja lebih lama.
Ini adalah hasil visualisasi menggunakan Stem and Leaf Plot, yang menggambarkan distribusi lama bekerja dari responden. Berikut adalah hasilnya:
stem(data$`Lama Bekerja (tahun)`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 11123344
## 0 | 5778889
## 1 | 4
## 1 | 7889
## 2 | 011233444
## 2 | 9
Stem and Leaf Plot menunjukkan bahwa mayoritas responden memiliki lama bekerja dalam rentang tertentu, dengan beberapa outlier yang menandakan adanya pekerja dengan pengalaman jauh lebih lama atau lebih singkat. Distribusi ini membantu memahami pola penyebaran lama bekerja sebelum penerapan AI.
Berikut adalah hasil visualisasi menggunakan Histogram, yang menunjukkan frekuensi penggunaan AI per minggu oleh responden. Grafik ini membantu memahami sebaran intensitas penggunaan AI.
histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")
histogram
Histogram menunjukkan bahwa sebagian besar responden menggunakan AI dengan frekuensi tertentu per minggu, dengan pola distribusi yang dapat mengindikasikan apakah penggunaan AI lebih sering terjadi dalam jumlah jam tertentu. Beberapa kelompok mungkin menggunakan AI secara intensif, sementara yang lain lebih jarang menggunakannya.
Berikut adalah hasil visualisasi menggunakan Box Plot, yang menunjukkan distribusi lama bekerja (dalam tahun) responden. Grafik ini membantu melihat variasi, median, serta adanya outlier dalam data.
boxplot_data <- ggplot(data) +
geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
theme_minimal() +
labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")
boxplot_data
Box Plot menunjukkan bahwa mayoritas responden memiliki lama bekerja dalam rentang tertentu, dengan median yang menunjukkan nilai tengah dari distribusi. Rentang interkuartil (IQR) mengindikasikan persebaran utama data, sementara titik outlier menunjukkan pekerja dengan pengalaman jauh lebih lama atau lebih singkat dibandingkan mayoritas responden.
Berikut adalah hasil visualisasi menggunakan Density Plot, yang menunjukkan distribusi efisiensi kerja setelah penggunaan AI. Grafik ini membantu memahami pola penyebaran efisiensi kerja setelah penerapan AI.
density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot
Density Plot menunjukkan bahwa efisiensi kerja setelah penggunaan AI memiliki pola distribusi tertentu, dengan puncak pada nilai tertentu yang mengindikasikan tingkat efisiensi paling umum. Grafik ini juga memperlihatkan apakah distribusi efisiensi kerja bersifat normal, condong ke kiri/kanan, atau memiliki lebih dari satu puncak.
Setelah semua plot dibuat, langkah terakhir adalah menampilkan seluruh visualisasi secara bersamaan untuk mempermudah analisis perbandingan data.
grid.arrange(
pie_chart,
bar_chart,
dot_plot,
histogram,
boxplot_data,
density_plot,
ncol = 2,
heights = c(1, 1, 1)
)
Untuk menampilkan beberapa plot dalam satu tampilan, dapat digunakan
fungsi seperti grid.arrange() dari library gridExtra.