Install Library

Beberapa library yanng perlu diinstall sebagai berikut:

library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)

Setting the Working Directory

Setelah mengInstall Library. Kita akan melakukan Set Working Directory atau setwd() untuk mengakses file Excel(.xlsx) di dalam folder yang sudah disimpan. Lalu gunakan read_excel() untuk membaca dataset dalam format Excel.

setwd("D:/Kuliah/Semester 2/Probabilitas dan Statistika/Pertemuan ke-2")
data <- read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
##   Industri   `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
##   <chr>      <chr>             <chr>                   <chr>               
## 1 Manufaktur Software Engineer Rendah                  Negatif             
## 2 Keuangan   Analis Keuangan   Tinggi                  Positif             
## 3 Teknologi  Data Scientist    Sedang                  Negatif             
## 4 Teknologi  Dosen             Tinggi                  Positif             
## 5 Teknologi  Analis Keuangan   Rendah                  Positif             
## 6 Pendidikan Analis Keuangan   Sedang                  Positif             
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## #   `Frekuensi Penggunaan AI per Minggu` <dbl>,
## #   `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>

Kemudian gunakan head(data) untuk melihat beberapa baris pertama dataset sebagai pratinjau awal.

1. Pie Chart

Ini adalah hasil visualisasi menggunakan Pie Chart, yang menggambarkan distribusi industri berdasarkan tingkat penggunaan AI. Berikut adalah hasilnya:

pie_chart <- ggplot(data, aes(x = "", fill = Industri)) +
  geom_bar(width = 1) +
  coord_polar("y", start = 0) +
  theme_minimal() +
  labs(title = "Distribusi Industri") +
  theme(axis.text.x = element_blank())

pie_chart

Pada Pie Chart, terlihat bahwa industri dengan penggunaan AI terbanyak adalah Teknologi, diikuti oleh Keuangan dan Manufaktur. Hal ini menunjukkan bahwa sektor teknologi menjadi yang paling adaptif terhadap implementasi AI, sementara industri manufaktur dan keuangan juga mulai mengadopsi teknologi ini secara bertahap.

2. Bar Chart

Ini adalah hasil visualisasi menggunakan Bar Chart, yang menunjukkan distribusi tingkat penggunaan AI di berbagai industri. Berikut adalah hasilnya:

bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
  geom_bar() +
  theme_minimal() +
  labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")

bar_chart

Pada Bar Chart, dapat disimpulkan bahwa mayoritas responden memiliki tingkat penggunaan AI yang Sedang hingga Tinggi, dengan jumlah yang lebih sedikit pada kategori Rendah. Hal ini menunjukkan bahwa AI semakin umum digunakan dalam berbagai pekerjaan, terutama di bidang Teknologi dan Keuangan.

3. Dot Plots

Ini adalah hasil visualisasi menggunakan Dot Plot, yang menggambarkan perbandingan antara lama bekerja dan efisiensi sebelum penggunaan AI. Berikut adalah hasilnya:

dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
  geom_point(color = "blue", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")

dot_plot

Dot Plot ini menunjukkan hubungan antara lama bekerja seseorang dengan efisiensi sebelum penerapan AI. Dari grafik, dapat dilihat bahwa pegawai dengan masa kerja lebih lama cenderung memiliki efisiensi yang lebih stabil, tetapi tidak selalu lebih tinggi dibandingkan pegawai yang lebih baru. Beberapa titik menunjukkan bahwa ada pekerja dengan pengalaman singkat namun memiliki efisiensi yang hampir setara dengan mereka yang sudah bekerja lebih lama.

4. Stem and Leaf Plot

Ini adalah hasil visualisasi menggunakan Stem and Leaf Plot, yang menggambarkan distribusi lama bekerja dari responden. Berikut adalah hasilnya:

stem(data$`Lama Bekerja (tahun)`)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   0 | 11123344
##   0 | 5778889
##   1 | 4
##   1 | 7889
##   2 | 011233444
##   2 | 9

Stem and Leaf Plot menunjukkan bahwa mayoritas responden memiliki lama bekerja dalam rentang tertentu, dengan beberapa outlier yang menandakan adanya pekerja dengan pengalaman jauh lebih lama atau lebih singkat. Distribusi ini membantu memahami pola penyebaran lama bekerja sebelum penerapan AI.

5. Histogram

Berikut adalah hasil visualisasi menggunakan Histogram, yang menunjukkan frekuensi penggunaan AI per minggu oleh responden. Grafik ini membantu memahami sebaran intensitas penggunaan AI.

histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
  geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")

histogram

Histogram menunjukkan bahwa sebagian besar responden menggunakan AI dengan frekuensi tertentu per minggu, dengan pola distribusi yang dapat mengindikasikan apakah penggunaan AI lebih sering terjadi dalam jumlah jam tertentu. Beberapa kelompok mungkin menggunakan AI secara intensif, sementara yang lain lebih jarang menggunakannya.

6. Box Plot

Berikut adalah hasil visualisasi menggunakan Box Plot, yang menunjukkan distribusi lama bekerja (dalam tahun) responden. Grafik ini membantu melihat variasi, median, serta adanya outlier dalam data.

boxplot_data <- ggplot(data) +
  geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
  theme_minimal() +
  labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")

boxplot_data

Box Plot menunjukkan bahwa mayoritas responden memiliki lama bekerja dalam rentang tertentu, dengan median yang menunjukkan nilai tengah dari distribusi. Rentang interkuartil (IQR) mengindikasikan persebaran utama data, sementara titik outlier menunjukkan pekerja dengan pengalaman jauh lebih lama atau lebih singkat dibandingkan mayoritas responden.

7. Density Plot

Berikut adalah hasil visualisasi menggunakan Density Plot, yang menunjukkan distribusi efisiensi kerja setelah penggunaan AI. Grafik ini membantu memahami pola penyebaran efisiensi kerja setelah penerapan AI.

density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
  geom_density(alpha = 0.5) +
  theme_minimal() +
  labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot

Density Plot menunjukkan bahwa efisiensi kerja setelah penggunaan AI memiliki pola distribusi tertentu, dengan puncak pada nilai tertentu yang mengindikasikan tingkat efisiensi paling umum. Grafik ini juga memperlihatkan apakah distribusi efisiensi kerja bersifat normal, condong ke kiri/kanan, atau memiliki lebih dari satu puncak.

Menampilkan semua Plot

Setelah semua plot dibuat, langkah terakhir adalah menampilkan seluruh visualisasi secara bersamaan untuk mempermudah analisis perbandingan data.

grid.arrange(
  pie_chart,
  bar_chart,
  dot_plot,
  histogram,
  boxplot_data,
  density_plot,
  ncol = 2,
  heights = c(1, 1, 1)
  )

Untuk menampilkan beberapa plot dalam satu tampilan, dapat digunakan fungsi seperti grid.arrange() dari library gridExtra.