# Install dan load library
library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)

# Import Data
setwd("D:/Kuliah/Semester2/W2/ProbStat/1-Praktikum-Visualisasi data")
data <- read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
##   Industri   `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
##   <chr>      <chr>             <chr>                   <chr>               
## 1 Manufaktur Software Engineer Rendah                  Negatif             
## 2 Keuangan   Analis Keuangan   Tinggi                  Positif             
## 3 Teknologi  Data Scientist    Sedang                  Negatif             
## 4 Teknologi  Dosen             Tinggi                  Positif             
## 5 Teknologi  Analis Keuangan   Rendah                  Positif             
## 6 Pendidikan Analis Keuangan   Sedang                  Positif             
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## #   `Frekuensi Penggunaan AI per Minggu` <dbl>,
## #   `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>

Hasil Visualisasi Data

Berdasarkan data sampel terkait tren penggunaan ai, berikut ini adalah hasil visualisasi data tren penggunaan ai berdasarkan jenis sifat datanya :

Data Kategorik

# Pie Chart
pie_chart1 <- ggplot(data, aes(x = "", fill = Industri)) +
  geom_bar(width = 1) +
  coord_polar("y", start = 0) +
  theme_minimal() +
  labs(title = "Pie Chart : Distribusi Industri") +
  theme(axis.text.x = element_blank())

pie_chart1

pie_chart2 <- ggplot(data, aes(x = "", fill = `Jenis Pekerjaan`)) +
  geom_bar(width = 1) +
  coord_polar("y", start = 0) +
  theme_minimal() +
  labs(title = "Pie Chart : Distribusi Jenis Pekerjaan") +
  theme(axis.text.x = element_blank())

pie_chart2

pie_chart3 <- ggplot(data, aes(x = "", fill = `Tingkat Penggunaan AI`)) +
  geom_bar(width = 1) +
  coord_polar("y", start = 0) +
  theme_minimal() +
  labs(title = "Pie Chart : Distribusi Tingkat Penggunaan AI") +
  theme(axis.text.x = element_blank())

pie_chart3

pie_chart4 <- ggplot(data, aes(x = "", fill = `Respon terhadap AI`)) +
  geom_bar(width = 1) +
  coord_polar("y", start = 0) +
  theme_minimal() +
  labs(title = "Pie Chart : Distribusi Respon terhadap AI") +
  theme(axis.text.x = element_blank())

pie_chart4

# Bar Chart
bar_chart1 <- ggplot(data, aes(x = `Industri`, fill = `Industri`)) +
  geom_bar() +
  theme_minimal() +
  labs(title = "Bar Chart : Distribusi Industri", x = "Industri", y = "Frekuensi")

bar_chart1

bar_chart2 <- ggplot(data, aes(x = `Jenis Pekerjaan`, fill = `Jenis Pekerjaan`)) +
  geom_bar() +
  theme_minimal() +
  labs(title = "Bar Chart : Distribusi Jenis Pekerjaan", x = "Jenis Pekerjaan", y = "Frekuensi")

bar_chart2

bar_chart3 <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
  geom_bar() +
  theme_minimal() +
  labs(title = "Bar Chart : Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")

bar_chart3

bar_chart4 <- ggplot(data, aes(x = `Respon terhadap AI`, fill = `Respon terhadap AI`)) +
  geom_bar() +
  theme_minimal() +
  labs(title = "Bar Chart : Distribusi Respon terhadap AI", x = "Respon terhadap AI", y = "Frekuensi")

bar_chart4

  1. Distribusi Industri
# Tampilkan semua plot data kategorik 1
grid.arrange(pie_chart1, bar_chart1, ncol = 2)

  1. Distribusi Jenis Pekerjaan
# Tampilkan semua data kategorik 2
grid.arrange(pie_chart2, bar_chart2, ncol = 2)

  1. Distribusi Tingkat Penggunaan AI
# Tampilkan semua data kategorik 3
grid.arrange(pie_chart3, bar_chart3, ncol = 2)

  1. Distribusi Respon terhadap AI
# Tampilkan semua data kategorik 4
grid.arrange(pie_chart4, bar_chart4, ncol = 2)

Data Numerik

# Dot Plot
dot_plot1 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Frekuensi Penggunaan AI per Minggu`)) +
  geom_point(color = "blue", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Lama Bekerja vs. Penggunaan AI per Minggu", x = "Lama Bekerja (tahun)", y = "Penggunaan AI per Minggu")

dot_plot1

dot_plot2 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
  geom_point(color = "blue", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")

dot_plot2

dot_plot3 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sesudah AI`)) +
  geom_point(color = "blue", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sesudah AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sesudah AI")

dot_plot3

dot_plot4 <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`, y = `Efisiensi Kerja Sebelum AI`)) +
  geom_point(color = "blue", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Frekuensi Penggunaan AI per Minggu vs. Efisiensi Sebelum AI", x = "Frekuensi Penggunaan AI per Minggu", y = "Efisiensi Sebelum AI")

dot_plot4

dot_plot5 <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`, y = `Efisiensi Kerja Sesudah AI`)) +
  geom_point(color = "blue", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Frekuensi Penggunaan AI per Minggu vs. Efisiensi Sesudah AI", x = "Frekuensi Penggunaan AI per Minggu", y = "Efisiensi Sesudah AI")

dot_plot5

dot_plot6 <- ggplot(data, aes(x = `Efisiensi Kerja Sebelum AI`, y = `Efisiensi Kerja Sesudah AI`)) +
  geom_point(color = "blue", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Efisiensi Kerja Sebelum AI vs. Efisiensi Sesudah AI", x = "Efisiensi Kerja Sebelum AI", y = "Efisiensi Sesudah AI")

dot_plot6

# Histogram
histogram1 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`)) +
  geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Histogram: Frekuensi Lama Bekerja dalam tahun", x = "Lama Bekerja (tahun)", y = "Jumlah Individu")

histogram1

histogram2 <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
  geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")

histogram2

histogram3 <- ggplot(data, aes(x = `Efisiensi Kerja Sebelum AI`)) +
  geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Histogram: Frekuensi Efisiensi Kerja Sebelum AI", x = "Persentase Efisiensi Kerja Sebelum AI", y = "Jumlah Individu")

histogram3

histogram4 <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`)) +
  geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Histogram: Frekuensi Efisiensi Kerja Sesudah AI", x = "Persentase Efisiensi Kerja Sesudah AI", y = "Jumlah Individu")

histogram4

# Box Plot
boxplot_data1 <- ggplot(data) +
  geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun)"), alpha = 0.6) +
  theme_minimal() +
  labs(title = "Box plot: Lama Bekerja dalam tahun", fill = "Kondisi")

boxplot_data1

boxplot_data2 <- ggplot(data) +
  geom_boxplot(aes(y = `Frekuensi Penggunaan AI per Minggu`, fill = "Frekuensi Penggunaan AI per Minggu"), alpha = 0.6) +
  theme_minimal() +
  labs(title = "Box plot: Frekuensi Penggunaan AI per Minggu", fill = "Kondisi")

boxplot_data2

boxplot_data3 <- ggplot(data) +
  geom_boxplot(aes(y = `Efisiensi Kerja Sebelum AI`, fill = "Persentase Efisiensi Kerja Sebelum AI"), alpha = 0.6) +
  theme_minimal() +
  labs(title = "Box plot: Efisiensi Kerja Sebelum AI", fill = "Kondisi")

boxplot_data3

boxplot_data4 <- ggplot(data) +
  geom_boxplot(aes(y = `Efisiensi Kerja Sesudah AI`, fill = "Persentase Efisiensi Kerja Sesudah AI"), alpha = 0.6) +
  theme_minimal() +
  labs(title = "Box plot: Efisiensi Kerja Sesudah AI", fill = "Kondisi")

boxplot_data4

# Density Plot
density_plot1 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`,fill = "Lama Bekerja(tahun)")) +
  geom_density(alpha = 0.5) +
  theme_minimal() +
  labs(title = "Density Plot: Lama Bekerja dalam tahun", x = "Lama Bekerja(tahun)", y = "Density")

density_plot1

density_plot2 <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`,fill = "Frekuensi Penggunaan AI Per Minggu")) +
  geom_density(alpha = 0.5) +
  theme_minimal() +
  labs(title = "Density Plot: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi Penggunaan AI Per Minggu", y = "Density")

density_plot2

density_plot3 <- ggplot(data, aes(x = `Efisiensi Kerja Sebelum AI`,fill = "Efisiensi Kerja Sebelum AI")) +
  geom_density(alpha = 0.5) +
  theme_minimal() +
  labs(title = "Density Plot: Efisiensi Kerja Sebelum AI", x = "Persentase Efisiensi Kerja Sebelum AI", y = "Density")

density_plot3

density_plot4 <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi Kerja Sesudah AI")) +
  geom_density(alpha = 0.5) +
  theme_minimal() +
  labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Persentase Efisiensi Kerja Sesudah AI", y = "Density")

density_plot4

  1. Distribusi Lama Kerja (tahun)
grid.arrange(histogram1, density_plot1, boxplot_data1, dot_plot1, dot_plot2, dot_plot3, ncol = 2)

stem(data$`Lama Bekerja (tahun)`)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   0 | 11123344
##   0 | 5778889
##   1 | 4
##   1 | 7889
##   2 | 011233444
##   2 | 9
  1. Distribusi Frekuensi Penggunaan AI per Minggu
grid.arrange(histogram2, density_plot2, boxplot_data2, dot_plot4, dot_plot5, dot_plot1, ncol = 2)

stem(data$`Frekuensi Penggunaan AI per Minggu`)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   0 | 02
##   0 | 56679
##   1 | 034
##   1 | 677
##   2 | 11224
##   2 | 6789
##   3 | 44
##   3 | 78
##   4 | 4
##   4 | 688
  1. Distribusi Persentase Efisiensi Sebelum Kerja
grid.arrange(histogram3, density_plot3, boxplot_data3, dot_plot6, dot_plot4, dot_plot2, ncol = 2)

stem(data$`Efisiensi Kerja Sebelum AI`)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   4 | 244
##   4 | 556
##   5 | 002344
##   5 | 7788
##   6 | 233344
##   6 | 9
##   7 | 
##   7 | 5689
##   8 | 000
  1. Distribusi Persentase Efisiensi Sesudah Kerja
grid.arrange(histogram4, density_plot4, boxplot_data4, dot_plot6, dot_plot5, dot_plot3 ,ncol = 2)

stem(data$`Efisiensi Kerja Sesudah AI`)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   5 | 02
##   5 | 579
##   6 | 1134
##   6 | 56
##   7 | 11224
##   7 | 555678
##   8 | 2
##   8 | 6
##   9 | 12344
##   9 | 9

Interpretasi

Berdasarkan data tren penggunaanan ai, berikut ini adalah interpretasi dari chartnya berdasarkan jenis sifat data sampel :

Data Kategorik

Berikut ini adalah interpretasi dari jenis data sampel kategorik atau kualitatif sebagai berikut :

  1. Distribusi Industri, dapat ditinjau dari pie chart dan bar chart data sampel bahwa industri dengan penggunaan ai tertinggi adalah industri teknologi. Sementara itu, industri dengan penggunaan ai terendah adalah industri pendidikan.

  2. Distribusi Jenis Pekerjaan, dapat ditinjau dari pie chart dan bar chart data sampel bahwa jenis pekerjaan yang menjadi pengguna ai tertinggi adalah Analis Keuangan dan Data Scientist. Sementara itu, jenis pekerjaan yang menjadi pengguna ai terendah adalah Dokter.

  3. Distribusi Tingkat Penggunaan AI, dapat ditinjau dari pie chart dan bar chart data sampel bahwa mayoritasnya menggunakan ai dengan tingkat tinggi. Sementara itu, jumlah sampel yang menggunakan ai dengan tingkat sedang dan rendah sama.

  4. Distribusi Respon terhadap AI, dapat ditinjau dari pie chart dan bar chart data sampel bahwa mayoritasnya memiliki respon positif terhadap AI. Sementara itu, respon dengan jumlah sampel yang paling rendah adalah respon netral.

Data Numerik

Berikut ini adalah interpretasi untuk jenis data sampel numerik atau kuantitatif sebagai berikut :

  1. Distribusi Lama Bekerja, dapat ditinjau dari box plot bahwa median data sampel adalah sekitar 12 tahun. Dapat juga ditinjau dari histogram, density plot, serta stem and leaf plot bahwa panjang lama bekerja dari data sampel yang terbanyak ada di bawah 10 tahun lama bekerja. Sementara itu, panjang lama bekerja dari data sampel yang tersedikit ada di rentang 25-30 tahun lama bekerja.

  2. Distribusi Frekuensi Penggunaan AI per Minggu, dapat ditinjau dari box plot bahwa median data sampel adalah sekitar 21 kali per minggu. Dapat juga ditinjau dari histogram, density plot, serta stem and leaf plot bahwa frekuensi penggunaan ai per minggu yang terbanyak dari data sampel ada di rentang 15-20 kali per minggu. Sementara itu, frekuensi penggunaan ai per minggu dari data sampel yang tersedikit ada di atas rentang 40-45 kali per minggu.

  3. Distribusi Efisiensi Kerja Sebelum AI, dapat ditinjau dari box plot bahwa median data sampel adalah sekitar 57 persen. Dapat juga ditinjau dari histogram, density plot, serta stem and leaf plot bahwa persentase efisiensi kerja sebelum ai dari data sampel yang terbanyak ada di rentang 50-60 persen. Sementara itu, persentase efisiensi kerja sebelum ai dari data sampel yang tersedikit ada di rentang 70-75 persen.

  4. Distribusi Efisiensi Kerja Sesudah AI, dapat ditinjau dari box plot bahwa median data sampel adalah sekitar 73 persen. Dapat juga ditinjau dari histogram, density plot, serta stem and leaf plot bahwa persentase efisiensi kerja sesudah ai dari data sampel yang terbanyak ada di rentang 75-80 persen. Sementara itu, persentase efisiensi kerja sesudah ai dari data sampel yang tersedikit ada di rentang 80-90 dan di atas 95 persen.

Interpretasi Relasi Antara Dua Variabel Numerik

Berdasarkan data sampel tren penggunaan ai, dapat ditinjau dari dot plot bahwa relasi variabel lama bekerja dengan frekuensi penggunaan ai per minggu adalah di bawah 10 tahun lama bekerja frekuensi penggunaan ai kebanyakan masih di bawah 20 kali per minggu. Dapat juga ditinjau dari dot plot bahwa relasi variabel lama bekerja dengan persentase efisiensi kerja sebelum ai adalah kebanyakan memiliki persentase efisiensi kerja di rentang 40-60 persen terutama di bawah 10 tahun dan sekitar 20 tahun lama bekerja. Lalu dari dot plot ditemukan relasi antara variabel lama bekerja dengan persentase efisiensi kerja sesudah ai adalah kebanyakan memiliki persentase efisiensi kerja di rentang 55-75 persen terutama di rentang 20-25 tahun lama bekerja.

Dapat juga diamati dari dot plot bahwa relasi variabel frekuensi penggunaan ai per minggu dengan persentase efisiensi kerja sebelum ai adalah kebanyakan memiliki persentase efisiensi kerja di rentang 50-60 persen dengan frekuensi penggunaannya terletak di rentang 10-30 kali per minggu. Lalu relasi variabel frekuensi penggunaan ai per minggu dengan persentase efisiensi kerja sesudah ai adalah kebanyakan memiliki persentase efisiensi kerja di rentang 60-80 persen dengan frekuensinya terletak di rentang 10-30 kali per minggu.

Setelah itu ditinjau juga dari dot plot antara relasi variabel persentase efisiensi kerja sebelum ai dan persentase efisiensi kerja sesudah ai. Di mana dapat ditemukan bahwa terdapat kenaikan persentase dari sebelum ai dan sesudah ai dengan maksimumnya sekitar 10 persen. Perubahan persentase ini dapat diprediksikan dengan model regresi linier.