library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)
Data diinput dari Microsoft Excel dengan syntax sebagai berikut:
setwd("C:/Users/ameli/OneDrive/Documents")
data <- read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
## Industri `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
## <chr> <chr> <chr> <chr>
## 1 Manufaktur Software Engineer Rendah Negatif
## 2 Keuangan Analis Keuangan Tinggi Positif
## 3 Teknologi Data Scientist Sedang Negatif
## 4 Teknologi Dosen Tinggi Positif
## 5 Teknologi Analis Keuangan Rendah Positif
## 6 Pendidikan Analis Keuangan Sedang Positif
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## # `Frekuensi Penggunaan AI per Minggu` <dbl>,
## # `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>
Dari data tersebut dapat disimpulkan bahwa industri manufaktur dengan jenis pekerjaan software engineer dan industri teknologi dengan jenis pekerjaan data scientist memiliki respon negatif terhadap AI. Selain itu tingkat penggunaan AI yang tinggi dicapai oleh industri keuangan dengan jenis pekerjaan analisis keuangan dan industri teknologi dengan jenis pekerjaan sebagai dosen.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Pie Chart. Berikut terlampir hasil visualisasi data Persentase Responden berdasarkan Distribusi Industri:
pie_chart <- ggplot(data, aes(x = "", fill = Industri)) +
geom_bar(width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Distribusi Industri") +
theme(axis.text.x = element_blank())
pie_chart
Dari hasil visualisasi tersebut dapat dijelaskan bahwa industri
teknologi merupakan industri yang paling banyak memiliki responden.
Sedangkan yang memiliki paling sedikit responden yaitu industri
pendidikan.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Bar Chart. Berikut terlampir hasil visualisasi data Persentase Tingkat penggunaan AI berdasarkan distribusi Tingkat Penggunaan AI:
bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
geom_bar() +
theme_minimal() +
labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")
bar_chart
Dari hasil visualisasi tersebut dapat dijelaskan bahwa tingkat
penggunaan AI yang tinggi masih menduduki peringkat pertama dengan
frekuensi sekitar 11.5-12.0.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Dot Plot. Berikut terlampir hasil visualisasi data lama tahun bekerja vs efisiensi sebelum AI berdasarkan distribusi tingkat penggunaan AI:
dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")
dot_plot
Dari hasil visualisasi tersebut dapat disimpulkan bahwa lama bekerja
dengan rentang waktu 0-10 tahun memiliki efisiensi sebelum AI dengan
rata-rata yang lebih tinggi dibandingkan dengan lama bekerja dengan
rentang waktu 20-30 tahun.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Stem and Leaf. Berikut terlampir hasil visualisasi data lama tahun bekerja berdasarkan distribusi tingkat penggunaan AI:
stem(data$`Lama Bekerja (tahun)`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 11123344
## 0 | 5778889
## 1 | 4
## 1 | 7889
## 2 | 011233444
## 2 | 9
Dari hasil visualisasi tersebut dapat disimpulkan bahwa lama tahun bekerja paling banyak sekitar 2.0-2.4 tahun. Sedangkan lama tahun bekerja paling sedikit adalah 1.4 tahun dan 2.9 tahun.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Histogram. Berikut terlampir hasil visualisasi data frekuensi penggunaan AI Perminggu berdasarkan distribusi tingkat penggunaan AI:
histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")
histogram
Dari hasil visualisasi tersebut dapat disimpulkan bahwa histogram
tersebut tidak memiliki outlier sehingga data tersebut dapat dipastikan
tidak memiliki hasil yang abnormal. Frekuensi penggunaan AI per minggu
paling banyak berada di frekuensi 10-20 dengan jumlah individu paling
banyak 5 orang. Sedangkan frekuensi paling sedikit berada di posisi 40
dengan jumlah individu hanya 1 orang.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Box Plot. Berikut terlampir hasil visualisasi data frekuensi lama bekerja dalam tahun berdasarkan distribusi tingkat penggunaan AI:
boxplot_data <- ggplot(data) +
geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
theme_minimal() +
labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")
boxplot_data
Dari hasil visualisasi data di atas dapat disimpulkan bahwa median dari
lama tahun bekerja tersebut memiliki distribusi data yang tidak simetris
karena garis median berada lebih dekat ke bawah. Lama bekerja dalam
tahun tersebut memiliki frekuensi 5 hingga 20 tahun lama bekerja.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Density Plot. Berikut terlampir hasil visualisasi data frekuensi efisiensi kerja sesudah AI berdasarkan distribusi tingkat penggunaan AI:
density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot
Dari hasil visualisasi data tersebut dapat disimpulkan bahwa data
tersebut termasuk ke dalam bimodal karena memiliki dua puncak. Efisiensi
tertinggi dicapai pada range 70-75 dengan kepadatan atau density di atas
0.02.Sedangkan untuk efisiensi tertingi kedua dicapai pada range 90-95
dengan kepadatan di atas 0.01.
Hasil visualisasi data di atas dengan menggunakan semua plot disajikan sebagai berikut:
grid.arrange(pie_chart, bar_chart, dot_plot, histogram, boxplot_data, density_plot, ncol = 2)