Beberapa library yang perlu diinstal sebagai berikut:
library(ggplot2)
library(readxl)
library(ggthemes)
## Warning: package 'ggthemes' was built under R version 4.4.2
library(gridExtra)
## Warning: package 'gridExtra' was built under R version 4.4.2
Data diinput dari Microsoft Excel dengan syntax sebagai berikut:
setwd("F:/Probabilitas dan Statistika/Pertemuan 2")
data<-read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
## Industri `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
## <chr> <chr> <chr> <chr>
## 1 Manufaktur Software Engineer Rendah Negatif
## 2 Keuangan Analis Keuangan Tinggi Positif
## 3 Teknologi Data Scientist Sedang Negatif
## 4 Teknologi Dosen Tinggi Positif
## 5 Teknologi Analis Keuangan Rendah Positif
## 6 Pendidikan Analis Keuangan Sedang Positif
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## # `Frekuensi Penggunaan AI per Minggu` <dbl>,
## # `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>
Dari data tersebut dapat disimpulkan bahwa industri manufaktur dengan jenis pekerjaan software engineer dan industri teknologi dengan jenis pekerjaan data scientist memiliki respon negatif terhadap AI. Selain itu tingkat penggunaan AI yang tinggi dicapai oleh industri keuangan dengan jenis pekerjaan analisis keuangan dan industri teknologi dengan jenis pekerjaan sebagai dosen.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Pie Chart. Berikut terlampir hasil visualisasi data Persentase Responden berdasarkan Distribusi Industri:
pie_chart <- ggplot(data,aes(x="",fill=Industri)) +
geom_bar(width=1) +
coord_polar("y",start=0) +
theme_minimal() +
labs(title = "Distribusi Industri") +
theme(axis.text.x = element_blank())
pie_chart
Dari hasil visualisasi tersebut dapat dijelaskan bahwa industri teknologi merupakan industri yang paling banyak memiliki responden. Sedangkan yang memiliki paling sedikit responden yaitu industri pendidikan.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Bar Chart. Berikut terlampir hasil visualisasi data Persentase Tingkat penggunaan AI berdasarkan distribusi Tingkat Penggunaan AI:
bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
geom_bar() +
theme_minimal() +
labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")
bar_chart
Dari hasil visualisasi tersebut dapat dijelaskan bahwa tingkat penggunaan AI yang tinggi masih menduduki peringkat pertama dengan frekuensi sekitar 11.5-12.0.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Dot Plot. Berikut terlampir hasil visualisasi data lama tahun bekerja vs efisiensi sebelum AI berdasarkan distribusi tingkat penggunaan AI:
dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")
dot_plot
Dari hasil visualisasi tersebut dapat disimpulkan bahwa lama bekerja dengan rentang waktu 0-10 tahun memiliki efisiensi sebelum AI dengan rata-rata yang lebih tinggi dibandingkan dengan lama bekerja dengan rentang waktu 20-30 tahun.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Stem and Leaf. Berikut terlampir hasil visualisasi data lama tahun bekerja berdasarkan distribusi tingkat penggunaan AI:
stem(data$`Lama Bekerja (tahun)`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 11123344
## 0 | 5778889
## 1 | 4
## 1 | 7889
## 2 | 011233444
## 2 | 9
Dari hasil visualisasi tersebut dapat disimpulkan bahwa lama tahun bekerja paling banyak sekitar 2.0-2.4 tahun. Sedangkan lama tahun bekerja paling sedikit adalah 1.4 tahun dan 2.9 tahun.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Histogram. Berikut terlampir hasil visualisasi data frekuensi penggunaan AI Perminggu berdasarkan distribusi tingkat penggunaan AI:
histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")
histogram
Dari hasil visualisasi tersebut dapat disimpulkan bahwa histogram tersebut tidak memiliki outlier sehingga data tersebut dapat dipastikan tidak memiliki hasil yang abnormal. Frekuensi penggunaan AI per minggu paling banyak berada di frekuensi 10-20 dengan jumlah individu paling banyak 5 orang. Sedangkan frekuensi paling sedikit berada di posisi 40 dengan jumlah individu hanya 1 orang.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Box Plot. Berikut terlampir hasil visualisasi data frekuensi lama bekerja dalam tahun berdasarkan distribusi tingkat penggunaan AI:
boxplot_data <- ggplot(data) +
geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
theme_minimal() +
labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")
boxplot_data
Dari hasil visualisasi data di atas dapat disimpulkan bahwa median dari lama tahun bekerja tersebut memiliki distribusi data yang tidak simetris karena garis median berada lebih dekat ke bawah. Lama bekerja dalam tahun tersebut memiliki frekuensi 5 hingga 20 tahun lama bekerja.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Density Plot. Berikut terlampir hasil visualisasi data frekuensi efisiensi kerja sesudah AI berdasarkan distribusi tingkat penggunaan AI:
density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot
Dari hasil visualisasi data tersebut dapat disimpulkan bahwa data tersebut termasuk ke dalam bimodal karena memiliki dua puncak. Efisiensi tertinggi dicapai pada range 70-75 dengan kepadatan atau density di atas 0.02.Sedangkan untuk efisiensi tertingi kedua dicapai pada range 90-95 dengan kepadatan di atas 0.01.
Hasil visualisasi data di atas dengan menggunakan semua plot disajikan sebagai berikut:
grid.arrange(pie_chart, bar_chart, dot_plot, histogram, boxplot_data, density_plot, ncol = 2)