Berikut merupakan beberapa library yang diperlukan dan perlu di install:
library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)
`
Data diambil dari excel dengan format seperti berikut:
data <- read_excel("C:/Users/najwa/Downloads/data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
## Industri `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
## <chr> <chr> <chr> <chr>
## 1 Manufaktur Software Engineer Rendah Negatif
## 2 Keuangan Analis Keuangan Tinggi Positif
## 3 Teknologi Data Scientist Sedang Negatif
## 4 Teknologi Dosen Tinggi Positif
## 5 Teknologi Analis Keuangan Rendah Positif
## 6 Pendidikan Analis Keuangan Sedang Positif
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## # `Frekuensi Penggunaan AI per Minggu` <dbl>,
## # `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>
Dari data tersebut dapat disimpulkan bahwa Industri keuangan dengan jenis pekerjaan analis keuangan dan Industri Teknologi dengan pekerjaan dosen memiliki tingkat penggunaan AI yang tinggi dibandingkan dengan jenis pekerjaan lain. Selain itu, Industri manufaktur dengan jenis pekerjaan software engineer dan Industri teknologi dengan jenis pekerjaan analis keuangan memiliki tingkat penggunaan AI yang paling rendah diantara yang lain.
Berikut merupakan visualisasi berbentuk pie chart berdasarkan data persentase responden berdasarkan distrubusi industri:
pie_chart <- ggplot(data,aes(x="",fill=Industri)) +
geom_bar(width=1) +
coord_polar("y",start=0) +
theme_minimal() +
labs(title = "Distribusi Industri") +
theme(axis.text.x = element_blank())
pie_chart
Dari gambar pie chart diatas dapat diartikan bahwa responden terbanyak berasal dari industri teknologi dan responden dari industri pendidikan merupakan yang paling sedikit
Berikut merupakan visualisasi bar chart mengenai persentase tingkat penggunaan AI berdasarkan distribusi penggunaan AI:
bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
geom_bar() +
theme_minimal() +
labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")
bar_chart
Dari bar chart diatas dapat disimpulkan bahwa tingkat penggunaan AI yang tinggi, menjadi yang paling tinggi diantara tingkatan lainnya
Berikut merupakan visualisasi data lama tahun bekerja vs efisiensi sebelum AI berdasarkan distribusi tungkat penggunaan AI yang divisualisasikan kedalam bentuk dot plot:
dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")
dot_plot
Dari data diatas tidak dapat disimpulkan karena data tersebar secara acak
Berikut merupakan hasil visualisasi data lama tahun bekerja berdasarkan distribusi tingkat penggunaan AI kedalam bentuk steam dan leaf:
stem(data$`Lama Bekerja (tahun)`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 11123344
## 0 | 5778889
## 1 | 4
## 1 | 7889
## 2 | 011233444
## 2 | 9
Dari hasil visualisasi, didapat kesimpulan bahwa lama tahun bekerja dengan durasi 2,0 s/d 2,4 tahun merupakan yang paling banyak. Kemudian lama tahun bekerja yang paling sedikit yaitu 1,4 tahun dan 2,9 tahun
Berikut hasil visualisasi data frekuensi penggunaan AI Perminggu berdasarkan distribusi tingkat penggunaan AI dalam bentuk histogram:
histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")
histogram
Dari hasil visualisasi histogram diatas dapat disimpulkan bahwa data persebaran hampir mendekati kurva persebaran normal
Berikut merupakan hasil visualisasi data frekuensi lama bekerja dalam tahun berdasarkan distribusi tingkat penggunaan AI dalam bentuk box plot:
boxplot_data <- ggplot(data) +
geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
theme_minimal() +
labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")
boxplot_data
Dari visualisasi box plot diatas dapat disimpulkan bahwa nilai tengah lama tahun bekerja cenderung lebih dekat kebawah.
Berikut adalah hasil visualisasi data frekuensi efisiensi kerja sesudah AI berdasarkan distribusi tingkat penggunaan AI menggunakan density plot:
density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot
Berikut merupakan gabungan dari semua hasil visualisasi data yang telah dibuat:
grid.arrange(pie_chart, bar_chart, dot_plot, histogram, boxplot_data, density_plot, ncol = 2)