Beberapa library yang perlu diinstall sebagai berikut:
library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)
Data diinput dari Microsoft Excel dengan syntax sebagai berikut:
setwd("C:/Users/UseR/Desktop/SEMESTER 2/PROBABILITAS STATISTIKA")
data<-read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
## Industri `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
## <chr> <chr> <chr> <chr>
## 1 Manufaktur Software Engineer Rendah Negatif
## 2 Keuangan Analis Keuangan Tinggi Positif
## 3 Teknologi Data Scientist Sedang Negatif
## 4 Teknologi Dosen Tinggi Positif
## 5 Teknologi Analis Keuangan Rendah Positif
## 6 Pendidikan Analis Keuangan Sedang Positif
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## # `Frekuensi Penggunaan AI per Minggu` <dbl>,
## # `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>
Dari data tersebut akan disajikan visualisasi data dalam bentuk pie chart. Berikut terlampir hasil visualisasi data persentase responden berdasarkan distribusi industri;
pie_chart<- ggplot(data, aes(x ="", fill = Industri)) +
geom_bar(width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Distribusi Industri") +
theme(axis.text.x = element_blank())
pie_chart
Dari hasil visualisasi data diatas dengan menggunakan Pie Chart dapat
dijelaskan bahwa Pie Chart yang mewakili 5 bagian distribusi industri
mewakili kategori industri tertentu. Semakin besar potongan pie chart
semakin besar pola persentase masing-masing industri berdasarkan data
yang digunakan dalam dataset excel tersebut.
Dari data tersebut akan disajikan visualisasi data dalam bentuk bar chart. Berikut terlampir hasil visualisasi data jumlah responden berdasarkan distribusi industri;
bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
geom_bar() +
theme_minimal() +
labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")
bar_chart
Dari hasil visualisasi data diatas dengan menggunakan Bar Chart dapat
dijelaskan bahwa tingkat penggunaan AI dengan tingkat “Tinggi” memilki
frekuensi tertinggi. Sedangkan, tingkat penggunaan AI tingkat “Sedang”
dan “Rendah” memiliki frekuensi yang sama. Hal ini dapat disimpulkan
bahwa jumlah pengguna AI dalam dataset memiliki keterlibatan tinggi
dalam penggunaan AI.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Dot Plot. Berikut terlampir hasil visualisasi data hubungan antaralama tahun bekerja denmgan efisiensi kerja sebelum menggunakan AI
dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")
dot_plot
Dari hasil visualisasi data diatas dengan menggunakan Dot Plot dapat
dijelaskan bahwa titik-titik yang tersebar menunjukkan bahwa lama
bekerja memiliki hubungan langsung dengan efisiensi sebelum mengunakan
AI. Beberapa individu dengan lama bekerja mempunyai efisiensi yang
tinggi dengan rentang efisiensi 50-60 dan lama bekerja dalam rentang
15-25.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Stem and Leaf Plot. Berikut terlampir hasil visualisasi data lama bekerja dalam tahun
stem(data$Lama Bekerja (tahun)
)
stem(data$`Lama Bekerja (tahun)`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 11123344
## 0 | 5778889
## 1 | 4
## 1 | 7889
## 2 | 011233444
## 2 | 9
Dari hasil visualisasi data diatas dengan menggunakan Stem and Leaf Plot dapat dijelaskan bahwa lebih banyak individu yang mempunyai pengalaman bekerja lebih singkat dibandingkan dengan yang pengalaman kerja lebih lama. Sebagian besar individu memiliki pengalaman lama bekerja di bawah 20 tahun.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Histogram. Berikut terlampir hasil visualisasi data frekuensi penggunaan AI per Minggu
histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")
histogram
Dari hasil visualisasi data diatas dengan menggunakan Histogram dapat
dijelaskan bahwa jumlah individu yang tidak terdistribusi merata
mengakibatkan beberapa puncak histogram di mana lebih banyak individu
memiliki frekuensi penggunaan AI per Minggu, sementara di frekuensi
lainnya jumlah individu lebih sedikit. Terdapat variasi dalam penggunaa
AI dengan sebagian individu memiliki kebiasaan penggunaan dalam rentang
tertentu.
histogram
Dari data tersebut akan disajikan visualisasi data dalam bentuk Boxplot. Berikut terlampir hasil visualisasi data lama bekerja dalam tahun
boxplot_data <- ggplot(data) +
geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
theme_minimal() +
labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")
boxplot_data
Dari hasil visualisasi data diatas dengan menggunakan Boxplot dapat
dijelaskan bahwa whiskers bagian atas menunjukkan lama bekerja cukup
besar dibandingkan whisker bagian bawah yang menunjukkan bahwa individu
memiliki lama bekerja yang berdekatan.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Density Plot. Berikut terlampir hasil visualisasi data efisiensi kerja sesudah AI
density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot
Dari hadil visualisasi data diatas dengan menggunaan Density Plot dapat
dijelaskan bahwa efisiensi kerja sesudah AI memiliki sebagian besar
individu yang berkisar 65-85 memiliki kepadatan tertinggi dengan nilai
tertentu.
grid.arrange(pie_chart, bar_chart, dot_plot, histogram, boxplot_data, density_plot, ncol = 2)
Menampilkan semua visualisasi data dengan: 1. Data tersebar di beberapa
industri seperti kesehatan, keuangan, manufaktur, pendidikan dan
teknologi. 2. Tingkat penggunaan AI ada 3, yaitu Rendah, Sedang, dan
Tinggi. Mayoritas individu berada di frekuensi tingkat penggunaan AI
“Tinggi” 3. Adanya hubungan antara lama bekerja dan efisiensi sebelum
AI. Beberapa individu dengan lama bekerja yang panjang memiliki variasi
efisiensi yang tinggi. 4. Sebagian besar individu memiliki pola
penggunaan AI yang jauh lebih tinggi atau lebih rendah dibanding
mayoritas. 5. Whiskers bagian atas menunjukkan lama bekerja cukup besar
dibandingkan whisker bagian bawah yang menunjukkan bahwa individu
memiliki lama bekerja yang berdekatan. 6. Adanya peningkatan setelah
menggunakan AI. Sebagian besar individu memiliki efisiensi dalam kisaran
tertentu.