Beberapa library yang perlu diinstal sebagai berikut :
library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)
Data diinput dari Microsoft Excel dengan syntax sebagai berikut:
setwd("~/Semester 2/Probabilitas dan Statiska/Pertemuan 2")
data <- read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
## Industri `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
## <chr> <chr> <chr> <chr>
## 1 Manufaktur Software Engineer Rendah Negatif
## 2 Keuangan Analis Keuangan Tinggi Positif
## 3 Teknologi Data Scientist Sedang Negatif
## 4 Teknologi Dosen Tinggi Positif
## 5 Teknologi Analis Keuangan Rendah Positif
## 6 Pendidikan Analis Keuangan Sedang Positif
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## # `Frekuensi Penggunaan AI per Minggu` <dbl>,
## # `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>
Dari data tersebut akan disajikan visualisasi data dalam bentuk Pie Chart. Berikut terlampir hasil visualisasi datanya :
pie_chart <- ggplot(data, aes(x = "", fill = Industri)) +
geom_bar(width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Distribusi Industri") +
theme(axis.text.x = element_blank())
pie_chart
Dari hasil visualisai tersebut dapat dijelaskan bahwa distribusi industri seperti Kesehatan, Keuangan, Manufaktur, Pendidikan, dan Teknologi menyebar secara tidak merata dalam data tren penggunaan ai. Dimana posisi paling tinggi ditempati oleh industri Teknologi, kedua oleh industri Keuangan, ketinga oleh industri Manufaktur, keempat oleh industri Kesehatan, dan kelima oleh industri Pendidikan.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Bar Chart. Berikut terlampir hasil visualisasi datanya :
bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
geom_bar() +
theme_minimal() +
labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")
bar_chart
Dari hasil visualisasi data tersebut dapat dijelaskan bahwa Distribusi Tingkat Penggunaan AI rendah dan sedang memiliki frekuensi yang sama yaitu sekitar 9 kali, dan Distribusi Tingkat Penggunaan AI tinggi memiliki frekuensi tertinggi yaitu sekitar 12 kali.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Dot Plot. Berikut terlampir hasil visualisasi datanya :
dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
geom_point(color = "pink", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")
dot_plot
Dari hasil visualisasi data tersebut dapat dijelaskan bahwa grafik Dot Plot menggambarkan data antara lama bekerja dengan tingkat efisiensi sebelum menggunakan AI. Tidak terlihat pola yang jelas mengenai hubungan lama bekerja dengan efisensi sebelum AI, titik data nya terseber dengan acak yang menjelaskan bahwa lama nya bekerja tidak selalu berbanding lurus dengan efisiensi sebelum AI. Nilai efisiensi sebelum AI bervariasi dengan rentang sekitar 50 sampai 80.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Stem and Leaf Plot. Berikut terlampir hasil visualisasi datanya :
stem(data$`Lama Bekerja (tahun)`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 11123344
## 0 | 5778889
## 1 | 4
## 1 | 7889
## 2 | 011233444
## 2 | 9
Dari hasil visualisasi data tersebut dapat dijelaskan bahwa data Lama Bekerja menyebar atau memiliki rentang dari 0 sampai dengan 29 tahun. Bisa juga dilihat bahwa data lebih banyak berkumpul pada rentang 0 sampai dengan 10 tahun, karena pada rentang ini memiliki kepadatan yang lebih tinggi.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Histogram. Berikut terlampir hasil visualisasi datanya :
histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
geom_histogram(binwidth = 5, fill = "pink", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")
histogram
Dari hasil visualisasi data tersebut dapat dijelaskan bahwa frekuensi penggunaan AI per minggu paling tinggi yaitu dengan nilai Frekuensi sekitar 15 kali dan jumalah individu sebanyak 5 orang, ada pula jumlah individu yang memiliki nilai frekuensi penggunaan AI per minggu paling rendah yaitu dengan nilai frekuensi 0 dengan jumlah individu 2 orang.
Dari data tersebut akan disajikan visualisasi data dalam bentuk Box Plot. Berikut terlampir hasil visualisasi datanya :
boxplot_data <- ggplot(data) +
geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
theme_minimal() +
labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")
boxplot_data
Dari hasil visualisasi data tersebut dapat dijelaskan bahwa mayoritas individu memiliki lama bekerja dari rentang 5 sampai dengan 22 tahun, dengan median sekitar 15 tahun yang ditunjukkan pada (garis hitam ditengah).
Dari data tersebut aka disajikan visualisasi data dalam bentuk Density Plot. Berikut terlampir hasil visualisasi datanya :
density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot
Dari hasil visualisasi data tersebut dapat dijelaskan bahwa puncak Efisiensi Kerja Sesudah AI terjadi pada rentang nilai 70 sampai dengan 80, yang artinya sebagian individu memiliki efisiensi kerja pada nilai rentang ini.
grid.arrange(pie_chart, bar_chart, dot_plot, histogram, boxplot_data, density_plot, ncol = 2)
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.