Instal Library

Beberapa library yang perlu diinstal sebagai berikut :

library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)

Input Data

Data diinput dari Microsoft Excel dengan syntax sebagai berikut:

setwd("~/Semester 2/Probabilitas dan Statiska/Pertemuan 2")
data <- read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
##   Industri   `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
##   <chr>      <chr>             <chr>                   <chr>               
## 1 Manufaktur Software Engineer Rendah                  Negatif             
## 2 Keuangan   Analis Keuangan   Tinggi                  Positif             
## 3 Teknologi  Data Scientist    Sedang                  Negatif             
## 4 Teknologi  Dosen             Tinggi                  Positif             
## 5 Teknologi  Analis Keuangan   Rendah                  Positif             
## 6 Pendidikan Analis Keuangan   Sedang                  Positif             
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## #   `Frekuensi Penggunaan AI per Minggu` <dbl>,
## #   `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>

Pie Chart

Dari data tersebut akan disajikan visualisasi data dalam bentuk Pie Chart. Berikut terlampir hasil visualisasi datanya :

pie_chart <- ggplot(data, aes(x = "", fill = Industri)) +
  geom_bar(width = 1) +
  coord_polar("y", start = 0) +
  theme_minimal() +
  labs(title = "Distribusi Industri") +
  theme(axis.text.x = element_blank())

pie_chart

Dari hasil visualisai tersebut dapat dijelaskan bahwa distribusi industri seperti Kesehatan, Keuangan, Manufaktur, Pendidikan, dan Teknologi menyebar secara tidak merata dalam data tren penggunaan ai. Dimana posisi paling tinggi ditempati oleh industri Teknologi, kedua oleh industri Keuangan, ketinga oleh industri Manufaktur, keempat oleh industri Kesehatan, dan kelima oleh industri Pendidikan.

Bar Chart

Dari data tersebut akan disajikan visualisasi data dalam bentuk Bar Chart. Berikut terlampir hasil visualisasi datanya :

bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
  geom_bar() +
  theme_minimal() +
  labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")
bar_chart

Dari hasil visualisasi data tersebut dapat dijelaskan bahwa Distribusi Tingkat Penggunaan AI rendah dan sedang memiliki frekuensi yang sama yaitu sekitar 9 kali, dan Distribusi Tingkat Penggunaan AI tinggi memiliki frekuensi tertinggi yaitu sekitar 12 kali.

Dot Plot

Dari data tersebut akan disajikan visualisasi data dalam bentuk Dot Plot. Berikut terlampir hasil visualisasi datanya :

dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
  geom_point(color = "pink", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")

dot_plot

Dari hasil visualisasi data tersebut dapat dijelaskan bahwa grafik Dot Plot menggambarkan data antara lama bekerja dengan tingkat efisiensi sebelum menggunakan AI. Tidak terlihat pola yang jelas mengenai hubungan lama bekerja dengan efisensi sebelum AI, titik data nya terseber dengan acak yang menjelaskan bahwa lama nya bekerja tidak selalu berbanding lurus dengan efisiensi sebelum AI. Nilai efisiensi sebelum AI bervariasi dengan rentang sekitar 50 sampai 80.

Stem And Leaf Plot

Dari data tersebut akan disajikan visualisasi data dalam bentuk Stem and Leaf Plot. Berikut terlampir hasil visualisasi datanya :

stem(data$`Lama Bekerja (tahun)`)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   0 | 11123344
##   0 | 5778889
##   1 | 4
##   1 | 7889
##   2 | 011233444
##   2 | 9

Dari hasil visualisasi data tersebut dapat dijelaskan bahwa data Lama Bekerja menyebar atau memiliki rentang dari 0 sampai dengan 29 tahun. Bisa juga dilihat bahwa data lebih banyak berkumpul pada rentang 0 sampai dengan 10 tahun, karena pada rentang ini memiliki kepadatan yang lebih tinggi.

Histogram

Dari data tersebut akan disajikan visualisasi data dalam bentuk Histogram. Berikut terlampir hasil visualisasi datanya :

histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
  geom_histogram(binwidth = 5, fill = "pink", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")

histogram

Dari hasil visualisasi data tersebut dapat dijelaskan bahwa frekuensi penggunaan AI per minggu paling tinggi yaitu dengan nilai Frekuensi sekitar 15 kali dan jumalah individu sebanyak 5 orang, ada pula jumlah individu yang memiliki nilai frekuensi penggunaan AI per minggu paling rendah yaitu dengan nilai frekuensi 0 dengan jumlah individu 2 orang.

Box Plot

Dari data tersebut akan disajikan visualisasi data dalam bentuk Box Plot. Berikut terlampir hasil visualisasi datanya :

boxplot_data <- ggplot(data) +
  geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
  theme_minimal() +
  labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")

boxplot_data

Dari hasil visualisasi data tersebut dapat dijelaskan bahwa mayoritas individu memiliki lama bekerja dari rentang 5 sampai dengan 22 tahun, dengan median sekitar 15 tahun yang ditunjukkan pada (garis hitam ditengah).

Density Plot

Dari data tersebut aka disajikan visualisasi data dalam bentuk Density Plot. Berikut terlampir hasil visualisasi datanya :

density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
  geom_density(alpha = 0.5) +
  theme_minimal() +
  labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot

Dari hasil visualisasi data tersebut dapat dijelaskan bahwa puncak Efisiensi Kerja Sesudah AI terjadi pada rentang nilai 70 sampai dengan 80, yang artinya sebagian individu memiliki efisiensi kerja pada nilai rentang ini.

Menampilkan Semua Plot

grid.arrange(pie_chart, bar_chart, dot_plot, histogram, boxplot_data, density_plot, ncol = 2)

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.