Input Data

Data diinput dari Microsoft Excel dengan syntax sebagai berikut:

setwd("F:/Probabilitas dan Statistika/Pertemuan 2")
data<-read_excel("data_tren_penggunaan_ai.xlsx")
head(data)

## # A tibble: 6 × 8
##   Industri   `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
##   <chr>      <chr>             <chr>                   <chr>               
## 1 Manufaktur Software Engineer Rendah                  Negatif             
## 2 Keuangan   Analis Keuangan   Tinggi                  Positif             
## 3 Teknologi  Data Scientist    Sedang                  Negatif             
## 4 Teknologi  Dosen             Tinggi                  Positif             
## 5 Teknologi  Analis Keuangan   Rendah                  Positif             
## 6 Pendidikan Analis Keuangan   Sedang                  Positif             
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## #   `Frekuensi Penggunaan AI per Minggu` <dbl>,
## #   `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>

Dari data tersebut dapat disimpulkan bahwa industri manufaktur dengan jenis pekerjaan software engineer dan industri teknologi dengan jenis pekerjaan data scientist memiliki respon negatif terhadap AI. Selain itu tingkat penggunaan AI yang tinggi dicapai oleh industri keuangan dengan jenis pekerjaan analisis keuangan dan industri teknologi dengan jenis pekerjaan sebagai dosen.

Pie Chart

Dari data tersebut akan disajikan visualisasi data dalam bentuk Pie Chart. Berikut terlampir hasil visualisasi data Persentase Responden berdasarkan Distribusi Industri:

pie_chart <- ggplot(data,aes(x="",fill=Industri)) +
  geom_bar(width=1) +
  coord_polar("y",start=0) +
  theme_minimal() +
  labs(title = "Distribusi Industri") +
  theme(axis.text.x = element_blank())

pie_chart

Dari hasil visualisasi tersebut dapat dijelaskan bahwa industri teknologi merupakan industri yang paling banyak memiliki responden. Sedangkan yang memiliki paling sedikit responden yaitu industri pendidikan.

Bar Chart

Dari data tersebut akan disajikan visualisasi data dalam bentuk Bar Chart. Berikut terlampir hasil visualisasi data Persentase Tingkat penggunaan AI berdasarkan distribusi Tingkat Penggunaan AI:

bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
  geom_bar() +
  theme_minimal() +
  labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")

bar_chart

Dari hasil visualisasi tersebut dapat dijelaskan bahwa tingkat penggunaan AI yang tinggi masih menduduki peringkat pertama dengan frekuensi sekitar 11.5-12.0.

Dot Plot

Dari data tersebut akan disajikan visualisasi data dalam bentuk Dot Plot. Berikut terlampir hasil visualisasi data lama tahun bekerja vs efisiensi sebelum AI berdasarkan distribusi tingkat penggunaan AI:

dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
  geom_point(color = "blue", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")

dot_plot

Dari hasil visualisasi tersebut dapat disimpulkan bahwa lama bekerja dengan rentang waktu 0-10 tahun memiliki efisiensi sebelum AI dengan rata-rata yang lebih tinggi dibandingkan dengan lama bekerja dengan rentang waktu 20-30 tahun.

Stem and Leaf

Dari data tersebut akan disajikan visualisasi data dalam bentuk Stem and Leaf. Berikut terlampir hasil visualisasi data lama tahun bekerja berdasarkan distribusi tingkat penggunaan AI:

stem(data$`Lama Bekerja (tahun)`)

## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   0 | 11123344
##   0 | 5778889
##   1 | 4
##   1 | 7889
##   2 | 011233444
##   2 | 9

Dari hasil visualisasi tersebut dapat disimpulkan bahwa lama tahun bekerja paling banyak sekitar 2.0-2.4 tahun. Sedangkan lama tahun bekerja paling sedikit adalah 1.4 tahun dan 2.9 tahun.

Histogram

Dari data tersebut akan disajikan visualisasi data dalam bentuk Histogram. Berikut terlampir hasil visualisasi data frekuensi penggunaan AI Perminggu berdasarkan distribusi tingkat penggunaan AI:

histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
  geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")

histogram

Dari hasil visualisasi tersebut dapat disimpulkan bahwa histogram tersebut tidak memiliki outlier sehingga data tersebut dapat dipastikan tidak memiliki hasil yang abnormal. Frekuensi penggunaan AI per minggu paling banyak berada di frekuensi 10-20 dengan jumlah individu paling banyak 5 orang. Sedangkan frekuensi paling sedikit berada di posisi 40 dengan jumlah individu hanya 1 orang.

Box plot

Dari data tersebut akan disajikan visualisasi data dalam bentuk Box Plot. Berikut terlampir hasil visualisasi data frekuensi lama bekerja dalam tahun berdasarkan distribusi tingkat penggunaan AI:

boxplot_data <- ggplot(data) +
  geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
  theme_minimal() +
  labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")

boxplot_data

Dari hasil visualisasi data di atas dapat disimpulkan bahwa median dari lama tahun bekerja tersebut memiliki distribusi data yang tidak simetris karena garis median berada lebih dekat ke bawah. Lama bekerja dalam tahun tersebut memiliki frekuensi 5 hingga 20 tahun lama bekerja.

Density Plot

Dari data tersebut akan disajikan visualisasi data dalam bentuk Density Plot. Berikut terlampir hasil visualisasi data frekuensi efisiensi kerja sesudah AI berdasarkan distribusi tingkat penggunaan AI:

density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
  geom_density(alpha = 0.5) +
  theme_minimal() +
  labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot

Dari hasil visualisasi data tersebut dapat disimpulkan bahwa data tersebut termasuk ke dalam bimodal karena memiliki dua puncak. Efisiensi tertinggi dicapai pada range 70-75 dengan kepadatan atau density di atas 0.02.Sedangkan untuk efisiensi tertingi kedua dicapai pada range 90-95 dengan kepadatan di atas 0.01.

Menampilkan Semua Plot

Hasil visualisasi data di atas dengan menggunakan semua plot disajikan sebagai berikut:

grid.arrange(pie_chart, bar_chart, dot_plot, histogram, boxplot_data, density_plot, ncol = 2)

Visualisasi Data dengan ggplot2

Gallenina Mahsashera Widodo

2025-02-24

Install Library