Install dan load library

library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)

Import Data

setwd("C:/Users/user/Downloads/Tugas Probstat")
data <- read_excel("data_tren_penggunaan_ai.xlsx")
head(data)

## # A tibble: 6 × 8
##   Industri   `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
##   <chr>      <chr>             <chr>                   <chr>               
## 1 Manufaktur Software Engineer Rendah                  Negatif             
## 2 Keuangan   Analis Keuangan   Tinggi                  Positif             
## 3 Teknologi  Data Scientist    Sedang                  Negatif             
## 4 Teknologi  Dosen             Tinggi                  Positif             
## 5 Teknologi  Analis Keuangan   Rendah                  Positif             
## 6 Pendidikan Analis Keuangan   Sedang                  Positif             
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## #   `Frekuensi Penggunaan AI per Minggu` <dbl>,
## #   `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>

1. Pie Chart

Dari data tersebut akan disajikan visualisasi data dalam bentuk Pie Chart. Berikut terlampir hasil visualisasi data Persentase Responden berdasarkan Distribusi Industri:

pie_chart <- ggplot(data, aes(x = "", fill = Industri)) +
  geom_bar(width = 1) +
  coord_polar("y", start = 0) +
  theme_minimal() +
  labs(title = "Distribusi Industri") +
  theme(axis.text.x = element_blank())

pie_chart

Pie chart ini menggambarkan distribusi data berdasarkan kategori industri. Setiap irisan dalam pie chart mewakili proporsi dari setiap kategori industri dalam keseluruhan data.Pie chart ini memberikan gambaran visual tentang bagaimana data terdistribusi di antara berbagai kategori industri.Pie chart ini adalah alat visual yang efektif untuk menunjukkan distribusi data kategorikal.

2. Bar Chart

Bar chart ini menggambarkan distribusi frekuensi dari tiga tingkat penggunaan AI: Rendah, Sedang, dan Tinggi. Sumbu horizontal (sumbu x) menunjukkan kategori tingkat penggunaan AI, sedangkan sumbu vertikal (sumbu y) menunjukkan frekuensi atau jumlah data untuk setiap kategori.

bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
  geom_bar() +
  theme_minimal() +
  labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")

bar_chart

Bar chart ini memungkinkan kita untuk membandingkan frekuensi data di antara tiga tingkat penggunaan AI. Kita dapat melihat kategori mana yang memiliki frekuensi tertinggi dan mana yang memiliki frekuensi terendah.Dengan melihat bar chart ini, Anda dapat dengan cepat memahami perbandingan frekuensi relatif dari berbagai tingkat penggunaan AI dalam data yang diberikan.

3. Dot Plot

Dot plot ini menggambarkan hubungan antara dua variabel: “Lama Bekerja (tahun)” dan “Efisiensi Sebelum AI”. Setiap titik (dot) pada grafik mewakili satu observasi atau data poin, di mana posisi titik tersebut ditentukan oleh nilai dari kedua variabel.

dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
  geom_point(color = "blue", size = 2) +
  theme_minimal() +
  labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")

dot_plot

Dot plot ini adalah alat visual yang berguna untuk mengeksplorasi hubungan antara dua variabel numerik. Dengan melihat distribusi titik-titik, kita dapat memperoleh wawasan tentang bagaimana variabel-variabel tersebut berinteraksi.

4. Stem and Leaf Plot

Diagram batang-daun ini menyajikan distribusi data dari variabel “Lama Bekerja (tahun)”. Diagram ini membagi setiap data poin menjadi dua bagian: batang (stem) dan daun (leaf). Batang mewakili digit puluhan, sedangkan daun mewakili digit satuan dari setiap data poin.

stem(data$`Lama Bekerja (tahun)`)

## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   0 | 11123344
##   0 | 5778889
##   1 | 4
##   1 | 7889
##   2 | 011233444
##   2 | 9

Diagram batang-daun ini adalah alat visual yang berguna untuk menyajikan dan menganalisis distribusi data numerik. Dengan melihat diagram ini, kita dapat dengan cepat memahami bagaimana data terdistribusi dan mengidentifikasi pola atau karakteristik penting dari data.

5. Histogram

Histogram ini menggambarkan distribusi frekuensi dari penggunaan kecerdasan buatan (AI) per minggu. Sumbu horizontal (sumbu x) menunjukkan frekuensi penggunaan AI, sedangkan sumbu vertikal (sumbu y) menunjukkan jumlah individu yang memiliki frekuensi penggunaan AI tersebut.

histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
  geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")

histogram

Histogram ini adalah alat visual yang berguna untuk menunjukkan distribusi frekuensi data numerik. Dengan melihat histogram ini, kita dapat dengan cepat memahami bagaimana frekuensi penggunaan AI terdistribusi di antara individu.

6. Boxplot

Boxplot ini menggambarkan distribusi dari variabel “Lama Bekerja (tahun)”. Boxplot adalah alat visual yang berguna untuk menunjukkan ringkasan statistik dari suatu kumpulan data, termasuk median, kuartil, dan outlier.

boxplot_data <- ggplot(data) +
  geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
  theme_minimal() +
  labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")

boxplot_data

Boxplot ini adalah alat visual yang efektif untuk menunjukkan ringkasan statistik dan distribusi data numerik. Dengan melihat boxplot ini, kita dapat dengan cepat memahami karakteristik penting dari data lama bekerja dalam tahun.

7. Density Plot

Density plot ini menggambarkan distribusi dari variabel “Efisiensi Kerja Sesudah AI”. Density plot adalah representasi visual dari distribusi probabilitas suatu variabel kontinu. Ini menunjukkan kepadatan data pada berbagai nilai variabel.

density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
  geom_density(alpha = 0.5) +
  theme_minimal() +
  labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot

Density plot ini adalah alat visual yang berguna untuk menunjukkan distribusi probabilitas dari data numerik kontinu. Dengan melihat density plot ini, kita dapat dengan cepat memahami karakteristik penting dari distribusi efisiensi kerja setelah AI. # Menampilkan semua plot

grid.arrange(pie_chart, bar_chart, dot_plot, histogram, boxplot_data, density_plot, ncol = 2)

Tugas probstat 2

Muhammad Hafiz Ramdhani

2025-02-27