library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)
setwd("C:/Users/user/Downloads/Tugas Probstat")
data <- read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
## Industri `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
## <chr> <chr> <chr> <chr>
## 1 Manufaktur Software Engineer Rendah Negatif
## 2 Keuangan Analis Keuangan Tinggi Positif
## 3 Teknologi Data Scientist Sedang Negatif
## 4 Teknologi Dosen Tinggi Positif
## 5 Teknologi Analis Keuangan Rendah Positif
## 6 Pendidikan Analis Keuangan Sedang Positif
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## # `Frekuensi Penggunaan AI per Minggu` <dbl>,
## # `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>
Dari data tersebut akan disajikan visualisasi data dalam bentuk Pie Chart. Berikut terlampir hasil visualisasi data Persentase Responden berdasarkan Distribusi Industri:
pie_chart <- ggplot(data, aes(x = "", fill = Industri)) +
geom_bar(width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Distribusi Industri") +
theme(axis.text.x = element_blank())
pie_chart
Pie chart ini menggambarkan distribusi data berdasarkan kategori
industri. Setiap irisan dalam pie chart mewakili proporsi dari setiap
kategori industri dalam keseluruhan data.Pie chart ini memberikan
gambaran visual tentang bagaimana data terdistribusi di antara berbagai
kategori industri.Pie chart ini adalah alat visual yang efektif untuk
menunjukkan distribusi data kategorikal.
Bar chart ini menggambarkan distribusi frekuensi dari tiga tingkat penggunaan AI: Rendah, Sedang, dan Tinggi. Sumbu horizontal (sumbu x) menunjukkan kategori tingkat penggunaan AI, sedangkan sumbu vertikal (sumbu y) menunjukkan frekuensi atau jumlah data untuk setiap kategori.
bar_chart <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
geom_bar() +
theme_minimal() +
labs(title = "Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")
bar_chart
Bar chart ini memungkinkan kita untuk membandingkan frekuensi data di
antara tiga tingkat penggunaan AI. Kita dapat melihat kategori mana yang
memiliki frekuensi tertinggi dan mana yang memiliki frekuensi
terendah.Dengan melihat bar chart ini, Anda dapat dengan cepat memahami
perbandingan frekuensi relatif dari berbagai tingkat penggunaan AI dalam
data yang diberikan.
Dot plot ini menggambarkan hubungan antara dua variabel: “Lama Bekerja (tahun)” dan “Efisiensi Sebelum AI”. Setiap titik (dot) pada grafik mewakili satu observasi atau data poin, di mana posisi titik tersebut ditentukan oleh nilai dari kedua variabel.
dot_plot <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")
dot_plot
Dot plot ini adalah alat visual yang berguna untuk mengeksplorasi
hubungan antara dua variabel numerik. Dengan melihat distribusi
titik-titik, kita dapat memperoleh wawasan tentang bagaimana
variabel-variabel tersebut berinteraksi.
Diagram batang-daun ini menyajikan distribusi data dari variabel “Lama Bekerja (tahun)”. Diagram ini membagi setiap data poin menjadi dua bagian: batang (stem) dan daun (leaf). Batang mewakili digit puluhan, sedangkan daun mewakili digit satuan dari setiap data poin.
stem(data$`Lama Bekerja (tahun)`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 11123344
## 0 | 5778889
## 1 | 4
## 1 | 7889
## 2 | 011233444
## 2 | 9
Diagram batang-daun ini adalah alat visual yang berguna untuk menyajikan dan menganalisis distribusi data numerik. Dengan melihat diagram ini, kita dapat dengan cepat memahami bagaimana data terdistribusi dan mengidentifikasi pola atau karakteristik penting dari data.
Histogram ini menggambarkan distribusi frekuensi dari penggunaan kecerdasan buatan (AI) per minggu. Sumbu horizontal (sumbu x) menunjukkan frekuensi penggunaan AI, sedangkan sumbu vertikal (sumbu y) menunjukkan jumlah individu yang memiliki frekuensi penggunaan AI tersebut.
histogram <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")
histogram
Histogram ini adalah alat visual yang berguna untuk menunjukkan
distribusi frekuensi data numerik. Dengan melihat histogram ini, kita
dapat dengan cepat memahami bagaimana frekuensi penggunaan AI
terdistribusi di antara individu.
Boxplot ini menggambarkan distribusi dari variabel “Lama Bekerja (tahun)”. Boxplot adalah alat visual yang berguna untuk menunjukkan ringkasan statistik dari suatu kumpulan data, termasuk median, kuartil, dan outlier.
boxplot_data <- ggplot(data) +
geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun"), alpha = 0.6) +
theme_minimal() +
labs(title = "Boxplot: Lama Bekerja dalam tahun", fill = "Kondisi")
boxplot_data
Boxplot ini adalah alat visual yang efektif untuk menunjukkan ringkasan
statistik dan distribusi data numerik. Dengan melihat boxplot ini, kita
dapat dengan cepat memahami karakteristik penting dari data lama bekerja
dalam tahun.
Density plot ini menggambarkan distribusi dari variabel “Efisiensi Kerja Sesudah AI”. Density plot adalah representasi visual dari distribusi probabilitas suatu variabel kontinu. Ini menunjukkan kepadatan data pada berbagai nilai variabel.
density_plot <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Efisiensi", y = "Density")
density_plot
Density plot ini adalah alat visual yang berguna untuk menunjukkan
distribusi probabilitas dari data numerik kontinu. Dengan melihat
density plot ini, kita dapat dengan cepat memahami karakteristik penting
dari distribusi efisiensi kerja setelah AI. # Menampilkan semua plot
grid.arrange(pie_chart, bar_chart, dot_plot, histogram, boxplot_data, density_plot, ncol = 2)