# Install dan load library
library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)
# Import Data
setwd("D:/Kuliah/Semester2/W2/ProbStat/1-Praktikum-Visualisasi data")
data <- read_excel("data_tren_penggunaan_ai.xlsx")
head(data)
## # A tibble: 6 × 8
## Industri `Jenis Pekerjaan` `Tingkat Penggunaan AI` `Respon terhadap AI`
## <chr> <chr> <chr> <chr>
## 1 Manufaktur Software Engineer Rendah Negatif
## 2 Keuangan Analis Keuangan Tinggi Positif
## 3 Teknologi Data Scientist Sedang Negatif
## 4 Teknologi Dosen Tinggi Positif
## 5 Teknologi Analis Keuangan Rendah Positif
## 6 Pendidikan Analis Keuangan Sedang Positif
## # ℹ 4 more variables: `Lama Bekerja (tahun)` <dbl>,
## # `Frekuensi Penggunaan AI per Minggu` <dbl>,
## # `Efisiensi Kerja Sebelum AI` <dbl>, `Efisiensi Kerja Sesudah AI` <dbl>
Berdasarkan data sampel terkait tren penggunaan ai, berikut ini adalah hasil visualisasi data tren penggunaan ai berdasarkan jenis sifat datanya :
# Pie Chart
pie_chart1 <- ggplot(data, aes(x = "", fill = Industri)) +
geom_bar(width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Pie Chart : Distribusi Industri") +
theme(axis.text.x = element_blank())
pie_chart1
pie_chart2 <- ggplot(data, aes(x = "", fill = `Jenis Pekerjaan`)) +
geom_bar(width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Pie Chart : Distribusi Jenis Pekerjaan") +
theme(axis.text.x = element_blank())
pie_chart2
pie_chart3 <- ggplot(data, aes(x = "", fill = `Tingkat Penggunaan AI`)) +
geom_bar(width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Pie Chart : Distribusi Tingkat Penggunaan AI") +
theme(axis.text.x = element_blank())
pie_chart3
pie_chart4 <- ggplot(data, aes(x = "", fill = `Respon terhadap AI`)) +
geom_bar(width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Pie Chart : Distribusi Respon terhadap AI") +
theme(axis.text.x = element_blank())
pie_chart4
# Bar Chart
bar_chart1 <- ggplot(data, aes(x = `Industri`, fill = `Industri`)) +
geom_bar() +
theme_minimal() +
labs(title = "Bar Chart : Distribusi Industri", x = "Industri", y = "Frekuensi")
bar_chart1
bar_chart2 <- ggplot(data, aes(x = `Jenis Pekerjaan`, fill = `Jenis Pekerjaan`)) +
geom_bar() +
theme_minimal() +
labs(title = "Bar Chart : Distribusi Jenis Pekerjaan", x = "Jenis Pekerjaan", y = "Frekuensi")
bar_chart2
bar_chart3 <- ggplot(data, aes(x = `Tingkat Penggunaan AI`, fill = `Tingkat Penggunaan AI`)) +
geom_bar() +
theme_minimal() +
labs(title = "Bar Chart : Distribusi Tingkat Penggunaan AI", x = "Tingkat Penggunaan AI", y = "Frekuensi")
bar_chart3
bar_chart4 <- ggplot(data, aes(x = `Respon terhadap AI`, fill = `Respon terhadap AI`)) +
geom_bar() +
theme_minimal() +
labs(title = "Bar Chart : Distribusi Respon terhadap AI", x = "Respon terhadap AI", y = "Frekuensi")
bar_chart4
# Tampilkan semua plot data kategorik 1
grid.arrange(pie_chart1, bar_chart1, ncol = 2)
# Tampilkan semua data kategorik 2
grid.arrange(pie_chart2, bar_chart2, ncol = 2)
# Tampilkan semua data kategorik 3
grid.arrange(pie_chart3, bar_chart3, ncol = 2)
# Tampilkan semua data kategorik 4
grid.arrange(pie_chart4, bar_chart4, ncol = 2)
# Dot Plot
dot_plot1 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Frekuensi Penggunaan AI per Minggu`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Penggunaan AI per Minggu", x = "Lama Bekerja (tahun)", y = "Penggunaan AI per Minggu")
dot_plot1
dot_plot2 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sebelum AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sebelum AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sebelum AI")
dot_plot2
dot_plot3 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`, y = `Efisiensi Kerja Sesudah AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Lama Bekerja vs. Efisiensi Sesudah AI", x = "Lama Bekerja (tahun)", y = "Efisiensi Sesudah AI")
dot_plot3
dot_plot4 <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`, y = `Efisiensi Kerja Sebelum AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Frekuensi Penggunaan AI per Minggu vs. Efisiensi Sebelum AI", x = "Frekuensi Penggunaan AI per Minggu", y = "Efisiensi Sebelum AI")
dot_plot4
dot_plot5 <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`, y = `Efisiensi Kerja Sesudah AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Frekuensi Penggunaan AI per Minggu vs. Efisiensi Sesudah AI", x = "Frekuensi Penggunaan AI per Minggu", y = "Efisiensi Sesudah AI")
dot_plot5
dot_plot6 <- ggplot(data, aes(x = `Efisiensi Kerja Sebelum AI`, y = `Efisiensi Kerja Sesudah AI`)) +
geom_point(color = "blue", size = 2) +
theme_minimal() +
labs(title = "Dot Plot: Efisiensi Kerja Sebelum AI vs. Efisiensi Sesudah AI", x = "Efisiensi Kerja Sebelum AI", y = "Efisiensi Sesudah AI")
dot_plot6
# Histogram
histogram1 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Lama Bekerja dalam tahun", x = "Lama Bekerja (tahun)", y = "Jumlah Individu")
histogram1
histogram2 <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi", y = "Jumlah Individu")
histogram2
histogram3 <- ggplot(data, aes(x = `Efisiensi Kerja Sebelum AI`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Efisiensi Kerja Sebelum AI", x = "Persentase Efisiensi Kerja Sebelum AI", y = "Jumlah Individu")
histogram3
histogram4 <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`)) +
geom_histogram(binwidth = 5, fill = "blue", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Histogram: Frekuensi Efisiensi Kerja Sesudah AI", x = "Persentase Efisiensi Kerja Sesudah AI", y = "Jumlah Individu")
histogram4
# Box Plot
boxplot_data1 <- ggplot(data) +
geom_boxplot(aes(y = `Lama Bekerja (tahun)`, fill = "lama bekerja (tahun)"), alpha = 0.6) +
theme_minimal() +
labs(title = "Box plot: Lama Bekerja dalam tahun", fill = "Kondisi")
boxplot_data1
boxplot_data2 <- ggplot(data) +
geom_boxplot(aes(y = `Frekuensi Penggunaan AI per Minggu`, fill = "Frekuensi Penggunaan AI per Minggu"), alpha = 0.6) +
theme_minimal() +
labs(title = "Box plot: Frekuensi Penggunaan AI per Minggu", fill = "Kondisi")
boxplot_data2
boxplot_data3 <- ggplot(data) +
geom_boxplot(aes(y = `Efisiensi Kerja Sebelum AI`, fill = "Persentase Efisiensi Kerja Sebelum AI"), alpha = 0.6) +
theme_minimal() +
labs(title = "Box plot: Efisiensi Kerja Sebelum AI", fill = "Kondisi")
boxplot_data3
boxplot_data4 <- ggplot(data) +
geom_boxplot(aes(y = `Efisiensi Kerja Sesudah AI`, fill = "Persentase Efisiensi Kerja Sesudah AI"), alpha = 0.6) +
theme_minimal() +
labs(title = "Box plot: Efisiensi Kerja Sesudah AI", fill = "Kondisi")
boxplot_data4
# Density Plot
density_plot1 <- ggplot(data, aes(x = `Lama Bekerja (tahun)`,fill = "Lama Bekerja(tahun)")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Lama Bekerja dalam tahun", x = "Lama Bekerja(tahun)", y = "Density")
density_plot1
density_plot2 <- ggplot(data, aes(x = `Frekuensi Penggunaan AI per Minggu`,fill = "Frekuensi Penggunaan AI Per Minggu")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Frekuensi Penggunaan AI per Minggu", x = "Frekuensi Penggunaan AI Per Minggu", y = "Density")
density_plot2
density_plot3 <- ggplot(data, aes(x = `Efisiensi Kerja Sebelum AI`,fill = "Efisiensi Kerja Sebelum AI")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Efisiensi Kerja Sebelum AI", x = "Persentase Efisiensi Kerja Sebelum AI", y = "Density")
density_plot3
density_plot4 <- ggplot(data, aes(x = `Efisiensi Kerja Sesudah AI`,fill = "Efisiensi Kerja Sesudah AI")) +
geom_density(alpha = 0.5) +
theme_minimal() +
labs(title = "Density Plot: Efisiensi Kerja Sesudah AI", x = "Persentase Efisiensi Kerja Sesudah AI", y = "Density")
density_plot4
grid.arrange(histogram1, density_plot1, boxplot_data1, dot_plot1, dot_plot2, dot_plot3, ncol = 2)
stem(data$`Lama Bekerja (tahun)`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 11123344
## 0 | 5778889
## 1 | 4
## 1 | 7889
## 2 | 011233444
## 2 | 9
grid.arrange(histogram2, density_plot2, boxplot_data2, dot_plot4, dot_plot5, dot_plot1, ncol = 2)
stem(data$`Frekuensi Penggunaan AI per Minggu`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 02
## 0 | 56679
## 1 | 034
## 1 | 677
## 2 | 11224
## 2 | 6789
## 3 | 44
## 3 | 78
## 4 | 4
## 4 | 688
grid.arrange(histogram3, density_plot3, boxplot_data3, dot_plot6, dot_plot4, dot_plot2, ncol = 2)
stem(data$`Efisiensi Kerja Sebelum AI`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 4 | 244
## 4 | 556
## 5 | 002344
## 5 | 7788
## 6 | 233344
## 6 | 9
## 7 |
## 7 | 5689
## 8 | 000
grid.arrange(histogram4, density_plot4, boxplot_data4, dot_plot6, dot_plot5, dot_plot3 ,ncol = 2)
stem(data$`Efisiensi Kerja Sesudah AI`)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 5 | 02
## 5 | 579
## 6 | 1134
## 6 | 56
## 7 | 11224
## 7 | 555678
## 8 | 2
## 8 | 6
## 9 | 12344
## 9 | 9
Berdasarkan data tren penggunaanan ai, berikut ini adalah interpretasi dari chartnya berdasarkan jenis sifat data sampel :
Berikut ini adalah interpretasi dari jenis data sampel kategorik atau kualitatif sebagai berikut :
Distribusi Industri, dapat ditinjau dari pie chart dan bar chart data sampel bahwa industri dengan penggunaan ai tertinggi adalah industri teknologi. Sementara itu, industri dengan penggunaan ai terendah adalah industri pendidikan.
Distribusi Jenis Pekerjaan, dapat ditinjau dari pie chart dan bar chart data sampel bahwa jenis pekerjaan yang menjadi pengguna ai tertinggi adalah Analis Keuangan dan Data Scientist. Sementara itu, jenis pekerjaan yang menjadi pengguna ai terendah adalah Dokter.
Distribusi Tingkat Penggunaan AI, dapat ditinjau dari pie chart dan bar chart data sampel bahwa mayoritasnya menggunakan ai dengan tingkat tinggi. Sementara itu, jumlah sampel yang menggunakan ai dengan tingkat sedang dan rendah sama.
Distribusi Respon terhadap AI, dapat ditinjau dari pie chart dan bar chart data sampel bahwa mayoritasnya memiliki respon positif terhadap AI. Sementara itu, respon dengan jumlah sampel yang paling rendah adalah respon netral.
Berikut ini adalah interpretasi untuk jenis data sampel numerik atau kuantitatif sebagai berikut :
Distribusi Lama Bekerja, dapat ditinjau dari box plot bahwa median data sampel adalah sekitar 12 tahun. Dapat juga ditinjau dari histogram, density plot, serta stem and leaf plot bahwa panjang lama bekerja dari data sampel yang terbanyak ada di bawah 10 tahun lama bekerja. Sementara itu, panjang lama bekerja dari data sampel yang tersedikit ada di rentang 25-30 tahun lama bekerja.
Distribusi Frekuensi Penggunaan AI per Minggu, dapat ditinjau dari box plot bahwa median data sampel adalah sekitar 21 kali per minggu. Dapat juga ditinjau dari histogram, density plot, serta stem and leaf plot bahwa frekuensi penggunaan ai per minggu yang terbanyak dari data sampel ada di rentang 15-20 kali per minggu. Sementara itu, frekuensi penggunaan ai per minggu dari data sampel yang tersedikit ada di atas rentang 40-45 kali per minggu.
Distribusi Efisiensi Kerja Sebelum AI, dapat ditinjau dari box plot bahwa median data sampel adalah sekitar 57 persen. Dapat juga ditinjau dari histogram, density plot, serta stem and leaf plot bahwa persentase efisiensi kerja sebelum ai dari data sampel yang terbanyak ada di rentang 50-60 persen. Sementara itu, persentase efisiensi kerja sebelum ai dari data sampel yang tersedikit ada di rentang 70-75 persen.
Distribusi Efisiensi Kerja Sesudah AI, dapat ditinjau dari box plot bahwa median data sampel adalah sekitar 73 persen. Dapat juga ditinjau dari histogram, density plot, serta stem and leaf plot bahwa persentase efisiensi kerja sesudah ai dari data sampel yang terbanyak ada di rentang 75-80 persen. Sementara itu, persentase efisiensi kerja sesudah ai dari data sampel yang tersedikit ada di rentang 80-90 dan di atas 95 persen.
Berdasarkan data sampel tren penggunaan ai, dapat ditinjau dari dot plot bahwa relasi variabel lama bekerja dengan frekuensi penggunaan ai per minggu adalah di bawah 10 tahun lama bekerja frekuensi penggunaan ai kebanyakan masih di bawah 20 kali per minggu. Dapat juga ditinjau dari dot plot bahwa relasi variabel lama bekerja dengan persentase efisiensi kerja sebelum ai adalah kebanyakan memiliki persentase efisiensi kerja di rentang 40-60 persen terutama di bawah 10 tahun dan sekitar 20 tahun lama bekerja. Lalu dari dot plot ditemukan relasi antara variabel lama bekerja dengan persentase efisiensi kerja sesudah ai adalah kebanyakan memiliki persentase efisiensi kerja di rentang 55-75 persen terutama di rentang 20-25 tahun lama bekerja.
Dapat juga diamati dari dot plot bahwa relasi variabel frekuensi penggunaan ai per minggu dengan persentase efisiensi kerja sebelum ai adalah kebanyakan memiliki persentase efisiensi kerja di rentang 50-60 persen dengan frekuensi penggunaannya terletak di rentang 10-30 kali per minggu. Lalu relasi variabel frekuensi penggunaan ai per minggu dengan persentase efisiensi kerja sesudah ai adalah kebanyakan memiliki persentase efisiensi kerja di rentang 60-80 persen dengan frekuensinya terletak di rentang 10-30 kali per minggu.
Setelah itu ditinjau juga dari dot plot antara relasi variabel persentase efisiensi kerja sebelum ai dan persentase efisiensi kerja sesudah ai. Di mana dapat ditemukan bahwa terdapat kenaikan persentase dari sebelum ai dan sesudah ai dengan maksimumnya sekitar 10 persen. Perubahan persentase ini dapat diprediksikan dengan model regresi linier.