Pada praktikum ini dipelajari dua materi utama, yaitu statistik deskriptif menggunakan fungsi buatan sendiri serta fungsi distribusi binomial Statistik deskriptif merupakan cabang statistik yang berfungsi merangkum dan menggambarkan karakteristik utama dari suatu kumpulan data melalui ukuran seperti mean, median, modus, variansi, dan deviasi standar. Fungsi distribusi seperti CDF dan PDF membantu memahami bagaimana suatu variabel acak tersebar serta mendukung pengambilan keputusan berbasis probabilitas. Berbagai jenis distribusi, seperti normal, uniform, dan eksponensial, dapat dianalisis dengan mudah menggunakan perangkat lunak R. Dengan dukungan paket seperti dplyr, ggplot2, dan stats, R menjadi alat yang kuat dan fleksibel untuk melakukan analisis statistik dan visualisasi data secara komprehensif.
Data dalam penelitian ini yaitu data sekunder yang merupakan data dari BPS Provinsi yaitu data “Rata-Rata Pendapatan Bersih Sebulan Pekerja Berusaha Sendiri menurut Provinsi dan Lapangan Pekerjaan Utama (ribu rupiah) tahun 2024”.
data <- c(
23.45, 45.67, 67.89, 34.56, 56.78, 78.90, 89.12, 45.67, 23.45, 67.89,
54.32, 32.76, 76.88, 90.12, 45.56, 56.34, 34.67, 67.89, 89.23, 23.45,
45.67, 67.34, 56.78, 78.65, 89.12, 65.72, 72.41, 41.23, 58.34, 62.89,
23.45, 45.67, 67.89, 34.56, 56.78, 78.90, 89.12, 65.72, 72.41
)
Gabungkan data untuk keperluan perhitungan manual:
data_all <- c(data)
manual_min <- function(x) sort(x)[1]
manual_max <- function(x) sort(x, decreasing = TRUE)[1]
manual_mean <- function(x) sum(x)/length(x)
manual_median <- function(x){
x <- sort(x)
n <- length(x)
if(n %% 2 == 1) x[(n+1)/2] else (x[n/2] + x[n/2 + 1]) / 2
}
manual_mode <- function(x){
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
manual_var <- function(x){
m <- manual_mean(x)
sum((x - m)^2) / (length(x)-1)
}
manual_sd <- function(x){
sqrt(manual_var(x))
}
manual_min(data_all)
## [1] 23.45
manual_max(data_all)
## [1] 90.12
manual_mean(data_all)
## [1] 58.39103
manual_median(data_all)
## [1] 58.34
manual_mode(data_all)
## [1] 23.45
manual_var(data_all)
## [1] 413.6789
manual_sd(data_all)
## [1] 20.3391
Diketahui peluang lampu cacat:
\[
p = 0.15,\quad n=8
\]
dbinom(2, size=8, prob=0.15)
## [1] 0.2376042
pbinom(2, size=8, prob=0.15)
## [1] 0.8947872
set.seed(123)
simulasi <- rbinom(10, 8, 0.15)
simulasi
## [1] 1 2 1 2 3 0 1 2 1 1
Dari kesimpulan pada praktikum ke-5 bahwa hasil analisis menunjukkan seluruh variabel memiliki variasi yang cukup besar, namun baik pada regresi sederhana maupun regresi berganda, variabel independen tidak memberikan pengaruh yang signifikan terhadap produktivitas kerja. Nilai R-squared yang rendah menandakan bahwa model hanya mampu menjelaskan sebagian kecil variasi produktivitas, sementara sebagian besar dipengaruhi oleh faktor lain yang tidak dimasukkan dalam model. Dengan demikian, hubungan antara pendidikan, pengalaman, dan kompetensi terhadap produktivitas kerja masih lemah, sehingga diperlukan penambahan variabel atau model yang lebih tepat untuk mendapatkan hasil analisis yang lebih akurat.