df <- read.csv(“C:/Users/User/Downloads/dataset_rumah tangga (1).csv”, sep=“;”)
library(tidyverse) library(dplyr)
#MINGGU 2 — Statistika Deskriptif + Visualisasi ringkasan <- df %>% summarise ( n = n(), mean_pendapatan = mean(pendapatan), median_pendapatan = median(pendapatan), sd_pendapatan = sd(pendapatan ), min_pendapatan = min(pendapatan ), max_pendapatan = max(pendapatan), mean_pengeluaran = mean(pengeluaran), median_pengeluaran = median(pengeluaran), sd_pengeluaran = sd(pengeluaran ), min_pengeluaran = min(pengeluaran ), max_pengeluaran = max(pengeluaran ) ) print(ringkasan ) # Grafikdasar # tampildi Plots (Histogram Pendapatan ) hist ( df\(pendapatan , main="Histogram PendapatanBulanan", xlab =" Pendapatan( Rp )") # tampildi Plots (Histogram Pengeluaran ) hist ( df\)pengeluaran , main=“Histogram PengeluaranBulanan”, xlab =” Pengeluaran( Rp )“) # tampildi Plots (Boxplot Pendapatan ) boxplot( df\(pendapatan , main="Boxplot Pendapatan", ylab =" Pendapatan( Rp )") # tampildi Plots (Boxplot Pengeluaran ) boxplot( df\)pengeluaran , main=”Boxplot Pengeluaran”, ylab =” Pengeluaran( Rp )“) # tampildi Plots ( MelihatHubunganantarPendapatandanPengeluaran ) plot( df\(pendapatan , df\)pengeluaran , main=” Pendapatanvs Pengeluaran”, xlab =” Pendapatan( Rp )“, ylab =” Pengeluaran( Rp )“)
barplot
4500000 ambang_pendapatan <- 3000000 ambang_pengeluaran <- 3300000 p_emp_pendapatan <- mean(df\(pendapatan > ambang_pendapatan) p_emp_pengeluaran <- mean(df\)pengeluaran > ambang_pengeluaran) prob_empiris <- data.frame( kejadian = c( paste0(“pendapatan >”, ambang_pendapatan), paste0(“pengeluaran >”, ambang_pengeluaran) ), peluang_empiris = c(p_emp_pendapatan, p_emp_pengeluaran) ) print(prob_empiris)
pmf_anggota <- prop.table(freq_anggota) pmf_df <- data.frame( anggota_keluarga = as.numeric(names(pmf_anggota)), probabilitas = as.numeric(pmf_anggota) ) print(pmf_df) barplot(pmf_anggota, main = “PMF Empiris Jumlah Anggota Keluarga”, xlab = “Jumlah Anggota”, ylab = “Probabilitas”)
mu <- mean(df\(pendapatan) sigma <- sd(df\)pendapatan) # Probabilitas model Normal: P(X > ambang_pendapatan) p_norm_pendapatan <- 1 - pnorm(ambang_pendapatan, mean = mu, sd = sigma) model_normal <- data.frame( distribusi = “Normal (aproksimasi)”, mu = mu, sd = sigma, ambang = ambang_pendapatan, p_model_X_gt_ambang = p_norm_pendapatan ) print(model_normal)
hist(df\(pendapatan, probability = TRUE, main="Pendapatan: Histogram + Kurva Normal (aproksimasi)", xlab="Pendapatan (Rp)") curve(dnorm(x, mean = mu, sd = sigma), add = TRUE, lwd = 2) knitr::opts_chunk\)set(echo = TRUE)
set.seed(123) B <- 2000 # jumlah simulasi n1 <- 10 n2 <- 30 mean_n10 <- replicate(B, mean(sample(df\(pendapatan, n1, replace = TRUE))) mean_n30 <- replicate(B, mean(sample(df\)pendapatan, n2, replace = TRUE))) sampling_df <- data.frame(mean_n10 = mean_n10, mean_n30 = mean_n30) sampling_df hist(mean_n10, main=“Distribusi Sampling Mean Pendapatan (n=10)”, xlab=“Mean Sampel”) hist(mean_n30, main=“Distribusi Sampling Mean Pendapatan (n=30)”, xlab=“Mean Sampel”)
mean_pendapatan <- mean(df\(pendapatan) ci_pendapatan <- t.test(df\)pendapatan, conf.level = 0.95)\(conf.int mean_pengeluaran <- mean(df\)pengeluaran) ci_pengeluaran <- t.test(df\(pengeluaran, conf.level = 0.95)\)conf.int estimasi <- data.frame( parameter = c(“mean_pendapatan”, “mean_pengeluaran”), estimasi_titik = c(mean_pendapatan, mean_pengeluaran), CI95_bawah = c(ci_pendapatan[1], ci_pengeluaran[1]), CI95_atas = c(ci_pendapatan[2], ci_pengeluaran[2]) ) print(estimasi)