Final-test Komputasi Statistika

Summary, Hypothesis, ANOVA, MANOVA


*Kontak *\(\downarrow\)**
Email
Instagram https://www.instagram.com/cvnopp_/
RPubs https://rpubs.com/calvinriswandy/
Nama Calvin Riswandy
NIM 20214920003

1. Buatkan Rangkuman Materi Kuliah 1-15

Chapter 1

Probability Distribution adalah bagaimana nilai dari variabel random didistribusikan,. Contohnya, dari pelemparan koin yang dimana hasilnya akan dikumpulkan berdasarkan urutan dari pelemparan tersebut. Berikut adalah macam-macam cara untuk menghitung probability distribution.

  • Binomial Distribution

distribusi binomial adalah distribusi probabilitas diskrit artinya data-data tersebut saling berhubungan. Setiap asumsi hanya memiliki dua hasil yaitu “sukses” atau “gagal”.

  • Poisson Distribution

distribusi poisson adalah distribusi yang diskrit dari kejadian peristiwa independen dalam suatu interval. Distribusi ini melakukan banyak percobaan yang terjadi pada periode atau selang waktu tertentu.

  • Continuous Uniform Distribution

distribusi ini adalah jenis distribusi yang dimana semua hasil memiliki kemungkinan yang sama sehingga setiap variabel memiliki probabilitas yang sama terhadap hasil.

  • Exponential Distribution

disribusi ini biasa digunakan untuk menghitung wantu antara dua kejadian yang sudah terjadi atau akan terjadi. distribusi ini menggambarkan waktu kedatangan urutan kejadian independen yan berulang secara random.

  • Normal Distributio

distribusi ini menunjukan fungsi kepadatan tersebut dan apakah ada penyebaran dari suatu variabel. Biasanya data dikatakan berdistribusi normal jika bentuk penyebarannya berbentuk lonceng.

  • Chi-squared Distribution

distribusi ini digunakan untuk menguji perbedaan frekuensi observasi dengan frekuensi harapan.

  • Student t Distribution

biasanya pengujian distribusi ini digunakan jika sampel yang digunakan dalam penelitian terbilang kecil (kurang dari 30 sampel)

  • F Distributio

distribusi yang digunakan untuk membandingkan dua variabel random yang independen.

Chapter 2

Confidence Intervals merupakan parameter yang dipakai untuk menetukan akurasi dari rata-rata atau mean, untuk mentukan seberapa kuat akurasi kemungkinan statistik yang dihitung. Biasa tingkan kepercayaan yang digunakan sebesar 95%.

Berikut tahapan cara untuk menyusun confidence interval :

  • Estimasi point dari rata-rata populasi

  • Rata-rata populasi (SD diketahui)

  • Rata-rata populasi (SD tidak diketahui)

  • atau Ukuran sampel dari rata-rata populasi

  • Poin estimasi dari proporsi populasi

  • Estimasi selang dari proporsi populasi

  • Ukuran sampel dari populasi

Chapter 3

Hypothesis Testing adalah pengujian hipotesis berdasarkan sampel yang di observasi, hasilnya antara di terima atau di tolak, dengan adanya tiga kondisi uji hipotesis, antara lain :

  • Left Tailed Test : H0 : μ ≥ μ0 , H1 : μ < μ0

  • Right Tailed Test : H0 : μ ≤ μ0 , H1 : μ > μ0

  • Two Tailed Test : H0 : μ = μ0 , H1 : μ ≠ μ0

  • Tolak H0 jika t<0.05

  • Terima H0 jika t>0.05

  • Tolak H1 jika t>0.05

  • Terima H1 jika t<0.05

Chapter 4

A/B Testing adalah suatu cara membandingkan atau eksperimen yang menguji dua varian dengan melihat insight yang diberikan oleh pembaca, kalau yang sering dilihat, akan semakin meningkat konversinya.

A/A Testing adalah suatu cara membandingkan atau eskperimen yang menguji dua varian yang sama persis, sedangkan A/A testing tidak akan ditemukan yang sering dilihat.

Chapter 5

Goodness of Fit digunakan untuk menguji apakah data ssempel tersebut cocok dengan distribusi dari populasi.

metode yang biasa digunakan, antara lain :

  • Chi-square : Untuk menguji frekuensi observasi dengan frekuensi ekspetasi.

  • Kolmogorov-Smirnov : Untuk membandingkan distribusi data dengan distribusi data yang sudah dikonfersi ke dalam bentuk Z-score atau disebut distribusi normal baku.

  • Anderson-Darling : Untuk menguji sampel data yang berasal dari suatu populasi dengan distribusi tertentu.

  • Shapiro-Wilk : Untuk mengidentifikasi apakah si peubah acak mengikuti distribusi normal.

Chapter 6

Non-parametric Methods biasa digunakan untuk menganalisis data ketika asumsi distribusi yang umum kita ketahui tidak terpenuhi.

Ada 3 metode dalam uji statistik non parametrik, antara lain :

  • Wilcoxon Signed-Rank Test : Untuk menghitung seberapa signifikan perbedaan antara 2 kelompok data berpasangan berskala ordinal atau interval, tetapi datanya berdistribusi tidak normal.

  • Mann-Whitney-Wilcoxon Test : Untuk mengetahui ada atau tidaknya perbedaan dua sampel data yang bersifat independen dari populasi yang berbeda.

  • Kruskal-Wallis Test : Untuk alternatif dari uji one way ANOVA, jika kenormalan nya tidak terpenuhi.

Chapter 7

Simple Linear Regressionbiasa digunakan untuk menggambarkan hubungan antara satu atau lebih variabel respon.

Chapter 8

Inference in Linear Regression merupakan regresi linear yang memodelkan hubungan antara 2 variabel dengan menyesuaikan persamaan linear dengan data yang diamati.

Chapter 9

Multiple Linear Regression adalah metode untuk melihat hubungan variabel dependen dengan variabel independen yang lebih dari satu.

Chapter 10

Logistic Regression adalah metode untuk mengetahui hubungan antara beberapa variabel, biasanya bentuk garisnya tidak lurus seperti linear regression.

Chapter 11

ANOVA adalah tehnik yang digunakan untuk membandingkan rata-rata antara dua kelompok atau lebih.ANOVA akan menguji apakah ada perbedaan rata-rata kelompok pada setiap level variabel independen.

Jenis-jenis ANOVA, antara lain :

  • One Way ANOVA : hanya ada 1 faktor yang memengaruhi (Contoh : Tinggi padi dengan 3 jenis pupuk).

  • Two Way ANOVA : ada 2 faktor yang memengaruhi (Contoh : Tinggi padi dengan mesin yang mengolah jenis pupuk).

Chapter 12

RM-ANOVA dipakai untuk menganalisis data yang dimana subjek yang diukur lebih dari satu. RM-Anova biasa digunakan untuk menguji pengukuran secara berulang, biasanya menguji lebih dari 3 atau lebih sampel yang saling berpasangan.

Chapter 13

Mixed-ANOVA adalah untuk membandingkan rata-rata kelompok yang di klasifikasikan silang oleh 2 jenis variabel yang berbeda, termasuk :

  • Faktor antar subjek : kategori independen.

  • Faktor dalam subjek : kategori berulang.

Chapter 14

ANCOVA adalah perpaduan analisis varians(ANOVA) dan regrasi. ANCOVA membuat beberapa asumsi tentang data, seperti:

  • Linearitas antara kovariat dan variabel hasil pada setiap tingkat variabel pengelompokan. Ini dapat diperiksa dengan membuat plot sebar yang dikelompokkan dari kovariat dan variabel hasil.

  • Homogenitas lereng regresi. Kemiringan garis regresi, yang dibentuk oleh kovariat dan variabel hasil, harus sama untuk setiap kelompok. Asumsi ini mengevaluasi bahwa tidak ada interaksi antara hasil dan kovariat. Garis regresi yang diplot oleh kelompok harus paralel.

  • Variabel hasil harus kira-kira terdistribusi secara normal. Ini dapat diperiksa menggunakan uji normalitas Shapiro-Wilk pada residu model.

  • Homoskedastisitas atau homogenitas varian residu untuk semua kelompok. Residual diasumsikan memiliki varian konstan (homoskedastisitas)

  • Tidak ada outlier yang signifikan dalam kelompok

Chapter 15

MANOVA (Muttivariate Analysis Of Variance) digunakan untuk membandingkan rata-rata variabel Y, yaitu jenis data numerik yang berjumlah 2 atau lebih datanya dibandingkan dengan variabel X, yaitu jenis data kategorik.

2. Buatlah contoh penyelesaian Hipotesis testing dengan menggunakan R!

Contoh Soal:

Seorang guru ingin membandingkan 2 metode pembelajaran, untuk melihat yang mana metode yang paling efektif. Metode pertama adalah Berdiskusi, dan metode kedua adalah belajar sendiri di tempat yang nyaman. Untuk melakukan penelitian ini guru tersebut mengajak siswanya sebanyak 20 orang siswanya secara random dan lalu melakukan ulangan setelahnya.

  • Nilai Kelompok Berdikusi : 80,92,87,78,94,76,89,83,97,79

  • Nilai Kelompok yang belajar sendiri: 94,71,86,63,59,78,90,52,68,82

Buktikan apakah ada perbedaan pada hasil uji rata-rata dari kedua metode ini.

  • H0 : μ = 0, tidak terdapat perbedaan yang signifikan.
  • H1 : μ ≠ 0, terdapat perbedaan yang signifikan.

α/2 = 0,05/2 = 0,025

Dis = c(80,92,87,78,94,76,89,83,97,79)
Sen = c(94,71,86,63,59,78,90,52,68,82)

# Uji Normalitas

shapiro.test(Dis-Sen)
## 
##  Shapiro-Wilk normality test
## 
## data:  Dis - Sen
## W = 0.91375, p-value = 0.3078
t.test(Dis, Sen, paired = TRUE)
## 
##  Paired t-test
## 
## data:  Dis and Sen
## t = 2.0642, df = 9, p-value = 0.06901
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -1.074157 23.474157
## sample estimates:
## mean difference 
##            11.2

Kesimpulan

H0 diterima, H1 diterima karena nilai p-value > 0.05, atau 0.06901 > 0.05. Maka kesimpulannya terdapat pengaruh metode belajar terhadap nilai yang diperoleh mahasiswa.

3. Buatlah contoh penyelesaian ANOVA dengan menggunakan R!

Berikut ini adalah data penjualan rokok di warung di Ciputat setiap minggunya selama 12 minggu.

Hipotesis:

  • H0 : P-value > α , tidak terdapat perbedaan yang signifikan dari penjualan rokok di setiap minggunya
  • H1 : P-value < α , terdapat perbedaan yang signifikan dari penjualan rokok setiap minggunya.
library(readxl)
anova <- read_excel("penjualan.xlsx")
anova
HAnova <- aov(Sales ~ Minggu, data = anova)
summary(HAnova)
##             Df Sum Sq Mean Sq F value Pr(>F)
## Minggu       1   0.09   0.086   0.012  0.914
## Residuals   10  70.16   7.016

Hasilnya P-value > α atau 0.914 > 0.05, Maka H0 diterima, dan H1 ditolak. Maka kesimpulannya tidak terdapat perbedaan yang signifikan dari penjualan rokok di setiap minggunya.

4. Buatlah contoh penyelesaian MANOVA dengan menggunakan R!

Kasus: Anda ingin membandingkan pengaruh tiga jenis diet (A, B, dan C) terhadap empat parameter kesehatan (tekanan darah, kolesterol, gula darah, dan indeks massa tubuh). Anda melakukan penelitian pada 20 partisipan yang dibagi secara acak ke dalam tiga kelompok, di mana setiap kelompok diberikan diet yang berbeda selama 12 minggu.

  • H0: P-value > α , Tidak ada perbedaan yang signifikan antara kelompok diet dalam variabel respons (tekanan darah, kolesterol, gula darah, dan indeks massa tubuh).

  • H1: P-value < α ,Terdapat perbedaan yang signifikan antara kelompok diet dalam variabel respons (tekanan darah, kolesterol, gula darah, dan indeks massa tubuh).

# Mengimpor paket-paket yang diperlukan
library(car)
## Loading required package: carData
# Membaca data
data <- read_excel("DietK.xlsx")
data
# Melakukan uji MANOVA
result <- manova(cbind(Tekanan_Darah, Kolesterol) ~ Diet, data=data)

# Menampilkan hasil
summary(result)
##           Df  Pillai approx F num Df den Df  Pr(>F)  
## Diet       2 0.51428   2.9422      4     34 0.03432 *
## Residuals 17                                         
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Hasilnya P-value > α atau 0.03432 > 0.05 , yang artinya H0 ditolak dan H1 diterima, jadi Terdapat perbedaan yang signifikan antara kelompok diet dalam variabel respons (tekanan darah, kolesterol, gula darah, dan indeks massa tubuh).