Dengan menggunakan data StudentsPerformance.csv ujilah apakah ada perbedaan antara nilai skor Matematika dan nilai skor reading?
data = read.csv("C:/Users/VELICIA FRANSISCA/Downloads/StudentsPerformance.csv",head = TRUE)
head(data)
## gender race.ethnicity parental.level.of.education lunch
## 1 female group B bachelor's degree standard
## 2 female group C some college standard
## 3 female group B master's degree standard
## 4 male group A associate's degree free/reduced
## 5 male group C some college standard
## 6 female group B associate's degree standard
## test.preparation.course math.score reading.score writing.score
## 1 none 72 72 74
## 2 completed 69 90 88
## 3 none 90 95 93
## 4 none 47 57 44
## 5 none 76 78 75
## 6 none 71 83 78
length(data$math.score)
## [1] 1000
summary(data$math.score)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 57.00 66.00 66.09 77.00 100.00
summary(data$reading.score)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 17.00 59.00 70.00 69.17 79.00 100.00
sd(data$math.score)
## [1] 15.16308
sd(data$reading.score)
## [1] 14.60019
library(BSDA)
## Loading required package: lattice
##
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
##
## Orange
library(lattice)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Hipotesis
\(\bullet\) \(H_0\) : math.score \(=\) reading.score
\(\bullet\) \(H_1\) : math.score \(\neq\) reading.score
Uji Statistik
z.test(data$math.score, data$reading.score,mu=0, sigma.x = 15.16308, sigma.y = 14.60019, alternative = "two.sided")
##
## Two-sample z-Test
##
## data: data$math.score and data$reading.score
## z = -4.6271, p-value = 3.708e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -4.384642 -1.775358
## sample estimates:
## mean of x mean of y
## 66.089 69.169
Daerah Kritis
\(\bullet\) Tolak \(H_0\), jika p-value < \(\alpha\)
\(\bullet\) Tolak \(H_1\), jika p-value > \(\alpha\)
Keputusan dan Kesimpulan
Dari hasil Uji-ZTest diatas dapat ditarik kesimpulan bahwa Tolak \(H_0\) \[p-value < \alpha\] \[3.708-e06 < 0.05\]
Jadi, kesimpulannya bahwa nilai math.score dan reading.score Tidak Sama.
Guna menguji manfaat sebuah suplemen pada berat ayam, seorang peternak mengambil sampel sebanyak 10 ekor ayam. Peternak mencatat data berat ayam sebelum dan sesudah pemberian suplemen. Data tersebut tertera pada tabel di bawah.
Apakah data berdistribusi normal?
Apakah pemberian suplemen efektif dalam meningkatlam berat ayam?
sebelum = c(3,3,2.4,2.8,2.7,2.7,2.4,2.8,2.5,2.6)
sesudah = c(3.5,2.9,2.6,4,3,2.1,3.7,2.4,3.2,3.6)
Hipotesis
\(\bullet\) \(H_0\) \(:\) Data berdistribusi normal.
\(\bullet\) \(H_1\) \(:\) Data tidak berdistribusi normal.
Uji Normalitas Data Sesudah Dengan Shapiro Wilk
shapiro.test(sebelum)
##
## Shapiro-Wilk normality test
##
## data: sebelum
## W = 0.92657, p-value = 0.415
Daerah Kritis
Pada pengujian Shapiro-Wilk Normality Test yang dilakukan memiliki daerah kritis sebagai berikut :
\(\bullet\) Tolak \(H_0,\) jika P-Value \(<\) \(\alpha (0.05)\)
\(\bullet\) Terima \(H_0,\) jika P-Value \(>\) \(\alpha (0.05)\)
Keputusan
Pada pengujian Shapiro-Wilk Normality Test menggunakan variabel sesudah memiliki keputusan sebagai berikut : \[p-value < \alpha (0.05)\] \[0.415 < \alpha (0.05)\]
Jadi, keputusannya Terima \(H_0\) atau Tolak \(H_1.\)
Kesimpulan
Karena variabel sesudah mempunyai nilai P-Value \(=\) \(0.9196\) yaitu lebih besar dari \(\alpha = 0.05,\) maka pada pengujian di atas dapat ditarik kesimpulan bahwa Terima \(H_0\) atau \(H_1\) Ditolak. Jadi, kesimpulannya benar bahwa data pada variabel sesudah Berdistribusi Normal.
Uji Kesamaan Varians
Misal :
\(\bullet\) \(\sigma_1\) \(=\)Varians Variabel Sebelum
\(\bullet\) \(\sigma_2\) \(=\)Varians Variabel Sesudah
Hipotesis
\(\bullet\) \(H_0\) \(:\) \(\sigma_1\) \(=\) \(\sigma_2\)
\(\bullet\) \(H_1\) \(:\) \(\sigma_1\) \(\neq\) \(\sigma_2\)
F Test To Compare Two Variances
# Uji Kesamaan Varians
var.test(sebelum, sesudah, alternative = "two.sided", conf.level = 0.95)
##
## F test to compare two variances
##
## data: sebelum and sesudah
## F = 0.12692, num df = 9, denom df = 9, p-value = 0.005107
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.0315259 0.5109916
## sample estimates:
## ratio of variances
## 0.1269231
Daerah Kritis :
Pada pengujian F Test To Compare Two Variances yang dilakukan memiliki daerah kritis sebagai berikut :
\(\bullet\) Tolak \(H_0,\) jika P-Value \(<\) \(\alpha (0.05)\)
\(\bullet\) Terima \(H_0,\) jika P-Value \(>\) \(\alpha (0.05)\)
Keputusan
Pada pengujian F Test To Compare Two Variances menggunakan variabel sebelum dan variabel sesudah memiliki keputusan sebagai berikut : \[P-Value < \alpha (0.05)\] \[0.005107 < \alpha (0.05)\]
Kesimpulan
Karena nilai P-Value \(=\) \(0.005107\) yaitu lebih kecil dari \(\alpha = 0.005,\) maka pada pengujian di atas dapat ditarik kesimpulan bahwa Tolak \(H_0\) atau \(H_1\) Diterima. Jadi, kesimpulannya benar bahwa Varians variabel sebelum dan variabel sesudah Tidak Sama.
Setelah diketahui memiliki perbedaan, dilanjutkan dengan Uji-T Independen
Misal :
\(\bullet\) \(\mu_1\) \(=\) Sebelum Pemberian Suplemen.
\(\bullet\) \(\mu_2\) \(=\) Sesudah Pemberian Suplemen.
Hipotesis
\(\bullet\) \(H_0\) \(:\) \(\mu_1\) \(\geq\) \(\mu_2\)
\(\bullet\) \(H_1\) \(:\) \(\mu_1\) \(<\) \(\mu_2\)
Uji_T Independen
t.test(sebelum, sesudah, alternative = "less", paired = F, var.equal = F, conf.level = 0.95)
##
## Welch Two Sample t-test
##
## data: sebelum and sesudah
## t = -1.993, df = 11.248, p-value = 0.03555
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
## -Inf -0.04128918
## sample estimates:
## mean of x mean of y
## 2.69 3.10
Daerah Kritis
Pada pangujian Two Sample t-test Independen menggunakan vriabel sebelum dan variabel sesudah memiliki keputusan sebagai berikut : \[P-Value < \alpha (0.05)\] \[0.03555 < \alpha (0.05)\]
Jadi, keputusannya Tolak \(H_0\) atau Terima \(H_1\)
Kesimpulan :
Karena nilai P-Value \(=\) \(0.03555\) yaitu lebih kecil dari \(\alpha = 0.05,\) maka pada pengujian dia atas dapat ditarik kesimpulan bahwa Tolak \(H_0\) atau \(H_1\) Diterima. Jadi, kesimpulannya benar bahwa pemberian suplemen efektif dalam meningkatkan berat ayam.