1 PENDAHULUAN

1.1 Latar Belakang

Statistika adalah sekumpulan konsep dan metode yang digunakan untuk mengumpulkan, menyajikan, menganalisis, dan menginterpretasi data kuantitatif suatu fakta tentang bidang kegiatan tertentu. Penyajian data yang berupa angka-angka dan analisis data tersebut merupakan salah satu fungsi statistika. Lebih lanjut perlu dijelaskan bahwa dalam metodologi dan teori statistika modern, statistika mempunyai fungsi lebih luas, tidak hanya sekedar penyajian grafik atau tabel.

Analisis/uji regresi merupakan suatu kajian dari hubungan antara satu variabel, yaitu variabel yang diterangkan (the explained variabel) dengan satu atau lebih variabel, yaitu variabel yang menerangkan (the explanatory). Apabila variabel bebasnya hanya satu, maka analisis regresinya disebut dengan regresi sederhana.

Analisis regresi digunakan untuk melakukan prediksi dan ramalan. Analisis regresi juga dapat digunakan untuk memahami variabel–variabel bebas mana saja yang dapat berhubungan dengan variabel terikat, serta untuk mengetahui bentuk hubungan tersebut.

1.2 Statistika Deskriptif

Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu data sehingga memberikan informasi yang berguna. Statistik deskriptif berfungsi untuk mendeskripsikan atau memberi gambaran terhadap objek yang diteliti melalui data sampel atau populasi. Statistika deskriptif dapat disajikan dalam berbagai bentuk yaitu Histogram, pie chart, tabel, poligon, ogive, dan diagram batang daun (stem and leaf). Berikut merupakan contoh diagaram pada statistika deskriptif.

Berikut adalah contoh histogram

1.3 Persamaan Regresi Linier Sederhana

Persamaan regresi linier sederhana merupakan suatu model persamaan yang menggambarkan hubungan satu variabel bebas/ predictor (X) dengan satu variabel tak bebas/ response (Y), yang biasanya digambarkan dengan garis lurus, Persamaan regresi linier sederhana secara matematik diekspresikan oleh: \[\widehat{Y}=a+bX\] yang mana:
\(\widehat{Y}=\) garis regresi/ variabel respon
\({a}=\) konstanta, perpotongan dengan sumbi internal
\({b}=\) konstanta regresi
\({X}=\) variabel bebas/ prediktor
Besarnya konstanta a dan b dapat ditentukan menggunkan persamaan:
\[a=\frac {(\sum{Y_i})(\sum{X_i^2})-(\sum{X_i})(\sum{X_iY_i})}{n\sum{X_i^2}-(\sum{X_i})^2}\] \[b=\frac {n(\sum{X_iY_i})-(\sum{X_i})(\sum{Y_i})}{n\sum{X_i^2}-(\sum{X_i})^2}\] yang mana \(n=\) jumlah data

1.4 Langkah-langkah Analisis dan Uji Regresi Linier Sederhana

Adapun langkah-langkah yang perlu dilakukan untuk melakukan analisis dan uji regresi linier sederhana adalah sebagai berikut:
1. Menentukan tujuan dari Analisis Regresi Linear Sederhana
2. Mengidentifikasi variabel predictor dan variabel response
3. Melakukan pengumpulan data dalam bentuk tabel
4. Menghitung X², XY dan total dari masing-masingnya
5. Menghitung a dan b menggunakan rumus yang telah ditentukan
6. Membuat model Persamaan Garis Regresi
7. Melakukan prediksi terhadap variabel predictor atau response
8. Uji signifikansi menggunakan Uji-t dan menentukan Taraf Signifikan

1.5 Koefisien Korelasi (r)

Untuk mengukur kekuatan hubungan antar variable predictor X dan response Y, dilakukan analisis korelasi yang hasilnya dinyatakan oleh suatu bilangan yang dikenal dengan koefisien korelasi. Biasanya analisis regresi sering dilakukan bersama-sama dengan analisis korelasi.

1.6 Koefisien korelasi \((r^2)\)

Koefisien determinasi dapat ditentukan dengan mengkuadratkan koefisien korelasi.

1.7 Uji Signifikansi dan Hipotesis

Pengujian hipotesis dimaksudkan untuk melihat apakah suatu hipotesis yang diajukan ditolak atau dapat diterima. Hipotesis merupakan asumsi atau pernyataan yang mungkin benar atau salah mengenai suatu populasi. Dengan mengamati seluruh populasi, maka suatu hipotesis akan dapat diketahui apakah suatu penelitian itu benar atau salah. Untuk keperluan praktis, pengambilan sampel secara acak dari populasi akan sangat membantu. Dalam pengujian hipotesis terdapat asumsi/ pernyataan istilah hipotesis nol. Hipotesis nol merupakan hipotesis yang akan diuji, dinyatakan oleh \(H_0\) dan penolakan H0 dimaknai dengan penerimaan hipotesis lainnya yang dinyatakan oleh \(H_1\).

Jika telah ditentukan Koefisien Determinasi \((r^2)\), maka selanjutnya dilakukan uji signifikan hipotesis yang diajukan. Uji ini dapat menggunakan Uji-t ; Uji-F ; Uji-z atau Uji Chi Kuadrat. Dengan uji signifikansi ini dapat diketahui apakah variable bebas/ predictor/ independent (X) berpengaruh secara signifikan terhadap variable tak bebas/ response/ dependent (Y). Arti dari signifikan adalah bahwa pengaruh antar varible berlaku bagiseluruh populasi. Dalam modul ini hanya dibahas uji signifikansi menggunakan uji-t.

1.8 Uji-t

Langkah-langkah yang perlu dilakukan dalam uji-t pada regresi linier adalah:
1. Menentukan Hipotesis \[H_0:\beta=0\];variabel X tidak berpengaruh signifikan/nyata terhadap Y \[H_1:\beta\neq0\];variabel X berpengaruh signifikan/nyata terhadap Y
2. Menentukan tingkat signifikansi \((\alpha)\) Tingkat signifikansi, \(\alpha\) yang sering digunakan adalah \(\alpha=0,05\)
3. Menghitung nilai t hitung menggunakan rumus: \[t_{hit}=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}}\]
4. Menentukan daerah penolakan \(H_0\) (daerah kritis)
5. Menentukan t tabel
6. Kriteria Pengujian nilai t hitung dan t tabel
7. Kesimpulan hasil uji signifikansi

1.9 Data

Data merupakan sekumpulan informasi atau juga keterangan– keterangan dari suatu hal yang diperoleh dengan melalui pengamatan atau juga pencarian ke sumber – sumber tertentu. Data yang diperoleh namun belum diolah lebih lanjut dapat menjadi sebuah fakta atau anggapan.

Dalam kasus ini digunakan data sekunder yang berasal dari penilaian nilai akhir siswa yang diambil secara acak diprediksi dipengaruhi oleh jumlah poin kedisiplinan yang bertujuan untuk mengetahui apakah jumlah poin kedisiplinan memengaruhi nilai akhir siswa.

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> library(rmarkdown)

Library yang digunakan adalah rmarkdown untuk menggunakan syntax paged_table.

2.2 Data Hasil Pengukuran

No Poin Kedisiplinan\((X)\) Nilai Akhir \((Y)\)
1 530 89
2 300 48
3 358 56
4 510 72
5 302 54
6 300 42
7 387 60
8 527 85
9 415 63
10 512 74

Berikut adalah data dari tabel

2.3 Membangkitkan Data

> X <- c(530,300,358,510,302,300,387,527,415,512)
> X2 <- X^2
> Y <- c(89,48,56,72,54,42,60,85,63,74)
> Y2 <- Y^2
> XY <- X*Y
> n <- 10
> data <- data.frame(X,X2,Y,Y2,XY)
> data
     X     X2  Y   Y2    XY
1  530 280900 89 7921 47170
2  300  90000 48 2304 14400
3  358 128164 56 3136 20048
4  510 260100 72 5184 36720
5  302  91204 54 2916 16308
6  300  90000 42 1764 12600
7  387 149769 60 3600 23220
8  527 277729 85 7225 44795
9  415 172225 63 3969 26145
10 512 262144 74 5476 37888

Syntax di atas digunakan untuk mendefinisikan variabel dengan nama x, y, xx, yy, xy, n dan kemudian dibuat data frame dengan nama variabel data dan judul kolom X, X2, Y, Y2, XY. Kemudia tabel data frame dipanggil dengan menggunakan nama variabel “data”.

> a <- (sum(Y)*sum(X2)-sum(X)*sum(XY))/(n*sum(X2)-sum(X)^2)
> a
[1] 2.608041

Memasukkan rumus untuk menghitung a, kemudian munculkan hasil perhitungan a dengan menngunakan nama variabel “a”.

> b <- (n*sum(XY)-sum(X)*sum(Y))/(n*sum(X2)-sum(X)^2)
> b
[1] 0.1489784

Memasukkan rumus untuk menghitung b, kemudian munculkan hasil perhitungan b dengan menngunakan nama variabel “b”.

> y <- a+b*X
> y
 [1] 81.56660 47.30156 55.94231 78.58703 47.59952 47.30156 60.26269 81.11966
 [9] 64.43408 78.88499

Memasukkan rumus untuk menghitung y, kemudian munculkan hasil perhitungan y dengan menngunakan nama variabel “y”.

2.4 Diagram Pencar

> plot(data$X,data$Y,main="Hubungan antara X terhadap Y",xlab="Poin Kedisiplinan",ylab="Nilai Akhir",col="darkblue")
> abline(lm(data$Y~data$X),col="violet")

2.5 Koefisien Korelasi \((r)\)

> r=(n*sum(XY)-sum(X)*sum(Y))/(sqrt((n*sum(X2)-sum(X)^2)*(n*sum(Y2)-sum(Y)^2)))
> r
[1] 0.9500932

Memasukkan rumus untuk menghitung r, kemudian munculkan hasil perhitungan r dengan menngunakan nama variabel “r”.

2.6 Koefisien Determinasi \((r^2)\)

> r2 <- r^2
> r2
[1] 0.9026771

Memasukkan rumus untuk menghitung r2, kemudian munculkan hasil perhitungan r2 dengan menngunakan nama variabel “r2”.

2.7 Uji Signifikansi

Uji t

> thit=(r*sqrt(n-2))/(sqrt(1-r^2))
> thit
[1] 8.613976

Mencari thitung menggunakan rumus (r*sqrt(n-2))/(sqrt(1-r^2)), kemudian dipanggil dengan menggunakan nama variabel “thit”.

> ttab=qt(0.025,8,lower.tail=F,log.p=F)
> ttab
[1] 2.306004

Mencari ttabel menggunakan rumus qt(0.025,8,lower.tail=F,log.p=F), kemudian dipanggil dengan menggunakan nama variabel “ttab”.

3 HASIL DAN PEMBAHASAN

3.1 Menentukan Variabel Prediktor dan Variabel Respon

Variabel Prediktor (X) = Poin Kedisiplinan
Variabel Respon (Y) = Nilai akhir
Dikarenakan poin kedisiplinan yang mempengaruhi nilai akhir.

3.2 Interpretasi Diagram Pencar

Berdasarkan diagram pencar diatas dapat dilihat bahwa titik-titik menyebar disekitar daerah garis diagonal, maka dapat disimpulkan bahwa data berdistribusi normal.

3.3 Perhitungan Model Regresi

Mencari a \[a=\frac {(\sum{Y_i})(\sum{X_i^2})-(\sum{X_i})(\sum{X_iY_i})}{n\sum{X_i^2}-(\sum{X_i})^2}\] \[a=\frac {(643)(1802235)-(4141)(279294)}{10(1802235)-(4141)^2}=2,068\] Mencari b \[b=\frac {n(\sum{X_iY_i})-(\sum{X_i})(\sum{Y_i})}{n\sum{X_i^2}-(\sum{X_i})^2}\] \[b=\frac {10(279294)-(4141)(643)}{10(1802235)-(4141)^2}=0,149\] Masukkan a dan b ke dalam model regresi \[\widehat{Y}=a+bX\] \[\widehat{Y}=2,608+0,149X\] Didapatkan model regresi yaitu \(\widehat{Y}=2,608+0,149X\)

3.4 Perhitungan koefisien korelasi

\[r=\frac{n\sum{X_iY_i}-(\sum{X_i})(\sum{Y_i})}{\sqrt{[n\sum{X_i^2}-(\sum{X_i})^2][n\sum{Y_i^2}-(\sum{Y_i})^2]}}\] \[r=\frac {10(279294)-(4141)(643)}{\sqrt{(10(1802235)-4141^2)(10(43495)-643^2)}}=0,95\] Didapatkan hasil koefisien korelasi sebesar 0,95, maka dapat dikatakan bahwa hubungan variabel bebas \(X\) dengan variabel terikat \(Y\) sangat kuat, persentasenya adalah 95%. Jadi, nilai akhir sangat dipengaruhi oleh jumlah poin kedisiplinan.

3.5 Perhitungan koefisien determinasi

\[r^2=0,95^2=0,90\] Didapatkan hasil koefisien determinasi 0,90 Nilai ini berarti 90% variabel bebas \(X\) dapat menjelaskan variabel tak bebas \(Y\) dan 10% dijelaskan oleh variabel lainnya.

3.6 Uji-t

1. Menentukan Hipotesis
\[H_0:\beta=0;variabel\space X\space tidak\space berpengaruh\space nyata\space terhadap\space Y\] \[ H_1:\beta\neq0;variabel\space X\space berpengaruh\space nyata\space terhadap\space Y \] 2. Tingkat Signifikansi
(\(\alpha\)) = 5%.
3. Nilai t hitung
\[t_{hit}=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}}\] \[t_{hit}=\frac{0,95\sqrt{10-2}}{\sqrt{1-0,90}}=8,497\] 4. Derajat Kebebasan
\(df=n-k=10-2=8\).
5. Nilai t tabel
\(t_{tab}=t_{(\alpha)(df)}=t_{(0,05)(8)}=2,306\).
6. Keputusan
Karena \(t_{hit}>t_{tab}\to 8,497>2,306\), maka tolak \(H_0\).
7. Kesimpulan
Karena Nilai \(t_{hit}>t_{tab}\), dapat dikatakan bahwa ada pengaruh nyata poin kedisiplinan terhadap nilai akhir dengan taraf signifikan 5%.

4 DAFTAR PUSTAKA

Yuliara, I. M. (2016). Regresi linier sederhana. Denpasar: Universitas Udayana.(Accesed on April 30th 2021 from https://simdos. unud. ac. id/uploads/file_pe ndidikan_1_dir/321812643.
Nalim, N., & Salafudin, S. (2012). Statistika deskriptif.
Davis, B. G. (2005). Pengertian data.
Wijayanto, A. (2008). Analisis regresi linear sederhana.
Khasanah, U. (2021). Analisis Regresi. UAD PRESS.
DATA, U. M. (1996). Metode Statistika.