Notes Theme: - Kelas E: cayman
- Kelas F: tactile
- Kelas G: architect
- Kelas H: hpstr

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Istilah regresi dikemukakan untuk pertama kali oleh seorang antropolog dan ahli meteorology Francis Galton dala artikelnya “Family Likeness in Stature” pada tahun 1886. Ada juga sumber lain yang menyatakan istilah regresi pertama kali muncul dalam pidato Francis Galton di depan Section H of The British Associaton di Aberdeen , 1855 dan dalam makalah “Regression towardsmediocrity in hereditary stature”, yang dimuat dalam Journal of The Anthropological Institute (Draper an Smith, 1992).

Studinya ini menghasilkan apa yang dikenal dengan hukum regresi universal tentangtingginya anggota suatu masyarakat. Hukum tersebut menyatakan bahwa distribusi tinggi suatumasyarakat tidak mengalami perubahan yang besar sekali antar generasi. Hal ini dijelaskan Galtonberdasarkan fakta yang memperlihatkan adanya kecenderungan mundurnya (regress) tinggi rata-rata anak dari orang tua dengan tinggi tertentu menuju tinggi rata-rata seluruh anggotamasyarakat. Ini berarti terjadi penyusutan ke arah keadaan sekarang. Tetapi sekarang istilahregresi telah diberikan makna yang jauh berbeda dari yang dimaksudkan oleh Gaston. Secara luasanalisis regresi diartikan sebagai suatu analisis tentang ketergantungan suatu variabel kepadavariabel lain yaitu variabel bebas dalam rangka membuat estimasi atau prediksi dari nilai rata-ratavariabel tergantung dengan diketahuinya nilai variabel bebas.

Analisis statistik yang digunakan untuk menyelesaikan masalah kausalitas atau sebab akibatadalah analisis regresi (Sembiring, 1995: 30). Metode yang sering digunakan dalammenyelesaikan masalah estimasi koefisien regresi adalah metode kuadrat terkecil, karenaestimator yang didapat dari metode ini merupakan estimator yang tak bias (Neter, 1997: 37)

1.2 Statistika Deskriptif

Statistik Deskriptif juga merupakan metode yang sangat sederhana. Metode ini hanya mendeskripsikan kondisi dari data yang sudah anda miliki Dan menyajikannya dalam bentuk tabel diagram grafik dan bentuk lainnya yang disajikan dalam uraian – uraian singkat dan juga terbatas.

Statistika di golongkan menjadi dua bagian, yakni statistika deskriptif dan statistika inferensia yang dilakukan berdasarkan aktivitas yang dilakukan.Untuk contoh dari statistika deskriptif sendiri antara lain yaitu: - tabel - diagram - grafik - besaran-besaran lain dalam majalah dan koran-koran.

Penyajian data dalam statistika deskriptif sangat beragam. Penyajian data meliputi : - histogram - diagram batang daun - diagram batang - ogive - pie chart

Statistika deskriptif digunakan untuk mengolah dan menganalisis data yang dikumpulkan dari sebuh penelitian. Statistika deskriptif ini digunakan untuk memberikan informasi tentang data dan mengetahui hubungan antar variabel data.

Metode statistika deskriptif terdiri dari : - mean , median dan modus - kuartil dan desil - jangkauan , simpangan dan simpangan rata - rata - simpangan baku dan ragam

1.3 Analisis Regresi

Model regresi linier sederhana adalah model probabilistik yang menyatakan hubungan linierantara dua variabel di mana salah satu variabel dianggap memengaruhi variabel yang lain.Variabel yang memengaruhi dinamakan variabel independen dan variabel yang dipengaruhidinamakan variabel dependen. Sebagai contoh mungkin seorang peneliti tertarik untukmenyelidiki pengaruh (hubungan) linier dari Intelegency Quotient (IQ) terhadap hasil belajarstatistika mahasiswa. Disini IQ adalah variabel independen, sedangkan hasil belajar adalahvariabel dependen. Masih banyak contoh yang dapat dimodelkan dengan regresi linier sederhana,misalnya hubungan antara motivasi dan kinerja pegawai, hubungan antara usia dan tinggi badanmanusia, hubungan antara pendapat dan pengeluaran rumah tangga, dan lain-lain.

Analisis regresi setidak-tidaknya memiliki tiga kegunaan, yaitu :

  1. Untuk tujuan deskripsi dari fenomena data atau kasus yang sedang diteliti, regresimampu mendeskripsikan fenomena data melalui terbentuknya suatu model hubunganyang bersifat numerik;2.
  2. Untuk tujuan kontrol, regresi juga dapat digunakan untuk melakukan pengendalian( control) terhadap suatu kasus atau hal-hal yang sedang diamati melalui penggunaanmodel regresi yang diperoleh.
  3. Sebagai prediksi, model regresi juga dapat dimanfaatkan untuk melakukan prediksivariabel terikat. Model probabilistik untuk regresi linier sederhana adalah :

\[ Y = \beta_{0} \ + \beta_{1} \ + \varepsilon \] Dimana X adalah variabel independen, Y adalah variabel dependen, beta_{0} dan beta_{1} adalah parameter- parameter yang nilainya tidak diketahui yang dinamakan koefisien regresi, dan varepsilon adalah kekeliruan atau galat acak (random error). Di sini variabel dependen diasumsikan bukan,dapat diobservasi atau diukur dengan kekeliruan yang dapat diabaikan, dan variasi dalam Xdianggap dapat diabaikan dibanding dengan range dari X. Sebagai konsekuensi dari adanya sukugalat acak varepsilon maka variabel dependen Y juga merupakan variabel acak. Galat acak varepsilon memiliki peranan yang sangat penting dalam analisis regresi. Galat acak varepsilon digunakan untuk memodelkanvariasi nilai-nilai Y untuk nilai X yang tetap. Karena kita hanya fokus pada pengaruh X terhadapY maka akan selalu diasumsikan bahwa mean(harga harapan atau ekspektasi) galat acak varepsilon samadengan. Ini berarti bahwa pengaruh semua faktor diluar X mean-nya dianggapsama dengan 0. Asumsi ini kiranya beralasan untuk mendapatkan model regresi linier sederhanayang baik

1.4 Data

Data yang digunakan adalah data primer yang terdiri dari 2 variabel. Yaitu variabel X sebagai prediktor dan variabel Y sebagai respon. X merupakan data umur kelinci dalam satuan tahun. Sedangkan Y merupakan data berat badan kelinci dalam satuan kg. Data dibangkitkan dengan cara random data. Lalu disimpan di dalam file microsoft excel. Function rnorm digunakan untuk membangkitkan data dengan sebaran normal. Data yang sudah disimpan di dalam excel harus dipanggil kembali melalui impor dataset.

2 SOURCE CODE

2.1 Mengimpor dataset

> library(readxl)
> data <- read_excel("D:/najla/Semester 6/Praktikum Komstat/data.xlsx")
> View(data)

2.2 Statistika Deskriptif

> summary(data)
       X               Y        
 Min.   :2.027   Min.   :3.029  
 1st Qu.:2.381   1st Qu.:3.196  
 Median :2.625   Median :3.893  
 Mean   :2.853   Mean   :3.786  
 3rd Qu.:3.480   3rd Qu.:4.106  
 Max.   :3.730   Max.   :4.786  

2.3 Uji Asumsi

> reg <- lm(Y~X , data=data)

2.3.1 Uji Normalitas

> library(tseries)
> sisa <- residuals(reg)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 0.92226, df = 2, p-value = 0.6306
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.91144, p-value = 0.291
> qqnorm(sisa)

2.3.2 Uji Homoskedastisitas

> library(lmtest)
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 4.8496, df = 1, p-value = 0.02765

2.3.3 Uji Autokorelasi

> library(lmtest)
> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 3.7338, p-value = 0.9999
alternative hypothesis: true autocorrelation is greater than 0

2.4 Analisis Regresi

> reg <- lm(Y~X , data = data)
> print(reg)

Call:
lm(formula = Y ~ X, data = data)

Coefficients:
(Intercept)            X  
     4.1922      -0.1423  
> summary(reg)

Call:
lm(formula = Y ~ X, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-0.7879 -0.5992  0.1361  0.4304  0.8901 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)   4.1922     0.9629   4.354  0.00243 **
X            -0.1423     0.3295  -0.432  0.67718   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.658 on 8 degrees of freedom
Multiple R-squared:  0.02279,   Adjusted R-squared:  -0.09936 
F-statistic: 0.1866 on 1 and 8 DF,  p-value: 0.6772
> 
> coef(reg)
(Intercept)           X 
  4.1921503  -0.1423369 
> vcov(reg)
            (Intercept)          X
(Intercept)   0.9271452 -0.3097869
X            -0.3097869  0.1085792
> anova(reg)
Analysis of Variance Table

Response: Y
          Df Sum Sq Mean Sq F value Pr(>F)
X          1 0.0808 0.08078  0.1866 0.6772
Residuals  8 3.4635 0.43293               

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

Berdasarkan Data yang digunakan, diperoleh nilai rataan pada X sebesar 2.853, artinya rata - rata umur 10 kelinci yaitu 2.853 kg. Sedangkan pada Y rata - rata sebesar 3.786 , artinya rata - rata berat badan kelinci sebesar 3.786 tahun. Sedangkan nilai minimum pada X sebesar 2.027 tahun dan pada Y yaitu 3.029 kg. Sedangkan nilai maksimum pada X yaitu 3.730 tahun dan pada Y sebesar 4.786 kg.

3.2 Uji Asumsi

3.2.1 Uji Normalitas

Dari hasil output di atas didapatkan nilai p-value pada jarque bera sebesar 0.6306 dan nilai p-value pada shapiro wilk sebesar 0.291. Kedua nilai tersebut lebih besar daripada nilai alpha (>0.05) maka Terima H0. Dapat disimpulkan bahwa pada data tersebut tidak terbukti adanya pelanggaran normalitas.

3.2.2 Uji Homoskedastisitas

Uji homoskedastisitas menggunakan fungi bptest dan didapatkan nilai p-value sebesar 0.02765. Maka Tolak H0 karena kurang dari nilai alpha ( < 0.05). Dapat disimpulkan bahwa terbukti adanya pelanggaran asumsi homogenitas ragam galat pada model data tersebut.

3.2.3 Uji Autokorelasi

Uji asumsi autokorelasi menggunakan fungsi dwtest. Didapatkan nilai p-value pada durbin watson test sebesar 0.9999. Maka Terima H0. Dapat disimpulkan bahwa data tersebut tidak ada masalah autokorelasi.

3.3 Analisis Regresi

3.3.1 Analisis Regresi

Mendefinisikan variabel reg dengan fungsi lm dan didapatkan output dengan intercept sebesar 4.1922 dan X sebesar -0.1423. Terlihat nilai penduga sebesar 4.1922 dan -0.1423. Didapatkan nilai rsquare sebesar -0.099. Maka didapatkan persamaan yaitu \[ Y \ = \ 4.1922\ - 0.1423\ X\ \] Dapat disimpulkan bahwa jika beta1 atau X naik satu satuan, maka akan menurunkan Y sebesar 0.1423.

3.3.2 Uji F

rumus uji F : \[ F = \frac{R^2 \ / \ (n-1) }{1 \ - \ R^2 \ / \ ( n - k) } \] \[ df = n \ - \ 2 \]

Dari hasil uji F didapatkan output sebesar 0.1866 dengan df sebesar 8.

3.3.3 Uji T

rumus uji T : \[ \frac{(Xbar \ - \mu_0)} {s \ / \sqrt(n)} \] Dari hasil perhitungan uji T didapatkan output sebesar 4.354.

4 DAFTAR PUSTAKA

Algifari. 2000.Analisis Regresi Teori, Kasus dan Solusi Edisi 2. BPFE:Yogyakarta

Budi, Purbayu, Santosa dan Ashari. 2005.Analisis Statistik dengan Microsoft Exel& SPSS. ANDI: Jogjakarta

Draper, Norman R, and Smith Herry. ―Applied Regression Analysis.‖ John Wiley& Sons 2 (1998).