data <- read.csv("C:/Users/ASUS/Downloads/data liver.csv", sep=";")

y<-data$Y
x1<-data$X1
x2<-data$X2
x3<-data$X3
x4<-data$X4 
x5<-data$X5
x6<-data$X6

data<-data.frame(cbind(y,x1,x2,x3,x4,x5,x6))
head(data)
##        y    x1    x2   x3    x4    x5   x6
## 1 158.76 16.36  8.90 3.47  6.02 57.42 1.11
## 2 197.19 26.68 21.22 3.53 12.07 61.38 1.36
## 3 144.73 12.49 16.62 2.00  8.88 67.42 1.47
## 4 140.06  8.45 22.86 6.71  7.46 69.94 1.31
## 5 129.71 10.19 14.23 4.75  2.06 65.68 1.25
## 6 162.59 19.53 17.35 1.95  7.54 59.63 1.14

Kode tersebut bertujuan untuk membaca data dari file CSV dan membuat data frame bernama data, mengatur ulang data ke dalam struktur yang sesuai, dan menampilkan beberapa baris pertama dari data tersebut untuk memastikan bahwa pembacaan data berhasil dilakukan dengan benar.

Jumlah Data

n<-nrow(data)
n
## [1] 36

Menghitung baris

Jumlah Variabel

p<-ncol(data)
p
## [1] 7

Menghitung kolom

plot (x4,y)

Membuat grafik Scatter plot untuk mengetahui hubungan antara variabel y

summary (y)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   120.9   143.9   160.7   169.7   191.8   247.4

Membuat ringkasan statistik deskriptif dari variabel y. Ringkasan statistik deskriptif ini termasuk beberapa ukuran statistik yang umum digunakan untuk memahami distribusi dan karakteristik data.

hist(x4)

memuat tabel hitogram dari data x4

boxplot (x4)

membuat boxplot dari data x4

summary (x4)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.060   4.065   6.095   6.811   8.998  15.000

Membuat ringkasan statistik deskriptif dari variabel y. Ringkasan statistik deskriptif ini termasuk beberapa ukuran statistik yang umum digunakan untuk memahami distribusi dan karakteristik data

Pembentukan model tanpa fungsi bawaan (manual)

Parameter Regresi

b1<-(sum(x4*y)-sum(x4)*sum(y)/n)/(sum(x4^2)-(sum(x4)^2/n))
b1
## [1] 5.812239
b0<-mean(y)-b1*mean(x4)
b0
## [1] 130.1367

Menghitung parameter regresi dari variabel y dan x4. Parameter regresi adalah koefisien yang digunakan dalam model regresi untuk menghubungkan variabel independen (variabel prediktor) dengan variabel dependen (variabel respons). Rataan dugaan pada saat x sama dengan nol adalah 5.812239 Setiap naik satu satuan x, maka rataan dugaan akan mengalami perubahan sebesar 130.1367

Koefisien Determinasi dan Penyesuaiannya

r<-(sum(x4*y)-sum(x4)*sum(y)/n)/
sqrt((sum(x4^2)-(sum(x4)^2/n))*(sum(y^2)-(sum(y)^2/n)))
Koef_det<-r^2
Koef_det
## [1] 0.317748

Koefisien determinasi menunjukkan seberapa besar variasi dalam variabel dependen yang dapat dijelaskan oleh variabel independen dalam model regresi. Nilai Koefisien determinasi berkisar antara 0 dan 1. Nilai yang lebih tinggi menunjukkan bahwa model regresi lebih baik dalam menjelaskan variasi dalam data. Dalam data ini koefisien determinasi yaitu 0.317748 yang berarti data cukup bervariasi

Adj_R2<-1-((1-Koef_det)*(n-1)/(n-1-1))
Adj_R2
## [1] 0.2976818

Nilai 0.2976818 menunjukkan bahwa sekitar 29.77% variabilitas dalam variabel dependen dapat dijelaskan oleh model regresi linier setelah disesuaikan dengan jumlah variabel independen yang digunakan dalam model.

Standar Error Parameter reegresi

galat<-y-(b0+b1*x1)
ragam_galat<-sum(galat^2)/(n-2)

se_b1<-sqrt(ragam_galat/sum((x4-mean(x4))^2))
se_b1
## [1] 3.288784

mengukur seberapa jauh perkiraan koefisien regresi b1 bisa bervariasi dari nilai sebenarnya dalam populasi.Semakin kecil standar error b1, semakin presisi estimasi koefisien regresi b1, dan semakin tinggi kepercayaan kita terhadap keakuratannya.

se_b0<-sqrt(ragam_galat*(1/n+mean(x4)^2/sum((x4-mean(x4))^2)))
se_b0
## [1] 24.67608

Nilai 24.67608 adalah hasil dari perhitungan standar error b0 dalam konteks model regresi linier. Standar error ini digunakan untuk mengevaluasi seberapa akurat estimasi koefisien b0 dalam sampel. Standar error yang lebih rendah menunjukkan bahwa estimasi koefisien b0 cenderung lebih stabil dan dapat diandalkan dalam memprediksi variabel dependen dalam model regresi linier

Signifikan Parameter (nilai-t)

t_b0<-b0/se_b0
t_b0
## [1] 5.273799

Nilai 5.273799 adalah nilai t-statistik b0 untuk koefisien b0 dalam model regresi linier. Nilai ini mengindikasikan seberapa jauh estimasi koefisien b0 dari nol dalam satuan standar error. ilai t-statistik yang lebih besar menunjukkan bahwa koefisien b0 lebih jauh dari nol dan memiliki signifikansi statistik yang lebih besar. Ini berarti variabel independen x4 memiliki pengaruh yang signifikan terhadap variabel dependen y dalam model regresi linier.

t_b1<-b1/se_b1
t_b1
## [1] 1.767292

Nilai ini menunjukkan seberapa jauh estimasi koefisien b1 dari nol, dalam satuan standar error. Dalam pengujian hipotesis, nilai t b1 yang lebih besar menunjukkan bahwa koefisien b1 lebih signifikan secara statistik. Hal ini menunjukkan bahwa variabel independen x4 memiliki pengaruh yang signifikan terhadap variabel dependen y dalam model regresi linier.

2*pt(-abs(t_b0 ),df<-n-2)
## [1] 7.576925e-06

Menghitung nilai p untuk tes hipotesis dua sisi terkait dengan koefisien b0 dalam model regresi linier.Jika nilai p lebih kecil dari tingkat signifikansi yang dipilih (misalnya, 0.05), kita akan menolak hipotesis nol dan menyimpulkan bahwa koefisien b0 signifikan secara statistik dalam model regresi linier. Dalam hal ini, nilai p sangat kecil, menunjukkan bahwa koefisien b0 sangat signifikan secara statistik.

2*pt(-abs(t_b1 ),df<-n-2)
## [1] 0.08615488

Nilai p sebesar 0.08615488 menunjukkan bahwa tidak cukup bukti untuk menolak hipotesis nol yang menyatakan bahwa koefisien b1 sama dengan nol. Dengan kata lain, tidak ada cukup bukti untuk menyatakan bahwa variabel independen memiliki pengaruh yang signifikan terhadap x4 variabel dependen y dalam model regresi linier, pada tingkat signifikansi yang umum (misalnya,α=0.05).

Ukuran Keragaman

galat<-y-(b0+b1*x4)

JKG <- sum((y - (b0+b1*x4))^2)
JKReg <- sum(((b0+b1*x4)- mean(y))^2)
JKT <- sum((y - mean(y))^2)
JKT <- JKReg+JKG

dbReg<-1
dbg<-n-2
dbt<-n-1

Fhit<-(JKReg/dbReg)/(JKG/dbg)
Fhit
## [1] 15.83496

F-statistik digunakan untuk menguji signifikansi keseluruhan model regresi, yaitu apakah setidaknya satu variabel independen dalam model memberikan kontribusi yang signifikan terhadap menjelaskan variabilitas dalam variabel dependen.

Nilai F-statistik yang lebih besar menunjukkan bahwa model regresi secara keseluruhan lebih signifikan secara statistik. Dalam konteks ini, nilai 15.83496 menunjukkan bahwa model regresi secara keseluruhan memiliki signifikansi statistik yang cukup besar.

P.value<-1-pf(Fhit, dbReg, dbg, lower.tail <- F)
P.value 
## [1] 0.0003435874

Nilai p ini menunjukkan probabilitas bahwa variabel acak dari distribusi F dengan derajat kebebasan yang diberikan memiliki nilai kurang dari atau sama dengan nilai F-statistik yang dihitung.

Dalam konteks ini, nilai p yang sangat kecil (0.0003435874) menunjukkan bahwa terdapat bukti yang kuat untuk menolak hipotesis nol.

Pembentukkan Model dengan fungsi lm

model<-lm(y~x4,data<-data)
summary(model)
## 
## Call:
## lm(formula = y ~ x4, data = data <- data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -44.630 -13.162  -4.809  15.601  63.697 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  130.137     10.959  11.875  1.2e-13 ***
## x4             5.812      1.461   3.979 0.000344 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 27.58 on 34 degrees of freedom
## Multiple R-squared:  0.3177, Adjusted R-squared:  0.2977 
## F-statistic: 15.83 on 1 and 34 DF,  p-value: 0.0003436
anova(model)
## Analysis of Variance Table
## 
## Response: y
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## x4         1  12042 12041.8  15.835 0.0003436 ***
## Residuals 34  25856   760.5                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1