Linear regression adalah metode statistik yang digunakan untuk memodelkan hubungan antara variabel dependen (variabel yang ingin diprediksi) dan satu atau lebih variabel independen (variabel yang digunakan untuk memprediksi variabel dependen). Tujuannya adalah untuk mengidentifikasi dan mengukur hubungan linier antara variabel-variabel tersebut. Dalam linear regression, digunakan persamaan garis lurus yang terbaik memprediksi nilai variabel dependen berdasarkan nilai-nilai variabel independen. Model regresi ini berusaha menemukan garis yang paling dekat dengan titik-titik data yang diamati, sehingga dapat digunakan untuk membuat prediksi tentang nilai variabel dependen berdasarkan nilai-nilai variabel independen yang baru. Hasil regresi linier biasanya dinyatakan dalam bentuk persamaan matematika y = mx + c, di mana y adalah variabel dependen, x adalah variabel independen, m adalah koefisien kemiringan, dan c adalah intersep pada sumbu y. Linear regression memiliki berbagai aplikasi dalam berbagai bidang, termasuk ekonomi, ilmu sosial, ilmu medis, dan ilmu data.

x <- c(151, 174, 138, 186, 128, 136, 179, 163, 152, 131)
y <- c(63, 81, 56, 91, 47, 57, 76, 72, 62, 48)

relation <- lm(y~x)

print(relation)
## 
## Call:
## lm(formula = y ~ x)
## 
## Coefficients:
## (Intercept)            x  
##    -38.4551       0.6746
x <- c(151, 174, 138, 186, 128, 136, 179, 163, 152, 131)
y <- c(63, 81, 56, 91, 47, 57, 76, 72, 62, 48)

relation <- lm(y~x)

print(summary(relation))
## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.3002 -1.6629  0.0412  1.8944  3.9775 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -38.45509    8.04901  -4.778  0.00139 ** 
## x             0.67461    0.05191  12.997 1.16e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.253 on 8 degrees of freedom
## Multiple R-squared:  0.9548, Adjusted R-squared:  0.9491 
## F-statistic: 168.9 on 1 and 8 DF,  p-value: 1.164e-06
x <- c(151, 174, 138, 186, 128, 136, 179, 163, 152, 131)

y <- c(63, 81, 56, 91, 47, 57, 76, 72, 62, 48)

relation <- lm(y~x)

a <- data.frame(x = 170)
result <-  predict(relation,a)
print(result)
##        1 
## 76.22869
x <- c(151, 174, 138, 186, 128, 136, 179, 163, 152, 131)
y <- c(63, 81, 56, 91, 47, 57, 76, 72, 62, 48)
relation <- lm(y~x)

png(file = "linearregression.png")

plot(y,x,col = "blue",main = "Height & Weight Regression",
abline(lm(x~y)),cex = 1.3,pch = 16,xlab = "Weight in Kg",ylab = "Height in cm")

dev.off()
## png 
##   2

Linear regression adalah salah satu metode statistik yang paling umum digunakan untuk mempelajari hubungan antara variabel-variabel. Tujuannya adalah untuk memodelkan hubungan linier antara variabel dependen dan satu atau lebih variabel independen.

Dalam linear regression, kita mencari garis lurus terbaik yang dapat mewakili pola data yang diamati. Garis ini dapat digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai-nilai variabel independen yang baru.

Proses linear regression melibatkan penghitungan koefisien kemiringan (slope) dan intersep (intercept) dari garis regresi. Koefisien kemiringan menggambarkan perubahan rata-rata dalam variabel dependen ketika variabel independen berubah satu satuan, sedangkan intersep adalah nilai dari variabel dependen ketika variabel independen adalah nol.

Untuk mengestimasi garis regresi, digunakan metode kuadrat terkecil (least squares method) yang mencari garis yang memiliki kesalahan prediksi terkecil antara nilai yang diobservasi dan nilai yang diprediksi oleh model.

Linear regression dapat digunakan untuk berbagai keperluan. Misalnya, dalam ilmu sosial, dapat digunakan untuk memahami hubungan antara faktor-faktor seperti pendidikan, penghasilan, dan status sosial dalam memprediksi perilaku manusia. Dalam ekonomi, linear regression dapat digunakan untuk menganalisis hubungan antara variabel seperti harga dan penjualan. Dalam ilmu medis, dapat digunakan untuk mempelajari pengaruh faktor-faktor seperti usia, jenis kelamin, dan faktor risiko terhadap perkembangan penyakit.

Namun, penting untuk diingat bahwa linear regression memiliki asumsi tertentu, seperti hubungan linier antara variabel, ketidakadaan multikolinieritas, dan ketidaknormalan dalam distribusi residual. Jika asumsi ini tidak terpenuhi, hasil dari analisis regresi dapat menjadi tidak valid. Oleh karena itu, perlu dilakukan evaluasi dan pengujian yang cermat sebelum mengandalkan hasil dari model linear regression.