Praktikum Analisis Regresi P1
Data
pendapatan <-c(15,20,25,20,25,30,16,15,25,20,16,18,20,25,30,25,19,10,20,20)
pengeluaran <-c(10,15,20,16,22,25,15,14,10,18,12,15,15,20,25,23,16,8,15,17)
data1 <-data.frame(pendapatan, pengeluaran) #membuat dataframe
head(data1)
## pendapatan pengeluaran
## 1 15 10
## 2 20 15
## 3 25 20
## 4 20 16
## 5 25 22
## 6 30 25
Eksplorasi Data
Scatter plot
plot(data1$pendapatan, data1$pengeluaran, main="Scatterplot",xlab="Pendapatan", ylab="Pengeluaran", pch=19)
Boxplot
par(mfrow=c(1, 2)) # divide graph area in 2 columns
boxplot(data1$pendapatan, main="Pendapatan", sub=paste("Outlier rows: ", boxplot.stats(data1$pendapatan)$out)) # box plot for 'pendapatan'
boxplot(data1$pengeluaran, main="Pengeluaran", sub=paste("Outlier rows: ", boxplot.stats(data1$pengeluaran)$out)) # box plot for 'pengeluaran'
## [1] 0.8291603
Persamaan Regresi Linier Sederhana
Estimasi Parameter Regresi dengan Metode MKT manual
data1$xdif <- data1$pendapatan-mean(data1$pendapatan)
data1$ydif <- data1$pengeluaran-mean(data1$pengeluaran)
data1$crp <- data1$xdif * data1$ydif
data1$xsq <- data1$xdif^2
#estimator b0 dan b1
b1 <- sum(data1$crp)/sum(data1$xsq)
b1
## [1] 0.7751892
## [1] 0.5035842
Estimasi Parameter Regresi dengan R function
#gunakan perintah help(lm) untuk mengetahui secara detail suatu fungsi dalam R
lm1 <- lm(pengeluaran ~ pendapatan, data=data1) # build linear regression model on full data
summary(lm1)
##
## Call:
## lm(formula = pengeluaran ~ pendapatan, data = data1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.8833 -0.9318 0.3298 1.3977 3.1167
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.5036 2.6236 0.192 0.85
## pendapatan 0.7752 0.1232 6.293 6.22e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.761 on 18 degrees of freedom
## Multiple R-squared: 0.6875, Adjusted R-squared: 0.6701
## F-statistic: 39.6 on 1 and 18 DF, p-value: 6.22e-06
plot(data1$pendapatan,data1$pengeluaran,main="Pengeluaran ~ Pendapatan",xlab="Pendapatan",ylab="Pengeluaran", pch=19)
abline(lm1,col="blue")
Excercise
Para ilmuwan kehutanan prihatin dengan penurunan pertumbuhan hutan di seluruh dunia. Salah satu aspek dari penurunan ini adalah kemungkinan dampak emisi dari pembangkit listrik tenaga batu bara. Para ilmuwan khususnya tertarik pada tingkat pH tanah dan dampaknya terhadap terhambatnya pertumbuhan pohon. Para ilmuwan mempelajari berbagai hutan yang kemungkinan terkena emisi tersebut. Mereka mengukur berbagai aspek pertumbuhan yang terkait dengan pepohonan di wilayah tertentu dan pH tanah di wilayah yang sama. Para ilmuwan kehutanan kemudian ingin menentukan dampak terhadap pertumbuhan pohon ketika tanah menjadi lebih asam. Indeks keterbelakangan pertumbuhan dibangun dari berbagai pengukuran yang dilakukan pada pohon dengan nilai yang tinggi menunjukkan keterbelakangan pertumbuhan pohon yang lebih besar. Semakin tinggi nilai pH tanah menunjukkan semakin masamnya tanah tersebut. Dua puluh pohon yang terkena emisi pembangkit listrik dipilih untuk dipelajari. Nilai indeks keterbelakangan pertumbuhan (growth retardation index) dan rata-rata pH tanah (average soil pH) terdapat pada Tabel di bawah ini.
Tentukan persamaan regresi dari data tersebut.
Prediksi indeks pertumbuhan apabila rata-rata ph tanah 4.9.
Interpretasi koefisien \(b_1\).