#B. Soal Praktik #1.a
# Mengakses dataset
data("mtcars")
# Menghitung statistik deskriptif
mean_mpg <- mean(mtcars$mpg)
median_mpg <- median(mtcars$mpg)
sd_mpg <- sd(mtcars$mpg)
mean_mpg
## [1] 20.09062
median_mpg
## [1] 19.2
sd_mpg
## [1] 6.026948
#1.b
# Membuat boxplot
boxplot(mpg ~ cyl, data = mtcars,
main = "Boxplot mpg berdasarkan cyl",
xlab = "Jumlah Silinder (cyl)",
ylab = "Miles per Gallon (mpg)",
col = c("grey", "red", "purple"))
#2
# Dataset mtcars
data("mtcars")
# Membuat histogram untuk variabel hp dan ditambahkan garis densitas
hist(mtcars$hp, breaks = 10, probability = TRUE,
main = "Histogram dan Garis Densitas hp",
xlab = "Horsepower (hp)",
col = "pink")
lines(density(mtcars$hp), col = "yellow", lwd = 4)
Penjelasan distribusi data berdasarkan grafik : Berdasarkan histogram
dan garis densitas pada grafik: 1. Bentuk Distribusi: - Distribusi data
horsepower (hp) terlihat tidak simetris dan condong ke kanan
(right-skewed). Hal ini ditunjukkan oleh ekor distribusi yang panjang di
sisi kanan.
Kesimpulan: Distribusi data horsepower (hp) bersifat right-skewed, dengan sebagian besar nilai terpusat pada rentang 100-150 dan hanya sedikit data dengan horsepower tinggi di atas 200.
#3
# Dataset iris
data("iris")
# Uji ANOVA
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#4
# Subset data untuk dua spesies
setosa <- subset(iris, Species == "setosa")$Petal.Length
versicolor <- subset(iris, Species == "versicolor")$Petal.Length
# Uji t-test
t_test_result <- t.test(setosa, versicolor)
t_test_result
##
## Welch Two Sample t-test
##
## data: setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -2.939618 -2.656382
## sample estimates:
## mean of x mean of y
## 1.462 4.260
Kesimpulan : Terdapat perbedaan rata-rata panjang petal yang signifikan secara statistik antara spesies setosa dan versicolor.
#5
# Model regresi linear
model <- lm(mpg ~ wt, data = mtcars)
#a.
#Ringkasan model
summary(model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
#b
# b. Scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg, main = "Regresi Linear mpg ~ wt",
xlab = "Berat Mobil (wt)", ylab = "Miles per Gallon (mpg)", pch = 19, col = "purple")
abline(model, col = "grey", lwd = 2)
#c
Persamaan regresi dari hasil: mpg = 37.2851 − 5.3445 x wt Intercept (37.2851): Ketika berat kendaraan (wt) adalah nol, rata-rata mpg diprediksi sebesar 37.2851. Namun, nilai ini kurang relevan secara praktis karena berat kendaraan tidak mungkin nol. Koefisien wt (-5.3445): Setiap peningkatan berat kendaraan sebesar 1 (dalam unit variabel wt), rata-rata mpg akan menurun sebesar 5.3445. Kekuatan Model (R-Squared) Multiple R-squared: 0.7528. Adjusted R-squared: 0.7446. R-squared sebesar 0.7528 menunjukkan bahwa 75.28% variasi dalam mpg dapat dijelaskan oleh variabel berat kendaraan (wt). Adjusted R-squared (0.7446) memperhitungkan jumlah prediktor dalam model dan tetap menunjukkan model memiliki kekuatan prediktif yang baik.