#B. Soal Praktik #1.a

# Mengakses dataset
data("mtcars")
# Menghitung statistik deskriptif
mean_mpg <- mean(mtcars$mpg)
median_mpg <- median(mtcars$mpg)
sd_mpg <- sd(mtcars$mpg)

mean_mpg
## [1] 20.09062
median_mpg
## [1] 19.2
sd_mpg
## [1] 6.026948

#1.b

# Membuat boxplot
boxplot(mpg ~ cyl, data = mtcars,
        main = "Boxplot mpg berdasarkan cyl",
        xlab = "Jumlah Silinder (cyl)",
        ylab = "Miles per Gallon (mpg)",
        col = c("grey", "red", "purple"))

#2

# Dataset mtcars
data("mtcars")
# Membuat histogram untuk variabel hp dan ditambahkan garis densitas
hist(mtcars$hp, breaks = 10, probability = TRUE,
     main = "Histogram dan Garis Densitas hp",
     xlab = "Horsepower (hp)",
     col = "pink")
lines(density(mtcars$hp), col = "yellow", lwd = 4)

Penjelasan distribusi data berdasarkan grafik : Berdasarkan histogram dan garis densitas pada grafik: 1. Bentuk Distribusi: - Distribusi data horsepower (hp) terlihat tidak simetris dan condong ke kanan (right-skewed). Hal ini ditunjukkan oleh ekor distribusi yang panjang di sisi kanan.

  1. Puncak Distribusi (Mode):
    • Histogram memiliki satu puncak utama (unimodal) pada rentang horsepower sekitar 100-150, yang menunjukkan bahwa sebagian besar data berada pada kisaran tersebut.
  2. Penyebaran Data:
    • Sebagian besar data horsepower berkisar antara 50 hingga 200.
    • Ada beberapa nilai horsepower yang lebih besar dari 200 (hingga 350), tetapi jumlahnya jauh lebih sedikit, menciptakan ekor panjang ke kanan.
  3. Garis Densitas:
    • Garis densitas memberikan gambaran halus dari distribusi, mengonfirmasi pola right-skewed. Tingginya densitas pada rentang 100-150 mencerminkan konsentrasi data di area tersebut.

Kesimpulan: Distribusi data horsepower (hp) bersifat right-skewed, dengan sebagian besar nilai terpusat pada rentang 100-150 dan hanya sedikit data dengan horsepower tinggi di atas 200.

#3

# Dataset iris
data("iris")
# Uji ANOVA
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

#4

# Subset data untuk dua spesies
setosa <- subset(iris, Species == "setosa")$Petal.Length
versicolor <- subset(iris, Species == "versicolor")$Petal.Length
# Uji t-test
t_test_result <- t.test(setosa, versicolor)
t_test_result
## 
##  Welch Two Sample t-test
## 
## data:  setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

Kesimpulan : Terdapat perbedaan rata-rata panjang petal yang signifikan secara statistik antara spesies setosa dan versicolor.

#5

# Model regresi linear
model <- lm(mpg ~ wt, data = mtcars)

#a.

#Ringkasan model
summary(model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

#b

# b. Scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg, main = "Regresi Linear mpg ~ wt",
     xlab = "Berat Mobil (wt)", ylab = "Miles per Gallon (mpg)", pch = 19, col = "purple")
abline(model, col = "grey", lwd = 2)

#c

Persamaan regresi dari hasil: mpg = 37.2851 − 5.3445 x wt Intercept (37.2851): Ketika berat kendaraan (wt) adalah nol, rata-rata mpg diprediksi sebesar 37.2851. Namun, nilai ini kurang relevan secara praktis karena berat kendaraan tidak mungkin nol. Koefisien wt (-5.3445): Setiap peningkatan berat kendaraan sebesar 1 (dalam unit variabel wt), rata-rata mpg akan menurun sebesar 5.3445. Kekuatan Model (R-Squared) Multiple R-squared: 0.7528. Adjusted R-squared: 0.7446. R-squared sebesar 0.7528 menunjukkan bahwa 75.28% variasi dalam mpg dapat dijelaskan oleh variabel berat kendaraan (wt). Adjusted R-squared (0.7446) memperhitungkan jumlah prediktor dalam model dan tetap menunjukkan model memiliki kekuatan prediktif yang baik.