Import data dan menghitung Statistik Deskriptif (mean, median, standar deviasi) untuk Variabel mpg

data(mtcars)  # Memuat dataset mtcars
mpg_stats <- data.frame(
  Mean = mean(mtcars$mpg),
  Median = median(mtcars$mpg),
  SD = sd(mtcars$mpg)
)
mpg_stats
##       Mean Median       SD
## 1 20.09062   19.2 6.026948

Membuat Boxplot Variabel mpg Berdasarkan Variabel cyl

boxplot(mpg ~ cyl, data = mtcars, 
        main = "Boxplot MPG Berdasarkan Jumlah Silinder",
        xlab = "Jumlah Silinder", 
        ylab = "Miles per Gallon (MPG)", 
        col = c("skyblue", "orange", "green"))

Membuat histogram untuk Variabel hp dengan Garis Densitas

hist(mtcars$hp, breaks = 10, prob = TRUE, 
     main = "Histogram Horsepower dengan Garis Densitas", 
     xlab = "Horsepower (hp)", col = "lightblue")
lines(density(mtcars$hp), col = "red", lwd = 2)

Berdasarkan histogram dan garis densitas di atas:

  1. Bentuk Distribusi: Distribusi horsepower (hp) tidak simetris dan tampak memiliki kemiringan (skewed) ke arah kanan. Ini menunjukkan bahwa sebagian besar nilai horsepower terkonsentrasi di rentang yang lebih rendah (sekitar 50–150), sementara ada beberapa nilai ekstrem di rentang yang lebih tinggi (di atas 200).

  2. Puncak Distribusi: Puncak densitas (mode) terjadi di sekitar nilai 100, menunjukkan bahwa banyak mobil dalam dataset memiliki horsepower di sekitar nilai tersebut.

  3. Ekor Distribusi: Ekor kanan yang panjang menunjukkan adanya beberapa mobil dengan horsepower yang jauh lebih tinggi daripada rata-rata, yang merupakan indikasi distribusi right-skewed.

Kesimpulan: Distribusi horsepower dalam dataset ini tidak normal, melainkan cenderung miring ke kanan dengan nilai yang beragam dan beberapa outlier di sisi kanan.

Uji ANOVA pada Dataset iris

data(iris)  # Memuat dataset iris
anova_model <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_model)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Hasil uji ANOVA menunjukkan adanya perbedaan yang signifikan pada rata-rata panjang sepal (Sepal.Length) antar spesies dalam dataset iris dengan nilai F sebesar 119.3 dan p-value < 2e-16. Hal ini menunjukkan bahwa variasi panjang sepal antar spesies jauh lebih besar dibandingkan variasi dalam spesies, sehingga dapat disimpulkan bahwa rata-rata panjang sepal berbeda secara signifikan antar spesies.

Uji T-Test Dua Sampel (Setosa vs Versicolor)

setosa_versicolor <- subset(iris, Species %in% c("setosa", "versicolor"))
t_test <- t.test(Petal.Length ~ Species, data = setosa_versicolor)
t_test
## 
##  Welch Two Sample t-test
## 
## data:  Petal.Length by Species
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group setosa and group versicolor is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
##     mean in group setosa mean in group versicolor 
##                    1.462                    4.260

Hasil uji Welch Two Sample t-test menunjukkan bahwa rata-rata panjang petal (Petal.Length) spesies setosa (1.462) secara signifikan lebih rendah dibandingkan spesies versicolor (4.260). Dengan t = -39.493, derajat kebebasan = 62.14, dan p-value < 2.2e-16, perbedaan ini sangat signifikan secara statistik. Interval kepercayaan 95% untuk selisih rata-rata panjang petal adalah antara -2.94 dan -2.66, yang menunjukkan bahwa panjang petal spesies setosa secara konsisten lebih pendek daripada versicolor.

Model Regresi Linear Sederhana pada dataset mtcars

## Ringkasan Model
linear_model <- lm(mpg ~ wt, data = mtcars)
summary(linear_model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10
## Scatter Plot dengan Garis Regresi
plot(mtcars$wt, mtcars$mpg, 
     main = "Scatter Plot Berat Mobil dan MPG", 
     xlab = "Berat Mobil (wt)", 
     ylab = "Miles per Gallon (MPG)", 
     pch = 16, col = "blue")
abline(linear_model, col = "red", lwd = 2)

Hasil regresi linear menunjukkan hubungan negatif yang signifikan antara berat mobil (wt) dan efisiensi bahan bakar (mpg). Koefisien regresi menunjukkan bahwa ketika berat mobil (wt) meningkat, efisiensi bahan bakar (mpg) cenderung menurun. Secara khusus, setiap kenaikan 1 satuan berat mobil akan mengurangi mpg sebesar 5.3445. Nilai intercept sebesar 37.2851 menunjukkan bahwa pada mobil dengan berat 0, efisiensi bahan bakar diprediksi sebesar 37.2851 mpg. Model ini memiliki nilai R-squared sebesar 0.7528, yang berarti 75.28% variasi dalam mpg dapat dijelaskan oleh berat mobil. Dengan nilai p-value yang sangat kecil (p < 0.001) untuk koefisien regresi, hubungan ini dapat dianggap sangat signifikan. Secara keseluruhan, model regresi ini menunjukkan bahwa berat mobil merupakan prediktor yang kuat untuk efisiensi bahan bakar.