Hitung statistik deskriptif (mean, median, standar deviasi) untuk variabel mpg.

data(mtcars)
mpg_stats <- data.frame(
  Mean = mean(mtcars$mpg),
  Median = median(mtcars$mpg),
  Standard_Deviation = sd(mtcars$mpg)
)
print(mpg_stats)
##       Mean Median Standard_Deviation
## 1 20.09062   19.2           6.026948

Membuat boxplot variabel mpg berdasarkan variabel cyl.

boxplot(mpg ~ cyl, data = mtcars, 
        main = "Boxplot MPG berdasarkan Cylinders",
        xlab = "Cylinders",
        ylab = "Miles Per Gallon (MPG)",
        col = c("lightblue", "lightgreen", "pink"))

Histogram untuk variabel hp dengan garis densitas.

hist(mtcars$hp, probability = TRUE, 
     main = "Histogram Horsepower dengan Garis Densitas",
     xlab = "Horsepower",
     col = "green", border = "white")

lines(density(mtcars$hp), col = "blue", lwd = 2)

Penjelasan :

Distribusi Data: Histogram menunjukkan bahwa distribusi horsepower tidak simetris dan memiliki skewness ke kanan (positif). Artinya, terdapat lebih banyak mobil dengan horsepower rendah hingga sedang, sedangkan horsepower yang tinggi lebih jarang ditemui.

Puncak Distribusi (Mode): Garis densitas memiliki puncak (mode) sekitar nilai horsepower 100 hingga 120. Ini menunjukkan bahwa mayoritas kendaraan dalam dataset memiliki tenaga mesin (horsepower) dalam rentang tersebut.

Ekor Distribusi: Ekor distribusi ke arah kanan cukup panjang, yang mengindikasikan adanya beberapa mobil dengan horsepower tinggi di atas 200. Mobil ini adalah outlier dalam distribusi data.

Kesimpulan: Sebagian besar kendaraan memiliki horsepower yang rendah hingga sedang. Untuk analisis lebih lanjut, perlu dipertimbangkan efek dari distribusi skewed ini pada hasil statistik atau model regresi yang akan digunakan.

Uji ANOVA pada Sepal.Length berdasarkan Species dalam dataset iris.

# Uji ANOVA
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Uji t-test untuk membandingkan panjang petal antara spesies setosa dan versicolor

# Subset data
setosa <- iris[iris$Species == "setosa", "Petal.Length"]
versicolor <- iris[iris$Species == "versicolor", "Petal.Length"]

# Uji t-test
t_test_result <- t.test(setosa, versicolor)
t_test_result
## 
##  Welch Two Sample t-test
## 
## data:  setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

Kesimpulan : Hasil Welch Two Sample t-test menunjukkan perbedaan signifikan pada panjang petal (Petal Length) antara spesies Setosa dan Versicolor (t = -39.493, p-value < 2.2e-16). Rata-rata panjang petal Setosa adalah 1.462, sedangkan Versicolor adalah 4.260, dengan selisih rata-rata berada dalam interval kepercayaan 95% [-2.94, -2.66]. Karena nilai p sangat kecil, kita menolak hipotesis nol dan menyimpulkan bahwa panjang petal kedua spesies tersebut berbeda secara signifikan, di mana Versicolor

Model Regresi Linear Sederhana untuk mpg dan wt

# Model regresi linear
model <- lm(mpg ~ wt, data = mtcars)
summary(model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

Buat scatter plot dengan garis regresi.

# Scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg, 
     main = "Scatter Plot MPG vs WT",
     xlab = "Weight (WT)",
     ylab = "Miles Per Gallon (MPG)",
     pch = 19, col = "green")
abline(model, col = "red", lwd = 2)

Interpretasi hasil

terdapat hubungan negatif yang signifikan antara berat mobil (wt) dan efisiensi bahan bakar (mpg). Berdasarkan persamaan regresi yang diperoleh, setiap peningkatan berat mobil sebesar satu satuan akan menyebabkan penurunan rata-rata efisiensi bahan bakar sebesar 5,3445 satuan. Intersep sebesar 37,2851 menunjukkan nilai perkiraan mpg saat berat mobil adalah nol, meskipun ini bersifat teoretis. Nilai R-squared sebesar 75,28% menunjukkan bahwa model ini mampu menjelaskan 75,28% variasi dalam mpg, sehingga model memiliki kemampuan prediktif yang baik. Selain itu, koefisien regresi untuk wt dan uji F-statistik menunjukkan bahwa hubungan ini secara statistik signifikan dengan p-value < 0,001. Kesimpulannya, mobil yang lebih berat cenderung memiliki efisiensi bahan bakar yang lebih rendah, dan berat mobil adalah faktor penting dalam menentukan konsumsi bahan bakar.