1. Import dataset mtcars yang tersedia do R.

data(mtcars)

a. Hitung Statistik deskriptif (mean, median, standar deviasi) untuk variabel mpg.

mean_mpg <- mean(mtcars$mpg)
median_mpg <- median(mtcars$mpg)
sd_mpg <- sd(mtcars$mpg)

mean_mpg
## [1] 20.09062
median_mpg
## [1] 19.2
sd_mpg
## [1] 6.026948

b. Buat boxplot variabel mpg berdasarkan variabel cyl.

boxplot(mpg ~ cyl, data = mtcars, main = "Boxplot MPG berdasarkan CYL", xlab = "Jumlah Silinder (cyl)", ylab = "Miles per Gallon (mpg)")

2. Buat histogram untuk variabel hp (horsepower) dan tambahkan garis densitas. Jelaskan distribusi data berdasarkan grafik tersebut.

hist(mtcars$hp, probability = TRUE, main = "Histogram Horsepower dengan Densitas", xlab = "Horsepower (hp)")
lines(density(mtcars$hp), col = "green", lwd = 2)

Histogram menggambarkan distribusi frekuensi horsepower dalam dataset. Garis densitas menunjukkan distribusi probabilitasnya. Jika distribusi mendekati bentuk lonceng (normal), maka data memiliki distribusi normal. Namun, jika miring, artinya distribusi tidak normal.

3. Lakukan uji ANOVA untuk mengetahui apakah terdapat perbedaan signifikan pada rata-rata panjang sepal (Sepal.Length) antar spesies dalam dataset iris.

anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Uji ANOVA digunakan untuk melihat apakah ada perbedaan rata-rata panjang sepal antar spesies dalam dataset iris. Jika p-value < 0,05, berarti ada perbedaan signifikan.

4. Lakukan uji t-test dua sampel untuk membandingkan panjang petal (Petal.Length) antara spesies setosa dan versicolor. Berikan kesimpulan dari hasil uji tersebut.

t_test_result <- t.test(iris$Petal.Length[iris$Species == "setosa"], 
                        iris$Petal.Length[iris$Species == "versicolor"])
t_test_result
## 
##  Welch Two Sample t-test
## 
## data:  iris$Petal.Length[iris$Species == "setosa"] and iris$Petal.Length[iris$Species == "versicolor"]
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

Uji t-test dilakukan untuk membandingkan panjang petal antara spesies setosa dan versicolor. Jika p-value < 0,05, ada perbedaan signifikan antara kedua spesies tersebut.

5. Bangun model regresi linear sederhana menggunakan dataset mtcars untuk memprediksi mpg berdasarkan wt (berat mobil).

a. Tampilkan ringkasan model menggunakan summary().

model <- lm(mpg ~ wt, data = mtcars)
summary(model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

b. Buat scatter plot dengan garis regresi.

plot(mtcars$wt, mtcars$mpg, main = "Scatter Plot MPG vs Berat Mobil", xlab = "Berat Mobil (wt)", ylab = "Miles per Gallon (mpg)")
abline(model, col = "green", lwd = 2)

c. Interpretasikan hasil, termasuk koefisien regresi dan nilai R².

Koefisien regresi menunjukkan seberapa besar perubahan mpg jika ada perubahan satu unit pada berat mobil (wt). Nilai R² menunjukkan proporsi variabilitas mpg yang dapat dijelaskan oleh wt. Nilai R² yang lebih tinggi menunjukkan model yang lebih baik.