1. Import Dataset mtcars

Memuat dataset mtcars

data(mtcars)

Menampilkan Tabel, 6 baris pertama

head(mtcars) 
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
  1. Hitung Statistik Deskriptif untuk Variabel mpg

Statistik deskriptif untuk mpg

mpg_summary <- summary(mtcars$mpg) 
mpg_sd <- sd(mtcars$mpg)           

Output

mpg_summary
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.40   15.43   19.20   20.09   22.80   33.90
mpg_sd
## [1] 6.026948

Hasil: Mean (Rata-rata): 20.09 Median: 19.2 # Standar Deviasi (SD): 6.03 Minimum dan Maksimum: Rentang nilai mpg adalah 10.4 hingga 33.9.

Interpretasi: # Rata-rata efisiensi bahan bakar mobil dalam dataset adalah sekitar 20.09 MPG. Penyebaran data cukup besar karena standar deviasi 6.03 menunjukkan variasi efisiensi bahan bakar yang signifikan antar mobil.

  1. Buat Boxplot Variabel mpg Berdasarkan cyl Boxplot digunakan untuk membandingkan distribusi mpg (Miles per Gallon) berdasarkan kategori jumlah silinder (cyl).

Membuat boxplot

boxplot(mpg ~ cyl, data = mtcars,
        main = "Boxplot MPG Berdasarkan Cylinders",
        xlab = "Jumlah Cylinders",
        ylab = "Miles per Gallon (MPG)",
        col = c("lightblue", "lightgreen", "pink"))

Hasil: # Mobil dengan 4 silinder memiliki rata-rata mpg lebih tinggi dibandingkan dengan mobil dengan 6 atau 8 silinder. Distribusi mpg untuk mobil 8 silinder lebih sempit, menunjukkan nilai lebih konsisten.

Interpretasi: # Efisiensi bahan bakar cenderung menurun seiring dengan meningkatnya jumlah silinder. Hal ini wajar karena mobil dengan lebih banyak silinder biasanya memiliki tenaga yang lebih besar namun kurang efisien dalam konsumsi bahan bakar.

  1. Histogram Variabel hp dengan Garis Densitas Histogram digunakan untuk menggambarkan distribusi variabel hp (horsepower) dalam dataset mtcars, dilengkapi garis densitas untuk visualisasi lebih jelas.

Membuat histogram dengan garis densitas

hist(mtcars$hp, probability = TRUE, col = "lightblue",
     main = "Histogram HP dengan Garis Densitas",
     xlab = "Horsepower (HP)")
lines(density(mtcars$hp), col = "red", lwd = 2) # Garis densitas

Hasil: # Sebagian besar mobil memiliki nilai hp (horsepower) yang berkisar antara 50 hingga 150. # Garis densitas menunjukkan distribusi yang right-skewed, artinya terdapat beberapa mobil dengan horsepower sangat tinggi, namun jumlahnya sedikit.

Interpretasi: # Mayoritas mobil dalam dataset memiliki tenaga mesin yang relatif rendah hingga sedang. # Distribusi right-skewed menunjukkan ada outlier (mobil dengan tenaga mesin sangat besar).

  1. Uji ANOVA untuk Sepal.Length dalam Dataset iris ANOVA digunakan untuk menguji apakah terdapat perbedaan signifikan dalam rata-rata panjang sepal (Sepal.Length) antar spesies dalam dataset iris.

Memuat dataset iris

data(iris)
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

Uji ANOVA

anova_result <- aov(Sepal.Length ~ Species, data = iris)

Ringkasan hasil ANOVA

summary(anova_result)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Hasil: # Hasil ANOVA menunjukkan p-value < 0.05, yang berarti terdapat perbedaan signifikan dalam rata-rata panjang sepal (Sepal.Length) antar spesies (setosa, versicolor, dan virginica).

Interpretasi: # Rata-rata panjang sepal berbeda secara statistik antara spesies bunga. Misalnya, setosa cenderung memiliki sepal lebih pendek dibandingkan dengan spesies lain.

  1. Uji T-Test untuk Membandingkan Petal.Length antara setosa dan versicolor Uji t-test digunakan untuk membandingkan rata-rata panjang petal (Petal.Length) antara spesies setosa dan versicolor.

Subset data untuk setosa dan versicolor

setosa <- subset(iris, Species == "setosa")$Petal.Length
versicolor <- subset(iris, Species == "versicolor")$Petal.Length

Uji t-test

t_test_result <- t.test(setosa, versicolor, var.equal = TRUE)

Menampilkan hasil

t_test_result
## 
##  Two Sample t-test
## 
## data:  setosa and versicolor
## t = -39.493, df = 98, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.938597 -2.657403
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

Hasil: # p-value < 0.05, menunjukkan panjang petal (Petal.Length) untuk spesies setosa dan versicolor berbeda secara signifikan. # Rata-rata Petal.Length spesies versicolor lebih panjang dibandingkan setosa.

Interpretasi: # Data mendukung hipotesis bahwa kedua spesies memiliki karakteristik morfologi yang berbeda dalam hal panjang petal, yang dapat menjadi kunci identifikasi spesies

  1. Regresi Linear Sederhana untuk mpg Berdasarkan wt Model regresi linear digunakan untuk memprediksi nilai mpg (Miles per Gallon) berdasarkan berat mobil (wt).

Membuat model regresi

lm_model <- lm(mpg ~ wt, data = mtcars)

A. Ringkasan model

summary(lm_model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

B, Scatter plot dengan garis regresi

plot(mtcars$wt, mtcars$mpg,
     main = "Scatter Plot MPG vs Weight",
     xlab = "Weight (wt)",
     ylab = "Miles per Gallon (MPG)",
     pch = 19, col = "blue")
abline(lm_model, col = "red", lwd = 2)

Hasil Scatter Plot: # Scatter plot menunjukkan hubungan negatif antara berat mobil dan efisiensi bahan bakar. # Garis regresi berwarna merah menggambarkan tren penurunan mpg seiring dengan meningkatnya berat mobil.

C. Interpretasi: # Hubungan Negatif: Mobil dengan berat lebih besar memiliki efisiensi bahan bakar lebih rendah, yang terlihat dari kemiringan negatif garis regresi. # Koefisien Regresi: Setiap kenaikan 1 satuan berat mobil (wt) menurunkan rata-rata mpg sebesar 5.34. # Visualisasi Model: Scatter plot dengan garis regresi membantu memperkuat hasil numerik dari model regresi sebelumnya. Data cenderung mendekati garis regresi, menunjukkan model cukup baik dalam menjelaskan hubungan antara wt dan mpg.