B. Soal Praktik

1. Import dataset mtcars

dataset=mtcars

a. Menghitung statistik deskriptif untuk variabel mpg

data=mtcars$mpg
summary(data)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.40   15.43   19.20   20.09   22.80   33.90

b. Buat boxplot variabel mpg berdasrkan variabel cyl

boxplot(mpg~cyl, data=mtcars, 
        main="Boxplot variabel mpg berdasarkan variabel cyl",
        xlab="Jumlah Silinder", 
        ylab="Mil per Galon", 
        col=c("cyan", "lightgreen", "red"), 
        border="navy" )

2. Histogram untuk variabel hp (horse power) dengan garis densitas

hist(mtcars$hp, 
     breaks=15,
     col="cyan",
     main="Histogram untuk variabel hp (Horse Power) dengan garis densitas", 
     xlab="Horse Power", 
     ylab="Frekuensi", 
     freq=FALSE)
lines(density(mtcars$hp), 
      col="red", 
      lwd=3)

Distribusi Horse Power pada dataset mtcars cenderung terpusat di sekitar 100 hingga 150 hp, dengan distribusi yang sedikit skewed positif (lebih banyak data di sisi kiri), dan beberapa mobil dengan Horse Power tinggi sebagai outliers. Secara keseluruhan, distribusi ini tidak simetris dan memiliki puncak yang jelas, dengan sedikit data yang menunjukkan tenaga mobil sangat tinggi.

3. Uji ANOVA

anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Hasil ANOVA yang dilakukan pada data iris menunjukkan bahwa ada perbedaan yang signifikan dalam rata-rata panjang sepal (Sepal.Length) antara spesies bunga yang berbeda. Berdasarkan output, nilai p-value untuk uji F sangat kecil (< 0.001), yang berarti kita dapat menolak hipotesis nol (H0) yang menyatakan bahwa tidak ada perbedaan antara spesies. Nilai F yang besar (119.3) mengindikasikan bahwa variasi antar kelompok (spesies) jauh lebih besar dibandingkan variasi dalam kelompok, menegaskan bahwa spesies mempengaruhi panjang sepal secara signifikan. Dengan demikian, kita dapat menyimpulkan bahwa panjang sepal bervariasi secara signifikan antara spesies dalam dataset iris.

4. Uji t-test

data(iris)
setosa <- iris[iris$Species == "setosa", "Petal.Length"]
versicolor <- iris[iris$Species == "versicolor", "Petal.Length"]
t_test_result <- t.test(setosa, versicolor)
t_test_result
## 
##  Welch Two Sample t-test
## 
## data:  setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

Berdasarkan hasil uji t-test dua sampel yang dilakukan untuk membandingkan panjang petal antara spesies Setosa dan Versicolor, diperoleh nilai p-value sebesar (2.2e-16). Karena p-value ini jauh lebih kecil dari tingkat signifikansi yang umum digunakan (0.05), kita menolak hipotesis nol yang menyatakan bahwa tidak ada perbedaan rata-rata panjang petal antara kedua spesies. Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan yang signifikan secara statistik dalam panjang petal antara bunga Setosa dan Versicolor. Kesimpulannya, berdasarkan hasil uji t-test, panjang petal spesies Setosa dan Versicolor berbeda secara signifikan. Perbedaan ini menunjukkan bahwa faktor spesies mempengaruhi panjang petal bunga, dengan Setosa dan Versicolor memiliki ukuran petal yang berbeda dalam hal rata-rata.

5. Model Regresi Linear sederhana menggunak dataset mtcars untuk memprediksi mpg berdasarkan wt (berat mobil)

a. Tampilkan ringkasan summary()

model=lm(mpg~wt, data=mtcars)
summary(model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

b. Buat scatterplot dengan garis regresi

library(ggplot2)
ggplot(mtcars, aes(x=wt, y=mpg))+
  geom_point()+
  geom_smooth(method="lm", col="darkblue")+
  labs(titlle="Regresi Linear antara mpg dan wt", x="Berat mobil (wt)", y="Miles per gallon (mpg)")
## `geom_smooth()` using formula = 'y ~ x'

c. Interpretasi hasil

Koefisien regresi untuk wt mengindikasikan seberapa besar perubahan pada mpg terkait dengan perubahan pada berat mobil. Misalnya, jika koefisien regresi untuk wt adalah -5.344, maka setiap kenaikan 1 unit pada berat mobil (misalnya, dari 3.0 menjadi 4.0) akan menyebabkan penurunan sekitar 5.34 mil per galon dalam konsumsi bahan bakar. Ini menunjukkan bahwa semakin berat mobil, semakin rendah efisiensi bahan bakarnya. Koefisien intersep (konstanta) menunjukkan nilai prediksi mpg ketika wt bernilai 0. Ini lebih bersifat teoretis dalam konteks dunia nyata karena berat mobil tidak mungkin 0, tetapi dapat memberi gambaran tentang model secara keseluruhan. Sedangkan Nilai R-squared dalam model ini menggambarkan seberapa baik model regresi linear menjelaskan variabilitas data mpg berdasarkan variabel wt. Sebagai contoh, jika nilai R² adalah 0.75, ini berarti bahwa sekitar 75% variasi dalam konsumsi bahan bakar (mpg) dapat dijelaskan oleh berat mobil (wt), sedangkan sisanya (25%) dipengaruhi oleh faktor lain yang tidak tercakup dalam model ini. Nilai R² yang tinggi menunjukkan hubungan yang cukup kuat antara variabel wt dan mpg.