1. Impor dataset mtcars yang tersedia di R

mtcars
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
## Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2

a. hitung statistik deskriptif(mean, median, standar deviasi) untuk variabel mpg.

mean_mpg <- mean(mtcars$mpg)
median_mpg <- median(mtcars$mpg)
sd_mpg <- sd(mtcars$mpg)
cat("Mean mpg:", mean_mpg, "\n")
## Mean mpg: 20.09062

hasil rata rata untuk variabel mpg didalam data mtcars bernilai 20.09062

cat("Median mpg:", median_mpg, "\n")
## Median mpg: 19.2

kemudian untuk nilai tengah data di variabel mpg adalah 19.2

cat("Standar Deviasi mpg:", sd_mpg, "\n")
## Standar Deviasi mpg: 6.026948

standar deviasi dari data di variabel mpg sebesar 6.026948

b. Buat boxplot untuk variabel mpg berdasarkan variabel cyl

library(ggplot2)
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
  geom_boxplot() +
  labs(title = "Boxplot MPG berdasarkan Jumlah Silinder",
       x = "Jumlah Silinder",
       y = "Miles per Gallon (MPG)")

berdasarkan variabel cyl atau silinder:

4 silinder: Rentang MPG sekitar 21 hingga 33. Median sekitar 26. Jadi, kendaraan dengan 4 silinder cenderung memiliki efisiensi bahan bakar yang lebih tinggi, dengan nilai MPG yang lebih tinggi dibandingkan dengan kendaraan dengan jumlah silinder yang lebih banyak.

6 silinder: Rentang MPG sekitar 17 hingga 22. Median sekitar 19. Jadi, kendaraan dengan 6 silinder memiliki efisiensi bahan bakar yang lebih rendah dibandingkan dengan kendaraan 4 silinder, tetapi lebih tinggi dibandingkan kendaraan 8 silinder.

8 silinder: Rentang MGP sekitar 12 hingga 19. Median sekitar 15. Jadi, kendaraan dengan 8 silinder memiliki efisiensi bahan bakar yang paling rendah diantara ketiga kelompok. kesimpulannya didapar bahwa jumlah silinder dalam kendaraan memiliki hubungan negatif dengan efisiensi bahan bakar (MPG).Semakin banyak silinder, semakin rendah efisiensi bahan bakar kendaraan tersebut.

2. Buat histogram untuk variabel hp (horsepower) dan tambahkan garis densitas. Jelaskan distribusi data berdasarkan grafik tersebut.

ggplot(mtcars, aes(x = hp)) +
  geom_histogram(aes(y = ..density..), bins = 15, fill = "blue", alpha = 0.5) +
  geom_density(color = "red", size = 1) +
  labs(title = "HistogramHorsepower dengan Garis Densitas",
       x = "Horsepower (hp)",
       y = "Density")
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Distribusi data horsepower (hp) berdasarkan histogram dengan garis densitas menunjukkan beberapa karakteristik penting. Terdapat dua puncak densitas utama, dengan puncak pertama berada di sekitar 100 hp dan puncak kedua di sekitar 200 hp. hal tersebut menunjukkan bahwa banyak kendaraan dalam dataset memiliki tenaga kuda di sekitar nilai-nilai tersebut, mengindikasikan adanya dua kelompok utama dalam data, mungkin mewakili jenis kendaraan yang berbeda seperti mobil ekonomi dan mobil performa tinggi. Data horsepower tersebar dari sekitar 50 hp hingga lebih dari 300 hp, namun sebagian besar data berada di rentang 50 hingga 250 hp. Distribusi ini bersifat bimodal, dengan dua puncak yang jelas, dan memiliki ekor kanan yang panjang, menunjukkan bahwa ada beberapa kendaraan dengan tenaga kuda yang sangat tinggi (di atas 300 hp), meskipun jumlahnya relatif sedikit. Sebagian besar kendaraan memiliki tenaga kuda di bawah 200 hp, dengan kepadatan tertinggi di sekitar 100 hp. Grafik ini memberikan gambaran visual yang jelas tentang bagaimana data horsepower terdistribusi dalam dataset mtcars, membantu dalam analisis lebih lanjut atau pengambilan keputusan berdasarkan data tersebut.

3. Lakukan uji ANOVA untuk mengetahui apakah terdapat perbedaan signifikan pada rata-rata panjang sepal(Sepal.Length) antar spesies dalam dataset iris.

iris
##     Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1            5.1         3.5          1.4         0.2     setosa
## 2            4.9         3.0          1.4         0.2     setosa
## 3            4.7         3.2          1.3         0.2     setosa
## 4            4.6         3.1          1.5         0.2     setosa
## 5            5.0         3.6          1.4         0.2     setosa
## 6            5.4         3.9          1.7         0.4     setosa
## 7            4.6         3.4          1.4         0.3     setosa
## 8            5.0         3.4          1.5         0.2     setosa
## 9            4.4         2.9          1.4         0.2     setosa
## 10           4.9         3.1          1.5         0.1     setosa
## 11           5.4         3.7          1.5         0.2     setosa
## 12           4.8         3.4          1.6         0.2     setosa
## 13           4.8         3.0          1.4         0.1     setosa
## 14           4.3         3.0          1.1         0.1     setosa
## 15           5.8         4.0          1.2         0.2     setosa
## 16           5.7         4.4          1.5         0.4     setosa
## 17           5.4         3.9          1.3         0.4     setosa
## 18           5.1         3.5          1.4         0.3     setosa
## 19           5.7         3.8          1.7         0.3     setosa
## 20           5.1         3.8          1.5         0.3     setosa
## 21           5.4         3.4          1.7         0.2     setosa
## 22           5.1         3.7          1.5         0.4     setosa
## 23           4.6         3.6          1.0         0.2     setosa
## 24           5.1         3.3          1.7         0.5     setosa
## 25           4.8         3.4          1.9         0.2     setosa
## 26           5.0         3.0          1.6         0.2     setosa
## 27           5.0         3.4          1.6         0.4     setosa
## 28           5.2         3.5          1.5         0.2     setosa
## 29           5.2         3.4          1.4         0.2     setosa
## 30           4.7         3.2          1.6         0.2     setosa
## 31           4.8         3.1          1.6         0.2     setosa
## 32           5.4         3.4          1.5         0.4     setosa
## 33           5.2         4.1          1.5         0.1     setosa
## 34           5.5         4.2          1.4         0.2     setosa
## 35           4.9         3.1          1.5         0.2     setosa
## 36           5.0         3.2          1.2         0.2     setosa
## 37           5.5         3.5          1.3         0.2     setosa
## 38           4.9         3.6          1.4         0.1     setosa
## 39           4.4         3.0          1.3         0.2     setosa
## 40           5.1         3.4          1.5         0.2     setosa
## 41           5.0         3.5          1.3         0.3     setosa
## 42           4.5         2.3          1.3         0.3     setosa
## 43           4.4         3.2          1.3         0.2     setosa
## 44           5.0         3.5          1.6         0.6     setosa
## 45           5.1         3.8          1.9         0.4     setosa
## 46           4.8         3.0          1.4         0.3     setosa
## 47           5.1         3.8          1.6         0.2     setosa
## 48           4.6         3.2          1.4         0.2     setosa
## 49           5.3         3.7          1.5         0.2     setosa
## 50           5.0         3.3          1.4         0.2     setosa
## 51           7.0         3.2          4.7         1.4 versicolor
## 52           6.4         3.2          4.5         1.5 versicolor
## 53           6.9         3.1          4.9         1.5 versicolor
## 54           5.5         2.3          4.0         1.3 versicolor
## 55           6.5         2.8          4.6         1.5 versicolor
## 56           5.7         2.8          4.5         1.3 versicolor
## 57           6.3         3.3          4.7         1.6 versicolor
## 58           4.9         2.4          3.3         1.0 versicolor
## 59           6.6         2.9          4.6         1.3 versicolor
## 60           5.2         2.7          3.9         1.4 versicolor
## 61           5.0         2.0          3.5         1.0 versicolor
## 62           5.9         3.0          4.2         1.5 versicolor
## 63           6.0         2.2          4.0         1.0 versicolor
## 64           6.1         2.9          4.7         1.4 versicolor
## 65           5.6         2.9          3.6         1.3 versicolor
## 66           6.7         3.1          4.4         1.4 versicolor
## 67           5.6         3.0          4.5         1.5 versicolor
## 68           5.8         2.7          4.1         1.0 versicolor
## 69           6.2         2.2          4.5         1.5 versicolor
## 70           5.6         2.5          3.9         1.1 versicolor
## 71           5.9         3.2          4.8         1.8 versicolor
## 72           6.1         2.8          4.0         1.3 versicolor
## 73           6.3         2.5          4.9         1.5 versicolor
## 74           6.1         2.8          4.7         1.2 versicolor
## 75           6.4         2.9          4.3         1.3 versicolor
## 76           6.6         3.0          4.4         1.4 versicolor
## 77           6.8         2.8          4.8         1.4 versicolor
## 78           6.7         3.0          5.0         1.7 versicolor
## 79           6.0         2.9          4.5         1.5 versicolor
## 80           5.7         2.6          3.5         1.0 versicolor
## 81           5.5         2.4          3.8         1.1 versicolor
## 82           5.5         2.4          3.7         1.0 versicolor
## 83           5.8         2.7          3.9         1.2 versicolor
## 84           6.0         2.7          5.1         1.6 versicolor
## 85           5.4         3.0          4.5         1.5 versicolor
## 86           6.0         3.4          4.5         1.6 versicolor
## 87           6.7         3.1          4.7         1.5 versicolor
## 88           6.3         2.3          4.4         1.3 versicolor
## 89           5.6         3.0          4.1         1.3 versicolor
## 90           5.5         2.5          4.0         1.3 versicolor
## 91           5.5         2.6          4.4         1.2 versicolor
## 92           6.1         3.0          4.6         1.4 versicolor
## 93           5.8         2.6          4.0         1.2 versicolor
## 94           5.0         2.3          3.3         1.0 versicolor
## 95           5.6         2.7          4.2         1.3 versicolor
## 96           5.7         3.0          4.2         1.2 versicolor
## 97           5.7         2.9          4.2         1.3 versicolor
## 98           6.2         2.9          4.3         1.3 versicolor
## 99           5.1         2.5          3.0         1.1 versicolor
## 100          5.7         2.8          4.1         1.3 versicolor
## 101          6.3         3.3          6.0         2.5  virginica
## 102          5.8         2.7          5.1         1.9  virginica
## 103          7.1         3.0          5.9         2.1  virginica
## 104          6.3         2.9          5.6         1.8  virginica
## 105          6.5         3.0          5.8         2.2  virginica
## 106          7.6         3.0          6.6         2.1  virginica
## 107          4.9         2.5          4.5         1.7  virginica
## 108          7.3         2.9          6.3         1.8  virginica
## 109          6.7         2.5          5.8         1.8  virginica
## 110          7.2         3.6          6.1         2.5  virginica
## 111          6.5         3.2          5.1         2.0  virginica
## 112          6.4         2.7          5.3         1.9  virginica
## 113          6.8         3.0          5.5         2.1  virginica
## 114          5.7         2.5          5.0         2.0  virginica
## 115          5.8         2.8          5.1         2.4  virginica
## 116          6.4         3.2          5.3         2.3  virginica
## 117          6.5         3.0          5.5         1.8  virginica
## 118          7.7         3.8          6.7         2.2  virginica
## 119          7.7         2.6          6.9         2.3  virginica
## 120          6.0         2.2          5.0         1.5  virginica
## 121          6.9         3.2          5.7         2.3  virginica
## 122          5.6         2.8          4.9         2.0  virginica
## 123          7.7         2.8          6.7         2.0  virginica
## 124          6.3         2.7          4.9         1.8  virginica
## 125          6.7         3.3          5.7         2.1  virginica
## 126          7.2         3.2          6.0         1.8  virginica
## 127          6.2         2.8          4.8         1.8  virginica
## 128          6.1         3.0          4.9         1.8  virginica
## 129          6.4         2.8          5.6         2.1  virginica
## 130          7.2         3.0          5.8         1.6  virginica
## 131          7.4         2.8          6.1         1.9  virginica
## 132          7.9         3.8          6.4         2.0  virginica
## 133          6.4         2.8          5.6         2.2  virginica
## 134          6.3         2.8          5.1         1.5  virginica
## 135          6.1         2.6          5.6         1.4  virginica
## 136          7.7         3.0          6.1         2.3  virginica
## 137          6.3         3.4          5.6         2.4  virginica
## 138          6.4         3.1          5.5         1.8  virginica
## 139          6.0         3.0          4.8         1.8  virginica
## 140          6.9         3.1          5.4         2.1  virginica
## 141          6.7         3.1          5.6         2.4  virginica
## 142          6.9         3.1          5.1         2.3  virginica
## 143          5.8         2.7          5.1         1.9  virginica
## 144          6.8         3.2          5.9         2.3  virginica
## 145          6.7         3.3          5.7         2.5  virginica
## 146          6.7         3.0          5.2         2.3  virginica
## 147          6.3         2.5          5.0         1.9  virginica
## 148          6.5         3.0          5.2         2.0  virginica
## 149          6.2         3.4          5.4         2.3  virginica
## 150          5.9         3.0          5.1         1.8  virginica
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

H0 : μ1 = μ2 = μ3 (Rata-rata panjang sepal untuk semua spesies adalah sama) H1 : Setidaknya ada satu pasangan spesies dengan rata-rata panjang sepal yang berbeda

Jika hasil uji ANOVA menunjukkan p-value yang lebih kecil dari tingkat signifikansi (misalnya, 0.05), maka kita menolak hipotesis nol (H0) dan menerima hipotesis alternatif (H1), yang berarti terdapat perbedaan signifikan pada rata-rata panjang sepal antar spesies. Jika p-value lebih besar dari tingkat signifikansi, maka kita gagal menolak hipotesis nol, yang berarti tidak ada bukti yang cukup untuk menyatakan adanya perbedaan signifikan pada rata-rata panjang sepal antar spesies.

Nilai p-value yang sangat kecil (<2e-16) menunjukkan bahwa terdapat perbedaan yang signifikan pada rata-rata panjang sepal antar spesies dalam dataset iris. Dengan kata lain, spesies yang berbeda memiliki panjang sepal yang berbeda secara signifikan. Hasil ini didukung oleh nilai F yang tinggi (119.3), yang menunjukkan bahwa variabilitas antar spesies jauh lebih besar dibandingkan dengan variabilitas dalam spesies.

4. Lakukan uji t-test dua sampel untuk membandingkan panjang petal (Petal.Length) antara spesies setosa dan versicolor. Berikan kesimpulan dari hasil uji tersebut.

# Memisahkan data berdasarkan spesies
setosa <- subset(iris, Species == "setosa")$Petal.Length
versicolor <- subset(iris, Species == "versicolor")$Petal.Length
# uji t-test two sample
t_test_result <- t.test(setosa, versicolor)
# Melihat hasil uji t-test
t_test_result
## 
##  Welch Two Sample t-test
## 
## data:  setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

Kesimpulan hasil pengujian: Berdasarkan hasil uji t-test dua sampel untuk membandingkan panjang petal (Petal.Length) antara spesies setosa dan versicolor, terdapat perbedaan yang signifikan secara statistik antara kedua spesies tersebut. Nilai t yang sangat besar (atau kecil dalam hal ini, karena negatif) dan p-value yang sangat kecil (lebih kecil dari 2.2e-16) menunjukkan bahwa perbedaan ini sangat signifikan. Interval kepercayaan 95% juga tidak mencakup nol, yang berarti perbedaan rata-rata antara kedua kelompok tersebut signifikan. Rata-rata panjang petal untuk spesies setosa adalah 1.462, sedangkan untuk spesies versicolor adalah 4.260. Dengan demikian, kita dapat menyimpulkan bahwa panjang petal antara spesies setosa dan versicolor berbeda secara signifikan.

5. Bangun model regresi linear sederhana menggunakan dataset mtcars untuk memprediksi mpg berdasarkan wt (berat mobil).

model <- lm(mpg ~ wt, data = mtcars)

a. Tampilkan ringkasan model dengan summary()

summary(model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

b. Buat Scatter Plot dengan garis regresi.

ggplot(mtcars, aes(x = wt, y = mpg)) +
  geom_point() + geom_smooth(method = "lm", col = "red") +
  labs(title = "Scatter Plot MPG berdasarkan Berat Mobil",
       x = "Berat Mobil (1000 lbs)",
       y = "Miles per Gallon (MPG)")
## `geom_smooth()` using formula = 'y ~ x'

## c. Interpretasikan hasil, termasuk koefisien regresi dan nilai R^2 H0 : Tidak ada hubungan linear antara berat mobil (wt) dan efisiensi bahan bakar (mpg). H1 : Ada hubungan linear antara berat mobil (wt) dan efisiensi bahan bakar (mpg).

Hasil Model Regresi:

  1. Koefisien Regresi: Intercept (β0): 37.2851 Ini adalah nilai mpg ketika wt (berat mobil) adalah 0. Secara praktis, ini tidak memiliki makna fisik karena berat mobil tidak mungkin 0, tetapi ini adalah titik awal dari garis regresi. Slope (β1): -5.3445 Ini menunjukkan bahwa setiap peningkatan 1 unit dalam wt (berat mobil dalam 1000 lbs) akan mengurangi mpg sebesar 5.3445. Dengan kata lain, ada hubungan negatif antara berat mobil dan efisiensi bahan bakar.

  2. Nilai R-squared: Multiple R-squared: 0.7528 Ini menunjukkan bahwa sekitar 75.28% variabilitas dalam mpg dapat dijelaskan oleh model yang menggunakan wt sebagai prediktor. Ini adalah indikasi bahwa model memiliki kecocokan yang baik dengan data. Adjusted R-squared: 0.7446 Ini adalah versi yang disesuaikan dari R-squared yang memperhitungkan jumlah prediktor dalam model. Nilai ini sedikit lebih rendah tetapi masih menunjukkan kecocokan yang baik.

  3. Signifikansi Statistik: p-value untuk koefisien wt: 1.29e-10 Nilai p yang sangat kecil ini menunjukkan bahwa koefisien wt sangat signifikan secara statistik. Dengan kata lain, berat mobil adalah prediktor yang sangat signifikan untuk mpg. F-statistic: 91.38 dengan p-value 1.294e-10 F-statistic yang tinggi dan p-value yang sangat kecil menunjukkan bahwa model secara keseluruhan sangat signifikan.

Kesimpulan: Berdasarkan hasil uji regresi linear, kita dapat menolak hipotesis nol (H0) dan menerima hipotesis alternatif (H1). Ini berarti ada hubungan linear yang signifikan antara berat mobil (wt) dan efisiensi bahan bakar (mpg). Semakin berat mobil, semakin rendah efisiensi bahan bakarnya. Model ini menjelaskan sekitar 75.28% variabilitas dalam mpg, yang menunjukkan bahwa berat mobil adalah prediktor yang kuat untuk efisiensi bahan bakar.