# Memuat dataset mtcars
data(mtcars)
# Melihat beberapa baris pertama dari data
head(mtcars)
## mpg cyl disp hp drat wt qsec vs am gear carb
## Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
## Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
## Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
## Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
## Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
## Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
mean(mtcars$mpg)
## [1] 20.09062
median(mtcars$mpg)
## [1] 19.2
sd(mtcars$mpg)
## [1] 6.026948
# Membuat boxplot mpg berdasarkan cyl
boxplot(mpg ~ cyl, data = mtcars)
# no.2 Membuat histogram dengan garis densitas
hist(mtcars$hp,
main = "Distribusi Tenaga Kuda (hp)",
xlab = "Tenaga Kuda (hp)",
freq = FALSE,
col = "orange",
border = "navy")
# Menambahkan garis densitas
lines(density(mtcars$hp), col = "black")
# Penjelasan Kesimpulan Berdasarkan histogram tersebut, dapat
disimpulkan bahwa: Mayoritas mobil dalam dataset memiliki tenaga kuda
yang tergolong sedang, berkisar antara 100-150 hp. Ada beberapa mobil
dengan tenaga kuda yang sangat tinggi, yang menyebabkan distribusi
menjadi miring ke kanan. Ini mungkin mengindikasikan adanya mobil-mobil
sport atau mobil dengan performa tinggi dalam dataset. Tidak banyak
mobil dengan tenaga kuda yang sangat rendah.
# no.3 Memuat dataset iris
data(iris)
# Melakukan uji ANOVA satu arah
model <- aov(Sepal.Length ~ Species, data = iris)
# Visualisasi
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
ggplot(iris, aes(x=Species, y=Sepal.Length)) +
geom_boxplot()
# Melihat hasil uji ANOVA
summary(model)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# no.4 Memisahkan data berdasarkan spesies
setosa <- iris[iris$Species == "setosa", "Petal.Length"]
versicolor <- iris[iris$Species == "versicolor", "Petal.Length"]
# Melakukan uji t-test dua sampel
t.test(setosa, versicolor)
##
## Welch Two Sample t-test
##
## data: setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -2.939618 -2.656382
## sample estimates:
## mean of x mean of y
## 1.462 4.260
##Penjelasan kesimpulan Nilai p sangat kecil menunjukkan bahwa ada perbedaan yang sangat signifikan secara statistik antara rata-rata panjang petal spesies setosa dan versicolor. Interval kepercayaan tidak mencakup nol mengindikasikan bahwa perbedaan rata-rata antara kedua kelompok tidak mungkin terjadi secara kebetulan. Kesimpulan: Berdasarkan hasil uji t-test, kita dapat menyimpulkan bahwa rata-rata panjang petal spesies setosa secara signifikan lebih pendek dibandingkan dengan rata-rata panjang petal spesies versicolor.
# no.5 Memuat dataset mtcars
data(mtcars)
# Membangun model regresi linear sederhana
model <- lm(mpg ~ wt, data = mtcars)
# Melihat ringkasan model
summary(model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
# Membuat scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg,
xlab = "Berat Mobil (wt)",
ylab = "Efisiensi Bahan Bakar (mpg)",
main = "Hubungan antara Berat Mobil dan Efisiensi Bahan Bakar")
abline(model, col = "darkblue")
# Interpretasi hasil termasuk koefisien regresi dan nilai R2 Ringkasan
model: Dari output summary(model), kita dapat melihat koefisien regresi
untuk intercept dan variabel wt. Koefisien ini menunjukkan pengaruh
variabel wt terhadap variabel mpg. Nilai p-value yang kecil menunjukkan
bahwa hubungan antara wt dan mpg signifikan secara statistik. Scatter
plot: Scatter plot akan menunjukkan sebaran data dan garis regresi yang
menunjukkan hubungan linear antara wt dan mpg. Jika garis regresi
memiliki kemiringan negatif, artinya semakin berat mobil, maka efisiensi
bahan bakarnya cenderung semakin rendah.
Koefisien Regresi: Intercept (37.2851): adalah nilai prediksi untuk mpg ketika wt (berat) sama dengan 0. Namun, interpretasi tersebut mungkin tidak terlalu relevan dalam konteks mobil karena tidak ada mobil dengan berat 0. wt (-5.3445): Koefisien ini menunjukkan bahwa setiap peningkatan 1 unit pada wt (dalam ribuan pound) akan menyebabkan penurunan mpg sebesar 5.3445 unit. Artinya, semakin berat sebuah mobil, maka konsumsi bahan bakarnya cenderung semakin boros.
R-squared (0.7529): Nilai ini menunjukkan bahwa sekitar 75.29% dari variabilitas dalam mpg dapat dijelaskan oleh wt. Artinya, model kita cukup baik dalam menjelaskan hubungan antara berat mobil dan efisiensi bahan bakar.