# Menggunakan dataset mtcars bawaan di R
data("mtcars")
# Menghitung statistik deskriptif untuk variabel mpg
mean_mpg <- mean(mtcars$mpg) # Rata-rata
median_mpg <- median(mtcars$mpg) # Median
sd_mpg <- sd(mtcars$mpg) # Standar deviasi
# Menampilkan hasil
cat("Mean MPG:", mean_mpg, "\n")
## Mean MPG: 20.09062
cat("Median MPG:", median_mpg, "\n")
## Median MPG: 19.2
cat("Standard Deviation MPG:", sd_mpg, "\n")
## Standard Deviation MPG: 6.026948
# Membuat boxplot
boxplot(mpg ~ cyl, data = mtcars,
main = "Boxplot of MPG by Number of Cylinders",
xlab = "Number of Cylinders",
ylab = "Miles Per Gallon (MPG)",
col = c("red", "yellow", "green"))
2.
# Memuat dataset mtcars
data(mtcars)
# Membuat histogram dengan garis densitas
hist(mtcars$hp, breaks = 10, probability = TRUE,
main = "Histogram dan Garis Densitas Horsepower",
xlab = "Horsepower (hp)", col = "yellow", border = "black")
lines(density(mtcars$hp), col = "red", lwd = 2)
Distribusi horsepower (hp) pada grafik menunjukkan pola right-skewed
(ekor panjang ke kanan), di mana sebagian besar kendaraan memiliki
horsepower rendah hingga sedang, dengan puncak utama (unimodal) di
sekitar 100–150 hp, yang menjadi rentang paling sering muncul. Sebagian
besar data terkonsentrasi antara 50–200 hp, sementara nilai horsepower
di atas 250 hp jarang terjadi dan dapat dianggap sebagai outlier
potensial. Garis densitas mengonfirmasi bahwa distribusi tidak mengikuti
pola normal (bell curve), dengan probabilitas yang menurun tajam setelah
puncak. Karakteristik ini menunjukkan bahwa dataset didominasi oleh
kendaraan dengan tenaga mesin rendah hingga menengah, sedangkan
kendaraan dengan horsepower tinggi merupakan kasus khusus.
# Memuat dataset iris
data(iris)
# Uji ANOVA
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Filter data untuk dua spesies
setosa <- subset(iris, Species == "setosa")$Petal.Length
versicolor <- subset(iris, Species == "versicolor")$Petal.Length
# Melakukan uji t
t_test_result <- t.test(setosa, versicolor, alternative = "two.sided")
t_test_result
##
## Welch Two Sample t-test
##
## data: setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -2.939618 -2.656382
## sample estimates:
## mean of x mean of y
## 1.462 4.260
# Membuat model regresi linear
model <- lm(mpg ~ wt, data = mtcars)
summary(model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
# Scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg, main = "Scatter Plot MPG vs WT",
xlab = "Weight (wt)", ylab = "Miles per Gallon (mpg)", pch = 19, col = "blue")
abline(model, col = "red", lwd = 2)
5. c interpretasi hasil Persamaan Regresi: mpg = 37.2851 − 5.3445.wt
Intercept (37.2851): Ketika wt (berat mobil) = 0, prediksi mpg adalah 37.2851.
Koefisien wt (-5.3445), Hubungan ini negatif dan signifikan.
Signifikansi Statistik (P-Value): P-Value Koefisien wt: 1.29e-10 (< 0.05), menunjukkan bahwa berat mobil (wt) secara signifikan memengaruhi efisiensi bahan bakar (mpg).
Kualitas Model (R-squared): R-squared: 0.7528, menunjukkan bahwa sekitar 75.28% variabilitas dalam mpg dapat dijelaskan oleh variabel wt.
Adjusted R-squared: 0.7446, memperhitungkan jumlah prediktor dalam model, sehingga lebih realistis untuk menilai kualitas model.
Residual Standard Error (RSE): RSE: 3.046, menunjukkan seberapa jauh nilai observasi mpg menyimpang dari nilai yang diprediksi oleh model.