# Hitung statistik deskriptif
mpg_mean <- mean(mtcars$mpg)
mpg_median <- median(mtcars$mpg)
mpg_sd <- sd(mtcars$mpg)
# Tampilkan hasil
cat("Statistik Deskriptif untuk mpg:\n")
## Statistik Deskriptif untuk mpg:
cat("Mean:", mpg_mean, "\n")
## Mean: 20.09062
cat("Median:", mpg_median, "\n")
## Median: 19.2
cat("Standar Deviasi:", mpg_sd, "\n")
## Standar Deviasi: 6.026948
# Boxplot
boxplot(mpg ~ cyl, data = mtcars,
main = "Boxplot mpg berdasarkan jumlah silinder",
xlab = "Jumlah Silinder (cyl)",
ylab = "Miles per Gallon (mpg)",
col = c("lightblue", "pink", "lightgreen"))
2. Histogram dan Garis Densitas untuk Variabel hp
# Histogram dengan garis densitas
hist(mtcars$hp, breaks = 10, probability = TRUE,
main = "Histogram dan Densitas Horsepower",
xlab = "Horsepower (hp)",
col = "lightblue", border = "white")
lines(density(mtcars$hp), col = "red", lwd = 2)
Penjelasan: Distribusi data horsepower (hp) tampak sebutkan karakteristik distribusi, seperti normal, miring ke kiri/kanan, atau multimodal.
# Import dataset iris
data(iris)
# Uji ANOVA
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Kesimpulan: Hasil ANOVA menunjukkan jelaskan apakah terdapat perbedaan signifikan atau tidak pada rata-rata panjang sepal antar spesies.
# Filter data untuk setosa dan versicolor
setosa <- subset(iris, Species == "setosa")
versicolor <- subset(iris, Species == "versicolor")
# Uji t-test
t_test_result <- t.test(setosa$Petal.Length, versicolor$Petal.Length)
t_test_result
##
## Welch Two Sample t-test
##
## data: setosa$Petal.Length and versicolor$Petal.Length
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -2.939618 -2.656382
## sample estimates:
## mean of x mean of y
## 1.462 4.260
Kesimpulan: Berdasarkan hasil uji t-test, jelaskan apakah terdapat perbedaan signifikan atau tidak pada panjang petal.
# Model regresi linear
model <- lm(mpg ~ wt, data = mtcars)
summary(model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
# Scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg,
main = "Scatter Plot MPG vs WT",
xlab = "Berat Mobil (wt)",
ylab = "Miles per Gallon (mpg)",
pch = 16, col = "blue")
abline(model, col = "red", lwd = 2)
c. Interpretasi Hasil Interpretasi: Koefisien regresi: Setiap peningkatan 1 unit pada wt akan menyebabkan perubahan rata-rata sebesar coef(model)[2] pada mpg. R²: Nilai R² sebesar summary(model)$r.squared menunjukkan bahwa persentase variabilitas dalam mpg yang dapat dijelaskan oleh wt.