#Nomor 1
# dataset mtcars
data(mtcars)
# Hitung statistik dekriptif
mean_mpg <- mean(mtcars$mpg)
median_mpg <- median(mtcars$mpg)
sd_mpg <- sd(mtcars$mpg)
cat("Mean mpg:", mean_mpg, "\n")
## Mean mpg: 20.09062
cat("Median mpg:", median_mpg, "\n")
## Median mpg: 19.2
cat("Standard Deviation mpg:", sd_mpg, "\n")
## Standard Deviation mpg: 6.026948
#Buat Boxplot
boxplot(mpg ~ cyl, data = mtcars,
main = "Boxplot of mpg by Number of Cylinders",
xlab = "Number of Cylinders", ylab = "Miles per Gallon (mpg)",
col = c("lightskyblue", "powderblue", "dodgerblue"))

#Nomor2
# Buat Histogram
# Histogram dan garis densitas
hist(mtcars$hp, probability = TRUE, main = "Histogram of Horsepower", xlab = "Horsepower", col = "lightskyblue")
lines(density(mtcars$hp), col = "red", lwd = 2)

# Penjelasan distribusi
cat("Histogram menunjukkan distribusi yang cenderung normal dengan sedikit skewness ke kanan, menunjukkan bahwa sebagian besar mobil memiliki tenaga yang berada di kisaran menengah.")
## Histogram menunjukkan distribusi yang cenderung normal dengan sedikit skewness ke kanan, menunjukkan bahwa sebagian besar mobil memiliki tenaga yang berada di kisaran menengah.
#Nomor3
#Uji ANOVA
# Load dataset iris
data(iris)
# Uji ANOVA
anova_model <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_model)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Penjelasan
cat("Jika p-value < 0.05, maka terdapat perbedaan signifikan pada rata-rata panjang sepal antar spesies.")
## Jika p-value < 0.05, maka terdapat perbedaan signifikan pada rata-rata panjang sepal antar spesies.
#Nomor4
#Uji t-test dua sampel
# Subset data untuk Setosa dan Versicolor
setosa <- subset(iris, Species == "setosa")$Petal.Length
versicolor <- subset(iris, Species == "versicolor")$Petal.Length
# Uji t-test
t_test <- t.test(setosa, versicolor, var.equal = TRUE)
t_test
##
## Two Sample t-test
##
## data: setosa and versicolor
## t = -39.493, df = 98, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -2.938597 -2.657403
## sample estimates:
## mean of x mean of y
## 1.462 4.260
# penjelasan
cat("Jika p-value < 0.05, maka panjang petal Setosa dan Versicolor berbeda secara signifikan.")
## Jika p-value < 0.05, maka panjang petal Setosa dan Versicolor berbeda secara signifikan.
#Nomor5
# a
lm_model <- lm(mpg ~ wt, data = mtcars)
summary(lm_model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
# b
plot(mtcars$wt, mtcars$mpg,
main = "Scatter Plot of mpg vs wt",
xlab = "Weight (wt)", ylab = "Miles per Gallon (mpg)",
pch = 16, col = "lightskyblue")
abline(lm_model, col = "red", lwd = 2)

# c
cat("Koefisien wt menunjukkan perubahan rata-rata mpg untuk setiap unit perubahan berat mobil. Jika negatif, maka berat yang lebih besar cenderung menurunkan efisiensi bahan bakar.")
## Koefisien wt menunjukkan perubahan rata-rata mpg untuk setiap unit perubahan berat mobil. Jika negatif, maka berat yang lebih besar cenderung menurunkan efisiensi bahan bakar.
cat("Menunjukkan proporsi variabilitas mpg yang dapat dijelaskan oleh wt. Nilai mendekati 1 menunjukkan model yang baik.
")
## Menunjukkan proporsi variabilitas mpg yang dapat dijelaskan oleh wt. Nilai mendekati 1 menunjukkan model yang baik.