data(mtcars)
mean_mpg <- mean(mtcars$mpg)
median_mpg <- median(mtcars$mpg)
sd_mpg <- sd(mtcars$mpg)
mean_mpg
## [1] 20.09062
median_mpg
## [1] 19.2
sd_mpg
## [1] 6.026948
boxplot(mpg ~ cyl, data = mtcars, main = "Boxplot MPG berdasarkan CYL", xlab = "Jumlah Silinder (cyl)", ylab = "Miles per Gallon (mpg)")
hist(mtcars$hp, probability = TRUE, main = "Histogram Horsepower dengan Densitas", xlab = "Horsepower (hp)")
lines(density(mtcars$hp), col = "green", lwd = 2)
Histogram menggambarkan distribusi frekuensi horsepower dalam dataset.
Garis densitas menunjukkan distribusi probabilitasnya. Jika distribusi
mendekati bentuk lonceng (normal), maka data memiliki distribusi normal.
Namun, jika miring, artinya distribusi tidak normal.
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Uji ANOVA digunakan untuk melihat apakah ada perbedaan rata-rata panjang sepal antar spesies dalam dataset iris. Jika p-value < 0,05, berarti ada perbedaan signifikan.
t_test_result <- t.test(iris$Petal.Length[iris$Species == "setosa"],
iris$Petal.Length[iris$Species == "versicolor"])
t_test_result
##
## Welch Two Sample t-test
##
## data: iris$Petal.Length[iris$Species == "setosa"] and iris$Petal.Length[iris$Species == "versicolor"]
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -2.939618 -2.656382
## sample estimates:
## mean of x mean of y
## 1.462 4.260
Uji t-test dilakukan untuk membandingkan panjang petal antara spesies setosa dan versicolor. Jika p-value < 0,05, ada perbedaan signifikan antara kedua spesies tersebut.
model <- lm(mpg ~ wt, data = mtcars)
summary(model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
plot(mtcars$wt, mtcars$mpg, main = "Scatter Plot MPG vs Berat Mobil", xlab = "Berat Mobil (wt)", ylab = "Miles per Gallon (mpg)")
abline(model, col = "green", lwd = 2)
Koefisien regresi menunjukkan seberapa besar perubahan mpg jika ada perubahan satu unit pada berat mobil (wt). Nilai R² menunjukkan proporsi variabilitas mpg yang dapat dijelaskan oleh wt. Nilai R² yang lebih tinggi menunjukkan model yang lebih baik.