data(mtcars)
head(mtcars)
## mpg cyl disp hp drat wt qsec vs am gear carb
## Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
## Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
## Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
## Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
## Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
## Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
mpg_summary <- summary(mtcars$mpg)
mpg_sd <- sd(mtcars$mpg)
mpg_summary
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 10.40 15.43 19.20 20.09 22.80 33.90
mpg_sd
## [1] 6.026948
Hasil: Mean (Rata-rata): 20.09 Median: 19.2 # Standar Deviasi (SD): 6.03 Minimum dan Maksimum: Rentang nilai mpg adalah 10.4 hingga 33.9.
Interpretasi: # Rata-rata efisiensi bahan bakar mobil dalam dataset adalah sekitar 20.09 MPG. Penyebaran data cukup besar karena standar deviasi 6.03 menunjukkan variasi efisiensi bahan bakar yang signifikan antar mobil.
boxplot(mpg ~ cyl, data = mtcars,
main = "Boxplot MPG Berdasarkan Cylinders",
xlab = "Jumlah Cylinders",
ylab = "Miles per Gallon (MPG)",
col = c("lightblue", "lightgreen", "pink"))
Hasil: # Mobil dengan 4 silinder memiliki rata-rata mpg lebih tinggi
dibandingkan dengan mobil dengan 6 atau 8 silinder. Distribusi mpg untuk
mobil 8 silinder lebih sempit, menunjukkan nilai lebih konsisten.
Interpretasi: # Efisiensi bahan bakar cenderung menurun seiring dengan meningkatnya jumlah silinder. Hal ini wajar karena mobil dengan lebih banyak silinder biasanya memiliki tenaga yang lebih besar namun kurang efisien dalam konsumsi bahan bakar.
hist(mtcars$hp, probability = TRUE, col = "lightblue",
main = "Histogram HP dengan Garis Densitas",
xlab = "Horsepower (HP)")
lines(density(mtcars$hp), col = "red", lwd = 2) # Garis densitas
Hasil: # Sebagian besar mobil memiliki nilai hp (horsepower) yang
berkisar antara 50 hingga 150. # Garis densitas menunjukkan distribusi
yang right-skewed, artinya terdapat beberapa mobil dengan horsepower
sangat tinggi, namun jumlahnya sedikit.
Interpretasi: # Mayoritas mobil dalam dataset memiliki tenaga mesin yang relatif rendah hingga sedang. # Distribusi right-skewed menunjukkan ada outlier (mobil dengan tenaga mesin sangat besar).
data(iris)
head(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Hasil: # Hasil ANOVA menunjukkan p-value < 0.05, yang berarti terdapat perbedaan signifikan dalam rata-rata panjang sepal (Sepal.Length) antar spesies (setosa, versicolor, dan virginica).
Interpretasi: # Rata-rata panjang sepal berbeda secara statistik antara spesies bunga. Misalnya, setosa cenderung memiliki sepal lebih pendek dibandingkan dengan spesies lain.
setosa <- subset(iris, Species == "setosa")$Petal.Length
versicolor <- subset(iris, Species == "versicolor")$Petal.Length
t_test_result <- t.test(setosa, versicolor, var.equal = TRUE)
t_test_result
##
## Two Sample t-test
##
## data: setosa and versicolor
## t = -39.493, df = 98, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -2.938597 -2.657403
## sample estimates:
## mean of x mean of y
## 1.462 4.260
Hasil: # p-value < 0.05, menunjukkan panjang petal (Petal.Length) untuk spesies setosa dan versicolor berbeda secara signifikan. # Rata-rata Petal.Length spesies versicolor lebih panjang dibandingkan setosa.
Interpretasi: # Data mendukung hipotesis bahwa kedua spesies memiliki karakteristik morfologi yang berbeda dalam hal panjang petal, yang dapat menjadi kunci identifikasi spesies
lm_model <- lm(mpg ~ wt, data = mtcars)
A. Ringkasan model
summary(lm_model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
B, Scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg,
main = "Scatter Plot MPG vs Weight",
xlab = "Weight (wt)",
ylab = "Miles per Gallon (MPG)",
pch = 19, col = "blue")
abline(lm_model, col = "red", lwd = 2)
Hasil Scatter Plot: # Scatter plot menunjukkan hubungan negatif antara
berat mobil dan efisiensi bahan bakar. # Garis regresi berwarna merah
menggambarkan tren penurunan mpg seiring dengan meningkatnya berat
mobil.
C. Interpretasi: # Hubungan Negatif: Mobil dengan berat lebih besar memiliki efisiensi bahan bakar lebih rendah, yang terlihat dari kemiringan negatif garis regresi. # Koefisien Regresi: Setiap kenaikan 1 satuan berat mobil (wt) menurunkan rata-rata mpg sebesar 5.34. # Visualisasi Model: Scatter plot dengan garis regresi membantu memperkuat hasil numerik dari model regresi sebelumnya. Data cenderung mendekati garis regresi, menunjukkan model cukup baik dalam menjelaskan hubungan antara wt dan mpg.