# Memuat dataset mtcars
data(mtcars)

# Melihat beberapa baris pertama dari data
head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
mean(mtcars$mpg)
## [1] 20.09062
median(mtcars$mpg)
## [1] 19.2
sd(mtcars$mpg)
## [1] 6.026948
# Membuat boxplot mpg berdasarkan cyl
boxplot(mpg ~ cyl, data = mtcars)

# no.2 Membuat histogram dengan garis densitas
hist(mtcars$hp, 
     main = "Distribusi Tenaga Kuda (hp)", 
     xlab = "Tenaga Kuda (hp)",
     freq = FALSE,
     col = "orange",
     border = "navy")
# Menambahkan garis densitas
lines(density(mtcars$hp), col = "black")

# Penjelasan Kesimpulan Berdasarkan histogram tersebut, dapat disimpulkan bahwa: Mayoritas mobil dalam dataset memiliki tenaga kuda yang tergolong sedang, berkisar antara 100-150 hp. Ada beberapa mobil dengan tenaga kuda yang sangat tinggi, yang menyebabkan distribusi menjadi miring ke kanan. Ini mungkin mengindikasikan adanya mobil-mobil sport atau mobil dengan performa tinggi dalam dataset. Tidak banyak mobil dengan tenaga kuda yang sangat rendah.

# no.3 Memuat dataset iris
data(iris)

# Melakukan uji ANOVA satu arah
model <- aov(Sepal.Length ~ Species, data = iris)

# Visualisasi
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
ggplot(iris, aes(x=Species, y=Sepal.Length)) + 
  geom_boxplot()

# Melihat hasil uji ANOVA
summary(model)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# no.4 Memisahkan data berdasarkan spesies
setosa <- iris[iris$Species == "setosa", "Petal.Length"]
versicolor <- iris[iris$Species == "versicolor", "Petal.Length"]

# Melakukan uji t-test dua sampel
t.test(setosa, versicolor)
## 
##  Welch Two Sample t-test
## 
## data:  setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

##Penjelasan kesimpulan Nilai p sangat kecil menunjukkan bahwa ada perbedaan yang sangat signifikan secara statistik antara rata-rata panjang petal spesies setosa dan versicolor. Interval kepercayaan tidak mencakup nol mengindikasikan bahwa perbedaan rata-rata antara kedua kelompok tidak mungkin terjadi secara kebetulan. Kesimpulan: Berdasarkan hasil uji t-test, kita dapat menyimpulkan bahwa rata-rata panjang petal spesies setosa secara signifikan lebih pendek dibandingkan dengan rata-rata panjang petal spesies versicolor.

# no.5 Memuat dataset mtcars
data(mtcars)

# Membangun model regresi linear sederhana
model <- lm(mpg ~ wt, data = mtcars)

# Melihat ringkasan model
summary(model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10
# Membuat scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg,
     xlab = "Berat Mobil (wt)",
     ylab = "Efisiensi Bahan Bakar (mpg)",
     main = "Hubungan antara Berat Mobil dan Efisiensi Bahan Bakar")
abline(model, col = "darkblue")

# Interpretasi hasil termasuk koefisien regresi dan nilai R2 Ringkasan model: Dari output summary(model), kita dapat melihat koefisien regresi untuk intercept dan variabel wt. Koefisien ini menunjukkan pengaruh variabel wt terhadap variabel mpg. Nilai p-value yang kecil menunjukkan bahwa hubungan antara wt dan mpg signifikan secara statistik. Scatter plot: Scatter plot akan menunjukkan sebaran data dan garis regresi yang menunjukkan hubungan linear antara wt dan mpg. Jika garis regresi memiliki kemiringan negatif, artinya semakin berat mobil, maka efisiensi bahan bakarnya cenderung semakin rendah.

Koefisien Regresi: Intercept (37.2851): adalah nilai prediksi untuk mpg ketika wt (berat) sama dengan 0. Namun, interpretasi tersebut mungkin tidak terlalu relevan dalam konteks mobil karena tidak ada mobil dengan berat 0. wt (-5.3445): Koefisien ini menunjukkan bahwa setiap peningkatan 1 unit pada wt (dalam ribuan pound) akan menyebabkan penurunan mpg sebesar 5.3445 unit. Artinya, semakin berat sebuah mobil, maka konsumsi bahan bakarnya cenderung semakin boros.

R-squared (0.7529): Nilai ini menunjukkan bahwa sekitar 75.29% dari variabilitas dalam mpg dapat dijelaskan oleh wt. Artinya, model kita cukup baik dalam menjelaskan hubungan antara berat mobil dan efisiensi bahan bakar.