SOAL B

SOAL 1

#1.a
data("mtcars")
mean_mpg <- mean(mtcars$mpg)
median_mpg <- median(mtcars$mpg)
sd_mpg <- sd(mtcars$mpg)

mean_mpg
## [1] 20.09062
median_mpg
## [1] 19.2
sd_mpg
## [1] 6.026948
#1.b
boxplot(mpg ~ cyl, data = mtcars,
        main = "Boxplot MPG Berdasarkan Jumlah Silinder",
        xlab = "Jumlah Silinder",
        ylab = "Miles Per Gallon (MPG)",
        col = c("blue", "orange", "pink"))

#Soal 2

# Membuat Histogram untuk Variable hp (Horspower)
data("mtcars")

hist(mtcars$hp, breaks = 10, probability = TRUE,
    col = "purple")
    main = "Histogram of Horsepower"
    xlab = "Horsepower"
#Tambahkan garis desitas    
lines(density(mtcars$hp), col = "pink", lwd = 2)

Penjelsan : Dari histogram di atas (untuk variabel hp dari dataset mtcars) 1. Distribusi Data - Histogram menunjukkan distribusi hp (horsepower atau daya kuda mesin mobil). - Sebagian besar nilai hp berada pada kisaran 50 hingga 200, dengan frekuensi tertinggi di sekitar 100-150. - Semakin tinggi nilai hp, jumlah mobil dengan daya kuda tersebut semakin sedikit, terlihat dari batang yang semakin kecil menuju ke kanan.

  1. Garis Densitas
    • Garis densitas di atas histogram memberikan gambaran pola distribusi data.
    • Distribusi data ini tampaknya tidak simetris (tidak normal) dan condong ke kanan (skewed to the right). Hal ini menunjukkan bahwa ada beberapa mobil dengan hp yang sangat tinggi (outlier), meskipun sebagian besar mobil memiliki hp yang lebih rendah.
  2. Pola Umum
    • Mayoritas nilai horsepower terpusat pada rentang 100-150.
    • Ada beberapa mobil dengan nilai horsepower ekstrem, seperti di kisaran 300-350, tetapi frekuensinya sangat kecil.

Kesimpulan :
Distribusi hp pada dataset mtcars bersifat positively skewed (condong ke kanan) dengan sebagian besar mobil memiliki horsepower yang relatif kecil, sedangkan hanya sedikit yang memiliki horsepower sangat besar.

#SOAL 3

data(iris)
# Melkuakn Uji Anova 
anova_result <- aov(Sepal.Length ~ Species, data =iris)
summary(anova_result)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

penjelasan : karena p-value = <2e-16 < 0,05 ini menunjukkan bahwa efek variabel Species terhadap respons sangat signifikan secara statistik. Dengan kata lain, ada perbedaan yang nyata di antara kelompok spesies tersebut.

#SOAL 4

#Memilih Data 
setosa <- iris[iris$Species == "setosa", ]
versicolor <- iris[iris$Species == "versicolor", ]
#Melakukan Uji T
t_test_result <- t.test(setosa$Petal.Length, versicolor$Petal.Length)
t_test_result
## 
##  Welch Two Sample t-test
## 
## data:  setosa$Petal.Length and versicolor$Petal.Length
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

Penjelasan : (H₀): Tidak ada perbedaan rata-rata panjang petal (Petal.Length) antara spesies setosa dan versicolor (H₁): Ada perbedaan rata-rata panjang petal (Petal.Length) antara spesies setosa dan versicolor - Karena nilai p-value < 0.05, kita menolak hipotesis nol (H₀). Ini menunjukkan bahwa terdapat perbedaan signifikan secara statistik dalam rata-rata panjang petal antara spesies setosa dan versicolor - Selisih rata-rata panjang petal adalah negatif, yang menunjukkan bahwa panjang petal setosa (1.462) lebih kecil dibandingkan panjang petal versicolor (4.260). - Confidence Interval [-2.939618, -2.656382] tidak mencakup nol, yang semakin menguatkan kesimpulan bahwa perbedaan rata-rata signifikan secara statistik. Sehingga rata-rata panjang petal spesies setosa secara signifikan lebih pendek dibandingkan spesies versicolor dengan tingkat kepercayaan 95%.

#SOAL 5

#5.a
model <- lm(mpg ~ wt, data = mtcars)
summary(model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10
#5.b
plot(mtcars$wt, mtcars$mpg,
     main = "Scatter Plot of MPG vs Weight",
     xlab = "Weight",
     ylab = "Miles Per Gallon",
     col = "lightblue",
     pch = 19)

# Tambahkan garis regresi
abline(model, col = "red", lwd = 2)

5.c