UTS KOMSTAT

# Menggunakan dataset mtcars bawaan di R
data("mtcars")

# Menghitung statistik deskriptif untuk variabel mpg
mean_mpg <- mean(mtcars$mpg)       # Rata-rata
median_mpg <- median(mtcars$mpg)   # Median
sd_mpg <- sd(mtcars$mpg)           # Standar deviasi

# Menampilkan hasil
cat("Mean MPG:", mean_mpg, "\n")

## Mean MPG: 20.09062

cat("Median MPG:", median_mpg, "\n")

## Median MPG: 19.2

cat("Standard Deviation MPG:", sd_mpg, "\n")

## Standard Deviation MPG: 6.026948

# Membuat boxplot
boxplot(mpg ~ cyl, data = mtcars,
        main = "Boxplot of MPG by Number of Cylinders",
        xlab = "Number of Cylinders",
        ylab = "Miles Per Gallon (MPG)",
        col = c("red", "yellow", "green"))

# Memuat dataset mtcars
data(mtcars)

# Membuat histogram dengan garis densitas
hist(mtcars$hp, breaks = 10, probability = TRUE, 
     main = "Histogram dan Garis Densitas Horsepower", 
     xlab = "Horsepower (hp)", col = "yellow", border = "black")
lines(density(mtcars$hp), col = "red", lwd = 2)

Distribusi horsepower (hp) pada grafik menunjukkan pola right-skewed (ekor panjang ke kanan), di mana sebagian besar kendaraan memiliki horsepower rendah hingga sedang, dengan puncak utama (unimodal) di sekitar 100–150 hp, yang menjadi rentang paling sering muncul. Sebagian besar data terkonsentrasi antara 50–200 hp, sementara nilai horsepower di atas 250 hp jarang terjadi dan dapat dianggap sebagai outlier potensial. Garis densitas mengonfirmasi bahwa distribusi tidak mengikuti pola normal (bell curve), dengan probabilitas yang menurun tajam setelah puncak. Karakteristik ini menunjukkan bahwa dataset didominasi oleh kendaraan dengan tenaga mesin rendah hingga menengah, sedangkan kendaraan dengan horsepower tinggi merupakan kasus khusus.

# Memuat dataset iris
data(iris)

# Uji ANOVA
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)

##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# Filter data untuk dua spesies
setosa <- subset(iris, Species == "setosa")$Petal.Length
versicolor <- subset(iris, Species == "versicolor")$Petal.Length

# Melakukan uji t
t_test_result <- t.test(setosa, versicolor, alternative = "two.sided")
t_test_result

## 
##  Welch Two Sample t-test
## 
## data:  setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

# Membuat model regresi linear
model <- lm(mpg ~ wt, data = mtcars)
summary(model)

## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

# Scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg, main = "Scatter Plot MPG vs WT",
     xlab = "Weight (wt)", ylab = "Miles per Gallon (mpg)", pch = 19, col = "blue")
abline(model, col = "red", lwd = 2)

5. c interpretasi hasil Persamaan Regresi: mpg = 37.2851 − 5.3445.wt

Intercept (37.2851): Ketika wt (berat mobil) = 0, prediksi mpg adalah 37.2851.

Koefisien wt (-5.3445), Hubungan ini negatif dan signifikan.

Signifikansi Statistik (P-Value): P-Value Koefisien wt: 1.29e-10 (< 0.05), menunjukkan bahwa berat mobil (wt) secara signifikan memengaruhi efisiensi bahan bakar (mpg).

Kualitas Model (R-squared): R-squared: 0.7528, menunjukkan bahwa sekitar 75.28% variabilitas dalam mpg dapat dijelaskan oleh variabel wt.

Adjusted R-squared: 0.7446, memperhitungkan jumlah prediktor dalam model, sehingga lebih realistis untuk menilai kualitas model.

Residual Standard Error (RSE): RSE: 3.046, menunjukkan seberapa jauh nilai observasi mpg menyimpang dari nilai yang diprediksi oleh model.

UTS KOMSTAT

Nur Aini Rahayu P.L

2024-12-02