Jawaban Soal Praktik


1. Statistik Deskriptif dan Boxplot

a. Hitung Statistik Deskriptif (Mean, Median, Standar Deviasi) untuk Variabel mpg

# Import dataset
data(mtcars)

# Hitung statistik deskriptif
# Mean
mean_mpg <- mean(mtcars$mpg)   
# Median
median_mpg <- median(mtcars$mpg) 
# Standar Deviasi
sd_mpg <- sd(mtcars$mpg)        


# Cetak hasil
cat("Mean:", mean_mpg, "\nMedian:", median_mpg, "\nStandar Deviasi:", sd_mpg)
## Mean: 20.09062 
## Median: 19.2 
## Standar Deviasi: 6.026948

b. Buat Boxplot Variabel mpg Berdasarkan Variabel cyl

# Membuat boxplot
boxplot(mpg ~ cyl, data = mtcars, 
        main = "Boxplot mpg berdasarkan cyl",
        xlab = "Jumlah Silinder (cyl)", 
        ylab = "Miles Per Gallon (mpg)",
        col = c("lightblue", "lightgreen", "pink"))


2. Histogram untuk Variabel hp (Horsepower)

# Membuat histogram dengan garis densitas
hist(mtcars$hp, breaks = 10, probability = TRUE, 
     main = "Histogram hp dengan Garis Densitas",
     xlab = "Horsepower (hp)", 
     col = "lightblue")
lines(density(mtcars$hp), col = "red", lwd = 2) # Garis densitas

Berdasarkan histogram dan garis densitas, dapat disimpulkan bahwa distribusi horsepower (hp) pada dataset mtcars cenderung skewed ke kanan, dengan mayoritas mobil memiliki horsepower yang lebih rendah. —

3. Uji ANOVA untuk Variabel Sepal.Length Berdasarkan Species

# Import dataset iris
data(iris)

# Uji ANOVA
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

kesimpulan

Berdasarkan hasil uji ANOVA, kita dapat menyimpulkan bahwa terdapat perbedaan yang signifikan pada rata-rata panjang sepal (Sepal.Length) antar spesies dalam dataset iris. Dengan nilai p yang sangat kecil (jauh di bawah 0.05), kita menolak hipotesis nol dan menerima hipotesis alternatif bahwa rata-rata panjang sepal antar spesies tidak sama. —

4. Uji t-Test Dua Sampel untuk Petal.Length Antara Setosa dan Versicolor

# Uji t-test
t_test_result <- t.test(iris$Petal.Length[iris$Species == "setosa"], 
                        iris$Petal.Length[iris$Species == "versicolor"])
t_test_result
## 
##  Welch Two Sample t-test
## 
## data:  iris$Petal.Length[iris$Species == "setosa"] and iris$Petal.Length[iris$Species == "versicolor"]
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
## mean of x mean of y 
##     1.462     4.260

kesimpulan

Berdasarkan hasil uji t-test, kita dapat menyimpulkan bahwa terdapat perbedaan yang sangat signifikan antara panjang kelopak bunga (Petal.Length) pada spesies setosa dan versicolor. Dengan nilai p yang sangat kecil dan interval kepercayaan yang tidak mencakup nol, kita dapat menyatakan bahwa perbedaan antara kedua spesies tersebut adalah nyata dan tidak disebabkan oleh kebetulan. —

5. Model Regresi Linear Sederhana

a. Tampilkan Ringkasan Model

# Model regresi linear sederhana
model <- lm(mpg ~ wt, data = mtcars)
summary(model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

b. Scatter Plot dengan Garis Regresi

# Scatter plot dengan garis regresi
plot(mtcars$wt, mtcars$mpg, 
     main = "Scatter Plot mpg vs wt dengan Garis Regresi",
     xlab = "Berat Mobil (wt)", 
     ylab = "Miles Per Gallon (mpg)",
     col = "blue", pch = 16)
abline(model, col = "red", lwd = 2) # Garis regresi


interpretasi hasil koefisien regresi dan nilai R2

bagian kode Regresi Linear

  1. lm(mpg ~ wt, data = mtcars) digunakan untuk membuat model regresi linear dengan mpg sebagai variabel dependen dan wt sebagai variabel independen.
  2. summary(model) menampilkan hasil regresi termasuk koefisien, nilai R², dan nilai p.

Penjelasan Hasil Regresi

  1. Koefisien Regresi -Intercept menunjukkan nilai prediksi mpg ketika wt = 0. -Koefisien untuk wt menunjukkan seberapa besar pengaruh berat mobil terhadap efisiensi bahan bakar.
  2. Nilai R-squared (R²) menunjukkan seberapa baik model ini menjelaskan variasi dalam data. Semakin tinggi nilai R², semakin baik model dalam memprediksi variabel dependen.
  3. Nilai p menunjukkan apakah koefisien yang ditemukan signifikan. Nilai p < 0.05 menunjukkan bahwa variabel tersebut berpengaruh signifikan terhadap model.

kesimpulan:

Menyimpulkan hubungan antara wt dan mpg berdasarkan koefisien regresi dan nilai R², serta menyoroti seberapa kuat hubungan tersebut.