UTS KOMPUTASI STATISTIKA

Nama: Cindy Pramudita NIM: 2304220040 Prodi: Statistika dan Sains Data

Soal Praktik Nomor 1

Mengimport dataset mtcars

data(mtcars)
mtcars
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
## Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2

a. menghitung statistika deskriptif

mean_mpg <- mean(mtcars$mpg)
mean_mpg
## [1] 20.09062
median_mpg <- median(mtcars$mpg)
median_mpg
## [1] 19.2
sd_mpg <- sd(mtcars$mpg)
sd_mpg
## [1] 6.026948

b. boxplot

boxplot(mpg ~ cyl, data = mtcars,
        main = "Boxplot MPG Berdasarkan Cylinder",
        xlab = "Jumlah Silinder (cyl)",
        ylab = "Miles Per Gallon (mpg)",
        col = c("red", "purple", "pink"))

Soal Praktik Nomor 2

hist(mtcars$hp, freq = FALSE, main = "Histogram HP dengan Garis Densitas",
     xlab = "Horsepower (hp)", col = "pink")
lines(density(mtcars$hp), col = "black", lwd = 2)

Penjelasan dengan Bahasa Statistik: Berdasarkan histogram dengan garis densitas yang ditampilkan, distribusi data variabel horsepower (hp) memiliki bentuk yang tidak simetris dan cenderung positively skewed (skewness positif). Hal ini terlihat dari ekor distribusi yang lebih panjang ke arah kanan (nilai horsepower yang lebih tinggi), yang menunjukkan bahwa sebagian besar data terpusat di nilai yang lebih rendah (sekitar 100 hingga 150), sementara beberapa data memiliki nilai horsepower yang sangat tinggi (di atas 250).

Penjelasan dengan Bahasa Sederhana: Grafik ini menunjukkan bahwa kebanyakan mobil dalam dataset memiliki tenaga mesin (horsepower) yang relatif kecil, yaitu sekitar 100 hingga 150. Namun, ada juga beberapa mobil dengan tenaga yang sangat besar, yang membuat distribusi data ini tidak rata atau berat ke kanan. Artinya, nilai horsepower tinggi tidak banyak ditemukan dibandingkan dengan nilai horsepower yang lebih rendah.

Soal Praktik Nomor 3

anova_model <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_model)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  63.21  31.606   119.3 <2e-16 ***
## Residuals   147  38.96   0.265                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Penjelasan dengan Bahasa Statistik: Berdasarkan hasil uji ANOVA di atas, nilai F (119.3) yang sangat besar dan nilai p-value < 2e-16 yang jauh lebih kecil dari 0.05 menunjukkan bahwa ada perbedaan yang sangat signifikan dalam rata-rata panjang sepal antar spesies dalam dataset iris. Dengan kata lain, variabilitas panjang sepal antar spesies jauh lebih besar dibandingkan dengan variabilitas dalam spesies itu sendiri. Oleh karena itu, kita dapat menyimpulkan bahwa ho (hipotesis nol) yang menyatakan bahwa tidak ada perbedaan rata-rata panjang sepal antar spesies dapat ditolak.

Penjelasan dengan Bahasa Sederhana: Hasil uji ini menunjukkan bahwa panjang sepal (bagian dari bunga) memiliki perbedaan yang jelas antara spesies yang ada dalam dataset iris. Hal ini dibuktikan dengan nilai p yang sangat kecil, yang mengindikasikan bahwa perbedaan tersebut bukanlah kebetulan. Dengan kata lain, spesies bunga yang berbeda memiliki rata-rata panjang sepal yang berbeda, jadi kita bisa yakin bahwa spesies mempengaruhi panjang sepal bunga.

Soal Praktik Nomor 4

t_test <- t.test(Petal.Length ~ Species,
                 data = subset(iris, Species %in% c("setosa", "versicolor")))
t_test
## 
##  Welch Two Sample t-test
## 
## data:  Petal.Length by Species
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group setosa and group versicolor is not equal to 0
## 95 percent confidence interval:
##  -2.939618 -2.656382
## sample estimates:
##     mean in group setosa mean in group versicolor 
##                    1.462                    4.260

Penjelasan dengan Bahasa Statistik: Berdasarkan hasil uji t-test dua sampel, nilai t = -39.493 dan p-value < 2.2e-16 menunjukkan bahwa terdapat perbedaan yang sangat signifikan antara panjang petal (Petal Length) pada spesies setosa dan versicolor. Karena nilai p sangat kecil (jauh lebih kecil dari 0.05), kita dapat menolak hipotesis nol yang menyatakan bahwa tidak ada perbedaan panjang petal antara kedua spesies tersebut.

Confidence Interval antara -2.94 hingga -2.66 menunjukkan bahwa perbedaan panjang petal antara kedua spesies adalah sekitar 2.66 hingga 2.94 unit, dengan spesies versicolor memiliki panjang petal yang lebih panjang daripada spesies setosa. Dengan kata lain, spesies setosa memiliki panjang petal yang lebih pendek dibandingkan dengan spesies versicolor.

Penjelasan dengan Bahasa Sederhana: Hasil uji t-test ini menunjukkan bahwa panjang kelopak bunga (petal) pada spesies setosa dan versicolor jelas berbeda. Spesies versicolor memiliki kelopak bunga yang lebih panjang dibandingkan dengan spesies setosa. Nilai p yang sangat kecil mengindikasikan bahwa perbedaan ini sangat signifikan dan bukan kebetulan. Selain itu, interval kepercayaan menunjukkan bahwa perbedaan panjang petal antara kedua spesies ini sekitar 2.7 cm.

Soal Praktik Nomor 5

a. Summary model

reg_model <- lm(mpg ~ wt, data = mtcars)
summary(reg_model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

b. Scatter plot

# Scatter plot dengan garis regresi
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
ggplot(mtcars, aes(x = wt, y = mpg)) +
  geom_point(color = "brown") +
  geom_smooth(method = "lm", color = "gold", se = FALSE) +
  labs(title = "Scatter Plot MPG vs Berat Mobil",
       x = "Berat Mobil (wt)",
       y = "Miles Per Gallon (mpg)")
## `geom_smooth()` using formula = 'y ~ x'

#### c. Interpretasi hasil 1. Hubungan Berat Mobil (wt) dan Efisiensi Bahan Bakar (mpg): Grafik scatter plot menunjukkan hubungan negatif antara berat mobil (wt) dan efisiensi bahan bakar (mpg). Artinya: Ketika berat mobil meningkat, efisiensi bahan bakar cenderung menurun. Hal ini dapat dilihat dari garis regresi (garis hitam) yang menurun.

  1. Koefisien Regresi: Intercept: Nilai prediksi mpg ketika berat mobil (wt) adalah nol. Meskipun ini tidak realistis (karena berat mobil tidak bisa nol), nilai ini berguna untuk membangun model matematis. Slope (kemiringan): Mengukur seberapa besar perubahan mpg ketika berat mobil bertambah 1 unit. Contohnya, jika slope = -5, maka setiap kenaikan berat mobil sebesar 1 unit akan mengurangi efisiensi bahan bakar sebanyak 5 mpg.

  2. R² (Koefisien Determinasi): Nilai R2R2 menunjukkan seberapa baik hubungan linier antara berat mobil dan efisiensi bahan bakar. Misalnya: Jika R2=0.80R2=0.80, berarti 80% variasi dalam efisiensi bahan bakar (mpg) dapat dijelaskan oleh berat mobil (wt). Sisanya (20%) dipengaruhi oleh faktor lain yang tidak termasuk dalam model, seperti jenis mesin atau aerodinamika mobil.

R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.