Nama: Cindy Pramudita NIM: 2304220040 Prodi: Statistika dan Sains Data
data(mtcars)
mtcars
## mpg cyl disp hp drat wt qsec vs am gear carb
## Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
## Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
## Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
## Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
## Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
## Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1
## Duster 360 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4
## Merc 240D 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
## Merc 230 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
## Merc 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4
## Merc 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4
## Merc 450SE 16.4 8 275.8 180 3.07 4.070 17.40 0 0 3 3
## Merc 450SL 17.3 8 275.8 180 3.07 3.730 17.60 0 0 3 3
## Merc 450SLC 15.2 8 275.8 180 3.07 3.780 18.00 0 0 3 3
## Cadillac Fleetwood 10.4 8 472.0 205 2.93 5.250 17.98 0 0 3 4
## Lincoln Continental 10.4 8 460.0 215 3.00 5.424 17.82 0 0 3 4
## Chrysler Imperial 14.7 8 440.0 230 3.23 5.345 17.42 0 0 3 4
## Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1
## Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2
## Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1
## Toyota Corona 21.5 4 120.1 97 3.70 2.465 20.01 1 0 3 1
## Dodge Challenger 15.5 8 318.0 150 2.76 3.520 16.87 0 0 3 2
## AMC Javelin 15.2 8 304.0 150 3.15 3.435 17.30 0 0 3 2
## Camaro Z28 13.3 8 350.0 245 3.73 3.840 15.41 0 0 3 4
## Pontiac Firebird 19.2 8 400.0 175 3.08 3.845 17.05 0 0 3 2
## Fiat X1-9 27.3 4 79.0 66 4.08 1.935 18.90 1 1 4 1
## Porsche 914-2 26.0 4 120.3 91 4.43 2.140 16.70 0 1 5 2
## Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2
## Ford Pantera L 15.8 8 351.0 264 4.22 3.170 14.50 0 1 5 4
## Ferrari Dino 19.7 6 145.0 175 3.62 2.770 15.50 0 1 5 6
## Maserati Bora 15.0 8 301.0 335 3.54 3.570 14.60 0 1 5 8
## Volvo 142E 21.4 4 121.0 109 4.11 2.780 18.60 1 1 4 2
mean_mpg <- mean(mtcars$mpg)
mean_mpg
## [1] 20.09062
median_mpg <- median(mtcars$mpg)
median_mpg
## [1] 19.2
sd_mpg <- sd(mtcars$mpg)
sd_mpg
## [1] 6.026948
boxplot(mpg ~ cyl, data = mtcars,
main = "Boxplot MPG Berdasarkan Cylinder",
xlab = "Jumlah Silinder (cyl)",
ylab = "Miles Per Gallon (mpg)",
col = c("red", "purple", "pink"))
hist(mtcars$hp, freq = FALSE, main = "Histogram HP dengan Garis Densitas",
xlab = "Horsepower (hp)", col = "pink")
lines(density(mtcars$hp), col = "black", lwd = 2)
Penjelasan dengan Bahasa Statistik: Berdasarkan histogram dengan garis
densitas yang ditampilkan, distribusi data variabel horsepower (hp)
memiliki bentuk yang tidak simetris dan cenderung positively skewed
(skewness positif). Hal ini terlihat dari ekor distribusi yang lebih
panjang ke arah kanan (nilai horsepower yang lebih tinggi), yang
menunjukkan bahwa sebagian besar data terpusat di nilai yang lebih
rendah (sekitar 100 hingga 150), sementara beberapa data memiliki nilai
horsepower yang sangat tinggi (di atas 250).
Penjelasan dengan Bahasa Sederhana: Grafik ini menunjukkan bahwa kebanyakan mobil dalam dataset memiliki tenaga mesin (horsepower) yang relatif kecil, yaitu sekitar 100 hingga 150. Namun, ada juga beberapa mobil dengan tenaga yang sangat besar, yang membuat distribusi data ini tidak rata atau berat ke kanan. Artinya, nilai horsepower tinggi tidak banyak ditemukan dibandingkan dengan nilai horsepower yang lebih rendah.
anova_model <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_model)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Penjelasan dengan Bahasa Statistik: Berdasarkan hasil uji ANOVA di atas, nilai F (119.3) yang sangat besar dan nilai p-value < 2e-16 yang jauh lebih kecil dari 0.05 menunjukkan bahwa ada perbedaan yang sangat signifikan dalam rata-rata panjang sepal antar spesies dalam dataset iris. Dengan kata lain, variabilitas panjang sepal antar spesies jauh lebih besar dibandingkan dengan variabilitas dalam spesies itu sendiri. Oleh karena itu, kita dapat menyimpulkan bahwa ho (hipotesis nol) yang menyatakan bahwa tidak ada perbedaan rata-rata panjang sepal antar spesies dapat ditolak.
Penjelasan dengan Bahasa Sederhana: Hasil uji ini menunjukkan bahwa panjang sepal (bagian dari bunga) memiliki perbedaan yang jelas antara spesies yang ada dalam dataset iris. Hal ini dibuktikan dengan nilai p yang sangat kecil, yang mengindikasikan bahwa perbedaan tersebut bukanlah kebetulan. Dengan kata lain, spesies bunga yang berbeda memiliki rata-rata panjang sepal yang berbeda, jadi kita bisa yakin bahwa spesies mempengaruhi panjang sepal bunga.
t_test <- t.test(Petal.Length ~ Species,
data = subset(iris, Species %in% c("setosa", "versicolor")))
t_test
##
## Welch Two Sample t-test
##
## data: Petal.Length by Species
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group setosa and group versicolor is not equal to 0
## 95 percent confidence interval:
## -2.939618 -2.656382
## sample estimates:
## mean in group setosa mean in group versicolor
## 1.462 4.260
Penjelasan dengan Bahasa Statistik: Berdasarkan hasil uji t-test dua sampel, nilai t = -39.493 dan p-value < 2.2e-16 menunjukkan bahwa terdapat perbedaan yang sangat signifikan antara panjang petal (Petal Length) pada spesies setosa dan versicolor. Karena nilai p sangat kecil (jauh lebih kecil dari 0.05), kita dapat menolak hipotesis nol yang menyatakan bahwa tidak ada perbedaan panjang petal antara kedua spesies tersebut.
Confidence Interval antara -2.94 hingga -2.66 menunjukkan bahwa perbedaan panjang petal antara kedua spesies adalah sekitar 2.66 hingga 2.94 unit, dengan spesies versicolor memiliki panjang petal yang lebih panjang daripada spesies setosa. Dengan kata lain, spesies setosa memiliki panjang petal yang lebih pendek dibandingkan dengan spesies versicolor.
Penjelasan dengan Bahasa Sederhana: Hasil uji t-test ini menunjukkan bahwa panjang kelopak bunga (petal) pada spesies setosa dan versicolor jelas berbeda. Spesies versicolor memiliki kelopak bunga yang lebih panjang dibandingkan dengan spesies setosa. Nilai p yang sangat kecil mengindikasikan bahwa perbedaan ini sangat signifikan dan bukan kebetulan. Selain itu, interval kepercayaan menunjukkan bahwa perbedaan panjang petal antara kedua spesies ini sekitar 2.7 cm.
reg_model <- lm(mpg ~ wt, data = mtcars)
summary(reg_model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
# Scatter plot dengan garis regresi
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
ggplot(mtcars, aes(x = wt, y = mpg)) +
geom_point(color = "brown") +
geom_smooth(method = "lm", color = "gold", se = FALSE) +
labs(title = "Scatter Plot MPG vs Berat Mobil",
x = "Berat Mobil (wt)",
y = "Miles Per Gallon (mpg)")
## `geom_smooth()` using formula = 'y ~ x'
#### c. Interpretasi hasil 1. Hubungan Berat Mobil (wt) dan Efisiensi
Bahan Bakar (mpg): Grafik scatter plot menunjukkan hubungan negatif
antara berat mobil (wt) dan efisiensi bahan bakar (mpg). Artinya: Ketika
berat mobil meningkat, efisiensi bahan bakar cenderung menurun. Hal ini
dapat dilihat dari garis regresi (garis hitam) yang menurun.
Koefisien Regresi: Intercept: Nilai prediksi mpg ketika berat mobil (wt) adalah nol. Meskipun ini tidak realistis (karena berat mobil tidak bisa nol), nilai ini berguna untuk membangun model matematis. Slope (kemiringan): Mengukur seberapa besar perubahan mpg ketika berat mobil bertambah 1 unit. Contohnya, jika slope = -5, maka setiap kenaikan berat mobil sebesar 1 unit akan mengurangi efisiensi bahan bakar sebanyak 5 mpg.
R² (Koefisien Determinasi): Nilai R2R2 menunjukkan seberapa baik hubungan linier antara berat mobil dan efisiensi bahan bakar. Misalnya: Jika R2=0.80R2=0.80, berarti 80% variasi dalam efisiensi bahan bakar (mpg) dapat dijelaskan oleh berat mobil (wt). Sisanya (20%) dipengaruhi oleh faktor lain yang tidak termasuk dalam model, seperti jenis mesin atau aerodinamika mobil.
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE
parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.