mtcars
## mpg cyl disp hp drat wt qsec vs am gear carb
## Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
## Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
## Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
## Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
## Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
## Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1
## Duster 360 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4
## Merc 240D 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
## Merc 230 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
## Merc 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4
## Merc 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4
## Merc 450SE 16.4 8 275.8 180 3.07 4.070 17.40 0 0 3 3
## Merc 450SL 17.3 8 275.8 180 3.07 3.730 17.60 0 0 3 3
## Merc 450SLC 15.2 8 275.8 180 3.07 3.780 18.00 0 0 3 3
## Cadillac Fleetwood 10.4 8 472.0 205 2.93 5.250 17.98 0 0 3 4
## Lincoln Continental 10.4 8 460.0 215 3.00 5.424 17.82 0 0 3 4
## Chrysler Imperial 14.7 8 440.0 230 3.23 5.345 17.42 0 0 3 4
## Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1
## Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2
## Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1
## Toyota Corona 21.5 4 120.1 97 3.70 2.465 20.01 1 0 3 1
## Dodge Challenger 15.5 8 318.0 150 2.76 3.520 16.87 0 0 3 2
## AMC Javelin 15.2 8 304.0 150 3.15 3.435 17.30 0 0 3 2
## Camaro Z28 13.3 8 350.0 245 3.73 3.840 15.41 0 0 3 4
## Pontiac Firebird 19.2 8 400.0 175 3.08 3.845 17.05 0 0 3 2
## Fiat X1-9 27.3 4 79.0 66 4.08 1.935 18.90 1 1 4 1
## Porsche 914-2 26.0 4 120.3 91 4.43 2.140 16.70 0 1 5 2
## Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2
## Ford Pantera L 15.8 8 351.0 264 4.22 3.170 14.50 0 1 5 4
## Ferrari Dino 19.7 6 145.0 175 3.62 2.770 15.50 0 1 5 6
## Maserati Bora 15.0 8 301.0 335 3.54 3.570 14.60 0 1 5 8
## Volvo 142E 21.4 4 121.0 109 4.11 2.780 18.60 1 1 4 2
mean_mpg <- mean(mtcars$mpg)
median_mpg <- median(mtcars$mpg)
sd_mpg <- sd(mtcars$mpg)
cat("Mean mpg:", mean_mpg, "\n")
## Mean mpg: 20.09062
hasil rata rata untuk variabel mpg didalam data mtcars bernilai 20.09062
cat("Median mpg:", median_mpg, "\n")
## Median mpg: 19.2
kemudian untuk nilai tengah data di variabel mpg adalah 19.2
cat("Standar Deviasi mpg:", sd_mpg, "\n")
## Standar Deviasi mpg: 6.026948
standar deviasi dari data di variabel mpg sebesar 6.026948
library(ggplot2)
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
geom_boxplot() +
labs(title = "Boxplot MPG berdasarkan Jumlah Silinder",
x = "Jumlah Silinder",
y = "Miles per Gallon (MPG)")
berdasarkan variabel cyl atau silinder:
4 silinder: Rentang MPG sekitar 21 hingga 33. Median sekitar 26. Jadi, kendaraan dengan 4 silinder cenderung memiliki efisiensi bahan bakar yang lebih tinggi, dengan nilai MPG yang lebih tinggi dibandingkan dengan kendaraan dengan jumlah silinder yang lebih banyak.
6 silinder: Rentang MPG sekitar 17 hingga 22. Median sekitar 19. Jadi, kendaraan dengan 6 silinder memiliki efisiensi bahan bakar yang lebih rendah dibandingkan dengan kendaraan 4 silinder, tetapi lebih tinggi dibandingkan kendaraan 8 silinder.
8 silinder: Rentang MGP sekitar 12 hingga 19. Median sekitar 15. Jadi, kendaraan dengan 8 silinder memiliki efisiensi bahan bakar yang paling rendah diantara ketiga kelompok. kesimpulannya didapar bahwa jumlah silinder dalam kendaraan memiliki hubungan negatif dengan efisiensi bahan bakar (MPG).Semakin banyak silinder, semakin rendah efisiensi bahan bakar kendaraan tersebut.
ggplot(mtcars, aes(x = hp)) +
geom_histogram(aes(y = ..density..), bins = 15, fill = "blue", alpha = 0.5) +
geom_density(color = "red", size = 1) +
labs(title = "HistogramHorsepower dengan Garis Densitas",
x = "Horsepower (hp)",
y = "Density")
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Distribusi data horsepower (hp) berdasarkan histogram dengan garis
densitas menunjukkan beberapa karakteristik penting. Terdapat dua puncak
densitas utama, dengan puncak pertama berada di sekitar 100 hp dan
puncak kedua di sekitar 200 hp. hal tersebut menunjukkan bahwa banyak
kendaraan dalam dataset memiliki tenaga kuda di sekitar nilai-nilai
tersebut, mengindikasikan adanya dua kelompok utama dalam data, mungkin
mewakili jenis kendaraan yang berbeda seperti mobil ekonomi dan mobil
performa tinggi. Data horsepower tersebar dari sekitar 50 hp hingga
lebih dari 300 hp, namun sebagian besar data berada di rentang 50 hingga
250 hp. Distribusi ini bersifat bimodal, dengan dua puncak yang jelas,
dan memiliki ekor kanan yang panjang, menunjukkan bahwa ada beberapa
kendaraan dengan tenaga kuda yang sangat tinggi (di atas 300 hp),
meskipun jumlahnya relatif sedikit. Sebagian besar kendaraan memiliki
tenaga kuda di bawah 200 hp, dengan kepadatan tertinggi di sekitar 100
hp. Grafik ini memberikan gambaran visual yang jelas tentang bagaimana
data horsepower terdistribusi dalam dataset mtcars, membantu dalam
analisis lebih lanjut atau pengambilan keputusan berdasarkan data
tersebut.
iris
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
## 7 4.6 3.4 1.4 0.3 setosa
## 8 5.0 3.4 1.5 0.2 setosa
## 9 4.4 2.9 1.4 0.2 setosa
## 10 4.9 3.1 1.5 0.1 setosa
## 11 5.4 3.7 1.5 0.2 setosa
## 12 4.8 3.4 1.6 0.2 setosa
## 13 4.8 3.0 1.4 0.1 setosa
## 14 4.3 3.0 1.1 0.1 setosa
## 15 5.8 4.0 1.2 0.2 setosa
## 16 5.7 4.4 1.5 0.4 setosa
## 17 5.4 3.9 1.3 0.4 setosa
## 18 5.1 3.5 1.4 0.3 setosa
## 19 5.7 3.8 1.7 0.3 setosa
## 20 5.1 3.8 1.5 0.3 setosa
## 21 5.4 3.4 1.7 0.2 setosa
## 22 5.1 3.7 1.5 0.4 setosa
## 23 4.6 3.6 1.0 0.2 setosa
## 24 5.1 3.3 1.7 0.5 setosa
## 25 4.8 3.4 1.9 0.2 setosa
## 26 5.0 3.0 1.6 0.2 setosa
## 27 5.0 3.4 1.6 0.4 setosa
## 28 5.2 3.5 1.5 0.2 setosa
## 29 5.2 3.4 1.4 0.2 setosa
## 30 4.7 3.2 1.6 0.2 setosa
## 31 4.8 3.1 1.6 0.2 setosa
## 32 5.4 3.4 1.5 0.4 setosa
## 33 5.2 4.1 1.5 0.1 setosa
## 34 5.5 4.2 1.4 0.2 setosa
## 35 4.9 3.1 1.5 0.2 setosa
## 36 5.0 3.2 1.2 0.2 setosa
## 37 5.5 3.5 1.3 0.2 setosa
## 38 4.9 3.6 1.4 0.1 setosa
## 39 4.4 3.0 1.3 0.2 setosa
## 40 5.1 3.4 1.5 0.2 setosa
## 41 5.0 3.5 1.3 0.3 setosa
## 42 4.5 2.3 1.3 0.3 setosa
## 43 4.4 3.2 1.3 0.2 setosa
## 44 5.0 3.5 1.6 0.6 setosa
## 45 5.1 3.8 1.9 0.4 setosa
## 46 4.8 3.0 1.4 0.3 setosa
## 47 5.1 3.8 1.6 0.2 setosa
## 48 4.6 3.2 1.4 0.2 setosa
## 49 5.3 3.7 1.5 0.2 setosa
## 50 5.0 3.3 1.4 0.2 setosa
## 51 7.0 3.2 4.7 1.4 versicolor
## 52 6.4 3.2 4.5 1.5 versicolor
## 53 6.9 3.1 4.9 1.5 versicolor
## 54 5.5 2.3 4.0 1.3 versicolor
## 55 6.5 2.8 4.6 1.5 versicolor
## 56 5.7 2.8 4.5 1.3 versicolor
## 57 6.3 3.3 4.7 1.6 versicolor
## 58 4.9 2.4 3.3 1.0 versicolor
## 59 6.6 2.9 4.6 1.3 versicolor
## 60 5.2 2.7 3.9 1.4 versicolor
## 61 5.0 2.0 3.5 1.0 versicolor
## 62 5.9 3.0 4.2 1.5 versicolor
## 63 6.0 2.2 4.0 1.0 versicolor
## 64 6.1 2.9 4.7 1.4 versicolor
## 65 5.6 2.9 3.6 1.3 versicolor
## 66 6.7 3.1 4.4 1.4 versicolor
## 67 5.6 3.0 4.5 1.5 versicolor
## 68 5.8 2.7 4.1 1.0 versicolor
## 69 6.2 2.2 4.5 1.5 versicolor
## 70 5.6 2.5 3.9 1.1 versicolor
## 71 5.9 3.2 4.8 1.8 versicolor
## 72 6.1 2.8 4.0 1.3 versicolor
## 73 6.3 2.5 4.9 1.5 versicolor
## 74 6.1 2.8 4.7 1.2 versicolor
## 75 6.4 2.9 4.3 1.3 versicolor
## 76 6.6 3.0 4.4 1.4 versicolor
## 77 6.8 2.8 4.8 1.4 versicolor
## 78 6.7 3.0 5.0 1.7 versicolor
## 79 6.0 2.9 4.5 1.5 versicolor
## 80 5.7 2.6 3.5 1.0 versicolor
## 81 5.5 2.4 3.8 1.1 versicolor
## 82 5.5 2.4 3.7 1.0 versicolor
## 83 5.8 2.7 3.9 1.2 versicolor
## 84 6.0 2.7 5.1 1.6 versicolor
## 85 5.4 3.0 4.5 1.5 versicolor
## 86 6.0 3.4 4.5 1.6 versicolor
## 87 6.7 3.1 4.7 1.5 versicolor
## 88 6.3 2.3 4.4 1.3 versicolor
## 89 5.6 3.0 4.1 1.3 versicolor
## 90 5.5 2.5 4.0 1.3 versicolor
## 91 5.5 2.6 4.4 1.2 versicolor
## 92 6.1 3.0 4.6 1.4 versicolor
## 93 5.8 2.6 4.0 1.2 versicolor
## 94 5.0 2.3 3.3 1.0 versicolor
## 95 5.6 2.7 4.2 1.3 versicolor
## 96 5.7 3.0 4.2 1.2 versicolor
## 97 5.7 2.9 4.2 1.3 versicolor
## 98 6.2 2.9 4.3 1.3 versicolor
## 99 5.1 2.5 3.0 1.1 versicolor
## 100 5.7 2.8 4.1 1.3 versicolor
## 101 6.3 3.3 6.0 2.5 virginica
## 102 5.8 2.7 5.1 1.9 virginica
## 103 7.1 3.0 5.9 2.1 virginica
## 104 6.3 2.9 5.6 1.8 virginica
## 105 6.5 3.0 5.8 2.2 virginica
## 106 7.6 3.0 6.6 2.1 virginica
## 107 4.9 2.5 4.5 1.7 virginica
## 108 7.3 2.9 6.3 1.8 virginica
## 109 6.7 2.5 5.8 1.8 virginica
## 110 7.2 3.6 6.1 2.5 virginica
## 111 6.5 3.2 5.1 2.0 virginica
## 112 6.4 2.7 5.3 1.9 virginica
## 113 6.8 3.0 5.5 2.1 virginica
## 114 5.7 2.5 5.0 2.0 virginica
## 115 5.8 2.8 5.1 2.4 virginica
## 116 6.4 3.2 5.3 2.3 virginica
## 117 6.5 3.0 5.5 1.8 virginica
## 118 7.7 3.8 6.7 2.2 virginica
## 119 7.7 2.6 6.9 2.3 virginica
## 120 6.0 2.2 5.0 1.5 virginica
## 121 6.9 3.2 5.7 2.3 virginica
## 122 5.6 2.8 4.9 2.0 virginica
## 123 7.7 2.8 6.7 2.0 virginica
## 124 6.3 2.7 4.9 1.8 virginica
## 125 6.7 3.3 5.7 2.1 virginica
## 126 7.2 3.2 6.0 1.8 virginica
## 127 6.2 2.8 4.8 1.8 virginica
## 128 6.1 3.0 4.9 1.8 virginica
## 129 6.4 2.8 5.6 2.1 virginica
## 130 7.2 3.0 5.8 1.6 virginica
## 131 7.4 2.8 6.1 1.9 virginica
## 132 7.9 3.8 6.4 2.0 virginica
## 133 6.4 2.8 5.6 2.2 virginica
## 134 6.3 2.8 5.1 1.5 virginica
## 135 6.1 2.6 5.6 1.4 virginica
## 136 7.7 3.0 6.1 2.3 virginica
## 137 6.3 3.4 5.6 2.4 virginica
## 138 6.4 3.1 5.5 1.8 virginica
## 139 6.0 3.0 4.8 1.8 virginica
## 140 6.9 3.1 5.4 2.1 virginica
## 141 6.7 3.1 5.6 2.4 virginica
## 142 6.9 3.1 5.1 2.3 virginica
## 143 5.8 2.7 5.1 1.9 virginica
## 144 6.8 3.2 5.9 2.3 virginica
## 145 6.7 3.3 5.7 2.5 virginica
## 146 6.7 3.0 5.2 2.3 virginica
## 147 6.3 2.5 5.0 1.9 virginica
## 148 6.5 3.0 5.2 2.0 virginica
## 149 6.2 3.4 5.4 2.3 virginica
## 150 5.9 3.0 5.1 1.8 virginica
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
H0 : μ1 = μ2 = μ3 (Rata-rata panjang sepal untuk semua spesies adalah sama) H1 : Setidaknya ada satu pasangan spesies dengan rata-rata panjang sepal yang berbeda
Jika hasil uji ANOVA menunjukkan p-value yang lebih kecil dari tingkat signifikansi (misalnya, 0.05), maka kita menolak hipotesis nol (H0) dan menerima hipotesis alternatif (H1), yang berarti terdapat perbedaan signifikan pada rata-rata panjang sepal antar spesies. Jika p-value lebih besar dari tingkat signifikansi, maka kita gagal menolak hipotesis nol, yang berarti tidak ada bukti yang cukup untuk menyatakan adanya perbedaan signifikan pada rata-rata panjang sepal antar spesies.
Nilai p-value yang sangat kecil (<2e-16) menunjukkan bahwa terdapat perbedaan yang signifikan pada rata-rata panjang sepal antar spesies dalam dataset iris. Dengan kata lain, spesies yang berbeda memiliki panjang sepal yang berbeda secara signifikan. Hasil ini didukung oleh nilai F yang tinggi (119.3), yang menunjukkan bahwa variabilitas antar spesies jauh lebih besar dibandingkan dengan variabilitas dalam spesies.
# Memisahkan data berdasarkan spesies
setosa <- subset(iris, Species == "setosa")$Petal.Length
versicolor <- subset(iris, Species == "versicolor")$Petal.Length
# uji t-test two sample
t_test_result <- t.test(setosa, versicolor)
# Melihat hasil uji t-test
t_test_result
##
## Welch Two Sample t-test
##
## data: setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -2.939618 -2.656382
## sample estimates:
## mean of x mean of y
## 1.462 4.260
Kesimpulan hasil pengujian: Berdasarkan hasil uji t-test dua sampel untuk membandingkan panjang petal (Petal.Length) antara spesies setosa dan versicolor, terdapat perbedaan yang signifikan secara statistik antara kedua spesies tersebut. Nilai t yang sangat besar (atau kecil dalam hal ini, karena negatif) dan p-value yang sangat kecil (lebih kecil dari 2.2e-16) menunjukkan bahwa perbedaan ini sangat signifikan. Interval kepercayaan 95% juga tidak mencakup nol, yang berarti perbedaan rata-rata antara kedua kelompok tersebut signifikan. Rata-rata panjang petal untuk spesies setosa adalah 1.462, sedangkan untuk spesies versicolor adalah 4.260. Dengan demikian, kita dapat menyimpulkan bahwa panjang petal antara spesies setosa dan versicolor berbeda secara signifikan.
model <- lm(mpg ~ wt, data = mtcars)
summary(model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
ggplot(mtcars, aes(x = wt, y = mpg)) +
geom_point() + geom_smooth(method = "lm", col = "red") +
labs(title = "Scatter Plot MPG berdasarkan Berat Mobil",
x = "Berat Mobil (1000 lbs)",
y = "Miles per Gallon (MPG)")
## `geom_smooth()` using formula = 'y ~ x'
## c. Interpretasikan hasil, termasuk koefisien regresi dan nilai R^2 H0
: Tidak ada hubungan linear antara berat mobil (wt) dan efisiensi bahan
bakar (mpg). H1 : Ada hubungan linear antara berat mobil (wt) dan
efisiensi bahan bakar (mpg).
Hasil Model Regresi:
Koefisien Regresi: Intercept (β0): 37.2851 Ini adalah nilai mpg ketika wt (berat mobil) adalah 0. Secara praktis, ini tidak memiliki makna fisik karena berat mobil tidak mungkin 0, tetapi ini adalah titik awal dari garis regresi. Slope (β1): -5.3445 Ini menunjukkan bahwa setiap peningkatan 1 unit dalam wt (berat mobil dalam 1000 lbs) akan mengurangi mpg sebesar 5.3445. Dengan kata lain, ada hubungan negatif antara berat mobil dan efisiensi bahan bakar.
Nilai R-squared: Multiple R-squared: 0.7528 Ini menunjukkan bahwa sekitar 75.28% variabilitas dalam mpg dapat dijelaskan oleh model yang menggunakan wt sebagai prediktor. Ini adalah indikasi bahwa model memiliki kecocokan yang baik dengan data. Adjusted R-squared: 0.7446 Ini adalah versi yang disesuaikan dari R-squared yang memperhitungkan jumlah prediktor dalam model. Nilai ini sedikit lebih rendah tetapi masih menunjukkan kecocokan yang baik.
Signifikansi Statistik: p-value untuk koefisien wt: 1.29e-10 Nilai p yang sangat kecil ini menunjukkan bahwa koefisien wt sangat signifikan secara statistik. Dengan kata lain, berat mobil adalah prediktor yang sangat signifikan untuk mpg. F-statistic: 91.38 dengan p-value 1.294e-10 F-statistic yang tinggi dan p-value yang sangat kecil menunjukkan bahwa model secara keseluruhan sangat signifikan.
Kesimpulan: Berdasarkan hasil uji regresi linear, kita dapat menolak hipotesis nol (H0) dan menerima hipotesis alternatif (H1). Ini berarti ada hubungan linear yang signifikan antara berat mobil (wt) dan efisiensi bahan bakar (mpg). Semakin berat mobil, semakin rendah efisiensi bahan bakarnya. Model ini menjelaskan sekitar 75.28% variabilitas dalam mpg, yang menunjukkan bahwa berat mobil adalah prediktor yang kuat untuk efisiensi bahan bakar.