dataset=mtcars
data=mtcars$mpg
summary(data)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 10.40 15.43 19.20 20.09 22.80 33.90
boxplot(mpg~cyl, data=mtcars,
main="Boxplot variabel mpg berdasarkan variabel cyl",
xlab="Jumlah Silinder",
ylab="Mil per Galon",
col=c("cyan", "lightgreen", "red"),
border="navy" )
hist(mtcars$hp,
breaks=15,
col="cyan",
main="Histogram untuk variabel hp (Horse Power) dengan garis densitas",
xlab="Horse Power",
ylab="Frekuensi",
freq=FALSE)
lines(density(mtcars$hp),
col="red",
lwd=3)
Distribusi Horse Power pada dataset
mtcars cenderung terpusat di sekitar 100 hingga
150 hp, dengan distribusi yang sedikit skewed positif (lebih
banyak data di sisi kiri), dan beberapa mobil dengan Horse
Power tinggi sebagai outliers. Secara keseluruhan, distribusi
ini tidak simetris dan memiliki puncak yang jelas, dengan sedikit data
yang menunjukkan tenaga mobil sangat tinggi.
anova_result <- aov(Sepal.Length ~ Species, data = iris)
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Species 2 63.21 31.606 119.3 <2e-16 ***
## Residuals 147 38.96 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Hasil ANOVA yang dilakukan pada data iris menunjukkan bahwa ada perbedaan yang signifikan dalam rata-rata panjang sepal (Sepal.Length) antara spesies bunga yang berbeda. Berdasarkan output, nilai p-value untuk uji F sangat kecil (< 0.001), yang berarti kita dapat menolak hipotesis nol (H0) yang menyatakan bahwa tidak ada perbedaan antara spesies. Nilai F yang besar (119.3) mengindikasikan bahwa variasi antar kelompok (spesies) jauh lebih besar dibandingkan variasi dalam kelompok, menegaskan bahwa spesies mempengaruhi panjang sepal secara signifikan. Dengan demikian, kita dapat menyimpulkan bahwa panjang sepal bervariasi secara signifikan antara spesies dalam dataset iris.
data(iris)
setosa <- iris[iris$Species == "setosa", "Petal.Length"]
versicolor <- iris[iris$Species == "versicolor", "Petal.Length"]
t_test_result <- t.test(setosa, versicolor)
t_test_result
##
## Welch Two Sample t-test
##
## data: setosa and versicolor
## t = -39.493, df = 62.14, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -2.939618 -2.656382
## sample estimates:
## mean of x mean of y
## 1.462 4.260
Berdasarkan hasil uji t-test dua sampel yang dilakukan untuk membandingkan panjang petal antara spesies Setosa dan Versicolor, diperoleh nilai p-value sebesar (2.2e-16). Karena p-value ini jauh lebih kecil dari tingkat signifikansi yang umum digunakan (0.05), kita menolak hipotesis nol yang menyatakan bahwa tidak ada perbedaan rata-rata panjang petal antara kedua spesies. Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan yang signifikan secara statistik dalam panjang petal antara bunga Setosa dan Versicolor. Kesimpulannya, berdasarkan hasil uji t-test, panjang petal spesies Setosa dan Versicolor berbeda secara signifikan. Perbedaan ini menunjukkan bahwa faktor spesies mempengaruhi panjang petal bunga, dengan Setosa dan Versicolor memiliki ukuran petal yang berbeda dalam hal rata-rata.
model=lm(mpg~wt, data=mtcars)
summary(model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
library(ggplot2)
ggplot(mtcars, aes(x=wt, y=mpg))+
geom_point()+
geom_smooth(method="lm", col="darkblue")+
labs(titlle="Regresi Linear antara mpg dan wt", x="Berat mobil (wt)", y="Miles per gallon (mpg)")
## `geom_smooth()` using formula = 'y ~ x'
Koefisien regresi untuk wt mengindikasikan seberapa besar perubahan pada mpg terkait dengan perubahan pada berat mobil. Misalnya, jika koefisien regresi untuk wt adalah -5.344, maka setiap kenaikan 1 unit pada berat mobil (misalnya, dari 3.0 menjadi 4.0) akan menyebabkan penurunan sekitar 5.34 mil per galon dalam konsumsi bahan bakar. Ini menunjukkan bahwa semakin berat mobil, semakin rendah efisiensi bahan bakarnya. Koefisien intersep (konstanta) menunjukkan nilai prediksi mpg ketika wt bernilai 0. Ini lebih bersifat teoretis dalam konteks dunia nyata karena berat mobil tidak mungkin 0, tetapi dapat memberi gambaran tentang model secara keseluruhan. Sedangkan Nilai R-squared dalam model ini menggambarkan seberapa baik model regresi linear menjelaskan variabilitas data mpg berdasarkan variabel wt. Sebagai contoh, jika nilai R² adalah 0.75, ini berarti bahwa sekitar 75% variasi dalam konsumsi bahan bakar (mpg) dapat dijelaskan oleh berat mobil (wt), sedangkan sisanya (25%) dipengaruhi oleh faktor lain yang tidak tercakup dalam model ini. Nilai R² yang tinggi menunjukkan hubungan yang cukup kuat antara variabel wt dan mpg.