airquality
Menampilkan statistik deskriptif untuk variabel
Ozone pada dataset airquality
.
# Load dataset airquality
data("airquality")
summary(airquality$Ozone)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.00 18.00 31.50 42.13 63.25 168.00 37
sd(airquality$Ozone, na.rm = TRUE)
## [1] 32.98788
# Standar deviasi
## b. Scatter plot antara Wind dan Temp
plot(airquality$Wind, airquality$Temp,
main = "Scatter Plot Wind vs Temp",
xlab = "Wind (mph)",
ylab = "Temperature (Fahrenheit)",
col = "blue", pch = 19)
# 2 Bar Chart dan Label Frekuensi untuk cyl
# Load dataset mtcars
data("mtcars")
# Hitung frekuensi untuk variabel cyl
cyl_count <- table(mtcars$cyl)
# Bar chart untuk variabel cyl
barplot(cyl_count,
main = "Bar Chart of Cylinders",
xlab = "Number of Cylinders",
ylab = "Frequency",
col = "lightblue")
# Menambahkan label pada setiap bar
text(x = barplot(cyl_count), y = cyl_count,
labels = cyl_count, pos = 3, cex = 1)
# 3 A. Boxplot untuk Petal.Width Berdasarkan Species
# Boxplot Petal.Width berdasarkan Species
boxplot(Petal.Width ~ Species, data = iris,
main = "Boxplot Petal.Width by Species",
xlab = "Species",
ylab = "Petal Width",
col = c("orange", "purple", "green"))
# 3 B.Korelasi antara Sepal.Length dan Petal.Length
# Korelasi antara Sepal.Length dan Petal.Length
correlation <- cor(iris$Sepal.Length, iris$Petal.Length)
print(paste("Korelasi antara Sepal.Length dan Petal.Length:", round(correlation, 2)))
## [1] "Korelasi antara Sepal.Length dan Petal.Length: 0.87"
# 3 C. Scatter Plot antara Sepal.Length dan Sepal.Width dengan Warna Berdasarkan Species
# Scatter plot dengan warna berdasarkan Species
library(ggplot2)
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, color = Species)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
ggtitle("Scatter Plot Sepal.Length vs Sepal.Width") +
theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
# 4 Uji Chi-Square untuk vs dan am dalam Dataset mtcars
# Uji Chi-Square untuk variabel vs dan am
chisq_test <- chisq.test(mtcars$vs, mtcars$am)
# Hasil uji Chi-Square
print(chisq_test)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: mtcars$vs and mtcars$am
## X-squared = 0.34754, df = 1, p-value = 0.5555
# 5 A. Model Regresi Linear Sederhana
# Model regresi linear sederhana
model <- lm(Temp ~ Solar.R, data = airquality)
# Ringkasan model
summary(model)
##
## Call:
## lm(formula = Temp ~ Solar.R, data = airquality)
##
## Residuals:
## Min 1Q Median 3Q Max
## -22.3787 -4.9572 0.8932 5.9111 18.4013
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 72.863012 1.693951 43.014 < 2e-16 ***
## Solar.R 0.028255 0.008205 3.444 0.000752 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.898 on 144 degrees of freedom
## (7 observations deleted due to missingness)
## Multiple R-squared: 0.07609, Adjusted R-squared: 0.06967
## F-statistic: 11.86 on 1 and 144 DF, p-value: 0.0007518
# 5 B. Scatter Plot dengan Garis Regresi
# Scatter plot dengan garis regresi
plot(airquality$Solar.R, airquality$Temp,
main = "Scatter Plot Solar.R vs Temp",
xlab = "Solar.R (Solar Radiation)",
ylab = "Temperature (Fahrenheit)",
col = "blue", pch = 19)
# Tambahkan garis regresi
abline(model, col = "red", lwd = 2)
Berdasarkan hasil regresi linear yang diperoleh, model yang dihasilkan adalah Temp = 72.86 + 0.028 × Solar.R, yang menunjukkan bahwa Solar.R memiliki pengaruh positif terhadap Temp. Setiap kenaikan 1 unit pada Solar.R diperkirakan akan meningkatkan suhu (Temp) sebesar 0.028°F. Nilai p untuk kedua koefisien (Intercept dan Solar.R) sangat kecil (lebih dari 0.001), yang menunjukkan bahwa hubungan antara Solar.R dan Temp signifikan secara statistik. Meskipun demikian, model ini hanya mampu menjelaskan sekitar 7.61% variasi dalam suhu, seperti yang tercermin pada nilai R-squared yang rendah. Residual standard error sebesar 8.898 menunjukkan bahwa prediksi suhu memiliki deviasi sekitar 8.9°F dari nilai yang diperkirakan. Secara keseluruhan, meskipun ada hubungan yang signifikan antara Solar.R dan Temp, model ini tidak sepenuhnya dapat menjelaskan variasi suhu, yang berarti faktor lain mungkin turut memengaruhi suhu yang tidak tercakup dalam model ini.