1. Statistik Deskriptif

Menggunakan dataset airquality: a. Statistik Deskriptif:

data <- airquality
summary(data$Ozone)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    1.00   18.00   31.50   42.13   63.25  168.00      37
sd(data$Ozone, na.rm = TRUE)
## [1] 32.98788
  1. Scatter Plot antara Wind dan Temp:
plot(airquality$Wind, airquality$Temp,
     xlab = "Wind", ylab = "Temperature",
     main = "Scatter Plot Wind vs Temp")

2. Bar Chart untuk Variabel cyl di mtcars:

library(ggplot2)
ggplot(mtcars, aes(x = factor(cyl))) +
  geom_bar(fill = "skyblue") +
  labs(title = "Bar Chart Jumlah Kategori cyl", x = "cyl", y = "Jumlah")

3 Dataset Iris a. Boxplot

boxplot(Petal.Width ~ Species, data = iris,
        main = "Boxplot Petal Width by Species",
        xlab = "Species", ylab = "Petal Width")

b. Korelasi Sepal.Length dan Petal.Length:

cor(iris$Sepal.Length, iris$Petal.Length)
## [1] 0.8717538
  1. Scatter Plot Sepal.Length vs Sepal.Width:
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, color = Species)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  labs(title = "Scatter Plot Sepal.Length vs Sepal.Width")
## `geom_smooth()` using formula = 'y ~ x'

4 uji chi-square Membuat Tabel Kontingensi

# Mengakses dataset mtcars
data <- mtcars

# Membuat tabel kontingensi antara vs dan am
tabel <- table(data$vs, data$am)

# Menampilkan tabel kontingensi
print(tabel)
##    
##      0  1
##   0 12  6
##   1  7  7

Melakukan Uji Chi-Square

# Melakukan uji Chi-Square
hasil_chi <- chisq.test(tabel)

# Menampilkan hasil uji Chi-Square
print(hasil_chi)
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabel
## X-squared = 0.34754, df = 1, p-value = 0.5555

5 Model Regresi Linear Sederhana dengan Dataset airquality a. Ringkasan Model Menggunakan summary()

Untuk membangun model regresi linear sederhana:

# Membuat model regresi
model <- lm(Temp ~ Solar.R, data = airquality)

# Menampilkan ringkasan model
summary(model)
## 
## Call:
## lm(formula = Temp ~ Solar.R, data = airquality)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -22.3787  -4.9572   0.8932   5.9111  18.4013 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 72.863012   1.693951  43.014  < 2e-16 ***
## Solar.R      0.028255   0.008205   3.444 0.000752 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.898 on 144 degrees of freedom
##   (7 observations deleted due to missingness)
## Multiple R-squared:  0.07609,    Adjusted R-squared:  0.06967 
## F-statistic: 11.86 on 1 and 144 DF,  p-value: 0.0007518

b Scatter Plot dengan Garis Regresi

Untuk memvisualisasikan hubungan antara Solar.R dan Temp dengan garis regresi:

# Plot scatter dengan garis regresi
plot(airquality$Solar.R, airquality$Temp,
     main = "Scatter Plot Solar.R vs Temp",
     xlab = "Solar.R", ylab = "Temperature",
     pch = 16, col = "blue")
abline(model, col = "red", lwd = 2)

c. Interpretasi Hasil 1. Koefisien Regresi: • Jika koefisien untuk Solar.R positif, maka setiap peningkatan nilai Solar.R akan meningkatkan nilai Temp secara linear. • Contoh hasil koefisien: • Intercept: 50.0 • Solar.R: 0.06 Interpretasi: Jika Solar.R naik 1 unit, maka suhu (Temp) diperkirakan naik sebesar 0.06 derajat. 2. Nilai R²: • R² menunjukkan proporsi variasi Temp yang dijelaskan oleh Solar.R. • Misalnya, jika R² = 0.65, berarti 65% variasi Temp dijelaskan oleh variabel Solar.R, sedangkan sisanya dipengaruhi oleh faktor lain. 3. Signifikansi Model: • Dilihat dari p-value untuk koefisien Solar.R: • Jika p-value < 0.05, maka hubungan antara Solar.R dan Temp signifikan secara statistik.