Ini digunakan untuk memenuhi tugas mata kuliah komputasi statistika

1. Scatter Plot antara POP dan FEE

Buat scatter plot yang menunjukkan hubungan antara variabel POP dan FEE. Apakah ada pola yang terlihat antara kedua variabel tersebut?

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readxl)

#Data pada soal komstat revaa
data <- read_excel("D:/Kuliah/SEMESTER 3/Komputasi Statistika/Tugas dan Latihan/DATA CASEMETHOD REVAA P910.xlsx")
## New names:
## • `` -> `...4`
# 1. Scatter Plot antara POP dan FEE
plot(data$POP, data$FEE, 
     main = "Scatter Plot antara POP dan FEE", 
     xlab = "POP", ylab = "FEE", 
     pch = 19, col = "blue")
model <- lm(FEE ~ POP, data = data)
abline(model, col = "red")

Scatter plot menunjukkan hubungan antara variabel populasi (POP) dan biaya (FEE). Dari plot tersebut, dapat dilihat bahwa ada kecenderungan bahwa semakin tinggi populasi, semakin tinggi pula biaya (FEE). Hal ini menunjukkan adanya pola positif antara kedua variabel tersebut.

2. Box Plot FEE Berdasarkan Kelompok BIG8

Buat box plot untuk variabel FEE dan bedakan antara kelompok BIG8 (YES dan NO). Apakah terdapat perbedaan distribusi nilai FEE antara kelompok BIG8 dan non-BIG8?

library(dplyr)
library(readxl)

#Data pada soal komstat revaa
data <- read_excel("D:/Kuliah/SEMESTER 3/Komputasi Statistika/Tugas dan Latihan/DATA CASEMETHOD REVAA P910.xlsx")
## New names:
## • `` -> `...4`
# 2. Membuat Box Plot FEE Berdasarkan Kelompok BIG8
boxplot(FEE ~ BIG8, data = data,
        main = "Box Plot FEE Berdasarkan Kelompok BIG8",
        xlab = "BIG8", ylab = "FEE",
        col = c("orange", "green"))

# Uji t-test perbedaan distribusi FEE antara kelompok BIG8 dan non-BIG8
t_test_result <- t.test(FEE ~ BIG8, data = data)
t_test_result
## 
##  Welch Two Sample t-test
## 
## data:  FEE by BIG8
## t = -6.1868, df = 14.142, p-value = 2.262e-05
## alternative hypothesis: true difference in means between group NO and group YES is not equal to 0
## 95 percent confidence interval:
##  -94.16286 -45.71649
## sample estimates:
##  mean in group NO mean in group YES 
##          18.71417          88.65385

Box plot menunjukkan perbedaan distribusi nilai FEE antara kelompok BIG8 (YES) dan non-BIG8 (NO). Terlihat ada perbedaan yang jelas dalam posisi median dan lebar box, yang menunjukkan adanya perbedaan distribusi antara kedua kelompok tersebut. Dari hasil uji t-test, diperoleh nilai p-value = 2.262e-05, yang lebih kecil dari 0.05, sehingga dapat disimpulkan bahwa perbedaan distribusi FEE antara kelompok BIG8 dan non-BIG8 adalah signifikan secara statistik.

3. Histogram untuk Variabel POP

Buat histogram untuk variabel POP. Bagaimana distribusi populasi di seluruh sampel? Apakah distribusi ini normal atau miring?

# 3. Histogram untuk Variabel POP
library(dplyr)
library(readxl)


#Data pada soal komstat revaa
data <- read_excel("D:/Kuliah/SEMESTER 3/Komputasi Statistika/Tugas dan Latihan/DATA CASEMETHOD REVAA P910.xlsx")
## New names:
## • `` -> `...4`
hist(data$POP, 
     main = "Histogram untuk Variabel POP", 
     xlab = "POP", 
     col = "lightblue", 
     breaks = 10)

Histogram ini menunjukkan distribusi frekuensi dari populasi (POP). Dari histogram, terlihat bahwa distribusi data lebih terkonsentrasi di bagian kiri, yang mengindikasikan adanya distribusi yang miring ke kanan (positively skewed). Artinya, sebagian besar sampel memiliki populasi yang lebih rendah, dengan beberapa sampel yang memiliki populasi yang jauh lebih tinggi.

4. Bar Chart Rata-rata FEE Berdasarkan Kelompok BIG8

Buat bar chart yang menunjukkan rata-rata FEE untuk kelompok BIG8 (YES) dan non-BIG8 (NO). Dari grafik ini, apakah terlihat ada perbedaan rata-rata FEE antara kedua kelompok?

# 4. Bar Chart Rata-rata FEE Berdasarkan Kelompok BIG8
library(dplyr)
library(readxl)


#Data pada soal komstat revaa
data <- read_excel("D:/Kuliah/SEMESTER 3/Komputasi Statistika/Tugas dan Latihan/DATA CASEMETHOD REVAA P910.xlsx")
## New names:
## • `` -> `...4`
avg_fee <- data %>%
  group_by(BIG8) %>%
  summarise(mean_FEE = mean(FEE, na.rm = TRUE))

# Bar Chart rata-rata FEE berdasarkan kelompok BIG8
barplot(avg_fee$mean_FEE, 
        names.arg = avg_fee$BIG8, 
        main = "Bar Chart Rata-rata FEE Berdasarkan Kelompok BIG8", 
        xlab = "BIG8", ylab = "Rata-rata FEE", 
        col = c("orange", "green"))

Bar chart ini menunjukkan perbandingan rata-rata biaya (FEE) untuk kelompok BIG8 (YES) dan non-BIG8 (NO). Dari grafik, dapat dilihat bahwa kelompok BIG8 (YES) memiliki rata-rata biaya (FEE) yang lebih tinggi dibandingkan dengan kelompok non-BIG8 (NO). Hal ini menunjukkan bahwa kelompok BIG8 cenderung memiliki biaya yang lebih besar daripada kelompok non-BIG8.