Nama NIM
Ezra Farandi Zein 3337250002
Daffa Adillah Putra 3337250100
Muhammad Radja Ilyasa 3337250102
Yudhistira Ari Wicaksono 3337250025
Barliano Gigari Setiawan 3337250057

1 Pendahuluan

Pendidikan tinggi memiliki peran penting dalam pengembangan ilmu pengetahuan, teknologi, dan inovasi. Banyak lembaga melakukan pemeringkatan universitas untuk membantu mahasiswa memilih institusi terbaik. Salah satu lembaga yang terkenal adalah QS Quacquarelli Symonds yang setiap tahun merilis QS World University Rankings.

Pemeringkatan ini didasarkan pada beberapa indikator seperti reputasi akademik, reputasi pemberi kerja, rasio dosen dan mahasiswa, sitasi penelitian, serta tingkat internasionalisasi.

Tujuan analisis ini adalah untuk melihat gambaran statistik dari data universitas dunia tahun 2025 menggunakan metode statistik deskriptif.

Sumber data: https://www.topuniversities.com/university-rankings


2 Metodologi

2.1 Sumber Data

Data yang digunakan berasal dari dataset QS World University Rankings 2025 yang berisi lebih dari 1500 universitas dari berbagai negara.

2.2 Variabel yang Dianalisis

Beberapa variabel yang dianalisis dalam penelitian ini adalah:

  • Rank 2025
  • Institution Name
  • Location
  • Academic Reputation Score
  • Employer Reputation Score
  • Faculty Student Score
  • Citations per Faculty Score
  • International Faculty Score
  • International Students Score
  • Overall Score

2.3 Jenis Data

Dataset QS World University Rankings 2025 terdiri dari dua jenis data, yaitu data kategorik dan data numerik.

2.3.1 Data Kategorik

Data kategorik adalah data yang berisi label atau kategori, bukan angka. Berikut variabel kategorik dalam dataset ini:

Kolom Contoh Isi
Institution_Name MIT, Harvard University, dst
Location United States, United Kingdom, dst
Region Americas, Europe, Asia, Oceania
SIZE S (Small), M (Medium), L (Large), XL (Extra Large)
FOCUS CO (Comprehensive), FC (Focused), FO (Full Comprehensive), SP (Specialist)
RES. VH (Very High), HI (High), MD (Medium), LO (Low)
STATUS A (Public), B (Private)

2.3.2 Data Numerik

Data numerik adalah data yang berisi angka dan dapat dilakukan operasi matematika. Berikut variabel numerik dalam dataset ini:

Kolom Keterangan
RANK_2025 Peringkat universitas tahun 2025
RANK_2024 Peringkat universitas tahun 2024
Academic_Reputation_Score Skor reputasi akademik (0–100)
Employer_Reputation_Score Skor reputasi pemberi kerja (0–100)
Faculty_Student_Score Skor rasio dosen & mahasiswa (0–100)
Citations_per_Faculty_Score Skor sitasi per dosen (0–100)
International_Faculty_Score Skor dosen internasional (0–100)
International_Students_Score Skor mahasiswa internasional (0–100)
International_Research_Network_Score Skor jaringan riset internasional (0–100)
Employment_Outcomes_Score Skor hasil kerja lulusan (0–100)
Sustainability_Score Skor keberlanjutan (0–100)
Overall_Score Skor keseluruhan (0–100)

Dalam analisis ini, data numerik digunakan untuk menghitung statistik deskriptif dan visualisasi histogram, density plot, serta box plot. Sedangkan data kategorik (khususnya Region) digunakan untuk visualisasi pie chart dan pengelompokan pada box plot.

2.4 Metode Analisis

Metode analisis yang digunakan adalah statistik deskriptif, yaitu:

  • Rata-rata (mean)
  • Median
  • Modus
  • Standar deviasi & variansi
  • Kuartil (Q1 & Q3) dan Range
  • Visualisasi data (pie chart, bar chart, histogram, density plot, box plot)

3 Hasil dan Pembahasan

3.1 Persiapan Data

library(ggplot2)
library(dplyr)
library(scales)
library(tidyr)
# Import dataset
df_raw <- read.csv("QS_World_University_Rankings_2025__Top_global_universities_.csv",
                   stringsAsFactors = FALSE,
                   fileEncoding = "latin1")

# Ambil 50 data teratas
df <- df_raw[1:50, ]

# Konversi kolom numerik
df$Overall_Score               <- as.numeric(df$Overall_Score)
df$Academic_Reputation_Score   <- as.numeric(df$Academic_Reputation_Score)
df$Employer_Reputation_Score   <- as.numeric(df$Employer_Reputation_Score)
df$Citations_per_Faculty_Score <- as.numeric(df$Citations_per_Faculty_Score)

cat("Jumlah data  :", nrow(df), "universitas\n")
## Jumlah data  : 50 universitas
cat("Jumlah kolom :", ncol(df), "variabel\n")
## Jumlah kolom : 28 variabel

3.2 Universitas Peringkat Teratas

Berdasarkan data QS 2025, beberapa universitas dengan peringkat teratas adalah:

  1. Massachusetts Institute of Technology (MIT)
  2. Imperial College London
  3. University of Oxford
  4. Harvard University
  5. University of Cambridge

Universitas tersebut memiliki skor keseluruhan yang sangat tinggi karena memiliki reputasi akademik kuat, penelitian berkualitas, serta jaringan internasional yang luas.

# Palet warna
palette_main <- c("#2E86AB", "#A23B72", "#F18F01", "#C73E1D",
                  "#3B1F2B", "#44BBA4", "#E94F37", "#393E41")

# Top 20 universitas
top20 <- df %>%
  arrange(desc(Overall_Score)) %>%
  slice(1:20) %>%
  mutate(Institution_Name = factor(Institution_Name,
                                   levels = rev(Institution_Name)))

ggplot(top20, aes(x = Institution_Name, y = Overall_Score, fill = Overall_Score)) +
  geom_bar(stat = "identity", color = "white", linewidth = 0.3) +
  geom_text(aes(label = round(Overall_Score, 1)),
            hjust = -0.15, size = 3, fontface = "bold") +
  coord_flip() +
  scale_fill_gradient(low = "#74b9ff", high = "#0984e3") +
  scale_y_continuous(limits = c(0, 110), expand = c(0, 0)) +
  labs(title    = "Top 20 Universitas - Overall Score (QS 2025)",
       subtitle = "Peringkat berdasarkan skor keseluruhan",
       x = NULL, y = "Overall Score") +
  theme_minimal(base_size = 11) +
  theme(plot.title         = element_text(face = "bold", size = 13),
        panel.grid.major.y = element_blank(),
        legend.position    = "none")

3.3 Distribusi Universitas Berdasarkan Wilayah

Data menunjukkan bahwa universitas yang masuk dalam peringkat QS berasal dari berbagai wilayah seperti Amerika Utara, Eropa, Asia, dan Oceania. Wilayah Eropa dan Amerika masih mendominasi peringkat universitas terbaik dunia.

region_count <- df %>%
  count(Region) %>%
  mutate(pct   = n / sum(n),
         label = paste0(Region, "\n", n, " (", percent(pct, accuracy = 1), ")"))

ggplot(region_count, aes(x = "", y = n, fill = Region)) +
  geom_col(width = 1, color = "white", linewidth = 0.8) +
  coord_polar(theta = "y") +
  geom_text(aes(label = label),
            position = position_stack(vjust = 0.5),
            size = 3.5, fontface = "bold", color = "white") +
  scale_fill_manual(values = palette_main) +
  labs(title    = "Distribusi Top 50 Universitas Dunia (QS 2025)",
       subtitle = "Berdasarkan Wilayah/Region",
       fill = "Region") +
  theme_void() +
  theme(plot.title    = element_text(hjust = 0.5, size = 14, face = "bold"),
        plot.subtitle = element_text(hjust = 0.5, size = 11, color = "grey40"),
        legend.position = "right")

3.4 Analisis Skor Akademik

Skor Academic Reputation menjadi salah satu indikator paling penting dalam pemeringkatan universitas. Universitas dengan reputasi akademik tinggi biasanya memiliki penelitian berkualitas, publikasi ilmiah yang banyak, serta pengaruh besar dalam dunia akademik.

3.4.1 Statistik Deskriptif

# Fungsi modus
get_mode <- function(x) {
  x  <- na.omit(x)
  ux <- unique(round(x, 1))
  ux[which.max(tabulate(match(round(x, 1), ux)))]
}

score <- df$Overall_Score

mean_val   <- mean(score, na.rm = TRUE)
median_val <- median(score, na.rm = TRUE)
mode_val   <- get_mode(score)
sd_val     <- sd(score, na.rm = TRUE)
var_val    <- var(score, na.rm = TRUE)
q1_val     <- quantile(score, 0.25, na.rm = TRUE)
q3_val     <- quantile(score, 0.75, na.rm = TRUE)
range_val  <- diff(range(score, na.rm = TRUE))

# Tampilkan sebagai tabel
hasil_statistik <- data.frame(
  Ukuran  = c("Mean (Rata-rata)", "Median", "Modus",
              "Standar Deviasi", "Variansi",
              "Q1 (Kuartil 1)", "Q3 (Kuartil 3)", "Range"),
  Nilai   = round(c(mean_val, median_val, mode_val,
                    sd_val, var_val,
                    q1_val, q3_val, range_val), 4)
)

knitr::kable(hasil_statistik,
             caption = "Statistik Deskriptif Overall Score - Top 50 Universitas (QS 2025)",
             align   = c("l", "r"))
Statistik Deskriptif Overall Score - Top 50 Universitas (QS 2025)
Ukuran Nilai
Mean (Rata-rata) 85.4880
Median 83.8000
Modus 82.1000
Standar Deviasi 6.2859
Variansi 39.5121
Q1 (Kuartil 1) 81.0500
Q3 (Kuartil 3) 88.8000
Range 24.0000

3.4.2 Histogram

ggplot(df, aes(x = Overall_Score)) +
  geom_histogram(bins = 12, fill = "#6c5ce7", color = "white",
                 linewidth = 0.4, alpha = 0.85) +
  geom_vline(xintercept = mean_val,   color = "#e17055",
             linewidth = 1.2, linetype = "dashed") +
  geom_vline(xintercept = median_val, color = "#00b894",
             linewidth = 1.2, linetype = "dotted") +
  annotate("text", x = mean_val + 0.5, y = Inf, vjust = 1.8, hjust = 0,
           label = paste("Mean =", round(mean_val, 2)),
           color = "#e17055", size = 3.5, fontface = "bold") +
  annotate("text", x = median_val - 0.5, y = Inf, vjust = 3.5, hjust = 1,
           label = paste("Median =", round(median_val, 2)),
           color = "#00b894", size = 3.5, fontface = "bold") +
  labs(title    = "Histogram Overall Score - Top 50 Universitas (QS 2025)",
       subtitle = "Distribusi frekuensi skor keseluruhan",
       x = "Overall Score", y = "Frekuensi") +
  theme_minimal(base_size = 12) +
  theme(plot.title = element_text(face = "bold", size = 13))

3.5 Faktor Internasionalisasi

Indikator seperti International Faculty dan International Students menunjukkan seberapa global sebuah universitas. Universitas dengan tingkat internasionalisasi tinggi biasanya lebih menarik bagi mahasiswa dari berbagai negara.

3.5.1 Density Plot

ggplot(df, aes(x = Overall_Score)) +
  geom_density(fill = "#fd79a8", color = "#d63031", alpha = 0.65, linewidth = 1) +
  geom_vline(xintercept = mean_val, color = "#0984e3",
             linewidth = 1.2, linetype = "dashed") +
  geom_vline(xintercept = q1_val,  color = "#6c5ce7",
             linewidth = 1, linetype = "dotdash") +
  geom_vline(xintercept = q3_val,  color = "#6c5ce7",
             linewidth = 1, linetype = "dotdash") +
  annotate("text", x = mean_val + 0.3, y = Inf, vjust = 1.8, hjust = 0,
           label = paste("Mean =", round(mean_val, 2)),
           color = "#0984e3", size = 3.5, fontface = "bold") +
  annotate("text", x = q1_val - 0.3, y = Inf, vjust = 3.5, hjust = 1,
           label = paste("Q1 =", round(q1_val, 2)),
           color = "#6c5ce7", size = 3.2, fontface = "bold") +
  annotate("text", x = q3_val + 0.3, y = Inf, vjust = 3.5, hjust = 0,
           label = paste("Q3 =", round(q3_val, 2)),
           color = "#6c5ce7", size = 3.2, fontface = "bold") +
  labs(title    = "Density Plot Overall Score - Top 50 Universitas (QS 2025)",
       subtitle = "Kurva distribusi probabilitas skor keseluruhan",
       x = "Overall Score", y = "Density") +
  theme_minimal(base_size = 12) +
  theme(plot.title = element_text(face = "bold", size = 13))

3.5.2 Box Plot per Region

ggplot(df, aes(x = reorder(Region, Overall_Score, median),
               y = Overall_Score, fill = Region)) +
  geom_boxplot(outlier.shape = 21, outlier.fill  = "white",
               outlier.color = "grey40", outlier.size = 2,
               alpha = 0.8, linewidth = 0.6) +
  geom_jitter(width = 0.15, alpha = 0.55, size = 2, color = "grey30") +
  scale_fill_manual(values = palette_main) +
  coord_flip() +
  labs(title    = "Box Plot Overall Score per Region - Top 50 (QS 2025)",
       subtitle = "Persebaran skor keseluruhan per wilayah",
       x = NULL, y = "Overall Score") +
  theme_minimal(base_size = 12) +
  theme(plot.title         = element_text(face = "bold", size = 13),
        legend.position    = "none",
        panel.grid.major.y = element_blank())


4 Kesimpulan

Berdasarkan analisis data QS World University Rankings 2025, dapat disimpulkan bahwa:

  1. Universitas di Amerika dan Eropa masih mendominasi peringkat teratas dunia.
  2. Reputasi akademik dan kualitas penelitian menjadi faktor utama dalam penilaian universitas.
  3. Internasionalisasi juga menjadi indikator penting dalam meningkatkan reputasi universitas.
  4. Data pemeringkatan ini dapat menjadi referensi bagi mahasiswa dalam memilih universitas untuk melanjutkan pendidikan.