| Nama | NIM |
|---|---|
| Ezra Farandi Zein | 3337250002 |
| Daffa Adillah Putra | 3337250100 |
| Muhammad Radja Ilyasa | 3337250102 |
| Yudhistira Ari Wicaksono | 3337250025 |
| Barliano Gigari Setiawan | 3337250057 |
Pendidikan tinggi memiliki peran penting dalam pengembangan ilmu pengetahuan, teknologi, dan inovasi. Banyak lembaga melakukan pemeringkatan universitas untuk membantu mahasiswa memilih institusi terbaik. Salah satu lembaga yang terkenal adalah QS Quacquarelli Symonds yang setiap tahun merilis QS World University Rankings.
Pemeringkatan ini didasarkan pada beberapa indikator seperti reputasi akademik, reputasi pemberi kerja, rasio dosen dan mahasiswa, sitasi penelitian, serta tingkat internasionalisasi.
Tujuan analisis ini adalah untuk melihat gambaran statistik dari data universitas dunia tahun 2025 menggunakan metode statistik deskriptif.
Sumber data: https://www.topuniversities.com/university-rankings
Data yang digunakan berasal dari dataset QS World University Rankings 2025 yang berisi lebih dari 1500 universitas dari berbagai negara.
Beberapa variabel yang dianalisis dalam penelitian ini adalah:
Dataset QS World University Rankings 2025 terdiri dari dua jenis data, yaitu data kategorik dan data numerik.
Data kategorik adalah data yang berisi label atau kategori, bukan angka. Berikut variabel kategorik dalam dataset ini:
| Kolom | Contoh Isi |
|---|---|
Institution_Name |
MIT, Harvard University, dst |
Location |
United States, United Kingdom, dst |
Region |
Americas, Europe, Asia, Oceania |
SIZE |
S (Small), M (Medium), L (Large), XL (Extra Large) |
FOCUS |
CO (Comprehensive), FC (Focused), FO (Full Comprehensive), SP (Specialist) |
RES. |
VH (Very High), HI (High), MD (Medium), LO (Low) |
STATUS |
A (Public), B (Private) |
Data numerik adalah data yang berisi angka dan dapat dilakukan operasi matematika. Berikut variabel numerik dalam dataset ini:
| Kolom | Keterangan |
|---|---|
RANK_2025 |
Peringkat universitas tahun 2025 |
RANK_2024 |
Peringkat universitas tahun 2024 |
Academic_Reputation_Score |
Skor reputasi akademik (0–100) |
Employer_Reputation_Score |
Skor reputasi pemberi kerja (0–100) |
Faculty_Student_Score |
Skor rasio dosen & mahasiswa (0–100) |
Citations_per_Faculty_Score |
Skor sitasi per dosen (0–100) |
International_Faculty_Score |
Skor dosen internasional (0–100) |
International_Students_Score |
Skor mahasiswa internasional (0–100) |
International_Research_Network_Score |
Skor jaringan riset internasional (0–100) |
Employment_Outcomes_Score |
Skor hasil kerja lulusan (0–100) |
Sustainability_Score |
Skor keberlanjutan (0–100) |
Overall_Score |
Skor keseluruhan (0–100) |
Dalam analisis ini, data numerik digunakan untuk
menghitung statistik deskriptif dan visualisasi histogram, density plot,
serta box plot. Sedangkan data kategorik (khususnya
Region) digunakan untuk visualisasi pie chart dan
pengelompokan pada box plot.
Metode analisis yang digunakan adalah statistik deskriptif, yaitu:
# Import dataset
df_raw <- read.csv("QS_World_University_Rankings_2025__Top_global_universities_.csv",
stringsAsFactors = FALSE,
fileEncoding = "latin1")
# Ambil 50 data teratas
df <- df_raw[1:50, ]
# Konversi kolom numerik
df$Overall_Score <- as.numeric(df$Overall_Score)
df$Academic_Reputation_Score <- as.numeric(df$Academic_Reputation_Score)
df$Employer_Reputation_Score <- as.numeric(df$Employer_Reputation_Score)
df$Citations_per_Faculty_Score <- as.numeric(df$Citations_per_Faculty_Score)
cat("Jumlah data :", nrow(df), "universitas\n")## Jumlah data : 50 universitas
## Jumlah kolom : 28 variabel
Berdasarkan data QS 2025, beberapa universitas dengan peringkat teratas adalah:
Universitas tersebut memiliki skor keseluruhan yang sangat tinggi karena memiliki reputasi akademik kuat, penelitian berkualitas, serta jaringan internasional yang luas.
# Palet warna
palette_main <- c("#2E86AB", "#A23B72", "#F18F01", "#C73E1D",
"#3B1F2B", "#44BBA4", "#E94F37", "#393E41")
# Top 20 universitas
top20 <- df %>%
arrange(desc(Overall_Score)) %>%
slice(1:20) %>%
mutate(Institution_Name = factor(Institution_Name,
levels = rev(Institution_Name)))
ggplot(top20, aes(x = Institution_Name, y = Overall_Score, fill = Overall_Score)) +
geom_bar(stat = "identity", color = "white", linewidth = 0.3) +
geom_text(aes(label = round(Overall_Score, 1)),
hjust = -0.15, size = 3, fontface = "bold") +
coord_flip() +
scale_fill_gradient(low = "#74b9ff", high = "#0984e3") +
scale_y_continuous(limits = c(0, 110), expand = c(0, 0)) +
labs(title = "Top 20 Universitas - Overall Score (QS 2025)",
subtitle = "Peringkat berdasarkan skor keseluruhan",
x = NULL, y = "Overall Score") +
theme_minimal(base_size = 11) +
theme(plot.title = element_text(face = "bold", size = 13),
panel.grid.major.y = element_blank(),
legend.position = "none")Data menunjukkan bahwa universitas yang masuk dalam peringkat QS berasal dari berbagai wilayah seperti Amerika Utara, Eropa, Asia, dan Oceania. Wilayah Eropa dan Amerika masih mendominasi peringkat universitas terbaik dunia.
region_count <- df %>%
count(Region) %>%
mutate(pct = n / sum(n),
label = paste0(Region, "\n", n, " (", percent(pct, accuracy = 1), ")"))
ggplot(region_count, aes(x = "", y = n, fill = Region)) +
geom_col(width = 1, color = "white", linewidth = 0.8) +
coord_polar(theta = "y") +
geom_text(aes(label = label),
position = position_stack(vjust = 0.5),
size = 3.5, fontface = "bold", color = "white") +
scale_fill_manual(values = palette_main) +
labs(title = "Distribusi Top 50 Universitas Dunia (QS 2025)",
subtitle = "Berdasarkan Wilayah/Region",
fill = "Region") +
theme_void() +
theme(plot.title = element_text(hjust = 0.5, size = 14, face = "bold"),
plot.subtitle = element_text(hjust = 0.5, size = 11, color = "grey40"),
legend.position = "right")Skor Academic Reputation menjadi salah satu indikator paling penting dalam pemeringkatan universitas. Universitas dengan reputasi akademik tinggi biasanya memiliki penelitian berkualitas, publikasi ilmiah yang banyak, serta pengaruh besar dalam dunia akademik.
# Fungsi modus
get_mode <- function(x) {
x <- na.omit(x)
ux <- unique(round(x, 1))
ux[which.max(tabulate(match(round(x, 1), ux)))]
}
score <- df$Overall_Score
mean_val <- mean(score, na.rm = TRUE)
median_val <- median(score, na.rm = TRUE)
mode_val <- get_mode(score)
sd_val <- sd(score, na.rm = TRUE)
var_val <- var(score, na.rm = TRUE)
q1_val <- quantile(score, 0.25, na.rm = TRUE)
q3_val <- quantile(score, 0.75, na.rm = TRUE)
range_val <- diff(range(score, na.rm = TRUE))
# Tampilkan sebagai tabel
hasil_statistik <- data.frame(
Ukuran = c("Mean (Rata-rata)", "Median", "Modus",
"Standar Deviasi", "Variansi",
"Q1 (Kuartil 1)", "Q3 (Kuartil 3)", "Range"),
Nilai = round(c(mean_val, median_val, mode_val,
sd_val, var_val,
q1_val, q3_val, range_val), 4)
)
knitr::kable(hasil_statistik,
caption = "Statistik Deskriptif Overall Score - Top 50 Universitas (QS 2025)",
align = c("l", "r"))| Ukuran | Nilai |
|---|---|
| Mean (Rata-rata) | 85.4880 |
| Median | 83.8000 |
| Modus | 82.1000 |
| Standar Deviasi | 6.2859 |
| Variansi | 39.5121 |
| Q1 (Kuartil 1) | 81.0500 |
| Q3 (Kuartil 3) | 88.8000 |
| Range | 24.0000 |
ggplot(df, aes(x = Overall_Score)) +
geom_histogram(bins = 12, fill = "#6c5ce7", color = "white",
linewidth = 0.4, alpha = 0.85) +
geom_vline(xintercept = mean_val, color = "#e17055",
linewidth = 1.2, linetype = "dashed") +
geom_vline(xintercept = median_val, color = "#00b894",
linewidth = 1.2, linetype = "dotted") +
annotate("text", x = mean_val + 0.5, y = Inf, vjust = 1.8, hjust = 0,
label = paste("Mean =", round(mean_val, 2)),
color = "#e17055", size = 3.5, fontface = "bold") +
annotate("text", x = median_val - 0.5, y = Inf, vjust = 3.5, hjust = 1,
label = paste("Median =", round(median_val, 2)),
color = "#00b894", size = 3.5, fontface = "bold") +
labs(title = "Histogram Overall Score - Top 50 Universitas (QS 2025)",
subtitle = "Distribusi frekuensi skor keseluruhan",
x = "Overall Score", y = "Frekuensi") +
theme_minimal(base_size = 12) +
theme(plot.title = element_text(face = "bold", size = 13))Indikator seperti International Faculty dan International Students menunjukkan seberapa global sebuah universitas. Universitas dengan tingkat internasionalisasi tinggi biasanya lebih menarik bagi mahasiswa dari berbagai negara.
ggplot(df, aes(x = Overall_Score)) +
geom_density(fill = "#fd79a8", color = "#d63031", alpha = 0.65, linewidth = 1) +
geom_vline(xintercept = mean_val, color = "#0984e3",
linewidth = 1.2, linetype = "dashed") +
geom_vline(xintercept = q1_val, color = "#6c5ce7",
linewidth = 1, linetype = "dotdash") +
geom_vline(xintercept = q3_val, color = "#6c5ce7",
linewidth = 1, linetype = "dotdash") +
annotate("text", x = mean_val + 0.3, y = Inf, vjust = 1.8, hjust = 0,
label = paste("Mean =", round(mean_val, 2)),
color = "#0984e3", size = 3.5, fontface = "bold") +
annotate("text", x = q1_val - 0.3, y = Inf, vjust = 3.5, hjust = 1,
label = paste("Q1 =", round(q1_val, 2)),
color = "#6c5ce7", size = 3.2, fontface = "bold") +
annotate("text", x = q3_val + 0.3, y = Inf, vjust = 3.5, hjust = 0,
label = paste("Q3 =", round(q3_val, 2)),
color = "#6c5ce7", size = 3.2, fontface = "bold") +
labs(title = "Density Plot Overall Score - Top 50 Universitas (QS 2025)",
subtitle = "Kurva distribusi probabilitas skor keseluruhan",
x = "Overall Score", y = "Density") +
theme_minimal(base_size = 12) +
theme(plot.title = element_text(face = "bold", size = 13))ggplot(df, aes(x = reorder(Region, Overall_Score, median),
y = Overall_Score, fill = Region)) +
geom_boxplot(outlier.shape = 21, outlier.fill = "white",
outlier.color = "grey40", outlier.size = 2,
alpha = 0.8, linewidth = 0.6) +
geom_jitter(width = 0.15, alpha = 0.55, size = 2, color = "grey30") +
scale_fill_manual(values = palette_main) +
coord_flip() +
labs(title = "Box Plot Overall Score per Region - Top 50 (QS 2025)",
subtitle = "Persebaran skor keseluruhan per wilayah",
x = NULL, y = "Overall Score") +
theme_minimal(base_size = 12) +
theme(plot.title = element_text(face = "bold", size = 13),
legend.position = "none",
panel.grid.major.y = element_blank())Berdasarkan analisis data QS World University Rankings 2025, dapat disimpulkan bahwa: