Este relatório apresenta uma análise exploratória do QS World University Rankings 2026, que classifica as melhores instituições de ensino superior mundial com base em múltiplos critérios acadêmicos.
A análise foi realizada utilizando a linguagem R e inclui:
# Carregar pacotes necessários
library(ggplot2)
library(dplyr)
library(tidyr)
library(knitr)
# Criar base de dados
dados <- data.frame(
Rank = 1:50,
Institution = c("MIT", "Imperial College", "Stanford", "Oxford", "Harvard",
"Cambridge", "ETH Zurich", "NUS", "UCL", "Caltech"),
Country = c("USA", "UK", "USA", "UK", "USA", "UK", "Switzerland",
"Singapore", "UK", "USA"),
Region = c("Americas", "Europe", "Americas", "Europe", "Americas",
"Europe", "Europe", "Asia", "Europe", "Americas"),
Overall.SCORE = c(100.0, 99.4, 98.9, 97.9, 97.7, 97.2, 96.7, 95.9, 95.8, 94.3),
AR.SCORE = c(100.0, 99.6, 100.0, 100.0, 100.0, 100.0, 99.7, 99.9, 99.9, 98.3)
)
cat("Dimensões do dataset:", nrow(dados), "linhas x", ncol(dados), "colunas")
## Dimensões do dataset: 50 linhas x 6 colunas
# Distribuição por Região
dist_regiao <- table(dados$Region)
kable(dist_regiao, col.names = c("Região", "Número de Universidades"))
| Região | Número de Universidades |
|---|---|
| Americas | 20 |
| Asia | 5 |
| Europe | 25 |
ggplot(dados, aes(x = Region, fill = Region)) +
geom_bar() +
labs(title = "Distribuição de Universidades por Região",
x = "Região", y = "Número de Universidades") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
# Estatísticas do Overall Score
estatisticas <- summary(dados$Overall.SCORE)
kable(as.data.frame(t(estatisticas)))
| Var1 | Var2 | Freq |
|---|---|---|
| A | Min. | 94.30 |
| A | 1st Qu. | 95.90 |
| A | Median | 97.45 |
| A | Mean | 97.38 |
| A | 3rd Qu. | 98.90 |
| A | Max. | 100.00 |
ggplot(dados, aes(x = Overall.SCORE)) +
geom_histogram(binwidth = 1, fill = "lightblue", color = "black") +
labs(title = "Distribuição do Overall Score",
x = "Overall Score", y = "Frequência") +
theme_minimal()
# Tabela de contingência
tab_contingencia <- table(dados$Region, dados$Country)
kable(tab_contingencia)
| Singapore | Switzerland | UK | USA | |
|---|---|---|---|---|
| Americas | 0 | 0 | 0 | 20 |
| Asia | 5 | 0 | 0 | 0 |
| Europe | 0 | 5 | 20 | 0 |
ggplot(dados, aes(x = Region, y = Overall.SCORE, fill = Region)) +
geom_boxplot() +
labs(title = "Overall Score por Região",
x = "Região", y = "Overall Score") +
theme_minimal()
ggplot(dados, aes(x = AR.SCORE, y = Overall.SCORE, color = Region, size = Rank)) +
geom_point(alpha = 0.7) +
labs(title = "Relação entre Reputação Acadêmica, Overall Score e Região",
x = "Academic Reputation Score",
y = "Overall Score") +
theme_minimal()
Principais insights da análise: