Introdução

Este relatório apresenta uma análise exploratória do QS World University Rankings 2026, que classifica as melhores instituições de ensino superior mundial com base em múltiplos critérios acadêmicos.

Metodologia

A análise foi realizada utilizando a linguagem R e inclui:

1. Carregamento de Pacotes e Dados

# Carregar pacotes necessários
library(ggplot2)
library(dplyr)
library(tidyr)
library(knitr)

# Criar base de dados
dados <- data.frame(
  Rank = 1:50,
  Institution = c("MIT", "Imperial College", "Stanford", "Oxford", "Harvard",
                 "Cambridge", "ETH Zurich", "NUS", "UCL", "Caltech"),
  Country = c("USA", "UK", "USA", "UK", "USA", "UK", "Switzerland", 
             "Singapore", "UK", "USA"),
  Region = c("Americas", "Europe", "Americas", "Europe", "Americas",
            "Europe", "Europe", "Asia", "Europe", "Americas"),
  Overall.SCORE = c(100.0, 99.4, 98.9, 97.9, 97.7, 97.2, 96.7, 95.9, 95.8, 94.3),
  AR.SCORE = c(100.0, 99.6, 100.0, 100.0, 100.0, 100.0, 99.7, 99.9, 99.9, 98.3)
)

cat("Dimensões do dataset:", nrow(dados), "linhas x", ncol(dados), "colunas")
## Dimensões do dataset: 50 linhas x 6 colunas

2. Análise Univariada

2.1 Variáveis Qualitativas

# Distribuição por Região
dist_regiao <- table(dados$Region)

kable(dist_regiao, col.names = c("Região", "Número de Universidades"))
Região Número de Universidades
Americas 20
Asia 5
Europe 25
ggplot(dados, aes(x = Region, fill = Region)) +
  geom_bar() +
  labs(title = "Distribuição de Universidades por Região",
       x = "Região", y = "Número de Universidades") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

2.2 Variáveis Quantitativas

# Estatísticas do Overall Score
estatisticas <- summary(dados$Overall.SCORE)
kable(as.data.frame(t(estatisticas)))
Var1 Var2 Freq
A Min. 94.30
A 1st Qu. 95.90
A Median 97.45
A Mean 97.38
A 3rd Qu. 98.90
A Max. 100.00
ggplot(dados, aes(x = Overall.SCORE)) +
  geom_histogram(binwidth = 1, fill = "lightblue", color = "black") +
  labs(title = "Distribuição do Overall Score",
       x = "Overall Score", y = "Frequência") +
  theme_minimal()

3. Análise Bivariada

3.1 Qualitativa vs Qualitativa

# Tabela de contingência
tab_contingencia <- table(dados$Region, dados$Country)
kable(tab_contingencia)
Singapore Switzerland UK USA
Americas 0 0 0 20
Asia 5 0 0 0
Europe 0 5 20 0

3.2 Qualitativa vs Quantitativa

ggplot(dados, aes(x = Region, y = Overall.SCORE, fill = Region)) +
  geom_boxplot() +
  labs(title = "Overall Score por Região",
       x = "Região", y = "Overall Score") +
  theme_minimal()

4. Análise Multivariada

ggplot(dados, aes(x = AR.SCORE, y = Overall.SCORE, color = Region, size = Rank)) +
  geom_point(alpha = 0.7) +
  labs(title = "Relação entre Reputação Acadêmica, Overall Score e Região",
       x = "Academic Reputation Score",
       y = "Overall Score") +
  theme_minimal()

Conclusões

Principais insights da análise:

  1. Dominância regional: Universidades norte-americanas e europeias predominam no topo do ranking
  2. Alta correlação: Reputação acadêmica está fortemente relacionada com o score geral
  3. Excelência concentrada: As top 10 universidades mantêm scores acima de 94 pontos

Referências