Introducción

La Copa Mundial de la FIFA es el torneo de fútbol más importante a nivel internacional y se celebra cada cuatro años, reuniendo a las mejores selecciones nacionales del mundo. La edición de 2026 marcará un hito en la historia de la competición al ser la primera organizada conjuntamente por tres países: Estados Unidos, México y Canadá. Además, será el primer Mundial con un formato ampliado de 48 selecciones participantes, lo que incrementará la representación de todas las confederaciones y dará lugar al torneo más grande disputado hasta la fecha.

El presente trabajo tiene como objetivo explorar y visualizar la evolución competitiva de las 48 selecciones participantes en la Copa Mundial de la FIFA 2026 a partir de sus valores históricos de rating. Mediante técnicas de visualización de datos se analizarán tendencias temporales, cambios en el desempeño de las selecciones, diferencias entre confederaciones y la consolidación de potencias futbolísticas a lo largo del tiempo. Estas representaciones gráficas permitirán identificar patrones relevantes y ofrecer una perspectiva más clara sobre el estado competitivo de los equipos que disputarán el torneo.

Pregunta de Investigación

¿Cómo ha evolucionado el nivel competitivo de las confederaciones representadas en el Mundial 2026 según las calificaciones Elo históricas de sus selecciones?

¿Qué tan equilibradas son las selecciones en su estructura interna operativa de ataque y defensa? (Análisis micro-dimensional de balance competitivo).

Conjunto de Datos

El conjunto de datos “2026 FIFA World Cup — Historical Elo Ratings” recopila la evolución histórica de las calificaciones Elo de las selecciones nacionales clasificadas para la Copa Mundial de la FIFA 2026 desde 1901 hasta el 2026. El sistema Elo es un método de valoración originalmente desarrollado para el ajedrez y posteriormente adaptado al fútbol para medir la fortaleza relativa de los equipos a partir de sus resultados en partidos internacionales. A diferencia de los rankings tradicionales, las calificaciones Elo consideran factores como la calidad del rival, la importancia del encuentro y el margen de victoria, proporcionando una medida más robusta del nivel competitivo de cada selección.

El conjunto de datos esta disponible en https://www.kaggle.com/datasets/afonsofernandescruz/2026-fifa-world-cup-historical-elo-ratings/data

str( datos_raw) 
## 'data.frame':    4683 obs. of  23 variables:
##  $ year           : int  1901 1901 1902 1902 1902 1902 1902 1903 1903 1903 ...
##  $ snapshot_date  : chr  "1901-12-31" "1901-12-31" "1902-12-31" "1902-12-31" ...
##  $ country        : chr  "England" "Scotland" "Argentina" "England" ...
##  $ rank           : int  1 2 1 2 3 4 6 1 2 3 ...
##  $ country_code   : chr  "EN" "SQ" "AR" "EN" ...
##  $ rating         : int  2013 1973 2021 1995 1983 1914 1879 2005 1968 1956 ...
##  $ rank_max       : int  1 1 1 1 1 4 4 1 1 1 ...
##  $ rating_max     : int  2079 2104 2021 2079 2104 1914 1879 2021 2079 2104 ...
##  $ rank_avg       : int  2 1 1 2 1 4 5 1 2 2 ...
##  $ rating_avg     : int  1989 2018 2021 1989 2017 1914 1879 2018 1989 2015 ...
##  $ rank_min       : int  2 2 1 2 3 4 6 1 2 3 ...
##  $ rating_min     : int  1889 1926 2021 1889 1926 1914 1879 2005 1889 1926 ...
##  $ matches_total  : int  73 74 1 77 79 1 1 2 80 82 ...
##  $ matches_home   : int  38 37 0 39 39 1 1 1 42 40 ...
##  $ matches_away   : int  35 37 1 38 40 0 0 1 38 42 ...
##  $ matches_neutral: int  0 0 0 0 0 0 0 0 0 0 ...
##  $ wins           : int  46 53 1 47 56 1 0 1 49 58 ...
##  $ losses         : int  16 9 0 16 9 0 1 1 17 10 ...
##  $ draws          : int  11 12 0 14 14 0 0 0 14 14 ...
##  $ goals_for      : int  262 277 6 266 293 5 0 8 273 296 ...
##  $ goals_against  : int  102 101 0 105 106 0 6 3 108 109 ...
##  $ confederation  : chr  "UEFA" "UEFA" "CONMEBOL" "UEFA" ...
##  $ is_host        : int  0 0 0 0 0 0 0 0 0 0 ...

DIAGNÓSTICO Y LIMPIEZA DE DATOS

Siguiendo las mejores prácticas del reporte de desigualdad global, antes de extraer conclusiones estratégicas se implementa una auditoría integral de la calidad de la información para mitigar sesgos por duplicidad o valores perdidos.

## [1] "Valores nulos identificados por variable:"
##            year   snapshot_date         country            rank    country_code 
##               0               0               0               0               0 
##          rating        rank_max      rating_max        rank_avg      rating_avg 
##               0               0               0               0               0 
##        rank_min      rating_min   matches_total    matches_home    matches_away 
##               0               0               0               0               0 
## matches_neutral            wins          losses           draws       goals_for 
##               0               0               0               0               0 
##   goals_against   confederation         is_host 
##               0               0               0
## [1] "Registros únicos contemporáneos (2026): 48"

CLASIFICACIÓN DE LAS VARIABLES

Para estructurar los métodos estadísticos correspondientes, clasificamos rigurosamente cada componente del set de datos bajo una taxonomía formal de tipos de variables:

Variables Categóricas (Factores): Elementos cualitativos utilizados como dimensiones de agrupación y desagregación macro.

Nominales: country, country_code, confederation.

Binarias: is_host (Indicador lógico de país anfitrión (s/N)).

Variables Numéricas (Métricas Cuantitativas): Atributos continuos y discretos que describen rendimiento, historia y capacidad acumulada.

Discretas: rank, rank_max, rank_avg, rank_min, matches_total, matches_home, matches_away, matches_neutral, wins, losses, draws.

Continuas/Escala: rating, rating_max, rating_avg, rating_min, goals_for, goals_against.

Series de Tiempo (Estructuras Temporales): Indicadores de evolución cronológica.

Fechas: snapshot_date, year.

ANÁLISIS ESTADÍSTICO DESCRIPTIVO

Analizamos el comportamiento individual de las variables de interés fundamentales para comprender la dispersión y centralidad de la fuerza competitiva global.

##      rating          rank       matches_total      goals_for     
##  Min.   :1425   Min.   : 1.00   Min.   : 251.0   Min.   : 267.0  
##  1st Qu.:1671   1st Qu.:12.75   1st Qu.: 596.2   1st Qu.: 869.8  
##  Median :1775   Median :27.50   Median : 767.0   Median :1234.0  
##  Mean   :1782   Mean   :34.69   Mean   : 748.0   Mean   :1273.6  
##  3rd Qu.:1906   3rd Qu.:52.50   3rd Qu.: 883.8   3rd Qu.:1593.0  
##  Max.   :2165   Max.   :95.00   Max.   :1160.0   Max.   :2719.0  
##  goals_against   
##  Min.   : 278.0  
##  1st Qu.: 696.5  
##  Median : 865.5  
##  Mean   : 888.1  
##  3rd Qu.:1101.5  
##  Max.   :1482.0
Métricas de Tendencia Central y Dispersión del Rating Global (2026)
Media Mediana Desviacion_Estandar Minimo Maximo Rango_Intercuartil
1782.146 1775 176.2493 1425 2165 235.25

Análisis descriptivo

Inicialmente vamos a ver de donde proceden las selecciones participantes del mundial 2026

La mayor parte de las selecciones partipantes vienen de UEFA (Europa), seguido por la selecciones de la confederación asiativa y de sur america. Inicialmente vemos que la cantidad de cupos no son iguales y depende inicialmente de la cantidad de selecciones inscritas para cada confederación. Es importante ver que de oceania solo se otroga un cupo ya que es la confederación más pequeña de las inscritas ante FIFA.

Inicialmente vamos a ver como se comporta los rating (Calificaciones de los equipos) para cada confederación

Aqui podemos ver inicialmente que las confederaciones que más sobresalen son las de Conmeboly Uefa. Los datos demuestran una marcada disparidad asimétrica inter-confederacional:

UEFA (Europa) y CONMEBOL (Sudamérica) exhiben medianas y medias sustancialmente elevadas con respecto al resto del mundo, consolidándose como los polos hegemónicos del poder competitivo.

CAF (África), CONCACAF (Norte/Centroamérica) y AFC (Asia) muestran una zona media compacta, pero con una alta dispersión interna (presencia de outliers o selecciones élite que se distancian de su promedio regional).

OFC (Oceanía) presenta un rezago estructural en términos de rating promedio absoluto.

Ahora vamos a ver cuales selecciones han tenido mejor rankin en la historia pro cada una de las confederaciones

La evolución histórica de las selecciones participante de esta edición del mundial, nos muestra el poderio de las selecciones afiliadas a UEFA y Conmebol a lo largo de la historia. Se evidencial el crecimiento de las selecciones de la confederación de futbol de Asia, que han ido mejorando a lo largo del tiempo ubicandose en la actualidad en la tercer casilla en importancia después de Uefa y Conmebol.

Se ven cosas interesantes por confederación, inicialmente vemos que UEFA, cuenta con 6 selecciones que a lo largo de la historia han alcanzado el rankin 1. En conmebol 2 selecciones han alcanzado el rankin 1 (Argentina y Brasil). Vemos que el resto de las confederaciones no hay selecciones que han alcanzado el rankin 1. Adicionalmente vemos más marcado la diferencia competitiva de la selección de nueva Zelanda, que el máximo rankin alcanzado fue el 30 en la historia, lo que marca que es la confederación más debil de las inscritas ante FIFA.

A continuación comenzamos a analizar todas las selecciones de forma general

Se observa que las selecciones con el mayor rating promedio son Argentina y Brasil y que en los primeros puestos no se observan selecciones diferentes a Conmebol o UEFA, solo alcanza a entrar Mexico, lo que evidencia que las selecciones de las demás confederaciones participantes en el mundial son más debiles en comparación con la de estas confederaciones.

Ahora, analizando las selecciones que han alcanzado el ranking número 1 a lo largo del histórico, se ve que solo las selecciones de Uefa y Conmebol han alcanzo este rank, y se ve un dominio marcado de las selecciones de Brasil y Argentina, y un mayor número de selecciones de Uefa, lo que indica que el poderio del fútbol en sur america solo esta concentrada en 2 selecciones, mientras que históricamente Europa ha tenido mas representantes en los primeros lugares del rank.

Evaluando la tasa de victorias con el puntaje del rating, se observa que las mejores selecciones son Brasil y Argentina por parte de conmebol y por parte de UEfA España e Inglaterra. Adicional se ve que los puntos mejor ubicados siguen siendo de las selecciones de estas confederaciones.

El mapa cartesiano revela la taxonomía de balance de los equipos:

  1. Cuadrante Superior Derecho (Alta Eficiencia Bidimensional): Alberga a las potencias mundiales equilibradas. Estas selecciones logran optimizar simultáneamente su producción ofensiva y su solidez defensiva (alto rating Elo).

  2. Línea Diagonal Equivalente (\(X = Y\)): Los equipos situados sobre o muy cerca de la diagonal imaginaria que cruza desde el cuadrante inferior izquierdo al superior derecho reflejan un equilibrio simétrico perfecto en su propuesta de juego (su nivel ofensivo es directamente proporcional a su nivel defensivo).

  3. Zonas de Asimetría Estilística: Los equipos alejados de la diagonal muestran desbalances tácticos estructurales:

CONCLUSIONES

De acuerdo al analisis realizado se evidencia lo siguiente

  1. De los participantes del mundial 2026, históricamente se ve un dominio en el ranking de las selecciones Uefa y Conmebol.

  2. Solo selecciones de Uefa y Conmebol han alcanzado el rankin número 1. Se ve un dominio histórico de Brasil y Argentina

  3. Se ve un crecimiento histórico de la confederación asiática de fútbol a lo largo de los años y ahora se equipara a confederaciones de Africa y Concacaf.

  4. La confederación de Oceania es la más debil de todas las confederaciones, y se evidencia que su unico participante (Nueva Zelanda), alcanzo su mejor rank en el número 30, lo que evidencia una brecha de competitividad con las demás confederaciones.