Objetivo

Column

Propósito del análisis.

Objetivo General:

Realizar un análisis cuantitativo de “Big Data” para determinar cuáles han sido los nombres más dominantes en la historia de los Estados Unidos, sin distinción de género, basándonos en el volumen total de registros desde 1880.

Enfoque:

Este algoritmo nos ayuda con los siguientes procesos de la información:

  1. Suma la totalidad de nacimientos por nombre.
  2. Ordena (Ranking) los resultados de mayor a menor.
  3. Selecciona automáticamente los 20 primeros.

Justificación Técnica: Este enfoque permite eliminar el sesgo de selección manual y deja que “los datos hablen por sí mismos”, revelando qué nombres han tenido una permanencia y popularidad real a largo plazo (como James o John) frente a modas pasajeras.

Elaborado por: Luis Andres Coronel Pineda

Introducción

Column

Contexto y Muestra del Estudio

Dimensión de los Datos (Big Data):

Para garantizar la validez estadística de este proyecto, se ha procesado la totalidad del dataset babynames de la Administración de la Seguridad Social de EE.UU.

  • Volumen de la Muestra: El análisis abarca un total de 1,924,665 registros únicos.
  • Población Total: Estos registros representan la suma de 348,120,517 nacimientos contabilizados.
  • Rango Temporal: La serie de tiempo cubre 137 años de historia, desde 1880 hasta 2017.

Variables del Estudio:

  1. Tiempo (Year): Variable independiente continua.
  2. Frecuencia (n): Variable dependiente (cantidad de bebés).
  3. Categoría (Name/Sex): Variables cualitativas nominales.

“Al trabajar con una muestra de casi 2 millones de registros, podemos asegurar que las tendencias observadas en el Top 20 no son casualidad, sino patrones sociológicos definidos.”

Datos

Column

Tabla 1: Muestra de la Base de Datos (Primeros 2,000 registros por optimización)

Tabla 2: Ranking Top 20 Histórico

Análisis (Top 10)

Column

Tendencias de los Gigantes (Top 10)

Conclusiones

Column

Hallazgos del Ranking Global

1. Dominancia Masculina y Estabilidad

Los nombres masculinos (James, John, Robert) dominan el ranking acumulado. Esto se debe a que, históricamente, había menos variedad en nombres de niños, concentrando millones de nacimientos en pocas opciones bíblicas o tradicionales, mientras que los nombres femeninos variaban más por moda.

2. El Impacto del “Baby Boom” (Sesgo Demográfico)

Al analizar las curvas, notamos picos masivos entre 1946 y 1964. Nombres como Michael o David acumularon gran parte de su volumen total en este periodo. Esto demuestra que la popularidad de un nombre en el ranking histórico depende fuertemente de la tasa de natalidad del país en ese momento.

3. La Fragmentación del Mercado (Tendencia Actual)

Si observamos el final de la gráfica (años 2000+), las líneas de estos “gigantes” caen drásticamente.

  • Conclusión Sociológica: Hoy existe una “fragmentación del mercado”. Los padres modernos valoran la singularidad, lo que provoca que ya no existan nombres con el dominio absoluto que tuvieron “Mary” o “John” hace un siglo. La curva de distribución se ha aplanado.

Resumen: El Top 20 histórico es un reflejo de una era pasada de tradición y alta concentración cultural, contrastando con la diversidad y dispersión de la era moderna.