Un breve repaso por la historia de los Juegos Olímpicos, conociendo diferencias a través del género

El propósito de este trabajo es conocer algunos datos interesantes sobre la historia de los Juegos Olímpicos, a partir de la base de datos obtenida a través de https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results. La base de datos contiene información de cada evento desde Atenas 1896 hasta Río de Janeiro 2016. La idea es conocer algunos datos generales, y luego adentrarnos en algunos personajes interesantes que han participado. Espero que les divierta, cualquier consulta no duden en mandarme un mail a

Este trabajo tratará de ir respondiendo algunas preguntas:

¿Cuáles son los países que mayor cantidad de medallas obtuvieron?

¿Cómo ha ido variando la participación de acuerdo al género?

¿Cuáles son los países que más atletas mujeres aportaron a lo largo de la historia?

¿Cuáles son las mujeres que más medallas ganaron?

¿Hay diferencias en edad, peso y altura entre los atletas hombres y mujeres?

¿Quién es la atleta mujer más joven en ganar el Oro? ¿Y la más longeva?

¡Comenzemos!

Condicionamiento general del dataframe

Lo primero que haremos es condicionar el dataframe. Cada fila es un atleta, y las columnas muestran información variada acerca de la participación de ese atleta, tales como edad, peso, altura, país que representó, en qué edición estuvo, deporte, qué medalla obtuvo (si es que ganó), etc.

Algunas cosas ya sabía, como que existen juegos de verano e invierno, y que por determinado tiempo existió la competición “Arte”. Acá trabajaremos con los juegos de verano y excluiremos la competición artística.

library("tidyverse")
library("viridis")
library("hrbrthemes")
library("fmsb")

#Leemos el dataframe
athlete_events <- read_csv (("C:/Users/Nicolas/Desktop/R/Proyecto JJOO/Dataframes/athlete_events.csv"),
                            col_types = cols(
                              ID = col_character(),
                              Name = col_character(),
                              Sex = col_factor(levels = c("M","F")),
                              Age =  col_integer(),
                              Height = col_double(),
                              Weight = col_double(),
                              Team = col_character(),
                              NOC = col_character(),
                              Games = col_character(),
                              Year = col_integer(),
                              Season = col_factor(levels = c("Summer","Winter")),
                              City = col_character(),
                              Sport = col_character(),
                              Event = col_character(),
                              Medal = col_factor(levels = c("Gold","Silver","Bronze"))))

noc_regions <- read_csv("C:/Users/Nicolas/Desktop/R/Proyecto JJOO/Dataframes/noc_regions.csv")



# Uno dos dataframes: athlete_events y noc_regions

athlete_events <- athlete_events %>%
  inner_join(noc_regions, by = 'NOC')
athlete_events
## # A tibble: 270,767 x 17
##    ID    Name  Sex     Age Height Weight Team  NOC   Games  Year Season City 
##    <chr> <chr> <fct> <int>  <dbl>  <dbl> <chr> <chr> <chr> <int> <fct>  <chr>
##  1 1     A Di~ M        24    180     80 China CHN   1992~  1992 Summer Barc~
##  2 2     A La~ M        23    170     60 China CHN   2012~  2012 Summer Lond~
##  3 3     Gunn~ M        24     NA     NA Denm~ DEN   1920~  1920 Summer Antw~
##  4 4     Edga~ M        34     NA     NA Denm~ DEN   1900~  1900 Summer Paris
##  5 5     Chri~ F        21    185     82 Neth~ NED   1988~  1988 Winter Calg~
##  6 5     Chri~ F        21    185     82 Neth~ NED   1988~  1988 Winter Calg~
##  7 5     Chri~ F        25    185     82 Neth~ NED   1992~  1992 Winter Albe~
##  8 5     Chri~ F        25    185     82 Neth~ NED   1992~  1992 Winter Albe~
##  9 5     Chri~ F        27    185     82 Neth~ NED   1994~  1994 Winter Lill~
## 10 5     Chri~ F        27    185     82 Neth~ NED   1994~  1994 Winter Lill~
## # ... with 270,757 more rows, and 5 more variables: Sport <chr>, Event <chr>,
## #   Medal <fct>, region <chr>, notes <chr>
# Elimino variable notes

athlete_events <- athlete_events %>%
  select (-notes, -Games, -Team) %>%
  rename(Country = region) %>%
  filter(Season == "Summer") %>%
  filter(Sport != "Art Competitions")

Algunos datos generales sobre los Juegos Olímpicos

¿Cuántas medallas obtuvo cada país? ¿Cuáles son los más ganadores?

medallas_pais <- athlete_events %>% filter(!is.na(Medal))%>% 
  group_by(NOC, Medal, Event, Year) %>%
  summarize(isMedal=1)

medallas_pais <- medallas_pais %>%
  group_by(NOC, Year) %>%
  summarise(Medal = sum(isMedal))

medallas_pais <- medallas_pais %>%
  mutate(Year = as.character(Year))

medallas_paises <- medallas_pais %>%
  group_by(NOC) %>%
  summarise(Medal = sum(Medal))

# Veamos un mapa que coloree los países en función de sus medallas obtenidas

library("rnaturalearth")
library("rnaturalearthdata")
library("rgeos")
library("sf")

world <- ne_countries(scale = "medium", returnclass = "sf")
class(world)
## [1] "sf"         "data.frame"
world <- world %>%
  rename(NOC=gu_a3)

world_medallas <- left_join(world, medallas_pais)

ggplot(data = world_medallas) +
    geom_sf(aes(fill = Medal)) +
    scale_fill_viridis_c(option = "plasma", trans = "sqrt") +
    labs(title = "Los países más ganadores en los Juegos Olímpicos",
       subtitle = "Período Atenas 1896 - Río de Janeiro 2016",
       caption = "https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results")

# Gráfico de barras

medallas_paises %>%
  arrange(Medal) %>%
  mutate(name=factor(NOC, levels=NOC)) %>%
  filter(Medal >= 217) %>% #
  ggplot( aes(x=reorder (NOC, Medal), y=Medal)) +
    geom_segment( aes(xend=name, yend=0)) +
    geom_point( size=4, color="orange") +
    coord_flip() +
    theme_bw() +
    xlab("") +
  theme(legend.position="none", panel.spacing = unit(0.1, "lines")) +
        theme_ipsum(axis_text_size =  7.3) +
        theme(panel.grid.major.x = element_blank(), panel.grid.minor.x =           element_blank()) +
  labs(title = "Cantidad de medallas obtenidas por país",
       subtitle = "Top 20 países",
       caption = "https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results")

Por escándalo, Estados Unidos es el país más exitoso en la historia de los Juegos Olímpicos con un total de 2535 medallas. Le siguen la ya inexistente Unión Soviética con 1005 medallas (Capitalismo wins), que viene dando 29 años de ventaja y sigue ahí arriba. En tercer lugar tenemos a Gran Bretaña, con un total de 883 medallas. No tenemos representantes sudamericanos en la tabla TOP 20.

Un dato importante a tener en cuenta es que en este dataframe, la Unión Soviética y Rusia están separados. Vamos a dejarlos separado porque creemos que así reflejarían más fielmente los datos, pero es un criterio arbitrario.

Nivel de participación histórico

Sigamos con más datos descriptivos generales. ¿Cuál fue el nivel de participación a lo largo de la historia?

# Armamos un subdataset que tenga cantidad de participantes por año

participacion_anio <- athlete_events %>%
  group_by(Name, Year, Sex) %>% 
  summarise(isName = 1)

participacion_anio <- participacion_anio %>% 
  group_by(Year, Sex) %>% 
  summarise(num_athletes = sum(isName)) %>% 
  ungroup()

participacion_anio <- participacion_anio %>% add_row(Year = "1916", Sex = "M", num_athletes = "0") %>%
  add_row(Year = "1916", Sex = "F", num_athletes = "0") %>% 
  add_row(Year = "1916", Sex = "F", num_athletes = "0") %>% 
  add_row(Year = "1940", Sex = "F", num_athletes = "0") %>%
  add_row(Year = "1940", Sex = "M", num_athletes = "0") %>%
  add_row(Year = "1944", Sex = "M", num_athletes = "0") %>%
  add_row(Year = "1944", Sex = "F", num_athletes = "0") %>% 
  mutate(num_athletes = as.numeric(num_athletes)) %>%
  mutate(Year = as.numeric(Year)) %>%
  arrange(Year) %>% 
  filter(Year != 1906)

# Gráfico 
      
ggplot(participacion_anio, aes(x = Year, y = num_athletes)) +
   geom_col(fill = "lightskyblue4", width = 2) +
   scale_x_continuous(breaks = c(1896, 1912, 1920, 1936, 1948, 2016)) +
    theme(legend.position="none", panel.spacing = unit(0.1, "lines")) +
        theme_ipsum(axis_text_size =  7.3) +
        theme(panel.grid.major.x = element_blank(), panel.grid.minor.x =           element_blank()) +
  labs(title = "Nivel de participación en los Juegos Olímpicos",
       caption = "https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results",
       x = "", y = "n atletas")

En este gráfico podemos ver algunas cosas interesantes. Los Juegos Olímpicos comenzaron en el año 1896 (Atenas) y la última edición fue en 2016 (Río). La participación se ha ido incrementando a lo largo de los años, pero podemos observar dos “baches”: entre 1912-1920 y 1936-1948. 1era y 2da Guerra Mundial. La primera edición tuvo 176 atletas hombres y 0 mujeres. En los juegos de Río 2016 participaron 11139 atletas, 63 veces mayor que en sus inicios ateneos

¿Cuánto varía la participación de acuerdo al género?

Veamos qué ocurre en hombres y mujeres
# Ahora veamos si ha sido igual para hombres y mujeres
      
ggplot(participacion_anio, aes(Year, num_athletes)) +
   geom_col(aes(fill = Sex), width = 2.5, position = position_dodge(width=2.5), stat="identity") +
          scale_x_continuous(breaks = c(1896, 1912, 1920, 1936, 1948, 1972, 1996, 2016)) +
    theme(legend.position="none", panel.spacing = unit(0.1, "lines")) +
        theme_ipsum(axis_text_size =  7.3) +
        theme(panel.grid.major.x = element_blank(), panel.grid.minor.x =           element_blank()) +
  scale_fill_manual(values=c("seagreen3", "salmon1"), 
                       name="Género", labels=c("Masculino", "Femenino")) +
  labs(title = "Nivel de participación en los Juegos Olímpicos",
       subtitle = "Distribución por género",
       caption = "https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results",
       x = "",
       y = "")

Y como era de esperar, la participación no ha sido igual para hombres que para mujeres. En el gráfico vemos que las mujeres tuvieron una participación nula en la inauguración de 1896, y escasa los años subsiguientes. Recien a partir del año 1956 podemos ver una tendencia positiva: las mujeres han tenido una cada vez mayor participación en los Juegos Olímpicos. Aunque es claro que los hombres siguen siendo mayoría, es posible observar una tendencia decreciente en su participación, desde el año 1996; la brecha cada vez se va acortando más. En el año 2016, la brecha fue la menos pronunciada en toda la historia; 5015 mujeres y 6134 hombres participaron.

Deportes y género: ¿En qué deportes las mujeres obtuvieron la mayor participación?

Veamos qué deportes tuvieron una mayor apertura a la participación de mujeres a lo largo de la historia

mujeres_deporte <- athlete_events %>%
  filter(Sex == "F") %>% 
  group_by(Name, Sport, Year) %>% 
  summarise(isName = 1)

mujeres_deporte <- mujeres_deporte %>% 
  group_by(Sport, Year) %>% 
  summarise(num_athletes = sum(isName))

mujeres_deporte %>%
    filter((Sport == "Boxing" | Sport == "Modern Pentathlon" | Sport == "Trampolining" | Sport == "Athletics" | Sport == "Swimming" | Sport == "Rowing")) %>% 
  ggplot(aes(x=Year, y=num_athletes, group=Sport, color=Sport)) +
    geom_line(size = 1) +
  geom_point() + 
  scale_x_continuous(breaks = c(1896, 1906, 1916, 1936, 1956, 1976, 1996, 2016)) +
    theme(legend.position="none", panel.spacing = unit(0.1, "lines")) +
    labs(title = "Evolución de la participación femenina por deporte",
         subtitle = "Natación, Atletismo, Remo, Boxeo, Pentatlón Moderno y Trampolín",
         caption = "https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results") +
    theme_ipsum(axis_text_size = 7.3) +
    ylab("Número de atletas") +
    xlab ("")

Para el análisis, elegimos las TOP3 disciplinas con mayor presencia femenina en los últimos 5 años, y las 3 con menor concurrencia femenina: Atletismo, Remo, Natación, Boxeo, Trampolín y Pentatlón Moderno.

Atletismo

Atletismo ha sido la disciplina en la que las mujeres más participaron desde los juegos de Ámsterdam, 1928. Desde esas 95 mujeres, la participación femenina ha ido incrementando, y especialmente a partir de los juegos de Moscú en 1980. En 32 años, la participación femenina se cuadruplicó.

Natación

En segundo lugar se encuentra Natación. Las primeras mujeres que participaron fue en los juegos de Estocolmo, en el año 1912. Fueron un total 27 nadadoras olímpicas. La tendencia a lo largo de los años es parecida a la observada en Atletismo, pero en menor magnitud. Le faltó el sprint que Atletismo en los últimos 35 años. Más aún, la participación ha ido disminuyendo levemente desde Beijing 2008.La última edición de Río alojó un total de 439 nadadoras olímpicas.

Los deportes más “machos”

El boxeo, trampolín y pentatlón moderno son disciplinas que históricamente han sido reservadas para hombres; las mujeres comenzaron a participar en ellas a partir del advenimiento del siglo XXI. No se observa ninguna tendencia de aumento ni disminución. En Pentatlón Moderno, las mujeres han tenido el mismo nivel de participación en las últimas 3 ediciones: 36.

Proporción por deportes

Veamos qué ocurre al comparar el nivel participación de hombres y mujeres, en diferentes deportes

# Plot

deportes <- athlete_events %>%
  group_by(Name, Sex, Sport) %>% 
  summarise(isName = 1)

deportes <- deportes %>% 
  group_by(Sex, Sport) %>% 
  summarise(num_athletes = sum(isName)) %>% 
  ungroup()

deportes <- deportes %>% 
  pivot_wider(names_from = Sex, values_from = num_athletes)
deportes <- deportes %>% 
  filter(M > 2000)
deportes <- deportes %>% 
  pivot_longer(cols = -Sport, names_to = "M", values_to = "F")

deportes %>% 
ggplot(aes(fill = M, y= Sport, x = F)) +
   geom_bar(position = "fill",stat = "identity") +
    theme(legend.position="none", panel.spacing = unit(0.1, "lines")) +
        theme_ipsum(axis_text_size =  7.3) +
        theme(panel.grid.major.x = element_blank(), panel.grid.minor.x =           element_blank()) +
  scale_fill_manual(values=c("salmon1", "seagreen3"), 
                       name="Género", labels=c("Femenino", "Masculino")) +
  labs(title = "Comparación de la participación por género",
       subtitle = "Deportes cuya participación histórica masculina supera los 2000",
       caption = "https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results",
       x = "",
       y = "")

Esto cambia un poco las cosas. En esta lista podemos ver aquellos deportes que superan la participación masculina en 2000 atletas. Atletismo, que en el gráfico anterior se mostraba como el deporte femenino #1, pasó a ubicarse como el 3er deporte con mayor proporción de mujeres (x%)

Deportes de “machos”

Boxeo y lucha son deportes prácticamente no habitados por mujeres. La participación femenina es escasa y no supera el 2%. El fútbol y ciclismo también son deportes con poca participación femenina, aunque superan el 20%.

Deportes de mayor paridad de género

Natación, que antes lo vimos ocupar el 2do lugar en cuanto a cantidad de mujeres atletas a lo largo de la historia, es el deporte que más se aproxima a proporciones igualitarias (x%). La gimnasia también presenta una proporción parecida, aunque en menor medida.

Más allá de las tendencias, no hay NINGÚN deporte de alta participación en el que predominen mujeres.

Países y deportistas mujeres

Veamos cuáles fueron los países que más mujeres aportaron a los Juegos Olímpicos, y si hay tendientes crecientes o decrecientes

mujeres_pais <- athlete_events %>%
  filter(Sex == "F") %>% 
  group_by(Name, Country, Year) %>% 
  summarise(isName = 1)

mujeres_pais <- mujeres_pais %>% 
  group_by(Country, Year) %>% 
  summarise(num_athletes = sum(isName))

mujeres_pais %>%
  filter(Country == "USA" | Country == "China" | Country == "Argentina" | Country == "Finland" | Country == "Kenya" | Country == "Iran" | Country == "Italy" | Country == "Australia") %>% 
  ggplot(aes(x=Year, y=num_athletes, group=Country, color=Country)) +
    geom_line(size = 1) +
  geom_point() + 
  scale_x_continuous(breaks = c(1896, 1906, 1916, 1936, 1956, 1976, 1996, 2016)) +
    theme(legend.position="none", panel.spacing = unit(0.1, "lines")) +
    labs(title = "Evolución de la participación femenina por país",
         subtitle = "Argentina, Australia, China, Finlandia, Iran, Italia, Kenya y USA",
         caption = "https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results") +
    theme_ipsum(axis_text_size = 7.3) +
    ylab("Número de atletas") +
    xlab ("")

Elegimos 7 países distintos que pienso representarían distintas realidades culturales en las que viven las mujeres: Argentina, China, Finlandia, Irán, Gran Bretaña, Estados Unidos y Kenya

El bloque USA, China, Australia y rasgando, Italia

Estos 4 países son los que mayor cantidad de mujeres atletas aportaron a las últimas 9 ediciones de los Juegos Olímpicos. Apróximadamente a mediados de los 70’ la participación femenina aumento considerablemente, triplicándose en el caso de Italia y 130plicándose en China. China tuvo tan sólo 2 atletas mujeres en 1976, y en 40 años pasaron a presentarse 262 atletas chinas. La mayor participación femenina fue observada en Río 2016; fueron 291 las atletas estadounidenses.

Argentina, Irán, Kenya y Finlandia

Estos 4 países, aunque difieren en preferencias culturales, clima y ubicación geográfica, coinciden en algo. Ninguno de ellos mostró una participación femenina significativa, si comparamos con los gigantes de arriba.

Argentina se ubica como referente entre los 4, ya que desde los juegos de Barcelona en 1992 viene mostrando una tendencia creciente parecida a los grandes, no en su magnitud. La última edición hubieron 75 atletas argentinas.

En Kenya y Finlandia se observan intentos por simular la forma de las curvas de los gigantes, pero resultan bastante inestables. El premio “Raúl del lustro” se lo lleva Irán, que se ha desentendido por completo de la tendencia creciente a nivel mundial. Nunca más de 4 atletas iraníes femeninas hemos podido observar en un mismo certamen. Sin embargo, podemos rescatar un intento de curva creciente con el aumento de 3 a 8 participantes en 2012, y 9 en 2016.

Comparemos la participación de mujeres y hombres en estos países

mujeres_paises <- athlete_events %>%
  group_by(Name, Sex, Country) %>% 
  summarise(isName = 1)

mujeres_paises <- mujeres_paises %>% 
  group_by(Sex, Country) %>% 
  summarise(num_athletes = sum(isName)) %>% 
  ungroup()



mujeres_paises <- mujeres_paises %>% 
  pivot_wider(names_from = Sex, values_from = num_athletes)
mujeres_paises <-mujeres_paises %>% 
  filter(M > 1000)
mujeres_paises <- mujeres_paises %>% 
  pivot_longer(cols = -Country, names_to = "M", values_to = "F")


mujeres_paises %>% 
ggplot(aes(fill = M, y = Country, x = F)) +
   geom_bar(position = "fill", stat = "identity") +
        theme(panel.grid.major.x = element_blank(), panel.grid.minor.x =           element_blank()) +
  scale_fill_manual(values=c("salmon1", "seagreen3"), 
                       name="Género", labels=c("Femenino", "Masculino")) +
  labs(title = "Comparación de la participación por género",
       subtitle = "Países cuya participación masculina supera 1000",
       caption = "https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results",
       x = "",
       y = "")

Lo que acá vemos es la proporción de participación por género en cada uno de los países que mas atletas aportan, independientemente del género.

Los destacados: China, Australia, Canadá, Corea del Sur Y Rumania

Lejos, por escándalo, China es el país cuya participación se encuentra más repartida. El 48% de los atletas chinos en la historia de los Juegos Olímpicos han sido mujeres. Un dato importante es que recién en 1984 empezó a participar más fuertemente, ya que desde sus inicios (1936) hasta 1984, había aportado no más de 10 atletas en total. China incrementó su participación en un momento de tendencia creciente de participación femenina, mientras que otros países que participaron más fuertemente desde principios del sXX acarrean la brecha de esas epocas.

Canadá, Australia, Corea del Sur y Rumania también son países con menor brecha histórica, aunque en menor medida que el gigante China.

Mayor brecha: Bélgica, Suiza y Finlandia

Los 3 europeos se destacan por ser los países de participación masiva que mayor brecha muestra: sólo el 13.8% de los atletas belgas que participaron en alguna edición de los juegos olímpicos son mujeres. En Finlandia ocurre lo mismo; 13 de cada 100 atletas son mujeres. Por último, Finlandia es otro de los países cuya participación femenina es escasa en términos proporcionales (15%).

Cabe destacar que no estamos incluyendo países que llevan menos de 1000 atletas masculinos, y es probable que hayan varios países con participación femenina prácticamente nula. Lo que queremos mostrar aquí son los países que tienen participación masiva (>1000)

Medallero Olímpico: ¿Quiénes son los atletas más ganadores de la historia?

 medallas_atletas <- athlete_events %>% filter(!is.na(Medal))%>% 
    group_by(Name, Event, Year) %>%
  summarize(isMedal=1)

medallas_atletas <- medallas_atletas %>%
  group_by(Name) %>%
  summarise(Medal = sum(isMedal))

medallas_atletas %>%
  arrange(desc(Medal))
## # A tibble: 24,396 x 2
##    Name                                                Medal
##    <chr>                                               <dbl>
##  1 "Michael Fred Phelps, II"                              28
##  2 "Larysa Semenivna Latynina (Diriy-)"                   18
##  3 "Nikolay Yefimovich Andrianov"                         15
##  4 "Borys Anfiyanovych Shakhlin"                          13
##  5 "Edoardo Mangiarotti"                                  13
##  6 "Takashi Ono"                                          13
##  7 "Aleksey Yuryevich Nemov"                              12
##  8 "Birgit Fischer-Schmidt"                               12
##  9 "Dara Grace Torres (-Hoffman, -Minas)"                 12
## 10 "Jennifer Elisabeth \"Jenny\" Thompson (-Cumpelik)"    12
## # ... with 24,386 more rows
medallas_atletas <- medallas_atletas[with(medallas_atletas,order(-Medal)),]
medallas_atletas <- medallas_atletas [1:10,]
medallas_atletas
## # A tibble: 10 x 2
##    Name                                                Medal
##    <chr>                                               <dbl>
##  1 "Michael Fred Phelps, II"                              28
##  2 "Larysa Semenivna Latynina (Diriy-)"                   18
##  3 "Nikolay Yefimovich Andrianov"                         15
##  4 "Borys Anfiyanovych Shakhlin"                          13
##  5 "Edoardo Mangiarotti"                                  13
##  6 "Takashi Ono"                                          13
##  7 "Aleksey Yuryevich Nemov"                              12
##  8 "Birgit Fischer-Schmidt"                               12
##  9 "Dara Grace Torres (-Hoffman, -Minas)"                 12
## 10 "Jennifer Elisabeth \"Jenny\" Thompson (-Cumpelik)"    12
medallas_atletas[1, 1] = "Michael Phelps (USA)"
medallas_atletas [2, 1] = "Larysa Latynina (Ucrania)"
medallas_atletas [3, 1] = "Nikolay Andrianov (URS)"
medallas_atletas [4,1] = "Borys Shakhlin (URS)"
medallas_atletas [5,1] = "Takashi Ono (Japón)"
medallas_atletas [6,1] = "Edoardo Mangiarotti (Italia)"
medallas_atletas [7,1] = "Aleksey Nemov (Rusia)"
medallas_atletas [8,1] = "Dara Torres (USA)"
medallas_atletas [9,1]= "Jenny Thompson (USA)"
medallas_atletas [10,1] = "Natalie Coughlin (USA)"

# Hagamos un LOLLIPOP CHART: TOP 10 DEPORTISTAS

ggplot(medallas_atletas, aes(x=reorder (Name, Medal), y=Medal)) +
  geom_point(color="orange", size=4) +
  geom_segment( aes(x=Name, xend=Name, y=0, yend=Medal), color="grey", size=1) +
  ylim(0,30) +
  geom_point(color="orange", size=4) +
  coord_flip () +
  theme(legend.position="none", panel.spacing = unit(0.1, "lines")) +
        theme_ipsum(axis_text_size =  7.3) +
        theme(panel.grid.major.x = element_blank(), panel.grid.minor.x =           element_blank()) +
  labs(title = "Los más ganadores de la historia",
     subtitle = "Período Atenas 1896- Río de Janeiro 2016",
     caption = "https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results", x = "", y = "")

CRACK! Michael Phelps rompió el tablero: 10 medallas le lleva a la ucraniana Latynina, extraterrestre en la gimnasia olímpica. Después, los mortales: hay empates variados de 13 y 12 medallas.

4/10 son mujeres.

¿Quién es la atleta más jóven en haber ganado una medalla de Oro?
# ¿Atleta más jóven en ganar una medalla?

oro <- athlete_events %>% 
  filter(Medal == "Gold") 

Donna De Varonna es la atleta más jóven en llevarse el oro a sus 13 años. Fue en los Juegos de Tokyo de 1964, en la competición de 400 metros natación. Jessie Pollock, la longeva de Ohio se llevó el oro en arco y flecha a sus 63 años, en los juegos de St. Louis (1904).

Conclusión

Las mujeres han tenido una participación escasa a lo largo de la historia de los juegos olímpicos. Sin embargo, su participación se ha ido incrementando fuertemente en los últimos 30 años, y esto puede deberse a cambios culturales en relación al lugar que ocupa la mujer en la sociedad hoy en día. Ciertos cambios sobre la concepción sobre lo que es ser una “mujer” pueden haber animado a las mujeres a participar de eventos históricamente concebidos como de “hombres”.

Si bien es cierta la tendencia a una mayor participación femenina, dichos cambios parecen ocurrir más lentamente en los ámbitos cuya masculinidad ha sido más acentuada: boxeo y lucha son algunas de las disciplinas en las que parece haber más resistencia a la participación femenina. Los resultados no son claros acerca de qué es lo que causa qué: si las mujeres no muestran interés en el boxeo (por procesos de socialización temprana), o si el boxeo se resiste a dar lugar a aquellas mujeres que desean desempeñarse en la disciplina.

También analizamos estas tendencias en algunos países, y aunque en menor medida, todos los países exhiben cierto grado de apertura a la participación femenina. Estados Unidos se muestra como el país más representado por mujeres, pero en términos proporcionales el premio se lo lleva China. Entre los países con participación masiva, Bélgica, Suiza y Finlandia presentan una brecha intensa. Sería necesario ver la tendencia en estos países en los últimos 30 años.

Muchas gracias por leerme, espero que la lectura les haya disparado más preguntas de las que se pudieron responder en el estudio