As Olimpíadas de 2024 marcaram mais um capítulo na história do esporte mundial, reunindo atletas de todo o globo para competir no mais alto nível. Em meio às diversas conquistas e momentos memoráveis, o desempenho das mulheres, principalmente brasileiras, destacou-se refletindo tanto o crescimento quanto os desafios enfrentados em termos de representatividade e igualdade no esporte.
Este estudo foca na análise dos atletas nos Jogos Olímpicos de 2024, com ênfase especial na participação e desempenho das mulheres. O objetivo é examinar não apenas o número de participantes, mas também a distribuição de medalhas, a representatividade feminina, e as tendências que possam indicar avanços ou áreas que ainda necessitam de atenção na igualdade de gênero.
Neste estudo, utilizaremos as seguinte bibliotecas:
library(ggplot2)
library(dplyr)
library(knitr)
Para nossa análise, utilizaremos uma base de dados abrangente que contém informações detalhadas sobre as Olimpíadas de 2024. Este conjunto de dados, disponível no Kaggle, pode ser acessado através do seguinte link: Olimpíadas de Paris.
O dataset é composto por 10 tabelas principais, contendo milhares de linhas e dezenas de colunas. Nós utilizaremos os data frames athletes.csv e medallists.csv.
Essa tabela possui 11110 linhas e 35 colunas, contendo informações relevantes acerca de todos os competidores das olímpiadas, como podemos observar abaixo.
| name | gender | country | disciplines | events |
|---|---|---|---|---|
| ALEKSANYAN Artur | Male | Armenia | [‘Wrestling’] | [“Men’s Greco-Roman 97kg”] |
| AMOYAN Malkhas | Male | Armenia | [‘Wrestling’] | [“Men’s Greco-Roman 77kg”] |
| GALSTYAN Slavik | Male | Armenia | [‘Wrestling’] | [“Men’s Greco-Roman 67kg”] |
| HARUTYUNYAN Arsen | Male | Armenia | [‘Wrestling’] | [“Men’s Freestyle 57kg”] |
| TEVANYAN Vazgen | Male | Armenia | [‘Wrestling’] | [“Men’s Freestyle 65kg”] |
| ARENAS Lorena | Female | Colombia | [‘Athletics’] | [“Women’s 20km Race Walk”, ‘Marathon Race Walk Relay Mixed’] |
| McKENZIE Ashley | Male | Jamaica | [‘Judo’] | [‘Men -60 kg’] |
| BASS BITTAYE Gina Mariam | Female | Gambia | [‘Athletics’] | [“Women’s 100m”, “Women’s 200m”] |
| CAMARA Ebrahima | Male | Gambia | [‘Athletics’] | [“Men’s 100m”] |
| RUEDA SANTOS Lizeth | Female | Mexico | [‘Triathlon’] | [“Women’s Individual”] |
Já a tabela de medalhistas possui 2271 linhas e 12 colunas, contendo todas as informações do atletas que estiveram no pódio, ganhando uma, ou mais, medalhas para o seu país.
| name | gender | country | discipline | event |
|---|---|---|---|---|
| EVENEPOEL Remco | Male | Belgium | Cycling Road | Men’s Individual Time Trial |
| GANNA Filippo | Male | Italy | Cycling Road | Men’s Individual Time Trial |
| van AERT Wout | Male | Belgium | Cycling Road | Men’s Individual Time Trial |
| BROWN Grace | Female | Australia | Cycling Road | Women’s Individual Time Trial |
| HENDERSON Anna | Female | Great Britain | Cycling Road | Women’s Individual Time Trial |
| DYGERT Chloe | Female | United States | Cycling Road | Women’s Individual Time Trial |
| OH Sanguk | Male | Korea | Fencing | Men’s Sabre Individual |
| FERJANI Fares | Male | Tunisia | Fencing | Men’s Sabre Individual |
| SAMELE Luigi | Male | Italy | Fencing | Men’s Sabre Individual |
| KONG Man Wai Vivian | Female | Hong Kong, China | Fencing | Women’s Épée Individual |
Abaixo podemos ver uma explicação de cada umas das colunas encontradas nos dados selecionados:
| Variáveis | Descrição |
|---|---|
| code | Código único do atleta |
| name | Nome completo do atleta |
| name_short | Nome abreviado do atleta |
| name_tv | Nome do atleta exibido nas transmissões de TV |
| gender | Gênero do atleta (masculino/feminino) |
| function | Função do atleta (ex: jogador, treinador) |
| country_code | Código do país do atleta |
| country | Nome do país do atleta |
| country_full | Nome completo do país |
| nationality | Nacionalidade do atleta |
| nationality_full | Nome completo da nacionalidade |
| nationality_code | Código da nacionalidade |
| height | Altura do atleta (em cm) |
| weight | Peso do atleta (em kg) |
| disciplines | Esportes nos quais o atleta compete |
| events | Eventos específicos nos quais o atleta participa |
| birth_date | Data de nascimento do atleta |
| birth_place | Local de nascimento do atleta |
| birth_country | País de nascimento do atleta |
| residence_place | Local de residência do atleta |
| residence_country | País de residência do atleta |
| nickname | Apelido do atleta |
| hobbies | Hobbies e interesses do atleta |
| occupation | Profissão do atleta (fora do esporte) |
| education | Educação e nível de escolaridade do atleta |
| family | Informações sobre a família do atleta |
| lang | Idiomas falados pelo atleta |
| coach | Nome do treinador do atleta |
| reason | Razão para o atleta ter começado a praticar seu esporte |
| hero | Herói ou ídolo do atleta |
| influence | Influências na carreira do atleta |
| philosophy | Filosofia de vida do atleta |
| sporting_relatives | Parentes envolvidos em esportes |
| ritual | Rituais antes das competições |
| other_sports | Outros esportes praticados pelo atleta |
| Variáveis | Descrição |
|---|---|
| medal_date | Data em que o atleta ganhou a medalha |
| medal_type | Tipo de medalha (ouro, prata, bronze) |
| medal_code | Código da medalha (1=ouro, 2=prata, 3=bronze) |
| name | Nome completo do atleta |
| gender | Gênero do atleta (masculino/feminino) |
| country | Nome do país do atleta |
| country_code | Código do país do atleta |
| nationality | Nacionalidade do atleta |
| team | Nome do time do atleta (se aplicável) |
| team_gender | Gênero da equipe (se for competição de equipe) |
| discipline | Esporte no qual o atleta ganhou a medalha |
| event | Evento específico em que o atleta participou |
| event_type | Tipo de evento (individual ou em equipe) |
| url_event | URL do evento para mais informações |
| birth_date | Data de nascimento do atleta |
| code | Código único do atleta |
Para o nosso estudo, realizaremos uma série de combinações e modificações dessas tabelas para extrair informações interessantes acerca dos jogos. Exploraremos como as diferentes variáveis interagem e impactam o desempenho dos atletas, a distribuição das medalhas e outros aspectos importantes. Detalharemos cada etapa do processo ao longo do estudo para garantir uma compreensão clara dos métodos e resultados.
Pronto para começar essa jornada de análise e descobrir as histórias e tendências ocultas nos dados? Rumo ao pódio!
Você sabia que nas Olimpíadas de 2024, o número de mulheres participantes alcançou a marca de 5.455 competidoras? Essas atletas mostraram sua força e talento ao disputar medalhas em uma ampla variedade de modalidades esportivas, desafiando limites e conquistando grandes feitos. No entanto, quando comparamos esse número ao dos homens, percebemos que ainda há uma diferença significativa: havia 200 homens a mais competindo. Essa disparidade, embora reduzida em relação a edições anteriores dos Jogos, indica que ainda temos um caminho a percorrer na busca pela plena igualdade de gênero no esporte.
Ao analisar o número total de atletas por país nas Olimpíadas de 2024, destacamos que os Estados Unidos lideram com o maior número de competidores, enquanto o Brasil ocupa a 11ª posição.
Quando focamos exclusivamente nas atletas femininas, o Brasil desce uma posição para 12º lugar, enquanto os Estados Unidos mantêm a liderança. Um destaque interessante é a China, que avança três posições, alcançando o 4º lugar entre os países com mais competidoras. Esse avanço indica uma presença feminina significativa na delegação chinesa, quase equiparada ao número de homens chineses enviados para Paris.
Além disso, mesmo com a maior quantidade de atletas no geral, os Estados Unidos mostram uma disparidade notável entre gêneros: o número de homens competindo é quase o dobro do número de mulheres. Este dado sublinha a predominância masculina nas competições, em relação a todos os países.
O ranking dos 10 atletas mais altos das Olimpíadas de 2024 é, como esperado, composto exclusivamente por homens, refletindo as diferenças físicas naturais. No entanto, a diferença de altura entre os homens e as mulheres mais altas nas competições é surpreendentemente pequena. Várias atletas superam a marca de 2 metros.
Agora faremos uma análise das medalhas nos jogos olímpicos. Para isso, faremos a junção das tabelas “athletes.csv” e “medallists.csv”. Agruparemos as colunas que são semelhantes nos dois data frames, sendo elas: name, gender, country, country_code, nationality.
medallists <- read.csv("./medallists.csv", stringsAsFactors = FALSE)
medals <- athletes %>%
left_join(medallists, by = c("name", "gender", "country", "country_code", "nationality"))
merged_amost <- medals[1:10, c("name", "gender", "country", "disciplines", "events")]
kable(merged_amost, caption = "Amostra de dados dos atletas nas Olimpíadas de 2024.")
| name | gender | country | disciplines | events |
|---|---|---|---|---|
| ALEKSANYAN Artur | Male | Armenia | [‘Wrestling’] | [“Men’s Greco-Roman 97kg”] |
| AMOYAN Malkhas | Male | Armenia | [‘Wrestling’] | [“Men’s Greco-Roman 77kg”] |
| GALSTYAN Slavik | Male | Armenia | [‘Wrestling’] | [“Men’s Greco-Roman 67kg”] |
| HARUTYUNYAN Arsen | Male | Armenia | [‘Wrestling’] | [“Men’s Freestyle 57kg”] |
| TEVANYAN Vazgen | Male | Armenia | [‘Wrestling’] | [“Men’s Freestyle 65kg”] |
| ARENAS Lorena | Female | Colombia | [‘Athletics’] | [“Women’s 20km Race Walk”, ‘Marathon Race Walk Relay Mixed’] |
| McKENZIE Ashley | Male | Jamaica | [‘Judo’] | [‘Men -60 kg’] |
| BASS BITTAYE Gina Mariam | Female | Gambia | [‘Athletics’] | [“Women’s 100m”, “Women’s 200m”] |
| CAMARA Ebrahima | Male | Gambia | [‘Athletics’] | [“Men’s 100m”] |
| RUEDA SANTOS Lizeth | Female | Mexico | [‘Triathlon’] | [“Women’s Individual”] |
Em seguida, removeremos todas as colunas que não tenham informações relevantes para as próximas análises. Também faremos a troca do nome da coluna code.x para code.
medals <- medals %>%
select(-code.y, -name_short, -name_tv, -country_code, -country_full, -nationality, -nationality_full, -nationality_code, -birth_date.x, -birth_place, -birth_country, -residence_place, -residence_country, -nickname, -hobbies, -function., -occupation, -education, -family, -lang, -reason, -hero, -influence, -philosophy, -sporting_relatives, -ritual, -other_sports, -medal_code, -birth_date.y, -height, -weight, -url_event, -disciplines, -events)
medals <- medals %>%
rename(code = code.x)
É importante levar em conta que alguns esportes são disputados em equipe. Isso significa que, para uma análise precisa, devemos contar apenas a primeira medalha conquistada por cada equipe. Para realizar essa tarefa, criaremos um data frame que inclui apenas os registros das primeiras medalhas obtidas por cada time. Além disso, removeremos da tabela todos os atletas que não ganharam medalhas.
clean_medals <- medals %>%
filter(!is.na(medal_type))
unique_medals <- clean_medals %>%
distinct(discipline, event, country, medal_type, team_gender, .keep_all = TRUE)
Faremos o mesmo tratamento, agora mantendo apenas os competidores do sexo feminino, criando um novo data frame contendo apenas mulheres.
female_medals <- clean_medals %>%
filter(gender == "Female")
unique_medals_womans <- female_medals %>%
distinct(event, country, medal_type, .keep_all = TRUE)
Abaixo podemos ver os 20 países com mais medalhas ganhas. É possível notar que, assim como os Estados Unidos é o país com o maior número de competidores, também possui o maior número de medalhas.
Ao analisar exclusivamente as medalhas conquistadas por mulheres, notamos que os Estados Unidos continuam a liderar o ranking. No entanto, observamos uma mudança nas posições inferiores. O Reino Unido avança para a terceira colocação, destacando-se em termos de conquistas femininas e superando a França, que assumia a terceira colocação no ranking geral, conforme ilustrado no gráfico anterior.
Ao analisar o progresso na conquista de medalhas ao longo do tempo, observamos que os Estados Unidos dominaram a competição desde o início. A França começou a competição em segundo lugar, mas, com o passar dos dias, foi superada pela China, que assumiu a posição de vice-líder.
Com base nos dados analisados, podemos calcular a probabilidade de um atleta conquistar uma medalha. Considerando que ele nasceu nos Estados Unidos, vamos utilizar a fórmula a seguir, para calcular:
\[ P(Vencer)= \frac{Atletas}{Medalhas} \] Como demonstrado abaixo, nascer nos Estados Unidos oferece a um atleta uma probabilidade superior a 50% de conquistar uma medalha durante as Olimpíadas. Este dado evidencia o significativo investimento dos EUA em seus atletas e sua sólida posição como uma potência competitiva no cenário esportivo global.
Ao analisar os dados do Brasil, notamos que a probabilidade de um atleta brasileiro conquistar uma medalha é relativamente baixa. Isso destaca a magnitude de cada vitória e ressalta o esforço e a superação de cada competidor brasileiro, evidenciando a importância e o valor de suas conquistas.
Após este estudo, podemos retirar as seguintes conclusões:
Em resumo, a análise dos dados das Olimpíadas revela um panorama fascinante e dinâmico do esporte global. As tendências de igualdade de gênero, o domínio dos Estados Unidos e a superação do Brasil ilustram a evolução e a diversidade das competições. Estes insights não apenas celebram as conquistas dos atletas, mas também fornecem um ponto de partida para futuras estratégias e investimentos no esporte. A contínua observação e análise desses dados serão essenciais para promover um ambiente esportivo mais inclusivo e competitivo. O estudo demonstra que, independentemente dos desafios, a paixão pelo esporte e o compromisso com a excelência continuam a impulsionar atletas e nações a alcançar novos patamares.