Introdução

As Olimpíadas de 2024 marcaram mais um capítulo na história do esporte mundial, reunindo atletas de todo o globo para competir no mais alto nível. Em meio às diversas conquistas e momentos memoráveis, o desempenho das mulheres, principalmente brasileiras, destacou-se refletindo tanto o crescimento quanto os desafios enfrentados em termos de representatividade e igualdade no esporte.

Este estudo foca na análise dos atletas nos Jogos Olímpicos de 2024, com ênfase especial na participação e desempenho das mulheres. O objetivo é examinar não apenas o número de participantes, mas também a distribuição de medalhas, a representatividade feminina, e as tendências que possam indicar avanços ou áreas que ainda necessitam de atenção na igualdade de gênero.

Base de dados

Bibliotecas

Neste estudo, utilizaremos as seguinte bibliotecas:

library(ggplot2)
library(dplyr)
library(knitr)
  • Ggplot2
    • Utilizado para criar e apresentar gráficos no decorrer do projeto. O ggplot2 é uma poderosa biblioteca de visualização de dados, permitindo a construção de gráficos de maneira flexível e altamente customizável.
  • Deplyr
    • Usado para manipulação de dados, como filtragem, seleção de colunas e agregação. O dplyr facilita o trabalho com grandes conjuntos de dados e permite realizar operações de maneira concisa e eficiente.
  • Knitr
    • Utilizado para a geração de relatórios dinâmicos em RMarkdown. O knitr permite a integração de código R com texto, gerando documentos formatados em diferentes formatos, como HTML e PDF.

Data Frames

Para nossa análise, utilizaremos uma base de dados abrangente que contém informações detalhadas sobre as Olimpíadas de 2024. Este conjunto de dados, disponível no Kaggle, pode ser acessado através do seguinte link: Olimpíadas de Paris.

O dataset é composto por 10 tabelas principais, contendo milhares de linhas e dezenas de colunas. Nós utilizaremos os data frames athletes.csv e medallists.csv.

Athletes.csv

Essa tabela possui 11110 linhas e 35 colunas, contendo informações relevantes acerca de todos os competidores das olímpiadas, como podemos observar abaixo.

Amostra de dados dos atletas nas Olimpíadas de 2024.
name gender country disciplines events
ALEKSANYAN Artur Male Armenia [‘Wrestling’] [“Men’s Greco-Roman 97kg”]
AMOYAN Malkhas Male Armenia [‘Wrestling’] [“Men’s Greco-Roman 77kg”]
GALSTYAN Slavik Male Armenia [‘Wrestling’] [“Men’s Greco-Roman 67kg”]
HARUTYUNYAN Arsen Male Armenia [‘Wrestling’] [“Men’s Freestyle 57kg”]
TEVANYAN Vazgen Male Armenia [‘Wrestling’] [“Men’s Freestyle 65kg”]
ARENAS Lorena Female Colombia [‘Athletics’] [“Women’s 20km Race Walk”, ‘Marathon Race Walk Relay Mixed’]
McKENZIE Ashley Male Jamaica [‘Judo’] [‘Men -60 kg’]
BASS BITTAYE Gina Mariam Female Gambia [‘Athletics’] [“Women’s 100m”, “Women’s 200m”]
CAMARA Ebrahima Male Gambia [‘Athletics’] [“Men’s 100m”]
RUEDA SANTOS Lizeth Female Mexico [‘Triathlon’] [“Women’s Individual”]

Medallists.csv

Já a tabela de medalhistas possui 2271 linhas e 12 colunas, contendo todas as informações do atletas que estiveram no pódio, ganhando uma, ou mais, medalhas para o seu país.

Amostra de dados dos medalhistas nas Olimpíadas de 2024.
name gender country discipline event
EVENEPOEL Remco Male Belgium Cycling Road Men’s Individual Time Trial
GANNA Filippo Male Italy Cycling Road Men’s Individual Time Trial
van AERT Wout Male Belgium Cycling Road Men’s Individual Time Trial
BROWN Grace Female Australia Cycling Road Women’s Individual Time Trial
HENDERSON Anna Female Great Britain Cycling Road Women’s Individual Time Trial
DYGERT Chloe Female United States Cycling Road Women’s Individual Time Trial
OH Sanguk Male Korea Fencing Men’s Sabre Individual
FERJANI Fares Male Tunisia Fencing Men’s Sabre Individual
SAMELE Luigi Male Italy Fencing Men’s Sabre Individual
KONG Man Wai Vivian Female Hong Kong, China Fencing Women’s Épée Individual

Descrição das variáveis

Abaixo podemos ver uma explicação de cada umas das colunas encontradas nos dados selecionados:

Descrição das Colunas - athletes.csv
Variáveis Descrição
code Código único do atleta
name Nome completo do atleta
name_short Nome abreviado do atleta
name_tv Nome do atleta exibido nas transmissões de TV
gender Gênero do atleta (masculino/feminino)
function Função do atleta (ex: jogador, treinador)
country_code Código do país do atleta
country Nome do país do atleta
country_full Nome completo do país
nationality Nacionalidade do atleta
nationality_full Nome completo da nacionalidade
nationality_code Código da nacionalidade
height Altura do atleta (em cm)
weight Peso do atleta (em kg)
disciplines Esportes nos quais o atleta compete
events Eventos específicos nos quais o atleta participa
birth_date Data de nascimento do atleta
birth_place Local de nascimento do atleta
birth_country País de nascimento do atleta
residence_place Local de residência do atleta
residence_country País de residência do atleta
nickname Apelido do atleta
hobbies Hobbies e interesses do atleta
occupation Profissão do atleta (fora do esporte)
education Educação e nível de escolaridade do atleta
family Informações sobre a família do atleta
lang Idiomas falados pelo atleta
coach Nome do treinador do atleta
reason Razão para o atleta ter começado a praticar seu esporte
hero Herói ou ídolo do atleta
influence Influências na carreira do atleta
philosophy Filosofia de vida do atleta
sporting_relatives Parentes envolvidos em esportes
ritual Rituais antes das competições
other_sports Outros esportes praticados pelo atleta
Descrição das Colunas - medallists.csv
Variáveis Descrição
medal_date Data em que o atleta ganhou a medalha
medal_type Tipo de medalha (ouro, prata, bronze)
medal_code Código da medalha (1=ouro, 2=prata, 3=bronze)
name Nome completo do atleta
gender Gênero do atleta (masculino/feminino)
country Nome do país do atleta
country_code Código do país do atleta
nationality Nacionalidade do atleta
team Nome do time do atleta (se aplicável)
team_gender Gênero da equipe (se for competição de equipe)
discipline Esporte no qual o atleta ganhou a medalha
event Evento específico em que o atleta participou
event_type Tipo de evento (individual ou em equipe)
url_event URL do evento para mais informações
birth_date Data de nascimento do atleta
code Código único do atleta

Para o nosso estudo, realizaremos uma série de combinações e modificações dessas tabelas para extrair informações interessantes acerca dos jogos. Exploraremos como as diferentes variáveis interagem e impactam o desempenho dos atletas, a distribuição das medalhas e outros aspectos importantes. Detalharemos cada etapa do processo ao longo do estudo para garantir uma compreensão clara dos métodos e resultados.

Pronto para começar essa jornada de análise e descobrir as histórias e tendências ocultas nos dados? Rumo ao pódio!

Análise das Olimpíadas

Comparações

Homens x Mulheres

Você sabia que nas Olimpíadas de 2024, o número de mulheres participantes alcançou a marca de 5.455 competidoras? Essas atletas mostraram sua força e talento ao disputar medalhas em uma ampla variedade de modalidades esportivas, desafiando limites e conquistando grandes feitos. No entanto, quando comparamos esse número ao dos homens, percebemos que ainda há uma diferença significativa: havia 200 homens a mais competindo. Essa disparidade, embora reduzida em relação a edições anteriores dos Jogos, indica que ainda temos um caminho a percorrer na busca pela plena igualdade de gênero no esporte.

Ranking por país

Ao analisar o número total de atletas por país nas Olimpíadas de 2024, destacamos que os Estados Unidos lideram com o maior número de competidores, enquanto o Brasil ocupa a 11ª posição.

Quando focamos exclusivamente nas atletas femininas, o Brasil desce uma posição para 12º lugar, enquanto os Estados Unidos mantêm a liderança. Um destaque interessante é a China, que avança três posições, alcançando o 4º lugar entre os países com mais competidoras. Esse avanço indica uma presença feminina significativa na delegação chinesa, quase equiparada ao número de homens chineses enviados para Paris.

Além disso, mesmo com a maior quantidade de atletas no geral, os Estados Unidos mostram uma disparidade notável entre gêneros: o número de homens competindo é quase o dobro do número de mulheres. Este dado sublinha a predominância masculina nas competições, em relação a todos os países.

Alturas

O ranking dos 10 atletas mais altos das Olimpíadas de 2024 é, como esperado, composto exclusivamente por homens, refletindo as diferenças físicas naturais. No entanto, a diferença de altura entre os homens e as mulheres mais altas nas competições é surpreendentemente pequena. Várias atletas superam a marca de 2 metros.

Medalhas

Agora faremos uma análise das medalhas nos jogos olímpicos. Para isso, faremos a junção das tabelas “athletes.csv” e “medallists.csv”. Agruparemos as colunas que são semelhantes nos dois data frames, sendo elas: name, gender, country, country_code, nationality.

Tratamento dos dados

medallists <- read.csv("./medallists.csv", stringsAsFactors = FALSE)
medals <- athletes %>%
  left_join(medallists, by = c("name", "gender", "country", "country_code", "nationality"))

merged_amost <- medals[1:10, c("name", "gender", "country", "disciplines", "events")]
kable(merged_amost, caption = "Amostra de dados dos atletas nas Olimpíadas de 2024.")
Amostra de dados dos atletas nas Olimpíadas de 2024.
name gender country disciplines events
ALEKSANYAN Artur Male Armenia [‘Wrestling’] [“Men’s Greco-Roman 97kg”]
AMOYAN Malkhas Male Armenia [‘Wrestling’] [“Men’s Greco-Roman 77kg”]
GALSTYAN Slavik Male Armenia [‘Wrestling’] [“Men’s Greco-Roman 67kg”]
HARUTYUNYAN Arsen Male Armenia [‘Wrestling’] [“Men’s Freestyle 57kg”]
TEVANYAN Vazgen Male Armenia [‘Wrestling’] [“Men’s Freestyle 65kg”]
ARENAS Lorena Female Colombia [‘Athletics’] [“Women’s 20km Race Walk”, ‘Marathon Race Walk Relay Mixed’]
McKENZIE Ashley Male Jamaica [‘Judo’] [‘Men -60 kg’]
BASS BITTAYE Gina Mariam Female Gambia [‘Athletics’] [“Women’s 100m”, “Women’s 200m”]
CAMARA Ebrahima Male Gambia [‘Athletics’] [“Men’s 100m”]
RUEDA SANTOS Lizeth Female Mexico [‘Triathlon’] [“Women’s Individual”]

Em seguida, removeremos todas as colunas que não tenham informações relevantes para as próximas análises. Também faremos a troca do nome da coluna code.x para code.

medals <- medals %>%
  select(-code.y, -name_short, -name_tv, -country_code, -country_full, -nationality, -nationality_full, -nationality_code, -birth_date.x, -birth_place, -birth_country, -residence_place, -residence_country, -nickname, -hobbies, -function., -occupation, -education, -family, -lang, -reason, -hero, -influence, -philosophy, -sporting_relatives, -ritual, -other_sports, -medal_code, -birth_date.y, -height, -weight, -url_event, -disciplines, -events)

medals <- medals %>%
  rename(code = code.x)

É importante levar em conta que alguns esportes são disputados em equipe. Isso significa que, para uma análise precisa, devemos contar apenas a primeira medalha conquistada por cada equipe. Para realizar essa tarefa, criaremos um data frame que inclui apenas os registros das primeiras medalhas obtidas por cada time. Além disso, removeremos da tabela todos os atletas que não ganharam medalhas.

clean_medals <- medals %>%
  filter(!is.na(medal_type))
unique_medals <- clean_medals %>%
  distinct(discipline, event, country, medal_type, team_gender, .keep_all = TRUE)

Faremos o mesmo tratamento, agora mantendo apenas os competidores do sexo feminino, criando um novo data frame contendo apenas mulheres.

female_medals <- clean_medals %>%
  filter(gender == "Female")
unique_medals_womans <- female_medals %>%
  distinct(event, country, medal_type, .keep_all = TRUE)

Contagem de medalhas

Abaixo podemos ver os 20 países com mais medalhas ganhas. É possível notar que, assim como os Estados Unidos é o país com o maior número de competidores, também possui o maior número de medalhas.

Ao analisar exclusivamente as medalhas conquistadas por mulheres, notamos que os Estados Unidos continuam a liderar o ranking. No entanto, observamos uma mudança nas posições inferiores. O Reino Unido avança para a terceira colocação, destacando-se em termos de conquistas femininas e superando a França, que assumia a terceira colocação no ranking geral, conforme ilustrado no gráfico anterior.

Ao analisar o progresso na conquista de medalhas ao longo do tempo, observamos que os Estados Unidos dominaram a competição desde o início. A França começou a competição em segundo lugar, mas, com o passar dos dias, foi superada pela China, que assumiu a posição de vice-líder.

Probabilidade de Vitória

Com base nos dados analisados, podemos calcular a probabilidade de um atleta conquistar uma medalha. Considerando que ele nasceu nos Estados Unidos, vamos utilizar a fórmula a seguir, para calcular:

\[ P(Vencer)= \frac{Atletas}{Medalhas} \] Como demonstrado abaixo, nascer nos Estados Unidos oferece a um atleta uma probabilidade superior a 50% de conquistar uma medalha durante as Olimpíadas. Este dado evidencia o significativo investimento dos EUA em seus atletas e sua sólida posição como uma potência competitiva no cenário esportivo global.

Ao analisar os dados do Brasil, notamos que a probabilidade de um atleta brasileiro conquistar uma medalha é relativamente baixa. Isso destaca a magnitude de cada vitória e ressalta o esforço e a superação de cada competidor brasileiro, evidenciando a importância e o valor de suas conquistas.

Conclusão

Após este estudo, podemos retirar as seguintes conclusões:

  • Igualdade de gênero
    • O estudo revela um avanço significativo rumo à igualdade de gênero nos esportes. Observa-se um aumento na participação feminina, refletindo o progresso em direção a uma maior equidade. Esse avanço é um importante passo para a sociedade, evidenciando que a inclusão e a igualdade estão se tornando pilares fundamentais em competições de alto nível.
  • A força dos EUA
    • Os Estados Unidos continuam a se destacar como a nação com os competidores mais fortes nas Olimpíadas. Além de enviar um grande número de atletas, o país conquistou uma quantidade impressionante de medalhas. Essa supremacia é um reflexo do investimento contínuo em treinamento e desenvolvimento esportivo. Para outras nações, alcançar o primeiro lugar do ranking exige um esforço substancial e uma estratégia eficaz para elevar seu nível de competição.
  • A superação do Brasil
    • Embora o desempenho do Brasil possa ser considerado discreto em comparação com os líderes do ranking, as conquistas dos atletas brasileiros são notáveis. As medalhas conquistadas, especialmente contra países com um histórico esportivo forte, destacam a determinação e a habilidade dos competidores brasileiros. Essas vitórias representam não apenas o resultado do esforço individual, mas também uma superação das adversidades. Os atletas brasileiros merecem reconhecimento e valorização por sua resiliência e dedicação.

Em resumo, a análise dos dados das Olimpíadas revela um panorama fascinante e dinâmico do esporte global. As tendências de igualdade de gênero, o domínio dos Estados Unidos e a superação do Brasil ilustram a evolução e a diversidade das competições. Estes insights não apenas celebram as conquistas dos atletas, mas também fornecem um ponto de partida para futuras estratégias e investimentos no esporte. A contínua observação e análise desses dados serão essenciais para promover um ambiente esportivo mais inclusivo e competitivo. O estudo demonstra que, independentemente dos desafios, a paixão pelo esporte e o compromisso com a excelência continuam a impulsionar atletas e nações a alcançar novos patamares.