RELATÓRIO FINAL DO CURSO DE ESTATÍSTICA APLICADA NA UNIVERSIDADE FEDERAL DO ESTADO DO RIO DE JANEIRO
PROFESSOR: STEVEN DUTT ROSS
INTEGRANTES:
Giovana Acioli Ferreira dos Santos - Matrícula: 20212520024
Email: giovanaacioli@edu.unirio.br
Giovanna Prata de Freitas Aquino - Matrícula: 20212520025
Email: giovannaprata@edu.unirio.br
Nathalia Victoria Alves Cavalcante Magalhães - Matrícula: 20212520035
Email: nathalia.vicmagalhaes@edu.unirio.br
Diego Duarcha Vianna - Matrícula: 2021252001
Email: diegoduarcha@edu.unirio.br
Primeiramente, foi fonte de uso uma base de dados retirada do site “kaggle.com”, a qual é de propriedade do autor Lucas Nascimento Moreira e tratada pelo mesmo, nomeada como “Dados históricos das Olimpíadas”, e abrange uma cobertura temporal de 1896 até 2016. Essa possui mais de 250 mil linhas e 15 colunas. Neste trabalho, algumas modificações foram realizadas nessa base de dados, devido ao tamanho temporal dela, não sendo nossa abordagem os anos de 1896 até 2016. Portanto, será explicado toda metodologia realizada.
Nesse sentido, após explorarmos nossa base, filtramos os anos e ficamos apenas com 1984 e 2016, para uma análise mais eficiente. Posteriormente, trabalhamos com a variável ano e idade, filtrando a base de dados para retirar os dados faltantes, a fim de termos essa completa. Com isso, criamos uma tabela contendo a mediana, média, mínimo, máximo e desvio padrão, utilizando o flextable para personalizá-la, com ambas variáveis, visualizando melhor a questão da evolução e da variabilidade de idade em relação a 1984 e 2016.
Outrossim, utilizamos as variáveis ano e sexo, e fizemos uma tabela de números absolutos com o flextable e um gráfico de barra com o ggplot, a fim de relacionar ambas e analisar se há uma desigualdade de gênero em relação ao número de jogadores e jogadoras em cada ano.
Ademais, unimos duas variáveis ano e sexo, tornando-a uma só: anosexo, para conseguirmos fazer uma tabela de números absolutos e gráfico de barra, por meio do ggplot relacionando ambas variáveis com as medalhas. Além disso, na variável medalha, foram retirados os dados faltantes, os quais impossibilitam observar os dados que possuímos, fazer o gráfico, e teste de hipótese, por exemplo. A partir disso, foi criado uma tabela de números absolutos com o flextable, um gráfico de barras através do ggplot, com a variável criada anosexo e , comparando as duas.
A posteriori, foi realizado o teste de hipóteses das variáveis ano e idade. Considerando que a base de dados é extensa, aplicamos o teste Anderson-Darling, pois tem função de analisar a normalidade de duas variáveis quantitativas. Em seguida, usamos o teste de correlação, a fim de determinar a relação das duas variáveis, se o ano interfere na idade dos atletas.
Além disso, fizemos o teste de hipóteses das variáveis ano e sexo. Tendo em vista que estamos analisando uma variável quantitativa (ano) e outra qualitativa( sexo), utilizamos o teste Shapiro-Wilk, objetivando concluir se os dados possuem ou não distribuição normal. Posteriormente, aplicamos o teste Wilcoxon, para deduzir se a variável ano influencia na distribuição de homens e mulheres.
Por fim, o último teste realizado foi em torno das variáveis anosexo e medalhas, por meio do teste Qui-Quadrado, já que é próprio para avaliar duas variáveis qualitativas. Assim,utilizamos ele para analisar a influência dos anos na distribuição de medalhas por sexo.
Dessa maneira, segue abaixo a base de dados utilizada para fins deste trabalho:
library(readr)
microdados <- read_csv("C:/Users/02aci/Downloads/microdados.csv")
library(dplyr)
library(flextable)
library(DT)
library(ggplot2)
library(prettydoc)
microdados2 <-microdados %>% filter(ano==1984 | ano==2016)
microdados2 <-microdados2 %>%
mutate(
anosexo = case_when(
ano == 1984 & sexo =="F" ~ "Feminino_1984",
ano == 1984 & sexo =="M" ~ "Masculino_1984",
ano == 2016 & sexo =="F" ~ "Feminino_2016",
ano == 2016 & sexo =="M" ~ "Masculino_2016",
TRUE ~ "outros"))
microdados_sem_dados_faltantes <- microdados2 %>% filter(is.na(medalha)==F)
microdados_sem_dados_faltantes2 <- microdados2 %>% filter(is.na(idade)==F)
microdados_sem_dados_faltantes2 <- microdados_sem_dados_faltantes %>% filter(is.na(idade)==F)
datatable(microdados2)microdados_sem_dados_faltantes2 %>% select(anosexo,idade) %>% group_by(anosexo) %>%
summarise(Mediana=median(idade,na.rm = T), Minimo=min(idade,na.rm = T),
Maximo=max(idade), Media=mean(idade),desvio_padrao=round(sd(idade),2))%>%
flextable() %>% theme_vader()anosexo | Mediana | Minimo | Maximo | Media | desvio_padrao |
Feminino_1984 | 23 | 14 | 52 | 23.00730 | 4.63 |
Feminino_2016 | 25 | 15 | 52 | 25.82972 | 4.81 |
Masculino_1984 | 24 | 17 | 50 | 24.85117 | 4.43 |
Masculino_2016 | 26 | 17 | 58 | 26.78083 | 5.41 |
No que se pode observar, concluímos que é possível analisar uma dispersão de dados. No que se refere a idade, é visto diversas idades diferentes, confirmando a grande abrangência de diferentes idades nessas olimpíadas, fato observado não apenas em 1984, como também em 2016. A tabela de números absolutos mostra a discrepância de dados, que variam de 14 anos até 52 anos em 1984, e de 15 anos até 58 anos em 2016. Em suma, podemos concluir que independente do ano ou do sexo, a idade possui distribuições diferentes e o ano não influencia nessa distribuição, sendo possível notar que a cada ano, a idade aumenta.
tabela1 <- table(microdados2$ano, microdados2$sexo) %>% data.frame()
tabela1 <- tabela1 %>% rename (Ano=Var1, Sexo=Var2, Quantidade=Freq)
tabela1 %>% flextable() %>% theme_vader()Ano | Sexo | Quantidade |
1984 | F | 2,983 |
2016 | F | 6,223 |
1984 | M | 8,605 |
2016 | M | 7,465 |
ggplot(microdados2) +
aes(x = ano, fill = sexo) +
geom_bar(position = "dodge") +
scale_fill_viridis_d(option = "cividis",
direction = 1) +
labs(x = ".", y = "Frequência", title = "ANO X SEXO") +
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5), axis.title.y = element_text(face = "bold"))Nesse gráfico, é possível analisar que, no ano de 1984, houve uma grande discrepância entre o número de participações dos atletas femininos e masculinos. Com isso, nota-se que as mulheres fazem parte da minoria, sendo quase a terça parte dos homens presentes nessas Olimpíadas. Assim, evidencia-se a desigualdade de gênero nesses Jogos, expressa no fato de que o sexo feminino não possuía espaço e incentivo para estarem em ambientes esportivos tanto quanto o sexo masculino. Enquanto, no ano de 2016, observa-se que a quantidade de participantes de ambos os sexos é mais equivalente. No entanto, as mulheres continuam tendo uma participação menor do que dos homens, tendo uma diferença de um pouco mais de mil pessoas. Esse cenário constata que a desigualdade de gênero permanece mesmo após muitos anos e que o sexo feminino continua com menos espaço e oportunidades nas Olímpiadas.
tabela345 <- table(microdados_sem_dados_faltantes$anosexo, microdados_sem_dados_faltantes$medalha) %>% data.frame()
tabela345 <- tabela345 %>% rename (Sexo_ano=Var1, Medalhas=Var2, Quantidade=Freq)
tabela345 %>% flextable() %>% theme_vader()Sexo_ano | Medalhas | Quantidade |
Feminino_1984 | Bronze | 182 |
Feminino_2016 | Bronze | 331 |
Masculino_1984 | Bronze | 394 |
Masculino_2016 | Bronze | 372 |
Feminino_1984 | Gold | 188 |
Feminino_2016 | Gold | 318 |
Masculino_1984 | Gold | 383 |
Masculino_2016 | Gold | 347 |
Feminino_1984 | Silver | 178 |
Feminino_2016 | Silver | 320 |
Masculino_1984 | Silver | 373 |
Masculino_2016 | Silver | 335 |
perf <- ggplot(microdados_sem_dados_faltantes) +
aes(x = anosexo, fill = medalha) +
geom_bar(position = "dodge") +
scale_fill_viridis_d(option = "cividis",
direction = 1) +
labs(x = ".", y = "Frequência", title = "ANO X SEXO X MEDALHA")+
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5), axis.title.y = element_text(face = "bold"))
perf+scale_fill_manual(values=c("#02075e","#f1f731","#9e9e8d"))No que se refere a distribuição de medalhas por sexo em cada ano, é possível perceber que as mulheres aumentaram o número de ganhos de todos os níveis de medalhas em 2016, quase duplicando seus números em relação a 1984. Além disso, os homens diminuíram em todos os níveis, uma perda pequena mas significativa. Desse modo, fica evidente que a inclusão das mulheres aumentou suas oportunidades e abriu espaço para crescer ainda mais esses números. No entanto, apesar da grande mudança, os homens ainda seguem ganhando mais medalhas, em todo os níveis, evidenciando que a luta pela igualdade dentro das olimpíadas ainda tem um longo caminho para percorrer.
modelo2 <- aov( idade ~ anosexo, data= microdados_sem_dados_faltantes2)
residuos2 <- residuals(modelo2)
shapiro.test(residuos2)##
## Shapiro-Wilk normality test
##
## data: residuos2
## W = 0.92571, p-value < 2.2e-16
options (scipen=999)
# p-value < 0.00000000000000022kruskal.test(idade ~ anosexo, data= microdados_sem_dados_faltantes2)##
## Kruskal-Wallis rank sum test
##
## data: idade by anosexo
## Kruskal-Wallis chi-squared = 246.04, df = 3, p-value < 2.2e-16
# p-value < 0.00000000000000022Após isso, realizamos o teste de comparação múltipla para comparar as 4 categorias entre elas e decidir se há alguma relação entre elas.
PMW <- pairwise.wilcox.test(microdados_sem_dados_faltantes2$idade, microdados_sem_dados_faltantes2$anosexo, p.adjust.method = "fdr")
PMW##
## Pairwise comparisons using Wilcoxon rank sum test with continuity correction
##
## data: microdados_sem_dados_faltantes2$idade and microdados_sem_dados_faltantes2$anosexo
##
## Feminino_1984 Feminino_2016 Masculino_1984
## Feminino_2016 < 2e-16 - -
## Masculino_1984 < 2e-16 1.1e-08 -
## Masculino_2016 < 2e-16 0.0012 < 2e-16
##
## P value adjustment method: fdr
modelo3 <- aov(ano ~ sexo, data= microdados_sem_dados_faltantes)
residuos3 <- residuals(modelo3)
shapiro.test(residuos3)##
## Shapiro-Wilk normality test
##
## data: residuos3
## W = 0.74399, p-value < 2.2e-16
options (scipen=999)
# p-value < 0.00000000000000022wilcox.test(ano ~ sexo, data = microdados_sem_dados_faltantes)##
## Wilcoxon rank sum test with continuity correction
##
## data: ano by sexo
## W = 1940113, p-value < 0.00000000000000022
## alternative hypothesis: true location shift is not equal to 0
# p-value < 0.00000000000000022tabela <- table (microdados_sem_dados_faltantes$anosexo, microdados_sem_dados_faltantes$medalha)
tabela##
## Bronze Gold Silver
## Feminino_1984 182 188 178
## Feminino_2016 331 318 320
## Masculino_1984 394 383 373
## Masculino_2016 372 347 335
teste_qui_quadrado <- chisq.test(tabela)
teste_qui_quadrado$expected##
## Bronze Gold Silver
## Feminino_1984 188.3612 182.0285 177.6103
## Feminino_2016 333.0693 321.8715 314.0591
## Masculino_1984 395.2835 381.9941 372.7224
## Masculino_2016 362.2859 350.1059 341.6082
teste_qui_quadrado##
## Pearson's Chi-squared test
##
## data: tabela
## X-squared = 1.0063, df = 6, p-value = 0.9854
options (scipen=999)Infere-se, portanto, que a partir de uma análise minuciosa e descritiva, as hipóteses trabalhadas foram confirmadas. Em primeira análise, nota-se a exacerbada abrangência de idades nos esportes olímpicos de ambos os sexos , incluindo desde pré- adolescentes até a faixa etária adulta. Todavia, os homens tiveram, em comparação ao ano de 1984, um aumento de sua faixa etária, em 2016, de 8 anos, como exibidas em uma tabela de números absolutos e gráfico de dispersão, possibilitando maior visualização e entendimento, dessa questão. Portanto, é notória a variedade de idades nas olimpíadas, tanto do sexo feminino quanto do masculino.
Em segunda análise, é lícito postular a quantidade de mulheres e dos homens nos jogos de 1984 e de 2016. No ano de 1984, devido a sociedade patriarcal, a qual dificultava e julgava a participação das mulheres nos esportes, observa-se que a gritante discrepância entre o gênero femino e o gênero masculino, uma vez que possuía apenas 2.983 atletas femininas em comparação a 8.605 atletas masculinos, sendo uma diferença de 5.622 atletas. Já em 2016, esse cenário extremista, alterou-se . Isso porque, com o passar dos anos, a questão da desigualdade de gênero e do machismo estrutural começou a fazer parte de debates, diálogos e questionamentos, além do aumento do poder de voz das mulheres, se comparado a 1984. Assim, o número de mulheres participantes foi de 6.223, sendo uma diferença de 3.240 mulheres em relação a 1984, e o número de homens foi de 7.465, reduzindo em 1.140 relacionando-se a 1984. Logo, é possível concluir que a participação das mulheres nas olimpíadas aumentaram significativamente com o passar dos anos e a dos homens diminuíram. No entanto, mesmo estando mais equilibrado essa quantidade, o sexo feminino ainda sim encontra-se em menor quantidade, ratificando a questão trabalhada ao longo desse trabalho: a da desigualdade de gênero nas olimpíadas e o menor espaço delas no ambiente olímpico. Desse modo, é necessário que a sociedade continue essa conscientização e o incentivo da participação feminina nos esportes.
Por fim, foi analisada a quantidade de medalhas ( ouro, prata e bronze) em consonância com o sexo e o ano. Em 1986, as mulheres ganharam no total 548 medalhas, e os homens 1150, sendo mais que a metade em comparação com o das mulheres. Isso ocorreu, devido a ínfima quantidade do gênero feminino nos jogos olímpicos, pela falta de estímulo, incentivo e principalmente pelo machismo, como citado anteriormente. Em 2016, as mulheres conquistaram 969 medalhas, aumentando notoriamente sua quantidade em relação a 2016, e o total de medalhas dos homens foi de 1090, diminuindo suas conquistas em comparação com 1984. Na tabela e gráfico, expostos anteriormente, percebe-se nitidamente essa situação: Enquanto nas mulheres houve um aumento nas três medalhas ,as dos homens diminuíram nas três. Dessa forma, essa situação ocorreu, dado que o gênero feminino, com o passar dos anos, foi sendo mais valorizado no meio esportivo, deixando de ser visto como “sexo frágil”, e tendo potencial de jogar igual ou melhor do que o genêro masculino, o que foi comprovado com esse aumento de medalhas conquistadas por mulheres e a diminuição das conquistadas pelos homens. Todavia, ainda há desafios de maior valorização, patrocínios e visibilidade pela população dessa questão, necessitando de meios para sanar, retardar, tal questão.
Nesse sentido, medidas são necessárias para reduzir a questão da desigualdade de gênero nas olimpíadas. Assim, o governo, responsável pelo bem-estar social, por meio de maior incentivo financeiro, deve aumentar o número de bolsas de atletas, incentivando, assim,maior participação nos esportes, principalmente bolsas atletas femininas. Outrossim, a mídia, como uns dos principais meios de comunicação e de influência no comportamento social, pode criar mais campanhas de divulgação de valorização e de expansão da cota feminina nos jogos, por meio de postagens frequentes, depoimentos de atletas mulheres, tanto na televisão quanto nas redes sociais. Logo, isso consequentemente aumentará a visibilidade das mulheres no esporte,desconstruindo visões machistas e antepassadas ainda infelizmente existentes no corpo social, e atraindo mais patrocínio, por exemplo de empresas privadas.
Portanto, essas são algumas propostas viáveis para reduzir a desigualdade de gênero nas olimpíadas, a médio- longo prazo, já que tal problemática está intrínseca na sociedade a anos.
Swaddling, Judith (2000). The Ancient Olympic Games 2 ed. Austin: University of Texas Press. 54 páginas. Consultado em 03 de agosto de 2022
As mulheres no esporte: 3 mil anos proibidas nas Olimpíadas. Disponível em: https://blogdoenem.com.br/as-mulheres-no-esporte-ficaram-3-mil-anos-proibidas-nas-olimpiadas/. Consultado em 03 de agosto de 2022
The Olympic Flags and Emblem. The Vancouver Organizing Committee for the 2010 Olympic and Paralympic Winter Games. Consultado em 03 de agosto de 2022
Olympic Sports of the Past. International Olympic Committee. Consultado em 03 de agosto de 2022
Sports. International Olympic Committee. Consultado em 03 de agosto de 2022
FERNANDES, Cláudio. “Olimpíadas”; Brasil Escola. Disponível em: https://brasilescola.uol.com.br/educacao-fisica/olimpiadas.htm. Acesso em 04 de agosto de 2022.
Olympic Games - the Medal Ceremonies (registration required). Encyclopædia Britannica. Consultado em 03 de agosto de 2022