Trabalho Biostatística

Author

Ana Prya Bartolo Gomes, Bruna Lacerda, Felipe Almada, Ismael de Jesus, Luiz Daniel Gonzalez de Sena, Michaelle Nery

##Lendo e vizualizando o arquivo do excel

library(readxl)
world_data_2023 <- read_excel("trabalho bioestatistica_files/world-data-2023.xlsx", 
    col_types = c("text", "text", "numeric", 
        "text", "text", "text", "numeric", 
        "text", "text", "numeric", "numeric", 
        "text", "text", "text", "text", "text", 
        "text", "text", "numeric"))
View(world_data_2023)

##Atribuindo o arquivo à dados e fazendo a tabela dos dados

library(gtsummary)
dados<-(world_data_2023)
tbl_summary(dados)

##Apagando variáveis em excesso

library(dados)
dados<- world_data_2023
dados$Latitude<-NULL
dados$Longitude<-NULL
dados$`Tax revenue (%)`<-NULL
dados$`Physicians per thousand`<-NULL
dados$`Armed Forces size`<-NULL
dados$`Capital/Major City`<-NULL
dados$`Currency-Code`<-NULL
dados$`Gasoline Price`<-NULL
dados$`Official language`<-NULL
dados$`Calling Code`<-NULL #não sei o que é isso
dados$`<-`<-NULL #não sei o que é isso
dados$`Gross tertiary education enrollment (%)`<- NULL
dados$`Maternal mortality ratio`<- NULL
dados$CPI<- NULL
dados$`CPI Change (%)`<-NULL
dados$`Largest city`<- NULL
dados$`Terras Agrícolas(%)`<-NULL
dados$`Land Area(Km2)`<-NULL
dados$População<-NULL
dados$`População Urbana`<-NULL
dados$`Taxa de Desemprego`<-NULL
dados$`Densidade (P/Km2)"`<-NULL
dados$`Taxa de Natalidade`<-NULL

#Fazendo uma nova tabela, agora sem as variáveis em excesso

library(gtsummary)
dados<-(dados)
tbl_summary(dados)

##Vendo a estrutura dos dados

str(dados)

##Traduzindo o nome de variáveis

colnames(dados)
colnames(dados)[10]<-"PIB"
colnames(dados)[18]<-"Matrícula Bruta no Ensino Primário"
colnames(dados)[19]<-"Mortalidade Infantil"

##Precisamos de no mínimo 2 variáveis quali e 2 quanti; vamos transformar uma quanti em quali através da criação de uma faixa de valores:

#Transformar PIB em qualitativa:

dados$PIB<-cut(dados$`PIB ($)`,c(0,3318716360,5354435962732,10712190641821,16069945320911,214277000000000))
levels(dados$`PIB ($)`)<-c("De 0 a 3318716360", "De 3318716360 a 5354435962732", "De 10712190641821 a 16069945320911","De 16069945320911 a 21427700000000 ", "Mais de 21427700000000")

#Transformar EMISSÃO DE CARBONO em qualitativa:

# world_data_2023$`Emissão de Co2`<-cut(world_data_2023$`Emissão de Co2`,c(0,1738,2471957,4945651,7419345,9893038))
# world_data_2023$`Emissão de Co2`

world_data_2023$`Emissão de Co2`
levels(world_data_2023$`Emissão de Co2`)<-c("De 0 a 1738", "De 1738 a 2471957", "De 4945651 a 7419345","De 7419345 a 9893038", "Mais de 9893038")

#Transformar MORTALIDADE INFANTIL em qualitativa:

# world_data_2023$`Infant mortality`<-cut(world_data_2023$`Infant mortality`,c(0,40,60,2000)) 

world_data_2023$`Infant mortality` 

levels(world_data_2023$`Infant mortality`)<-c("Até 40 mortes", "Mais que 40 mortes e até 60 mortes", "Mais que 60 mortes")

Perguntas e seus respctivos gráficos:

Criando o Gráfico com o uso de duas qualitativas:

O quanto o PIB aumenta de acordo com a quantidade de emissão de CO2?

str(world_data_2023)

library(ggplot2)

ggplot(world_data_2023) +
 aes(x = `Emissão de Co2`, y = `PIB ($)`) +
 geom_tile() +
 labs(x = " Emissões de dióxido de carbono em toneladas", 
 y = "PIB, valor total dos bens e serviços produzidos no país", title = "Emissão de C02 em relação ao PIB", 
 subtitle = "Um panorama global") +
 theme_minimal() +
 theme(plot.title = element_text(face = "bold", 
 hjust = 0.5), plot.subtitle = element_text(size = 13L, face = "italic", hjust = 0.5))

Criando o Gráfico com o uso de duas quantitativas:

A presença de maior área florestal aumenta a expectativa de vida da população?

library(readxl)
expect_vida <- read_excel("trabalho bioestatistica_files/expect_vida.xlsx", 
    col_types = c("text", "numeric", "numeric"))
View(expect_vida)


library(ggplot2)

ggplot(expect_vida) +
 aes(x = `Area Florestal(%)`, y = `Expectativa de Vida`) +
 geom_point(shape = "circle", 
 size = 1.5, colour = "#112446") +
 labs(x = "Área Florestal (%): Porcentagem de área coberta por florestas", 
 y = "Número médio de anos que se espera que um recém-nascido viva", title = "Expectativa de Vida relacionada à Área Florestal", 
 subtitle = "Um panorama global") +
 theme_minimal()

Criando o Gráfico com o uso de uma qualitativa e uma quantitativa:

Países com mais matrículas no ensino primário tem menor mortalidade infantil?

library(readxl)
mort_matri <- read_excel("trabalho bioestatistica_files/mort_matri.xlsx", 
    col_types = c("text", "numeric", "numeric"))
View(mort_matri)

mort_matri$`Infant mortality`<-cut(mort_matri$`Infant mortality`,c(0,40,60,2000)) 

mort_matri$`Infant mortality` 

levels(mort_matri$`Infant mortality`)<-c("Até 40 mortes", "Mais que 40 mortes e até 60 mortes", "Mais que 60 mortes")


library(dplyr)
library(ggplot2)

mort_matri %>%
 filter(`Matrícula Bruta no Ensino Primário (%)` >= 75 & `Matrícula Bruta no Ensino Primário (%)` <= 
 120.5) %>%
 filter(!is.na(`Infant mortality`)) %>%
 ggplot() +
 aes(x = `Matrícula Bruta no Ensino Primário (%)`, y = `Infant mortality`) +
 geom_boxplot(fill = "#112446") +
 labs(x = "Taxa bruta de matrícula no ensino primário (%)", y = "Mortalidade Infantil: Número de mortes por 1.000 nascidos vivos antes de completar um ano de idade", 
 title = "Mortalidade Infantil e a percentagem de matriculados no Ensino Primário", subtitle = "Um panorama global") +
 coord_flip() +
 theme_minimal() +
 theme(plot.title = element_text(face = "bold", hjust = 0.5), plot.subtitle = element_text(size = 13L, 
 face = "italic", hjust = 0.5))

#Gráfico complementar:

library(readxl)
maior_mortalidade_ <- read_excel("trabalho bioestatistica_files/maior_mortalidade,.xlsx", 
    col_types = c("text", "text", "text"))
View(maior_mortalidade_)


library(ggplot2)

ggplot(maior_mortalidade_) +
 aes(x = `Infant mortality`, y = `Gross primary education enrollment (%)`, 
 fill = País) +
 geom_tile() +
 scale_fill_hue(direction = 1) +
 labs(x = "Número de mortes por 1.000 nascidos vivos antes de completar um ano de idade", 
 y = "Taxa bruta de matrícula no ensino primário", title = "Mortalidade Infantil e a percentagem de matriculados no Ensino Primário", 
 subtitle = "Um recorte de quatro países") +
 theme_minimal() +
 theme(plot.title = element_text(face = "bold", 
 hjust = 0.5), plot.subtitle = element_text(size = 13L, face = "italic", hjust = 0.5))

Criando o Gráfico com o uso de duas quantitativas:

Como os impostos são direcionados para a saúde pública?

library(readxl)
world_data_2023 <- read_excel("trabalho bioestatistica_files/world-data-2023.xlsx", 
    col_types = c("text", "numeric", "numeric", 
        "text", "text", "text", "text", "text", 
        "text", "numeric", "text", "text", 
        "text", "numeric", "text", "text", 
        "numeric", "text", "text"))
View(world_data_2023)

library(ggplot2)

ggplot(world_data_2023) +
 aes(x = `Taxa Total de Imposto (%)`, y = `Despesas de Saúde do Próprio Bolso`) +
 geom_point(shape = "circle", size = 2.95, colour = "#0ADF79") +
 labs(x = "Taxa total de imposto (%)", 
 y = "Despesas de Saúde do Próprio Bolso (%)", title = "Como os impostos são direcionados para a saúde pública?") +
 theme_minimal() +
 theme(plot.title = element_text(size = 18L, face = "bold", hjust = 0.5), axis.title.y = element_text(size = 15L, 
 face = "bold"), axis.title.x = element_text(size = 15L, face = "bold"))

Criando o Gráfico com o uso de duas quantitativas:

Países com um salário mínimo mais elevado influenciam no aumento da taxa de fertilidade?

library(readxl)
fertilidade <- read_excel("trabalho bioestatistica_files/fertilidade.xlsx", 
    col_types = c("text", "numeric", "numeric"))
View(fertilidade)


library(dplyr)
library(ggplot2)

fertilidade %>%
 filter(!is.na(`Salário Mínimo`)) %>%
 ggplot() +
 aes(x = `Taxa de Fertilidade`, y = `Salário Mínimo`, fill = País) +
 geom_point(shape = "circle", 
 size = 1.5, colour = "#112446") +
 scale_fill_viridis_d(option = "magma", direction = -1) +
 labs(x = "Número médio de filhos nascidos de uma mulher durante a sua vida", 
 y = "Nível do salário mínimo em moeda local", title = "Relação entre Taxa de Fertilidade e Salário Mínimo", 
 subtitle = "Um panorama global") +
 theme_minimal() +
 theme(plot.title = element_text(face = "bold", 
 hjust = 0.5), plot.subtitle = element_text(size = 13L, face = "italic", hjust = 0.5))