library(readxl)
world_data_2023 <- read_excel("trabalho bioestatistica_files/world-data-2023.xlsx",
col_types = c("text", "text", "numeric",
"text", "text", "text", "numeric",
"text", "text", "numeric", "numeric",
"text", "text", "text", "text", "text",
"text", "text", "numeric"))
View(world_data_2023)Trabalho Biostatística
##Lendo e vizualizando o arquivo do excel
##Atribuindo o arquivo à dados e fazendo a tabela dos dados
library(gtsummary)
dados<-(world_data_2023)
tbl_summary(dados)##Apagando variáveis em excesso
library(dados)
dados<- world_data_2023
dados$Latitude<-NULL
dados$Longitude<-NULL
dados$`Tax revenue (%)`<-NULL
dados$`Physicians per thousand`<-NULL
dados$`Armed Forces size`<-NULL
dados$`Capital/Major City`<-NULL
dados$`Currency-Code`<-NULL
dados$`Gasoline Price`<-NULL
dados$`Official language`<-NULL
dados$`Calling Code`<-NULL #não sei o que é isso
dados$`<-`<-NULL #não sei o que é isso
dados$`Gross tertiary education enrollment (%)`<- NULL
dados$`Maternal mortality ratio`<- NULL
dados$CPI<- NULL
dados$`CPI Change (%)`<-NULL
dados$`Largest city`<- NULL
dados$`Terras Agrícolas(%)`<-NULL
dados$`Land Area(Km2)`<-NULL
dados$População<-NULL
dados$`População Urbana`<-NULL
dados$`Taxa de Desemprego`<-NULL
dados$`Densidade (P/Km2)"`<-NULL
dados$`Taxa de Natalidade`<-NULL#Fazendo uma nova tabela, agora sem as variáveis em excesso
library(gtsummary)
dados<-(dados)
tbl_summary(dados)##Vendo a estrutura dos dados
str(dados)##Traduzindo o nome de variáveis
colnames(dados)
colnames(dados)[10]<-"PIB"
colnames(dados)[18]<-"Matrícula Bruta no Ensino Primário"
colnames(dados)[19]<-"Mortalidade Infantil"##Precisamos de no mínimo 2 variáveis quali e 2 quanti; vamos transformar uma quanti em quali através da criação de uma faixa de valores:
#Transformar PIB em qualitativa:
dados$PIB<-cut(dados$`PIB ($)`,c(0,3318716360,5354435962732,10712190641821,16069945320911,214277000000000))
levels(dados$`PIB ($)`)<-c("De 0 a 3318716360", "De 3318716360 a 5354435962732", "De 10712190641821 a 16069945320911","De 16069945320911 a 21427700000000 ", "Mais de 21427700000000")#Transformar EMISSÃO DE CARBONO em qualitativa:
# world_data_2023$`Emissão de Co2`<-cut(world_data_2023$`Emissão de Co2`,c(0,1738,2471957,4945651,7419345,9893038))
# world_data_2023$`Emissão de Co2`
world_data_2023$`Emissão de Co2`
levels(world_data_2023$`Emissão de Co2`)<-c("De 0 a 1738", "De 1738 a 2471957", "De 4945651 a 7419345","De 7419345 a 9893038", "Mais de 9893038")#Transformar MORTALIDADE INFANTIL em qualitativa:
# world_data_2023$`Infant mortality`<-cut(world_data_2023$`Infant mortality`,c(0,40,60,2000))
world_data_2023$`Infant mortality`
levels(world_data_2023$`Infant mortality`)<-c("Até 40 mortes", "Mais que 40 mortes e até 60 mortes", "Mais que 60 mortes")Perguntas e seus respctivos gráficos:
Criando o Gráfico com o uso de duas qualitativas:
O quanto o PIB aumenta de acordo com a quantidade de emissão de CO2?
str(world_data_2023)
library(ggplot2)
ggplot(world_data_2023) +
aes(x = `Emissão de Co2`, y = `PIB ($)`) +
geom_tile() +
labs(x = " Emissões de dióxido de carbono em toneladas",
y = "PIB, valor total dos bens e serviços produzidos no país", title = "Emissão de C02 em relação ao PIB",
subtitle = "Um panorama global") +
theme_minimal() +
theme(plot.title = element_text(face = "bold",
hjust = 0.5), plot.subtitle = element_text(size = 13L, face = "italic", hjust = 0.5))Criando o Gráfico com o uso de duas quantitativas:
A presença de maior área florestal aumenta a expectativa de vida da população?
library(readxl)
expect_vida <- read_excel("trabalho bioestatistica_files/expect_vida.xlsx",
col_types = c("text", "numeric", "numeric"))
View(expect_vida)
library(ggplot2)
ggplot(expect_vida) +
aes(x = `Area Florestal(%)`, y = `Expectativa de Vida`) +
geom_point(shape = "circle",
size = 1.5, colour = "#112446") +
labs(x = "Área Florestal (%): Porcentagem de área coberta por florestas",
y = "Número médio de anos que se espera que um recém-nascido viva", title = "Expectativa de Vida relacionada à Área Florestal",
subtitle = "Um panorama global") +
theme_minimal()Criando o Gráfico com o uso de uma qualitativa e uma quantitativa:
Países com mais matrículas no ensino primário tem menor mortalidade infantil?
library(readxl)
mort_matri <- read_excel("trabalho bioestatistica_files/mort_matri.xlsx",
col_types = c("text", "numeric", "numeric"))
View(mort_matri)
mort_matri$`Infant mortality`<-cut(mort_matri$`Infant mortality`,c(0,40,60,2000))
mort_matri$`Infant mortality`
levels(mort_matri$`Infant mortality`)<-c("Até 40 mortes", "Mais que 40 mortes e até 60 mortes", "Mais que 60 mortes")
library(dplyr)
library(ggplot2)
mort_matri %>%
filter(`Matrícula Bruta no Ensino Primário (%)` >= 75 & `Matrícula Bruta no Ensino Primário (%)` <=
120.5) %>%
filter(!is.na(`Infant mortality`)) %>%
ggplot() +
aes(x = `Matrícula Bruta no Ensino Primário (%)`, y = `Infant mortality`) +
geom_boxplot(fill = "#112446") +
labs(x = "Taxa bruta de matrícula no ensino primário (%)", y = "Mortalidade Infantil: Número de mortes por 1.000 nascidos vivos antes de completar um ano de idade",
title = "Mortalidade Infantil e a percentagem de matriculados no Ensino Primário", subtitle = "Um panorama global") +
coord_flip() +
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5), plot.subtitle = element_text(size = 13L,
face = "italic", hjust = 0.5))#Gráfico complementar:
library(readxl)
maior_mortalidade_ <- read_excel("trabalho bioestatistica_files/maior_mortalidade,.xlsx",
col_types = c("text", "text", "text"))
View(maior_mortalidade_)
library(ggplot2)
ggplot(maior_mortalidade_) +
aes(x = `Infant mortality`, y = `Gross primary education enrollment (%)`,
fill = País) +
geom_tile() +
scale_fill_hue(direction = 1) +
labs(x = "Número de mortes por 1.000 nascidos vivos antes de completar um ano de idade",
y = "Taxa bruta de matrícula no ensino primário", title = "Mortalidade Infantil e a percentagem de matriculados no Ensino Primário",
subtitle = "Um recorte de quatro países") +
theme_minimal() +
theme(plot.title = element_text(face = "bold",
hjust = 0.5), plot.subtitle = element_text(size = 13L, face = "italic", hjust = 0.5))Criando o Gráfico com o uso de duas quantitativas:
Como os impostos são direcionados para a saúde pública?
library(readxl)
world_data_2023 <- read_excel("trabalho bioestatistica_files/world-data-2023.xlsx",
col_types = c("text", "numeric", "numeric",
"text", "text", "text", "text", "text",
"text", "numeric", "text", "text",
"text", "numeric", "text", "text",
"numeric", "text", "text"))
View(world_data_2023)
library(ggplot2)
ggplot(world_data_2023) +
aes(x = `Taxa Total de Imposto (%)`, y = `Despesas de Saúde do Próprio Bolso`) +
geom_point(shape = "circle", size = 2.95, colour = "#0ADF79") +
labs(x = "Taxa total de imposto (%)",
y = "Despesas de Saúde do Próprio Bolso (%)", title = "Como os impostos são direcionados para a saúde pública?") +
theme_minimal() +
theme(plot.title = element_text(size = 18L, face = "bold", hjust = 0.5), axis.title.y = element_text(size = 15L,
face = "bold"), axis.title.x = element_text(size = 15L, face = "bold"))Criando o Gráfico com o uso de duas quantitativas:
Países com um salário mínimo mais elevado influenciam no aumento da taxa de fertilidade?
library(readxl)
fertilidade <- read_excel("trabalho bioestatistica_files/fertilidade.xlsx",
col_types = c("text", "numeric", "numeric"))
View(fertilidade)
library(dplyr)
library(ggplot2)
fertilidade %>%
filter(!is.na(`Salário Mínimo`)) %>%
ggplot() +
aes(x = `Taxa de Fertilidade`, y = `Salário Mínimo`, fill = País) +
geom_point(shape = "circle",
size = 1.5, colour = "#112446") +
scale_fill_viridis_d(option = "magma", direction = -1) +
labs(x = "Número médio de filhos nascidos de uma mulher durante a sua vida",
y = "Nível do salário mínimo em moeda local", title = "Relação entre Taxa de Fertilidade e Salário Mínimo",
subtitle = "Um panorama global") +
theme_minimal() +
theme(plot.title = element_text(face = "bold",
hjust = 0.5), plot.subtitle = element_text(size = 13L, face = "italic", hjust = 0.5))