library(readxl)
world_data_2023 <- read_excel("~/Custom Office Templates/world-data-2023.xltx",
col_types = c("text", "text", "numeric",
"numeric", "numeric", "numeric",
"numeric", "numeric", "numeric"))
View(world_data_2023)Trabalho Bioestatística
Pib para faixa
world_data_2023$`PIB ($)`<-cut(world_data_2023$`PIB ($)`,c(0, 14083906357,95503088538,21427700000000))
world_data_2023$`PIB ($)`
world_data_2023$`PIB ($)`
levels(world_data_2023$`PIB ($)`)<-c("Baixo", "Médio", "Alto")Emissões para faixa
world_data_2023$`Emissão de Co2 (toneladas)`<-cut(world_data_2023$`Emissão de Co2 (toneladas)`,c(0,2065,34693,9893038))
world_data_2023$`Emissão de Co2 (toneladas)`
world_data_2023$`Emissão de Co2 (toneladas)`
levels(world_data_2023$`Emissão de Co2 (toneladas)`)<-c("Baixo", "Médio", "Alto")Gráfico Emissões x PIB
# world_data_2023 %>%
# filter(!is.na(`Emissão de Co2 (toneladas)`)) %>%
# filter(!is.na(`PIB ($)`)) %>%
# ggplot() +
# aes(x = `Emissão de Co2 (toneladas)`, y = `PIB ($)`) +
# geom_tile() +
# theme_minimal()Taxa de Desemprego para faixa
world_data_2023$`Taxa de desemprego (%)`<-cut(world_data_2023$`Taxa de desemprego (%)`,c(0,14,29))
world_data_2023$`Taxa de desemprego (%)`
levels(world_data_2023$`Taxa de desemprego (%)`)<-c("Baixo", "Alto")Gráfico Taxa de Desemprego x Continente
world_data_2023$`Taxa de desemprego (%)` [1] Baixo Baixo Baixo Alto <NA> Baixo Baixo Baixo Baixo Alto Baixo Baixo
[13] Baixo <NA> Baixo <NA> Baixo Baixo <NA> <NA> Baixo Baixo Baixo <NA>
[25] Baixo Baixo Baixo Alto <NA> <NA> Baixo Baixo <NA> Baixo Baixo Alto
[37] <NA> Baixo Baixo Baixo Baixo <NA> Baixo <NA> Baixo Baixo Baixo Baixo
[49] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
[61] Baixo Alto Baixo Baixo Baixo Baixo Alto Baixo Baixo Baixo Baixo Baixo
[73] Baixo Baixo Alto Baixo Baixo Baixo Baixo Alto Alto Baixo Baixo Baixo
[85] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
[97] Baixo Baixo Baixo Baixo Baixo Baixo Alto Baixo Baixo Baixo Baixo Baixo
[109] Baixo Baixo Baixo Baixo Baixo Baixo Alto Baixo Baixo Alto Baixo Baixo
[121] Baixo Baixo Alto Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
[133] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Alto Baixo Baixo Baixo
[145] Alto Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
[157] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
[169] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Alto Baixo Baixo Baixo Baixo
[181] Baixo Baixo Baixo Baixo Baixo Alto Baixo <NA> <NA> <NA> <NA> <NA>
[193] <NA> <NA> <NA> Baixo
Levels: Baixo Alto
library(dplyr)
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
library(ggplot2)
world_data_2023 %>%
filter(!is.na(Continente)) %>%
filter(!is.na(`Taxa de desemprego (%)`)) %>%
ggplot() +
aes(x = Continente, fill = `Taxa de desemprego (%)`) +
geom_bar() +
scale_fill_hue(direction = 1) +
coord_flip() +
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5))Estrutura de World Data e Taxa de Desemprego como numérica
world_data_2023$`Taxa de desemprego (%)`<- as.numeric(world_data_2023$`Taxa de desemprego (%)`)
str(world_data_2023)Gráfico Taxa de Desemprego x Continente
world_data_2023 %>%
filter(!is.na(Continente)) %>%
filter(!is.na(`Área florestal (%)`)) %>%
filter(!is.na(`Taxa de desemprego (%)`)) %>%
ggplot() +
aes(x = Continente, y = `Taxa de desemprego (%)`) +
geom_boxplot(fill = "#112446") +
labs(title = "Taxa de desemprego por continente") +
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5))Descrição de Taxa de desemprego (mediana, VC, IQR)
library(summarytools)
descr(world_data_2023$`Taxa de desemprego (%)`)Descriptive Statistics
world_data_2023$`Taxa de desemprego (%)`
N: 196
Taxa de desemprego (%)
----------------- --------------------------
Mean 1.10
Std.Dev 0.30
Min 1.00
Q1 1.00
Median 1.00
Q3 1.00
Max 2.00
MAD 0.00
IQR 0.00
CV 0.27
Skewness 2.71
SE.Skewness 0.18
Kurtosis 5.36
N.Valid 176.00
Pct.Valid 89.80
Gráfico Salário Mínimo x Taxa de Natalidade
world_data_2023$`Taxa de natalidade`<- as.numeric(world_data_2023$`Taxa de natalidade`)
world_data_2023$`Salário Mínimo($)`<- as.numeric(world_data_2023$`Salário Mínimo($)`)
str(world_data_2023)tibble [196 × 9] (S3: tbl_df/tbl/data.frame)
$ País : chr [1:196] "Togo" "Tajikistan" "Uganda" "Botswana" ...
$ Continente : chr [1:196] "África" "Ásia" "África" "África" ...
$ Densidade (P/Km2) : num [1:196] 152 68 229 4 393 115 31 137 94 25 ...
$ Taxa de natalidade : num [1:196] 33.1 30.8 38.1 24.8 NA ...
$ Emissão de Co2 (toneladas): Factor w/ 3 levels "Baixo","Médio",..: 1 1 1 1 1 1 1 1 1 1 ...
$ Área florestal (%) : num [1:196] 3.1 3 9.7 18.9 33.3 12.5 51.3 41.2 7.8 8.1 ...
$ PIB ($) : Factor w/ 3 levels "Baixo","Médio",..: 1 1 2 2 1 3 2 2 2 2 ...
$ Salário Mínimo($) : num [1:196] 0.34 0.23 0.01 0.29 NA NA 3.14 0.27 0.25 0.41 ...
$ Taxa de desemprego (%) : num [1:196] 1 1 1 2 NA 1 1 1 1 2 ...
world_data_2023 %>%
filter(!is.na(`Taxa de natalidade`)) %>%
filter(!is.na(`Salário Mínimo($)`)) %>%
ggplot() +
geom_smooth(span = 1L) +
aes(x = `Salário Mínimo($)`, y = `Taxa de natalidade`) +
geom_point(shape = "circle", size = 1.5, colour = "#112446") +
labs(
title = "Influência do salário mínimo na taxa de natalidade"
) +
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5))`geom_smooth()` using method = 'loess' and formula = 'y ~ x'
Gráfico Densidade x Continente
library(dplyr)
library(ggplot2)
world_data_2023 %>%
filter(!is.na(Continente)) %>%
filter(!is.na(`Densidade (P/Km2)`)) %>%
ggplot() +
aes(x = Continente, weight = `Densidade (P/Km2)`) +
geom_bar(fill = "#112446") +
labs(y = "Densidade (P\\Km2)") +
theme_minimal()Área Florestal para faixa
world_data_2023$`Área florestal (%)`<- as.numeric(world_data_2023$`Área florestal (%)`)
world_data_2023$`Área florestal (%)`<-cut(world_data_2023$`Área florestal (%)`,c(0,31.8,98.3))
world_data_2023$`Área florestal (%)`
levels(world_data_2023$`Área florestal (%)`)<-c("Pouco extensa", "Extensa")Emissão de Co2 para faixa
world_data_2023$`Emissão de Co2 (toneladas)`<-as.numeric(world_data_2023$`Emissão de Co2 (toneladas)`)
world_data_2023$`Emissão de Co2 (toneladas)`<-cut(world_data_2023$`Emissão de Co2 (toneladas)`,c(0,2065,34693,9893038))
world_data_2023$`Emissão de Co2 (toneladas)`
world_data_2023$`Emissão de Co2 (toneladas)`
levels(world_data_2023$`Emissão de Co2 (toneladas)`)<-c("Baixo", "Médio", "Alto")Gráfico Emissão de Co2 x Área florestal
library(dplyr)
library(ggplot2)
world_data_2023 %>%
filter(!is.na(Continente)) %>%
filter(!is.na(`Taxa de natalidade`)) %>%
filter(!is.na(`Emissão de Co2 (toneladas)`)) %>%
filter(!is.na(`Área florestal (%)`)) %>%
filter(!is.na(`PIB ($)`)) %>%
filter(!is.na(`Salário Mínimo($)`)) %>%
filter(!is.na(`Taxa de desemprego (%)`)) %>%
ggplot() +
aes(x = `Emissão de Co2 (toneladas)`, fill = `Área florestal (%)`) +
geom_bar() +
scale_fill_hue(direction = 1) +
labs(y = " ") +
theme_minimal() Tabela Descritiva das variáveis numéricas:
library(summarytools)
descr(world_data_2023)Non-numerical variable(s) ignored: País, Continente, Emissão de Co2 (toneladas), Área florestal (%), PIB ($)
Descriptive Statistics
world_data_2023
N: 196
Densidade (P/Km2) Salário Mínimo($) Taxa de desemprego (%) Taxa de natalidade
----------------- ------------------- ------------------- ------------------------ --------------------
Mean 350.32 2.19 1.10 20.15
Std.Dev 1986.79 2.97 0.30 9.94
Min 1.38 0.01 1.00 5.90
Q1 34.00 0.40 1.00 11.15
Median 85.50 1.04 1.00 17.91
Q3 214.00 2.46 1.00 28.70
Max 26337.00 13.59 2.00 46.08
MAD 89.70 1.04 0.00 10.95
IQR 177.75 2.04 0.00 17.44
CV 5.67 1.35 0.27 0.49
Skewness 11.88 2.16 2.71 0.58
SE.Skewness 0.17 0.20 0.18 0.18
Kurtosis 149.24 3.97 5.36 -0.83
N.Valid 194.00 150.00 176.00 188.00
Pct.Valid 98.98 76.53 89.80 95.92