Trabalho Bioestatística

Author

Ana Prya Bartolo Gomes, Bruna Lacerda, Felipe Almada, Ismael de Jesus, Luiz Daniel Gonzalez de Sena, Michaelle Nery

library(readxl)
world_data_2023 <- read_excel("~/Custom Office Templates/world-data-2023.xltx", 
    col_types = c("text", "text", "numeric", 
        "numeric", "numeric", "numeric", 
        "numeric", "numeric", "numeric"))
View(world_data_2023)

Pib para faixa

world_data_2023$`PIB ($)`<-cut(world_data_2023$`PIB ($)`,c(0, 14083906357,95503088538,21427700000000))
world_data_2023$`PIB ($)`

world_data_2023$`PIB ($)`
levels(world_data_2023$`PIB ($)`)<-c("Baixo", "Médio", "Alto")

Emissões para faixa

world_data_2023$`Emissão de Co2 (toneladas)`<-cut(world_data_2023$`Emissão de Co2 (toneladas)`,c(0,2065,34693,9893038))
world_data_2023$`Emissão de Co2 (toneladas)`
 
world_data_2023$`Emissão de Co2 (toneladas)`
levels(world_data_2023$`Emissão de Co2 (toneladas)`)<-c("Baixo", "Médio", "Alto")

Gráfico Emissões x PIB

# world_data_2023 %>%
#  filter(!is.na(`Emissão de Co2 (toneladas)`)) %>%
#  filter(!is.na(`PIB ($)`)) %>%
#  ggplot() +
#   aes(x = `Emissão de Co2 (toneladas)`, y = `PIB ($)`) +
#   geom_tile() +
#   theme_minimal()

Taxa de Desemprego para faixa

world_data_2023$`Taxa de desemprego (%)`<-cut(world_data_2023$`Taxa de desemprego (%)`,c(0,14,29))
world_data_2023$`Taxa de desemprego (%)`
levels(world_data_2023$`Taxa de desemprego (%)`)<-c("Baixo", "Alto")

Gráfico Taxa de Desemprego x Continente

world_data_2023$`Taxa de desemprego (%)`
  [1] Baixo Baixo Baixo Alto  <NA>  Baixo Baixo Baixo Baixo Alto  Baixo Baixo
 [13] Baixo <NA>  Baixo <NA>  Baixo Baixo <NA>  <NA>  Baixo Baixo Baixo <NA> 
 [25] Baixo Baixo Baixo Alto  <NA>  <NA>  Baixo Baixo <NA>  Baixo Baixo Alto 
 [37] <NA>  Baixo Baixo Baixo Baixo <NA>  Baixo <NA>  Baixo Baixo Baixo Baixo
 [49] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
 [61] Baixo Alto  Baixo Baixo Baixo Baixo Alto  Baixo Baixo Baixo Baixo Baixo
 [73] Baixo Baixo Alto  Baixo Baixo Baixo Baixo Alto  Alto  Baixo Baixo Baixo
 [85] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
 [97] Baixo Baixo Baixo Baixo Baixo Baixo Alto  Baixo Baixo Baixo Baixo Baixo
[109] Baixo Baixo Baixo Baixo Baixo Baixo Alto  Baixo Baixo Alto  Baixo Baixo
[121] Baixo Baixo Alto  Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
[133] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Alto  Baixo Baixo Baixo
[145] Alto  Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
[157] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo Baixo
[169] Baixo Baixo Baixo Baixo Baixo Baixo Baixo Alto  Baixo Baixo Baixo Baixo
[181] Baixo Baixo Baixo Baixo Baixo Alto  Baixo <NA>  <NA>  <NA>  <NA>  <NA> 
[193] <NA>  <NA>  <NA>  Baixo
Levels: Baixo Alto
library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
library(ggplot2)

world_data_2023 %>%
 filter(!is.na(Continente)) %>%
 filter(!is.na(`Taxa de desemprego (%)`)) %>%
 ggplot() +
 aes(x = Continente, fill = `Taxa de desemprego (%)`) +
 geom_bar() +
 scale_fill_hue(direction = 1) +
 coord_flip() +
 theme_minimal() +
 theme(plot.title = element_text(face = "bold", hjust = 0.5))

Estrutura de World Data e Taxa de Desemprego como numérica

world_data_2023$`Taxa de desemprego (%)`<- as.numeric(world_data_2023$`Taxa de desemprego (%)`)
str(world_data_2023)

Gráfico Taxa de Desemprego x Continente

 world_data_2023 %>%
 filter(!is.na(Continente)) %>%
 filter(!is.na(`Área florestal (%)`)) %>%
 filter(!is.na(`Taxa de desemprego (%)`)) %>%
 ggplot() +
  aes(x = Continente, y = `Taxa de desemprego (%)`) +
  geom_boxplot(fill = "#112446") +
  labs(title = "Taxa de desemprego por continente") +
  theme_minimal() +
  theme(plot.title = element_text(face = "bold", hjust = 0.5))

Descrição de Taxa de desemprego (mediana, VC, IQR)

library(summarytools)
descr(world_data_2023$`Taxa de desemprego (%)`)
Descriptive Statistics  
world_data_2023$`Taxa de desemprego (%)`  
N: 196  

                      Taxa de desemprego (%)
----------------- --------------------------
             Mean                       1.10
          Std.Dev                       0.30
              Min                       1.00
               Q1                       1.00
           Median                       1.00
               Q3                       1.00
              Max                       2.00
              MAD                       0.00
              IQR                       0.00
               CV                       0.27
         Skewness                       2.71
      SE.Skewness                       0.18
         Kurtosis                       5.36
          N.Valid                     176.00
        Pct.Valid                      89.80

Gráfico Salário Mínimo x Taxa de Natalidade

world_data_2023$`Taxa de natalidade`<- as.numeric(world_data_2023$`Taxa de natalidade`)
world_data_2023$`Salário Mínimo($)`<- as.numeric(world_data_2023$`Salário Mínimo($)`)
str(world_data_2023)
tibble [196 × 9] (S3: tbl_df/tbl/data.frame)
 $ País                      : chr [1:196] "Togo" "Tajikistan" "Uganda" "Botswana" ...
 $ Continente                : chr [1:196] "África" "Ásia" "África" "África" ...
 $ Densidade (P/Km2)         : num [1:196] 152 68 229 4 393 115 31 137 94 25 ...
 $ Taxa de natalidade        : num [1:196] 33.1 30.8 38.1 24.8 NA ...
 $ Emissão de Co2 (toneladas): Factor w/ 3 levels "Baixo","Médio",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ Área florestal (%)        : num [1:196] 3.1 3 9.7 18.9 33.3 12.5 51.3 41.2 7.8 8.1 ...
 $ PIB ($)                   : Factor w/ 3 levels "Baixo","Médio",..: 1 1 2 2 1 3 2 2 2 2 ...
 $ Salário Mínimo($)         : num [1:196] 0.34 0.23 0.01 0.29 NA NA 3.14 0.27 0.25 0.41 ...
 $ Taxa de desemprego (%)    : num [1:196] 1 1 1 2 NA 1 1 1 1 2 ...
world_data_2023 %>%
 filter(!is.na(`Taxa de natalidade`)) %>%
 filter(!is.na(`Salário Mínimo($)`)) %>%
 ggplot() +
  geom_smooth(span = 1L) +
  aes(x = `Salário Mínimo($)`, y = `Taxa de natalidade`) +
  geom_point(shape = "circle", size = 1.5, colour = "#112446") +
  labs(
    title = "Influência do salário mínimo na taxa de natalidade"
  ) +
  theme_minimal() +
  theme(plot.title = element_text(face = "bold", hjust = 0.5))
`geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Gráfico Densidade x Continente

library(dplyr)
library(ggplot2)

world_data_2023 %>%
 filter(!is.na(Continente)) %>%
 filter(!is.na(`Densidade (P/Km2)`)) %>%
 ggplot() +
 aes(x = Continente, weight = `Densidade (P/Km2)`) +
 geom_bar(fill = "#112446") +
 labs(y = "Densidade (P\\Km2)") +
 theme_minimal()

Área Florestal para faixa

world_data_2023$`Área florestal (%)`<- as.numeric(world_data_2023$`Área florestal (%)`)

world_data_2023$`Área florestal (%)`<-cut(world_data_2023$`Área florestal (%)`,c(0,31.8,98.3))

world_data_2023$`Área florestal (%)`
levels(world_data_2023$`Área florestal (%)`)<-c("Pouco extensa", "Extensa")

Emissão de Co2 para faixa

world_data_2023$`Emissão de Co2 (toneladas)`<-as.numeric(world_data_2023$`Emissão de Co2 (toneladas)`)

world_data_2023$`Emissão de Co2 (toneladas)`<-cut(world_data_2023$`Emissão de Co2 (toneladas)`,c(0,2065,34693,9893038))
world_data_2023$`Emissão de Co2 (toneladas)`
 
world_data_2023$`Emissão de Co2 (toneladas)`
levels(world_data_2023$`Emissão de Co2 (toneladas)`)<-c("Baixo", "Médio", "Alto")

Gráfico Emissão de Co2 x Área florestal

library(dplyr)
library(ggplot2)

world_data_2023 %>%
 filter(!is.na(Continente)) %>%
 filter(!is.na(`Taxa de natalidade`)) %>%
 filter(!is.na(`Emissão de Co2 (toneladas)`)) %>%
 filter(!is.na(`Área florestal (%)`)) %>%
 filter(!is.na(`PIB ($)`)) %>%
 filter(!is.na(`Salário Mínimo($)`)) %>%
 filter(!is.na(`Taxa de desemprego (%)`)) %>%
 ggplot() +
 aes(x = `Emissão de Co2 (toneladas)`, fill = `Área florestal (%)`) +
 geom_bar() +
 scale_fill_hue(direction = 1) +
 labs(y = " ") +
 theme_minimal()   

Tabela Descritiva das variáveis numéricas:

library(summarytools)
descr(world_data_2023)
Non-numerical variable(s) ignored: País, Continente, Emissão de Co2 (toneladas), Área florestal (%), PIB ($)
Descriptive Statistics  
world_data_2023  
N: 196  

                    Densidade (P/Km2)   Salário Mínimo($)   Taxa de desemprego (%)   Taxa de natalidade
----------------- ------------------- ------------------- ------------------------ --------------------
             Mean              350.32                2.19                     1.10                20.15
          Std.Dev             1986.79                2.97                     0.30                 9.94
              Min                1.38                0.01                     1.00                 5.90
               Q1               34.00                0.40                     1.00                11.15
           Median               85.50                1.04                     1.00                17.91
               Q3              214.00                2.46                     1.00                28.70
              Max            26337.00               13.59                     2.00                46.08
              MAD               89.70                1.04                     0.00                10.95
              IQR              177.75                2.04                     0.00                17.44
               CV                5.67                1.35                     0.27                 0.49
         Skewness               11.88                2.16                     2.71                 0.58
      SE.Skewness                0.17                0.20                     0.18                 0.18
         Kurtosis              149.24                3.97                     5.36                -0.83
          N.Valid              194.00              150.00                   176.00               188.00
        Pct.Valid               98.98               76.53                    89.80                95.92