library(pscl)
library(tidyverse)
library(tidymodels)
library(modelr) 
library(here)
library(janitor)
library(ggbeeswarm)
library(broom)


theme_set(theme_bw())

Os dados que vamos usar foram retirados desse estudo https://ourworldindata.org/life-expectancy que tenta compreender o que aconteceu com a expectativa de vida dos humanos desde 1800. Para isso, temos um conjundo de variaveis que buscam quantificar algumas caracteristicas que podem mudar essa espectativa, tal como morte infantil, uso de alcohol, campanhas de vacinação contra hepatiteb, polio, diphteria, mortes por aids a cada 1000 pessoas, tamanho da população, magreza de adolecentes e criança e escolaridade. Atravéz disso, vamos pegar uma amostra desses dados, onde examinaremos alguns paises que geram atenção desde 2000 até 2015.

paises = c("Brazil","Burundi","Canada","China","Germany","Japan","Mexico", "Russian Federation","Central African Republic", "United States of America")

life_exp<- read_csv(here('Life_Expectancy_Data.csv'), col_types = 'cdcddddddddddddddddddd') %>% 
  clean_names(., "lower_camel") %>% 
  filter(country %in% paises, !is.na(life_expectancy))

Expectativa de vida

Vamos começar com uma breve analise desses paises. Estamos mostrando a expectativa de vida nos mesmos.

life_exp %>%
  ggplot(aes(x= year, y = lifeExpectancy)) +
  geom_point(size=.9)+
  geom_line()+
  facet_wrap(~country)+
  labs(
    x = "Ano",
    y = "Expectativa de vida em anos"
  )

Em uma primeira analise podemos ver que :

Mortalidade de adultos

life_exp %>%
  ggplot(aes(x= year, y = adultMortality)) +
  geom_point(size=.9)+
  geom_line()+
  facet_wrap(~country)+
  labs(
    x = "Ano",
    y = "Mortalidade entre adultos"
  )

Dentre todos os paises, o que causa uma analise é a Federação russa, Burundi, republica africana centrao , os paises com expectativa de vida menores entre os observados, possuem peridos com grande mortalidade entre os adultos.

Mortalidade infantil

life_exp %>%
  ggplot(aes(x= year, y = adultMortality)) +
  geom_point(size=.9)+
  geom_line()+
  facet_wrap(~country)+
  labs(
    x = "Ano",
    y = "Mortalidade entre adultos"
  )

Podemos destacar aqui 2 paises, Brazil e a China, onde possuiam indices altos de mortes a cada 1000 crianças, e que conseguiram diminuir. China porém, em 2015, ficou na faixa de 150 mortes a cada 1000 crianças, enquanto no brasil, um pouco abaixo de 50 crianças.

Sumarios estatisticos

sumarios = life_exp %>%
  group_by(country) %>% 
  summarise(mediana_expectativa = median(lifeExpectancy),
            mediana_mortalidade_adulta = median(adultMortality),
            mediana_mortalidade_infantil = median(infantDeaths),
            .groups = "drop")
sumarios

temos que Central African Republic é o pais onde existe a maior media de probabilidade de morrer adulto e a china é o pais onde existem a maior media de mortes infantis a cada 1000 crianças nascidas.

sumarios %>% 
  mutate(country = fct_reorder(country, desc(mediana_expectativa))) %>% 
  ggplot(aes(x = country, y = mediana_expectativa))+
  coord_flip() +
  geom_point()+
  labs(y = "Mediana de expectativa de vida", x ="País")

Podemos ver que Japão é o pais com maior mediana na expectativa de vida, e Repulica da africa possui a menor.

sumarios %>% 
  mutate(country = fct_reorder(country, desc(mediana_mortalidade_adulta))) %>% 
  ggplot(aes(x = country, y = mediana_mortalidade_adulta))+
  coord_flip() +
  geom_point() +
  labs(y = "Mediana de mortalidade adulta", x ="País")

Temos os USA com pais com menor mediana de mortalidade adulta, enquanto Replublica Africana como a maior.

sumarios %>% 
  mutate(country = fct_reorder(country, desc(mediana_mortalidade_infantil))) %>% 
  ggplot(aes(x = country, y = mediana_mortalidade_infantil))+
  coord_flip() +
  geom_point() + 
  labs(y = "Mediana de mortalidade Infantil", x ="País")

Evidenciamos a china como o país com maior mediana na mortalidade infantil.

Como o que campanhas de vacinação influenciam na expectativa de vida de sua população.

regressao = lm(lifeExpectancy ~  polio + diphtheria + hepatitisB, data = life_exp)
tidy(regressao, conf.int = TRUE)
glance(regressao)
tidy(regressao, conf.int = TRUE)%>% 
  filter(term != "(Intercept)") %>% 
  ggplot(aes(x= reorder(term,estimate), y = estimate, ymin=conf.low, ymax = conf.high))+
  geom_linerange()+
  geom_point()+
  coord_flip() +
  labs(x = "Variaveis", y ="Estimativa")

Temos nossa função como lifeExpectancy = 47.6971 + polio * 0.0988 + diphtheria * 0.2750 - hepatitisB * 0.1046

Podemos afirmar que 2 das 3 campanhas de vacinação podem influenciar positivamente no aumento de expectativa de vida.

Entretanto, devemos que por mais que sua diferença seja positiva ou negativa, não existe uma grande mudança, pois no maximo, 0.4 em idade pode ser mudada . Porem, levando em consideração só a campanha de vacinação, sua influencia é de grande importancia para saude das crianças e consequentemente uma melhora na expectativa de vida.

Esse modelo explica 28 % da variavel de reposta(R2 = 0.2815348).

