library(pscl)
library(tidyverse)
library(tidymodels)
library(modelr) 
library(here)
library(janitor)
library(ggbeeswarm)
library(broom)


theme_set(theme_bw())

Os dados que vamos usar foram retirados desse estudo https://ourworldindata.org/life-expectancy que tenta compreender o que aconteceu com a expectativa de vida dos humanos desde 1800. Para isso, temos um conjundo de variaveis que buscam quantificar algumas caracteristicas que podem mudar essa espectativa, tal como morte infantil, uso de alcohol, campanhas de vacinação contra hepatiteb, polio, diphteria, mortes por aids a cada 1000 pessoas, tamanho da população, magreza de adolecentes e criança e escolaridade. Atravéz disso, vamos pegar uma amostra desses dados, onde examinaremos alguns paises que geram atenção desde 2000 até 2015.

paises = c("Brazil","Burundi","Canada","China","Germany","Japan","Mexico", "Russian Federation","Central African Republic", "United States of America")

life_exp<- read_csv(here('Life_Expectancy_Data.csv'), col_types = 'cdcddddddddddddddddddd') %>% 
  clean_names(., "lower_camel") %>% 
  filter(country %in% paises, !is.na(life_expectancy))

Expectativa de vida

Vamos começar com uma breve analise desses paises. Estamos mostrando a expectativa de vida nos mesmos.

life_exp %>%
  ggplot(aes(x= year, y = lifeExpectancy)) +
  geom_point(size=.9)+
  geom_line()+
  facet_wrap(~country)+
  labs(
    x = "Ano",
    y = "Expectativa de vida em anos"
  )

Em uma primeira analise podemos ver que :

Mortalidade de adultos

life_exp %>%
  ggplot(aes(x= year, y = adultMortality)) +
  geom_point(size=.9)+
  geom_line()+
  facet_wrap(~country)+
  labs(
    x = "Ano",
    y = "Mortalidade entre adultos"
  )

Dentre todos os paises, o que causa uma analise é a Federação russa, Burundi, republica africana centrao , os paises com expectativa de vida menores entre os observados, possuem peridos com grande mortalidade entre os adultos.

Mortalidade infantil

life_exp %>%
  ggplot(aes(x= year, y = adultMortality)) +
  geom_point(size=.9)+
  geom_line()+
  facet_wrap(~country)+
  labs(
    x = "Ano",
    y = "Mortalidade entre adultos"
  )

Podemos destacar aqui 2 paises, Brazil e a China, onde possuiam indices altos de mortes a cada 1000 crianças, e que conseguiram diminuir. China porém, em 2015, ficou na faixa de 150 mortes a cada 1000 crianças, enquanto no brasil, um pouco abaixo de 50 crianças.

Sumarios estatisticos

sumarios = life_exp %>%
  group_by(country) %>% 
  summarise(mediana_expectativa = median(lifeExpectancy),
            mediana_mortalidade_adulta = median(adultMortality),
            mediana_mortalidade_infantil = median(infantDeaths),
            .groups = "drop")
sumarios

temos que Central African Republic é o pais onde existe a maior media de probabilidade de morrer adulto e a china é o pais onde existem a maior media de mortes infantis a cada 1000 crianças nascidas.

sumarios %>% 
  mutate(country = fct_reorder(country, desc(mediana_expectativa))) %>% 
  ggplot(aes(x = country, y = mediana_expectativa))+
  coord_flip() +
  geom_point()+
  labs(y = "Mediana de expectativa de vida", x ="País")

Podemos ver que Japão é o pais com maior mediana na expectativa de vida, e Repulica da africa possui a menor.

sumarios %>% 
  mutate(country = fct_reorder(country, desc(mediana_mortalidade_adulta))) %>% 
  ggplot(aes(x = country, y = mediana_mortalidade_adulta))+
  coord_flip() +
  geom_point() +
  labs(y = "Mediana de mortalidade adulta", x ="País")

Temos os USA com pais com menor mediana de mortalidade adulta, enquanto Replublica Africana como a maior.

sumarios %>% 
  mutate(country = fct_reorder(country, desc(mediana_mortalidade_infantil))) %>% 
  ggplot(aes(x = country, y = mediana_mortalidade_infantil))+
  coord_flip() +
  geom_point() + 
  labs(y = "Mediana de mortalidade Infantil", x ="País")

Evidenciamos a china como o país com maior mediana na mortalidade infantil.

Como o que campanhas de vacinação influenciam na expectativa de vida de sua população.

regressao = lm(lifeExpectancy ~  polio + diphtheria + hepatitisB, data = life_exp)
tidy(regressao, conf.int = TRUE)
glance(regressao)
tidy(regressao, conf.int = TRUE)%>% 
  filter(term != "(Intercept)") %>% 
  ggplot(aes(x= reorder(term,estimate), y = estimate, ymin=conf.low, ymax = conf.high))+
  geom_linerange()+
  geom_point()+
  coord_flip() +
  labs(x = "Variaveis", y ="Estimativa")

Temos nossa função como lifeExpectancy = 47.6971 + polio * 0.0988 + diphtheria * 0.2750 - hepatitisB * 0.1046

Podemos afirmar que 2 das 3 campanhas de vacinação podem influenciar positivamente no aumento de expectativa de vida.

Entretanto, devemos que por mais que sua diferença seja positiva ou negativa, não existe uma grande mudança, pois no maximo, 0.4 em idade pode ser mudada . Porem, levando em consideração só a campanha de vacinação, sua influencia é de grande importancia para saude das crianças e consequentemente uma melhora na expectativa de vida.

Esse modelo explica 28 % da variavel de reposta(R2 = 0.2815348).

---
title: "Analise sobre expectativa de vida"
output: html_notebook
---

```{r error=FALSE, message=FALSE, warning=TRUE, paged.print=FALSE}
library(pscl)
library(tidyverse)
library(tidymodels)
library(modelr) 
library(here)
library(janitor)
library(ggbeeswarm)
library(broom)


theme_set(theme_bw())
```

Os dados que vamos usar foram retirados desse estudo <https://ourworldindata.org/life-expectancy> que tenta compreender o que aconteceu com a expectativa de vida dos humanos desde 1800. Para isso, temos um conjundo de variaveis que buscam quantificar algumas caracteristicas que podem mudar essa espectativa, tal como morte infantil, uso de alcohol, campanhas de vacinação contra hepatiteb, polio, diphteria, mortes por aids a cada 1000 pessoas, tamanho da população, magreza de adolecentes e criança e escolaridade. Atravéz disso, vamos pegar uma amostra desses dados, onde examinaremos alguns paises que geram atenção desde 2000 até 2015.

```{r}
paises = c("Brazil","Burundi","Canada","China","Germany","Japan","Mexico", "Russian Federation","Central African Republic", "United States of America")

life_exp<- read_csv(here('Life_Expectancy_Data.csv'), col_types = 'cdcddddddddddddddddddd') %>% 
  clean_names(., "lower_camel") %>% 
  filter(country %in% paises, !is.na(life_expectancy))
```

## Expectativa de vida

Vamos começar com uma breve analise desses paises. Estamos mostrando a expectativa de vida nos mesmos.

```{r}
life_exp %>%
  ggplot(aes(x= year, y = lifeExpectancy)) +
  geom_point(size=.9)+
  geom_line()+
  facet_wrap(~country)+
  labs(
    x = "Ano",
    y = "Expectativa de vida em anos"
  )
```

Em uma primeira analise podemos ver que :

-   Paises africanos com Burindi e Republica africana central são os paises onde os valores de expectativa de vida são os menores dentre todos os outros, não possuindo valores acima de 60 anos de idade.

-   A Federação Russa parte de um ponto de aprox 65 anos em 2000 até aprox 75 anos em 2015 constando como uma grande evolução no decorrer desse 15 anos.

-   Paises como Japão, Alemanha e Canada parecem possuir em todos os anos valores de expectativa de vida acima dos 80 anos, tendo Alemanha e Canada com algumas oscilaçoes nesse periodo.

-   Paises como Brasil, China, USA, Mexico estão no meio termo da expectativa de vida, entre 70 e 80 anos.

## Mortalidade de adultos

```{r}
life_exp %>%
  ggplot(aes(x= year, y = adultMortality)) +
  geom_point(size=.9)+
  geom_line()+
  facet_wrap(~country)+
  labs(
    x = "Ano",
    y = "Mortalidade entre adultos"
  )
```

Dentre todos os paises, o que causa uma analise é a Federação russa, Burundi, republica africana centrao , os paises com expectativa de vida menores entre os observados, possuem peridos com grande mortalidade entre os adultos.

## Mortalidade infantil

```{r}
life_exp %>%
  ggplot(aes(x= year, y = infantDeaths)) +
  geom_point(size=.9)+
  geom_line()+
  facet_wrap(~country)+
  labs(
    x = "Ano",
    y = "Mortalidade infantil"
  )
```

Podemos destacar aqui 2 paises, Brazil e a China, onde possuiam indices altos de mortes a cada 1000 crianças, e que conseguiram diminuir. China porém, em 2015, ficou na faixa de 150 mortes a cada 1000 crianças, enquanto no brasil, um pouco abaixo de 50 crianças.

## Sumarios estatisticos

```{r}
sumarios = life_exp %>%
  group_by(country) %>% 
  summarise(mediana_expectativa = median(lifeExpectancy),
            mediana_mortalidade_adulta = median(adultMortality),
            mediana_mortalidade_infantil = median(infantDeaths),
            .groups = "drop")
sumarios
```

temos que Central African Republic é o pais onde existe a maior media de probabilidade de morrer adulto e a china é o pais onde existem a maior media de mortes infantis a cada 1000 crianças nascidas.

```{r}
sumarios %>% 
  mutate(country = fct_reorder(country, desc(mediana_expectativa))) %>% 
  ggplot(aes(x = country, y = mediana_expectativa))+
  coord_flip() +
  geom_point()+
  labs(y = "Mediana de expectativa de vida", x ="País")
```

Podemos ver que Japão é o pais com maior mediana na expectativa de vida, e Repulica da africa possui a menor.

```{r}
sumarios %>% 
  mutate(country = fct_reorder(country, desc(mediana_mortalidade_adulta))) %>% 
  ggplot(aes(x = country, y = mediana_mortalidade_adulta))+
  coord_flip() +
  geom_point() +
  labs(y = "Mediana de mortalidade adulta", x ="País")
```

Temos os USA com pais com menor mediana de mortalidade adulta, enquanto Replublica Africana como a maior.

```{r}
sumarios %>% 
  mutate(country = fct_reorder(country, desc(mediana_mortalidade_infantil))) %>% 
  ggplot(aes(x = country, y = mediana_mortalidade_infantil))+
  coord_flip() +
  geom_point() + 
  labs(y = "Mediana de mortalidade Infantil", x ="País")
```

Evidenciamos a china como o país com maior mediana na mortalidade infantil.

## Como o que campanhas de vacinação influenciam na expectativa de vida de sua população.

```{r}
regressao = lm(lifeExpectancy ~  polio + diphtheria + hepatitisB, data = life_exp)
tidy(regressao, conf.int = TRUE)
glance(regressao)
```

```{r}
tidy(regressao, conf.int = TRUE)%>% 
  filter(term != "(Intercept)") %>% 
  ggplot(aes(x= reorder(term,estimate), y = estimate, ymin=conf.low, ymax = conf.high))+
  geom_linerange()+
  geom_point()+
  coord_flip() +
  labs(x = "Variaveis", y ="Estimativa")
```

Temos nossa função como lifeExpectancy = 47.6971 + polio \* 0.0988 + diphtheria \* 0.2750 - hepatitisB \* 0.1046

Podemos afirmar que 2 das 3 campanhas de vacinação podem influenciar positivamente no aumento de expectativa de vida.

-   polio com valor estimado de 0.0988, possui um intevalo de confiança entre [-0.0008, 0.1984] com 95% de confiança, ou seja, ela pode gerar ou não influencia positiva na expectativa de vida.

-   diphteria entretanto, com seu IC a 95 % de confiança[0.1600, 0.3900] estima que sua mudança é positiva.

-   hepatite b influencia negativamente na expectativa de vida, contrariando as espectativas IC[-0.1593,- 0.0498]

Entretanto, devemos que por mais que sua diferença seja positiva ou negativa, não existe uma grande mudança, pois no maximo, 0.4 em idade pode ser mudada . Porem, levando em consideração só a campanha de vacinação, sua influencia é de grande importancia para saude das crianças e consequentemente uma melhora na expectativa de vida.

Esse modelo explica 28 % da variavel de reposta(R2 = 0.2815348).
