preparar datos para gráficas
library(readr)
library(dplyr)
library(tidyr)
library(ggplot2)
library(stringr)
require(RCurl)
locale(date_names = "es", date_format = "%AD", time_format = "%AT",
decimal_mark = ",", grouping_mark = ".", tz = "UTC",
encoding = "UTF-8", asciify = FALSE)
## <locale>
## Numbers: 123.456,78
## Formats: %AD / %AT
## Timezone: UTC
## Encoding: UTF-8
## <date_names>
## Days: domingo (dom.), lunes (lun.), martes (mar.), miércoles (mié.), jueves
## (jue.), viernes (vie.), sábado (sáb.)
## Months: enero (ene.), febrero (feb.), marzo (mar.), abril (abr.), mayo (may.),
## junio (jun.), julio (jul.), agosto (ago.), septiembre (sept.),
## octubre (oct.), noviembre (nov.), diciembre (dic.)
## AM/PM: a. m./p. m.
url_file_prov<-"https://raw.githubusercontent.com/montera34/escovid19data/master/data/output/covid19-provincias-spain_consolidated.csv"
url_file_poblacion <- "https://raw.githubusercontent.com/montera34/escovid19data/master/data/original/provincias-poblacion.csv"
provincias <- read.csv( url_file_prov,encoding = "UTF-8")
provincias_poblacion <- read.csv( url_file_poblacion,encoding = "UTF-8")
df_provincias <- data.frame(provincias) %>%
filter (date >= "2020-08-03")
df_provincias_poblacion <- data.frame(provincias_poblacion)
df_provincias$date <- as.Date(df_provincias$date,format= "%Y-%m-%d")
df_provincias %>% select (date,province,ccaa,hospitalized,intensive_care,daily_deaths) %>%
merge(select(df_provincias_poblacion,provincia,poblacion,ine_code),
by.x = "province", by.y = "provincia", all = TRUE ) -> df_provincias
Fallecidos en Madrid / Cataluña en la segunda ola
df_ccaa_poblacion <- df_provincias %>%
filter (date == "2020-08-03") %>%
group_by(ccaa) %>%
summarise (ccaa_poblacion = sum (poblacion)) %>%
filter (ccaa=="Cataluña" | ccaa=="Madrid, Comunidad de")
df_provincias %>% filter (ccaa=="Cataluña" | ccaa=="Madrid, Comunidad de") %>%
group_by(ccaa) %>%
summarise ( `total fallecimientos` = sum(daily_deaths, na.rm = TRUE))%>%
merge(select(df_ccaa_poblacion,ccaa,ccaa_poblacion),
by.x = "ccaa", by.y = "ccaa", all = TRUE) %>%
mutate (`Fallecimientos 100.000 habitantes` = (`total fallecimientos`*100000)/ccaa_poblacion ) ->fallecidos_cat_madrid
print (fallecidos_cat_madrid)
## ccaa total fallecimientos ccaa_poblacion
## 1 Cataluña 2727 7675217
## 2 Madrid, Comunidad de 3014 6663394
## Fallecimientos 100.000 habitantes
## 1 35.52994
## 2 45.23220