preparar datos para gráficas

library(readr)
library(dplyr)
library(tidyr)
library(ggplot2)
library(stringr)
require(RCurl)
locale(date_names = "es", date_format = "%AD", time_format = "%AT",
       decimal_mark = ",", grouping_mark = ".", tz = "UTC",
       encoding = "UTF-8", asciify = FALSE)
## <locale>
## Numbers:  123.456,78
## Formats:  %AD / %AT
## Timezone: UTC
## Encoding: UTF-8
## <date_names>
## Days:   domingo (dom.), lunes (lun.), martes (mar.), miércoles (mié.), jueves
##         (jue.), viernes (vie.), sábado (sáb.)
## Months: enero (ene.), febrero (feb.), marzo (mar.), abril (abr.), mayo (may.),
##         junio (jun.), julio (jul.), agosto (ago.), septiembre (sept.),
##         octubre (oct.), noviembre (nov.), diciembre (dic.)
## AM/PM:  a. m./p. m.
url_file_prov<-"https://raw.githubusercontent.com/montera34/escovid19data/master/data/output/covid19-provincias-spain_consolidated.csv"
url_file_poblacion <- "https://raw.githubusercontent.com/montera34/escovid19data/master/data/original/provincias-poblacion.csv"

provincias <- read.csv( url_file_prov,encoding = "UTF-8")
provincias_poblacion <- read.csv( url_file_poblacion,encoding = "UTF-8")
df_provincias  <- data.frame(provincias)  %>%
                  filter (date >= "2020-08-03") 
df_provincias_poblacion <- data.frame(provincias_poblacion)
df_provincias$date <-  as.Date(df_provincias$date,format= "%Y-%m-%d")
df_provincias  %>% select (date,province,ccaa,hospitalized,intensive_care,daily_deaths) %>% 
                  merge(select(df_provincias_poblacion,provincia,poblacion,ine_code),
                      by.x = "province", by.y = "provincia", all = TRUE   ) -> df_provincias

Fallecidos en Madrid / Cataluña en la segunda ola

df_ccaa_poblacion <- df_provincias %>%
                     filter (date == "2020-08-03") %>%
                     group_by(ccaa) %>%
                     summarise (ccaa_poblacion = sum (poblacion)) %>%
                     filter (ccaa=="Cataluña" | ccaa=="Madrid, Comunidad de") 

df_provincias  %>%  filter (ccaa=="Cataluña" | ccaa=="Madrid, Comunidad de") %>%
                    group_by(ccaa) %>%
                    summarise ( `total fallecimientos`  = sum(daily_deaths, na.rm = TRUE))%>%
                    merge(select(df_ccaa_poblacion,ccaa,ccaa_poblacion),
                      by.x = "ccaa", by.y = "ccaa", all = TRUE) %>%
                    mutate (`Fallecimientos 100.000 habitantes` =  (`total fallecimientos`*100000)/ccaa_poblacion ) ->fallecidos_cat_madrid
print (fallecidos_cat_madrid)
##                   ccaa total fallecimientos ccaa_poblacion
## 1             Cataluña                 2727        7675217
## 2 Madrid, Comunidad de                 3014        6663394
##   Fallecimientos 100.000 habitantes
## 1                          35.52994
## 2                          45.23220