library(data.table)
Registered S3 method overwritten by 'data.table':
  method           from
  print.data.table     
data.table 1.14.0 using 3 threads (see ?getDTthreads).  Latest news: r-datatable.com

Attaching package: 㤼㸱data.table㤼㸲

The following object is masked _by_ 㤼㸱.GlobalEnv㤼㸲:

    .N
library(tidyverse)
Registered S3 methods overwritten by 'dbplyr':
  method         from
  print.tbl_lazy     
  print.tbl_sql      
-- Attaching packages ----------------------------------------- tidyverse 1.3.1 --
v ggplot2 3.3.3     v purrr   0.3.4
v tibble  3.1.1     v dplyr   1.0.5
v tidyr   1.1.3     v stringr 1.4.0
v readr   1.4.0     v forcats 0.5.1
-- Conflicts -------------------------------------------- tidyverse_conflicts() --
x dplyr::between()   masks data.table::between()
x dplyr::filter()    masks stats::filter()
x dplyr::first()     masks data.table::first()
x dplyr::lag()       masks stats::lag()
x dplyr::last()      masks data.table::last()
x purrr::transpose() masks data.table::transpose()
library(leaflet) # Mapas
library(sp)
library(broom)
library(janitor) #Paquete para limpiar datos

Attaching package: 㤼㸱janitor㤼㸲

The following objects are masked from 㤼㸱package:stats㤼㸲:

    chisq.test, fisher.test
library(rgbif) #Datos para ejemplo de mapas
library(sf) #Geografia
Linking to GEOS 3.9.0, GDAL 3.2.1, PROJ 7.2.1
library(chilemapas) #Geograía de Chile
Registered S3 method overwritten by 'geojsonlint':
  method         from 
  print.location dplyr
library(data.table)

Mapas con Leaflet

#Leaflet es una de las librerías abiertas más populares y reconocidas de JavaScript. El #paquete de R con el mismo nombre nos permite crear mapas interactivos. Probablemente ya han #visto mapas de leaflet antes, porque muchísimas páginas web las utilizan, como por ejemplo #http://openstreetmap.org.

#leaflet funciona por capas, y al igual que en ggplot existen muchísimas capas disponibles #para mejorar el aspecto de nuestros mapas. Hoy veremos:

#- Map Tiles: Elegimos el tipo de mapa que queremos. (addTiles, addProviderTiles) #- Markers: Marcadores específicos en un punto del mapa (latitud y longitud) (addMarkers (lat= lng=), addAwesomeMarkers) #- Polígonos: una región específica del mapa, como por ejemplo una comuna.

#Para hacer nuestro primer mapa simple, vayamos a Google Maps para encontrar las coordenadas de la unviersidad. Aquí hacemos mapas con diferentes Provider Tiles

leaflet() %>% 
  addTiles() %>%   # Por defecto
  addMarkers(lat=-33.414308757047465, lng=-70.55307645736842)


mapa <- leaflet() %>% 
  addProviderTiles(providers$Stamen.Toner) %>% 
  addAwesomeMarkers(lat=-33.414308757047465, lng=-70.55307645736842)

mapa

leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addMarkers(lat=-33.414308757047465, lng=-70.5530764573684)

Mapa de la RM con datos del MINEDUC

#Ahora, vamos a aprender a agregar layers como marcadores o polígonos.

#Abrir la base de datos Rendimiento_2018.csv. Esta representa el rendimiento escolar de #alumnos de octavo básico de la Región Metropolitana, para el año 2018.

#Ahora podemos empezar a explorar nuestros datos. Primero hagamos un gráfico simple para ver la distribución de las notas en la muestra completa:

#Podemos hacer un análisis más profundo y separar los datos por género. Con esto, podemos ver diferencias entre el rendimiento de niños y niñas. (Hombres gen_alu=1 y mujeres gen_alu=2) #facet_wrap se separa el gráfico

#Ahora vamos a los mapas:

##Primero, vamos a abrir los datos georeferenciales de las comunas de Santiago, desde el paquete de CRAN chilemapas. Este paquete tiene información para generar mapas de las divisiones políticas y adminsitrativas de Chile. Incluye información a nivel comunal, provincial y regional (entre otros). Es muy útil ya que nos entrega la geometría de cada unidad geográfica que quedamos mapear. En este caso, vamos a hacer un mapa de la RM por comuna. ###Una vez que cargamos el paquete, podemos crear objetos con los datos que necesitamos. En este caso, vamos a usar la función filter del paquete dplyr para quedarnos solo con las comunas de la Región Metropolitana.

##Juntamos las comunas de los alumnos con las comunas del mapa.

##Para identificar diferencias entre las comunas de Santiago, vamos a mapear el promedio general de los alumnos, por comuna (esta base de datos, por simplicidad, solo tiene a los alumnos que aprobaron). Esto nos mostrará una representación del promedio general promedio en cada comuna, en un mapa del Gran Santiago. ###Primero, creamos la variable de promedio general:

#Luego, con distinct nos quedamos solo con una observación por comuna, y seleccionamos solo las variables relevantes para crear el mapa en un nuevo objeto. Luego lo transformamos a formato sf para poder trabajar con leaflet

notas_geo <- distinct(notas_geo) %>% 
  select(codigo_comuna, geometry, nota)
Error in distinct(notas_geo) %>% select(codigo_comuna, geometry, nota) : 
  no se pudo encontrar la función "%>%"

#Ahora, creemos un mapa. #Con el paquete RColorBrewer podemos elegir muchas paletas de colores preexistentes. Con display.brewer.all() podemos verlas y elegir otra.

pal <- colorNumeric(    # definimos la paleta de colores
  palette = "PuRd",
  domain = rend_2018_geo$nota)


mapa <- leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addPolygons(data = notas_geo,
              fillColor = ~pal(nota),
              color = "#b2aeae",  # usamos código Hex para los colores
              fillOpacity = 0.7, # rellenamos con color los polígonos
              smoothFactor = 0.2,
              weight = 1) %>%   # para el grosor de la línea
  addLegend(pal = pal, # paleta de colores 
            values = notas_geo$nota,
            position = "bottomright",
            title = "Promedio General") %>% 
  addScaleBar(position = "topright") # Agregar escala arriba a la derecha
sf layer has inconsistent datum (+proj=longlat +ellps=GRS80 +no_defs).
Need '+proj=longlat +datum=WGS84'

mapa

mapa = leaflet() %>% addProviderTiles(providers\(CartoDB.Positron) %>% addPolygons(data = notas_geo, fillColor = ~pal(nota), addPolygons(data= notas_geo, #de donde sacamos la data fillColor = ~pal(nota), #paleta que quiero, color = "#72147e", fillOpacity= 0.7, #opacidad de los poligonos smoothFactor=0.2, weight=1) %>% addLegend(pal = pal, # paleta de colores values = notas_geo\)nota, position = “bottomright”, title = “Promedio General”) %>% addScaleBar(position = “topright”)) # Agregar escala arriba a la derecha

mapa

#Vacunas contra COVID-19 en chile—-

Cargar la base de datos de las primeras dosis de las vacunas

vacuna_dosis1=fread("https://raw.githubusercontent.com/MinCiencia/Datos-COVID19/master/output/producto80/vacunacion_comuna_1eraDosis.csv")

 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...
 [0%] Downloaded 0 bytes...

#eliminar comunas desconocidas. Eliminame las variabl4s que tengan la palabra desconocido

Debemos cambiar la estructura del dataframe para realizar el mapa, por ello, vamos a crear dos columnas, una de ellas serán las fechas de vacunación y la otra será la cantidad de personas vacunas en la fecha y comuna respectiva. Utilizaremos la función melt. Está en formato wide, es decir, formato ancho, la idea es que esté en formato long, es decir largo.

Columnas necesarias para hacer melt

melt(data = vacuna_dosis1, id.vars= c("Region", "Comuna", "Codigo comuna", "Poblacion"), measure.vars= Fechas, variable.names("fecha"))
Error in melt.data.table(data = vacuna_dosis1, id.vars = c("Region", "Comuna",  : 
  Argument 'variable.name' must be a character vector

Porcentaje de primeras dosis por comuna

###Cuando tenemos el nombre de una variable con un espacio entre medio, hay que ponerle comillas.Codigo comuna

##Queremos sumar el total de vacunas por comuna

Mapa comunas—-

Hagamos un mapa para ver el porcentaje de personas vacunadas por comunas.

#Mapa final.

leaflet(mapa)%>% 
  addProviderTiles(provider = providers$OpenStreetMap.Mapnik)%>%
  addPolygons(color = ~paleta(Porcentaje_Primeras_dosis),
              weight = 1, 
              fillOpacity = 0.8,
              label = labels)%>%
  addLegend(pal = paleta, values = ~bins, opacity = 1,position = "bottomright",title ="Porc. 1º dosis") # Agregar una leyenda
sf layer has inconsistent datum (+proj=longlat +ellps=GRS80 +no_defs).
Need '+proj=longlat +datum=WGS84'Some values were outside the color scale and will be treated as NASome values were outside the color scale and will be treated as NA

leaflet(mapa)%>% addProviderTiles(provider = providers$OpenStreetMap.Mapnik)%>% addPolygons(color = ~paleta(Porcentaje_Primeras_dosis), weight = 1, fillOpacity = 0.8, label = labels)%>% addLegend(pal = paleta, values = ~bins, opacity = 1,position = “bottomright”,title =“Porc. 1º dosis”) # Agregar una leyenda

---
title: "Lab 7"
output: html_notebook
---

```{r}
library(data.table)
library(tidyverse)
library(leaflet) # Mapas
library(sp)
library(broom)
library(janitor) #Paquete para limpiar datos
library(rgbif) #Datos para ejemplo de mapas
library(sf) #Geografia
library(chilemapas) #GeograÃ­a de Chile
library(data.table)
library(knitr)
rm(list=ls())
```

### Mapas con `Leaflet`

#`Leaflet` es una de las librerÃ­as abiertas mÃ¡s populares y reconocidas de `JavaScript`. El #paquete de R con el mismo nombre nos permite crear mapas interactivos. Probablemente ya han #visto mapas de `leaflet` antes, porque muchÃ­simas pÃ¡ginas web las utilizan, como por ejemplo #http://openstreetmap.org.

#`leaflet` funciona por capas, y al igual que en `ggplot` existen muchÃ­simas capas disponibles #para mejorar el aspecto de nuestros mapas. Hoy veremos:
  
#- Map Tiles: Elegimos el tipo de mapa que queremos. (`addTiles`, `addProviderTiles`)
#- Markers: Marcadores especÃ­ficos en un punto del mapa (latitud y longitud) (`addMarkers`  (lat= lng=), `addAwesomeMarkers`)
#- PolÃ­gonos: una regiÃ³n especÃ­fica del mapa, como por ejemplo una comuna.

#Para hacer nuestro primer mapa simple, vayamos a Google Maps para encontrar las coordenadas de la unviersidad. AquÃ­ hacemos mapas con diferentes Provider Tiles 
```{r}
leaflet() %>% 
  addTiles() %>%   # Por defecto
  addMarkers(lat=-33.414308757047465, lng=-70.55307645736842)

mapa <- leaflet() %>% 
  addProviderTiles(providers$Stamen.Toner) %>% 
  addAwesomeMarkers(lat=-33.414308757047465, lng=-70.55307645736842)

mapa

leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addMarkers(lat=-33.414308757047465, lng=-70.5530764573684) 
```
### Mapa de la RM con datos del MINEDUC

#Ahora, vamos a aprender a agregar `layers` como marcadores o polÃ­gonos.

#Abrir la base de datos `Rendimiento_2018.csv`. Esta representa el rendimiento escolar de #alumnos de octavo bÃ¡sico de la RegiÃ³n Metropolitana, para el aÃ±o 2018.
```{r}
rend_2018 <- fread("Rendimiento_2018.csv")
```
#Ahora podemos empezar a explorar nuestros datos. Primero hagamos un grÃ¡fico simple para ver la distribuciÃ³n de las notas en la muestra completa:
```{r}
 
ggplot(rend_2018[prom_gral>=40 & prom_gral<=70], aes(x=prom_gral)) +
  geom_bar()
```


#Podemos hacer un anÃ¡lisis mÃ¡s profundo y separar los datos por gÃ©nero.  Con esto, podemos ver diferencias entre el rendimiento de niÃ±os y niÃ±as. (Hombres `gen_alu=1` y mujeres `gen_alu=2`) #facet_wrap se separa el gráfico 
```{r}
ggplot(rend_2018[prom_gral>=40 & prom_gral<=70], aes(x=prom_gral)) +
  geom_bar(fill = "purple") +
  labs(x="Promedio General", y="Numero de alumnos", title="Distribución de notas por género", caption="Fuente: MINEDUC") +
  facet_wrap(facets = "gen_alu", ncol=1)
```


#Ahora vamos a los mapas:
  
##Primero, vamos a abrir los datos georeferenciales de las comunas de Santiago, desde el paquete de CRAN `chilemapas`. Este paquete tiene informaciÃ³n para generar mapas de las divisiones polÃ­ticas y adminsitrativas de Chile. Incluye informaciÃ³n a nivel comunal, provincial y regional (entre otros). Es muy Ãºtil ya que nos entrega la geometrÃ­a de cada unidad geogrÃ¡fica que quedamos mapear. En este caso, vamos a hacer un mapa de la RM por comuna.
###Una vez que cargamos el paquete, podemos crear objetos con los datos que necesitamos. En este caso, vamos a usar la funciÃ³n `filter` del paquete `dplyr` para quedarnos solo con las comunas de la RegiÃ³n Metropolitana. 
```{r}
#(si van a `??chilemapas` encontrarÃ¡n información de todos los datos que contiene este paquete)

comunas = mapa_comunas %>% 
  filter(codigo_region==13)
comunas
```

##Juntamos las comunas de los alumnos con las comunas del mapa.
```{r}
rend_2018_geo <- merge(comunas, rend_2018, by.x="codigo_comuna", by.y="cod_com_alu")
```


##Para identificar diferencias entre las comunas de Santiago, vamos a mapear el promedio general de los alumnos, por comuna (esta base de datos, por simplicidad, solo tiene a los alumnos que aprobaron). Esto nos mostrarÃ¡ una representaciÃ³n del promedio general promedio en cada comuna, en un mapa del Gran Santiago.
###Primero, creamos la variable de promedio general:
```{r}
rend_2018_geo <- as.data.table(rend_2018_geo)
notas_geo <- rend_2018_geo[, nota:=mean(prom_gral), by=codigo_comuna]
```


#Luego, con `distinct` nos quedamos solo con una observaciÃ³n por comuna, y seleccionamos solo las variables relevantes para crear el mapa en un nuevo objeto. Luego lo transformamos a formato `sf` para poder trabajar con `leaflet`
```{r}
#distinct es para eliminar los duplicados y quedarme solo con una observación por comuna.%>% dpipe ctrl shift M, sirve para aplicar varias funciones juntas al mismo objeto (notas_geo)
##st_sf, es para transformar el objeto a formato sf, hay que hacerlo siempre que quiero hacer un mapa

notas_geo = distinct(notas_geo) %>% 
  select(codigo_comuna, geometry, nota) 
notas_geo = st_sf(notas_geo)
```

#Ahora, creemos un mapa.
#Con el paquete `RColorBrewer` podemos elegir muchas paletas de colores preexistentes. Con `display.brewer.all()` podemos verlas y elegir otra.
```{r}
#crear una paleta de colores con color numering
install.packages("RColorBrewer")
library("RColorBrewer")
#display.brewer.all() para ver las paletas de colores que existen.
#domain=de donde voy a sacar los datos para poner los colores. 

pal= colorNumeric(palette = "Set3", 
                  domain = rend_2018_geo$nota
                  )

#Ahora creo el mapa con el diseño que quiero
  

  pal <- colorNumeric(    # definimos la paleta de colores
  palette = "PuRd",
  domain = rend_2018_geo$nota)


mapa <- leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addPolygons(data = notas_geo,
              fillColor = ~pal(nota),
              color = "#b2aeae",  # usamos cÃ³digo Hex para los colores
              fillOpacity = 0.7, # rellenamos con color los polÃ­gonos
              smoothFactor = 0.2,
              weight = 1) %>%   # para el grosor de la lÃ­nea
  addLegend(pal = pal, # paleta de colores 
            values = notas_geo$nota,
            position = "bottomright",
            title = "Promedio General") %>% 
  addScaleBar(position = "topright") # Agregar escala arriba a la derecha

mapa
  
```

mapa = leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addPolygons(data = notas_geo,
              fillColor = ~pal(nota),
  addPolygons(data= notas_geo, #de donde sacamos la data
              fillColor = ~pal(nota), #paleta que quiero,
             color = "#72147e",
             fillOpacity= 0.7, #opacidad de los poligonos
             smoothFactor=0.2,
             weight=1) %>% 
    addLegend(pal = pal, # paleta de colores 
            values = notas_geo$nota,
            position = "bottomright",
            title = "Promedio General") %>% 
    addScaleBar(position = "topright")) # Agregar escala arriba a la derecha
  
  mapa


#Vacunas contra COVID-19 en chile----

## Cargar la base de datos de las primeras dosis de las vacunas
```{r}
# Cargar la base de datos de las primeras dosis de las vacunas
vacuna_dosis1 <- fread('https://raw.githubusercontent.com/MinCiencia/Datos-COVID19/master/output/producto80/vacunacion_comuna_1eraDosis.csv')


```
#eliminar comunas desconocidas. Eliminame las variabl4s que tengan la palabra desconocido 
```{r}

vacuna_dosis1<-vacuna_dosis1[!Comuna%like%"Desconocido",]
```

# Debemos cambiar la estructura del dataframe para realizar el mapa, por ello, vamos a crear dos columnas, una de ellas serán las fechas de vacunaciÃ³n y la otra serÃ¡ la cantidad de personas vacunas en la fecha y comuna respectiva. Utilizaremos la función melt. Está en formato wide, es decir, formato ancho, la idea es que esté en formato long, es decir largo. 

# Columnas necesarias para hacer melt 

```{r}
Fechas <- names(vacuna_dosis1)
Fechas <- Fechas[6:124]

#hacemos reshape con la función melt

vacuna_dosis1_1 = melt(data = vacuna_dosis1,id.vars = c("Region","Comuna","Codigo comuna","Poblacion"),measure.vars = Fechas ,variable.name = "Fecha")
```


# Porcentaje de primeras dosis por comuna
###Cuando tenemos el nombre de una variable con un espacio entre medio, hay que ponerle comillas.`Codigo comuna`

##Queremos sumar el total de vacunas por comuna
```{r}

vacuna_dosis1_P <- vacuna_dosis1_1[,.(Suma_Primeras_dosis=sum(value)), by=.(`Codigo comuna`,Comuna,Poblacion)]

# Porcentaje de primeras dosis por comuna

vacuna_dosis1_P[,Porcentaje_Primeras_dosis:=(Suma_Primeras_dosis/Poblacion),by=.(`Codigo comuna`,Comuna)]

#Hay que agregar un cero adelante a todas las comunas que no sean de la region metropolitana, porque chilemapas reconoce las comunas con 5 caracteres.

vacuna_dosis1_P[, `Codigo comuna` := ifelse(`Codigo comuna` < 10000 , paste0("0",vacuna_dosis1_P$`Codigo comuna`), vacuna_dosis1_P$`Codigo comuna`)] # Agregar un cero adelante en codigo de las comunas que tengan 4 digitos 

```


# Mapa comunas----

# Hagamos un mapa para ver el porcentaje de personas vacunadas por comunas.

```{r}
#mapa_comunas, viene inclido en chilemapas, si le digo a r, ya va a saber que se refiere a este mapa. 

mapa=merge(mapa_comunas,vacuna_dosis1_P,by.x='codigo_comuna', by.y='Codigo comuna') # Merge entre el mapa de las comunas que nos proporciona el paquete chilemapas y el dataframe de los porcentajes. 

mapa<-st_sf(mapa) # Convertie el dataframe de data.table a sf

bins<-seq(0,1,0.2) # Intervalos del porcenateje para los colores del mapa #como voy a separar el porcentaje con la gama de colores, va a ir de 0 a 1, separado de a 0.2 decimas 

paleta= colorBin('Dark2', domain = vacuna_dosis1_P$Porcentaje_Primeras_dosis, bins = bins)

#este codigo automatiza el nombre de cada comuna con el porcentaje de la primera dosis que queremos que nos muestre cuando pasemos el mouse por arriba del mapa

paleta<-colorBin(palette = 'Dark2',domain = vacuna_dosis1_P$Porcentaje_Primeras_dosis,bins = bins) # Paleta de colores para el mapa

labels <- sprintf(
  "<strong>%s</strong><br/>%g Porc. Primera Dosis",
  mapa$Comuna, mapa$Porcentaje_Primeras_dosis
) %>% lapply(htmltools::HTML) # Labels al pasar arriba del mapa

              
```

#Mapa final.
```{r}
leaflet(mapa)%>% 
  addProviderTiles(provider = providers$OpenStreetMap.Mapnik)%>%
  addPolygons(color = ~paleta(Porcentaje_Primeras_dosis),
              weight = 1, 
              fillOpacity = 0.8,
              label = labels)%>%
  addLegend(pal = paleta, values = ~bins, opacity = 1,position = "bottomright",title ="Porc. 1Âº dosis") # Agregar una leyenda
```


leaflet(mapa)%>% 
  addProviderTiles(provider = providers$OpenStreetMap.Mapnik)%>%
  addPolygons(color = ~paleta(Porcentaje_Primeras_dosis),
              weight = 1, 
              fillOpacity = 0.8,
              label = labels)%>%
  addLegend(pal = paleta, values = ~bins, opacity = 1,position = "bottomright",title ="Porc. 1Âº dosis") # Agregar una leyenda

