library(tidyverse)
## Warning: package 'tidyverse' was built under R version 3.6.3
## -- Attaching packages ------------------------------------------------------------------------------------------------------------------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.0     v purrr   0.3.3
## v tibble  2.1.3     v dplyr   0.8.4
## v tidyr   1.0.2     v stringr 1.4.0
## v readr   1.3.1     v forcats 0.5.0
## Warning: package 'tidyr' was built under R version 3.6.3
## Warning: package 'readr' was built under R version 3.6.3
## Warning: package 'purrr' was built under R version 3.6.3
## Warning: package 'dplyr' was built under R version 3.6.3
## Warning: package 'stringr' was built under R version 3.6.3
## Warning: package 'forcats' was built under R version 3.6.3
## -- Conflicts --------------------------------------------------------------------------------------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(lubridate)
## Warning: package 'lubridate' was built under R version 3.6.3
## 
## Attaching package: 'lubridate'
## The following object is masked from 'package:base':
## 
##     date
library(ggmap)
## Warning: package 'ggmap' was built under R version 3.6.3
## Google's Terms of Service: https://cloud.google.com/maps-platform/terms/.
## Please cite ggmap if you use it! See citation("ggmap") for details.

I. Utilizar los tweets que descargaron en el ejercicio anterior o elegir algún dataset open data de la Ciudad que tenga tanto coordenadas como fecha. Quienes se animen pueden trabajar con ambos y luego compararlos entre sí.

Analizamos un dataset de las inspecciones ambientales realizadas a industrias entre los años 2014-2020 en el País Vasco. El mismo fue obtenido del portal de datos abiertos opendata.euskadi.

IIA <- read.csv("informes_aai_v2.csv",  sep = ";", dec = ",") %>%  rename("Clasif" = Clasificación.DEI.y.actividad) 
str(IIA)
## 'data.frame':    707 obs. of  37 variables:
##  $ Nombre                                                                              : Factor w/ 696 levels "Informe de inspección medioambiental [AAI00001-2014]",..: 691 227 599 433 263 316 232 691 431 504 ...
##  $ Código.de.expediente                                                                : Factor w/ 272 levels "AAI00001","AAI00002",..: 267 75 226 160 90 113 77 267 159 191 ...
##  $ Titular.del.expediente                                                              : Factor w/ 308 levels "ACABADOS SUPERFICIALES BERRITZEN, S.L.",..: 17 119 34 72 4 89 239 17 130 301 ...
##  $ Año.del.programa                                                                    : int  2019 2020 2019 2020 2019 2019 2020 2019 2019 2019 ...
##  $ Fecha.del.documento                                                                 : Factor w/ 481 levels "01/02/2018","01/03/2017",..: 252 118 418 29 452 252 174 395 475 332 ...
##  $ Ruta.al.documento                                                                   : Factor w/ 706 levels "","/contenidos/documentacion_autorizacion/aai00001_1449/es_def/adjuntos/AAI00001_20170329_es.pdf",..: 701 228 602 434 263 316 232 700 431 504 ...
##  $ Clasif                                                                              : Factor w/ 45 levels "","1.1- Actividades de producción de energia electrica y cogeneración",..: 1 1 14 15 11 23 42 41 16 27 ...
##  $ Fecha.de.autorización                                                               : Factor w/ 276 levels "","01/02/2010",..: 1 1 17 207 62 169 249 144 10 62 ...
##  $ Inspección.programada...no.programada                                               : Factor w/ 3 levels "Inspección No Programada",..: 1 1 2 2 2 2 2 2 2 2 ...
##  $ Código.del.alcance.de.la.actuación.de.inspección.ambiental                          : Factor w/ 128 levels "","GAM","INS#PCA#OTR#RUE#LIC#MPR#GAM",..: 1 1 29 29 26 79 29 26 98 29 ...
##  $ Alcance.de.la.actuación.de.inspección.ambiental                                     : Factor w/ 128 levels "","Gestión Ambiental",..: 1 1 29 29 26 79 29 26 98 29 ...
##  $ Fecha.informe                                                                       : Factor w/ 475 levels "01/03/2017","01/03/2018",..: 394 59 403 57 41 306 379 309 71 334 ...
##  $ Fecha.notificación                                                                  : Factor w/ 307 levels "","01/03/2017",..: 41 50 237 41 130 1 41 96 61 164 ...
##  $ Alegaciones                                                                         : Factor w/ 3 levels "No","No procede",..: 1 1 1 1 1 2 1 2 2 2 ...
##  $ Grado.de.cumplimiento                                                               : Factor w/ 6 levels "","Alto","Bajo",..: 1 1 4 1 4 1 1 4 4 4 ...
##  $ Códigos.de.las.materias.asociadas.a.los.incumplimientos.constatados.en.la.inspección: Factor w/ 117 levels "","1#2#3#4#6",..: 1 1 81 87 75 73 93 13 74 83 ...
##  $ Materias.asociadas.a.los.incumplimientos.constatados.en.la.inspección               : Factor w/ 117 levels "","Condiciones específicas de gestión de residuos",..: 1 1 99 103 94 88 105 8 92 95 ...
##  $ NIF                                                                                 : Factor w/ 260 levels "","16433186P",..: 160 66 151 143 11 173 58 160 230 239 ...
##  $ Coordenadas.GPS                                                                     : Factor w/ 267 levels "4705190.222,541619.069",..: 48 175 20 36 69 139 81 48 107 247 ...
##  $ YETRS89                                                                             : Factor w/ 267 levels "4705190.222",..: 48 175 20 36 69 139 81 48 107 247 ...
##  $ XETRS89                                                                             : Factor w/ 267 levels "484639.674","489016.733",..: 133 89 201 127 31 207 238 133 167 27 ...
##  $ LONGITUD                                                                            : num  -2.65 -2.78 -2.4 -2.65 -3 ...
##  $ LATITUD                                                                             : num  42.9 43.2 42.8 42.9 43 ...
##  $ Nombre.lugar                                                                        : Factor w/ 313 levels " TUBOS REUNIDOS INDUSTRIAL, S.L.U.",..: 18 121 35 73 5 90 242 18 132 306 ...
##  $ Dirección                                                                           : Factor w/ 301 levels " P.I. de Lantarón",..: 98 3 200 91 284 224 99 98 101 13 ...
##  $ Municipio                                                                           : Factor w/ 108 levels "","Abadiño","Abanto y Ciérvana-Abanto Zierbena",..: 69 71 5 97 14 23 12 69 43 70 ...
##  $ Código.municipio                                                                    : int  58 55 51 59 2 17 8 58 32 54 ...
##  $ Código.postal                                                                       : int  1015 48330 1200 1013 1470 20720 20268 1015 48230 48940 ...
##  $ Provincia                                                                           : Factor w/ 4 levels "","Araba/Álava",..: 2 3 2 2 2 4 4 2 3 3 ...
##  $ Código.provincia                                                                    : int  1 48 1 1 1 20 20 1 48 48 ...
##  $ País                                                                                : Factor w/ 1 level "España": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Código.país                                                                         : int  108 108 108 108 108 108 108 108 108 108 ...
##  $ URL.amigable                                                                        : Factor w/ 697 levels "","https://opendata.euskadi.eus/datos/-/documentacion-autorizacion/informe-de-inspeccion-medioambiental-aai00001-2014/",..: 697 689 696 694 691 692 690 683 427 497 ...
##  $ URL.física                                                                          : Factor w/ 707 levels "https://opendata.euskadi.eus/datos/contenidos/documentacion_autorizacion/aai00001_1449/es_def/index.shtml",..: 702 228 603 435 263 317 232 701 432 505 ...
##  $ XML.datos                                                                           : Factor w/ 707 levels "https://opendata.euskadi.eus/contenidos/documentacion_autorizacion/aai00001_1449/es_def/data/es_r01dtpd15d807c3"| __truncated__,..: 702 228 603 435 263 317 232 701 432 505 ...
##  $ XML.metadatos                                                                       : Factor w/ 707 levels "https://opendata.euskadi.eus/contenidos/documentacion_autorizacion/aai00001_1449/r01Index/aai00001_1449-idxContent.xml",..: 702 228 603 435 263 317 232 701 432 505 ...
##  $ Zip                                                                                 : Factor w/ 707 levels "https://opendata.euskadi.eus/contenidos/documentacion_autorizacion/aai00001_1449/opendata/aai00001_1449.zip",..: 702 228 603 435 263 317 232 701 432 505 ...
names(IIA)
##  [1] "Nombre"                                                                              
##  [2] "Código.de.expediente"                                                                
##  [3] "Titular.del.expediente"                                                              
##  [4] "Año.del.programa"                                                                    
##  [5] "Fecha.del.documento"                                                                 
##  [6] "Ruta.al.documento"                                                                   
##  [7] "Clasif"                                                                              
##  [8] "Fecha.de.autorización"                                                               
##  [9] "Inspección.programada...no.programada"                                               
## [10] "Código.del.alcance.de.la.actuación.de.inspección.ambiental"                          
## [11] "Alcance.de.la.actuación.de.inspección.ambiental"                                     
## [12] "Fecha.informe"                                                                       
## [13] "Fecha.notificación"                                                                  
## [14] "Alegaciones"                                                                         
## [15] "Grado.de.cumplimiento"                                                               
## [16] "Códigos.de.las.materias.asociadas.a.los.incumplimientos.constatados.en.la.inspección"
## [17] "Materias.asociadas.a.los.incumplimientos.constatados.en.la.inspección"               
## [18] "NIF"                                                                                 
## [19] "Coordenadas.GPS"                                                                     
## [20] "YETRS89"                                                                             
## [21] "XETRS89"                                                                             
## [22] "LONGITUD"                                                                            
## [23] "LATITUD"                                                                             
## [24] "Nombre.lugar"                                                                        
## [25] "Dirección"                                                                           
## [26] "Municipio"                                                                           
## [27] "Código.municipio"                                                                    
## [28] "Código.postal"                                                                       
## [29] "Provincia"                                                                           
## [30] "Código.provincia"                                                                    
## [31] "País"                                                                                
## [32] "Código.país"                                                                         
## [33] "URL.amigable"                                                                        
## [34] "URL.física"                                                                          
## [35] "XML.datos"                                                                           
## [36] "XML.metadatos"                                                                       
## [37] "Zip"
head (IIA$Clasif)
## [1]                                                                                                                                                                                                                                                                           
## [2]                                                                                                                                                                                                                                                                           
## [3] 2.3- Transformacion de metales ferrosos laminación,  forja y aplicación de capas de metal fundido#2.4.- Fundición de metales ferrosos capacidad > 20 t/dia                                                                                                                
## [4] 2.3- Transformacion de metales ferrosos laminación,  forja y aplicación de capas de metal fundido#2.6.- Tratamiento de superficie de metales y materiales plásticos volumen>30m3                                                                                          
## [5] 2.2- Producción de aceros brutos ( primera y segunda fusión) y fundición continua.#2.3- Transformacion de metales ferrosos laminación,  forja y aplicación de capas de metal fundido#5.4- Valorización o mezcla de valorización/eliminación de RNP con capacidad> 75 t/dia
## [6] 2.6.- Tratamiento de superficie de metales y materiales plásticos volumen>30m3                                                                                                                                                                                            
## 45 Levels:  ...

Convertimos el campo “fecha” al tipo de dato especializado llamado fecha (date).

IIA <- IIA %>% mutate(fecha = dmy(Fecha.informe))

Realizamos algunas pruebas al azar con las fechas del dataset.

set.seed("99")
muestra_de_fechas <- IIA %>% 
    mutate(fecha = paste(fecha)) %>% 
    sample_n(5) %>% 
    pull(fecha)

muestra_de_fechas
## [1] "2017-06-21" "2018-10-25" "2016-11-02" "2018-11-28" "2016-01-11"
wday(muestra_de_fechas)
## [1] 4 5 4 4 2
wday(muestra_de_fechas, label = TRUE)
## [1] Wed Thu Wed Wed Mon
## Levels: Sun < Mon < Tue < Wed < Thu < Fri < Sat
month(muestra_de_fechas)
## [1]  6 10 11 11  1
month(muestra_de_fechas, label = TRUE)
## [1] Jun Oct Nov Nov Jan
## 12 Levels: Jan < Feb < Mar < Apr < May < Jun < Jul < Aug < Sep < ... < Dec
year(muestra_de_fechas)
## [1] 2017 2018 2016 2018 2016

II. Realizar 2 gráficos que les permitan analizar la temporalidad de los datos.¿Detectan algún patrón temporal? ¿A qué puede deberse?

options(scipen = 20)

ggplot(IIA) + 
    geom_bar(aes(x = year(fecha))) +
  theme_light() +
  labs(title = "Informes de inspección ambiental | Análisis por año",
           x = "Años",
           y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Podemos observar que el pico de inspecciones se logró en el año 2015, luego descendió y año a año siguiente se va incrementando sin llegar aun a los valores del 2015. Los datos del 2015 son coincidentes con la implementación en ese año por parte del Pais Vasco de un seguimiento electronico de los expedientes.

IIA %>% 
    filter(year(fecha) == 2015) %>% 
    ggplot() +
        geom_bar(aes(x = month(fecha, label = TRUE))) +
  theme_light() +
  labs(title = "Informes de inspección ambiental | Análisis por mes (2015)",
           x = "Meses",
           y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Podemos observar que los meses con menores inspecciones corresponden a las fechas coincidentes con el inicio y el fin de las vacaciones de verano en España (agosto/octubre).

Categorías de industrias por rubro mas inspeccionadas (mayor frecuencia).

IIA %>% 
    count(Clasif) %>% 
    top_n(5) %>% 
    arrange(desc(n))
## Selecting by n
## # A tibble: 5 x 2
##   Clasif                                                                       n
##   <fct>                                                                    <int>
## 1 2.6.- Tratamiento de superficie de metales y materiales plásticos volum~   102
## 2 2.4.- Fundición de metales ferrosos capacidad > 20 t/dia                    82
## 3 5.5- Vertderos de todo tipo de residuos, excepto inertes, con capacidad~    79
## 4 5.4- Valorización o mezcla de valorización/eliminación de RNP con capac~    36
## 5 2.5.- Producción o fusión de metales no ferrosos                            33
IIA_frecuentes <- IIA %>% 
    count(Clasif) %>% 
    top_n(5) %>% 
    pull(Clasif)
## Selecting by n
IIA %>% 
    filter(year(fecha) == 2015,
           Clasif %in% IIA_frecuentes) %>% 
    ggplot() +
        geom_bar(aes(x = month(fecha, label = TRUE), fill = Clasif)) +
  theme_light()+
  coord_flip()+
  scale_fill_viridis_d() +
  labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados (2015)",
           x = "Meses",
           y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

IIA %>% 
    filter(year(fecha) == 2015,
           Clasif %in% IIA_frecuentes) %>% 
    ggplot() +
        geom_bar(aes(x = month(fecha, label = TRUE), fill = Clasif),
                 position = "dodge")  +
  theme_light() +
  coord_flip()+
  scale_fill_viridis_d() +
  labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados (2015)",
           x = "Meses",
           y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

conteo <-  IIA %>% 
    filter(year(fecha) == 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2014,
           Clasif %in% IIA_frecuentes) %>% 
    count(Clasif, mes = month(fecha, label = TRUE))

ggplot(conteo) +
    geom_line(aes(x = mes, y = n, group = Clasif, color = Clasif))+
  labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados por mes (2014-2020)",
           x = "Meses",
           y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Podemos observar claramente que en los meses de receso descienden las inspecciones a industrias.

Comparamos valores absolutos de las inspecciones realizadas.

conteo <-  IIA %>% 
    filter(year(fecha) == 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2014,
           Clasif %in% IIA_frecuentes) %>% 
    count(Clasif, diasemana = wday(fecha, label = TRUE))
   

ggplot(conteo) +
    geom_line(aes(x = diasemana, y = n, group = Clasif, color = Clasif)) + 
  labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados por día (2014-2020) | Valores absolutos",
           x = "Días",
           y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")  

Comparamos porcentajes de las inspecciones realizadas.

conteo <-  conteo  %>% 
    group_by(Clasif) %>% 
    mutate(pct = n / sum(n) * 100)

ggplot(conteo) +
    geom_line(aes(x = diasemana, y = pct, group = Clasif, color = Clasif)) + 
  labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados por día (2014-2020) | Valores en porcentajes",
           x = "Días",
           y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

ggplot(conteo) +
    geom_line(aes(x = diasemana, y = pct, group = Clasif, color = Clasif))+
    expand_limits(y = 0) + 
  labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados por día (2014-2020) | Valores en porcentajes",
           x = "Días",
           y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Según el análisis que se desprende del gráfico la mayor cantidad de inspecciones se realizan los días jueves/viernes.

No se llegó a realizar el análisis horario ya que el dataset no poseía dicha información.

III. Analizar la distribución espacial de los datos a partir de:

a. Un mapa de densidad que muestre donde se concentran la mayor cantidad de observaciones.

Obtenemos un mapa base de la región.

bbox <- make_bbox(IIA$LONGITUD, IIA$LATITUD)

bbox
##      left    bottom     right       top 
## -3.258335 42.451763 -1.734332 43.467969
PAISVASCO <- get_stamenmap(bbox = bbox, maptype = "toner-lite", zoom = 10)
## Source : http://tile.stamen.com/toner-lite/10/502/374.png
## Source : http://tile.stamen.com/toner-lite/10/503/374.png
## Source : http://tile.stamen.com/toner-lite/10/504/374.png
## Source : http://tile.stamen.com/toner-lite/10/505/374.png
## Source : http://tile.stamen.com/toner-lite/10/506/374.png
## Source : http://tile.stamen.com/toner-lite/10/507/374.png
## Source : http://tile.stamen.com/toner-lite/10/502/375.png
## Source : http://tile.stamen.com/toner-lite/10/503/375.png
## Source : http://tile.stamen.com/toner-lite/10/504/375.png
## Source : http://tile.stamen.com/toner-lite/10/505/375.png
## Source : http://tile.stamen.com/toner-lite/10/506/375.png
## Source : http://tile.stamen.com/toner-lite/10/507/375.png
## Source : http://tile.stamen.com/toner-lite/10/502/376.png
## Source : http://tile.stamen.com/toner-lite/10/503/376.png
## Source : http://tile.stamen.com/toner-lite/10/504/376.png
## Source : http://tile.stamen.com/toner-lite/10/505/376.png
## Source : http://tile.stamen.com/toner-lite/10/506/376.png
## Source : http://tile.stamen.com/toner-lite/10/507/376.png
## Source : http://tile.stamen.com/toner-lite/10/502/377.png
## Source : http://tile.stamen.com/toner-lite/10/503/377.png
## Source : http://tile.stamen.com/toner-lite/10/504/377.png
## Source : http://tile.stamen.com/toner-lite/10/505/377.png
## Source : http://tile.stamen.com/toner-lite/10/506/377.png
## Source : http://tile.stamen.com/toner-lite/10/507/377.png
## Source : http://tile.stamen.com/toner-lite/10/502/378.png
## Source : http://tile.stamen.com/toner-lite/10/503/378.png
## Source : http://tile.stamen.com/toner-lite/10/504/378.png
## Source : http://tile.stamen.com/toner-lite/10/505/378.png
## Source : http://tile.stamen.com/toner-lite/10/506/378.png
## Source : http://tile.stamen.com/toner-lite/10/507/378.png
ggmap(PAISVASCO) + 
  labs(title = "País Vasco",
           x = "Longitud",
           y = "Latitud")

Mapeamos las industrias inspeccionadas entre los periodos 2014-2020

ggmap(PAISVASCO) +
    geom_point(data = IIA, aes(x = LONGITUD, y = LATITUD),
               color = "salmon", size = 3, alpha = 0.8) +
  labs(title = "Informes de inspección ambiental (2014-2020)",
           x = "Longitud",
           y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Las industrias se encuentran altamente concentradas en las proximidades de las urbanizaciones y sobre los corredores viales que conectan las mismas. Muy probablemente exista una relación entre la localización de las industrias y la proximidad a un cauce hídrico.

Realizamos mapas de densidad de la región.

ggmap(PAISVASCO) +
    geom_bin2d(data = IIA, 
               aes(x = LONGITUD, y = LATITUD)) +
  labs(title = "Informes de inspección ambiental | Mayor cantidad de inspecciones (2014-2020)",
           x = "Longitud",
           y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

ggmap(PAISVASCO) +
    geom_bin2d(data = IIA, 
               aes(x = LONGITUD, y = LATITUD), bins = 20) +
    scale_fill_viridis_c() +
  labs(title = "Informes de inspección ambiental | Mayor cantidad de inspecciones (2014-2020)",
           x = "Longitud",
           y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Observamos las mayores concentraciones próximo a las urbanizaciones existentes.

Realizamos un mapa kernel density estimation.

ggmap(PAISVASCO) +
    geom_density2d(data = IIA, aes(x = LONGITUD, y = LATITUD, color = stat(level))) +
    scale_color_viridis_c() +
  labs(title = "Informes de inspección ambiental | Mayor cantidad de inspecciones (2014-2020)",
           x = "Longitud",
           y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

b. Un facetado del mapa del punto III.a. que permita discernir patrones espaciales dentro de las categorías de una variable. ¿El patrón espacial de los datos elegidos se mantiene o varía según las categorías?

ggmap(PAISVASCO) +
    geom_point(data = filter(IIA, Clasif %in% IIA_frecuentes), 
               aes(x = LONGITUD, y = LATITUD, color = Clasif),
               size = 2, alpha = 1)  +
    guides(color = guide_legend(override.aes = list(size=3, alpha = 1))) +
    scale_color_brewer(palette = "Set1") +
  labs(title = "Informes de inspección ambiental | Industrias mas inspeccionadas (2014-2020)",
           x = "Longitud",
           y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

ggmap(PAISVASCO) +
    geom_point(data = filter(IIA, Clasif %in% IIA_frecuentes), 
               aes(x = LONGITUD, y = LATITUD, color = Clasif),
               size = 2.5, alpha = 0.9) +
    scale_color_brewer(palette = "Set1") +
    facet_wrap(~Clasif)  +
  labs(title = "Informes de inspección ambiental | Industrias mas inspeccionadas (2014-2020)",
           x = "Longitud",
           y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Según este gráfico las industrias se encuentran distribuidas equitativamente en la región vasca.

ggmap(PAISVASCO) +
    geom_density2d(data = filter(IIA, Clasif %in% IIA_frecuentes), aes(x = LONGITUD, y = LATITUD, color = Clasif, color = stat(level))) +
    scale_color_viridis_c() +
    facet_wrap(~Clasif) +
  labs(title = "Informes de inspección ambiental | Industrias mas inspeccionadas (2014-2020)",
           x = "Longitud",
           y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")
## Warning: Duplicated aesthetics after name standardisation: colour

El presente gráfico nos permite detectar los focos de localización según cada rubro lo que indica que no están equitativamente distribuidas.

IV. Comparar la densidad de los datos en el tiempo (facetar). ¿Los patrones espaciales de los datos elegidos se mantienen o varían en el tiempo?

IIA <- IIA %>% 
    mutate(dia_semana = wday(fecha, label = TRUE))
ggmap(PAISVASCO) +
    geom_point(data = filter(IIA, Clasif %in% c("2.4.- Fundición de metales ferrosos capacidad > 20 t/dia", "5.5- Vertderos de todo tipo de residuos, excepto inertes, con capacidad>10 t/dia.")),
                aes(x = LONGITUD, y = LATITUD, color = Clasif), alpha = .9, size = 2) +
    facet_wrap(~dia_semana) +
  labs(title = "Informes de inspección ambiental | Comparativa inspecciones por días en 2 rubros (2014-2020)",
           x = "Longitud",
           y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

A simple vista no detectamos algún patrón de inspección diaria en relación a la comparativa de ambos rubros. Parecería que jueves/viernes las inspecciones son mas dispersas que el resto de los días.

ggmap(PAISVASCO) +
    geom_density2d(data = filter(IIA, 
                                 Clasif == "2.6.- Tratamiento de superficie de metales y materiales plásticos volumen>30m3"),
                   aes(x = LONGITUD, 
                       y = LATITUD, 
                       color = stat(level))) +
    scale_color_viridis_c() +
    facet_wrap(~dia_semana, nrow = 2) +
    labs(title = "Inspecciones ambientales industrias metalurgicas",
         subtitle = "según día de la semana") +
  labs(title = "Informes de inspección ambiental | Mapa de calor rubro 'Trat. de sup. de metales y materiales plasticos' por día (2014-2020)",
           x = "Longitud",
           y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
         caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

En relación al rubro analizado martes y viernes son los días con mas concentración de inspecciones. El resto de los días existe mayor dispersión territorial.

Con este ultimo chunk damos por finalizado el TP4.-