II. Realizar 2 gráficos que les permitan analizar la temporalidad de los datos.¿Detectan algún patrón temporal? ¿A qué puede deberse?
options(scipen = 20)
ggplot(IIA) +
geom_bar(aes(x = year(fecha))) +
theme_light() +
labs(title = "Informes de inspección ambiental | Análisis por año",
x = "Años",
y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Podemos observar que el pico de inspecciones se logró en el año 2015, luego descendió y año a año siguiente se va incrementando sin llegar aun a los valores del 2015. Los datos del 2015 son coincidentes con la implementación en ese año por parte del Pais Vasco de un seguimiento electronico de los expedientes.
IIA %>%
filter(year(fecha) == 2015) %>%
ggplot() +
geom_bar(aes(x = month(fecha, label = TRUE))) +
theme_light() +
labs(title = "Informes de inspección ambiental | Análisis por mes (2015)",
x = "Meses",
y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Podemos observar que los meses con menores inspecciones corresponden a las fechas coincidentes con el inicio y el fin de las vacaciones de verano en España (agosto/octubre).
Categorías de industrias por rubro mas inspeccionadas (mayor frecuencia).
IIA %>%
count(Clasif) %>%
top_n(5) %>%
arrange(desc(n))
## Selecting by n
## # A tibble: 5 x 2
## Clasif n
## <fct> <int>
## 1 2.6.- Tratamiento de superficie de metales y materiales plásticos volum~ 102
## 2 2.4.- Fundición de metales ferrosos capacidad > 20 t/dia 82
## 3 5.5- Vertderos de todo tipo de residuos, excepto inertes, con capacidad~ 79
## 4 5.4- Valorización o mezcla de valorización/eliminación de RNP con capac~ 36
## 5 2.5.- Producción o fusión de metales no ferrosos 33
IIA_frecuentes <- IIA %>%
count(Clasif) %>%
top_n(5) %>%
pull(Clasif)
## Selecting by n
IIA %>%
filter(year(fecha) == 2015,
Clasif %in% IIA_frecuentes) %>%
ggplot() +
geom_bar(aes(x = month(fecha, label = TRUE), fill = Clasif)) +
theme_light()+
coord_flip()+
scale_fill_viridis_d() +
labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados (2015)",
x = "Meses",
y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

IIA %>%
filter(year(fecha) == 2015,
Clasif %in% IIA_frecuentes) %>%
ggplot() +
geom_bar(aes(x = month(fecha, label = TRUE), fill = Clasif),
position = "dodge") +
theme_light() +
coord_flip()+
scale_fill_viridis_d() +
labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados (2015)",
x = "Meses",
y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

conteo <- IIA %>%
filter(year(fecha) == 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2014,
Clasif %in% IIA_frecuentes) %>%
count(Clasif, mes = month(fecha, label = TRUE))
ggplot(conteo) +
geom_line(aes(x = mes, y = n, group = Clasif, color = Clasif))+
labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados por mes (2014-2020)",
x = "Meses",
y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Podemos observar claramente que en los meses de receso descienden las inspecciones a industrias.
Comparamos valores absolutos de las inspecciones realizadas.
conteo <- IIA %>%
filter(year(fecha) == 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2014,
Clasif %in% IIA_frecuentes) %>%
count(Clasif, diasemana = wday(fecha, label = TRUE))
ggplot(conteo) +
geom_line(aes(x = diasemana, y = n, group = Clasif, color = Clasif)) +
labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados por día (2014-2020) | Valores absolutos",
x = "Días",
y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Comparamos porcentajes de las inspecciones realizadas.
conteo <- conteo %>%
group_by(Clasif) %>%
mutate(pct = n / sum(n) * 100)
ggplot(conteo) +
geom_line(aes(x = diasemana, y = pct, group = Clasif, color = Clasif)) +
labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados por día (2014-2020) | Valores en porcentajes",
x = "Días",
y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

ggplot(conteo) +
geom_line(aes(x = diasemana, y = pct, group = Clasif, color = Clasif))+
expand_limits(y = 0) +
labs(title = "Informes de inspección ambiental | Rubros mas inspeccionados por día (2014-2020) | Valores en porcentajes",
x = "Días",
y = "Cantidades", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Según el análisis que se desprende del gráfico la mayor cantidad de inspecciones se realizan los días jueves/viernes.
No se llegó a realizar el análisis horario ya que el dataset no poseía dicha información.
III. Analizar la distribución espacial de los datos a partir de:
a. Un mapa de densidad que muestre donde se concentran la mayor cantidad de observaciones.
Obtenemos un mapa base de la región.
bbox <- make_bbox(IIA$LONGITUD, IIA$LATITUD)
bbox
## left bottom right top
## -3.258335 42.451763 -1.734332 43.467969
PAISVASCO <- get_stamenmap(bbox = bbox, maptype = "toner-lite", zoom = 10)
## Source : http://tile.stamen.com/toner-lite/10/502/374.png
## Source : http://tile.stamen.com/toner-lite/10/503/374.png
## Source : http://tile.stamen.com/toner-lite/10/504/374.png
## Source : http://tile.stamen.com/toner-lite/10/505/374.png
## Source : http://tile.stamen.com/toner-lite/10/506/374.png
## Source : http://tile.stamen.com/toner-lite/10/507/374.png
## Source : http://tile.stamen.com/toner-lite/10/502/375.png
## Source : http://tile.stamen.com/toner-lite/10/503/375.png
## Source : http://tile.stamen.com/toner-lite/10/504/375.png
## Source : http://tile.stamen.com/toner-lite/10/505/375.png
## Source : http://tile.stamen.com/toner-lite/10/506/375.png
## Source : http://tile.stamen.com/toner-lite/10/507/375.png
## Source : http://tile.stamen.com/toner-lite/10/502/376.png
## Source : http://tile.stamen.com/toner-lite/10/503/376.png
## Source : http://tile.stamen.com/toner-lite/10/504/376.png
## Source : http://tile.stamen.com/toner-lite/10/505/376.png
## Source : http://tile.stamen.com/toner-lite/10/506/376.png
## Source : http://tile.stamen.com/toner-lite/10/507/376.png
## Source : http://tile.stamen.com/toner-lite/10/502/377.png
## Source : http://tile.stamen.com/toner-lite/10/503/377.png
## Source : http://tile.stamen.com/toner-lite/10/504/377.png
## Source : http://tile.stamen.com/toner-lite/10/505/377.png
## Source : http://tile.stamen.com/toner-lite/10/506/377.png
## Source : http://tile.stamen.com/toner-lite/10/507/377.png
## Source : http://tile.stamen.com/toner-lite/10/502/378.png
## Source : http://tile.stamen.com/toner-lite/10/503/378.png
## Source : http://tile.stamen.com/toner-lite/10/504/378.png
## Source : http://tile.stamen.com/toner-lite/10/505/378.png
## Source : http://tile.stamen.com/toner-lite/10/506/378.png
## Source : http://tile.stamen.com/toner-lite/10/507/378.png
ggmap(PAISVASCO) +
labs(title = "País Vasco",
x = "Longitud",
y = "Latitud")

Mapeamos las industrias inspeccionadas entre los periodos 2014-2020
ggmap(PAISVASCO) +
geom_point(data = IIA, aes(x = LONGITUD, y = LATITUD),
color = "salmon", size = 3, alpha = 0.8) +
labs(title = "Informes de inspección ambiental (2014-2020)",
x = "Longitud",
y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Las industrias se encuentran altamente concentradas en las proximidades de las urbanizaciones y sobre los corredores viales que conectan las mismas. Muy probablemente exista una relación entre la localización de las industrias y la proximidad a un cauce hídrico.
Realizamos mapas de densidad de la región.
ggmap(PAISVASCO) +
geom_bin2d(data = IIA,
aes(x = LONGITUD, y = LATITUD)) +
labs(title = "Informes de inspección ambiental | Mayor cantidad de inspecciones (2014-2020)",
x = "Longitud",
y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

ggmap(PAISVASCO) +
geom_bin2d(data = IIA,
aes(x = LONGITUD, y = LATITUD), bins = 20) +
scale_fill_viridis_c() +
labs(title = "Informes de inspección ambiental | Mayor cantidad de inspecciones (2014-2020)",
x = "Longitud",
y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Observamos las mayores concentraciones próximo a las urbanizaciones existentes.
Realizamos un mapa kernel density estimation.
ggmap(PAISVASCO) +
geom_density2d(data = IIA, aes(x = LONGITUD, y = LATITUD, color = stat(level))) +
scale_color_viridis_c() +
labs(title = "Informes de inspección ambiental | Mayor cantidad de inspecciones (2014-2020)",
x = "Longitud",
y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

b. Un facetado del mapa del punto III.a. que permita discernir patrones espaciales dentro de las categorías de una variable. ¿El patrón espacial de los datos elegidos se mantiene o varía según las categorías?
ggmap(PAISVASCO) +
geom_point(data = filter(IIA, Clasif %in% IIA_frecuentes),
aes(x = LONGITUD, y = LATITUD, color = Clasif),
size = 2, alpha = 1) +
guides(color = guide_legend(override.aes = list(size=3, alpha = 1))) +
scale_color_brewer(palette = "Set1") +
labs(title = "Informes de inspección ambiental | Industrias mas inspeccionadas (2014-2020)",
x = "Longitud",
y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

ggmap(PAISVASCO) +
geom_point(data = filter(IIA, Clasif %in% IIA_frecuentes),
aes(x = LONGITUD, y = LATITUD, color = Clasif),
size = 2.5, alpha = 0.9) +
scale_color_brewer(palette = "Set1") +
facet_wrap(~Clasif) +
labs(title = "Informes de inspección ambiental | Industrias mas inspeccionadas (2014-2020)",
x = "Longitud",
y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

Según este gráfico las industrias se encuentran distribuidas equitativamente en la región vasca.
ggmap(PAISVASCO) +
geom_density2d(data = filter(IIA, Clasif %in% IIA_frecuentes), aes(x = LONGITUD, y = LATITUD, color = Clasif, color = stat(level))) +
scale_color_viridis_c() +
facet_wrap(~Clasif) +
labs(title = "Informes de inspección ambiental | Industrias mas inspeccionadas (2014-2020)",
x = "Longitud",
y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")
## Warning: Duplicated aesthetics after name standardisation: colour

El presente gráfico nos permite detectar los focos de localización según cada rubro lo que indica que no están equitativamente distribuidas.
IV. Comparar la densidad de los datos en el tiempo (facetar). ¿Los patrones espaciales de los datos elegidos se mantienen o varían en el tiempo?
IIA <- IIA %>%
mutate(dia_semana = wday(fecha, label = TRUE))
ggmap(PAISVASCO) +
geom_point(data = filter(IIA, Clasif %in% c("2.4.- Fundición de metales ferrosos capacidad > 20 t/dia", "5.5- Vertderos de todo tipo de residuos, excepto inertes, con capacidad>10 t/dia.")),
aes(x = LONGITUD, y = LATITUD, color = Clasif), alpha = .9, size = 2) +
facet_wrap(~dia_semana) +
labs(title = "Informes de inspección ambiental | Comparativa inspecciones por días en 2 rubros (2014-2020)",
x = "Longitud",
y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

A simple vista no detectamos algún patrón de inspección diaria en relación a la comparativa de ambos rubros. Parecería que jueves/viernes las inspecciones son mas dispersas que el resto de los días.
ggmap(PAISVASCO) +
geom_density2d(data = filter(IIA,
Clasif == "2.6.- Tratamiento de superficie de metales y materiales plásticos volumen>30m3"),
aes(x = LONGITUD,
y = LATITUD,
color = stat(level))) +
scale_color_viridis_c() +
facet_wrap(~dia_semana, nrow = 2) +
labs(title = "Inspecciones ambientales industrias metalurgicas",
subtitle = "según día de la semana") +
labs(title = "Informes de inspección ambiental | Mapa de calor rubro 'Trat. de sup. de metales y materiales plasticos' por día (2014-2020)",
x = "Longitud",
y = "Latitud", subtitle = "País Vasco - Fecha de actualización 16/05/2020",
caption = "Fuente: Gobierno Vasco / Departamento de Medio Ambiente y Política Territorial - https://opendata.euskadi.eus/")

En relación al rubro analizado martes y viernes son los días con mas concentración de inspecciones. El resto de los días existe mayor dispersión territorial.
Con este ultimo chunk damos por finalizado el TP4.-