###Limpiar el environment

rm(list=ls())

###Abrir los paquetes con los que trabajaremos

library(data.table)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✓ ggplot2 3.3.3     ✓ purrr   0.3.4
## ✓ tibble  3.1.1     ✓ dplyr   1.0.5
## ✓ tidyr   1.1.3     ✓ stringr 1.4.0
## ✓ readr   1.4.0     ✓ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::between()   masks data.table::between()
## x dplyr::filter()    masks stats::filter()
## x dplyr::first()     masks data.table::first()
## x dplyr::lag()       masks stats::lag()
## x dplyr::last()      masks data.table::last()
## x purrr::transpose() masks data.table::transpose()
library(leaflet)
library(sp)
library("RColorBrewer")
library(ggplot2)

Abrir la base de datos que utilizaremos, en este caso será el OED de hogares realizado en el Gran Valparaiso en los años 2014-2015

Hogares <- fread("/Users/antoniasalinas/Desktop/Data Science/Clase 3/EOD_hogares.csv")

###Analizaremos la relación existente entre los ingresos por hogar y la comuna a la que pertenecen estos hogares.

ggplot(data= Hogares, aes(x=Comuna, fill=IngresoHogar))+geom_bar()+labs(y="Ingreso hogar", title = "Frecuencia Ingreso Hogar", subtitle="Por Comuna", caption="Fuente: Base de Datos EOD_Hogares")

###Comuna 2= Valparaiso ###Comuna 3= Viña del Mar ###Comuna 4= Villa Alemana ###Comuna 5= Quilpue ###Comuna 6= Concon ###La comuna con mayor nivel de ingreso por hoar es Viña del Mar con mas de 3.000 y la que tiene un menor nivel de ingreso es la comuna Villa Alemana con menos de 1.000. Podemos ver tambien que hay una gran diferencia entre los ingresos del hogar segun comuna, siendo bastante relevante la diferencia entre lo que tienen como ingreso por hogar de la comuna Viña del Mar y Villa Alemana.

###Ahora veremos en otor grafico la relación que existe entre el número de vehículos y la comuna a la que pertenecen los Hogares. Podríamos pensar que esto seguirá el patron del grafico anterior de que las comunas con mayor ingreso son las que tienen más vehiculos. ###Primero crearemos el objeto numerodevehiculosporcomuna

Numvehporcomuna=Hogares[,sum(NumVeh),by="Comuna"]
ggplot(data=Numvehporcomuna)+geom_point(mapping=aes(x=V1,y=Comuna,color=Comuna))+labs(x="Numero Vehiculos", y="Comuna", title = "Numero Vehiculos", subtitle="Por Comuna", caption="Fuente: Base de Datos EOD_Hogares")

###Comuna 2= Valparaiso ###Comuna 3= Viña del Mar ###Comuna 4= Villa Alemana ###Comuna 5= Quilpue ###Comuna 6= Concon ###Tal como lo presentíamos, vemos que el comportamiento que vimos en la relación ingresos por hogar en cada comuna se repite en la cantidad de autos por hogar en cada comuna: En Viña del Mar los hogares tienen una mayor cantidad de autos con mucho más de 1500 vehiculos, mientras que en Villa Alemana tienen menos de 500 autos.

###Crearemos un mapa para ver las 3 comunas que más vehiculos tienen según la muestra en el Gran Valparaiso; Viña del Mar, Valparaiso y Quilpue.

leaflet() %>% 
addTiles() %>% 
addMarkers(lat=c(-33,-33.05,-33.05), lng=c(-71.5167,-71.6167,-71.45),popup = c("Viña del mar","Valparaiso", "Quilpue"))