Trabajo Aplicado Visualizaciones con ggplot2 + rmarkdown

P1

Instale y cargue los siguientes paquetes: data.table,rgdal,ggplot2 y treemap

install.packages("rgdal")
install.packages("ggplot2")
install.packages("treemap")
library(data.table)
library(rgdal)
library(ggplot2)
library(treemap)

P2

Cargue la base de datos de la lista y transformarla en un data.table

biciMap<-readOGR(dsn = "Bici_personaGS2016_2/Bici_personaGS2016_2.shp")
## OGR data source with driver: ESRI Shapefile 
## Source: "C:\Users\Florencia\Documents\UAI\8vo semestre\Data Science\Laboratorio 7\Bici_personaGS2016_2\Bici_personaGS2016_2.shp", layer: "Bici_personaGS2016_2"
## with 1135 features
## It has 33 fields
databici<-data.table(biciMap@data)

P3

La variable ESTADO_CAL describe el estado de la calzada por la cual circulaba el/la ciclista. De esta forma, las categorías que debe considerar esta variable son 3: BUENO, REGULAR y MALO. Por lo tanto, lo que debe hacer, es considerar todas aquellas observaciones que tengan alguna de esas 3 categorías en la variable ESTADO_CAL.

databiciFiltrada<-databici[ESTADO_CAL%in%c("BUENO","REGULAR","MALO")]

P4

¿Cuántos accidentes hay por comuna?

databiciFiltrada[,.(Accidentesxcomuna=sum(Accidentes)),by=COMUNA1]
##              COMUNA1 Accidentesxcomuna
##  1:      PROVIDENCIA               141
##  2:      CERRO NAVIA                15
##  3:            NUNOA                83
##  4:            RENCA                34
##  5:         SANTIAGO               154
##  6:            MAIPU                63
##  7:       LA FLORIDA                31
##  8: P. AGUIRRE CERDA                12
##  9:         PUDAHUEL                36
## 10:        PENALOLEN                43
## 11:            LAMPA                12
## 12:           COLINA                 6
## 13:       LAS CONDES                54
## 14:        QUILICURA                49
## 15:      SAN JOAQUIN                19
## 16:           PIRQUE                 1
## 17:      PUENTE ALTO                73
## 18:            MACUL                28
## 19:      LA CISTERNA                18
## 20:     LO BARNECHEA                 9
## 21:        EL BOSQUE                35
## 22:        CERRILLOS                15
## 23:        SAN RAMON                14
## 24:         VITACURA                 7
## 25:         RECOLETA                26
## 26:         LA REINA                30
## 27:         LO PRADO                18
## 28: ESTACION CENTRAL                34
## 29:       SAN MIGUEL                19
## 30:    QUINTA NORMAL                27
## 31:        LA GRANJA                15
## 32:       HUECHURABA                 6
## 33:    INDEPENDENCIA                16
## 34:       LA PINTANA                13
## 35:         CONCHALI                12
##              COMUNA1 Accidentesxcomuna

P5

¿Cuántos accidentes con personas fallecidas hay por comuna?

databiciFiltrada[,.(Fallecidosxcomuna=sum(Fallecidos)),by=COMUNA1]
##              COMUNA1 Fallecidosxcomuna
##  1:      PROVIDENCIA                 0
##  2:      CERRO NAVIA                 1
##  3:            NUNOA                 1
##  4:            RENCA                 0
##  5:         SANTIAGO                 1
##  6:            MAIPU                 1
##  7:       LA FLORIDA                 2
##  8: P. AGUIRRE CERDA                 0
##  9:         PUDAHUEL                 0
## 10:        PENALOLEN                 0
## 11:            LAMPA                 0
## 12:           COLINA                 0
## 13:       LAS CONDES                 0
## 14:        QUILICURA                 2
## 15:      SAN JOAQUIN                 0
## 16:           PIRQUE                 0
## 17:      PUENTE ALTO                 0
## 18:            MACUL                 1
## 19:      LA CISTERNA                 1
## 20:     LO BARNECHEA                 0
## 21:        EL BOSQUE                 0
## 22:        CERRILLOS                 0
## 23:        SAN RAMON                 0
## 24:         VITACURA                 0
## 25:         RECOLETA                 1
## 26:         LA REINA                 1
## 27:         LO PRADO                 0
## 28: ESTACION CENTRAL                 0
## 29:       SAN MIGUEL                 0
## 30:    QUINTA NORMAL                 0
## 31:        LA GRANJA                 1
## 32:       HUECHURABA                 0
## 33:    INDEPENDENCIA                 0
## 34:       LA PINTANA                 1
## 35:         CONCHALI                 0
##              COMUNA1 Fallecidosxcomuna

P6

¿Cuántos accidentes con personas graves hay por comuna?

databiciFiltrada[,.(Gravesxcomuna=sum(Graves)),by=COMUNA1]
##              COMUNA1 Gravesxcomuna
##  1:      PROVIDENCIA            26
##  2:      CERRO NAVIA             2
##  3:            NUNOA            16
##  4:            RENCA             8
##  5:         SANTIAGO            19
##  6:            MAIPU            11
##  7:       LA FLORIDA             3
##  8: P. AGUIRRE CERDA             2
##  9:         PUDAHUEL            13
## 10:        PENALOLEN             6
## 11:            LAMPA             2
## 12:           COLINA             2
## 13:       LAS CONDES             9
## 14:        QUILICURA             4
## 15:      SAN JOAQUIN             6
## 16:           PIRQUE             0
## 17:      PUENTE ALTO             7
## 18:            MACUL             5
## 19:      LA CISTERNA             5
## 20:     LO BARNECHEA             2
## 21:        EL BOSQUE             9
## 22:        CERRILLOS             2
## 23:        SAN RAMON             1
## 24:         VITACURA             2
## 25:         RECOLETA             5
## 26:         LA REINA             7
## 27:         LO PRADO             4
## 28: ESTACION CENTRAL             5
## 29:       SAN MIGUEL             3
## 30:    QUINTA NORMAL            10
## 31:        LA GRANJA             3
## 32:       HUECHURABA             1
## 33:    INDEPENDENCIA             4
## 34:       LA PINTANA             3
## 35:         CONCHALI             2
##              COMUNA1 Gravesxcomuna

P7

¿Cómo podría mostrar el resultado de la pregunta 6 en un gráfico?. Muestre un gráfico legible.

ggplot(data =databiciFiltrada ,aes(x=COMUNA1, y=Graves))+geom_bar(stat ='identity')+ theme(axis.text.x =element_text(angle=85, vjust=0.5))+labs(x="Comuna",y="Cantidad", title = "Accidentes con personas graves por comuna")

P8

¿Cuál es la principal causa (CAUSA__CON) de accidentes?

databiciFiltrada[,.(AccidentesxCausa=sum(Accidentes)),by=CAUSA__CON]
##                         CAUSA__CON AccidentesxCausa
##  1:       PERDIDA CONTROL VEHICULO               21
##  2:         CAUSAS NO DETERMINADAS              251
##  3:      IMPRUDENCIA DEL CONDUCTOR              525
##  4:                   OTRAS CAUSAS              204
##  5:   DESOBEDIENCIA A SENALIZACION              123
##  6:           ALCOHOL EN CONDUCTOR               22
##  7: DROGAS Y/O FATIGA EN CONDUCTOR                4
##  8:         IMPRUDENCIA DEL PEATON               13
##  9:               FALLAS MECANICAS                2
## 10:           VELOCIDAD IMPRUDENTE                2
## 11:            DEFICIENCIAS VIALES                1
Al tener solo 11 causas, es fácil observar que la imprudencia del conductor es la principal causa de accidentes.

P9

¿Cómo podríamos mostrar,gráficamente, las diferentes causas para la comuna de Providencia y Santiago? Muestre un gráfico legible. (3 puntos)

newdata<-databiciFiltrada[COMUNA1%in% c("PROVIDENCIA","SANTIAGO")]

ggplot(data =newdata ,aes(x=CAUSA__CON, y= Accidentes, ))+geom_bar(stat ='identity')+ theme(axis.text.x =element_text(angle=85, vjust=0.5))+labs(x="Causas del accidente",y="Cantidad", title = "Diferentes causas de accidentes en las comunas de Providencia y Santiago")

P10

¿Podría establecer que existe alguna relación entre la cantidad de accidentes leves por comuna y la proporción de accidentes que ocurren en un buen estado de calzada (porc_bueno)? Argumente gráficamente, de la mejor manera posible. (5 puntos)

ggplot(data=databiciFiltrada,aes(x=porc_bueno,y=Leves, colour= Leves))+geom_point(stat ='identity')

P11

¿Podría establecer que existe alguna relación entre la cantidad de accidentes graves por comuna y la proporción de accidentes que ocurren en un buen estado de calzada (porc_bueno)? Argumente gráficamente, de la mejor manera posible. (5 puntos)

ggplot(data=databiciFiltrada,aes(x=porc_bueno,y=Graves, colour= Graves))+geom_point(stat ='identity')

P12

Muestre gráficamente la cantidad de accidentes que hay para las distintas causas de accidentes. (5 puntos)

ggplot(data =databiciFiltrada ,aes(x=Accidentes, y=CAUSA__CON))+geom_bar(stat ='identity')+ theme(axis.text.x =element_text(angle=85, vjust=0.5))+labs(x="Cantidad de accidentes",y="Causas de accidentes", title = "Cantidad de accidentes por causa")