Instale y cargue los siguientes paquetes: data.table,rgdal,ggplot2 y treemap.
library("data.table")
library("rgdal")
library("ggplot2")
library("treemap")
Cargue la base de datos de la lista y transformarla en un data.table.
bici <- readOGR("Bici_personaGS2016_2/Bici_personaGS2016_2.shp")
## OGR data source with driver: ESRI Shapefile
## Source: "/cloud/project/Bici_personaGS2016_2/Bici_personaGS2016_2.shp", layer: "Bici_personaGS2016_2"
## with 1135 features
## It has 33 fields
bici<-bici@data
bici<- as.data.table(bici)
La variable ESTADO_CAL describe el estado de la calzada por la cual circulaba el/la ciclista. De esta forma, las categorÃas que debe considerar esta variable son 3: BUENO, REGULAR y MALO. Por lo tanto, lo que debe hacer, es considerar todas aquellas observaciones que tengan alguna de esas 3 categorÃas en la variable ESTADO_CAL.
bici<- bici[ESTADO_CAL=="BUENO"|ESTADO_CAL=="REGULAR" |ESTADO_CAL=="MALO", ]
¿Cuántos accidentes hay por comuna?.
bici[,.N,by= COMUNA1]
## COMUNA1 N
## 1: PROVIDENCIA 135
## 2: CERRO NAVIA 14
## 3: NUNOA 79
## 4: RENCA 34
## 5: SANTIAGO 150
## 6: MAIPU 62
## 7: LA FLORIDA 31
## 8: P. AGUIRRE CERDA 11
## 9: PUDAHUEL 35
## 10: PENALOLEN 41
## 11: LAMPA 11
## 12: COLINA 6
## 13: LAS CONDES 52
## 14: QUILICURA 48
## 15: SAN JOAQUIN 18
## 16: PIRQUE 1
## 17: PUENTE ALTO 72
## 18: MACUL 28
## 19: LA CISTERNA 16
## 20: LO BARNECHEA 9
## 21: EL BOSQUE 34
## 22: CERRILLOS 14
## 23: SAN RAMON 14
## 24: VITACURA 6
## 25: RECOLETA 24
## 26: LA REINA 29
## 27: LO PRADO 18
## 28: ESTACION CENTRAL 32
## 29: SAN MIGUEL 19
## 30: QUINTA NORMAL 27
## 31: LA GRANJA 15
## 32: HUECHURABA 6
## 33: INDEPENDENCIA 16
## 34: LA PINTANA 12
## 35: CONCHALI 11
## COMUNA1 N
¿Cuántos accidentes con personas fallecidas hay por comuna?
bici[bici$Fallecidos ==1,.N, by = COMUNA1]
## COMUNA1 N
## 1: QUILICURA 2
## 2: LA GRANJA 1
## 3: CERRO NAVIA 1
## 4: MAIPU 1
## 5: LA FLORIDA 2
## 6: MACUL 1
## 7: SANTIAGO 1
## 8: LA PINTANA 1
## 9: LA REINA 1
## 10: LA CISTERNA 1
## 11: NUNOA 1
## 12: RECOLETA 1
¿Cuántos accidentes con personas graves hay por comuna?
Graves <- bici[Graves>0,.N, by = COMUNA1]
#otra opcion: bici[bici$Graves == 1 | bici$Graves ==2,.N, by = COMUNA1]
¿Cómo podrÃa mostrar el resultado de la pregunta 6 en un gráfico?. Muestre un gráfico legible.
ggplot(data = bici[Graves>0],aes(COMUNA1)) + geom_bar() + theme(axis.text.x=element_text(angle=90, vjust=0,5),axis.text.x.top =element_text(size=15), plot.title=element_text(size=10),) + ggtitle("Conteo por comuna", subtitle="Accidentes graves por comuna") + xlab("Comuna") + ylab("Número de Accidentes Graves") + labs(caption= "Fuente: Profesor")
¿Cuál es la principal causa (CAUSA__CON) de accidentes?
principal <- bici[,.N, by = CAUSA__CON]
max(principal$N)
## [1] 507
R: La principal causa de accidentes es de IMPRUDENCIA DEL CONDUCTOR que son 507
¿Cómo podrÃamos mostrar,gráficamente, las diferentes causas para la comuna de Providencia y Santiago? Muestre un gráfico legible.
ggplot(data=bici[COMUNA1=="PROVIDENCIA"|COMUNA1=="SANTIAGO",by=CAUSA__CON], aes(x=CAUSA__CON,))+ geom_bar()+theme(axis.text.x =element_text(angle=90, vjust=10),axis.text.x.top = element_text(size=10),plot.title = element_text(size=10)) + ggtitle("Causas accidentes", subtitle = "Santiago y Providencia") + xlab("Causa accidente") + ylab("Número de Accidentes") + labs(caption = "Fuente:Profesor") + facet_wrap(facets = "COMUNA1")
¿PodrÃa establecer que existe alguna relación entre la cantidad de accidentes leves por comuna y la proporción de accidentes que ocurren en un buen estado de calzada (porc_bueno)? Argumente gráficamente, de la mejor manera posible.
ggplot(data=bici,aes(x=Leves, y=porc_bueno))+geom_point() + ggtitle("Cantidad de Accidentes", subtitle = "segun propocion que ocurren en un buen estado de calzada") + xlab("Accidentes Leves") + ylab("Porcion Calzada buen estado") + labs(caption = "Fuente:Profesor")
¿PodrÃa establecer que existe alguna relación entre la cantidad de accidentes graves por comuna y la proporción de accidentes que ocurren en un buen estado de calzada (porc_bueno)? Argumente gráficamente, de la mejor manera posible.
ggplot(data=bici,aes(x=Graves>0, y=porc_bueno))+geom_point() + ggtitle("Cantidad de Accidentes", subtitle = "segun propocion que ocurren en un buen estado de calzada") + xlab("Accidentes Leves") + ylab("Porcion Calzada buen estado") + labs(caption = "Fuente:Profesor")
Muestre gráficamente la cantidad de accidentes que hay para las distintas causas de accidentes.
ggplot(bici, aes(x=CAUSA__CON, y=Accidentes)) + geom_bar(stat= "identity") + theme(axis.text.x = element_text(angle=45, hjust=1))+ ggtitle("Cantidad de Accidentes", subtitle = "segun sus Causas") + xlab("Causa accidente") + ylab("Número de Accidentes") + labs(caption = "Fuente:Profesor")