Introducción

El siguiente documento está realizado con la finalidad de poder comprender como se distribuye la movilidad de la ciudad de Cali, es decir, desde que comuna de origen puede viajar un habitante de la ciudad y cuales son las principales áreas o comunas de destino, en ese sentido, mediante mapas se podran apreciar los lugares de donde mayoritariamente sale la gente a trabajar o diferenets labores y cuales son sus sitios de llegada para tomar decisiones que permitan mejorar este problema.

1. Limpieza y entendimiento de los datos

Inicialmente, se cargo el excel de origen el cual tenia un total de 35,054 filas de datos, este excel contenia diferenets columnas como la fecha, municipio, sexo, edad, entre otras variables, sin embargo para el estudio en particular, era necesario unicamente las variables de “Tipo de vehiculo”, “Comuna origen” y “Comuna destino”.

glimpse(EncuestaOrigenDestino)
## Rows: 35,054
## Columns: 28
## $ FECHA                                                                                      <dttm> …
## $ `ID ESTACIÓN`                                                                              <dbl> …
## $ ESTACIÓN                                                                                   <chr> …
## $ ACCESO                                                                                     <chr> …
## $ MOVIMIENTO                                                                                 <chr> …
## $ `Hora de Encuesta`                                                                         <dttm> …
## $ MUNICIPIO...7                                                                              <chr> …
## $ `DEPARTAMENTO / LOCALIDAD  / COMUNA / DISTRITO / BARRIO / VEREDA  / HITO / DIRECCIÓN...8`  <chr> …
## $ `Codigo Origen_SDG`                                                                        <chr> …
## $ `¿QUE ESTABA HACIENDO EN ESE LUGAR?`                                                       <dbl> …
## $ MUNICIPIO...11                                                                             <chr> …
## $ `DEPARTAMENTO / LOCALIDAD  / COMUNA / DISTRITO / BARRIO / VEREDA  / HITO / DIRECCIÓN...12` <chr> …
## $ `Codigo Destino_SDG`                                                                       <chr> …
## $ `¿QUE VA HACER A ESE LUGAR?`                                                               <dbl> …
## $ `ESTRATO EN SU VIVIENDA`                                                                   <dbl> …
## $ `¿DISPONIA DE UN VEHÍCULO PARA REALIZAR ESTE DESPLAZAMIENTO?`                              <dbl> …
## $ `OTRO ¿CUÁL?...17`                                                                         <lgl> …
## $ ANTES                                                                                      <dbl> …
## $ DESPUES                                                                                    <lgl> …
## $ EDAD                                                                                       <dbl> …
## $ SEXO                                                                                       <dbl> …
## $ `PERSONAS EN EL VEHÍCULO`                                                                  <dbl> …
## $ `TIPO DE VEHÍCULO`                                                                         <dbl> …
## $ `OTRO ¿CUÁL?...24`                                                                         <lgl> …
## $ `TIPO DE VIAJERO`                                                                          <chr> …
## $ `comuna origen`                                                                            <chr> …
## $ `comuna destino`                                                                           <chr> …
## $ Intracomuna                                                                                <chr> …

Selección de columnas

Teniendo en cuenta lo anterior se realizá un datafram alterno que incluya unicamente las variables útiles para el documento en cuestión.

df_Encuesta = EncuestaOrigenDestino[,c("comuna origen","comuna destino","TIPO DE VEHÍCULO")]
colnames(df_Encuesta) = c("C_Origen", "C_Destino", "Tipo_Vehiculo")

Normalización de variables

Posteriormente se realiza un proceso de normalización y depuración de la información, en este caso se procedió a eliminar aquellas filas que tuvieras la inscripción “Fuera de Cali” ya sea como comuna de origen o comuna de destino ya que no es objeto de investigación en este documento, adicionalmente, se eliminaron aquellas comunas cuyo origen era 0, ya que no existe la comuna 0 y adicionalmente, esto puede deberse a un error en la transcripción de los datos, en función de esto no se consideró oportuno reemplazar la data con la moda, sino que se opto por imputar los datos ya que se cuenta con una cantidad considerable de ellos.

unique(df_Encuesta$C_Origen)
##  [1] "02"            "Fuera de Cali" "06"            "03"           
##  [5] "04"            "13"            "17"            "16"           
##  [9] "05"            "15"            "07"            "14"           
## [13] "10"            "21"            "08"            "11"           
## [17] "19"            "12"            "20"            "01"           
## [21] "0"             "18"            "09"            "22"
df_Encuesta = df_Encuesta[df_Encuesta$C_Origen != "Fuera de Cali" & df_Encuesta$C_Origen != "0",]
unique(df_Encuesta$C_Destino)
##  [1] "22"            "02"            "04"            "03"           
##  [5] "19"            "09"            "Fuera de Cali" "18"           
##  [9] "21"            "06"            "10"            "05"           
## [13] "11"            "17"            "14"            "08"           
## [17] "07"            "15"            "12"            "01"           
## [21] "13"            "16"            "0"             "20"
df_Encuesta = df_Encuesta[df_Encuesta$C_Destino != "Fuera de Cali" & df_Encuesta$C_Destino != "0",]

Adicionalmente, se tuvo en cuenta cuales son los tipos de vehiculos a evaluar, el estudio unicamnete se centra en vehiculos Automoviles (3), Bicicletas (1) y Motos (2), las demás categrías fueron eliminadas del dataset y las que se conservron fueron convertidas a formato numérico.

unique(df_Encuesta$Tipo_Vehiculo)
##  [1]  2  3  4  1  5  7  8 77 NA  6  9
df_Encuesta = df_Encuesta[df_Encuesta$Tipo_Vehiculo %in% c(1, 2, 3),]
df_Encuesta$C_Origen = as.numeric(df_Encuesta$C_Origen)
df_Encuesta$C_Destino = as.numeric(df_Encuesta$C_Destino)

Análisis de faltantes

Una vez realizada esta depuración se quiso evidenciar las cantidades de datos faltantes dentro del dtaset, sin embargo no se obtuvieron de este tipo y por lo tanto no se realizaron procedimientos para solucionar esto. La cantidad final de los datos fueron 20,135.

library(mice)
## 
## Attaching package: 'mice'
## The following object is masked from 'package:stats':
## 
##     filter
## The following objects are masked from 'package:base':
## 
##     cbind, rbind
Grafico_Faltantes = md.pattern(df_Encuesta, rotate.names = TRUE)
##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

2. Implementación del código y creación de gráficos.

Cargar Shapefile de comuna

Inicialmente se procedió con la carga del archivo shapefile, el cual contiene todas las comunas de la ciudad de cali, el archivo es .shp, de tipo polinomial, el cual graficamente permite ver las coordenadas y poligonos de cada comuna. Adicionalmente la data del archivo contine el código gid, el numero de la comuna y su respectivo nombre.

Comunas = shapefile("C:/Users/nicol/Desktop/Shapes/Comunas.shp")
##    OBJECTID gid comuna    nombre
## 1         1 107      2  Comuna 2
## 2         2 108      1  Comuna 1
## 3         3 109      3  Comuna 3
## 4         4 110     19 Comuna 19
## 5         5 103     15 Comuna 15
## 6         6 104     17 Comuna 17
## 7         7 105     18 Comuna 18
## 8         8 106     22 Comuna 22
## 9         9  89      6  Comuna 6
## 10       10  90      4  Comuna 4
## 11       11  91      5  Comuna 5
## 12       12  92      7  Comuna 7
## 13       13  93      8  Comuna 8
## 14       14  94      9  Comuna 9
## 15       15  95     21 Comuna 21
## 16       16  96     13 Comuna 13
## 17       17  97     12 Comuna 12
## 18       18  98     14 Comuna 14
## 19       19  99     11 Comuna 11
## 20       20 100     10 Comuna 10
## 21       21 101     20 Comuna 20
## 22       22 102     16 Comuna 16

Con el fin de poder unificar la información de ambos documentos y poder encontrar la cantidad de personas con origen de destino y origen por cada medio de transporte se realiza primero un agrupamiento de todos los valores segun su comuna y posteriormente esta se adiciona a la data del archivo .shp de comunas. Inicialmente se realiza el agrupamiento por todas las comunas y todos los tipos de vehiculos

# Origen y destino para vehiculos tipo

df_Encuesta_Origen_all = df_Encuesta %>%
  group_by(C_Origen) %>%
  summarise(Viajes_Origen_all = n())

Comunas$Origen_all <- df_Encuesta_Origen_all$Viajes_Origen_all[match(Comunas$comuna, df_Encuesta_Origen_all$C_Origen)]

df_Encuesta_Destino_all = df_Encuesta %>%
  group_by(C_Destino) %>%
  summarise(Viajes_Destino_all = n())

Comunas$Destino_all <- df_Encuesta_Destino_all$Viajes_Destino_all[match(Comunas$comuna, df_Encuesta_Destino_all$C_Destino)]

Se realiza el mismo procedimiento para las bicicletas, o vehiculos tipo 1, 2 y 3.

A continuación, se puede ver la data adicionada al archivo principal una vez realizado el match corrrespondiente con la comuna a la cual pertenece, esto con el fin de obtener los resultados de origen y destido por cada tiipo de vehiculos y en general.

##    OBJECTID gid comuna    nombre Origen_all Destino_all Origen_1 Destino_1
## 1         1 107      2  Comuna 2       2045        3446      122       194
## 2         2 108      1  Comuna 1        562         172       32         9
## 3         3 109      3  Comuna 3       1465        2600       84       169
## 4         4 110     19 Comuna 19       2031        2209      113       131
## 5         5 103     15 Comuna 15        887         448       55        17
## 6         6 104     17 Comuna 17       1618        1489      103        95
## 7         7 105     18 Comuna 18       1111         484       85        28
## 8         8 106     22 Comuna 22        906        1425       52        95
## 9         9  89      6  Comuna 6        720         494       29        31
## 10       10  90      4  Comuna 4       1072        1354       58        80
## 11       11  91      5  Comuna 5        473         402       28        38
## 12       12  92      7  Comuna 7        531         539       30        36
## 13       13  93      8  Comuna 8        786         753       46        46
## 14       14  94      9  Comuna 9        648         950       36        56
## 15       15  95     21 Comuna 21        630         390       35        24
## 16       16  96     13 Comuna 13        927         502       62        28
## 17       17  97     12 Comuna 12        231         190       10        13
## 18       18  98     14 Comuna 14        526         290       32        20
## 19       19  99     11 Comuna 11        649         447       42        26
## 20       20 100     10 Comuna 10       1010         678       71        34
## 21       21 101     20 Comuna 20        539         277       33        22
## 22       22 102     16 Comuna 16        768         596       65        31
##    Origen_2 Destino_2 Origen_3 Destino_3
## 1      1063      1734      860      1518
## 2       296        90      234        73
## 3       702      1333      679      1098
## 4       995      1152      923       926
## 5       455       232      377       199
## 6       853       744      662       650
## 7       593       240      433       216
## 8       430       766      424       564
## 9       377       255      314       208
## 10      571       678      443       596
## 11      260       183      185       181
## 12      272       279      229       224
## 13      421       382      319       325
## 14      317       512      295       382
## 15      323       202      272       164
## 16      453       285      412       189
## 17      133       106       88        71
## 18      258       150      236       120
## 19      339       217      268       204
## 20      535       353      404       291
## 21      278       124      228       131
## 22      383       290      320       275

a. Graficos de Origen y Destino todos los medios de transporte

En la primer grafica donde se tienen en cuenta todos los medios de transporte, se puede apreciar que el principal punto o comuna de origen son las comunas 2, 19, 17 y 3 en orden de mayor a menor, en este casose aprecia que los sectores nor occidentales de la ciudad son de donde mas sale gente a hacer sus labores.

Por otra parte, cuando se analiza los lugares de detino las comunas que mayores datos muestran son las comunas 2 y 3, lo que permite reconocer un patron determinante al ver que el sector mas concurrido de las ciudad de encuentra en la comuna 2 de Cali. Tambien se aprecia que la seccion centro y sur oriental son sitios donde no se designan como destinos habitualmente.

b. Graficos de Origen y Destino medio de transporte “Bicicleta”

Al igual que en las graficas generales, cuando se analiza el lugar de origen de las personas que viajan usando bicicleta en Cali, se pued eapreciar que las comunas 2, 19 y 17 presentan valores muy altos, tambien e simportante observar que la cantidad de gente que se tranporta por este medio oscila entre los 120 y 0 personas, encontrando que desde la comuna 12 es casi nulo el uso de bicicleta.

En cuanto al destino de las personas que se mueven en bicicleta mayoritariamente son la comuna 3, 3 y 19, dejando en valores muy por debajo a los sectores centro orientales de la ciudad, a diferencia de la ciudad de origen de la cual si existen varias personas que viajan en bicicleta desde estos lugares a la parte norte. Es importante apreciar que probablemente al ser un medio de transporte que no se usa para distancias largas, los viajes de origen y destino pueden ubicarse dentro de la misma comuna y por eso la distribución es tan similar.

c. Graficos de Origen y Destino medio de transporte “Moto”

En cuanto al transporte en moto, se encuentra una gran similitud con respecto a quienes se transportan en bicicleta, sin embargo la escala se muestra de manera más amplia, siendo hasta 10 veces mas grande que las bicicletas, también se puede denotar un mayor punto de origen desde las comunas cercanas a la comuna 2 que es la de mayor afluecia.

En cuanto a los sitios a los que suelen dirigirse las personas en moto, se puede ver que es casi que la misma distribución de las bicicletas, particularmente puede darse el mismo fenomeno en que las personas se mueven dentro de la misma comuna, por tanto, si la ciudad con mayor origen es la 2 y se mueven en la misma comuna tambien se convierte en la de más destinos, de ifual manera se aprecia un incremento en la escala y la cantidad de personas se de transportan en moto.

d. Graficos de Origen y Destino medio de transporte “Automovil”

Finalmente cuando se habla de transporte en automovil, se aprecia al interesante, la comuna 19 se convierte en la comuna con más cantidad de personas cuyo origen es esta comuna y se trasladan usando automovil, tienen un rango menor que el de personas en motocicleta, sin embargo representan gran cantidad de ciudadanos transportandose en Carro. Las demás comunas presentan el mismo patron de origen.

Por último las comunas de destino de los automoviles presentan los mismos patrones de los medios de transporte anteriores.

3. Conclusiones