## Este paquete está en desarrollo. Por favor, si detectas errores  o quieres hacernos alguna sugerencia, puedes ponerte en contacto con nosotros en:
## estadistic@uv.es
## También puedes seguirnos en el canal de youtube:
## https://go.uv.es/estadistic/youtube
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var

Cargar de la base de datos

library(readxl)
BD_PA <- read_excel("C:/Users/Darlin/OneDrive/Escritorio/BD_PA.xlsx")
View(BD_PA)

UNIVERSIDAD DE LA SALLE

TABLA DE CONTENIDO

1.INTRODUCCIÓN
2.JUSTIFICACIÓN
2.1 ¿Por qué el estudio?
2.2 ¿Por qué el instrumento?
2.3 Población y muestra
Población
Muestra
3. MARCO TEÓRICO
3.1. Estadística
3.2. Variables estadísticas
Variables cuantitativas
Variables cualitativas
3.3. Media, Mediana y Moda
Media
Mediana
Moda
3.4 Tabla de frecuencia
Frecuencia absoluta
Frecuencia acumulada
Frecuencia relativa
Fórmula de Sturges
Límite de clase
Marca de clase
3.5. Rstudio
3.6 Gráficos
4. MARCO CONCEPTUAL
4.1 Patrones de movilidad
4.2 Sexo
4.3 Estrato socioeconómico
4.4 Medios de transporte
Transmilenio
Sistema Integrado de Transporte Público (SITP)
Bicicletas
Taxis
Aplicaciones de transporte compartido
Caminar
Vehículo Propio
4.5 Distancia
4.6 Tiempo
4.7 Dinero
4.8 Gráficas
Diagrama de barras
Gráfico circular
Histograma
Polígono de frecuencias
Ojiva
4.9 Medidas de dispersión
5. TABLAS DE FRECUENCIA, GRÁFICAS E INTERPRETACIONES
5.1 DATOS CUANTITATIVOS
Interpretación de Costo
Interpretación de distancia
Interpretación de tiempo
5.2 DATOS CUANTITATIVOS
Interpretación de Estrato
Interpretación de medio de transporte
Interpretación de Sexo
7. CONCLUSIONES
8. REFERENCIAS

1. Introducción

El siguiente documento tiene como objetivo presentar el informe final del Proyecto de Aula. Este proyecto consiste observar y analizar los patrones de movilidad presentes en la ciudad de Bogotá. Para llevar a cabo el informe, se elaboró una encuesta compuesta por un conjunto de cinco preguntas, estas preguntas abarcan variables cualitativas, tanto ordinales como nominales, como variables cuantitativas, que engloban datos cuantitativos discretos como continuos, esto con el fin de lograr presentar resultados de la presente investigación mediante representaciones gráficas como ojivas, polígonos de frecuencia e histogramas (para datos cuantitativos), así como gráficas de pastel y diagramas de barras (para datos cualitativos), junto con tablas de frecuencia. Por otro lado, también se válida eque tanto se alejan los datos de la media lo cual se pudo obtener a través de las medidas de dispersión o variabilidad, clasificandose en varianza, desviación estándar, coeficiente de variación y desviación media.

Las preguntas planteadas en el instrumento fueron diseñadas para recopilar datos acerca del sexo de los encuestados, los medios de transporte que utilizan con más frecuencia, el estrato socioeconómico en el que viven, el gasto monetario que destinan a su movilidad diaria, el tiempo que emplean en sus desplazamientos y la distancia promedio que recorren en sus trayectoscotidianos de ida y vuelta. Por otro lado, de las 82 respuestas obtenidas se logra establecer la base para realizar el documento, en ese sentido, el ejercicio realizado a través de la encuesta ha posibilitado la generación de los gráficos mencionados previamente y tablas de frecuencia, lo que ayuda a obtener un perfil más detallado de la población objeto de estudio: los habitantes de ciudad de Bogotá.

2. Justificación

2.1. ¿Por qué el estudio?

Este estudio se ha llevado a cabo con el propósito de obtener una visión más cercana y precisa a la realidad de la movilidad en Bogotá, porque permite que se profundice en la cotidianidad de cómo los ciudadanos eligen desplazarse, ya que esta comprensión nos brinda un panorama mucho más amplio sobre el tiempo que dedican y los recursos que invierten en el sistema de transporte de la ciudad.

No obstante, conviene destacar que, más allá de esta exploración sobre la movilidad en Bogotá, hay una dimensión adicional que merece atención. En este caso, se puede inferir que el docente a cargo de este estudio tiene como objetivo pedagógico guiar a sus estudiantes de métodos estadísticos a través de una experiencia de aprendizaje que involucre el análisis y la recopilación de datos relacionados con el proyecto de aula propuesto, de esta manera, el docentebusca fomentar una habilidad crítica en los estudiantes al indagar y reflexionar sobre los procesos del abordaje en una investigación.

Además, esta experiencia de investigación ofrece la oportunidad de adentrarse en la formulación de preguntas, la realización de proyectos investigativos lo que implica aprender a interpretar una encuesta, que permite adquirir datos por medio de herramientas como Excelo Word y RMarkdown con la cual se podrá presentar un proyecto más organizado utilizando el mismo aplicativo de R tanto para el desarrollo como para la presentación de resultados, de estqa manera también hubo un apoyo a través de RSTUDIO,donde el docente ha destacado que RSTUDIO es la herramienta más acertada en este caso para generar este tipo de gráficos, por lo tanto, mediante ejercicios tanto teóricos como prácticos se ha logrado llegar a una profundización y familiarización con esta lo que ha permitido comprender sus funciones y su aplicación en el documento que se encuentra actualmente en desarrollo. El aprendizaje obtenido durante este proyecto de aula se convertirá en las bases para poder desarrollar futuros proyectos y así mismo ejecutarlo en el ámbito de la práctica profesional.

2.2. ¿Por qué el instrumento?

Para empezar, es necesario definir que es una encuesta, para así entrarse al concepto un poco más. Es por esto por lo que una encuesta, según Méndez (2009, p.252), citado por Autor Anónimo (s.f, p.60) define la técnica de observación por encuesta como la recolección de información que se hace por medio de formularios, la cual permite el conocimiento de las motivaciones, el comportamiento y las opiniones de los individuos en relación con el objeto de investigación o por otro lado Hernández, Fernández y Baptista (2006, p.310) citados por Autor Anónimo (s.f, p.60) definen la encuesta como el instrumento más utilizado para recolectar datos, consiste en un conjunto de preguntas respecto a una o más variables a medir.”

En síntesis, el cuestionario representa el instrumento preferido para la mayoría de losinvestigadores, puesto que el uso de esta herramienta es poco costoso, fácil de elaborar, se puede realizar en un tiempo relativamente corto, y además puede estructurarse de diversas formas conteniendo tipos de preguntas cerradas y abiertas dependiendo el diseño que se elija utilizar.”Teniendo más claro el concepto de encuesta, es necesario recalcar que este fue el medio por el cual logramos recopilar una información, que como bien es dicho anteriormente es mucho más rápido y eficaz para obtener un resultado en poco tiempo y de igual manera invertible menos a esta estrategia de investigación, ya que otro tipo de estrategias tal vez pueden llegar a demandar de mayor tiempo, es por esto que fue el instrumento que mejor se logró adaptar no sólo al tipo de población al cual le hacíamos la encuesta, porque de manera digital se convierte en algo mucho más fácil que realizar algo de manera presencial, de igual manera teniendo sus alcances y limitaciones.

2.3. Población y muestra
Población:

Para el desarrollo del estudio se eligió a la población de Bogotá que se conforma por 7.412.566, según cifras de 2018, que se caracterizaran por movilizarse en la ciudad por medio de algún tipo de transporte e incluso caminando.

Muestra:

De acuerdo con la población elegida la muestra se basa en habitantes de Bogotá, que rodean nuestros circulo social, los cuales son mayores de edad de sexo femenino o masculino que viven en distintos estratos socioeconómicos, que también utilizan el medio de transporte o alternativas para desplazarse, como caminando, pero solo en casos de estudio o trabajo y también que a su vez estudian y trabajan para si llegar a obtener un total de 82 respuestas. En este caso, se ha logrado aplicar el debido proceso con RSTUDIO para la identificación y análisis de las variables cualitativas, como el sexo de los encuestados.

Estos datos cualitativos se han convertido en tablas de frecuencias que posteriormente serán representadas gráficamente y son estas gráficas las que nos permitirán visualizar de manera efectiva los resultados obtenidos en el documento.

3. Marco teórico

A continuación, podremos observar las teorías que fueron aplicadas para el desarrollo de este segundo avance de proyecto de aula. Para empezar, es necesario primero definir de que trata la rama de las matemáticas en la cual estamos trabajando.

3.1. Estadística

Según Parias 2011, citado por citado por Loaiza & López (2020, pág. 4) al referirse a la definición de la palabra estadística: son pocas son las personas las que tienen una descripción clara acerca del término, se determina que la estadística es aquella que se la asocia con una serie de datos o columna de números; de acontecimientos que se dieron en el pasado o de hechos históricos o una lista de defunciones, nacimientos, causas de muerte en una región, en un periodo de tiempo determinado, listados de precios de un sin número de artículos.

Por otro lado, según Mendiburu (2018), citado por Loaiza & López (2020, pág.4), “la estadística es una ciencia aplicada de las matemáticas y es una valiosa herramienta para la toma de decisiones que permite el estudio de fenómenos mediante la descripción de este a través de inferencias mediante distribución probabilísticas”. Sin embargo, Loaiza & López nos aclaran que al momento de enfatizar que es la estadística se comprende como una herramienta que tiene gran relevancia y es la encargada de la recolección, agrupación, representación, análisis e interpretación de datos, permitiendo de esa manera facilitar la comprensión de los datos de una manera clara y concisa. La estadística no son solo aquellos resultados de encuestas, sino que de la misma manera es una técnica científica que procura determinar conclusiones a partir de observaciones realizadas (2020, pág.4).

3.1. Variables estadísticas

Según Cuestas (2009): El término variables se define, como las cualidades, propiedades o características de los sujetos de estudio que pueden ser enumeradas o contadas (sexo, raza) o medidas cuantitativamente (peso, estatura) y cuyo valor varía de una a otra, primero las variables se enuncian en forma conceptual, haciendo referencia a la definición de dimensiones, a partir de las cuales surgen las variables en estudio, en un nivel de generalidad (Pág.1)

También es importante mencionar que existen una clasificación de las variables, este grupo se divide en variables cuantitativas y variables cualitativas, cada una de las variables teniendo sus subclasificaciones.

Variables cuantitativas

Según Cuestas (2009): Las variables cuantitativas, son aquellas cuya magnitud puede ser medida y expresada en términos numéricos. Su distribución es escalar, por lo que a cada una se le puede asignar un valor mayor o menor (número de eritrocitos, peso, talla). A su vez, éstas pueden ser continuas o discontinuas.

Las variables continuas son aquellas que pueden adoptar cualquier valor, dentro de un determinado rango, donde es posible dividir la unidad de medida utilizada infinitamente y las variables discretas, son las que pueden tener sólo un número limitado de valores enteros, pues la unidad de medición no puede ser fraccionada (número de hijos, número de piezas dentarias), pues ninguna de ellas admite valores decimales. (pág.1)

Variables cualitativas

Las variables cualitativas son aquellas que se refieren a propiedades de los elementos, que no pueden ser medidas, en términos de cantidad de propiedad presente, sino que sólo determina la presencia o ausencia de ella. Sus elementos de variación no son valores numéricos, son cualidades que corresponden a categorías de la variable, (sexo: masculino o femenino, estado civil: soltero, casado, viudo, divorciado, separado). Estas categorías se construyen expresando una distribución de atributos sin implicar ningún orden entre ellas a las cuales se les denomina nominales como por el ejemplo el sexo: masculino o femenino o expresando diferencias que implican un orden ascendente o descendente, por ejemplo, el nivel de educación: primario, secundario, terciario, universitario; estas son denominadas ordinales (Cuestas, 2009).

3.3. Media, Mediana y Moda

La media es el valor que se obtiene al sumar todos los datos y dividir el resultado entre la cantidad de datos. La mediana es el valor que ocupa la posición central cuando todos los datos están ordenados en orden creciente o decreciente. La moda es valor que más se repite(Autor anónimo, s.f, párr.1)

Media:

“La media es el valor que se obtiene al sumar todos los datos y dividir el resultado entre la cantidad de datos” (Autor anónimo, s.f, párr.3).

Mediana:

“La mediana es el valor que ocupa la posición central cuando todos los datos están ordenados en orden creciente o decreciente. La mediana se representa con las letras: Me.” (Autor anónimo, s.f, párr.8).

Moda:

“La moda es el valor que más se repite. También podemos decir que la moda es el valor con mayor frecuencia absoluta o el valor que ocurre con más frecuencia. La moda se representa con las letras: Mo” (Autor anónimo, s.f, párr.24).

3.4. Tabla de frecuencia:

“Una tabla de frecuencias o distribución de frecuencias es una tabla que muestra como se distribuyen los datos de acuerdo con sus frecuencias” (Información sacada de la clase de estadística G23). Estas tablas se dividen por medio de frecuencias, las cuales son:

Frecuencia absoluta:

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por fi, en este tipo de frecuencia al momento de sumar las frecuencias absolutas es igual al número total de datos, que se representa por la letra (N. f1 + f 2 + f 3 + …), de este modo para indicar de manera resumida estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria (Autor anónimo, 2014, pág.1).

Frecuencia acumulada:

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Por tanto, la frecuencia acumulada del último dato será siempre igual al número total de datos. En esta frecuencia también podemos encontrar una frecuencia relativa acumulada y una frecuencia porcentual acumulada (Autor anónimo, 2014, pág.3)

Frecuencia relativa:

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número totas de datos. Se representa por FRi, la expresión que se utiliza para calcular la frecuencia relativa es: FRi= Fi/N. La frecuencia relativa también se puede expresar en forma de porcentajes que viene a ser la frecuencia porcentual relativa de la misma, su expresión es Pi= 100x Fri (Autor anónimo, 2014, pág.2)

Existen tablas de frecuencia con datos agrupados, cuando esto sucede existen otras columnas o características que debe llevar la tabla como lo son los límites de clase que se constituyen por intervalos, pero para esto, es necesario antes de realizar la tabla aplicar la fórmula de Sturges, que consiste en hallar la amplitud que se considera la diferencia que debe existir entre el límite superior y el inferior, el espacio que debe haber dentro de cada intervalo y de igual manera, debemos hallar K que permitirá hallar el número de intervalos que deben ir en la tabla, para lo anterior, se debe realizar la formula ya mencionada que se puede evidenciar en lo siguiente:

Formúla de Sturges:

1. Hallar el rango (r): R: Xmax-Xmin2.

2. Hallar el número de intervalos (K), si el problema no indica cuantos intervalos usar, se recomienda usar la formula: K= 1+ 3.322.log(n), recordando que n es el número de datos que nos indica el problema

3. Determinar la amplitud de clase A= R/K

(Información sacada de la clase de estadística G23)

De tal modo también se debe agregar a la tabla de frecuencia el límite de clase y la marca de clase que son:

Límite de clase:

Cada clase es un intervalo que va desde el límite inferior hasta el límite superior. (Información sacada de la clase de estadística G23)

Marca de clase:

Punto medio de cada intervalo, que representa a la clase para el cálculo de algunos parámetros (Información sacada de la clase de estadística G23)

3.5 Rstudio

“Para empezar, R es un software que fue diseñado para hacer análisis estadísticos y gráficas” (Gonzales,2019, párr.1), además la Universidad de Granada (s.f) dice que:

RStudio es una interfaz que permite acceder de manera sencilla a toda la potencia de R y es un lenguaje orientado a objetos, es un lenguaje para el cálculo estadístico y la generación de gráficos, que ofrece una gran variedad de técnicas estadísticas y gráficas (párr. 1-2)

Por medio de Rstudio se ha podido generar gráficas y tablas de frecuencias que son fruto del último informe de este proyecto de aula, por medio de los siguientes códigos o formulas:

MEDIA: mean(dato)

X Cos<-mean(Cos)

MEDIANA: median(dato)

Y Cos<-median(Cos)

MODA: moda(dato)

Mo Cos<-moda(Cos)

POLIGONO DE FRECUENCIAS: plot(tFrec1,type=“fp”,xlab = “INTERVALOS”,ylab=“FRECUENCIAS”,main=“POLIGONO DE COSTO”,col=rainbow(16))
HISTOGRAMA:plot(tFrec1,type=“fh”,xlab = “INTERVALOS”,ylab=“FRECUENCIAS”,main=“HISTOGRAMA DE COSTO”, col=rainbow(16))
OJIVA:plot(tFrec1,type=“cfp”,xlab = “INTERVALOS”,ylab=“FRECUENCIAS ACUMULADAS”,main=“OJIVA DE COSTO”,col=rainbow(16))
TABLA DE FRECUENCIAS:tFrec2<-with(BD_PA,fdt(Distancia,start=0,end=55,h=3.5))

tFrec2

MODA: moda(dato)

Mo Cos<-moda(Cos)

VARIANZA: varianza(Dato)

Cos<-varianza(Cos)

COEFICIENTE DE VARIACIÓN: coeficiente.variacion(Dato)

Cos<-coeficiente.variacion(Cos)

DESVIACIÓN ESTÁNDAR: sd(dato)

Cos<-sd(dato)

DESVIACIÓN MEDIA mad(Dato)

cos<-mad(Cos)

GRAFICA 3D: (partes, labels= etiquetas)
3.6 Gráficos:

Según Westreicher (2021) los gráficos son una manera de resumir una imagen o una información recolectada en una formación estadística o base de datos, ya que este tipo de herramienta visual complementa el análisis y permite al receptor entender mejor las conclusiones de un determinado sondeo, estudio o proyecto de investigación. Existen diferentes tipos de representar estos gráficos, ya que cada uno posee sus características y tiene su función o manera de presentar la información dependiendo el tipo de variable que le corresponde. En este apartado no se podrán visualizar los distintos tipos de gráficos que existen, pero si en el siguiente apartado donde podemos empezar a leer el marco conceptual del presente documento.

4. MARCO CONCEPTUAL

4.1 Patrones de movilidad:

Held 1980: 34, citado por Krüger, 2010, párr.6, nos habla de la noción de ´patrones de movilidad´ y se refiere a:

El comportamiento de transporte (dentro de un área urbana donde se realizan desplazamientos de un lugar a otro) y a la participación con el transporte (que se refiere al modo de transporte y a la cantidad de los desplazamientos diarios. Por otro lado “caracteriza flujos de transporte y conexiones funcionales dentro de cierta estructura de la urbanización” (Krüger, 2010, párr.6).

De acuerdo con lo mencionado anteriormente, los patrones de movilidad se refieren al análisis que se puede lograr realizar del tiempo, la distancia recorrida, los métodos de transporte utilizados por los individuos y los gastos diarios asociados a su movilidad, es por ende, que el objetivo principal de este proyecto es precisamente analizar y comprender los patrones de movilidad que prevalecen en la ciudad de Bogotá.

4.2 Sexo

El sexo se refiere al sexo de nacimiento de una persona. Según la Organización Mundial de la Salud (s.f), citada por Instituto Nacional de estadística “el sexo hace referencia a las características biológicas y fisiológicas que definen a hombres y mujeres” (párr.1). De acuerdo con lo anterior decidimos hacer el proyecto con personas que se identifican como hombres y mujeres basándonos en su sexo de nacimiento, ya que, al enfocarse en el sexo de nacimiento, se simplifica la investigación y la obtención de datos sobre cómo se mueven las personas en la ciudad, cabe aclarar que esto no significa que ignoremos las diferencias de género, simplemente se hizo con el fin de facilitar el proceso de estudio en este en específico.

4.3 Estrato socioeconómico:

Baker, 2014& Brogan, 2019, citado por Agualongo y Garcés definen el nivel socioeconómico diciendo que: Aborda principalmente dos componentes. Por un lado, el factor social, que incluye características de la educación, ocupación de la persona, prestigio, poder político, identificación étnica e inclusive, el historial de la familia; por otro lado, se encuentra el factor económico, que está relacionado con el ingreso individual y en algunas ocasiones, con el nivel económico del barrio en donde la persona vive (Baker, 2014; Brogan, 2019). Como se mencionó previamente, en Colombia, el estrato socioeconómico se determina en función de las circunstancias del individuo, este sistema se basa en la ubicación geográfica y las condiciones de acceso a servicios de calidad en el hogar o la residencia de la persona. Además, los estratos desempeñan un papel importante en la regulación de las tarifas de servicios públicos como agua, energía eléctrica y gas, así como en la formulación de políticas de subsidios y programas gubernamentales. En esta investigación, la ubicación geográfica de las personas encuestadas se convierte en un factor relevante, ya que puede influir en sus patrones de movilidad y es algo que se relaciona con su estrato socioeconómico y esto puede proporcionar información valiosa sobre los medios de transporte que podrían utilizar, en función de la ubicación de su vivienda y su capacidad económica, así que resulta útil la variable del estrato socioeconómico porque es un elemento clave para comprender las dinámicas de movilidad en Bogotá.

4.4 Medios de transporte

“Son los diferentes sistemas o maneras que le permite a las personas trasladarse de un lugar a otro, además contribuyen al desarrollo social y económico de los pueblos” (Hernández, s.f, párr.1). En este caso los tipos de transporte que frecuentan los ciudadanos de Bogotá son:

Transmilenio

El Transmilenio es un sistema de autobuses de tránsito rápido que recorre toda la ciudad en carriles exclusivos. Es una forma eficiente y popular de transporte público en Bogotá.

Sistema Integrado de Transporte Público (SITP):

Junto con el Transmilenio, el SITP complementa el sistema de transporte público de la ciudad con una flota de autobuses convencionales y ofrece una amplia cobertura en áreas que no están servidas por el Transmilenio.

Bicicletas

En Bogotá se ha implementado una red de ciclovías y ciclorrutas que promueve el uso de la bicicleta como medio de transporte. También existe un sistema de alquiler de bicicletas llamado “BiciBogotá”.

Taxis

Los taxis son ampliamente disponibles en Bogotá y ofrecen una forma conveniente de moverse por la ciudad.

Aplicaciones de transporte compartido

Servicios como Uber, Didi, Picap están disponibles en Bogotá y proporcionan opciones de transporte compartido a través de aplicaciones móviles

Caminar

En muchas áreas de Bogotá, caminar es una opción viable debido a las aceras y zonas peatonales bien desarrolladas.

Vehículo Propio

Un vehículo propio es un medio de transporte motorizado, como un automóvil, una motocicleta, una bicicleta motorizada u otro tipo de vehículo de propiedad personal. La característica distintiva de un vehículo propio es que pertenece y es operado por una persona o entidad específica, en contraposición a los vehículos de transporte público que son propiedad de empresas o entidades gubernamentales y se utilizan de manera compartida por el público en general.

En resumen, Bogotá ofrece una amplia variedad de opciones de transporte, muchas de las cuales se han incluido en nuestro proyecto de aula con el propósito de analizar los patrones de movilidad relacionados con los diversos medios de transporte disponibles en la ciudad, resaltando la abundancia de alternativas de movilidad, se puede ver la complejidad de la vida urbana en Bogotá y nos brinda la oportunidad de comprender cómo las personas se desplazan y eligen entre las diferentes opciones de transporte según su comodidad.

4.5 Distancia

Según Editorial Etecé (2021) La distancia, en física y matemáticas, es una magnitud escalar que se mide en unidades de longitud, y que se puede entender como el camino entre un punto de origen A y un punto de destino B. Dicho trayecto normalmente equivale a la longitud de una recta que une dos puntos, estando en un plano euclídeo (Párr.1) Según lo anterior la distancia es una magnitud que se mide de un punto a a un punto b, esto es una de las cosas que se quiere analizar con el presente documento, obtener información acerca de cuánta distancia recorren los habitantes de Bogotá, teniendo en cuenta las múltiples opciones de movilidad que ofrece la ciudad.

4.6 Tiempo

Según Espinola (2022): El tiempo es, en sentido general, una magnitud física que se utiliza para medir la duración, simultaneidad y separación de los hechos y acontecimientos. Esto permite ordenar acontecimientos en una secuencia, de la que se desprenden las nociones de pasado, futuro y presente(párr.1) Este concepto resulta de gran utilidad para llevar a cabo un análisis detallado del tiempo que los ciudadanos de Bogotá dedican a sus desplazamientos diarios, es importante destacar que este tiempo de viaje puede variar considerablemente dependiendo la situación del medio de transporte que se elija utilizar. Además, la distancia desde la ubicación de partida también influye en la duración total de los traslados. En resumen, este concepto nos permite comprender mejor cómo los patrones de movilidad se relacionan con el tiempo de viaje, considerando tanto el medio de transporte como la ubicación geográfica de las personas en Bogotá, lo cual puede ser de suma importancia para la planificación antes de un trayecto de movilización.

4.7 Dinero

“En general, el dinero es un conjunto de activos de una economía que las personas regularmente están dispuestas a usar como medio de pago para comprar y vender bienes y servicios” (Banxico educa, s.f, párr.1). La relación entre el dinero y los patrones de movilidad en Bogotá se vinculan directamente con cuánto gastan las personas en sus desplazamientos

4.8 Gráficas
Diagrama de barras

Un diagrama de barras es una representación gráfica que utiliza barras rectangulares o verticales para mostrar datos cualitativos o datos cuantitativos discretos. Cada barra representa una categoría o valor en un conjunto de datos y la altura o longitud de la barra es proporcional a la cantidad o frecuencia de ese valor. Los diagramas de barras son una herramienta comúnmente utilizada para visualizar y comparar datos de manera efectiva. Este tipo de gráfica se empleará en el documento con el propósito de analizar de manera efectiva las variables cualitativas, tales como el sexo, el estrato socioeconómico y el medio de transporte de las personas, teniendo en cuenta que se tiene una mayor claridad visual y se puede comparar entre datos con facilidad.

Gráfico circular

Un gráfico circular, también conocido como gráfico de pastel o gráfico de sectores, es una representación gráfica utilizada para mostrar la proporción o el porcentaje de diferentes categorías en un conjunto de datos. Se presenta en forma de un círculo dividido en secciones o sectores, donde cada sector representa una categoría específica y el tamaño del sector es proporcional a la cantidad o el porcentaje que esa categoría representa en el conjunto de datos, aquí se utilizaran variables cualitativas de igual manera teniendo en cuenta que son nominales y ordinales, en este concepto se aclara que la cualitativa ordinal sería el estrato socioeconómico, las otras dos variables serían nominales.

Histograma

Un histograma es una representación gráfica utilizada en estadísticas para mostrar la distribución de frecuencias de una variable cuantitativa continua o discreta. Se utiliza para visualizar cómo se agrupan o dispersan los valores en un conjunto de datos y cómo se distribuyen en diferentes intervalos o clases, cuando se trabaja con variables cualitativas se emplean diagramas de barras. Esta representación gráfica en el documento se enfocará en las variables cuantitativas: el tiempo, la distancia y el gasto económico que incurren los ciudadanos en sus desplazamientos.

Polígono de frecuencias

Un polígono de frecuencias, también conocido como polígono de frecuencia acumulada, es una representación gráfica utilizada en estadísticas para visualizar la distribución de frecuencias de una variable cuantitativa discreta. Los polígonos de frecuencia son útiles para visualizar la distribución de los datos y para identificar tendencias y patrones. Pueden ayudar a responder preguntas como cuántos valores son menores o iguales a cierto punto dado en la variable y cómo se distribuyen las frecuencias en todo el rango de valores. Este grafico ayudara a resumir y visualizar datos de la movilidad de los Bogotanos, lo que permite identificar patrones, tendencias y características significativas en los desplazamientos de las personas de las variables cuantitativas del proyecto.

Ojiva

Una ojiva es una representación gráfica utilizada en estadísticas y análisis de datos para mostrar la distribución acumulada de una variable, como una forma de visualizar la frecuencia relativa acumulada de los valores de la variable. Esta representación se utiliza comúnmente en estadísticas descriptivas y se crea a partir de un histograma o un conjunto de datos. Finalmente, también se incluirá una ojiva como representación de datos cuantitativos en el documento, también es importante destacar que el gasto de dinero se trata de una variable cuantitativa discreta, mientras que las otras dos variables, el tiempo y la distancia, son continua, ya que se pueden medir.

4.9 Medidas de dispersión

Continuando con la investigación se continúa a hablar de las medidas de dispersión, según lo explica La Comunidad Andina y La Unión Europea (2002) podemos entender estas como “Son estadísticos que nos resumen la información de la muestra dándonos información acerca de la magnitud del alejamiento de la distribución de datos en relación a un valor central o de concentración de los datos”

Varianza

La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (Xi) y la media X̅ .(Anderson, Sweeney y Williams 2008).

Desviación estándar

Según Abraira (2002), la desviación estándar se define como un indicador de la variabilidad en un conjunto de datos. A medida que la dispersión de los datos aumenta, la desviación estándar también lo hace; en contraste, si todos los datos son idénticos, la desviación estándar sería nula.

Coeficiente de variación

El Coeficiente de Variación se emplea para contrastar la variabilidad o dispersión en conjuntos de datos que poseen medidas o medias aritméticas distintas. (Anonimo, 2020)

Desviación media

“La desviación media de un conjunto de datos se define como la media aritmética de las diferencias absolutas de cada valor de la variable con respecto a la media” (Campaña, 1992)

Variabilidad

Para Garfield y Ben-Zvi (2008, citado por Orta y Fernandez, s.f) “la comprensión de las ideas de dispersión y variabilidad en los datos es una componente clave en la comprensión del concepto de distribución y es esencial para hacer inferencias estadísticas” (p. 189)

Datos agrupados en variable discreta

Para entender esta definición, primero debemos comprender a que nos referimos con espacio muestral discreto, según lo explican (Walpore et al, 2012), “Una variable aleatoria se llama variable aleatoria discreta si se puede contar su conjunto de resultados posibles”, ahora cuando hablamos de datos agrupados en variables discreta podemos plantear que esto implica que los datos originales, que consisten en valores individuales de una variable discreta, se han organizado y presentado en grupos o intervalos para facilitar el análisis y la interpretación.

Datos agrupados por intervalos

Cuando hablamos de datos agrupados por intervalos, tal como lo señalan en su libro, Estadística para Administración y Economía, Newbold, Carlson & Thorne (2008), podemos entender este sistema como una técnica comúnmente utilizada en estadísticas para organizar y resumir conjuntos de datos extensos y continuos. En este caso, en lugar de presentar cada valor de datos individualmente, los datos se dividen en intervalos o rangos, y se cuenta la frecuencia de los valores que caen dentro de cada intervalo.

Medidas de tendencia central

Media

Media de Costo

La media de costo es:

## [1] 9553.659
Media de Distancia

La media de distancia es:

## [1] 15.90244
Media de Tiempo

La media de tiempo es:

## [1] 110.0122

Mediana

Mediana de Costo

La mediana de costo es:

## [1] 9000
Mediana de Distancia

La mediana de distancia es:

## [1] 15
Mediana de Tiempo

La mediana de tiempo es:

## [1] 90

Moda

Moda de costo

La moda de costo es:

##   variable.x
## 1       6000
Moda de distnacia

La moda de distancia es:

##   variable.x
## 1         20
Moda de tiempo

La moda de tiempo es:

##   variable.x
## 1         60

5. Tablas de frecuencia, gráficas e interpretaciones

5.1. Datos cuantitativos
Interpretación de costo
Tabla de frecuencia de costo:
##   Class limits  f   rf rf(%) cf  cf(%)
##       [0,2000)  5 0.06  6.10  5   6.10
##    [2000,4000)  3 0.04  3.66  8   9.76
##    [4000,6000)  9 0.11 10.98 17  20.73
##    [6000,8000) 21 0.26 25.61 38  46.34
##   [8000,10000)  5 0.06  6.10 43  52.44
##  [10000,12000) 14 0.17 17.07 57  69.51
##  [12000,14000) 10 0.12 12.20 67  81.71
##  [14000,16000)  4 0.05  4.88 71  86.59
##  [16000,18000)  0 0.00  0.00 71  86.59
##  [18000,20000)  2 0.02  2.44 73  89.02
##  [20000,22000)  6 0.07  7.32 79  96.34
##  [22000,24000)  0 0.00  0.00 79  96.34
##  [24000,26000)  2 0.02  2.44 81  98.78
##  [26000,28000)  0 0.00  0.00 81  98.78
##  [28000,30000)  0 0.00  0.00 81  98.78
##  [30000,32000)  1 0.01  1.22 82 100.00

De acuerdo con los datos presentados en la Tabla de Frecuencia de Costo (tFrec1) en pesos colombianos, se destaca que la frecuencia mínima registrada es de 0 en los intervalos [16000,18000), [22000,24000) y [26000,28000). Este análisis revela que, de las 82 personas que participaron en la encuesta, ninguna de ellas informó haber incurrido en gastos dentro de los rangos específicos mencionados, es decir, [16000,18000), [22000,24000) y [26000,28000). Por otro lado, el valor máximo de frecuencia según la tabla es 21, lo que significa que, de las 82 personas encuestadas, 21 reportaron gastos en el rango de transporte de 6000 a 8000 pesos, representando así el 46.34% de la muestra total. Finalmente, se destaca que el 96.34% de la frecuencia porcentual acumulada corresponde a 79 personas que indicaron haber gastado en transporte en intervalos que abarcan desde [0,2000) hasta [22000,24000)

Histograma de costo:

Con el anterior histograma de costo, en el eje X se ha simbolizado los intervalos y en el eje Y se ha interpretado la frecuencia. Por este motivo, el histograma toma los datos de las respuestas de las personas correspondientes a los datos de la tabla de frecuencia. Entre los intervalos de 0 COP pesos colombianos hasta los 8000 pesos colombianos, se pudo evidenciar que contiene 43 respuestas. Continuando desde los 8000 pesos colombianos a los 16000 pesos colombianos, obteniendo 33 respuestas. Luego, desde los 16000 hasta los 24000 con 8 respuestas y por último desde los 24000 hasta los 32000 con 3 respuestas obtenidas. Cada intervalo está representado por un color. Ya que el histograma toma datos de la tabla de frecuencia. Por ejemplo, se puede observar que el dato más alto esta entre los 0 a 8000 pesos colombianos, lo cual coincide con la tabla de frecuencia

Poligono de costo:

El propósito del polígono de costo radica en la representación visual de la información obtenida en la tabla de frecuencia y usa el dato de frecuencias. De ese modo, se traza utilizando puntos y segmentos para conectarlos, lo que permite que se pueda interpretar de forma organizada esta representación gráfica sigue la misma secuencia de valores que se toma para el histograma. En términos prácticos, el polígono de distancia es una herramienta complementaria al histograma

Ojiva de costo:

Con respecto a la gráfica de ojiva de costo, se representa en el eje X los intervalos y para el eje Y las frecuencias acumuladas. Se pudo observar que entre los intervalos de 0 a 2000 pesos colombianos la frecuencia es 5 y se refleja de color rojo. En el intervalo de 2000 a 4000 pesos colombianos se pudo ver que la frecuencia es 8 y se muestra de color rojo quemado. Luego en los intervalos de 4000 a 6000 pesos colombianos la frecuencia es de 17 y se representa de color naranja. A continuación, en los intervalos de 6000 a 8000 pesos colombianos se pudo ver que la frecuencia es 38 y se refleja de color amarillo. Después sigue los intervalos de 8000 a 10000 pesos colombianos la frecuencia es de 43 y se representa de color verde claro. En los intervalos de 10000 a 12000 pesos colombianos se pudo ver que la frecuencia es 57 y se muestra de color verde oscuro Luego entre los intervalos de 12000 a 14000 pesos colombianos la frecuencia es de 67 y se evidencia de color verde menta. En los intervalos de 14000 a 16000 pesos colombianos la frecuencia es 71 y se representa de color verde azulejo. Luego entre los intervalos de 16000 a 18000 la frecuencia es 0 que representa algunos intervalos que se obtuvieron en la tabla de frecuencia ya que las personas no respondieron a ese dato en específico. Entre los intervalos 18000 a 20000 pesos colombianos la frecuencia es 73 y se refleja de color azul agua marina. A continuación, entre los intervalos 20000 a 22000 la frecuencia es 79 y se representa de color “azul 2”. Continuando con los intervalos entre 22000 a 24000 pesos colombiano la frecuencia es 0 que representa algunos intervalos que se obtuvieron en la tabla de frecuencia ya que las personas no respondieron a ese dato en específico. Luego de los intervalos de 24000 a 26000 pesos colombianos y la frecuencia es 81 y se demuestra de color morado. Como se refleja en la gráfica entre los intervalos 26000, 28000 y 30000 pesos colombianos la frecuencia es 0 porque representa algunos intervalos que se obtuvieron en la tabla de frecuencia ya que las personas no respondieron a ese dato en específico. Ya por último con los intervalos de 30000 a 32000 pesos colombianos la frecuencia es 82 y se muestra de color fucsia.

Medidas de dispersión y variabilidad
Varianza de costo
## varianza_variable.x 
##            35539316
Coeficiente de variación de costo
## coef_variacion_variable.x 
##                     0.624
Desviación estándar de costo
## [1] 5998.172
Desviación media de costo
## [1] 4447.8

Esta variable tiene una media de 9553.659, respecto a esto con una varianza de 35539316, siguiendole una desviación estándar de 5998.172 con una desviación media de 4447.8 y un coeficiente de variación de 0.624 (62.4%); lo que indica que hay valores extremos o atípicos que afectan la dispersión de los datos, de ese modo, hace que esté más lejos de la media.

Interpretación de distancia
Tabla de frecuencia de distancia:
##  Class limits  f   rf rf(%) cf  cf(%)
##       [0,3.5) 13 0.16 15.85 13  15.85
##       [3.5,7)  8 0.10  9.76 21  25.61
##        [7,10)  9 0.11 10.98 30  36.59
##       [10,14)  7 0.09  8.54 37  45.12
##       [14,18) 10 0.12 12.20 47  57.32
##       [18,21) 14 0.17 17.07 61  74.39
##       [21,24)  6 0.07  7.32 67  81.71
##       [24,28)  4 0.05  4.88 71  86.59
##       [28,32)  4 0.05  4.88 75  91.46
##       [32,35)  0 0.00  0.00 75  91.46
##       [35,38)  2 0.02  2.44 77  93.90
##       [38,42)  3 0.04  3.66 80  97.56
##       [42,46)  1 0.01  1.22 81  98.78
##       [46,49)  0 0.00  0.00 81  98.78
##       [49,52)  1 0.01  1.22 82 100.00

En relación con la Tabla de Frecuencias de Distancia (tFrec2), se destacan dos valores mínimos registrados en relación con la distancia recorrida en kilómetros. Estos valores se ubican en los intervalos [42,36) y [49,52), en los cuales se reporta solamente la presencia de una persona que ha recorrido una distancia de 42 a 36 kilómetros y de 49 a 52 kilómetros, respectivamente. En este contexto, los datos correspondientes a una sola persona representan únicamente el 1.22% en cada uno de estos intervalos. Por otro lado, el valor máximo registrado es de 14 personas, quienes indicaron haber recorrido una distancia de 18 a 21 kilómetros, lo que equivale al 17.07% del total de la muestra.Finalmente, al analizar la frecuencia relativa acumulada porcentual, se observa que el 57.32% corresponde a los intervalos [0,3.5), [3,5.7), [7,10), [10,14), [14,18), los cuales suman un total de 47 personas.

Histograma de distancia:

Para el histograma de distancia en el eje X se encuentran los intervalos y el eje Y se encuentran las frecuencias, se interpreta que 13 personas recorren de 0 a 3.5 km representado en color rojo, 8 personas recorren de 3.5 a 7 km representado en color naranja, 9 personas recorren de 7 a 10 km, esto representado en color amarillo quemado, 7 personas recorren de 10 a 14 km esta se encuentra en color amarillo 10 personas recorren de 14 a 18 km representado en color verde manzana, 14 personas atraviesan de 18 a 21 km representado en color verde, 6 personas cruzan de 21 a 24 km representado en color verde clarito, 4 personas transitan de 24 a 28 km esto personificado en color azul verdoso, 4 personas recorren entre 28 y 32 km representado en color azul aguamarina, por otro lado ninguna persona recorre de 32 a 35 km, 2 personas cruzan de 35 a 38 km esto representado en color azul, 3 personas transitan de 38 a 42 km esto lo podemos ver de color púrpura, 1 persona recorre de 42 a 46 km representado en color morado, ninguna persona recorre de 46 a 49 km y solo 1 persona recorre de 49 a 52 km y lo podemos ver de color fucsia.

Poligono de distancia:

En relación con el polígono de distancia se observa que, en el eje horizontal, conocido como eje X, se disponen los intervalos pertinentes, mientras que, en el eje vertical, denominado eje Y, se representan las correspondientes frecuencias. Este gráfico recopila y visualiza los datos que se derivan del histograma (histograma de distancia) y las respectivas frecuencias de la tabla de frecuencia (tFrec2). Es decir que la representación gráfica en forma de polígono presenta la misma secuencia de datos que el histograma, pero lo hace a través de puntos que se interconectan mediante segmentos. Esta representación gráfica contribuye a una comprensión más clara y detallada de la distribución de los datos en términos de intervalos y frecuencias, lo que facilita la interpretación de la información.

Ojiva de distancia:

Para la ojiva de distancia en el eje x se encuentran los intervalos y el eje y se encuentran las frecuencias acumuladas, se interpreta que 13 personas recorren de 0 a 3.5 km representado en color rojo, 21 personas recorren de 3.5 a 7 km representado en color naranja, 30 personas recorren de 7 a 10 km, esto representado en color amarillo quemado, 37 personas recorren de 10 a 14 km esta se encuentra en color amarillo, 47 personas recorren de 14 a 18 km representado en color verde manzana, 61 personas atraviesan de 18 a 21 km representado en color verde, 67 personas cruzan de 21 a 24 km, 71 personas transitan de 24 a 28 km esto personificado en color verde clarito, 75 personas recorren entre 28 y 32 km representado en color azul verdoso, por otro lado 75 personas recorren de 32 a 35 km representado en color azul aguamarina, 77 personas cruzan de 35 a 38 km esto representado en color azul, 80 personas transitan de 38 a 42 km esto lo podemos ver de color púrpura, 81 personas recorren de 42 a 46 km representado en color morado, 81 personas recorren de 46 a 49 km y lo vemos representado de color rosado fuerte y 82 personas recorren de 49 a 52 km y lo podemos ver de color fucsia. Finalmente, al analizar la frecuencia relativa acumulada porcentual, se observa que el 57.32% corresponde a los intervalos [0,3.5), [3,5.7), [7,10), [10,14), [14,18), los cuales suman un total de 47 personas.

Medidas de dispersión y variabilidad
Varianza de distancia
## varianza_variable.x 
##            123.8441
Coeficiente de variación de distancia
## coef_variacion_variable.x 
##                    0.6998
Desviación estándar de distancia
## [1] 11.19701
Desviación media de distancia
## [1] 10.3782

Esta variable tiene un valor promedio de alrededor de 15.90244. Sin embargo, la variabilidad en los datos es bastante grande, indicada por la varianza de 123.8441 y la desviación estándar de 11.19701 y un coeficiente de variación de 0.6998 (69.98%); lo que indica que hay valores extremos o atípicos que afectan la dispersión de los datos, de ese modo, hace que esté más lejos de la media.

En este caso hay algunos valores poco comunes que están afectando la dispersión general de los datos, haciendo que estén más alejados.

Interpretación de tiempo
Tabla de frecuencia de tiempo:
##  Class limits  f   rf rf(%) cf  cf(%)
##        [5,31) 14 0.17 17.07 14  17.07
##       [31,57)  5 0.06  6.10 19  23.17
##       [57,83) 19 0.23 23.17 38  46.34
##      [83,109)  8 0.10  9.76 46  56.10
##     [109,135) 13 0.16 15.85 59  71.95
##     [135,161)  5 0.06  6.10 64  78.05
##     [161,187)  5 0.06  6.10 69  84.15
##     [187,213)  2 0.02  2.44 71  86.59
##     [213,239)  0 0.00  0.00 71  86.59
##     [239,265)  9 0.11 10.98 80  97.56
##     [265,291)  0 0.00  0.00 80  97.56
##     [291,317)  0 0.00  0.00 80  97.56
##     [317,343)  0 0.00  0.00 80  97.56
##     [343,369)  1 0.01  1.22 81  98.78
##     [369,395)  0 0.00  0.00 81  98.78
##     [395,421)  1 0.01  1.22 82 100.00

Con respecto a la anterior tabla de frecuencia de tiempo (tFrec3) se observa que el mayor número de respuestas es de 19 personas, las cuales hacen parte del intervalo [57, 83) representado en minutos. Lo que corresponde según la frecuencia relativa porcentual al 23.17%. Adicionalmente, se pudo observar que la frecuencia mínima es de 0 en los intervalos [213,239), [265,291), [291,317) [317,343) y [369,395). Siendo este uno de los datos de valor mínimo entre los intervalos. Se pudo ver que las personas no respondieron ante esta pregunta, con lo cual no ocuparon el tiempo de [213,239), [265,291), [291,317) [317,343) y [369,395). Se pudo ver que las personas no respondieron ante esta pregunta, con lo cual no ocuparon el tiempo de 213 a 239 minutos, de 265 a 291 minutos, de 291 a 317, de 317 a 343 minutos y de 369 a 395 minutos. A continuación, el otro intervalo es desde [239,265) se refleja en color azul y azul oscuro.

Histograma de tiempo:

En el histograma de tiempo en el eje x se encuentran registrados los intervalos y en el eje y se encuentran registradas las frecuencias, 14 personas se tardan de 5 a 31 minutos en llegar a su destino esto representaba en color rojo, 5 personas tardan de 31 a 57 minutos esto representado en color naranja, 19 personas tardan de 57 a 83 minutos esto representado en color amarillo quemado, 8 personas se demoran de 83 a 109 minutos en llegar a su destino esto se observa de color verde manzana, 13 personas se demoran de 109 a 135 minutos esto representado de color verde, 5 personas demoran 135 a 161 minutos esto se encuentra de color verde clarito, 5 personas se demoran de 161 a 187 minutos esto se encuentra de color azul verdoso, 2 personas demoran de 187 a 213 minutos, ninguna persona se demora de 213 a 239 minutos, 9 personas tardan de 239 a 265 minutos esto representado de color azul clarito, ninguna persona se demora de 265 a 291 minutos, ninguna persona se demora de 291 a 317 minutos, ninguna persona se demora de 317 a 343 minutos en llegar a sus destinos,1 persona tarda de 343 a 369 minutos esto es representado en color morado, ninguna persona se demora de 369 a 395 minutos y 1 persona se demora de 395 a 421 minutos esto personificado en color fucsia.

Poligono de tiempo:

Con respecto al polígono de tiempo se aprecia que, en el eje horizontal X, se alinean los intervalos con respecto a la tabla de frecuencia (tFrec3), mientras que, en el eje vertical, Y, se encuentran las respectivas frecuencias correspondientes. Esta representación gráfica recopila los datos obtenidos en el histograma de distancia como de la tabla de frecuencia. En otras palabras, el polígono de distancia presenta la misma secuencia de valores que se encuentra en el histograma, aunque lo hace mediante la conexión de puntos. Este tipo de representación gráfica contribuye significativamente a proporcionar una comprensión de cómo se distribuyen los datos en términos de intervalos y sus correspondientes frecuencias, lo que, en permite la interpretación de la información.

Ojiva de tiempo:

Mediante el grafico de ojiva se puede observar desde el eje Y las frecuencias acumuladas y desde el eje X los datos obtenidos acerca del tiempo que ocupa, claramente la distribución de la información es obtenida de la tabla de frecuencia. En el primer punto de color rojo se puede evidenciar las respuestas que no tuvieron información o no fue marcadas por las personas que respondieron la cuenta, dando como resultado en el intervalo de [0,5) que no se respondieron. Por otro lado, frente al segundo punto se obtuvo 19 respuestas que corresponde al intervalo [31,57) y es representado mediante el color naranjado y amarillo oscuro. Adicionalmente, el siguiente intervalo va dese [57,83) en color amarillo oscuro y amarillo, que representa en frecuencia acumulada 38 personas. En el intervalo [83,109) se obtuvo un total de 46 respuestas y representa mediante los colores amarillo y verde claro; frente al siguiente intervalo va [109,135) y con base en la tabla de frecuencias representa 59 personas donde se puede percibir a través del color verde claro y verde menta.

Medidas de dispersión y variabilidad
Varianza de tiempo
## varianza_variable.x 
##            6535.866
Coeficiente de variación de tiempo
## coef_variacion_variable.x 
##                    0.7349
Desviación estándar de tiempo
## [1] 81.34221
Desviación media de tiempo
## [1] 66.717

Los datos de la variablede Tiempo indican una media de 110.0122. Contrastando esta medida central, la varianza es de 6535.866 y la desviación estándar es 81.34221. Además, la desviación media absoluta (MAD) se presenta como 66.717, y el coeficiente de variación es de 0.7349 (73.49%).

Estos valores sugieren que la media está relativamente alejada de los demás datos, indicando una variabilidad considerable. La presencia de valores extremos o atípicos parece influir significativamente en la dispersión general de los datos, resultando en una media que puede no ser representativa del conjunto completo.

5.2. Datos cualitativos
Interpretación de estrato
Tabla de frecuencia de estrato:

A partir de la tabla de frecuencia de estratos (tabla_completa2e), se evidencia que las 82 personas encuestadas de Bogotá marcaron que viven en los estratos 1, 2, 3, 4 y 5. El dato más elevado corresponde a 34 personas que habitan en el estrato 2, lo que representa el 41.4% del total. Asimismo, se observa que 30 personas residen en el estrato 3, lo que equivale al 36.5% y, de manera similar, se encuentran 8 personas tanto en el estrato 1 como en el estrato 4, sumando un total de 16 personas y constituyendo el 9.7% de la población estudiada. Finalmente, en el estrato 5 se registra la menor cantidad de personas, específicamente dos, lo que representa el 2.4% del total. Al sumar todos estos porcentajes, se obtiene una cifra del 100%. Estos resultados indican que las 82 personas estudiadas en la encuesta no comparten el mismo nivel de calidad de vida en función de los estratos en los que residen.

Diagrama de pastel de estrato

A través del diagrama de pastel de estratos, se puede evidenciar que el 41.4% representa el estrato dos identificado con el color verde. Además, se observa que el 36.5% es el segundo porcentaje más alto y con base en la gráfica corresponde al estrato 3 marcado en color azul. En cuanto a los estratos uno y cuatro, se evidenció que cada uno cuenta con el mismo valor de porcentaje, representando un 9.7% cada uno. Sin embargo, cabe aclarar que en el diagrama el estrato uno representa el color purpura y el estrato cuatro se diferencia en el color amarillo. Finalmente, el menor dato corresponde a la variable de estrato cinco, donde a nivel porcentual obtuvo el 2.4% y se representa a través del color rojo.

Gráfica de barras de estrato

De acuerdo con la gráfica de barra de estrato, se puede observar que en el eje X se puso los diferentes números de estrato, y en el eje Y se representa la cantidad de personas que respondieron a la encuesta. Ante esto, se pudo observar que en el estrato dos es donde está el número mayor equivalente a 34 personas, resaltado en color verde; continuando con el estrato tres correspondiente a 30 personas y representado en color azul. Para los estratos uno y cuatro es proporcionado por una misma cantidad de personas, siendo 8 cada una; en uno el color se representa mediante el purpura y el estrato cuatro mediante el color amarillo. Finalmente, el menor dato es el estrato cinco representado con el color rojo y las cuales solo obtuvieron un total de 2 respuestas de los 82 encuestados.

Interpretación de transporte
Tabla de frecuencia de transporte:

A partir de la Tabla de Frecuencia (tabla_completa3t), se puede discernir que se encuestaron a un total de 82 personas que utilizan varios medios de transporte para llegar a sus destinos. Estos medios incluyen: TransMilenio (TM) - Sistema de Transporte Urbano (SITP); Taxi, Uber, Picap, DiDi, Cabify, InDriver, entre otros; también se encuentra el uso de vehículo propio (moto o carro), medios amigables con el medio ambiente (como bicicletas o monopatines) y caminar. El medio de transporte más utilizado es TransMilenio (TM) - Sistema de Transporte Urbano (SITP), con 54 personas representando el 65.8% de la muestra. Le sigue el uso de vehículo propio (moto o carro) con 14 personas, lo que equivale al 17%. En tercer lugar, se encuentra el grupo de personas que eligen medios amigables con el medio ambiente y la opción de caminar, cada uno con un total de 6 respuestas, representando según la tabla de frecuencia con un porcentaje de 7.3%. Por último, hubo un resultado con 2 personas que optan por servicios de taxi, Uber, Picap, DiDi, Cabify, InDriver, etc., lo que representa un 2.4% en la muestra. La frecuencia acumulada porcentual total asciende al 100%, lo que demuestra que se ha tenido en cuenta a la totalidad de la muestra para este análisis. Estos datos revelan las preferencias de movilidad de los encuestados y la diversidad de medios de transporte utilizados en la ciudad de Bogotá.

Diagrama de pastel de transporte

En el diagrama de pastel de transporte 3D, representado en color azul se encuentra TransMilenio (TM) - Sistema de Transporte Urbano (SITP) este equivale al 65.8%, se encuentra en color morado. Se tiene vehículo propio (moto o carro) el cual es un 17% y está representado en color fucsia. Con respecto a las personas que se van caminando se obtuvo un porcentaje del 7.3% y seleccionada en color rojo. En cuanto a amigables con el medio ambiente (bicicleta, monopatín, etc) hacen referencia también al 7.3% representada en color amarillo. Por último, en color verde con un 2.4% se encuentra las personas que seleccionaron Taxi, Uber, Picap, did, Cabify, InDriver, entre otros.

Gráfica de barras de transporte

En el diagrama de barras en el eje X se encuentra las variables de TransMilenio (TM) - Sistema de Transporte Urbano (SITP) representado en color azul; Taxi, Uber, Picap, did, Cabify, InDriver, etc.; representado en color verde. Por otro lado, vehículo propio (moto o carro) se encuentra en color morado, amigables con el medio ambiente (bicicleta, monopatín, etc) representado en color rojo y caminando se encuentra en color amarillo. En el eje y se encuentran las frecuencias. 6 personas se movilizan en Amigables con el medio ambiente (bicicleta, monopatín, etc), 6 personas se movilizan caminano, 2 personas se desplazan en Taxi, Uber, Picap, did, Cabify, InDriver, etc, 54 personas se desplazan en TransMilenio (TM) - Sistema de Transporte Urbano (SITP) y 14 personas tienen su vehículo propio.

Interpretación de sexo
Tabla de frecuencia de sexo:

De acuerdo con la Tabla de Frecuencia de Sexo (tabla_completa1s), se puede inferir que se recopiló información de un total de 82 encuestados, de los cuales 45 personas marcaron su género como femenino, mientras que 37 personas seleccionaron como masculinas. El grupo más numeroso corresponde al género femenino, las cuales representan un 54% de la muestra total. Por otro lado, el género masculino obtuvo un 45% de representación en la muestra. Al validar la frecuencia acumulada porcentual, se obtiene un valor de 100%, lo que indica que la totalidad de la muestra ha sido tenida en cuenta en este análisis. Estos datos reflejan una distribución de género entre los encuestados, donde las mujeres son ligeramente más representativas en la muestra en comparación con los hombres.

Diagrama de pastel de sexo:

En el diagrama de pastel tridimensional sobre el sexo, se pueden observar los porcentajes asociados a cada variable, es decir, femenino y masculino. El sexo femenino es mayor y representa el 55% del total y se encuentra identificado mediante el color azul. En segundo lugar, se encuentra el sexo masculino, que representa el 45% restante y se representa en el diagrama con el color rojo.

Grafica de barras de sexo:

En el diagrama de barras de sexo, se puede observar que con respecto al eje X se encuentra las variables Masculino representado en color rojo y Femenino representado en color amarillo. Mientras que en el eje Y se anotaron el número de personas; de ese modo, permite evidenciar que sexo masculino representa a 37 personas y el sexo femenino representa a 45 personas, y obteniendo como resultado el total de personas encuestadas para el proyecto de aula, en este caso 82 personas.

6. Conclusiones

En este proyecto de aula, se han explorado los patrones de movilidad en Bogotá a través de una encuesta que recopiló datos de 82 participantes, el objetivo de este documento es comprender mejor cómo se mueven las personas en la ciudad y proporcionar a los estudiantes una experiencia de aprendizaje en la investigación estadística, mediante esta experiencia se ha podido identificar algunos de los medios de transporte más utilizados, los gastos promedio, los tiempos de viaje y las distancias recorridas. Se ha logrado observar que al analizar los datos cuantitativos de costo, distancia y tiempo, se han obtenido datos importantes sobre el comportamiento de las 82 personas encuestadas en relación con sus gastos de transporte, distancias recorridas y tiempos de desplazamiento, puesto que al costo se puede destacar que ningún encuestado informó haber incurrido en gastos en los intervalos [16000,18000), [22000,24000) y [26000,28000), lo que indica que estos rangos de costo no fueron representativos en la muestra, pero por otro lado, el intervalo de costo de 6000 a 8000 pesos fue el más frecuente, con un 46.34% de la muestra.

Respecto a la variable de distancia se observa que la mayoría de los encuestados recorrieron distancias en los intervalos [0,3.5), [3,5.7), [7,10), [10,14) y [14,18), que en conjunto representan el 57.32% de la muestra. Por otro lado, se registraron valores mínimos en los intervalos [42,36) y [49,52), indicando que solo una persona en cada uno de estos intervalos recorrió esas distancias y en cuanto al tiempo de desplazamiento, el intervalo de [57, 83) minutos fue el más común, con un 23.17% de la muestra, mientras que varios intervalos de tiempo registraron una frecuencia mínima de 0, lo que puede llegar a indicar que algunas personas no proporcionaron información sobre sus tiempos de viaje en esos rangos.

Desde el punto de vista de las variables de los datos cualitativos, se observa que los encuestados provienen de diferentes estratos sociales, siendo el estrato 2 el más representativo con un 41.4% de la muestra. En cuanto al medio de transporte, TransMilenio fue el más utilizado, con un 65.8%, seguido por el uso de vehículo propio (17%), medios amigables con el medio ambiente y caminar (7.3% cada uno) y servicios de taxi y similares (2.4%); para finalmente, en términos de sexo, se observa una ligera mayoría de mujeres en la muestra, representando el 54%, mientras que los hombres constituyen el 45% restante, sin embargo, no fue mucha la diferencia que hubo entre estos. Al realizar la recolección de estos datos cuantitativos y cualitativos se puede obtener una visión completa y detallada del comportamiento de las personas encuestadas en relación con su movilidad y gastos en transporte en la ciudad de Bogotá. También resulta importante mencionar que, a lo largo del proyecto, aplicamos conceptos estadísticos como medidas de tendencia central, tablas de frecuencia y diversos tipos de gráficos, mediante RStudio como herramienta para realizar análisis estadísticos y generar representaciones graficas de los resultados obtenidos. Finalmente, este proyecto no solo ha mejorado nuestra comprensión de la movilidad en Bogotá, sino que también ha fortalecido nuestras habilidades en investigación y análisis de datos, además nos ha permitido enriquecernos en temas nuevos y en el uso de aplicaciones como Rstudio que como podrán ser útiles para el futuro, ya sea a nivel personal o como futuros profesionales.

7. Referencias