¿REALMENTE SOMOS LA CIUDAD CAPITAL DEL TURISMO?



Universidad Distrital Francisco José De Caldas
Probabilidad y estadística
Proyecto: Parte II

Laura Daniela Urrego Díaz
Juan Esteban Perez Jimenez

Docente: Sindy Tatiana Cordoba Cordoba


Introducción


Colombia es reconocido como uno de los países que atrae a sus tierras infinidad de visitantes provenientes de todas partes del mundo debido a que se sienten atraídos por el encanto de la gente, las historias, la cautivadora belleza de los paisajes y las diversas actividades que permiten ser realizadas al ser un país tan diverso y multicultural.

La fascinación por conocer este país trae consigo muchos viajeros quienes curiosos de todo lo que Colombia tiene por ofrecer eligen a este como un principal destino turístico a conocer comenzando con la capital del país, la cual cuenta con una ubicación privilegiada en el centro del territorio colombiano en el altiplano cundiboyacense, ubicado en la cordillera oriental de los Andes conocida oficialmente como Bogotá Distrito Capital.

Bogotá tiene una longitud de 33 km de sur a norte y 16 km de oriente a occidente, está constituida por 20 localidades donde cada una tiene su propio alcalde menor y junta administrativa local encargados de la supervisión, ejecución y debido funcionamiento de los procesos internos de cada localidad; esta ciudad es el epicentro artístico, cultural, deportivo y turístico del país debido a que ofrece una gran variedad de gastronomía y arquitectura especializada con fines turísticos tales como museos, parques, teatros, casas culturales, centros comerciales y otros locaciones que acogen al viajero a vivir experiencias únicas dentro de la ciudad capital con una mezcla perfecta entre lo antiguo y lo moderno.

La finalidad de este proyecto es tomar como objeto de estudio un enfoque turístico de la ciudad de Bogotá y con ayuda de diferentes áreas del conocimiento como la estadística, la probabilidad y otras ciencias exactas realizar un análisis acerca de la inversión que se destina para estos intereses y la distribución por localidades de los recursos con ese fin, también se reconocerán otros factores que tienen relación tanto indirecta como directamente para así lograr visualizar como el turismo en la capital de la ciudad está presente en el desarrollo integral del país y brindando nuevas experiencias llamativas para los visitantes como también nuevas oportunidades de empleo, mejora de infraestructura y mejoramiento de la calidad de vida para los ciudadanos.



Problema Objetivo



El problema objetivo tratado a lo largo del desarrollo del proyecto es:


¿La inversión monetaria destinada al turismo en la ciudad de Bogotá se ve reflejada en la realidad para el gozo de los ciudadanos y visitantes?


Se realizará el estudio de los recursos que son destinados para la mejora y construcción de diferentes locaciones que promueven el turismo en la ciudad de Bogotá tales como casas de cultura, teatros, ciclo infraestructura, malla vial, espacios públicos y parques de la ciudad de Bogotá en las diferentes localidades, también se tendrá en cuenta el tipo de intervención que se esté realizando y el estado de esta para así poder visualizar cuantitativamente la cantidad de obras que realmente se han realizado y están disponibles para su uso colectivo como también la cantidad de obras están en su fase inicial, con incumplimientos o en suspensión.



Antecedentes Problemática



¿Qué se ha realizado hasta el momento?

El centro de gobierno local de Bogotá tiene a disposición de los ciudadanos información referente a los diferentes contratos existentes y obras ya que esta entidad es la encargada de llevar los seguimientos a la inversión de las diferentes infraestructuras y acciones de los espacios públicos de cada localidad, en esta información se puede evidenciar el mapa, las estadísticas de la ciudad, el estado de los procesos contractuales y el resumen de infraestructura local.

Lamentablemente este tipo de procesos la mayoría de veces no se ejecutan de la manera más eficaz y rápida posible de modo que, aunque la información se encuentra y se conocen las futuras intervenciones aun así en la mayoría de casos se evidencia una nula o lenta ejecución de estas.


La posible solución que se plantea es:

Realizar un análisis de la información que brida el centro de gobierno local de Bogotá para así poder identificar la inversión monetaria turística por localidad, adicionalmente identificar la jerarquización de los recursos entre las localidades y los avances que allí presentan para las infraestructuras que aportan al desarrollo turístico de la cuidad para luego poder comparar con visitas de campo si realmente se evidencia la respectiva intervención en la locación tal como lo presenta la información.

Gracias a este estudio se tendría la posibilidad de conocer en la actualidad las intervenciones que se están ejecutando y poder exigir la agilidad de los procesos a entidades como la secretaria de gobierno y la junta administrativa por localidad para que así tanto los ciudadanos como los visitantes de otros lugares puedan seguir disfrutando los espacios turísticos que se encuentran y que se planean construir en un futuro en la ciudad de Bogotá.



¿Cómo contribuye la estadística inferencial en la solución de esta problemática?

La estadística inferencial tiene un papel importante en cuanto al apoyo de la solución de esta problemática debido a que su aplicación nos permite estudiar diferentes factores que se relacionan tanto directa como indirectamente con el turismo y nos ayuda a comprenderlos para así realizar una toma de decisiones de una manera más fácil, basándonos así en los datos que nos muestran nuestras fuentes de información.

Otro aporte que nos brinda la estadística inferencial es el apoyo en la realización de deducciones para conocer el siguiente paso a seguir y dar la continuidad del estudio, implementando la solución a esta problemática basándonos en gran parte en la información numérica adquirida teniendo una base solida para la argumentación a la atención de la problemática.



Objetivos


Objetivo General


Analizar la eficiencia, cumplimiento e inversión de las construcciones como también de los espacios públicos que están destinados al ocio y gozo tanto de los habitantes de la ciudad de Bogotá como los visitantes de otras locaciones.


Objetivos Especificos


  • Compilar toda la información necesaria con el fin de conocer los factores de la problemática en su totalidad y realizar la interpretación de estos mismos.


  • Realizar un análisis especifico de la base de datos para conocer la inversión monetaria y ejecución de las obras referentes al turismo en la ciudad capital del país.


  • Comparar la información brindada por el análisis del estudio con trabajo en campo que rectifique la veracidad de la información por medio de evidencias.


  • Aprender a utilizar la estadística inferencial y sus aplicaciones como herramienta de trabajo en un ámbito real de la ingeniería civil.



Marco Teórico


  • Turismo: Término que define actividades que realizan las personas durante sus viajes y permanencias en lugares distintos a su entorno habitual durante un período de tiempo con fines de ocio, negocios u otros.


  • Ingeniería civil: Disciplina que emplea conocimientos de cálculo, mecánica, hidráulica y física para encargarse del diseño, construcción y mantenimiento de las infraestructuras reallizadas en el entorno.


  • Infraestructura: Realización humana diseñada y dirigida por profesionales de Ingeniería, Urbanismo, etc., que sirven de soporte para el desarrollo de otras actividades y su funcionamiento.


  • Estadística: Ciencia de dar sentido a los datos, proporcionando la teoría y los métodos para extraer información de estos y poder resolver problemas del mundo real.


  • Probabilidad:Valor numérico que nos sirve para determinar qué tan posible es que ocurra un evento determinado.


  • Localidad: División territorial o administrativa genérica para cualquier núcleo de población, con identidad propia. Puede ser tanto un núcleo de gran tamaño y con muchos habitantes o núcleo pequeño tamaño y pocos habitantes.


  • Contrato: Negocio jurídico bilateral en el cual dos o más partes expresan su consentimiento en la forma permitida por la ley, para crear, regular, modificar o extinguir obligaciones.


  • Invensión:Acto de asignar recursos para la compra o creación de activos o de capital.


  • Zona: Superficie de terreno determinada por consideraciones administrativas o estructurales.



Recopilación Datos


La recopilación de datos se llevó a cabo por medio de fuentes abiertas, la base de datos seleccionada con la cual se realizó el respectivo análisis de la información para estudiar la problemática de turismo en la ciudad de Bogotá anteriormente planteada fue obtenida de la página web correspondiente al gobierno local de Bogotá, esta información junto con la adición de otros datos obtenidos son la base del estudio en su totalidad.



Centro de Gobierno Local de Bogotá




Figura 1:Captura pantalla página web Centro gobierno local-Bogotá



# Librerias
library(readxl)
library(dplyr)
library(ggplot2)
library(univariateML)
library(nortest)
library(fitdistrplus)
library(MASS)
library(kableExtra)
library(leaflet)

Organización Datos


Los datos utilizados para el estudio están contenidos y organizados en formato de Excel (XLSX), estos se podrán observar en el siguiente enlace.

Base de datos Matriz Bogotá Turismo


Resumen base de datos

Localidad Número Contrato Tipo de Contrato Valor Final Contrato EGC Valor Final Contrato Interventoría Categoría Inversión Valor Inversión Por Categoría Tipo Intervención Zona Estado Intervención
USAQUÉN 286 Obra 215000000 Liquidado NA Sede 215000000 Mantenimiento Urbano Terminado
CHAPINERO 289 Obra 1141246181 Terminado 310200000 Parque 1141246181 Construcción Urbano Terminado
SANTA FE 273 Consultoría 140175457 Terminado 56113573 Acueductos 140175457 Estudios y Diseños Rural Terminado
SAN CRISTÓBAL 507 Obra 3263380489 Terminado 435269199 Malla Vial 2240424925 Construcción Urbano Terminado
USME 387 Obra 991276364 Terminado 89594303 Parque 991276364 Mantenimiento y dotación Urbano Terminado
TUNJUELITO 222 Obra 972278940 En ejecución 85819981 Parque 972278940 Construcción Urbano En ejecución
FONTIBÓN 313 Obra 1489318000 Terminado 166905670 Malla Vial 1407278914 Conservación Urbano Terminado
SUBA 541 Obra 7367292388 Terminado 537295500 Malla Vial 6427773659 Construcción Urbano Terminado
ENGATIVÁ 297 Suministro 1137801000 Terminado NA Malla Vial 1062526560 Mantenimiento Urbano Terminado
CIUDAD BOLÍVAR 572 Suministro 2032959607 Terminado NA Malla Vial 1355306607 Mantenimiento Rural Terminado
RAFAEL URIBE URIBE 315 Obra 1107812430 Terminado 130421589 Parque 1107812430 Construcción Urbano Terminado
BOSA 508 Obra 2121564275 Terminado 302637000 Malla Vial 2121564275 Construcción Urbano Terminado
PUENTE ARANDA 310 Obra 1518476451 Terminado 243346551 Espacio Público 1518476451 Conservación Urbano Terminado
KENNEDY 534 Convenio 4469130012 Terminado NA Malla Vial 715564834 Conservación Urbano Terminado
LOS MÁRTIRES 196 Obra 842821700 Suspendido 74440300 Malla Vial 390986961 Mantenimiento Urbano En ejecución
CANDELARIA 201 Obra 343587245 En ejecución NA Espacio Público 229058163 Mantenimiento Urbano Terminado
TEUSAQUILLO 224 Obra 1229310415 Terminado 149857192 Malla Vial 0 Conservación Urbano Terminado
BARRIOS UNIDOS 212 Obra 1168808480 Terminado 158741136 Sede 0 Mantenimiento Urbano Terminado
ANTONIO NARIÑO 212 Obra 1218523298 Terminado 183540840 Malla Vial 766220620 Conservación Urbano Terminado
SUMAPAZ 169 Suministro 3654576577 Terminado NA Malla Vial 871360083 Conservación Rural Terminado

Tabla 1:Resumen base de datos extraida del centro de gobierno local


En el siguiente mapa podemos observar la división de bogotá en sus respectivas localidades las cuales son el objeto de estudio del presente trabajo en el sector de turismo.

Recomendación : Descargar el documento para poder visualizar el mapa


leaflet() %>%
  addTiles() %>%
  setView(lng = -74.08175, lat = 4.60971, zoom = 12) %>%
  addMiniMap(width = 150, height = 150)



Identificación Variables



Para realizar el estudio se hizo uso de las siguientes variables dentro de la base de datos



##  [1] "Localidad"                          "Número Contrato"                   
##  [3] "Tipo de Contrato"                   "Valor Final Contrato"              
##  [5] "EGC"                                "Valor Final Contrato Interventoría"
##  [7] "Categoría Inversión"                "Valor Inversión Por Categoría"     
##  [9] "Tipo Intervención"                  "Zona"                              
## [11] "Estado Intervención"



A continuación se muestra el diccionario de datos de las variables para la compresión de las tablas de datos.



CAMPO TIPO DE DATO DESCRIPCIÓN
Localidad Carácter Localidad donde se encuentra la intervención
No. de contrato Numérico Número de contrato de la intervención
Tipo de Contrato Carácter Especificación general del tipo de intervención
Valor Final Contrato Numérico Valor monetario del contrato total de la intervención
Estado General Contrato Carácter Estado de avance del contrato de la intervención
Valor Final Contrato Interventoría Numérico Valor monetario del contrato de la interventoria
Categoría Inversión Carácter Tipo de construcción turistica
Valor Inversión Por Categoría Numérico Valor monetario total destinado a cada construcción turistica
Tipo Intervención Carácter Especificación detallada del tipo de intervención
Zona Carácter Especificación de especio rural o urbano
Estado Intervención Carácter Estado de avance de la intervención

Tabla 2:Diccionario de variables



Limpieza Datos


datos<-read_excel("matrizestadistica.xlsx")
datos1<-subset(datos,datos$`Valor Final Contrato`!=0)
VTC<-sum(datos1$`Valor Final Contrato`, na.rm=TRUE)
datos2<-subset(datos,datos$`Valor Final Contrato Interventoría`!=0)
VTCI<-sum(datos1$`Valor Final Contrato Interventoría`, na.rm=TRUE)
datos_limpios <- na.omit(datos[, "EGC", drop = FALSE])

En el proceso de limpieza de datos aplicado a las variables principales, se considera esencial eliminar aquellos valores que sean iguales a cero o que estén marcados como N/A (no disponibles). Esta práctica garantiza que estos valores no interfieran en los cálculos siguientes, especialmente durante la suma de los valores. En el análisis exploratorio de datos, se seguirá evidenciando este enfoque de limpieza, asegurando que los resultados proporcionados continúen excluyendo estos valores nulos o cero. Este procedimiento contribuirá a mantener la integridad y relevancia de los resultados obtenidos en los demás análisis.


Tablas de contingencia


Localidad y Zona


datos$Variable1 <- as.factor(datos$Localidad)
datos$Variable2 <- as.factor(datos$`Zona`)

# Tabla de contingencia
tabla_contingencia <- table(datos$Localidad, datos$`Zona`)

Tabla_proporciones<- prop.table(tabla_contingencia)
Tabla_P<- addmargins(round(tabla_contingencia*100,3))
Form.basic<-c("striped","bordered","hover","condensed","responsive")
kable(Tabla_P,format = "html")%>%
  kable_styling(bootstrap_options = Form.basic,full_width = F,font_size = 10)
Rural Urbano Sum
ANTONIO NARIÑO 0 6600 6600
BARRIOS UNIDOS 0 12600 12600
BOSA 0 26000 26000
CANDELARIA 0 1400 1400
CHAPINERO 300 1300 1600
CIUDAD BOLÍVAR 8500 25700 34200
ENGATIVÁ 0 89700 89700
FONTIBÓN 0 9100 9100
KENNEDY 0 40800 40800
LOS MÁRTIRES 0 6400 6400
PUENTE ARANDA 0 9400 9400
RAFAEL URIBE URIBE 0 18200 18200
SAN CRISTÓBAL 0 17200 17200
SANTA FE 6900 4900 11800
SUBA 200 54700 54900
SUMAPAZ 10300 0 10300
TEUSAQUILLO 0 4800 4800
TUNJUELITO 0 2900 2900
USAQUÉN 0 14900 14900
USME 10200 28700 38900
Sum 36400 375300 411700


Estado Genaral del Contrato y Estado de intervención


datos$Variable1 <- as.factor(datos$'EGC')
datos$Variable2 <- as.factor(datos$ 'Estado Intervención')

# Tabla de contingencia
tabla_contingencia <- table(datos$'EGC', datos$'Estado Intervención')

Tabla_proporciones<- prop.table(tabla_contingencia)
Tabla_P<- addmargins(round(tabla_contingencia*100,3))
Form.basic<-c("striped","bordered","hover","condensed","responsive")
kable(Tabla_P,format = "html")%>%
  kable_styling(bootstrap_options = Form.basic,full_width = F,font_size = 10)
En ejecución Incumplimiento Por iniciar Suspendido Terminado Sum
En ejecución 3600 0 2500 100 1200 7400
Incumplimiento 0 100 0 0 100 200
Liquidado 0 0 0 0 1600 1600
Por iniciar 100 0 400 0 0 500
Suspendido 700 0 200 800 100 1800
Terminado 0 0 0 0 9400 9400
Sum 4400 100 3100 900 12400 20900


Categoría de Inversión y tipo de contrato


datos$Variable1 <- as.factor(datos$'Categoría Inversión')
datos$Variable2 <- as.factor(datos$'Tipo de Contrato')

# Tabla de contingencia
tabla_contingencia <- table(datos$'Categoría Inversión', datos$'Tipo de Contrato')

Tabla_proporciones<- prop.table(tabla_contingencia)
Tabla_P<- addmargins(round(tabla_contingencia*100,3))
Form.basic<-c("striped","bordered","hover","condensed","responsive")
kable(Tabla_P,format = "html")%>%
  kable_styling(bootstrap_options = Form.basic,full_width = F,font_size = 10)
Compra de Maquinaria Consultoría Convenio Mantenimiento de Maquinaria Obra Suministro Sum
Acueductos 0 600 0 0 1000 0 1600
Bahía 0 0 500 0 500 100 1100
Casa de Cultura 0 100 0 0 900 0 1000
Cicloinfraestructura 0 14800 1300 0 10900 100 27100
Edificaciones 0 0 100 0 300 0 400
Espacio Público 0 26600 5800 0 47700 2000 82100
Malla Vial 0 36700 6100 0 110700 65000 218500
Obra de Bioingeniería 0 0 0 0 800 0 800
Obra de Mitigación 0 0 0 0 900 0 900
Parque 0 0 200 0 29100 0 29300
Puente 0 1000 0 0 6900 0 7900
Salón Comunal 0 1500 2000 0 13600 200 17300
Sede 0 100 0 0 2900 200 3200
Teatro 0 0 0 0 100 0 100
Vallado 0 0 0 0 3600 0 3600
Vivienda Rural 0 0 0 0 15500 1300 16800
Sum 0 81400 16000 0 245400 68900 411700


Relación Variables


Pruebas de Chi cuadrado


Localidad y Zona


datos$Variable1 <- as.factor(datos$'Localidad')
datos$Variable2 <- as.factor(datos$'Zona')

# Test de chi-cuadrado
resultado_chi_cuadrado <- chisq.test(table(datos$'Localidad', datos$'Zona'))
print(resultado_chi_cuadrado)
## 
##  Pearson's Chi-squared test
## 
## data:  table(datos$Localidad, datos$Zona)
## X-squared = 1980.3, df = 19, p-value < 2.2e-16


INTERPRETACIÓN: Dado que el valor p es muy pequeño, rechazamos la hipótesis nula de independencia entre las variables “Localidad” y “Tipo de Contrato”. En otras palabras, hay evidencia significativa para sugerir que existe una asociación entre estas dos variables. El valor del estadístico de chi-cuadrado (1980.3) es alto, lo que indica que hay una gran diferencia entre las frecuencias observadas y las frecuencias esperadas bajo la hipótesis nula de independencia.


Estado General Contrato y Estado Inversión

datos$Variable1 <- as.factor(datos$'EGC')
datos$Variable2 <- as.factor(datos$'Estado Intervención')

# Test de chi-cuadrado
resultado_chi_cuadrado <- chisq.test(table(datos$'EGC', datos$'Estado Intervención'))
print(resultado_chi_cuadrado)
## 
##  Pearson's Chi-squared test
## 
## data:  table(datos$EGC, datos$"Estado Intervención")
## X-squared = 345.09, df = 20, p-value < 2.2e-16


INTERPRETACIÓN:Asociación Significativa: Dado que el valor p es muy pequeño, rechazamos la hipótesis nula de independencia entre las variables “EGC” y “Estado Intervención”. Esto sugiere que hay una asociación significativa entre estas dos variables. El valor del estadístico de chi-cuadrado (345.09) es alto, indicando que hay una gran diferencia entre las frecuencias observadas y las frecuencias esperadas bajo la hipótesis nula de independencia.


Categoría Inversión y Tipo Contrato


datos$Variable1 <- as.factor(datos$'Categoría Inversión')
datos$Variable2 <- as.factor(datos$'Tipo de Contrato')

# Test de chi-cuadrado
resultado_chi_cuadrado <- chisq.test(table(datos$'Categoría Inversión', datos$'Tipo Intervención'))
print(resultado_chi_cuadrado)
## 
##  Pearson's Chi-squared test
## 
## data:  table(datos$"Categoría Inversión", datos$"Tipo Intervención")
## X-squared = 8086.5, df = 165, p-value < 2.2e-16

INTERPRETACIÓN:Dado que el valor p es muy pequeño, rechazamos la hipótesis nula de independencia entre las variables “Categoría Inversión” y “Tipo Intervención”. Esto sugiere que hay una asociación significativa entre estas dos variables.El valor del estadístico de chi-cuadrado (8086.5) es alto, indicando que hay una gran diferencia entre las frecuencias observadas y las frecuencias esperadas bajo la hipótesis nula de independencia

Coeficiente de correlación de Pearson


matrizestadistica <- readxl::read_excel("matrizestadistica.xlsx")

cuanti <- matrizestadistica[, c("Valor Final Contrato", "Valor Final Contrato Interventoría", "Valor Inversión Por Categoría", "Número Contrato")]

pairs(cuanti,col='red',pch = 18,labels = c("V.F.C.","V.F.C. Interventoría","V.I.Categoría","Número Contrato"),
      main = "Otras variables numéricas")

correlaciones <- cor(cuanti, use = "complete.obs")

print(correlaciones)
##                                    Valor Final Contrato
## Valor Final Contrato                        1.000000000
## Valor Final Contrato Interventoría          0.877241660
## Valor Inversión Por Categoría               0.964075126
## Número Contrato                            -0.001030257
##                                    Valor Final Contrato Interventoría
## Valor Final Contrato                                       0.87724166
## Valor Final Contrato Interventoría                         1.00000000
## Valor Inversión Por Categoría                              0.88888823
## Número Contrato                                            0.06360459
##                                    Valor Inversión Por Categoría
## Valor Final Contrato                                  0.96407513
## Valor Final Contrato Interventoría                    0.88888823
## Valor Inversión Por Categoría                         1.00000000
## Número Contrato                                      -0.01803976
##                                    Número Contrato
## Valor Final Contrato                  -0.001030257
## Valor Final Contrato Interventoría     0.063604592
## Valor Inversión Por Categoría         -0.018039761
## Número Contrato                        1.000000000


Valor Final Contrato con otras variables


  • Valor Final Contrato Interventoría: Hay una fuerte correlación positiva de aproximadamente 0.88 entre “Valor Final Contrato” y “Valor Final Contrato Interventoría”. Esto sugiere que cuando el valor de un contrato aumenta, el valor de la interventoría también tiende a aumentar de manera proporcional.


  • Valor Inversión Por Categoría: Hay una fuerte correlación positiva de aproximadamente 0.96 entre “Valor Final Contrato” y “Valor Inversión Por Categoría”. Esto indica una fuerte relación positiva entre el valor final del contrato y la inversión por categoría.


Valor Final Contrato Interventoría con otras variables


  • Valor Inversión Por Categoría: Hay una fuerte correlación positiva de aproximadamente 0.89 entre “Valor Final Contrato Interventoría” y “Valor Inversión Por Categoría”. Esto sugiere una relación positiva entre el valor de la interventoría y la inversión por categoría.


Valor Inversión Por Categoría con Número Contrato


  • Número Contrato: La correlación entre “Valor Inversión Por Categoría” y “Número Contrato” es cercana a cero (aproximadamente -0.02), lo que indica una correlación débil. Esto sugiere que no hay una relación lineal clara entre el valor de la inversión por categoría y el número de contrato.


Número Contrato con otras variables


  • Las correlaciones entre “Número Contrato” y las otras variables son muy bajas, cercanas a cero. Esto sugiere que no hay una relación lineal evidente entre el número de contrato y los otros valores.


En resumen, las correlaciones positivas indican que hay asociaciones lineales positivas fuertes o moderadas entre algunas de las variables. Las correlaciones cercanas a cero indican una débil o nula relación lineal.


La correlación positiva entre las variables indica que están relacionadas entre sí de alguna manera. Sin embargo, estas relaciones no deben interpretarse como una razón para eliminar variables, ya que cada una de ellas aporta información única al entendimiento de los contratos. Estas variables pueden estar conectadas, pero su inclusión en el análisis es fundamental para entender la diversidad de factores que influyen en el comportamiento de los contratos.

Al eliminar variables altamente correlacionadas, podríamos perder enfoques importantes y limitar nuestra capacidad para analizar los contratos desde diversas perspectivas. Cada variable, aunque pueda compartir cierta información con otras, aporta su propio contexto único, enriqueciendo así la comprensión general de los datos.


Datos atípicos


En el ámbito del análisis de datos en el centro de gobierno local de Bogotá, se da una atención especial a la presencia de datos atípicos, dado que los valores de los contratos tienen una variabilidad significativa. Estos valores atraviesan un proceso de tratamiento que implica la revisión detallada a cargo de analistas de datos. El propósito fundamental de este procedimiento es verificar la autenticidad de estos antes de ser integrados en el cuadro de control. Esta práctica asegura la integridad de la información presentada, permitiendo a los responsables de la toma de decisiones acceder a datos precisos y pertinentes para sus análisis.

Análisis Exploratorio Datos


Una vez realizada la limpieza de los datos para poder obtener específicamente solo la información que requeremos con fines del estudio, se lleva a la práctica el análisis de todos los datos.


Para el análisis se encuentran las medidas de tendencia central de la base de datos.


Variable “valor final contrato interventoria”


Media
mediaVFCI<-mean(datos2$`Valor Final Contrato Interventoría`);mediaVFCI
## [1] 354533475
Mediana
medianaVFCI<-median(datos2$`Valor Final Contrato Interventoría`);medianaVFCI
## [1] 165157066
Varianza
VarianzaVFCI<-var(datos2$`Valor Final Contrato Interventoría`);VarianzaVFCI
## [1] 2.958739e+17

Realizando el estudio del valor final de contrato de interventoria observamos que en promedio el valor de los contratos realizados es de $354.533.475 y el contrato que se encuentra en la posición central de toda la muestra tiene un valor de $165.157.066. En el contexto de la varianza, este resultado indica que hay una gran dispersión en los valores del conjunto de datos.


Valor total de contratos interventoria


VTCI<-sum(datos1$`Valor Final Contrato Interventoría`, na.rm=TRUE);VTCI
## [1] 50343753510

La suma de contratos total de interventoria en el año 2023 finalmente muestra que en total el estado invirtió $50.343.753.510 en el seguimiento técnico y vigilancia de los contratos de todas las obras de turismo con el objetivo de supervisar la finalización exitosa de estos mismos.


Variable “valor final contrato”

Media
## [1] 2578172416
Mediana
## [1] 840518181
Varianza
VarianzaVFC<-var(datos1$`Valor Final Contrato`);VarianzaVFC
## [1] 1.490514e+19

Por otro lado, se identifica que en promedio el valor de los contratos realizados que son destinados a la inversión del turismo en la ciudad de Bogotá es de $2.578.172.416 y el contrato que se encuentra en la posición central de toda la muestra ordenada y tiene un valor de $840.518.181. De igual manera que el caso anterior respecto a la varianza, este resultado indica que hay una gran dispersión en los valores del conjunto de datos.

Valor total de contratos generales

## [1] 554307069433


La suma de contratos en el año 2023 finalmente muestra que en total el estado invirtió $554.307.069.433 en el sector de turismo y estos se dividieron en diferentes tipos de intervenciones, dentro de las cuales destacan las siguientes categorias con sus respectivos valores:


Intervención 1: Mantenimiento


Localidad Número Contrato Tipo de Contrato Valor Final Contrato EGC Valor Final Contrato Interventoría Categoría Inversión Valor Inversión Por Categoría Tipo Intervención Zona Estado Intervención
USAQUÉN 286 Obra 215000000 Liquidado NA Sede 215000000 Mantenimiento Urbano Terminado
USAQUÉN 308 Obra 301880000 Liquidado 54275235 Cicloinfraestructura 301880000 Mantenimiento Urbano Terminado
USAQUÉN 419 Obra 170000000 Liquidado NA Sede 170000000 Mantenimiento Urbano Terminado
USAQUÉN 423 Obra 130000000 Liquidado NA Sede 130000000 Mantenimiento Urbano Terminado
SANTA FE 276 Obra 731671423 Terminado 87800568 Vivienda Rural 731671423 Mantenimiento Rural Terminado

Tabla 3:Intervenciones de mantenimiento ciudad de Bogotá


Intervención 2: Conservación


Localidad Número Contrato Tipo de Contrato Valor Final Contrato EGC Valor Final Contrato Interventoría Categoría Inversión Valor Inversión Por Categoría Tipo Intervención Zona Estado Intervención
USAQUÉN 292 Obra 4050515384 Liquidado 484402370 Malla Vial 4050515384 Conservación Urbano Terminado
CHAPINERO 304 Obra 2240632023 Terminado 366250994 Malla Vial 2240632023 Conservación Rural Terminado
USME 428 Obra 621521100 Terminado 69057900 Acueductos 621521100 Conservación Rural Terminado
USME 431 Obra 570734289 En ejecución 77827403 Obra de Bioingeniería 570734289 Conservación Urbano En ejecución
TUNJUELITO 236 Obra 793799960 Terminado 81627509 Espacio Público 793799960 Conservación Urbano Terminado

Tabla 4:Intervenciones de conservación ciudad de Bogotá


Intervención 3: Construcción


Localidad Número Contrato Tipo de Contrato Valor Final Contrato EGC Valor Final Contrato Interventoría Categoría Inversión Valor Inversión Por Categoría Tipo Intervención Zona Estado Intervención
CHAPINERO 289 Obra 1141246181 Terminado 310200000 Parque 1141246181 Construcción Urbano Terminado
SAN CRISTÓBAL 507 Obra 3263380489 Terminado 435269199 Malla Vial 2240424925 Construcción Urbano Terminado
SAN CRISTÓBAL 508 Obra 300250243 Terminado 52385514 Obra de Mitigación 300250243 Construcción Urbano Terminado
TUNJUELITO 222 Obra 972278940 En ejecución 85819981 Parque 972278940 Construcción Urbano En ejecución
TUNJUELITO 230 Obra 621338396 Terminado 69093780 Salón Comunal 621338396 Construcción Urbano Terminado

Tabla 5:Intervenciones de construcción ciudad de Bogotá


Intervención 4: Adecuación


Localidad Número Contrato Tipo de Contrato Valor Final Contrato EGC Valor Final Contrato Interventoría Categoría Inversión Valor Inversión Por Categoría Tipo Intervención Zona Estado Intervención
USME 413 Suministro 1260000000 Terminado NA Malla Vial NA Adecuación Rural Terminado
USAQUÉN 561 Obra 683263741 Terminado 115659514 Obra de Mitigación 683263741 Adecuación Urbano Terminado
KENNEDY 817 Obra 495000000 Terminado NA Casa de Cultura NA Adecuación Urbano Terminado

Tabla 6:Intervenciones de adecuación ciudad de Bogotá


Intervención 5: Estudios y diseños


Localidad Número Contrato Tipo de Contrato Valor Final Contrato EGC Valor Final Contrato Interventoría Categoría Inversión Valor Inversión Por Categoría Tipo Intervención Zona Estado Intervención
SANTA FE 273 Consultoría 140175457 Terminado 56113573 Acueductos 140175457 Estudios y Diseños Rural Terminado
USME 410 Consultoría 190241168 En ejecución NA Salón Comunal 190241168 Estudios y Diseños Urbano En ejecución
USME 436 Consultoría 1014381324 Suspendido 101432132 Cicloinfraestructura 101432132 Estudios y Diseños Urbano En ejecución
BOSA 514 Consultoría 312861777 En ejecución NA Salón Comunal 312861777 Estudios y Diseños Urbano En ejecución
KENNEDY 548 Consultoría 169976000 Suspendido 56428765 Salón Comunal 113570000 Estudios y Diseños Urbano En ejecución

Tabla 7:Intervenciones de estudios y diseños ciudad de Bogotá


Intervención 6: Limpieza de Vallados


## [1] 1079236046


Intervención 7: Rehabilitación


Localidad Número Contrato Tipo de Contrato Valor Final Contrato EGC Valor Final Contrato Interventoría Categoría Inversión Valor Inversión Por Categoría Tipo Intervención Zona Estado Intervención
USAQUÉN 536 Obra 610726566 En ejecución NA Puente 610726566 Rehabilitación Urbano Por iniciar
TEUSAQUILLO 232 Obra 3157146401 En ejecución 343048012 Malla Vial NA Rehabilitación Urbano Por iniciar
ANTONIO NARIÑO 260 Obra 4983460033 Por iniciar NA Malla Vial NA Rehabilitación Urbano Por iniciar

Tabla 8:Intervenciones de rehabilitación ciudad de Bogotá


Resumen de valores por categorías de inversión


CATEGORÍA DE INVERSIÓN VALOR
Mantenimiento $5.299.151.316
Conservación $12.818.645.335
Construcción $22.376.874.493
Adecuación $683.263.741
Estudios y diseños $9.583.255.998
Limpieza de Vallados $1.079.236.046
Rehabilitación $610.726.566

Tabla 9:Resumen valores de intervención ciudad de Bogotá


Representación Gráfica


Zona de intervención


barplot(table(datos$Zona),main = "Tipo de Zona Intervenida", xlab="Zona" , ylab="Conteo", col=c("blue","red"), ylim = c(0,4000) )

Interpretando el gráfico de barras correspondiente a la variable “zona”, se puede identificar que en el área de estudio de la ciudad de Bogotá, el tipo de zona que tiene mayor intervención intervenida es de tipo urbano.

Intervención localidad en Bogotá


colores1 <- c("#00F5FF", "#5CACEE", "#C6E2FF", "#27408B")

Localidad<-subset(datos,select=Localidad)
pie(table(Localidad),main = "Intervenciones por Localidad", r=1.08, cex=0.5, col = colores1)


En el diagrama de pastel de intervención por localidad podemos identificar que la más intervenida es Engativá, seguido de Kennedy, Suba y Ciudad Bolívar, mientras que las localidades menos intervenidas son Candelaria, Chapinero y Tunjuelito, lo cual nos ayuda a inferir que aunque en estas localidades hay varias zonas turísticas aun así no se evidencian intervenciones para la mejora y expansión de lugares, en especial Candelaria, donde se debería estar invirtiendo en mayor cantidad ya que como se sabe es la localidad donde tanto visitantes como locales eligen más para el gozo de diferentes actividades y tiempos de ocio debido a la cultura que allí presenta la ciudad.

Otra conclusión inferida a partir del grafico es el balance de turismo, es beneficioso ya que existen algunos puntos clave donde se disfruta del turismo y se concentra la mayor parte de espacios; al distribuir como comenzar a construir en otras localidades las personas tendrán varias opciones para poder realizar turismo en Bogotá y los habitantes locales no tomarán viajes tan extensos atravesando la ciudad para poder disfrutar del turismo de la capital del país.

Estado general de los contratos


barplot(table(datos$EGC), main = "Estado Genaral de Contrato", xlab = "Estado del Contrato", ylab = "Conteo", col = c("green", "purple"), las = 2, cex.names = 0.55, ylim = c(0, 100))

Este grafico de barras nos muestra que el mayor porcentaje de los estados de los contratos están Finalizados o en ejecución y en un porcentaje reducido están incumplidos, suspendidos o por iniciar.

Estado general de intervención


colores2 <- c("#FFE7BA", "#FF7256", "#FF8247", "#EE8262","#FFA500")

Estado_intervencion<-subset(datos,select=`Estado Intervención`)
pie(table(Estado_intervencion),main = "Estado de Intervencion", r=1.08, col = colores2)

Distribución Discreta


Por medio de distribuciones discretas asociadas a las variables se realiza una representación de los datos correspondientes a la base de datos Matriz Bogotá Turismo con el fin de observar su comportamiento con ayuda de medidas descriptivas como la media, la varianza y la simetría a partir de experimentos realizar un análisis hacia las variables en las que está enfocado el proyecto.

Distribución Binomial


El estado general de un contrato se puede clasificar en 6 categorías las cuales son:

  • En ejecución
  • Incumplimiento
  • Liquidado
  • Por iniciar
  • Suspendido
  • Terminado

Para poder evidenciar el avance de las inversiones en turismo en la ciudad de Bogotá de manera real y garantizar que los ciudadanos puedan utilizar los espacios o se contemple la idea de que en un futuro cercano se puedan utilizar, el contrato debe estar en dos estados generales:

En ejecución: Debido a que se garantiza que actualmente se encuentran en construcción y la obra no está detenida.

Terminado: Debido a que si el contrato finalizo significa que la obra ya está culminada y el espacio actualmente se encuentra a disposición de todos los ciudadanos.


# Probabilidad contratos terminados
prob_ter <- sum(datos_limpios$EGC == "Terminado", na.rm = TRUE) / nrow(datos_limpios)

print(paste("Probabilidad de que los contratos esten es estado terminado es :",
            round(prob_ter, 2)))
## [1] "Probabilidad de que los contratos esten es estado terminado es : 0.45"


La probabilidad de seleccionar los contratos de las localidades que estén en estado terminado es del 45%.

# Probabilidad contratos terminados
prob_eje <- sum(datos_limpios$EGC == "En ejecución", na.rm = TRUE) / nrow(datos_limpios)

print(paste("Probabilidad de que los contratos esten es estado de ejecución es :",
            round(prob_eje, 2)))
## [1] "Probabilidad de que los contratos esten es estado de ejecución es : 0.35"


La probabilidad de seleccionar los contratos de las localidades que estén en estado de ejecución es del 35%.

# Estados
estados <- c("Liquidado", "Suspendido", "Por iniciar", "Incumplimiento")
probabilidades <- numeric(length(estados))

# Probabilidades para cada estado
for (i in seq_along(estados)) {
  prob_estado <- sum(datos_limpios$EGC == estados[i], na.rm = TRUE) / nrow(datos_limpios)
  probabilidades[i] <- prob_estado
}

# Sumar las probabilidades
prob_otros <- sum(probabilidades)

# Imprimir la suma de probabilidades con 2 decimales
print(paste("Suma de probabilidades:", sprintf("%.2f", prob_otros)))
## [1] "Suma de probabilidades: 0.20"


La probabilidad de seleccionar los contratos de las localidades que estén en otros estados es del 20%.

# Suma Probabilidades
prob_total <- prob_eje + prob_ter + prob_otros
print(paste("Probabilidad total:", round(prob_total, 2)))
## [1] "Probabilidad total: 1"

Se comprueba que la probabilidad total de todos los estados generales de los contratos en las 20 localidades es del 100%


Registro contratos de contrucciones turismo Bogotá



La variable de interés en este caso es el estado general de los contratos, ya que constituye la medida más representativa para evaluar si realmente se está invirtiendo dinero de manera efectiva en el sector turístico de Bogotá. Esta variable nos proporciona una visión integral del progreso y la finalización de los contratos, permitiéndonos identificar de manera clara y significativa la situación de las inversiones destinadas al desarrollo turístico en la ciudad.

Para este planteamiento se utilizan los contratos con estado general de terminado ya que nos garantizan que esas construcciones ya estan disponibles al uso del publico.

Si se sabe que la probabilidad de que un contrato este en estado general terminado es del 45% y se seleccionan una cantidad de 10 contratos al azar:

  • ¿cuál es la probabilidad de que 5 de esos contratos estén en estado terminado?

Se eligen 5 contratos, que representan la mitad del número total de ensayos propuestos, con el fin de obtener una muestra más manejable y significativa para analizar el estado de los contratos de manera más eficiente.


En este caso se emplea la distribución binomial debido a que es un experimento que admite dos posibles resultados donde 1 de ellos se considera como un éxito y el otro como un fracaso tal como se realiza en la distribución de Bernoulli pero se aplica de manera sucesiva teniendo en cuenta que cada contrato es independiente al anterior.

F.D.P.


Función De Distribución General

  • No.Ensayos = N
  • Probabilidad de éxito = P
  • Número de casos exitosos = X


X∼B(N,P)




Función De Distribución Especifica Del Experimento

  • No.Ensayos = 10
  • Probabilidad de éxito = 0.45
  • Número de casos exitosos = 5

X∼B(10,0.45)







prob_exito <- 0.45  # Probabilidad(contrato en estado terminado)
num_contratos <- 10  # Número total de contratos seleccionados al azar
num_exitos_deseados <- 5  # Número de contratos en estado terminado deseados

# Probabilidad
probabilidad <- dbinom(num_exitos_deseados, size = num_contratos, prob = prob_exito)

print(paste("La probabilidad de obtener", num_exitos_deseados, "contratos en estado terminado por cada 10 contratos seleccionados es:", round(probabilidad, 3)))
## [1] "La probabilidad de obtener 5 contratos en estado terminado por cada 10 contratos seleccionados es: 0.234"


La probabilidad de que, al seleccionar 10 contratos, todos estén en estado terminado es baja, específicamente del 23%. Este resultado refleja la realidad del proceso de ejecución de contratos en el ámbito de la construcción y restauración para actividades turísticas. La baja probabilidad indica que muchos contratos comienzan, pero no todos llegan a su estado final de terminado. Esto puede deberse a diversos factores, como demoras en la ejecución, cambios en los planes originales, problemas de financiamiento o cualquier otro obstáculo que pueda surgir durante el proceso de construcción. Esta estadística desfavorable sugiere que, a pesar de la existencia de numerosos contratos para proyectos turísticos, la transformación de estos contratos en obras terminadas implica una inversión considerable de tiempo y recursos. La complejidad y la duración del proceso pueden ser obstáculos importantes para la efectiva implementación de proyectos en el sector turístico.

Medidas Descriptivas


Media y varianza con distribución binomial del experimento correspondiente

# Parámetros
prob_exito <- 0.45
num_contratos <- 10

# Media y varianza
media <- num_contratos * prob_exito
varianza <- num_contratos * prob_exito * (1 - prob_exito)

print(paste("Media:", media))
## [1] "Media: 4.5"
print(paste("Varianza:", varianza))
## [1] "Varianza: 2.475"


Media(4.5):La media de una distribución binomial se calcula con la fórmula μ=n.p, representa el valor promedio de la distribución y, en este contexto, indica el número medio de contratos que se esperaría que estén en estado “terminado” al seleccionar 10 contratos al azar

La media sugiere que, en promedio, se esperaría que alrededor de 4.5 contratos estén en estado “terminado” en cada selección de 10 contratos. Dado que no se puede tener un número fraccional de contratos, esta cifra se interpreta como un valor esperado a largo plazo.

Varianza(2.475):La varianza de una distribución binomial se calcula con la fórmula σ^2=n⋅p⋅(1−p), mide la dispersión de la distribución. En este contexto, indica cuánto varía el número de contratos en estado “terminado” al seleccionar 10 contratos al azar.

La varianza indica que la distribución tiene cierta dispersión alrededor de la media. Cuanto mayor sea la varianza, mayor será la variabilidad en los resultados.


Gráficos F.D.P y F.D.A.


Gráfico que representa las distribución binomial de los contratos

# Números de contratos
num_contratos <- 0:10

# Parámetros
prob_exito <- 0.45
num_ensayos <- 10

# Probabilidades para cada número de contratos
probabilidades <- dbinom(num_contratos, size = num_ensayos, prob = prob_exito)

# Gráfico de barras
barplot(probabilidades, names.arg = num_contratos, col = "#FFB90F", 
        main = "Distribución Binomial Contratos Terminados", xlab = "Número de Contratos en Estado Terminado",
        ylab = "Probabilidad", ylim = c(0, 0.3), xlim = c(-0.5, 10.5), width = 0.7, border = "black", space = 0.2)

# Etiquetas de probabilidad
text(x = num_contratos, y = probabilidades, labels = paste(round(probabilidades, 3) * 100, "%"),
     pos = 3, col = "black", cex = 0.6)

# Media
abline(v = mean(num_contratos, prob = prob_exito * num_ensayos), col = "red", lty = 2)


INTERPRETACIÓN: El eje X representa el número de contratos en estado “terminado”, el eje Y representa la probabilidad de observar un cierto número de contratos en el mismo estado, en general se puede observar cómo varía la probabilidad a medida que cambia el número de contratos en estado “terminado”.


Gráfico que representa las distribución binomial acumulada de los contratos

# Números de contratos posibles
num_contratos <- 0:10

# Parámetros
prob_exito <- 0.45
num_ensayos <- 10

# Probabilidades acumuladas para cada número de contratos
prob_acumuladas <- pbinom(num_contratos, size = num_ensayos, prob = prob_exito)

# Gráfico de barras
barplot(prob_acumuladas, names.arg = num_contratos, col = "#FF7F24", 
        main = "Distribución Binomial Acumulada Contratos Terminados",
        xlab = "Número de Contratos en Estado Terminado", ylab = "Probabilidad Acumulada",
        ylim = c(0, 1.5), xlim = c(-0.5, 10.5), width = 0.7, border = "black", space = 0.2)

text(x = num_contratos, y = prob_acumuladas, labels = paste(round(prob_acumuladas, 3) * 100, "%"),
     pos = 3, col = "black", cex = 0.7, offset = 1)

# Media
abline(v = mean(num_contratos, prob = prob_exito * num_ensayos), col = "red", lty = 2)



INTERPRETACIÓN: El gráfico de distribución acumulada representa la probabilidad acumulada de que el número de contratos en estado “terminado” sea igual o menor que un valor específico. Cada barra en el gráfico indica la probabilidad acumulada hasta ese punto.La forma de la curva refleja cómo la probabilidad acumulada aumenta a medida que avanzamos a lo largo del eje X. En este caso, dado que la probabilidad de éxito (contratos en estado “terminado”) es relativamente alta (0.45), la curva sube más rápidamente.

Preguntas planteadas


1. Número esperado de contratos finalizados

  • ¿Cuál es el número esperado de contratos terminados en un mes si la probabilidad de éxito es del 45%?
# Probabilidad de éxito
prob_exito <- 0.45

# meses
num_ensayos <- 1

# Número esperado de contratos terminados en un mes
num_contratos_esperados <- num_ensayos * prob_exito

print(paste("El número esperado de contratos terminados en un mes es:", num_contratos_esperados))
## [1] "El número esperado de contratos terminados en un mes es: 0.45"
# Números de contratos
num_contratos <- 0:10

# Parámetros
prob_exito <- 0.45
num_ensayos <- 10

# Probabilidades para cada número de contratos
probabilidades <- dbinom(num_contratos, size = num_ensayos, prob = prob_exito)

# Gráfico de barras
barplot(probabilidades, names.arg = num_contratos, col = "#FFB90F", 
        main = "Contratos en un mes",
        xlab = "Número de Contratos en Estado Terminado",
        ylab = "Probabilidad", ylim = c(0, 0.3), xlim = c(-0.5, 10.5),
        width = 0.7, border = "black", space = 0.2)

# Etiquetas de probabilidad
text(x = num_contratos, y = probabilidades, labels = paste(round(probabilidades, 3) * 100, "%"),
     pos = 3, col = "black", cex = 0.6)
abline(v = 0.45, col = "blue", lty = 2)


  • ¿Cuál es el número esperado de contratos terminados semestralmente si la probabilidad de éxito es del 45%?
# Probabilidad de éxito
prob_exito <- 0.45

# meses en un semestre
meses <- 6

# Número esperado de contratos terminados semestralmente
num_contratos_esperados <- meses * prob_exito

print(paste("El número esperado de contratos terminados semestralmente es:", num_contratos_esperados))
## [1] "El número esperado de contratos terminados semestralmente es: 2.7"
# Números de contratos
num_contratos <- 0:10

# Parámetros
prob_exito <- 0.45
num_ensayos <- 10

# Probabilidades para cada número de contratos
probabilidades <- dbinom(num_contratos, size = num_ensayos, prob = prob_exito)

# Gráfico de barras
barplot(probabilidades, names.arg = num_contratos, col = "#FFB90F", 
        main = "Contratos en seis meses",
        xlab = "Número de Contratos en Estado Terminado",
        ylab = "Probabilidad", ylim = c(0, 0.3), xlim = c(-0.5, 10.5),
        width = 0.7, border = "black", space = 0.2)

# Etiquetas de probabilidad
text(x = num_contratos, y = probabilidades, labels = paste(round(probabilidades, 3) * 100, "%"),
     pos = 3, col = "black", cex = 0.6)
abline(v = 2.7, col = "purple", lty = 2)


2. Riesgo

  • ¿Cuál es la varianza del número de contratos terminados al seleccionar 20 contratos?
# Parámetros
n_contratos <- 20
prob_exito <- 0.45

# Varianza
varianza <- n_contratos * prob_exito * (1 - prob_exito)

print(paste("La varianza del número de contratos terminados es:", varianza))
## [1] "La varianza del número de contratos terminados es: 4.95"


3. Tamaños de muestra ideales

  • Si queremos asegurarnos de que al menos el 50% de los contratos estén terminados a tiempo y la probabilidad de éxito es del 45%, ¿cuál debería ser el tamaño mínimo de la muestra?
# Instalar y cargar la librería necesaria
# install.packages("readxl")
library(readxl)


prob_exito <- 0.45
cuantil_deseado <- 0.50

matriz_datos <- read_excel('matrizestadistica.xlsx')

# Calcular el tamaño mínimo de la muestra
tamaño_muestra <- qbinom(cuantil_deseado, size = nrow(matriz_datos), prob = prob_exito, lower.tail = FALSE)

print(paste("El tamaño mínimo de la muestra para asegurar el cuantil deseado de contratos terminados a tiempo es:", tamaño_muestra))
## [1] "El tamaño mínimo de la muestra para asegurar el cuantil deseado de contratos terminados a tiempo es: 1855"


5. Comparaciones

  • Si la probabilidad de éxito es de 45%, ¿cómo afecta esto a la probabilidad de que al menos 8 de 12 contratos estén terminados a tiempo?
# Parámetros
prob_exito_nuevo <- 0.45
num_contratos_nuevo <- 12
num_terminados_nuevo <- 8

# Probabilidad acumulativa
prob_acumulativa_nueva <- 1 - pbinom(num_terminados_nuevo - 1, size = num_contratos_nuevo, prob = prob_exito_nuevo)

print(paste("La probabilidad de que al menos 8 de 12 contratos estén terminados a tiempo con la probabilidad de éxito es:", round(prob_acumulativa_nueva, 3)))
## [1] "La probabilidad de que al menos 8 de 12 contratos estén terminados a tiempo con la probabilidad de éxito es: 0.112"
num_contratos <- 0:12
prob_exito <- 0.45
num_ensayos <- 12

# Probabilidades 
probabilidades <- dbinom(num_contratos, size = num_ensayos, prob = prob_exito)

# Probabilidad acumulativa
prob_acumulativa <- pbinom(7, size = num_ensayos, prob = prob_exito, lower.tail = FALSE)
par(mar = c(5, 5, 4, 2) + 0.1)  # Ajustar los márgenes

# Gráfico de barras
barplot(probabilidades, names.arg = num_contratos, col = "#FFB90F", 
        main = "Contratos terminados a tiempo",
        xlab = "Número de Contratos en Estado Terminado",
        ylab = "Probabilidad", ylim = c(0, 0.3), xlim = c(-0.5, 12.5),
        width = 0.7, border = "black", space = 0.2, las = 2)  # Rotar etiquetas del eje x

text(x = num_contratos, y = probabilidades, labels = paste(round(probabilidades, 3) * 100, "%"),
     pos = 3, col = "black", cex = 0.6)
abline(v = 7.5, col = "green", lty = 2)
text(x = 11, y = 0.28, labels = paste("Prob. Acumulativa (>=8):", round(prob_acumulativa, 3) * 100, "%"),
     col = "blue", pos = 3)



Análisis y conclusiones


Análisis:Se han explorado varias distribuciones de probabilidad, incluyendo la distribución uniforme, la distribución geométrica, la distribución binomial y la distribución de poisson seleccionando finalmente la binomial la cual representaba de una mejor manera el enfoque del proyecto que queriamos.

Esta elección se justifica por su capacidad para representar de manera efectiva la variabilidad en el número de contratos terminados y proporcionar información valiosa para comprender el avance de las construcciones en la ciudad de Bogotá respecto al turismo. Al utilizarla, se puede obtener una comprensión más profunda de la incertidumbre asociada con el estado de los contratos y, por ende, con el progreso general de las construcciones.


Conclusión:Este proyecto porporcionó una comprensión práctica de diversas distribuciones de probabilidad y cómo aplicarlas en el contexto de la gestión de contratos y proyectos de construcción en Bogotá. Las distribuciones de probabilidad son herramientas valiosas para modelar eventos inciertos y tomar decisiones informadas en la planificación y gestión de proyectos.

Al comprender y aplicar estas distribuciones, podemos hacer predicciones probabilísticas sobre eventos futuros, lo que es esencial para tomar decisiones estratégicas y asignar recursos de manera eficiente. La capacidad de modelar la incertidumbre y evaluar el riesgo asociado proporciona una base sólida para la toma de decisiones informada en el ámbito de la gestión de proyectos y contratos.



Distribución Continua



En el presente estudio, se lleva a cabo un análisis detallado de los datos extraídos de la base de datos “Matriz Bogotá Turismo”. El enfoque se centra en dos variables específicas: el “estado general del contrato” y su “valor final de contrato”. Estas variables se consideran cruciales para entender el comportamiento de los contratos en el contexto de la matriz.

Normalidad


Histograma

El objetivo principal es evaluar la normalidad de la distribución de estas variables y determinar si siguen ciertos patrones preestablecidos o difieren significativamente de una distribución normal.

En este contexto, se realizará un análisis exhaustivo de la relación entre las dos variables clave, “estado general del contrato” y “valor final del contrato”, con un enfoque específico en la evaluación de la normalidad. Para visualizar la distribución conjunta, se empleará un histograma que muestre la frecuencia de los distintos estados del contrato en relación con sus valores finales.

Este análisis visual no solo nos permitirá identificar patrones, tendencias o posibles relaciones entre el estado general del contrato y su valor final, sino que también nos proporcionará información valiosa sobre la normalidad de la distribución conjunta. La evaluación de la normalidad es crucial para comprender la naturaleza de las variables y puede influir en la elección de las pruebas estadísticas apropiadas para análisis posteriores.


datos1 <- subset(matrizestadistica, `Valor Final Contrato` != 0)

ggplot(datos1, aes(x = EGC, y = `Valor Final Contrato`, fill = EGC)) +
  geom_bar(stat = "identity", position = "dodge") +
  theme_minimal() +
  labs(title = "Histograma de Estado General del Contrato y su Valor Final",
       x = "Estado del Contrato",
       y = "Valor del Contrato") +
  theme(axis.text.x = element_text(size = 6))


La distribución de los datos revela que el conjunto de datos no sigue una distribución normal, y esta observación está vinculada a la categorización del “Estado del Contrato”. La frecuencia de las observaciones y la interacción entre las variables también influyen en la forma del histograma. En particular, se destaca que los contratos en ejecución son los que más impactan la normalidad de la gráfica, ya que representan la mayor cantidad de dinero en comparación con otros tipos de contratos.

En un sentido positivo, se observa que los contratos terminados también tienen una presencia significativa en la gráfica, indicando que esta categoría sigue a los contratos en ejecución en términos de la cantidad de dinero asociado. De esta manera, se puede concluir que los contratos terminados y en ejecución son los que más se destacan en la distribución, siendo los principales contribuyentes a la distribución de fondos representada en el histograma.


Diagrama de cajas y bigotes


#Diagrama
boxplot(datos1$`Valor Final Contrato`, main="Valor Final del Contrato",xlab = 'Valor', col = '#98F5FF')

El diagrama de bigotes nos permite identificar de manera clara la distribución de los datos, revelando patrones de simetría alrededor de la mediana y proporcionando información sobre la dispersión y la presencia de posibles valores atípicos.


Cuantiles


#Diagrama
qqnorm(datos1$`Valor Final Contrato`, main ='Cuantiles', col = '#8B4789')
qqline(datos1$`Valor Final Contrato`, col = '#FF3E96')

La observación muestra que si bien algunos puntos se alinean en cierta medida con la línea roja de referencia, no hay una concordancia completa. Esta falta de alineación perfecta sugiere que la desviación de la normalidad no es clara ni pronunciada. La presencia de puntos que se desvían de la línea indica cierta discrepancia en la distribución de los datos respecto a una distribución normal.


Pruebas de Normalidad


Pruebasnormalidad <- function(x) {
  shapiro <- shapiro.test(x)

  resultados <- data.frame(
    Prueba = c("Shapiro-Wilk"),
    Estadístico = c(shapiro$statistic),
    Valor_p = c( shapiro$p.value)
  )

  print(resultados)
}

Pruebasnormalidad(datos1$`Valor Final Contrato`)
##         Prueba Estadístico      Valor_p
## W Shapiro-Wilk   0.6437542 5.794366e-21


Shapiro-Wilk Test:

Estadístico: 0.6437542 Valor p: 5.794366e-21

El estadístico (0.64) y el valor p indican que los datos no siguen una distribución normal. La hipótesis nula de normalidad se rechaza.


Los resultados consistentemente indican que la variable Valor Final Contrato no sigue una distribución normal. Los valores extremadamente bajos de los estadísticos y los valores_p cercanos a cero proporcionan fuerte evidencia en contra de la hipótesis de normalidad.


Ajustes Bondad

# Columna a analizar 'Estado General del Contrato'
Valor_Contrato <-datos1$`Valor Final Contrato`

# Prueba de Kolmogorov-Smirnov
resultado_ks <- ks.test(Valor_Contrato, "pnorm", mean = mean(Valor_Contrato), sd = sd(Valor_Contrato))
## Warning in ks.test.default(Valor_Contrato, "pnorm", mean =
## mean(Valor_Contrato), : ties should not be present for the Kolmogorov-Smirnov
## test
print(resultado_ks)
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  Valor_Contrato
## D = 0.26439, p-value = 1.767e-13
## alternative hypothesis: two-sided
hist(Valor_Contrato, main='Histograma', xlab='Valor Contrato', ylab='Frecuencia', breaks = 3)


Se realiza un proceso de selección de modelos estadísticos aplicado a la variable ‘Valor Final Contrato’. Este análisis implica la evaluación de diversos modelos estadísticos con el objetivo de determinar cuál de ellos se adapta de manera óptima a los datos observados.



model_select(datos1$`Valor Final Contrato`)
## Maximum likelihood estimates for the Inverse Gaussian model 
##      mean      shape  
## 2.578e+09  6.239e+08


Este proceso de selección de modelos sugiere la utilización del modelo Inverse Gaussian para modelar la variable ‘Valor Final Contrato’. La elección de este modelo específico implica que, tras evaluar diferentes opciones, el modelo Inverse Gaussian ha demostrado ser el más adecuado para describir la estructura y la variabilidad de los datos observados. Sin embargo, es importante destacar que durante la implementación de este método, el programa solicitó ciertas especificaciones que no estaban dentro de nuestro conocimiento previo. Ante esta situación, optamos por explorar otro modelo llamado Weibull, el cual también demostró un ajuste significativo a la curva de nuestros datos, proporcionando una alternativa viable en el proceso de modelado estadístico.


min_aporte <- min(datos1$`Valor Final Contrato`)
max_aporte <- max(datos1$`Valor Final Contrato`)

# Ajustar una Distribución
Distribucion_Weibull <- fitdist(datos1$`Valor Final Contrato`, 'weibull')

summary(Distribucion_Weibull)
## Fitting of the distribution ' weibull ' by maximum likelihood 
## Parameters : 
##           estimate Std. Error
## shape 7.669122e-01         NA
## scale 2.239797e+09         NA
## Loglikelihood:  -4857.023   AIC:  9718.046   BIC:  9724.787 
## Correlation matrix:
## [1] NA
plot(Distribucion_Weibull)


Gráfico de cuantiles con modelo Weibull


# Distribución Weibull
Weibull <- fitdistrplus::fitdist(datos1$`Valor Final Contrato`, 'weibull')

# Gráfico de cuantiles con la distribución Weibull
fitdistrplus::qqcomp(list(Weibull), legendtext = "Weibull")

Medidas Descriptivas


# Distribución Weibull a los datos
ajuste_weibull <- fitdistrplus::fitdist(datos1$`Valor Final Contrato`, "weibull")

# parámetros
parametros_weibull <- ajuste_weibull$estimate

# Media y varianza
media_weibull <- parametros_weibull[2] * gamma(1 + 1/parametros_weibull[1])
varianza_weibull <- parametros_weibull[2]^2 * (gamma(1 + 2/parametros_weibull[1]) - (gamma(1 + 1/parametros_weibull[1]))^2)

cat("Media de la distribución Weibull:", media_weibull, "\n")
## Media de la distribución Weibull: 2619378888
cat("Varianza de la distribución Weibull:", varianza_weibull, "\n")
## Varianza de la distribución Weibull: 1.195341e+19


Media de la Distribución Weibull:

La media indica el nivel típico o esperado del “Valor Final Contrato” según la distribución Weibull. En el contexto de contratos, la media sugiere un punto central alrededor del cual se agrupan los valores de “Valor Final Contrato”. Es esencial tener en cuenta este valor para comprender la magnitud promedio de los contratos.

Varianza de la Distribución Weibull:

La varianza mide la dispersión de los valores de “Valor Final Contrato” alrededor de la media. La magnitud significativa de esta varianza indica una amplia variabilidad en los “Valores Finales de Contrato”. Los valores dispersos sugieren que hay una considerable diversidad en los montos finales de los contratos.

Análisis General:

La presencia de una varianza tan grande sugiere que hay contratos con valores finales que varían considerablemente en comparación con la media. Puede haber contratos con valores extremadamente altos que contribuyan significativamente a la variabilidad total.


Funciones y Gráficos


FUNCIONES Y GRÁFICOS DE F.D.P y F.D.A.


\[f(x)= \left\{ \begin{array}{lcc} (2.239797e+09)(7.669122e-01) x^{(7.669122e-01)-1}e^{-2.239797e+09 x^{7.669122e-01}} & & x>0 \\ 0 & & \text{En otro caso} \end{array} \right. \]

# Rango de valores
x <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)

# Calcular la función de densidad de probabilidad (FDP) Weibull
fdp_weibull <- dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
head(fdp_weibull, 10)
##  [1]          Inf 5.156204e-10 3.932803e-10 3.248439e-10 2.778269e-10
##  [6] 2.424530e-10 2.144326e-10 1.914879e-10 1.722591e-10 1.558660e-10
fdp_weibull[!is.finite(fdp_weibull)] <- 0

# Calcular la función de distribución acumulativa (FDA) Weibull
fda_weibull <- pweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
head(fda_weibull, 10)
##  [1] 0.0000000 0.1442343 0.2328268 0.3035167 0.3630110 0.4144368 0.4596276
##  [8] 0.4997947 0.5357988 0.5682837
# Gráfico de la FDP y FDA Weibull
plot(x, fdp_weibull, type = "l", col = "springgreen3", lwd = 2, main = "FDP y FDA Weibull", xlab = "Valor Final Contrato", ylab = "Densidad de Probabilidad", ylim = c(0, max(fdp_weibull, na.rm = TRUE)))
lines(x, fda_weibull, type = "l", col = "#CD4F39", lwd = 2)

legend("topright", legend = c("FDP", "FDA"), col = c("springgreen3", "#CD4F39"), lty = 1, lwd = 2)


Consideraciones:

  • La FDP Weibull muestra cómo se distribuyen los valores del “Valor Final Contrato” alrededor de la media estimada para la distribución Weibull.

  • La (FDA) Weibull indica la probabilidad acumulativa de que un contrato tenga un valor menor o igual a cierto monto.

  • La pendiente de la curva proporciona información sobre la tasa de acumulación de probabilidad


Interpretación:

La alta variabilidad, indicada por la varianza previamente calculada, se reflejará en la forma de la FDP y en la tasa de acumulación de probabilidad en la FDA.

Valores extremos o colas largas en la FDP pueden indicar la presencia de contratos con montos significativamente más altos o bajos que la media.


Preguntas planteadas


Probabilidades Específicas:

Dada la distribución Weibull ajustada,¿cuál es la probabilidad de que esté entre dos valores dados?

# Parámetros ajustados
parametros_weibull <- Distribucion_Weibull$estimate

valor_inferior <- 89594303 
valor_superior <- 484402370 
  

# Probabilidad acumulada C/U
prob_inferior <- pweibull(valor_inferior, shape = parametros_weibull[1], scale = parametros_weibull[2])
prob_superior <- pweibull(valor_superior, shape = parametros_weibull[1], scale = parametros_weibull[2])

# Probabilidad Final
prob_entre_valores <- prob_superior - prob_inferior


cat("Probabilidad de que el valor final de un contrato esté entre", valor_inferior, "y", valor_superior, "es:", prob_entre_valores, "\n")
## Probabilidad de que el valor final de un contrato esté entre 89594303 y 484402370 es: 0.1846245
# Parámetros ajustados de la distribución Weibull
parametros_weibull <- Distribucion_Weibull$estimate

# Función de densidad de probabilidad (FDP) de la distribución Weibull
fdp_weibull <- function(x) dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)

# Densidad de probabilidad para cada valor
densidad_probabilidad <- fdp_weibull(valores_contrato)

# Gráfico de la función de densidad de probabilidad (FDP)
plot(valores_contrato, densidad_probabilidad, type = "l", lwd = 2, col = "blue",
     main = "probabilidad entre dos valores",
     xlab = "Valor Final del Contrato", ylab = "Densidad de Probabilidad")

# Límites
limite_inferior <- 89594303 
limite_superior <- 484402370 

# Líneas punteadas para los límites
abline(v = c(limite_inferior, limite_superior), col = c("red", "green"), lty = 2)

# Área sombreada entre los límites
x_area <- c(limite_inferior, valores_contrato[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], limite_superior)
y_area <- c(0, densidad_probabilidad[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], 0)
polygon(x_area, y_area, col = "lightgray", rgb(0.8, 0.8, 0.8, 0.5), border = NA)

# Leyenda
legend("topright", legend = c("FDP Weibull", "Límite Inferior", "Límite Superior"), 
       col = c("blue", "red", "green", rgb(0.8, 0.8, 0.8, 0.5)), lty = c(1, 2, 2, 0), cex = 0.8)

Comparación de Contratos:

Sea el experimiento de seleccionar dos contratos al azar y comparar sus Valores Finales de Contrato utilizando la función de distribución acumulativa. ¿Cuál tiene una probabilidad acumulativa más alta?

parametros_weibull <- ajuste_weibull$estimate

contrato_1 <- 166905670 
contrato_2 <- 76956615 

# Probabilidades acumulativas C/U
prob_acum_contrato_1 <- pweibull(contrato_1, shape = parametros_weibull[1], scale = parametros_weibull[2])
prob_acum_contrato_2 <- pweibull(contrato_2, shape = parametros_weibull[1], scale = parametros_weibull[2])

# Comparación
if (prob_acum_contrato_1 > prob_acum_contrato_2) {
  cat("El contrato 1 tiene una probabilidad acumulativa más alta.\n")
} else if (prob_acum_contrato_1 < prob_acum_contrato_2) {
  cat("El contrato 2 tiene una probabilidad acumulativa más alta.\n")
} else {
  cat("Ambos contratos tienen la misma probabilidad acumulativa.\n")
}
## El contrato 1 tiene una probabilidad acumulativa más alta.


parametros_weibull <- Distribucion_Weibull$estimate

# Función de distribución acumulativa (FDA) de la distribución Weibull
fda_weibull <- function(x) pweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)

# Probabilidad acumulativa para cada valor
prob_acumulativa <- fda_weibull(valores_contrato)

# Gráfico función de distribución acumulativa (FDA)
plot(valores_contrato, prob_acumulativa, type = "l", lwd = 2, col = "blue",
     main = "Probabilidad acumulativa mayor",
     xlab = "Valor Final del Contrato", ylab = "Probabilidad Acumulativa")

contrato_1 <- 166905670 
contrato_2 <- 76956615 
abline(v = contrato_1, col = "red", lty = 2)
abline(v = contrato_2, col = "green", lty = 2)
legend("bottomright", legend = c("FDA Weibull", "Contrato 1", "Contrato 2"), 
       col = c("blue", "red", "green"), lty = c(1, 2, 2), cex = 0.8)

Estimaciones:

Dada la función de distribución acumulativa, ¿cómo se estimaría el valor medio esperado de los Valores Finales de Contrato?

# Parámetros de la distribución Weibull ajustada
forma <- Weibull$estimate[1]
escala <- Weibull$estimate[2]

# Media de la distribución Weibull
media_weibull <- escala * gamma(1 + 1 / forma)

print(paste("La media esperada de los Valores Finales de Contrato según la distribución Weibull ajustada es:", round(media_weibull, 2)))
## [1] "La media esperada de los Valores Finales de Contrato según la distribución Weibull ajustada es: 2619378888.11"


parametros_weibull <- Distribucion_Weibull$estimate

# Función de densidad de probabilidad (FDP) de la distribución Weibull
fdp_weibull <- function(x) dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)

# Densidad de probabilidad para cada valor
densidad_probabilidad <- fdp_weibull(valores_contrato)

# Gráfico de la función de densidad de probabilidad (FDP)
plot(valores_contrato, densidad_probabilidad, type = "l", lwd = 2, col = "blue",
     main = "Valor medio esperado",
     xlab = "Valor Final del Contrato", ylab = "Densidad de Probabilidad")

media <- 2619378888.11
abline(v = media, col = "purple", lty = 2)
text(x = media, y = max(densidad_probabilidad) * 0.8,
     labels = paste("Media:", round(media, 2)), col = "purple")

legend("topright", legend = c("FDP Weibull", "Media"), 
       col = c("blue", "purple"), lty = c(1, 2), cex = 0.8)


¿Qué rango de valores abarca el 90% de los contratos?

# Cuantiles para el 5% y 95%
cuantil_5 <- qweibull(0.05, shape = ajuste_weibull$estimate[1], scale = ajuste_weibull$estimate[2])
cuantil_95 <- qweibull(0.95, shape = ajuste_weibull$estimate[1], scale = ajuste_weibull$estimate[2])

cat("El rango de valores que abarca el 90% de los contratos es:", round(cuantil_5, 2), "a", round(cuantil_95, 2), "\n")
## El rango de valores que abarca el 90% de los contratos es: 46581949 a 9365594483


# Parámetros ajustados de la distribución Weibull
parametros_weibull <- Distribucion_Weibull$estimate

# Función de densidad de probabilidad (FDP) de la distribución Weibull
fdp_weibull <- function(x) dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)

# Densidad de probabilidad para cada valor
densidad_probabilidad <- fdp_weibull(valores_contrato)

# Gráfico de la función de densidad de probabilidad (FDP)
plot(valores_contrato, densidad_probabilidad, type = "l", lwd = 2, col = "blue",
     main = "90% datos muestra",
     xlab = "Valor Final del Contrato", ylab = "Densidad de Probabilidad")

# Límites
limite_inferior <- 46581949
limite_superior <- 9365594483

# Líneas punteadas para los límites
abline(v = c(limite_inferior, limite_superior), col = c("red", "green"), lty = 2)

# Área sombreada entre los límites
x_area <- c(limite_inferior, valores_contrato[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], limite_superior)
y_area <- c(0, densidad_probabilidad[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], 0)
polygon(x_area, y_area, col = "lightgray", rgb(0.8, 0.8, 0.8, 0.5), border = NA)

# Leyenda
legend("topright", legend = c("FDP Weibull", "Límite Inferior", "Límite Superior"), 
       col = c("blue", "red", "green", rgb(0.8, 0.8, 0.8, 0.5)), lty = c(1, 2, 2, 0), cex = 0.8)


Probabilidades de Eventos Futuros

¿Cuál es la probabilidad de que un contrato tenga un valor superior superior a la media de la distribución?

# Distribución Weibull ajustada
forma <- Weibull$estimate[1]
escala <- Weibull$estimate[2]

# Media de la distribución Weibull
media_weibull <- escala * gamma(1 + 1 / forma)

# Probabilidad 
prob_superior_media <- 1 - pweibull(media_weibull, shape = forma, scale = escala)

print(paste("La probabilidad de que un contrato tenga un valor superior a la media es:", round(prob_superior_media, 4)))
## [1] "La probabilidad de que un contrato tenga un valor superior a la media es: 0.3238"


# Parámetros ajustados de la distribución Weibull
parametros_weibull <- Distribucion_Weibull$estimate

# Función de densidad de probabilidad (FDP) de la distribución Weibull
fdp_weibull <- function(x) dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)

# Densidad de probabilidad para cada valor
densidad_probabilidad <- fdp_weibull(valores_contrato)

# Gráfico de la función de densidad de probabilidad (FDP)
plot(valores_contrato, densidad_probabilidad, type = "l", lwd = 2, col = "blue",
     main = "Datos mayores a la media",
     xlab = "Valor Final del Contrato", ylab = "Densidad de Probabilidad")

# Límites
limite_inferior <- 2619378888.11
limite_superior <- 19627175114


# Líneas punteadas para los límites
abline(v = c(limite_inferior, limite_superior), col = c("red", "green"), lty = 2)

# Área sombreada entre los límites
x_area <- c(limite_inferior, valores_contrato[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], limite_superior)
y_area <- c(0, densidad_probabilidad[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], 0)
polygon(x_area, y_area, col = "lightgray", rgb(0.8, 0.8, 0.8, 0.5), border = NA)

# Leyenda
legend("topright", legend = c("FDP Weibull", "Límite Inferior", "Límite Superior"), 
       col = c("blue", "red", "green", rgb(0.8, 0.8, 0.8, 0.5)), lty = c(1, 2, 2, 0), cex = 0.8)



Análisis y Conclusiones


ANÁLISIS:El análisis detallado de la base de datos “Matriz Bogotá Turismo” revela una visión significativa del estado general de los contratos y su valor final en el contexto turístico de la ciudad. La primera gráfica refleja mayoritariamente contratos en ejecución en todas las localidades, sugiriendo un sesgo positivo en la distribución de datos. Sin embargo, esta interpretación inicial podría ser desviada, ya que muchos proyectos ni siquiera han comenzado o, mucho menos, finalizado.

Se observa que la falta de distribución en intervalos y la concentración en la fase de ejecución pueden deberse a diversos factores, como malos contratistas o la falta de avance real en las obras. Los histogramas indican que las localidades suroccidentales enfrentan contratos en incumplimiento o suspendidos, mientras que aquellas hacia el norte, oriente o suroriente tienden a tener proyectos en ejecución o terminados.

El análisis realizado sobre los Valores Finales de Contrato utilizando la distribución Weibull proporciona información valiosa sobre la variabilidad y la probabilidad asociada con esta variable. La elección de la distribución Weibull se basó en pruebas estadísticas y el ajuste visual de los datos. Se encontró que esta distribución se ajusta adecuadamente a la variabilidad de los Valores Finales de Contrato.

Las probabilidades acumulativas proporcionan información sobre la probabilidad de que un contrato tenga un valor final menor o igual a un cierto umbral. Estas probabilidades son valiosas para la toma de decisiones y la evaluación de riesgos.

Al comparar las probabilidades acumulativas de dos contratos seleccionados al azar, se puede determinar cuál tiene una probabilidad más alta de tener un Valor Final de Contrato inferior. Esto es útil para tomar decisiones informadas sobre la gestión de contratos.

La aplicación de estos conceptos en situaciones prácticas puede ayudar en la planificación y toma de decisiones relacionadas con contratos. Se pueden utilizar para evaluar la probabilidad de que los contratos alcancen ciertos umbrales de valor o para estimar costos esperados.


CONCLUSIÓN:La evaluación de los contratos en Bogotá presenta desafíos significativos derivados de la complejidad y la heterogeneidad de los datos. Se subraya la importancia de adoptar enfoques más avanzados y la necesidad de explorar modelos más sofisticados con el fin de comprender plenamente la dinámica de los contratos en el sector turístico de la ciudad. Este proyecto proporciona una sólida base para futuras investigaciones y estrategias en la gestión de contratos dentro del ámbito turístico, contribuyendo así al desarrollo de prácticas más eficientes en datos en el manejo de contratos en esta área específica.



Preguntas Generales


¿Cuál es la proporción de contratos suspendidos en comparación con los que han continuado o terminado, y cómo afecta esto a la distribución de valores finales?

La proporción de los contratos suspendidos con respecto a los que estan en ejecución o ya terminados es muy bajita, puede ser por eso mismo que al presentarse varios problemas dentro de los contratos u obras y no suspender, si no seguir inyectando capital es por lo que aparece ese sesgo positivo hacia el estado de ejecución, que puede significar un sobre costo.


¿Cómo varía la distribución de valores finales entre contratos en diferentes estados (liquidado, incumplimiento, por iniciar, suspendido, terminado)?

Tenemos que la mayor cantidad de dinero según el valor final del contrato están en las categorías donde más se demanda dinero: al momento de iniciar el contrato por todos los costos preliminares, cuando de estan ejecutando por todas las posibles demoras, abandonos y demás factores que pueden ocurrir en una obra, y al finalizar el contrato, cuanto falta ultimar detalles y dar liquidez a este.


¿Cómo influye la ubicación geográfica en la variabilidad de los valores finales de los contratos?

La ubicación en donde se estan realizando los contratos varía bastante entre las localidades, ya que las localidades suroccidentales enfrentan contratos en incumplimiento o suspendidos, mientras que aquellas hacia el norte, oriente o suroriente tienden a tener proyectos en ejecución o terminados.


¿Cuál es el impacto potencial de sesgo positivo en la interpretación de la distribución de datos para contratos en ejecución?

El sesgo positivo en la distribución de datos para contratos en ejecución sugiere una posible sobreestimación de los valores finales, que se pueden deber a varios factores de sobrecostos en la ejecución de estos contratos


¿Cómo afecta la inclusión de contratos que ni siquiera han comenzado al análisis de la distribución de valores finales en contratos en ejecución?

La inclusión de contratos que no han comenzado puede introducir sesgos en la distribución de valores finales para contratos en ejecución, ya que la falta de datos sobre proyectos no iniciados puede distorsionar la interpretación general y conducir a conclusiones menos precisas sobre el rendimiento de estos contratos en particular


