Universidad Distrital Francisco José De Caldas
Probabilidad y estadística
Proyecto: Parte II
Laura Daniela Urrego Díaz
Juan Esteban Perez
Jimenez
Docente: Sindy Tatiana Cordoba
Cordoba
Colombia es reconocido como uno de los países que atrae a sus tierras
infinidad de visitantes provenientes de todas partes del mundo debido a
que se sienten atraídos por el encanto de la gente, las historias, la
cautivadora belleza de los paisajes y las diversas actividades que
permiten ser realizadas al ser un país tan diverso y multicultural.
La fascinación por conocer este país trae consigo muchos viajeros
quienes curiosos de todo lo que Colombia tiene por ofrecer eligen a este
como un principal destino turístico a conocer comenzando con la capital
del país, la cual cuenta con una ubicación privilegiada en el centro del
territorio colombiano en el altiplano cundiboyacense, ubicado en la
cordillera oriental de los Andes conocida oficialmente como Bogotá
Distrito Capital.
Bogotá tiene una longitud de 33 km de sur a norte y 16 km de oriente
a occidente, está constituida por 20 localidades donde cada una tiene su
propio alcalde menor y junta administrativa local encargados de la
supervisión, ejecución y debido funcionamiento de los procesos internos
de cada localidad; esta ciudad es el epicentro artístico, cultural,
deportivo y turístico del país debido a que ofrece una gran variedad de
gastronomía y arquitectura especializada con fines turísticos tales como
museos, parques, teatros, casas culturales, centros comerciales y otros
locaciones que acogen al viajero a vivir experiencias únicas dentro de
la ciudad capital con una mezcla perfecta entre lo antiguo y lo moderno.
La finalidad de este proyecto es tomar como objeto de estudio un enfoque turístico de la ciudad de Bogotá y con ayuda de diferentes áreas del conocimiento como la estadística, la probabilidad y otras ciencias exactas realizar un análisis acerca de la inversión que se destina para estos intereses y la distribución por localidades de los recursos con ese fin, también se reconocerán otros factores que tienen relación tanto indirecta como directamente para así lograr visualizar como el turismo en la capital de la ciudad está presente en el desarrollo integral del país y brindando nuevas experiencias llamativas para los visitantes como también nuevas oportunidades de empleo, mejora de infraestructura y mejoramiento de la calidad de vida para los ciudadanos.
El problema objetivo tratado a lo largo del desarrollo del proyecto es:
¿La inversión monetaria destinada al turismo en la ciudad de Bogotá se ve reflejada en la realidad para el gozo de los ciudadanos y visitantes?
Se realizará el estudio de los recursos que son destinados para la mejora y construcción de diferentes locaciones que promueven el turismo en la ciudad de Bogotá tales como casas de cultura, teatros, ciclo infraestructura, malla vial, espacios públicos y parques de la ciudad de Bogotá en las diferentes localidades, también se tendrá en cuenta el tipo de intervención que se esté realizando y el estado de esta para así poder visualizar cuantitativamente la cantidad de obras que realmente se han realizado y están disponibles para su uso colectivo como también la cantidad de obras están en su fase inicial, con incumplimientos o en suspensión.
¿Qué se ha realizado hasta el momento?
El centro de gobierno local de Bogotá tiene a disposición de los ciudadanos información referente a los diferentes contratos existentes y obras ya que esta entidad es la encargada de llevar los seguimientos a la inversión de las diferentes infraestructuras y acciones de los espacios públicos de cada localidad, en esta información se puede evidenciar el mapa, las estadísticas de la ciudad, el estado de los procesos contractuales y el resumen de infraestructura local.
Lamentablemente este tipo de procesos la mayoría de veces no se ejecutan de la manera más eficaz y rápida posible de modo que, aunque la información se encuentra y se conocen las futuras intervenciones aun así en la mayoría de casos se evidencia una nula o lenta ejecución de estas.
La posible solución que se plantea es:
Realizar un análisis de la información que brida el centro de gobierno local de Bogotá para así poder identificar la inversión monetaria turística por localidad, adicionalmente identificar la jerarquización de los recursos entre las localidades y los avances que allí presentan para las infraestructuras que aportan al desarrollo turístico de la cuidad para luego poder comparar con visitas de campo si realmente se evidencia la respectiva intervención en la locación tal como lo presenta la información.
Gracias a este estudio se tendría la posibilidad de conocer en la actualidad las intervenciones que se están ejecutando y poder exigir la agilidad de los procesos a entidades como la secretaria de gobierno y la junta administrativa por localidad para que así tanto los ciudadanos como los visitantes de otros lugares puedan seguir disfrutando los espacios turísticos que se encuentran y que se planean construir en un futuro en la ciudad de Bogotá.
¿Cómo contribuye la estadística inferencial en la solución de
esta problemática?
La estadística inferencial tiene un papel importante en cuanto al apoyo de la solución de esta problemática debido a que su aplicación nos permite estudiar diferentes factores que se relacionan tanto directa como indirectamente con el turismo y nos ayuda a comprenderlos para así realizar una toma de decisiones de una manera más fácil, basándonos así en los datos que nos muestran nuestras fuentes de información.
Otro aporte que nos brinda la estadística inferencial es el apoyo en la realización de deducciones para conocer el siguiente paso a seguir y dar la continuidad del estudio, implementando la solución a esta problemática basándonos en gran parte en la información numérica adquirida teniendo una base solida para la argumentación a la atención de la problemática.
Analizar la eficiencia, cumplimiento e inversión de las construcciones como también de los espacios públicos que están destinados al ocio y gozo tanto de los habitantes de la ciudad de Bogotá como los visitantes de otras locaciones.
La recopilación de datos se llevó a cabo por medio de fuentes abiertas, la base de datos seleccionada con la cual se realizó el respectivo análisis de la información para estudiar la problemática de turismo en la ciudad de Bogotá anteriormente planteada fue obtenida de la página web correspondiente al gobierno local de Bogotá, esta información junto con la adición de otros datos obtenidos son la base del estudio en su totalidad.
# Librerias
library(readxl)
library(dplyr)
library(ggplot2)
library(univariateML)
library(nortest)
library(fitdistrplus)
library(MASS)
library(kableExtra)
library(leaflet)
Resumen base de datos
Localidad | Número Contrato | Tipo de Contrato | Valor Final Contrato | EGC | Valor Final Contrato Interventoría | Categoría Inversión | Valor Inversión Por Categoría | Tipo Intervención | Zona | Estado Intervención |
---|---|---|---|---|---|---|---|---|---|---|
USAQUÉN | 286 | Obra | 215000000 | Liquidado | NA | Sede | 215000000 | Mantenimiento | Urbano | Terminado |
CHAPINERO | 289 | Obra | 1141246181 | Terminado | 310200000 | Parque | 1141246181 | Construcción | Urbano | Terminado |
SANTA FE | 273 | Consultoría | 140175457 | Terminado | 56113573 | Acueductos | 140175457 | Estudios y Diseños | Rural | Terminado |
SAN CRISTÓBAL | 507 | Obra | 3263380489 | Terminado | 435269199 | Malla Vial | 2240424925 | Construcción | Urbano | Terminado |
USME | 387 | Obra | 991276364 | Terminado | 89594303 | Parque | 991276364 | Mantenimiento y dotación | Urbano | Terminado |
TUNJUELITO | 222 | Obra | 972278940 | En ejecución | 85819981 | Parque | 972278940 | Construcción | Urbano | En ejecución |
FONTIBÓN | 313 | Obra | 1489318000 | Terminado | 166905670 | Malla Vial | 1407278914 | Conservación | Urbano | Terminado |
SUBA | 541 | Obra | 7367292388 | Terminado | 537295500 | Malla Vial | 6427773659 | Construcción | Urbano | Terminado |
ENGATIVÁ | 297 | Suministro | 1137801000 | Terminado | NA | Malla Vial | 1062526560 | Mantenimiento | Urbano | Terminado |
CIUDAD BOLÍVAR | 572 | Suministro | 2032959607 | Terminado | NA | Malla Vial | 1355306607 | Mantenimiento | Rural | Terminado |
RAFAEL URIBE URIBE | 315 | Obra | 1107812430 | Terminado | 130421589 | Parque | 1107812430 | Construcción | Urbano | Terminado |
BOSA | 508 | Obra | 2121564275 | Terminado | 302637000 | Malla Vial | 2121564275 | Construcción | Urbano | Terminado |
PUENTE ARANDA | 310 | Obra | 1518476451 | Terminado | 243346551 | Espacio Público | 1518476451 | Conservación | Urbano | Terminado |
KENNEDY | 534 | Convenio | 4469130012 | Terminado | NA | Malla Vial | 715564834 | Conservación | Urbano | Terminado |
LOS MÁRTIRES | 196 | Obra | 842821700 | Suspendido | 74440300 | Malla Vial | 390986961 | Mantenimiento | Urbano | En ejecución |
CANDELARIA | 201 | Obra | 343587245 | En ejecución | NA | Espacio Público | 229058163 | Mantenimiento | Urbano | Terminado |
TEUSAQUILLO | 224 | Obra | 1229310415 | Terminado | 149857192 | Malla Vial | 0 | Conservación | Urbano | Terminado |
BARRIOS UNIDOS | 212 | Obra | 1168808480 | Terminado | 158741136 | Sede | 0 | Mantenimiento | Urbano | Terminado |
ANTONIO NARIÑO | 212 | Obra | 1218523298 | Terminado | 183540840 | Malla Vial | 766220620 | Conservación | Urbano | Terminado |
SUMAPAZ | 169 | Suministro | 3654576577 | Terminado | NA | Malla Vial | 871360083 | Conservación | Rural | Terminado |
En el siguiente mapa podemos observar la división de bogotá en sus respectivas localidades las cuales son el objeto de estudio del presente trabajo en el sector de turismo.
Recomendación : Descargar el documento para poder visualizar el mapa
leaflet() %>%
addTiles() %>%
setView(lng = -74.08175, lat = 4.60971, zoom = 12) %>%
addMiniMap(width = 150, height = 150)
Para realizar el estudio se hizo uso de las siguientes variables dentro de la base de datos
## [1] "Localidad" "Número Contrato"
## [3] "Tipo de Contrato" "Valor Final Contrato"
## [5] "EGC" "Valor Final Contrato Interventoría"
## [7] "Categoría Inversión" "Valor Inversión Por Categoría"
## [9] "Tipo Intervención" "Zona"
## [11] "Estado Intervención"
A continuación se muestra el diccionario de datos de las variables para la compresión de las tablas de datos.
CAMPO | TIPO DE DATO | DESCRIPCIÓN |
---|---|---|
Localidad | Carácter | Localidad donde se encuentra la intervención |
No. de contrato | Numérico | Número de contrato de la intervención |
Tipo de Contrato | Carácter | Especificación general del tipo de intervención |
Valor Final Contrato | Numérico | Valor monetario del contrato total de la intervención |
Estado General Contrato | Carácter | Estado de avance del contrato de la intervención |
Valor Final Contrato Interventoría | Numérico | Valor monetario del contrato de la interventoria |
Categoría Inversión | Carácter | Tipo de construcción turistica |
Valor Inversión Por Categoría | Numérico | Valor monetario total destinado a cada construcción turistica |
Tipo Intervención | Carácter | Especificación detallada del tipo de intervención |
Zona | Carácter | Especificación de especio rural o urbano |
Estado Intervención | Carácter | Estado de avance de la intervención |
datos<-read_excel("matrizestadistica.xlsx")
datos1<-subset(datos,datos$`Valor Final Contrato`!=0)
VTC<-sum(datos1$`Valor Final Contrato`, na.rm=TRUE)
datos2<-subset(datos,datos$`Valor Final Contrato Interventoría`!=0)
VTCI<-sum(datos1$`Valor Final Contrato Interventoría`, na.rm=TRUE)
datos_limpios <- na.omit(datos[, "EGC", drop = FALSE])
En el proceso de limpieza de datos aplicado a las variables principales, se considera esencial eliminar aquellos valores que sean iguales a cero o que estén marcados como N/A (no disponibles). Esta práctica garantiza que estos valores no interfieran en los cálculos siguientes, especialmente durante la suma de los valores. En el análisis exploratorio de datos, se seguirá evidenciando este enfoque de limpieza, asegurando que los resultados proporcionados continúen excluyendo estos valores nulos o cero. Este procedimiento contribuirá a mantener la integridad y relevancia de los resultados obtenidos en los demás análisis.
Tablas de contingencia
Localidad y Zona
datos$Variable1 <- as.factor(datos$Localidad)
datos$Variable2 <- as.factor(datos$`Zona`)
# Tabla de contingencia
tabla_contingencia <- table(datos$Localidad, datos$`Zona`)
Tabla_proporciones<- prop.table(tabla_contingencia)
Tabla_P<- addmargins(round(tabla_contingencia*100,3))
Form.basic<-c("striped","bordered","hover","condensed","responsive")
kable(Tabla_P,format = "html")%>%
kable_styling(bootstrap_options = Form.basic,full_width = F,font_size = 10)
Rural | Urbano | Sum | |
---|---|---|---|
ANTONIO NARIÑO | 0 | 6600 | 6600 |
BARRIOS UNIDOS | 0 | 12600 | 12600 |
BOSA | 0 | 26000 | 26000 |
CANDELARIA | 0 | 1400 | 1400 |
CHAPINERO | 300 | 1300 | 1600 |
CIUDAD BOLÍVAR | 8500 | 25700 | 34200 |
ENGATIVÁ | 0 | 89700 | 89700 |
FONTIBÓN | 0 | 9100 | 9100 |
KENNEDY | 0 | 40800 | 40800 |
LOS MÁRTIRES | 0 | 6400 | 6400 |
PUENTE ARANDA | 0 | 9400 | 9400 |
RAFAEL URIBE URIBE | 0 | 18200 | 18200 |
SAN CRISTÓBAL | 0 | 17200 | 17200 |
SANTA FE | 6900 | 4900 | 11800 |
SUBA | 200 | 54700 | 54900 |
SUMAPAZ | 10300 | 0 | 10300 |
TEUSAQUILLO | 0 | 4800 | 4800 |
TUNJUELITO | 0 | 2900 | 2900 |
USAQUÉN | 0 | 14900 | 14900 |
USME | 10200 | 28700 | 38900 |
Sum | 36400 | 375300 | 411700 |
Estado Genaral del Contrato y Estado de intervención
datos$Variable1 <- as.factor(datos$'EGC')
datos$Variable2 <- as.factor(datos$ 'Estado Intervención')
# Tabla de contingencia
tabla_contingencia <- table(datos$'EGC', datos$'Estado Intervención')
Tabla_proporciones<- prop.table(tabla_contingencia)
Tabla_P<- addmargins(round(tabla_contingencia*100,3))
Form.basic<-c("striped","bordered","hover","condensed","responsive")
kable(Tabla_P,format = "html")%>%
kable_styling(bootstrap_options = Form.basic,full_width = F,font_size = 10)
En ejecución | Incumplimiento | Por iniciar | Suspendido | Terminado | Sum | |
---|---|---|---|---|---|---|
En ejecución | 3600 | 0 | 2500 | 100 | 1200 | 7400 |
Incumplimiento | 0 | 100 | 0 | 0 | 100 | 200 |
Liquidado | 0 | 0 | 0 | 0 | 1600 | 1600 |
Por iniciar | 100 | 0 | 400 | 0 | 0 | 500 |
Suspendido | 700 | 0 | 200 | 800 | 100 | 1800 |
Terminado | 0 | 0 | 0 | 0 | 9400 | 9400 |
Sum | 4400 | 100 | 3100 | 900 | 12400 | 20900 |
Categoría de Inversión y tipo de contrato
datos$Variable1 <- as.factor(datos$'Categoría Inversión')
datos$Variable2 <- as.factor(datos$'Tipo de Contrato')
# Tabla de contingencia
tabla_contingencia <- table(datos$'Categoría Inversión', datos$'Tipo de Contrato')
Tabla_proporciones<- prop.table(tabla_contingencia)
Tabla_P<- addmargins(round(tabla_contingencia*100,3))
Form.basic<-c("striped","bordered","hover","condensed","responsive")
kable(Tabla_P,format = "html")%>%
kable_styling(bootstrap_options = Form.basic,full_width = F,font_size = 10)
Compra de Maquinaria | Consultoría | Convenio | Mantenimiento de Maquinaria | Obra | Suministro | Sum | |
---|---|---|---|---|---|---|---|
Acueductos | 0 | 600 | 0 | 0 | 1000 | 0 | 1600 |
Bahía | 0 | 0 | 500 | 0 | 500 | 100 | 1100 |
Casa de Cultura | 0 | 100 | 0 | 0 | 900 | 0 | 1000 |
Cicloinfraestructura | 0 | 14800 | 1300 | 0 | 10900 | 100 | 27100 |
Edificaciones | 0 | 0 | 100 | 0 | 300 | 0 | 400 |
Espacio Público | 0 | 26600 | 5800 | 0 | 47700 | 2000 | 82100 |
Malla Vial | 0 | 36700 | 6100 | 0 | 110700 | 65000 | 218500 |
Obra de Bioingeniería | 0 | 0 | 0 | 0 | 800 | 0 | 800 |
Obra de Mitigación | 0 | 0 | 0 | 0 | 900 | 0 | 900 |
Parque | 0 | 0 | 200 | 0 | 29100 | 0 | 29300 |
Puente | 0 | 1000 | 0 | 0 | 6900 | 0 | 7900 |
Salón Comunal | 0 | 1500 | 2000 | 0 | 13600 | 200 | 17300 |
Sede | 0 | 100 | 0 | 0 | 2900 | 200 | 3200 |
Teatro | 0 | 0 | 0 | 0 | 100 | 0 | 100 |
Vallado | 0 | 0 | 0 | 0 | 3600 | 0 | 3600 |
Vivienda Rural | 0 | 0 | 0 | 0 | 15500 | 1300 | 16800 |
Sum | 0 | 81400 | 16000 | 0 | 245400 | 68900 | 411700 |
Relación Variables
Pruebas de Chi cuadrado
Localidad y Zona
datos$Variable1 <- as.factor(datos$'Localidad')
datos$Variable2 <- as.factor(datos$'Zona')
# Test de chi-cuadrado
resultado_chi_cuadrado <- chisq.test(table(datos$'Localidad', datos$'Zona'))
print(resultado_chi_cuadrado)
##
## Pearson's Chi-squared test
##
## data: table(datos$Localidad, datos$Zona)
## X-squared = 1980.3, df = 19, p-value < 2.2e-16
INTERPRETACIÓN: Dado que el valor p es muy pequeño, rechazamos la hipótesis nula de independencia entre las variables “Localidad” y “Tipo de Contrato”. En otras palabras, hay evidencia significativa para sugerir que existe una asociación entre estas dos variables. El valor del estadístico de chi-cuadrado (1980.3) es alto, lo que indica que hay una gran diferencia entre las frecuencias observadas y las frecuencias esperadas bajo la hipótesis nula de independencia.
Estado General Contrato y Estado Inversión
datos$Variable1 <- as.factor(datos$'EGC')
datos$Variable2 <- as.factor(datos$'Estado Intervención')
# Test de chi-cuadrado
resultado_chi_cuadrado <- chisq.test(table(datos$'EGC', datos$'Estado Intervención'))
print(resultado_chi_cuadrado)
##
## Pearson's Chi-squared test
##
## data: table(datos$EGC, datos$"Estado Intervención")
## X-squared = 345.09, df = 20, p-value < 2.2e-16
INTERPRETACIÓN:Asociación Significativa: Dado que el valor p es muy pequeño, rechazamos la hipótesis nula de independencia entre las variables “EGC” y “Estado Intervención”. Esto sugiere que hay una asociación significativa entre estas dos variables. El valor del estadístico de chi-cuadrado (345.09) es alto, indicando que hay una gran diferencia entre las frecuencias observadas y las frecuencias esperadas bajo la hipótesis nula de independencia.
Categoría Inversión y Tipo Contrato
datos$Variable1 <- as.factor(datos$'Categoría Inversión')
datos$Variable2 <- as.factor(datos$'Tipo de Contrato')
# Test de chi-cuadrado
resultado_chi_cuadrado <- chisq.test(table(datos$'Categoría Inversión', datos$'Tipo Intervención'))
print(resultado_chi_cuadrado)
##
## Pearson's Chi-squared test
##
## data: table(datos$"Categoría Inversión", datos$"Tipo Intervención")
## X-squared = 8086.5, df = 165, p-value < 2.2e-16
INTERPRETACIÓN:Dado que el valor p es muy pequeño, rechazamos la hipótesis nula de independencia entre las variables “Categoría Inversión” y “Tipo Intervención”. Esto sugiere que hay una asociación significativa entre estas dos variables.El valor del estadístico de chi-cuadrado (8086.5) es alto, indicando que hay una gran diferencia entre las frecuencias observadas y las frecuencias esperadas bajo la hipótesis nula de independencia
Coeficiente de correlación de Pearson
matrizestadistica <- readxl::read_excel("matrizestadistica.xlsx")
cuanti <- matrizestadistica[, c("Valor Final Contrato", "Valor Final Contrato Interventoría", "Valor Inversión Por Categoría", "Número Contrato")]
pairs(cuanti,col='red',pch = 18,labels = c("V.F.C.","V.F.C. Interventoría","V.I.Categoría","Número Contrato"),
main = "Otras variables numéricas")
correlaciones <- cor(cuanti, use = "complete.obs")
print(correlaciones)
## Valor Final Contrato
## Valor Final Contrato 1.000000000
## Valor Final Contrato Interventoría 0.877241660
## Valor Inversión Por Categoría 0.964075126
## Número Contrato -0.001030257
## Valor Final Contrato Interventoría
## Valor Final Contrato 0.87724166
## Valor Final Contrato Interventoría 1.00000000
## Valor Inversión Por Categoría 0.88888823
## Número Contrato 0.06360459
## Valor Inversión Por Categoría
## Valor Final Contrato 0.96407513
## Valor Final Contrato Interventoría 0.88888823
## Valor Inversión Por Categoría 1.00000000
## Número Contrato -0.01803976
## Número Contrato
## Valor Final Contrato -0.001030257
## Valor Final Contrato Interventoría 0.063604592
## Valor Inversión Por Categoría -0.018039761
## Número Contrato 1.000000000
Valor Final Contrato con otras variables
Valor Final Contrato Interventoría con otras variables
Valor Inversión Por Categoría con Número Contrato
Número Contrato con otras variables
En resumen, las correlaciones positivas indican que hay asociaciones lineales positivas fuertes o moderadas entre algunas de las variables. Las correlaciones cercanas a cero indican una débil o nula relación lineal.
La correlación positiva entre las variables indica que están
relacionadas entre sí de alguna manera. Sin embargo, estas relaciones no
deben interpretarse como una razón para eliminar variables, ya que cada
una de ellas aporta información única al entendimiento de los contratos.
Estas variables pueden estar conectadas, pero su inclusión en el
análisis es fundamental para entender la diversidad de factores que
influyen en el comportamiento de los contratos.
Al eliminar variables altamente correlacionadas, podríamos perder enfoques importantes y limitar nuestra capacidad para analizar los contratos desde diversas perspectivas. Cada variable, aunque pueda compartir cierta información con otras, aporta su propio contexto único, enriqueciendo así la comprensión general de los datos.
Datos atípicos
En el ámbito del análisis de datos en el centro de gobierno local de Bogotá, se da una atención especial a la presencia de datos atípicos, dado que los valores de los contratos tienen una variabilidad significativa. Estos valores atraviesan un proceso de tratamiento que implica la revisión detallada a cargo de analistas de datos. El propósito fundamental de este procedimiento es verificar la autenticidad de estos antes de ser integrados en el cuadro de control. Esta práctica asegura la integridad de la información presentada, permitiendo a los responsables de la toma de decisiones acceder a datos precisos y pertinentes para sus análisis.
Una vez realizada la limpieza de los datos para poder obtener específicamente solo la información que requeremos con fines del estudio, se lleva a la práctica el análisis de todos los datos.
Para el análisis se encuentran las medidas de tendencia central de la base de datos.
Variable “valor final contrato interventoria”
mediaVFCI<-mean(datos2$`Valor Final Contrato Interventoría`);mediaVFCI
## [1] 354533475
medianaVFCI<-median(datos2$`Valor Final Contrato Interventoría`);medianaVFCI
## [1] 165157066
VarianzaVFCI<-var(datos2$`Valor Final Contrato Interventoría`);VarianzaVFCI
## [1] 2.958739e+17
Realizando el estudio del valor final de contrato de interventoria observamos que en promedio el valor de los contratos realizados es de $354.533.475 y el contrato que se encuentra en la posición central de toda la muestra tiene un valor de $165.157.066. En el contexto de la varianza, este resultado indica que hay una gran dispersión en los valores del conjunto de datos.
Valor total de contratos interventoria
VTCI<-sum(datos1$`Valor Final Contrato Interventoría`, na.rm=TRUE);VTCI
## [1] 50343753510
La suma de contratos total de interventoria en el año 2023 finalmente muestra que en total el estado invirtió $50.343.753.510 en el seguimiento técnico y vigilancia de los contratos de todas las obras de turismo con el objetivo de supervisar la finalización exitosa de estos mismos.
Variable “valor final contrato”
## [1] 2578172416
## [1] 840518181
VarianzaVFC<-var(datos1$`Valor Final Contrato`);VarianzaVFC
## [1] 1.490514e+19
Por otro lado, se identifica que en promedio el valor de los
contratos realizados que son destinados a la inversión del turismo en la
ciudad de Bogotá es de $2.578.172.416 y el contrato que
se encuentra en la posición central de toda la muestra ordenada y tiene
un valor de $840.518.181. De igual manera que el caso
anterior respecto a la varianza, este resultado indica que hay una gran
dispersión en los valores del conjunto de datos.
Valor total de contratos generales
## [1] 554307069433
La suma de contratos en el año 2023 finalmente muestra que en total el estado invirtió $554.307.069.433 en el sector de turismo y estos se dividieron en diferentes tipos de intervenciones, dentro de las cuales destacan las siguientes categorias con sus respectivos valores:
Intervención 1: Mantenimiento
Localidad | Número Contrato | Tipo de Contrato | Valor Final Contrato | EGC | Valor Final Contrato Interventoría | Categoría Inversión | Valor Inversión Por Categoría | Tipo Intervención | Zona | Estado Intervención |
---|---|---|---|---|---|---|---|---|---|---|
USAQUÉN | 286 | Obra | 215000000 | Liquidado | NA | Sede | 215000000 | Mantenimiento | Urbano | Terminado |
USAQUÉN | 308 | Obra | 301880000 | Liquidado | 54275235 | Cicloinfraestructura | 301880000 | Mantenimiento | Urbano | Terminado |
USAQUÉN | 419 | Obra | 170000000 | Liquidado | NA | Sede | 170000000 | Mantenimiento | Urbano | Terminado |
USAQUÉN | 423 | Obra | 130000000 | Liquidado | NA | Sede | 130000000 | Mantenimiento | Urbano | Terminado |
SANTA FE | 276 | Obra | 731671423 | Terminado | 87800568 | Vivienda Rural | 731671423 | Mantenimiento | Rural | Terminado |
Tabla 3:Intervenciones de mantenimiento ciudad de Bogotá
Intervención 2: Conservación
Localidad | Número Contrato | Tipo de Contrato | Valor Final Contrato | EGC | Valor Final Contrato Interventoría | Categoría Inversión | Valor Inversión Por Categoría | Tipo Intervención | Zona | Estado Intervención |
---|---|---|---|---|---|---|---|---|---|---|
USAQUÉN | 292 | Obra | 4050515384 | Liquidado | 484402370 | Malla Vial | 4050515384 | Conservación | Urbano | Terminado |
CHAPINERO | 304 | Obra | 2240632023 | Terminado | 366250994 | Malla Vial | 2240632023 | Conservación | Rural | Terminado |
USME | 428 | Obra | 621521100 | Terminado | 69057900 | Acueductos | 621521100 | Conservación | Rural | Terminado |
USME | 431 | Obra | 570734289 | En ejecución | 77827403 | Obra de Bioingeniería | 570734289 | Conservación | Urbano | En ejecución |
TUNJUELITO | 236 | Obra | 793799960 | Terminado | 81627509 | Espacio Público | 793799960 | Conservación | Urbano | Terminado |
Tabla 4:Intervenciones de conservación ciudad de Bogotá
Intervención 3: Construcción
Localidad | Número Contrato | Tipo de Contrato | Valor Final Contrato | EGC | Valor Final Contrato Interventoría | Categoría Inversión | Valor Inversión Por Categoría | Tipo Intervención | Zona | Estado Intervención |
---|---|---|---|---|---|---|---|---|---|---|
CHAPINERO | 289 | Obra | 1141246181 | Terminado | 310200000 | Parque | 1141246181 | Construcción | Urbano | Terminado |
SAN CRISTÓBAL | 507 | Obra | 3263380489 | Terminado | 435269199 | Malla Vial | 2240424925 | Construcción | Urbano | Terminado |
SAN CRISTÓBAL | 508 | Obra | 300250243 | Terminado | 52385514 | Obra de Mitigación | 300250243 | Construcción | Urbano | Terminado |
TUNJUELITO | 222 | Obra | 972278940 | En ejecución | 85819981 | Parque | 972278940 | Construcción | Urbano | En ejecución |
TUNJUELITO | 230 | Obra | 621338396 | Terminado | 69093780 | Salón Comunal | 621338396 | Construcción | Urbano | Terminado |
Tabla 5:Intervenciones de construcción ciudad de Bogotá
Intervención 4: Adecuación
Localidad | Número Contrato | Tipo de Contrato | Valor Final Contrato | EGC | Valor Final Contrato Interventoría | Categoría Inversión | Valor Inversión Por Categoría | Tipo Intervención | Zona | Estado Intervención |
---|---|---|---|---|---|---|---|---|---|---|
USME | 413 | Suministro | 1260000000 | Terminado | NA | Malla Vial | NA | Adecuación | Rural | Terminado |
USAQUÉN | 561 | Obra | 683263741 | Terminado | 115659514 | Obra de Mitigación | 683263741 | Adecuación | Urbano | Terminado |
KENNEDY | 817 | Obra | 495000000 | Terminado | NA | Casa de Cultura | NA | Adecuación | Urbano | Terminado |
Tabla 6:Intervenciones de adecuación ciudad de Bogotá
Intervención 5: Estudios y diseños
Localidad | Número Contrato | Tipo de Contrato | Valor Final Contrato | EGC | Valor Final Contrato Interventoría | Categoría Inversión | Valor Inversión Por Categoría | Tipo Intervención | Zona | Estado Intervención |
---|---|---|---|---|---|---|---|---|---|---|
SANTA FE | 273 | Consultoría | 140175457 | Terminado | 56113573 | Acueductos | 140175457 | Estudios y Diseños | Rural | Terminado |
USME | 410 | Consultoría | 190241168 | En ejecución | NA | Salón Comunal | 190241168 | Estudios y Diseños | Urbano | En ejecución |
USME | 436 | Consultoría | 1014381324 | Suspendido | 101432132 | Cicloinfraestructura | 101432132 | Estudios y Diseños | Urbano | En ejecución |
BOSA | 514 | Consultoría | 312861777 | En ejecución | NA | Salón Comunal | 312861777 | Estudios y Diseños | Urbano | En ejecución |
KENNEDY | 548 | Consultoría | 169976000 | Suspendido | 56428765 | Salón Comunal | 113570000 | Estudios y Diseños | Urbano | En ejecución |
Tabla 7:Intervenciones de estudios y diseños ciudad de Bogotá
Intervención 6: Limpieza de Vallados
## [1] 1079236046
Intervención 7: Rehabilitación
Localidad | Número Contrato | Tipo de Contrato | Valor Final Contrato | EGC | Valor Final Contrato Interventoría | Categoría Inversión | Valor Inversión Por Categoría | Tipo Intervención | Zona | Estado Intervención |
---|---|---|---|---|---|---|---|---|---|---|
USAQUÉN | 536 | Obra | 610726566 | En ejecución | NA | Puente | 610726566 | Rehabilitación | Urbano | Por iniciar |
TEUSAQUILLO | 232 | Obra | 3157146401 | En ejecución | 343048012 | Malla Vial | NA | Rehabilitación | Urbano | Por iniciar |
ANTONIO NARIÑO | 260 | Obra | 4983460033 | Por iniciar | NA | Malla Vial | NA | Rehabilitación | Urbano | Por iniciar |
Tabla 8:Intervenciones de rehabilitación ciudad de Bogotá
Resumen de valores por categorías de inversión
CATEGORÍA DE INVERSIÓN | VALOR |
---|---|
Mantenimiento | $5.299.151.316 |
Conservación | $12.818.645.335 |
Construcción | $22.376.874.493 |
Adecuación | $683.263.741 |
Estudios y diseños | $9.583.255.998 |
Limpieza de Vallados | $1.079.236.046 |
Rehabilitación | $610.726.566 |
Tabla 9:Resumen valores de intervención ciudad de Bogotá
Zona de intervención
barplot(table(datos$Zona),main = "Tipo de Zona Intervenida", xlab="Zona" , ylab="Conteo", col=c("blue","red"), ylim = c(0,4000) )
Interpretando el gráfico de barras correspondiente a la variable
“zona”, se puede identificar que en el área de estudio de la ciudad de
Bogotá, el tipo de zona que tiene mayor intervención intervenida es de
tipo urbano.
Intervención localidad en Bogotá
colores1 <- c("#00F5FF", "#5CACEE", "#C6E2FF", "#27408B")
Localidad<-subset(datos,select=Localidad)
pie(table(Localidad),main = "Intervenciones por Localidad", r=1.08, cex=0.5, col = colores1)
En el diagrama de pastel de intervención por localidad podemos identificar que la más intervenida es Engativá, seguido de Kennedy, Suba y Ciudad Bolívar, mientras que las localidades menos intervenidas son Candelaria, Chapinero y Tunjuelito, lo cual nos ayuda a inferir que aunque en estas localidades hay varias zonas turísticas aun así no se evidencian intervenciones para la mejora y expansión de lugares, en especial Candelaria, donde se debería estar invirtiendo en mayor cantidad ya que como se sabe es la localidad donde tanto visitantes como locales eligen más para el gozo de diferentes actividades y tiempos de ocio debido a la cultura que allí presenta la ciudad.
Otra conclusión inferida a partir del grafico es el balance de
turismo, es beneficioso ya que existen algunos puntos clave donde se
disfruta del turismo y se concentra la mayor parte de espacios; al
distribuir como comenzar a construir en otras localidades las personas
tendrán varias opciones para poder realizar turismo en Bogotá y los
habitantes locales no tomarán viajes tan extensos atravesando la ciudad
para poder disfrutar del turismo de la capital del país.
Estado general de los contratos
barplot(table(datos$EGC), main = "Estado Genaral de Contrato", xlab = "Estado del Contrato", ylab = "Conteo", col = c("green", "purple"), las = 2, cex.names = 0.55, ylim = c(0, 100))
Este grafico de barras nos muestra que el mayor porcentaje de los
estados de los contratos están Finalizados o en ejecución y en un
porcentaje reducido están incumplidos, suspendidos o por iniciar.
Estado general de intervención
colores2 <- c("#FFE7BA", "#FF7256", "#FF8247", "#EE8262","#FFA500")
Estado_intervencion<-subset(datos,select=`Estado Intervención`)
pie(table(Estado_intervencion),main = "Estado de Intervencion", r=1.08, col = colores2)
Por medio de distribuciones discretas asociadas a las variables se
realiza una representación de los datos correspondientes a la base de
datos Matriz Bogotá Turismo con el fin de observar su
comportamiento con ayuda de medidas descriptivas como la media, la
varianza y la simetría a partir de experimentos realizar un análisis
hacia las variables en las que está enfocado el proyecto.
El estado general de un contrato se puede clasificar en 6 categorías
las cuales son:
Para poder evidenciar el avance de las inversiones en turismo en la ciudad de Bogotá de manera real y garantizar que los ciudadanos puedan utilizar los espacios o se contemple la idea de que en un futuro cercano se puedan utilizar, el contrato debe estar en dos estados generales:
En ejecución: Debido a que se garantiza que actualmente se encuentran en construcción y la obra no está detenida.
Terminado: Debido a que si el contrato finalizo significa que la obra ya está culminada y el espacio actualmente se encuentra a disposición de todos los ciudadanos.
# Probabilidad contratos terminados
prob_ter <- sum(datos_limpios$EGC == "Terminado", na.rm = TRUE) / nrow(datos_limpios)
print(paste("Probabilidad de que los contratos esten es estado terminado es :",
round(prob_ter, 2)))
## [1] "Probabilidad de que los contratos esten es estado terminado es : 0.45"
La probabilidad de seleccionar los contratos de las localidades que
estén en estado terminado es del 45%.
# Probabilidad contratos terminados
prob_eje <- sum(datos_limpios$EGC == "En ejecución", na.rm = TRUE) / nrow(datos_limpios)
print(paste("Probabilidad de que los contratos esten es estado de ejecución es :",
round(prob_eje, 2)))
## [1] "Probabilidad de que los contratos esten es estado de ejecución es : 0.35"
La probabilidad de seleccionar los contratos de las localidades que
estén en estado de ejecución es del 35%.
# Estados
estados <- c("Liquidado", "Suspendido", "Por iniciar", "Incumplimiento")
probabilidades <- numeric(length(estados))
# Probabilidades para cada estado
for (i in seq_along(estados)) {
prob_estado <- sum(datos_limpios$EGC == estados[i], na.rm = TRUE) / nrow(datos_limpios)
probabilidades[i] <- prob_estado
}
# Sumar las probabilidades
prob_otros <- sum(probabilidades)
# Imprimir la suma de probabilidades con 2 decimales
print(paste("Suma de probabilidades:", sprintf("%.2f", prob_otros)))
## [1] "Suma de probabilidades: 0.20"
La probabilidad de seleccionar los contratos de las localidades que
estén en otros estados es del 20%.
# Suma Probabilidades
prob_total <- prob_eje + prob_ter + prob_otros
print(paste("Probabilidad total:", round(prob_total, 2)))
## [1] "Probabilidad total: 1"
Se comprueba que la probabilidad total de todos los estados generales
de los contratos en las 20 localidades es del 100%
La variable de interés en este caso es el estado general de los contratos, ya que constituye la medida más representativa para evaluar si realmente se está invirtiendo dinero de manera efectiva en el sector turístico de Bogotá. Esta variable nos proporciona una visión integral del progreso y la finalización de los contratos, permitiéndonos identificar de manera clara y significativa la situación de las inversiones destinadas al desarrollo turístico en la ciudad.
Para este planteamiento se utilizan los contratos con estado general de terminado ya que nos garantizan que esas construcciones ya estan disponibles al uso del publico.
Si se sabe que la probabilidad de que un contrato este en estado general terminado es del 45% y se seleccionan una cantidad de 10 contratos al azar:
Se eligen 5 contratos, que representan la mitad del número total de ensayos propuestos, con el fin de obtener una muestra más manejable y significativa para analizar el estado de los contratos de manera más eficiente.
En este caso se emplea la distribución binomial debido a que es
un experimento que admite dos posibles resultados donde 1 de ellos se
considera como un éxito y el otro como un fracaso tal como se realiza en
la distribución de Bernoulli pero se aplica de manera sucesiva teniendo
en cuenta que cada contrato es independiente al anterior.
Función De Distribución General
X∼B(N,P)
Función De Distribución Especifica Del Experimento
X∼B(10,0.45)
prob_exito <- 0.45 # Probabilidad(contrato en estado terminado)
num_contratos <- 10 # Número total de contratos seleccionados al azar
num_exitos_deseados <- 5 # Número de contratos en estado terminado deseados
# Probabilidad
probabilidad <- dbinom(num_exitos_deseados, size = num_contratos, prob = prob_exito)
print(paste("La probabilidad de obtener", num_exitos_deseados, "contratos en estado terminado por cada 10 contratos seleccionados es:", round(probabilidad, 3)))
## [1] "La probabilidad de obtener 5 contratos en estado terminado por cada 10 contratos seleccionados es: 0.234"
La probabilidad de que, al seleccionar 10 contratos, todos estén en
estado terminado es baja, específicamente del 23%. Este resultado
refleja la realidad del proceso de ejecución de contratos en el ámbito
de la construcción y restauración para actividades turísticas. La baja
probabilidad indica que muchos contratos comienzan, pero no todos llegan
a su estado final de terminado. Esto puede deberse a diversos factores,
como demoras en la ejecución, cambios en los planes originales,
problemas de financiamiento o cualquier otro obstáculo que pueda surgir
durante el proceso de construcción. Esta estadística desfavorable
sugiere que, a pesar de la existencia de numerosos contratos para
proyectos turísticos, la transformación de estos contratos en obras
terminadas implica una inversión considerable de tiempo y recursos. La
complejidad y la duración del proceso pueden ser obstáculos importantes
para la efectiva implementación de proyectos en el sector turístico.
Media y varianza con distribución binomial del experimento
correspondiente
# Parámetros
prob_exito <- 0.45
num_contratos <- 10
# Media y varianza
media <- num_contratos * prob_exito
varianza <- num_contratos * prob_exito * (1 - prob_exito)
print(paste("Media:", media))
## [1] "Media: 4.5"
print(paste("Varianza:", varianza))
## [1] "Varianza: 2.475"
Media(4.5):La media de una distribución binomial se calcula con la fórmula μ=n.p, representa el valor promedio de la distribución y, en este contexto, indica el número medio de contratos que se esperaría que estén en estado “terminado” al seleccionar 10 contratos al azar
La media sugiere que, en promedio, se esperaría que alrededor de 4.5 contratos estén en estado “terminado” en cada selección de 10 contratos. Dado que no se puede tener un número fraccional de contratos, esta cifra se interpreta como un valor esperado a largo plazo.
Varianza(2.475):La varianza de una distribución binomial se calcula con la fórmula σ^2=n⋅p⋅(1−p), mide la dispersión de la distribución. En este contexto, indica cuánto varía el número de contratos en estado “terminado” al seleccionar 10 contratos al azar.
La varianza indica que la distribución tiene cierta dispersión alrededor de la media. Cuanto mayor sea la varianza, mayor será la variabilidad en los resultados.
Gráfico que representa las distribución binomial de los contratos
# Números de contratos
num_contratos <- 0:10
# Parámetros
prob_exito <- 0.45
num_ensayos <- 10
# Probabilidades para cada número de contratos
probabilidades <- dbinom(num_contratos, size = num_ensayos, prob = prob_exito)
# Gráfico de barras
barplot(probabilidades, names.arg = num_contratos, col = "#FFB90F",
main = "Distribución Binomial Contratos Terminados", xlab = "Número de Contratos en Estado Terminado",
ylab = "Probabilidad", ylim = c(0, 0.3), xlim = c(-0.5, 10.5), width = 0.7, border = "black", space = 0.2)
# Etiquetas de probabilidad
text(x = num_contratos, y = probabilidades, labels = paste(round(probabilidades, 3) * 100, "%"),
pos = 3, col = "black", cex = 0.6)
# Media
abline(v = mean(num_contratos, prob = prob_exito * num_ensayos), col = "red", lty = 2)
INTERPRETACIÓN: El eje X representa el número de
contratos en estado “terminado”, el eje Y representa la probabilidad de
observar un cierto número de contratos en el mismo estado, en general se
puede observar cómo varía la probabilidad a medida que cambia el número
de contratos en estado “terminado”.
Gráfico que
representa las distribución binomial acumulada de los contratos
# Números de contratos posibles
num_contratos <- 0:10
# Parámetros
prob_exito <- 0.45
num_ensayos <- 10
# Probabilidades acumuladas para cada número de contratos
prob_acumuladas <- pbinom(num_contratos, size = num_ensayos, prob = prob_exito)
# Gráfico de barras
barplot(prob_acumuladas, names.arg = num_contratos, col = "#FF7F24",
main = "Distribución Binomial Acumulada Contratos Terminados",
xlab = "Número de Contratos en Estado Terminado", ylab = "Probabilidad Acumulada",
ylim = c(0, 1.5), xlim = c(-0.5, 10.5), width = 0.7, border = "black", space = 0.2)
text(x = num_contratos, y = prob_acumuladas, labels = paste(round(prob_acumuladas, 3) * 100, "%"),
pos = 3, col = "black", cex = 0.7, offset = 1)
# Media
abline(v = mean(num_contratos, prob = prob_exito * num_ensayos), col = "red", lty = 2)
INTERPRETACIÓN: El gráfico de distribución acumulada
representa la probabilidad acumulada de que el número de contratos en
estado “terminado” sea igual o menor que un valor específico. Cada barra
en el gráfico indica la probabilidad acumulada hasta ese punto.La forma
de la curva refleja cómo la probabilidad acumulada aumenta a medida que
avanzamos a lo largo del eje X. En este caso, dado que la probabilidad
de éxito (contratos en estado “terminado”) es relativamente alta (0.45),
la curva sube más rápidamente.
1. Número esperado de contratos finalizados
# Probabilidad de éxito
prob_exito <- 0.45
# meses
num_ensayos <- 1
# Número esperado de contratos terminados en un mes
num_contratos_esperados <- num_ensayos * prob_exito
print(paste("El número esperado de contratos terminados en un mes es:", num_contratos_esperados))
## [1] "El número esperado de contratos terminados en un mes es: 0.45"
# Números de contratos
num_contratos <- 0:10
# Parámetros
prob_exito <- 0.45
num_ensayos <- 10
# Probabilidades para cada número de contratos
probabilidades <- dbinom(num_contratos, size = num_ensayos, prob = prob_exito)
# Gráfico de barras
barplot(probabilidades, names.arg = num_contratos, col = "#FFB90F",
main = "Contratos en un mes",
xlab = "Número de Contratos en Estado Terminado",
ylab = "Probabilidad", ylim = c(0, 0.3), xlim = c(-0.5, 10.5),
width = 0.7, border = "black", space = 0.2)
# Etiquetas de probabilidad
text(x = num_contratos, y = probabilidades, labels = paste(round(probabilidades, 3) * 100, "%"),
pos = 3, col = "black", cex = 0.6)
abline(v = 0.45, col = "blue", lty = 2)
# Probabilidad de éxito
prob_exito <- 0.45
# meses en un semestre
meses <- 6
# Número esperado de contratos terminados semestralmente
num_contratos_esperados <- meses * prob_exito
print(paste("El número esperado de contratos terminados semestralmente es:", num_contratos_esperados))
## [1] "El número esperado de contratos terminados semestralmente es: 2.7"
# Números de contratos
num_contratos <- 0:10
# Parámetros
prob_exito <- 0.45
num_ensayos <- 10
# Probabilidades para cada número de contratos
probabilidades <- dbinom(num_contratos, size = num_ensayos, prob = prob_exito)
# Gráfico de barras
barplot(probabilidades, names.arg = num_contratos, col = "#FFB90F",
main = "Contratos en seis meses",
xlab = "Número de Contratos en Estado Terminado",
ylab = "Probabilidad", ylim = c(0, 0.3), xlim = c(-0.5, 10.5),
width = 0.7, border = "black", space = 0.2)
# Etiquetas de probabilidad
text(x = num_contratos, y = probabilidades, labels = paste(round(probabilidades, 3) * 100, "%"),
pos = 3, col = "black", cex = 0.6)
abline(v = 2.7, col = "purple", lty = 2)
2. Riesgo
# Parámetros
n_contratos <- 20
prob_exito <- 0.45
# Varianza
varianza <- n_contratos * prob_exito * (1 - prob_exito)
print(paste("La varianza del número de contratos terminados es:", varianza))
## [1] "La varianza del número de contratos terminados es: 4.95"
3. Tamaños de muestra ideales
# Instalar y cargar la librería necesaria
# install.packages("readxl")
library(readxl)
prob_exito <- 0.45
cuantil_deseado <- 0.50
matriz_datos <- read_excel('matrizestadistica.xlsx')
# Calcular el tamaño mínimo de la muestra
tamaño_muestra <- qbinom(cuantil_deseado, size = nrow(matriz_datos), prob = prob_exito, lower.tail = FALSE)
print(paste("El tamaño mínimo de la muestra para asegurar el cuantil deseado de contratos terminados a tiempo es:", tamaño_muestra))
## [1] "El tamaño mínimo de la muestra para asegurar el cuantil deseado de contratos terminados a tiempo es: 1855"
5. Comparaciones
# Parámetros
prob_exito_nuevo <- 0.45
num_contratos_nuevo <- 12
num_terminados_nuevo <- 8
# Probabilidad acumulativa
prob_acumulativa_nueva <- 1 - pbinom(num_terminados_nuevo - 1, size = num_contratos_nuevo, prob = prob_exito_nuevo)
print(paste("La probabilidad de que al menos 8 de 12 contratos estén terminados a tiempo con la probabilidad de éxito es:", round(prob_acumulativa_nueva, 3)))
## [1] "La probabilidad de que al menos 8 de 12 contratos estén terminados a tiempo con la probabilidad de éxito es: 0.112"
num_contratos <- 0:12
prob_exito <- 0.45
num_ensayos <- 12
# Probabilidades
probabilidades <- dbinom(num_contratos, size = num_ensayos, prob = prob_exito)
# Probabilidad acumulativa
prob_acumulativa <- pbinom(7, size = num_ensayos, prob = prob_exito, lower.tail = FALSE)
par(mar = c(5, 5, 4, 2) + 0.1) # Ajustar los márgenes
# Gráfico de barras
barplot(probabilidades, names.arg = num_contratos, col = "#FFB90F",
main = "Contratos terminados a tiempo",
xlab = "Número de Contratos en Estado Terminado",
ylab = "Probabilidad", ylim = c(0, 0.3), xlim = c(-0.5, 12.5),
width = 0.7, border = "black", space = 0.2, las = 2) # Rotar etiquetas del eje x
text(x = num_contratos, y = probabilidades, labels = paste(round(probabilidades, 3) * 100, "%"),
pos = 3, col = "black", cex = 0.6)
abline(v = 7.5, col = "green", lty = 2)
text(x = 11, y = 0.28, labels = paste("Prob. Acumulativa (>=8):", round(prob_acumulativa, 3) * 100, "%"),
col = "blue", pos = 3)
Análisis:Se han explorado varias distribuciones de probabilidad, incluyendo la distribución uniforme, la distribución geométrica, la distribución binomial y la distribución de poisson seleccionando finalmente la binomial la cual representaba de una mejor manera el enfoque del proyecto que queriamos.
Esta elección se justifica por su capacidad para representar de manera efectiva la variabilidad en el número de contratos terminados y proporcionar información valiosa para comprender el avance de las construcciones en la ciudad de Bogotá respecto al turismo. Al utilizarla, se puede obtener una comprensión más profunda de la incertidumbre asociada con el estado de los contratos y, por ende, con el progreso general de las construcciones.
Conclusión:Este proyecto porporcionó una comprensión práctica de diversas distribuciones de probabilidad y cómo aplicarlas en el contexto de la gestión de contratos y proyectos de construcción en Bogotá. Las distribuciones de probabilidad son herramientas valiosas para modelar eventos inciertos y tomar decisiones informadas en la planificación y gestión de proyectos.
Al comprender y aplicar estas distribuciones, podemos hacer predicciones probabilísticas sobre eventos futuros, lo que es esencial para tomar decisiones estratégicas y asignar recursos de manera eficiente. La capacidad de modelar la incertidumbre y evaluar el riesgo asociado proporciona una base sólida para la toma de decisiones informada en el ámbito de la gestión de proyectos y contratos.
En el presente estudio, se lleva a cabo un análisis detallado de los datos extraídos de la base de datos “Matriz Bogotá Turismo”. El enfoque se centra en dos variables específicas: el “estado general del contrato” y su “valor final de contrato”. Estas variables se consideran cruciales para entender el comportamiento de los contratos en el contexto de la matriz.
Histograma
El objetivo principal es evaluar la normalidad de la distribución de estas variables y determinar si siguen ciertos patrones preestablecidos o difieren significativamente de una distribución normal.
En este contexto, se realizará un análisis exhaustivo de la relación entre las dos variables clave, “estado general del contrato” y “valor final del contrato”, con un enfoque específico en la evaluación de la normalidad. Para visualizar la distribución conjunta, se empleará un histograma que muestre la frecuencia de los distintos estados del contrato en relación con sus valores finales.
Este análisis visual no solo nos permitirá identificar patrones, tendencias o posibles relaciones entre el estado general del contrato y su valor final, sino que también nos proporcionará información valiosa sobre la normalidad de la distribución conjunta. La evaluación de la normalidad es crucial para comprender la naturaleza de las variables y puede influir en la elección de las pruebas estadísticas apropiadas para análisis posteriores.datos1 <- subset(matrizestadistica, `Valor Final Contrato` != 0)
ggplot(datos1, aes(x = EGC, y = `Valor Final Contrato`, fill = EGC)) +
geom_bar(stat = "identity", position = "dodge") +
theme_minimal() +
labs(title = "Histograma de Estado General del Contrato y su Valor Final",
x = "Estado del Contrato",
y = "Valor del Contrato") +
theme(axis.text.x = element_text(size = 6))
La distribución de los datos revela que el conjunto de datos no sigue una distribución normal, y esta observación está vinculada a la categorización del “Estado del Contrato”. La frecuencia de las observaciones y la interacción entre las variables también influyen en la forma del histograma. En particular, se destaca que los contratos en ejecución son los que más impactan la normalidad de la gráfica, ya que representan la mayor cantidad de dinero en comparación con otros tipos de contratos.
En un sentido positivo, se observa que los contratos terminados también tienen una presencia significativa en la gráfica, indicando que esta categoría sigue a los contratos en ejecución en términos de la cantidad de dinero asociado. De esta manera, se puede concluir que los contratos terminados y en ejecución son los que más se destacan en la distribución, siendo los principales contribuyentes a la distribución de fondos representada en el histograma.
Diagrama de cajas y bigotes
#Diagrama
boxplot(datos1$`Valor Final Contrato`, main="Valor Final del Contrato",xlab = 'Valor', col = '#98F5FF')
El diagrama de bigotes nos permite identificar de manera clara la distribución de los datos, revelando patrones de simetría alrededor de la mediana y proporcionando información sobre la dispersión y la presencia de posibles valores atípicos.
Cuantiles
#Diagrama
qqnorm(datos1$`Valor Final Contrato`, main ='Cuantiles', col = '#8B4789')
qqline(datos1$`Valor Final Contrato`, col = '#FF3E96')
La observación muestra que si bien algunos puntos se alinean en cierta medida con la línea roja de referencia, no hay una concordancia completa. Esta falta de alineación perfecta sugiere que la desviación de la normalidad no es clara ni pronunciada. La presencia de puntos que se desvían de la línea indica cierta discrepancia en la distribución de los datos respecto a una distribución normal.
Pruebas de Normalidad
Pruebasnormalidad <- function(x) {
shapiro <- shapiro.test(x)
resultados <- data.frame(
Prueba = c("Shapiro-Wilk"),
Estadístico = c(shapiro$statistic),
Valor_p = c( shapiro$p.value)
)
print(resultados)
}
Pruebasnormalidad(datos1$`Valor Final Contrato`)
## Prueba Estadístico Valor_p
## W Shapiro-Wilk 0.6437542 5.794366e-21
Shapiro-Wilk Test:
Estadístico: 0.6437542 Valor p: 5.794366e-21
El estadístico (0.64) y el valor p indican que los datos no siguen una distribución normal. La hipótesis nula de normalidad se rechaza.
Los resultados consistentemente indican que la variable
Valor Final Contrato no sigue una distribución normal.
Los valores extremadamente bajos de los estadísticos y los valores_p
cercanos a cero proporcionan fuerte evidencia en contra de la hipótesis
de normalidad.
# Columna a analizar 'Estado General del Contrato'
Valor_Contrato <-datos1$`Valor Final Contrato`
# Prueba de Kolmogorov-Smirnov
resultado_ks <- ks.test(Valor_Contrato, "pnorm", mean = mean(Valor_Contrato), sd = sd(Valor_Contrato))
## Warning in ks.test.default(Valor_Contrato, "pnorm", mean =
## mean(Valor_Contrato), : ties should not be present for the Kolmogorov-Smirnov
## test
print(resultado_ks)
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: Valor_Contrato
## D = 0.26439, p-value = 1.767e-13
## alternative hypothesis: two-sided
hist(Valor_Contrato, main='Histograma', xlab='Valor Contrato', ylab='Frecuencia', breaks = 3)
Se realiza un proceso de selección de modelos estadísticos aplicado a la variable ‘Valor Final Contrato’. Este análisis implica la evaluación de diversos modelos estadísticos con el objetivo de determinar cuál de ellos se adapta de manera óptima a los datos observados.
model_select(datos1$`Valor Final Contrato`)
## Maximum likelihood estimates for the Inverse Gaussian model
## mean shape
## 2.578e+09 6.239e+08
Este proceso de selección de modelos sugiere la utilización del modelo Inverse Gaussian para modelar la variable ‘Valor Final Contrato’. La elección de este modelo específico implica que, tras evaluar diferentes opciones, el modelo Inverse Gaussian ha demostrado ser el más adecuado para describir la estructura y la variabilidad de los datos observados. Sin embargo, es importante destacar que durante la implementación de este método, el programa solicitó ciertas especificaciones que no estaban dentro de nuestro conocimiento previo. Ante esta situación, optamos por explorar otro modelo llamado Weibull, el cual también demostró un ajuste significativo a la curva de nuestros datos, proporcionando una alternativa viable en el proceso de modelado estadístico.
min_aporte <- min(datos1$`Valor Final Contrato`)
max_aporte <- max(datos1$`Valor Final Contrato`)
# Ajustar una Distribución
Distribucion_Weibull <- fitdist(datos1$`Valor Final Contrato`, 'weibull')
summary(Distribucion_Weibull)
## Fitting of the distribution ' weibull ' by maximum likelihood
## Parameters :
## estimate Std. Error
## shape 7.669122e-01 NA
## scale 2.239797e+09 NA
## Loglikelihood: -4857.023 AIC: 9718.046 BIC: 9724.787
## Correlation matrix:
## [1] NA
plot(Distribucion_Weibull)
Gráfico de cuantiles con modelo Weibull
# Distribución Weibull
Weibull <- fitdistrplus::fitdist(datos1$`Valor Final Contrato`, 'weibull')
# Gráfico de cuantiles con la distribución Weibull
fitdistrplus::qqcomp(list(Weibull), legendtext = "Weibull")
# Distribución Weibull a los datos
ajuste_weibull <- fitdistrplus::fitdist(datos1$`Valor Final Contrato`, "weibull")
# parámetros
parametros_weibull <- ajuste_weibull$estimate
# Media y varianza
media_weibull <- parametros_weibull[2] * gamma(1 + 1/parametros_weibull[1])
varianza_weibull <- parametros_weibull[2]^2 * (gamma(1 + 2/parametros_weibull[1]) - (gamma(1 + 1/parametros_weibull[1]))^2)
cat("Media de la distribución Weibull:", media_weibull, "\n")
## Media de la distribución Weibull: 2619378888
cat("Varianza de la distribución Weibull:", varianza_weibull, "\n")
## Varianza de la distribución Weibull: 1.195341e+19
Media de la Distribución Weibull:
La media indica el nivel típico o esperado del “Valor Final Contrato” según la distribución Weibull. En el contexto de contratos, la media sugiere un punto central alrededor del cual se agrupan los valores de “Valor Final Contrato”. Es esencial tener en cuenta este valor para comprender la magnitud promedio de los contratos.
Varianza de la Distribución Weibull:
La varianza mide la dispersión de los valores de “Valor Final Contrato” alrededor de la media. La magnitud significativa de esta varianza indica una amplia variabilidad en los “Valores Finales de Contrato”. Los valores dispersos sugieren que hay una considerable diversidad en los montos finales de los contratos.
Análisis General:
La presencia de una varianza tan grande sugiere que hay contratos con valores finales que varían considerablemente en comparación con la media. Puede haber contratos con valores extremadamente altos que contribuyan significativamente a la variabilidad total.
FUNCIONES Y GRÁFICOS DE F.D.P y F.D.A.
\[f(x)= \left\{ \begin{array}{lcc}
(2.239797e+09)(7.669122e-01)
x^{(7.669122e-01)-1}e^{-2.239797e+09 x^{7.669122e-01}} & &
x>0 \\
0 & & \text{En otro caso}
\end{array}
\right.
\]
# Rango de valores
x <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)
# Calcular la función de densidad de probabilidad (FDP) Weibull
fdp_weibull <- dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
head(fdp_weibull, 10)
## [1] Inf 5.156204e-10 3.932803e-10 3.248439e-10 2.778269e-10
## [6] 2.424530e-10 2.144326e-10 1.914879e-10 1.722591e-10 1.558660e-10
fdp_weibull[!is.finite(fdp_weibull)] <- 0
# Calcular la función de distribución acumulativa (FDA) Weibull
fda_weibull <- pweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
head(fda_weibull, 10)
## [1] 0.0000000 0.1442343 0.2328268 0.3035167 0.3630110 0.4144368 0.4596276
## [8] 0.4997947 0.5357988 0.5682837
# Gráfico de la FDP y FDA Weibull
plot(x, fdp_weibull, type = "l", col = "springgreen3", lwd = 2, main = "FDP y FDA Weibull", xlab = "Valor Final Contrato", ylab = "Densidad de Probabilidad", ylim = c(0, max(fdp_weibull, na.rm = TRUE)))
lines(x, fda_weibull, type = "l", col = "#CD4F39", lwd = 2)
legend("topright", legend = c("FDP", "FDA"), col = c("springgreen3", "#CD4F39"), lty = 1, lwd = 2)
Consideraciones:
La FDP Weibull muestra cómo se distribuyen los valores del “Valor Final Contrato” alrededor de la media estimada para la distribución Weibull.
La (FDA) Weibull indica la probabilidad acumulativa de que un contrato tenga un valor menor o igual a cierto monto.
La pendiente de la curva proporciona información sobre la tasa de acumulación de probabilidad
Interpretación:
La alta variabilidad, indicada por la varianza previamente calculada, se reflejará en la forma de la FDP y en la tasa de acumulación de probabilidad en la FDA.
Valores extremos o colas largas en la FDP pueden indicar la presencia de contratos con montos significativamente más altos o bajos que la media.
Probabilidades Específicas:
Dada la distribución Weibull ajustada,¿cuál es la probabilidad de que esté entre dos valores dados?
# Parámetros ajustados
parametros_weibull <- Distribucion_Weibull$estimate
valor_inferior <- 89594303
valor_superior <- 484402370
# Probabilidad acumulada C/U
prob_inferior <- pweibull(valor_inferior, shape = parametros_weibull[1], scale = parametros_weibull[2])
prob_superior <- pweibull(valor_superior, shape = parametros_weibull[1], scale = parametros_weibull[2])
# Probabilidad Final
prob_entre_valores <- prob_superior - prob_inferior
cat("Probabilidad de que el valor final de un contrato esté entre", valor_inferior, "y", valor_superior, "es:", prob_entre_valores, "\n")
## Probabilidad de que el valor final de un contrato esté entre 89594303 y 484402370 es: 0.1846245
# Parámetros ajustados de la distribución Weibull
parametros_weibull <- Distribucion_Weibull$estimate
# Función de densidad de probabilidad (FDP) de la distribución Weibull
fdp_weibull <- function(x) dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)
# Densidad de probabilidad para cada valor
densidad_probabilidad <- fdp_weibull(valores_contrato)
# Gráfico de la función de densidad de probabilidad (FDP)
plot(valores_contrato, densidad_probabilidad, type = "l", lwd = 2, col = "blue",
main = "probabilidad entre dos valores",
xlab = "Valor Final del Contrato", ylab = "Densidad de Probabilidad")
# Límites
limite_inferior <- 89594303
limite_superior <- 484402370
# Líneas punteadas para los límites
abline(v = c(limite_inferior, limite_superior), col = c("red", "green"), lty = 2)
# Área sombreada entre los límites
x_area <- c(limite_inferior, valores_contrato[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], limite_superior)
y_area <- c(0, densidad_probabilidad[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], 0)
polygon(x_area, y_area, col = "lightgray", rgb(0.8, 0.8, 0.8, 0.5), border = NA)
# Leyenda
legend("topright", legend = c("FDP Weibull", "Límite Inferior", "Límite Superior"),
col = c("blue", "red", "green", rgb(0.8, 0.8, 0.8, 0.5)), lty = c(1, 2, 2, 0), cex = 0.8)
Comparación de Contratos:
Sea el experimiento de seleccionar dos contratos al azar y comparar sus Valores Finales de Contrato utilizando la función de distribución acumulativa. ¿Cuál tiene una probabilidad acumulativa más alta?
parametros_weibull <- ajuste_weibull$estimate
contrato_1 <- 166905670
contrato_2 <- 76956615
# Probabilidades acumulativas C/U
prob_acum_contrato_1 <- pweibull(contrato_1, shape = parametros_weibull[1], scale = parametros_weibull[2])
prob_acum_contrato_2 <- pweibull(contrato_2, shape = parametros_weibull[1], scale = parametros_weibull[2])
# Comparación
if (prob_acum_contrato_1 > prob_acum_contrato_2) {
cat("El contrato 1 tiene una probabilidad acumulativa más alta.\n")
} else if (prob_acum_contrato_1 < prob_acum_contrato_2) {
cat("El contrato 2 tiene una probabilidad acumulativa más alta.\n")
} else {
cat("Ambos contratos tienen la misma probabilidad acumulativa.\n")
}
## El contrato 1 tiene una probabilidad acumulativa más alta.
parametros_weibull <- Distribucion_Weibull$estimate
# Función de distribución acumulativa (FDA) de la distribución Weibull
fda_weibull <- function(x) pweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)
# Probabilidad acumulativa para cada valor
prob_acumulativa <- fda_weibull(valores_contrato)
# Gráfico función de distribución acumulativa (FDA)
plot(valores_contrato, prob_acumulativa, type = "l", lwd = 2, col = "blue",
main = "Probabilidad acumulativa mayor",
xlab = "Valor Final del Contrato", ylab = "Probabilidad Acumulativa")
contrato_1 <- 166905670
contrato_2 <- 76956615
abline(v = contrato_1, col = "red", lty = 2)
abline(v = contrato_2, col = "green", lty = 2)
legend("bottomright", legend = c("FDA Weibull", "Contrato 1", "Contrato 2"),
col = c("blue", "red", "green"), lty = c(1, 2, 2), cex = 0.8)
Estimaciones:
Dada la función de distribución acumulativa, ¿cómo se estimaría el valor medio esperado de los Valores Finales de Contrato?
# Parámetros de la distribución Weibull ajustada
forma <- Weibull$estimate[1]
escala <- Weibull$estimate[2]
# Media de la distribución Weibull
media_weibull <- escala * gamma(1 + 1 / forma)
print(paste("La media esperada de los Valores Finales de Contrato según la distribución Weibull ajustada es:", round(media_weibull, 2)))
## [1] "La media esperada de los Valores Finales de Contrato según la distribución Weibull ajustada es: 2619378888.11"
parametros_weibull <- Distribucion_Weibull$estimate
# Función de densidad de probabilidad (FDP) de la distribución Weibull
fdp_weibull <- function(x) dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)
# Densidad de probabilidad para cada valor
densidad_probabilidad <- fdp_weibull(valores_contrato)
# Gráfico de la función de densidad de probabilidad (FDP)
plot(valores_contrato, densidad_probabilidad, type = "l", lwd = 2, col = "blue",
main = "Valor medio esperado",
xlab = "Valor Final del Contrato", ylab = "Densidad de Probabilidad")
media <- 2619378888.11
abline(v = media, col = "purple", lty = 2)
text(x = media, y = max(densidad_probabilidad) * 0.8,
labels = paste("Media:", round(media, 2)), col = "purple")
legend("topright", legend = c("FDP Weibull", "Media"),
col = c("blue", "purple"), lty = c(1, 2), cex = 0.8)
¿Qué rango de valores abarca el 90% de los contratos?
# Cuantiles para el 5% y 95%
cuantil_5 <- qweibull(0.05, shape = ajuste_weibull$estimate[1], scale = ajuste_weibull$estimate[2])
cuantil_95 <- qweibull(0.95, shape = ajuste_weibull$estimate[1], scale = ajuste_weibull$estimate[2])
cat("El rango de valores que abarca el 90% de los contratos es:", round(cuantil_5, 2), "a", round(cuantil_95, 2), "\n")
## El rango de valores que abarca el 90% de los contratos es: 46581949 a 9365594483
# Parámetros ajustados de la distribución Weibull
parametros_weibull <- Distribucion_Weibull$estimate
# Función de densidad de probabilidad (FDP) de la distribución Weibull
fdp_weibull <- function(x) dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)
# Densidad de probabilidad para cada valor
densidad_probabilidad <- fdp_weibull(valores_contrato)
# Gráfico de la función de densidad de probabilidad (FDP)
plot(valores_contrato, densidad_probabilidad, type = "l", lwd = 2, col = "blue",
main = "90% datos muestra",
xlab = "Valor Final del Contrato", ylab = "Densidad de Probabilidad")
# Límites
limite_inferior <- 46581949
limite_superior <- 9365594483
# Líneas punteadas para los límites
abline(v = c(limite_inferior, limite_superior), col = c("red", "green"), lty = 2)
# Área sombreada entre los límites
x_area <- c(limite_inferior, valores_contrato[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], limite_superior)
y_area <- c(0, densidad_probabilidad[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], 0)
polygon(x_area, y_area, col = "lightgray", rgb(0.8, 0.8, 0.8, 0.5), border = NA)
# Leyenda
legend("topright", legend = c("FDP Weibull", "Límite Inferior", "Límite Superior"),
col = c("blue", "red", "green", rgb(0.8, 0.8, 0.8, 0.5)), lty = c(1, 2, 2, 0), cex = 0.8)
Probabilidades de Eventos Futuros
¿Cuál es la probabilidad de que un contrato tenga un valor superior superior a la media de la distribución?
# Distribución Weibull ajustada
forma <- Weibull$estimate[1]
escala <- Weibull$estimate[2]
# Media de la distribución Weibull
media_weibull <- escala * gamma(1 + 1 / forma)
# Probabilidad
prob_superior_media <- 1 - pweibull(media_weibull, shape = forma, scale = escala)
print(paste("La probabilidad de que un contrato tenga un valor superior a la media es:", round(prob_superior_media, 4)))
## [1] "La probabilidad de que un contrato tenga un valor superior a la media es: 0.3238"
# Parámetros ajustados de la distribución Weibull
parametros_weibull <- Distribucion_Weibull$estimate
# Función de densidad de probabilidad (FDP) de la distribución Weibull
fdp_weibull <- function(x) dweibull(x, shape = parametros_weibull[1], scale = parametros_weibull[2])
valores_contrato <- seq(0, max(datos1$`Valor Final Contrato`), length.out = 100)
# Densidad de probabilidad para cada valor
densidad_probabilidad <- fdp_weibull(valores_contrato)
# Gráfico de la función de densidad de probabilidad (FDP)
plot(valores_contrato, densidad_probabilidad, type = "l", lwd = 2, col = "blue",
main = "Datos mayores a la media",
xlab = "Valor Final del Contrato", ylab = "Densidad de Probabilidad")
# Límites
limite_inferior <- 2619378888.11
limite_superior <- 19627175114
# Líneas punteadas para los límites
abline(v = c(limite_inferior, limite_superior), col = c("red", "green"), lty = 2)
# Área sombreada entre los límites
x_area <- c(limite_inferior, valores_contrato[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], limite_superior)
y_area <- c(0, densidad_probabilidad[valores_contrato >= limite_inferior & valores_contrato <= limite_superior], 0)
polygon(x_area, y_area, col = "lightgray", rgb(0.8, 0.8, 0.8, 0.5), border = NA)
# Leyenda
legend("topright", legend = c("FDP Weibull", "Límite Inferior", "Límite Superior"),
col = c("blue", "red", "green", rgb(0.8, 0.8, 0.8, 0.5)), lty = c(1, 2, 2, 0), cex = 0.8)
ANÁLISIS:El análisis detallado de la base de datos “Matriz Bogotá Turismo” revela una visión significativa del estado general de los contratos y su valor final en el contexto turístico de la ciudad. La primera gráfica refleja mayoritariamente contratos en ejecución en todas las localidades, sugiriendo un sesgo positivo en la distribución de datos. Sin embargo, esta interpretación inicial podría ser desviada, ya que muchos proyectos ni siquiera han comenzado o, mucho menos, finalizado.
Se observa que la falta de distribución en intervalos y la concentración en la fase de ejecución pueden deberse a diversos factores, como malos contratistas o la falta de avance real en las obras. Los histogramas indican que las localidades suroccidentales enfrentan contratos en incumplimiento o suspendidos, mientras que aquellas hacia el norte, oriente o suroriente tienden a tener proyectos en ejecución o terminados.
El análisis realizado sobre los Valores Finales de Contrato utilizando la distribución Weibull proporciona información valiosa sobre la variabilidad y la probabilidad asociada con esta variable. La elección de la distribución Weibull se basó en pruebas estadísticas y el ajuste visual de los datos. Se encontró que esta distribución se ajusta adecuadamente a la variabilidad de los Valores Finales de Contrato.
Las probabilidades acumulativas proporcionan información sobre la probabilidad de que un contrato tenga un valor final menor o igual a un cierto umbral. Estas probabilidades son valiosas para la toma de decisiones y la evaluación de riesgos.
Al comparar las probabilidades acumulativas de dos contratos seleccionados al azar, se puede determinar cuál tiene una probabilidad más alta de tener un Valor Final de Contrato inferior. Esto es útil para tomar decisiones informadas sobre la gestión de contratos.
La aplicación de estos conceptos en situaciones prácticas puede ayudar en la planificación y toma de decisiones relacionadas con contratos. Se pueden utilizar para evaluar la probabilidad de que los contratos alcancen ciertos umbrales de valor o para estimar costos esperados.
CONCLUSIÓN:La evaluación de los contratos en Bogotá presenta desafíos significativos derivados de la complejidad y la heterogeneidad de los datos. Se subraya la importancia de adoptar enfoques más avanzados y la necesidad de explorar modelos más sofisticados con el fin de comprender plenamente la dinámica de los contratos en el sector turístico de la ciudad. Este proyecto proporciona una sólida base para futuras investigaciones y estrategias en la gestión de contratos dentro del ámbito turístico, contribuyendo así al desarrollo de prácticas más eficientes en datos en el manejo de contratos en esta área específica.
¿Cuál es la proporción de contratos suspendidos en comparación con los que han continuado o terminado, y cómo afecta esto a la distribución de valores finales?
La proporción de los contratos suspendidos con respecto a los que estan en ejecución o ya terminados es muy bajita, puede ser por eso mismo que al presentarse varios problemas dentro de los contratos u obras y no suspender, si no seguir inyectando capital es por lo que aparece ese sesgo positivo hacia el estado de ejecución, que puede significar un sobre costo.
¿Cómo varía la distribución de valores finales entre contratos en diferentes estados (liquidado, incumplimiento, por iniciar, suspendido, terminado)?
Tenemos que la mayor cantidad de dinero según el valor final del contrato están en las categorías donde más se demanda dinero: al momento de iniciar el contrato por todos los costos preliminares, cuando de estan ejecutando por todas las posibles demoras, abandonos y demás factores que pueden ocurrir en una obra, y al finalizar el contrato, cuanto falta ultimar detalles y dar liquidez a este.
¿Cómo influye la ubicación geográfica en la variabilidad de los valores finales de los contratos?
La ubicación en donde se estan realizando los contratos varía bastante entre las localidades, ya que las localidades suroccidentales enfrentan contratos en incumplimiento o suspendidos, mientras que aquellas hacia el norte, oriente o suroriente tienden a tener proyectos en ejecución o terminados.
¿Cuál es el impacto potencial de sesgo positivo en la interpretación de la distribución de datos para contratos en ejecución?
El sesgo positivo en la distribución de datos para contratos en ejecución sugiere una posible sobreestimación de los valores finales, que se pueden deber a varios factores de sobrecostos en la ejecución de estos contratos
¿Cómo afecta la inclusión de contratos que ni siquiera han comenzado al análisis de la distribución de valores finales en contratos en ejecución?
La inclusión de contratos que no han comenzado puede introducir sesgos en la distribución de valores finales para contratos en ejecución, ya que la falta de datos sobre proyectos no iniciados puede distorsionar la interpretación general y conducir a conclusiones menos precisas sobre el rendimiento de estos contratos en particular
Cámara de comercio de Bogotá:
https://www.ccb.org.co/informacion-especializada/observatorio/analisis-economico/turismo
Bogotá.gov.co:
https://bogota.gov.co/mi-ciudad/turismo/bogota-imparable-en-ocupacion-hotelera-y-turismo
Centro Gobierno Local:
https://centrogobiernolocal.gobiernobogota.gov.co/datos-locales/obras-locales/seguimiento-de-inversion-en-infraestructura-2021-2023
Manejo Rstudio
https://r-charts.com/
Manual Rstudio
https://fhernanb.github.io/Manual-de-R/objetos.html#listas