Análisis descriptivo índice CIS
La utilización de la estadística como instrumento garante de confiabilidad, mediante el cual podemos dotar de veracidad a la investigación, facilita el objetivo del presente, la comprensión rigurosa de las principales características de la información recolectada en etapas previas del proyecto Ciudades inteligentes y sostenibles.
El análisis descriptivo, a través de mecanismos como las medidas de posición, de tendencia no central, de dispersión, de forma, representaciones gráficas, matrices de correlación, etc. favorecen a la identificación de comportamientos atípicos, tendencias, relaciones entre variables, entre otros.
Previo a su utilización para el cálculo del índice, es de suma importancia conocer, entender y explicar todas estas propiedades de los datos, ya que con este procedimiento se podrá identificar fallos en etapas anteriores, transformaciones matemáticas necesarias, particularidades específicas de ciertas variables a las cuales se les debe de realizar alguna salvedad y así sucesivamente, para poder cargar de especificidad y de respaldo empírico al índice y su precisión.
Promedio:
Mínimo y Máximo:
Desviación estándar:
Asimetría:
Curtosis:
En promedio se producen 148344.3 toneladas de dióxido de carbono por parte del sector transporte en las ciudades definidas, posee una inclinación a sumir valores mayores, además de estar desconcentrados con respecto al promedio. Se producen per cápita 0.31 toneladas de residuos solidos en las ciudades definidas, en donde existe una cierta simetría entre sus observaciones, o sea, tiende a asumir tanto valores mayores como menores que el promedio, agregando que estos se encuentran muy dispersos con respecto a este. Añadiendo que en promedio en cada una de las ciudades definidas existen 93548 personas con acceso a agua potable, mas como logran denotar los valores mínimos, máximos y la desviación estándar esta cifra es poco representativa, se recomienda ser contrastada con la población de cada una de las ciudades.
Para el caso de la Dimensión Ambiental solo existe una variable que posee una observación atípica, esta variable es “Cantidad per cápita de toneladas de residuos sólidos producidos por la ciudad” en la Ciudad de San José. Para esta ciudad tenemos que a pesar de que es la que posee mayor población, genera una cantidad tan grande de residuos que, ni aun poseyendo el denominador más grande de todos, sigue siendo la que más genera en términos per cápita, y no solo la que más genera, sino que se considera inclusive un atípico.
Se hace importante recalcar el papel de las variables categóricas que se incluyen en esta dimensión. Por un lado, tenemos que la variable “Ejecución por parte del gobierno local de un programa de reciclaje que incluya la clasificación total o parcial de los residuos generados por la ciudad” está presente en cada una de las ciudades definidas, y las variables “Disponibilidad de un plan regulador” y “Dispone de una política o serie de acciones formales contra el cambio climático” se encuentran en todas las ciudades exceptuando a la Ciudad de Heredia y a la Ciudad de Quesada respectivamente.
En promedio el porcentaje de las escuelas y colegios con acceso a internet en las ciudades definidas es del 69%, en donde existe una desconcentración de los elementos con respecto del promedio y no hay indicios de inclinaciones hacia mayores o menores cifras con respecto de este también. Si se realiza un análisis similar para aquellas ciudades dentro y fuera de la Gran Área Metropolitana (GAM) los promedios son 94% y 42% respectivamente, más comprender este tipo de fenómenos es análisis complementario al presente índice. La cantidad de escuelas y colegios por cada cien mil habitantes tiene como promedio en las ciudades definidas la cifra de 94, más claramente posee una desviación estándar amplia por la extensión en Km2 tan diversa que poseen las diferentes ciudades y su población. Los gobiernos locales impulsan en promedio 1 programa de alfabetización para los ciudadanos, en cada una de las ciudades definidas. En promedio, el porcentaje de la población con educación superior en las ciudades definidas es de un 23%, en donde existe una cierta simetría de los elementos con respecto del promedio y una dispersión bastante marcada. Las aprobaciones de cursos en educación técnica/profesional es en promedio del 90%, donde la desviación estándar nos indica que es bastante representativa esta cifra, la cual poseen una simetría importantes y un nivel de dispersión bastante grande con respecto del promedio ambas medidas. Y en última instancia tenemos que el promedio del porcentaje de matriculados en educación regular en edades de 13 a 17 años en la ciudad es del más del 100%, esto es debido a la metodología de cálculo que se utiliza para obtener esta variable, la cual se pueden consultar en las fichas técnicas (enlace final de la presente página). En tanto, cabe resaltar que estas cifras que sobrepasan el 100% para el cálculo del índice se consideran positivas, ya que denotan la preservación de los ciudadanos en el sistema educativo.
Existe solo una variable atípica en esta dimensión, esta variable es “Cantidad de programas de alfabetización digital impulsados por el gobierno local” que se presenta en la ciudad de San José. Se debe de considerar que este tipo de resultados están sujetos a la cantidad de observaciones que se poseen en la muestra, en este caso solo se realiza el análisis de 10 ciudades definidas y poseer tan pocas observaciones puede generar este tipo de interpretaciones, apariciones de atípicos, donde no pareciera haber ninguna anomalía acerca de la cantidad.
Con respecto a la matriz de correlación tenemos que las variables “Porcentaje de escuelas y colegios con acceso a internet en la ciudad” y “Cantidad de escuelas y colegios de la ciudad por cada cien mil habitantes” poseen una relación lineal negativa bastante fuerte, siendo este resultado intuitivo, ya que se esperaría que la probabilidad de que existan más centros educativos de primer y segundo nivel con acceso a internet disminuya conforme haya más de estos centros, ya que los recursos se deberán de repartir entre más escuelas y colegios, en tanto, en la división como crece el denominador (DE.CHv2) sin estrictamente crecer el numerador (DE.CHv1) hace que esta relación sea negativa. También se tiene una relación positiva fuerte entre “Porcentaje de escuelas y colegios con acceso a internet en la ciudad” y “Porcentaje de la población con educación superior en la ciudad” expresando una posible influencia positiva del acceso a tecnologías como el internet en el ingreso y culminación de estudios universitarios. Además, la relación lineal negativa entre “Cantidad de escuelas y colegios de la ciudad por cada cien mil habitantes” y “Porcentaje de la población con educación superior en la ciudad” denota que el acceso a educación de primer y segundo nivel no está generando un efecto positivo como se esperaría, apreciando, por tanto, que el objetivo de acceso a la educación es insuficiente para conseguir que los ciudadanos culminen estudios universitarios.
Tenemos que en promedio se realizan 1221 robos al año en cada una de las ciudades definidas, pero se logra expresar mediante la curtosis que existe una concentración muy alta con respecto al promedio, una notable inclinación hacia asumir valores mayores que este y una desviación estándar bastante grande, combinando estos resultados muy probablemente se esté ante la presencia de una observación atípica en esta variable. La cantidad de cámaras por cada cien mil habitantes en promedio es de 12, para esta variable la concentración es moderada y los elementos tienden a asumir valores menores a este, con una desviación estándar bastante grande, haciendo que el dato promedio sea sujeto de discusión. En promedio se comenten 14 homicidios en las ciudades definidas, concentrándose bastante alrededor de su promedio las observaciones y teniendo una notable inclinación a ser menores que este. La cantidad promedio de policías del gobierno local es de 38 en cada una de las ciudades, más como se mencionó anteriormente, la extensión en km2 y cantidad de habitantes juegan un papel determinante en este tipo de variables, inclusive existen ciudades donde no existen policías del gobierno local, afectando de esta manera el promedio y rescatando de nuevo la cantidad de observaciones con las que se está trabajando.
Se tiene presencia de observaciones atípicas en todas las variables de esta dimensión. En el caso de “Cantidad de robos al año por cada cien mil habitantes en la ciudad” San José descata con 2793 robos por cada 100.000 habitantes. Siendo, relativamente, la ciudad con más propabilidades en las que se puede sufrir de un robo. Tenemos por otro lado que “Cantidad de cámaras de vigilancia instaladas en la ciudad por cada diez mil habitantes” posee a las ciudades de Belén y Heredia muy por encima de las demás ciudades con respecto a este criterio de seguridad, teniendo instaladas 52 y 30 cámaras de vigilancia respectivamente. Aunado a este último criterio de seguridad tenemos que la variable “Cantidad de homicidios al año por cada cien mil habitantes en la ciudad” posee una observación aberrante en la ciudad de Limón, siendo esta la ciudad en donde ocurren más homicidios relativo a la población de la muestra escogida. Por último, se debe de considerar los resultados del análisis descriptivo de la variable “Cantidad de policías del gobierno local por cada cien mil habitantes en la ciudad” ya que existen ciudades que no poseen policías por parte del gobierno local haciendo que por la cantidad de observaciones con las cuales se trabaja, aquellas ciudades que si poseen policías tiendan a caracterizarse como atípicas o no representativas, como si poseer policías sea un resultado contraintuitivo cuando no lo es.
En lo que respecta a la matriz de correlación tenemos una relación lineal positiva fuerte en un caso, que iría en contra de la intuición lógica. Este sería la relación entre “Cantidad de robos al año por cada cien mil habitantes en la ciudad” y “Cantidad de policias del gobierno local por cada cien mil habitantes en la ciudad”, de la cual más bien se esperaría que entre más policias haya en la ciudad los robos disminuirian.
Las ciudades definidas cuentan en promedio con 8.42 kilómetros de ciclovías, mas la desviación estándar es bastante grande, en tanto podemos entender el porqué de la curtosis tan elevada, además una tendencia clara hacia poseer elementos por debajo del promedio. Las ciudades definidas poseen en promedio entre el nivel 1 y 2 de intermodalidad con tendencias hacia niveles de intermodalidad menores. la cantidad de puntos de alquiler de bicicletas es una variable que se comporta bastante parecido a la variable de kilómetros de ciclo vías, ya que la primera posee una amplia desviación estándar y una curtosis muy elevada y con tendencias a poseer más elementes menores al promedio, principalmente por ciudades que no poseen puntos de alquiler. Existen en promedio 48 sistemas de semaforización inteligente en cada ciudad, mas como lo expresa su desviación estándar hay en promedio mucha dispersión entre variables, debido principalmente a que la extensión y cantidad de habitantes de cada ciudad de muy diversa, en tanto, es claro que una región como menos personas y flujos de movilización tendrán menores sistemas de semaforización, ya que necesitara muchísimos menos que delimitaciones con mayor extensión y población. Hay entre 3 y 4 centros de recarga rápida de combustible en promedio en cada una de las ciudades definidas, donde hay un grado de concentración bastante grande entorno al promedio y una tendencia a poseer elementos menores a este. Y como última variable se tiene a la cantidad de accidentes de tránsito con víctimas, el cuál asume un cifra promedio de 1085 accidentes, presentando una concentración, una inclinación hacia poseer elementos menores al promedio y una desviación estándar muy grande, haciendo que el promedio sea una cifra cuestionable en torno a su representatividad en este caso.
En lo que respecta a la identificación de atípicos, la variable “Cantidad de kilómetros de ciclovías en la ciudad” posee una observación aberrante en la ciudad de Quesada, siendo esta la que más kilómetros posee. La mayoría de las ciudades no poseen ciclo vías en tanto hace que esta observación resalte sobremanera y se convierta en un atípico, tomando en cuenta de nuevo, las características de extensión y habitantes de las ciudades definidas. La variable “Cantidad de puntos de alquiler de bicicletas en la ciudad” tiene la particularidad de que la mayoría de la ciudades no cuentan con este tipo de posibilidades para los ciudadanos y las únicas ciudades que lo poseen son las ciudades de San José y Cartago, mientras todas las demás ciudades no poseen ni un solo punto de alquiler. se tiene también que la variable “Cantidad de sistemas inteligentes de semaforización en la ciudad” cuenta con una observación atípica en la ciudad de San José, siendo esta la que mayor extensión en kilómetros cuadrados y cantidad de habitantes posee y en la que se esperaría más flujos de movimiento de medios de transporte y necesidad de estos instrumentos de regulación de tránsito. “Cantidad de centros de recarga rápida para automóviles instalados en la ciudad” es una variable en la cual existen atípicos tanto por encima del límite superior como del límite inferior, estas observaciones son las ciudades de San José, Heredia y Belén respectivamente. Como estos centros de recarga están relacionados con la demanda del mercado de automóviles eléctricos y este mercado no se ha desarrollado plenamente en el país, es posible pensar en que ciudades definidas como la de Belén, con una población y extensión pequeñas, no cuente con este tipo de centros, más estando tan cerca de la ciudad que más centros posee, como lo es la ciudad de Heredia. Y como variable final tenemos a la " Cantidad de accidentes de tránsito con víctimas en la ciudad" la cuál posee una observación aberrante en la ciudad de San José, resaltando de nuevo que es la ciudad en la cual se esperaba que haya más flujo de tránsito por su extensión y habitantes, en tanto ser la ciudad con más probabilidades de que se dé un accidente.
La matriz de correlaciones muestra relaciones lineales fuertes, por ejemplo, como la que tienen las variables “Intermodalidad de sistemas de transporte” y “Cantidad de puntos de alquiler de bicicletas en la ciudad” esto debido principalmente a que en su especificación uno de los nodos transporte es punto de alquiler de bicicletas, en tanto para alcanzar el nivel máximo de intermodalidad se requiere que la ciudad definida posea puntos de alquiler de bicicletas a menos de 250 metros de otros 4 nodos de transporte. También existe una relación lineal fuerte entre las variables “Intermodalidad de sistemas de transporte” y “Cantidad de sistemas inteligentes de semaforización en la ciudad”, para explicar esto se debe de entender que los demás nodos de transporte que se toman en cuenta para el cálculo de la intermodalidad son ramales de tren y paradas de taxi, estos 2 nodos de transporte se suelen colocar en zonas estratégicas en las haya una concentración de personas con necesidad de transportarse hacia otros puntos, por esto se esperaría que en zonas en donde haya mucha concentración de este tipo se requieran y coloquen más sistemas de regulación vial, o sea, sistemas de semaforización inteligente. Por último tenemos que la variable “Cantidad de accidentes de tránsito con víctimas en la ciudad” posee una relación lineal fuerte con las variables “Intermodalidad de sistemas de transporte” y “Cantidad de puntos de alquiler de bicicletas en la ciudad” y “Cantidad de sistemas inteligentes de semaforización en la ciudad”, las anteriores tres son variables que se relacionan directamente con los flujos de transporte que se dan en la ciudad definida, en tanto, es claro que en donde haya un flujo mayor hayan más incidentes, esto no habla de las probabilidades per se, sino de mayores niveles de la variable en cuestión.
Las estadísticas descriptivas de la dimensión nos muestran que en promedio hay 542 PYMES activas por cada cien mil habitantes en cada una de las ciudades definidas, haciendo la salvedad de que se tiene una desviación estándar importante, las variables están concentradas en torno al promedio, con una leve inclinación a presentarse elementos menores a este. Se tiene también que el PIB per cápita, promedio en las ciudades definidas es de 10 millones de colones, con una deviación estándar de 7 millones de colones, una concentración entorno al promedio y una mayor presencia de elementos menores que este. Las ciudades definidas cuentan en promedio con una calificación en el índice de competitividad del 55, donde hay una desviación de 23 puestos una desconcentración muy amplia y una simetría bastante equilibrada. Se necesitan en promedio 24 días naturales para hacer legalmente operable un negocio, con una desviación estándar de 18 días, una simetría y desconcentración, con respecto del proemdio, bastante marcada. En las ciudades definidas se encuentra entre el 40 y 50% de las empresas exportadores de todo el país, se presenta asimetría entre las observaciones, tendiendo a asumir valores menores al promedio y una desconcentración importante con respecto también a este. La cantidad de consumo eléctrico per cápita de las ciudades definidas es en promedio de 2968 kw/h, más tiene una desviación estándar muy amplia, con una inclinación a poseer elementos que asumen valores menores al promedio y con una concentración muy amplia con respecto a este. Esta concentración y desviación estándar tan importante es muy probablemente por la presencia de atípicos.
Referente a la identificación de atípicos, la variable “Cantidad de PYMES activas por cada cien mil habitantes en la ciudad” posee uno en la ciudad de San José, en la cuál por ser cabecera de provincia, y contar una extensión y población mayor respecto a todas las demás ciudades, es probable que cuente con un mayor desarrollo de actividades económicas y por tanto de presencia de Pymes activas. Al igual que en la variable anterior, “PIB per cápita de la ciudad en millones de colones” se ve opacada por una observación atípica en la ciudad de San José, al igual que en la explicación anterior, este se debe principalmente al desarrollo de actividades económicas en esta zona, añadiendo que son actividades con mucho valor agregado como lo serían las actividades de servicios, en tanto, y siguiendo con la lógica de que entre más población y extensión más factores productivos posee y, por consiguiente, una mayor posibilidad de desarrollo.
Con respecto a la matriz de correlación, se observa que hay relaciones lineales fuertes positivas, por ejemplo, en las variables “Cantidad de PYMES activas por cada cien mil habitantes en la ciudad” y “PIB per cápita de la ciudad en millones de colones”, es claro que la presencia de PYMES activas en la ciudad mejora las condiciones materiales de los agentes, y viendo desde la perspectiva de que todo gasto es un ingreso para otro agente, es innegable la relación entre ambos. También la primera variable mencionada con la variable “Índice de competitividad” posee una relación fuerte positiva, en donde el índice de competitividad toma en cuenta 7 pilares para su construcción, dentro de los cuales las facilidades para abrir un negocio es una de las variables a considerar, si hay tantas PYMES activas, se asume que en hay facilidades para dar origen a una, en tanto, mejorara el índice de competitividad y al estar en un ambiente empresarial, en donde hay mucho encuentro entre diferentes actividades económicas este a su vez impulsa a todas las demás actividades. Punto de encuentro con la variable del PIB per cápita. “Índice de competitividad” y “Cantidad de Kilovatios hora (kW/h) de consumo eléctrico per cápita en la ciudad” se relacionan principalmente porque la disposición de redes eléctricas y el tipo de consumo que se les dé, residencial, de actividades económicas, etc., es esencial para que las ciudades sean más competitivas. Y el “PIB per cápita de la ciudad en millones de colones” se relaciona con el “Porcentaje de empresas exportadoras en la ciudad respecto al total país” por el mero hecho de que más empresas produciendo aumenta la renta general de la ciudad, y siendo productos de exportación, que por lo general llevan un grado de valor agregado importante, ese aumento es mayor.
Las estadísticas descriptivas de la dimensión Gobernanza nos indican que la calificación promedio de los mecanismos de rendición de cuentas en los gobiernos locales es de aproximadamente 94, en una escala de 1 al 100, en la cual hay una desviación estándar de casi 10 puntos, una desconcentración de los elementos e inclinación a tener elementos menores que el promedio. Los tramites que se pueden realizar de forma digital en los gobiernos locales ronda el 40% en promedio, variable que posee una cierta simetría y una desconcentración de los elementos, ambos con respcto al promedio. la calificación de libertad de acceso a la información en el gobierno local ronda los 44 puntos, con una desviación estándar de 19 puntos entre observaciones. Posee una concentración que asemeja a la distribución normal y una tendencia a poseer elementos que sean mayores al promedio. En promedio existen entre 7 y 8 bases de datos abiertas y disponibles para los ciudadanos en los gobiernos locales; cabe resaltar que hay ciudades definidas que no cuentan con estos y en general hay más elementos mayores al promedio que poseen una desconcentración importante.
En lo que respecta a la identificación de atípicos, solo tenemos que la variable “Cantidad de bases de datos abiertos con información disponible para los dos últimos años en los gobierno locales” posee una observación atípica en la ciudad de Pérez Zeledón, la cual no posee bases de datos abiertas con información disponible para los ciudadanos.
En promedio, las ciudades definidas descargan 5452.97 kilobits de información, con una concentración de los elementos que asemja a la normal y con una tendencia a poseer observaciones que son mayores al promedio. El porcentaje promedio de hogares con acceso a internet es del 54%, con una desviación estándar entre sus observaciones del 20%, con una simetría y desconcentración con respecto al promedio bastante marcada. Existen en promedio aproximadamente 28 puntos de acceso wifi gratuito en las ciudades definidas, reslatando que a pesar de la presencia de una desviación estándar alta, existe al menos un punto de acceso de wifi gratuito en cualquiera de las ciudades, además de presentar una concentración muy alto y tendencia hacia la presencia de elementos menores con respcto del promedio. Tambien en todos los gobiernos locales se impulsan aplicaciones digitales para la interacción con la ciudadania, en promedio hay 4 en cada una de las ciudades, presentando una concentración más aguda que en la distribución normal y una persistencia a tener valores mayores que el promedio. Los gobiernos locales de las ciudades definidas tienen una calificación promedio del cumplimiento de las normas TIC’s de 94 puntos, con una desviación estándar de 11 puntos, una concentración sumamente grande alrededor de la media y con una tendencia a poseer elemenos que son mayores al promedio. Por último tenemos que hay 19331 medidores nteligentes en promedio en cada una de las ciudades, esta cifra posee una desviación estándar sumamente amplia, y es principalmente porque se toma a la variable en sus niveles, y como las extensiones den Km2 y cantidad de habitantes es tan diversa en las ciudaddes definidas pues genera que las cifras máximas y mínimas sean muy disntintas, haciendo que no haya una concentración clara y que en general los elemenos sean mayores el promedio en cuestión.
En tanto a la identificación de atípicos tenemos que en la variable “Cantidad de Kilobits promedio de descarga de datos en la ciudad” existe una observación atípica en la ciudad de Limón, una ciudad que esta entre las que poseen menos población, menos puntos de acceso con wifi, además de la calidad de servicio menor con respcto a las ciudades dentro de la GAM. Tambien la variable “Cantidad de puntos de acceso público con Wifi gratuito” posee una de estas observaciones en la ciudad de San José, donde se vuelve a hacer alusión a la cantidad de observaciones que se están manejando y como esta ciudad por ser cabecera de la capital del país tiene muy desarrollado ambitos en como el tecnológico y lo podemos ver reflejado en indicadores como este. “La cantidad de aplicaciones impulsadas por el gobeirno local para la interacción con la ciudadanía” posee una observación aberrante en la ciudad de Cartago probablemente situación que se da por la cantidad de observaciones con las cuales se dispone para realizar el análisis. La variable “Calificación por Grado de madurez en el cumplimiento de las normas TIC’s en los gobiernos locales” presenta un atípico en la ciudad de puntarenas. Y como se introdujo en las estadisticas descriptivas, la variable “Cantidad de medidores eléctricos inteligentes instalados en la ciudad” tiene u¿observacionoes que se salen de la norma por la diversidad de concentraciones en las ciudades definidas, en tanto entre más concentrados se encuentre la ciudadania contara con más medidores inteligentes, como lo sería el caso de la ciuda de San José y Alajuela
Se realiza una redirección a ciertas variables que posean una lógica inversa a la del cálculo del índice. Está lógica es una en la cual valores positivos mayores de las variables, son beneficiosos para la dimensión en cuestión. Esta redirección se les realizó a las siguientes variables:
DSv1 (Tasa de desempleo de la ciudad): Se le resto a la unidad la variable para obtener su contrario
DSv2 (Porcentaje de hogares en hacinamiento de la ciudad): Se le resto a la unidad la variable para obtener su contrario
DSv3 (índice de Gini de la ciudad): Se resto le resto a la unidad la variable para obtener su contrario
DSv4 (Cantidad de Habitantes por EBAIS de la ciudad): Se multiplico por menos uno [-1] la variable, esto para conservar la lógica del cálculo del índice
DAv1 (Cantidad de toneladas equivalentes de dióxido de carbono emitidas por el sector transporte en la ciudad): Se multiplico por menos uno [-1] la variable, esto para conservar la lógica del cálculo del índice
DAv4 (Cantidad per cápita de toneladas de residuos sólidos producidos por la ciudad): Se multiplico por menos uno [-1] la variable, esto para conservar la lógica del cálculo del índice
DSCv1 (Cantidad de robos al año por cada cien mil habitantes en la ciudad): Se multiplico por menos uno [-1] la variable, esto para conservar la lógica del cálculo del índice
DSCv5 (Cantidad de homicidios al año por cada cien mil habitantes en la ciudad): Se multiplico por menos uno [-1] la variable, esto para conservar la lógica del cálculo del índice
DTv6 (Cantidad de accidentes de tránsito con víctimas en la ciudad): Se multiplico por menos uno [-1] la variable, esto para conservar la lógica del cálculo del índice
Dev4 (Cantidad de días naturales necesarios para hacer legalmente operable un negocio): Se multiplico por menos uno [-1] la variable, esto para conservar la lógica del cálculo del índice
Se utiliza el método de normalización por medio de la desviación estándar y se define como el número de desviaciones típicas que un valor dado toma con respecto a la media de su muestra o población. Esto se aplica con el objetivo de convertir a una sola unidad de medida (desviaciones estándar) a todas las variables y de esta manera hacerlas comparables.
Limitación: Dado que las variables categóricas DAv6 (Ejecución por parte del gobierno local de un programa de reciclaje que incluya la clasificación total o parcial de los residuos generados por la ciudad) y DGv2 (Existencia de instrumentos de participación ciudadana) no cambian a lo largo de las observaciones (ciudades), ya que todas asumen una misma categoría, toman la representación de NA en la base de datos, denotando que el método de normalización en estas variables no es posible aplicarlo. Situación que se solucionará más adelante.
Se empleo como base principal de la siguiente metodología, para el cálculo de los ponderadores, la información recopilada por los grupos focales, específicamente de las preguntas que se formularon como sigue:
En la primera pregunta se le pedía al panel de expertos que seleccionaran 6 variables del total de variables identificadas, indicando de esta manera las 6 más importantes, sin ningún tipo de orden especifico. En la segunda pregunta se buscó jerarquizar la significancia de esas 6 variables seleccionadas, o sea, calificar por orden de importancia las variables.
La ponderación para la primera pregunta se realizó contabilizando la cantidad de veces que las variables fueron mencionadas por las personas expertas, entre la cantidad de veces máximas que pudieron haber sido mencionadas (esto sería el caso en el cuál todos los expertos coinciden en la selección de una de las variables). A partir de allí, se seleccionaron las 6 que más porcentaje de escogencia tuvieron. Luego se escalaron (para obtener los ponderadores en un rango de [0,100]) dividiendo este porcentaje individual entre la sumatoria de los porcentajes de la dimensión total con 6 variables. Obteniendo de esta manera un ponderador para cada una de las seis variables de la dimensión.
Para la segunda pregunta, se le pidió al panel de expertos que priorizaran las variables dadas, dotando de una calificación a cada una de las seis, siendo 1 la mayor y 6 la menor percepción de importancia dentro de la dimensión. Una vez realizado este proceso se calcula un promedio simple de las calificaciones que le brindaron los expertos a cada variable, en este caso la variable mejor calificada poseerá un menor valor absoluto. Posterior a este proceso se le resta a siete (para que nunca de cero la resta) el promedio de las calificaciones, lo anterior se divide por 6 y por último se amplía multiplicando por cien. A partir de allí se suman todas las calificaciones y dividimos todas individualmente entre el total, obteniendo de esta manera el ponderador para cada una de las seis variables de la dimensión
Una vez obtenidos los ponderadores estos se multiplican por las varaibles ya normalizadas respectivamente en cada dimensión y así obtener el peso relativo de cada variable ya normalizada en cada dimensión.
Ahora bien, se procede a la reescalación de las variables ya normalizadas y ponderadas por medio del método de mínimos y máximos. Se reescala cada una de las varibles entre 0 y 1/6 (seis variables), esto pensado para que la sumatoria de las variables de cada observación(ciudad) en cada una de las Dimensiones no sobrepase la unidad. Por cómo trabaja el método, existiran en cada una de las variables siempre habrá alguna que asuma el valor mínimo de de 0 y otra el valor máximo de 1/6.
Acá retomamos el problema que nos habían generado las variables categóricas que no variaban. Se opta por reemplazar ese NA por la calificación máxima que puede obtener una variable reescalada, o sea, asumen un valor de 1/6. Como se concibió a estas 2 varaibles binarias como positivas en cuanto a la presnecia de estas en cada una de las ciudades (todas la poseen), el asignar esta cuasi-calificación máxima no contradice en lo absoluto a la lógica del índice. Obteniendo así calificaciones parcial por dimensión
Una vez hecho esto se suma el valor obtenido de cada una de las 6 variables de cada dimensión, ampliando la escala de este resultado múltiplicandolo por cien. Obteniendo de esta manera una calificación parcial por dimensión de 0-100
Una vez solucionado el tema de los NA y teniendo el cálculo por dimensión, solo realizamos un promedio de las calificaciones parciales y de esta manera obtenemos el índice de Ciudades Inteligentes y Sostenibles.