class: center, middle, inverse, title-slide .title[ # Análisis del acceso a Internet en países del mundo (2019) ] .author[ ### Danna Sofía Imbachi
Angie Camila Montes
Jeremy Andrés Salguero ] .date[ ### 20-06-25 ] --- <br><br><br> # Introducción En la actualidad, el acceso a Internet se ha consolidado como un factor esencial para el desarrollo económico, la innovación tecnológica y la inclusión social. No obstante, persisten desigualdades significativas en la conectividad digital entre países, reflejo de diferencias profundas en infraestructura, inversión y políticas públicas. Este estudio aborda dicha problemática mediante el uso de técnicas de analisis no supervisado, aplicadas a un conjunto de datos del Banco Mundial correspondiente al año 2019. La base de datos incluye 15 variables clave relacionadas con el desarrollo digital en 100 países, abarcando dimensiones económicas, tecnológicas y sociales. --- <br><br><br> # Metodología - **Método K-means** Agrupa observaciones en k clústeres según su similitud. Minimiza la distancia entre cada punto y el centro de su grupo. Requiere definir el número de grupos previamente. - **Método Ward** Forma clústeres minimizando la varianza interna. Agrupa países paso a paso, uniendo los más similares hasta formar una jerarquía (dendrograma). - **PCA (Análisis de Componentes Principales)** Reduce la dimensión de los datos conservando la mayor variabilidad posible. Transforma las variables originales en nuevas variables (componentes) no correlacionadas, facilitando la visualización y el análisis. --- class: center, middle # Descripción y selección de variables --- .pull-left[ .smaller[ <br><br><br> #### Variables tecnológicas: - x1. Suscripciones a banda ancha fija - x6. Usuarios que usan Internet - x7. Suscripciones banda ancha móvil - x9. Servidores de Internet seguros ] ] .pull-right[ <br><br><br> #### x6. Top 10 paises con mayor porcentaje de personas que usan Internet (2019)
] --- .pull-left[ .smaller[ **Variables económicas**: - x2.PIB per cápita - x3.Gasto público en educación - x4.Exportaciones de bienes TIC - x5.Importaciones de bienes TIC - x13.Servicios informáticos, comunicaciones y otros(Export) - x14.Servicios informáticos, comunicaciones y otros(Import) - x15.Inversión extranjera directa, entradas netas ] ] .pull-right[ #### x4.Exportaciones TIC
] --- .pull-left[ .smaller[ <br><br><br> **Variables sociales y de infraestructura:** - x8.Población total: - x10.Desempleo: - x11.Acceso a electricidad en zonas urbanas: - x12.Acceso a electricidad en zonas rurales: ] ] .pull-right[ #### X11.Acceso a electricidad en zonas urbanas
] --- ### Valores atipicos por variable <div style="display: flex; justify-content: center;">
--- class: center, middle # Modelo --- # K-means Al ejecutar la clusterización por el método K-means se observa que el gráfico de silueta sugiere 3 clusters.
--- # Resultado <div style="display: flex; justify-content: center;">
--- # Clusters <br><br><br> **Cluster 1.( 55 países) "Naciones Digitales Emergentes"** Representado en color rojo y ubicado en el centro del gráfico. **Cluster 2.(32 países) "Potencias Digitales" .** Este grupo, representado en color verde y ubicado en la parte derecha del gráfico. **Cluster 3. (13 países) "Brecha Digital Crítica"** Representado en color azul y ubicado en la parte izquierda del gráfico. --- class: center, middle # Análisis Multivariado (PCA) --- # Matriz de correlación .pull-left[ .smaller[ <!-- --> ] ] .pull-right[ <br><br><br> <table class="table table-hover table-condensed" style="width: auto !important; margin-left: auto; margin-right: auto;"> <caption>Contribución de variables</caption> <thead> <tr> <th style="text-align:left;"> Tabla 1 </th> <th style="text-align:left;"> Tabla 2 </th> <th style="text-align:left;"> Tabla 3 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> x6: 4.34 </td> <td style="text-align:left;"> x5: 3.84 </td> <td style="text-align:left;"> x2: 3.74 </td> </tr> <tr> <td style="text-align:left;"> x12: 3.66 </td> <td style="text-align:left;"> x11: 3.35 </td> <td style="text-align:left;"> x4: 3.24 </td> </tr> <tr> <td style="text-align:left;"> x13: 3.21 </td> <td style="text-align:left;"> x14: 3.15 </td> <td style="text-align:left;"> x7: 2.39 </td> </tr> <tr> <td style="text-align:left;"> x8: 2.39 </td> <td style="text-align:left;"> x1: 2.30 </td> <td style="text-align:left;"> x10: 1.69 </td> </tr> <tr> <td style="text-align:left;"> x9: 1.60 </td> <td style="text-align:left;"> x3: 1.54 </td> <td style="text-align:left;"> x15: 1.04 </td> </tr> </tbody> </table> ] --- ## ¿Por que estas variables tienen menos correlacion? - **x3 – Gasto gubernamental en educación (% del PIB):** Muestra escasa correlación con el resto de variables, posiblemente porque refleja una prioridad presupuestal general que no se traduce directamente en mejoras tecnológicas o de acceso digital. - **x8 – Población total:** Presenta correlaciones débiles, especialmente con variables clave del análisis. Esto puede deberse a que mide una magnitud absoluta que no distingue entre segmentos específicos, lo que podría generar ruido frente a variables más focalizadas como acceso o conectividad. - **x10 – Desempleo total:** Aunque es un indicador económico importante, su falta de correlación con factores tecnológicos e infraestructurales sugiere que representa dinámicas laborales más amplias, no directamente relacionadas con el desarrollo digital. - **x15 – Inversión extranjera directa:** Tiene baja o nula correlación con la mayoría de variables, posiblemente porque su comportamiento está influido por factores externos al entorno digital, como políticas fiscales, estabilidad macroeconómica o apertura comercial. --- # Aplicación de PCA <div style="display: flex; justify-content: center;"> <!-- --> --- class: center, middle # Interpretación de los factores --- ## Factor 1. .pull-left[ .smaller[ Variables que contribuyen al factor : - PIB per cápita (x2) - Acceso a electricidad en zonas urbanas (x11) - Usuarios que usan Internet (x6) - Acceso a electricidad en zonas rurales (x12) - Importaciones de bienes TIC (x5) - Exportaciones de bienes TIC (x4) ] ] .pull-right[ <!-- --> ] --- class: center, middle ## Factor 1. Desarrollo económico y tecnológico. Agrupa variables como el PIB per cápita, la infraestructura básica (electricidad urbana y rural), y el uso de servicios digitales. Los países con valores positivos en esta dimensión tienen mayores niveles de ingresos, infraestructuras más consolidadas y mayor capacidad para invertir en tecnologías y exportar servicios digitales. --- ## Factor 2. .pull-left[ .smaller[ Agrupa variables como: - Exportaciones de bienes TIC (x4) - Importaciones de bienes TIC (x5) - Servidores de Internet seguros (x9) - Servicios informáticos, comunicaciones y otros – exportaciones (x13) ] ] .pull-right[ <!-- --> ] --- class: center, middle ## Factor 2. Participación en servicios digitales globales. Recoge información vinculada a la conectividad de la población, como las suscripciones a internet (fijo y móvil), el uso de internet por parte de los ciudadanos, y la presencia de infraestructura digital segura (servidores). --- ## Factor 3. .pull-left[ .smaller[ Está fuertemente influenciada por variables relacionadas con: - Servicios informáticos, comunicaciones y otros(Export) (x13) - Servicios informáticos, comunicaciones y otros(Import)(x14) - PIB per cápita (x2) ] ] .pull-right[ <!-- --> ] --- class: center, middle ## Factor 3.Integración a la economía digital global Con valores positivos en Dim3 indican un mayor desarrollo en la exportación/importación y dinamismo del mercado TIC internacional. Georgia, Mongolia, Kazajistán, Paraguay, Ecuador son países que se ubican más a la derecha, lo cual indica que están relativamente más involucrados en mercados internacionales de servicios TIC dentro del grupo. --- # Factor 4. .pull-left[ .smaller[ Está dominada por la variable : - x9 (servidores de Internet seguros) ] ] .pull-right[ <!-- --> ] --- class: center, middle ## Factor 4. Indicador de capacidad tecnológica Con valores positivos en Dim4 muestran mayor capacidad tecnológica (infraestructura, capital humano en tecnología, innovación). --- class: center, middle # Clusterización PCA --- <br><br><br> **Dendograma**  --- # Relación de los clusters y los factores Factor 1 y 2. <div style="display: flex; justify-content: center;"> <!-- --> --- Factor 3 y 4. <div style="display: flex; justify-content: center;"> <!-- --> --- class: center, middle # Interpretación de los clusters --- class: center, middle ## **Cluster 1:** Agrupa a 35 países y se interpreta como **"Países en Escalón Digital Intermedio"** Representa a países con condiciones intermedias o moderadas. Tienen niveles medios en acceso a infraestructura digital, comercio TIC y conectividad. En general, este grupo se encuentra en una posición de transición entre países con alta y baja dotación tecnológica. --- class: center, middle ## **Cluster 2:** Esta conformado por 57 países y se interpreta como **"Países Vanguardia Digital"** Este grupo reúne a países con altos niveles de desarrollo digital. Se caracterizan por un mayor acceso a internet (x6), mejor cobertura eléctrica en zonas urbanas y rurales (x11, x12), y una fuerte participación en la exportación de servicios TIC (x2, x14). También muestran altos niveles en comercio de bienes TIC (x4, x5) y en suscripciones a banda ancha móvil (x7). --- class: center, middle ## **Cluster 3:** Incluye 8 países y se interpreta como **"Países con Rezago Tecnológico Acentuado"** Agrupa a países con bajo desempeño en los indicadores tecnológicos. Tienen poco acceso a internet y electricidad (x6, x11, x12), baja participación en exportaciones de servicios TIC (x2, x14), y menor comercio de bienes TIC y conectividad móvil (x4, x5, x7). Además, presentan poca variabilidad interna, lo que sugiere condiciones más homogéneas en estos bajos niveles. --- # Conclusiones - Este estudio reveló realidades que van más allá de lo esperado. Se confirmó que la brecha digital aún persiste: países con fuerte infraestructura tecnológica conviven con otros que aún enfrentan barreras básicas, como el acceso a la electricidad. En particular, algunas regiones de África siguen quedando rezagadas, lo que marca una diferencia significativa en comparación con regiones que lideran en innovación. Esto reafirma que el acceso a las TIC sigue siendo un desafío global, y no solo una cuestión de avance tecnológico. - Mediante el análisis de aprendizaje no supervisado con el método PCA , se identificaron y evaluaron las variables más relevantes que contribuyen a cada una de las cuatro dimensiones obtenidas. Este proceso permitió sintetizar sus características fundamentales y asignar un concepto global descriptivo a cada dimensión, facilitando así su interpretación y contextualización. - A pesar de que los resultados fueron consistentes, se considera que el modelo puede seguir mejorando. Se intentó ir más allá de una agrupación matemática para entender el contexto detrás de los datos, comparando realidades y evaluando el impacto de cada variable. Fue evidente que el modelo, por sí solo, no detectaría variables irrelevantes si no se complementa con un análisis exploratorio profundo. Por eso, herramientas como la matriz de correlación y el análisis de medias jugaron un papel fundamental para optimizar la clasificación. --- class: center, middle #¡Gracias!