Estado de la conectividad en Cuyo, Argentina

El siguiente trabajo buscará analizar el estado de la conectividad a internet en la región cuyana (Mendoza, San Luis y San Juan) para poder conocer la realidad de cada una y pensar políticas públicas focalizadas en las singularidades al tiempo de conocer cómo ha sido la evolución histórica en materia de conectividad. Para ello se utilizarán dos bases de datos del Enacom: una contiene las tasas de penetración (cada 100 hogares y acda 100 habitantes, por provincia) de internet y la otra contiene el acceso por tipo de tecnología a nivel provincial. Se usarán ambas porque la información de la unión permitirá sacar conclusiones más integrales del problema a tratar. Para realizar el trabajo se utilizarán las librerías tidyverse: readr/dplyr/tidyr/magrittr/ggplot2 y se trabajará desde un proyecto R, archivos de Rmakdown y se exportará el reporte en html.

Procesamiento de los datos

En primer lugar voy a activar los paquetes necesarios (en mi caso de a uno puesto que linuxmint no me reconoce levantar tydiverse entero)

Ahora voy a levantar dos bases de datos extraídas del sitio oficial de ENACOM, en formato csv. Una contiene la penetración de internet cada 100 habitantes y cada 100 hogares para las provincias argentinas y la otra contiene los accesos a internet por tipo de tecnología a nivel provincia.

base_penetracion <- read.csv(file = "data/penetracion_provincias.csv")
base_accesos <- read.csv(file = "data/accesos_tecnologias_provincias.csv")

Ahora voy a probar combinar las dos bases para trabajarlas conjuntamente usando la función merge, para eso primero tengo que renombrar una variable que aparece como “Provincias” a “Provincia” de modo que coincidan en ambas bases.

base_penetracion1 <- base_penetracion %>%
  mutate("Provincia" = Provincias) %>%
  mutate(Provincias= NULL)
base_combinada <- merge(base_accesos, base_penetracion1, by= c("Año", "Trimestre", "Provincia"))

A continuación voy a filtrar mi df para quedarme solo con las provincias que integran la región de Cuyo, en Argentina, que son: Mendoza, San Luis y San Juan. Y además, quedarme con el año 2024 porque me interesa ver cómo están las conexiones en la actualidad

base_cuyo <- base_combinada %>%
  filter(Provincia %in% c( "Mendoza", "San Juan", "San Luis") & Año== 2024)

Tasas de penetración a internet

Lo primero que quiero saber es cuál es el promedio de acceso cada 100 hogares y cada 100 habitantes que hay en cada provincia de la región y en Cuyo en su totalidad. Para averiguarlo voy a usar las funciones groupby y summarize. No sé porqué me mostraba las variables de acceso como character y son numéricas así que me daba nulo los promedios. Para poder sacarlos debo primero indicarle que se trata de una variable numérica. En primer lugar voy a usar gsub porque el problema es que tiene los valores separados por comas en vez de puntos.

base_cuyo$Acceso_hogares <- gsub(",", ".", base_cuyo$Accesos.cada.100.Hogares)
base_cuyo$Acceso_habitantes <- gsub(",", ".", base_cuyo$Accesos.cada.100.Habitantes)
base_cuyo <- base_cuyo %>%
  mutate(Accesos.cada.100.Hogares= NULL, Accesos.cada.100.Habitantes = NULL)

Luego de eso voy a corroborar como considera ahora a la variable con class. Si las sigue colocando como character voy a usar as.numeric para indicarle que es numérica.

class(base_cuyo$Acceso_hogares)
class(base_cuyo$Acceso_habitantes)
base_cuyo$Acceso_hogares <- base_cuyo$Acceso_hogares %>%
  as.numeric(base_cuyo$Acceso_hogares)
base_cuyo$Acceso_habitantes <- base_cuyo$Acceso_habitantes %>%
  as.numeric(base_cuyo$Acceso_habitantes)
class(base_cuyo$Acceso_hogares)
class(base_cuyo$Acceso_habitantes)

Ahora si, con los datos arreglados vamos por los promedios y por la mediana.

base_cuyo %>%
  group_by(Provincia) %>%
  summarise(Prom_hab = mean(Acceso_habitantes),
           Media_hab= median(Acceso_habitantes),
           Prom_hog= mean(Acceso_hogares),
           Media_hog= median(Acceso_hogares))
## # A tibble: 3 × 5
##   Provincia Prom_hab Media_hab Prom_hog Media_hog
##   <chr>        <dbl>     <dbl>    <dbl>     <dbl>
## 1 Mendoza       15.1      14.8     54.1      52.9
## 2 San Juan      13.7      13.2     53.9      51.8
## 3 San Luis      30.9      30.8    108.      107.

Sgún el cálculo previo San Luis es la provincia cuyana con mayor penetración de internet cada 100 hogares, con un promedio de 108 y cada 100 habitantes con un promedio de 30.9. Sin embargo, solo el dato de la penetración no logra demostrar el estado de conectividad porque no permite ver la distribución de las conexiones, los accesos por tipos de tecnologías ni otras variables vinculadas. Aún así, para tener estos datos visualizados de manera más práctica haré un gráfico de barras que permita ver la diferencia de penetración en Cuyo por provincia.

base_cuyo_hogares <- base_cuyo %>%
  group_by(Provincia) %>%
  summarise(Acceso_hogares= round (mean(Acceso_hogares),2))
ggplot(data = base_cuyo_hogares,
       mapping = aes(x= Provincia,
                     y= Acceso_hogares))+
  geom_col(data= base_cuyo_hogares, aes(fill= Provincia))+
  geom_text(aes(label=Acceso_hogares),
            position = position_stack(vjust = 1.2))+
  scale_fill_manual(values= c("Mendoza"= "cadetblue", "San Luis"= "aquamarine3", "San Juan"= "cyan4"))+
  labs(title = "Acceso a internet cada 100 hogares",
       subtitle = "Región de Cuyo",
       caption = "Fuente de datos Enacom")+
  theme_minimal()+
  theme(plot.title = element_text(hjust = 0.5),
        plot.subtitle = element_text(hjust = 0.5),
        plot.caption = element_text(hjust = 0.5))

El gráfico anterior nos permite visualizar con mayor claridad que San Luis es la provincia cuyana con mayor penetración de internet cada 100 hogares, arrojando un promedio de 108.08. A continuación, se mostrará la penetración en cada provincia cada 100 habitantes

base_cuyo_habitantes <- base_cuyo %>%
  group_by(Provincia) %>%
  summarise(Acceso_habitantes= round(mean(Acceso_habitantes), 2))
ggplot(data = base_cuyo_habitantes,
       mapping = aes(x= Provincia,
                     y= Acceso_habitantes))+
  geom_col(data = base_cuyo_habitantes, aes(fill=Provincia))+
  geom_text(aes(label = Acceso_habitantes),
            position = position_stack(vjust = 1.2))+
  scale_fill_manual(values= c("Mendoza"= "cadetblue", "San Luis"= "aquamarine3", "San Juan"= "cyan4"))+
  labs(title = "Acceso a internet cada 100 habitantes",
       subtitle = "Región de Cuyo",
       caption = "Fuente de datos Enacom")+
  theme_minimal()+
  theme(plot.title = element_text(hjust = 0.5),
        plot.subtitle = element_text(hjust = 0.5),
        plot.caption = element_text(hjust = 0.5))

Una vez obtenidos estos datos, en los cuales también San Luis presenta un mayor promedio de acceso cada 100 habitantes que las otras provincias cuyanas, nos interesa conocer cómo ha cambiado el acceso a internet en las provincias en los últimos 10 años. Para eso primero vamos a crear un nuevo dataframe que contenga los accesos totales, las provincias de Cuyo y los últimos 10 años.

base_cuyo_hist <- base_combinada %>%
  select(1, 3, 9) %>% 
  filter(Provincia %in% c("Mendoza", "San Luis", "San Juan"))

Voy a corroborar mi nueva tabla

head(base_cuyo_hist)
##    Año Provincia  Total
## 1 2014   Mendoza 165845
## 2 2014   Mendoza 166807
## 3 2014  San Juan  51646
## 4 2014  San Luis  13055
## 5 2014   Mendoza 167924
## 6 2014  San Juan  51779

Ahora vamos a graficar la distribución temporal de los totales de acceso a internet por provincia utilizando los gráficos geom_line y geom_point

ggplot(data = base_cuyo_hist,
       mapping= aes(x= Año,
                    y=Total,
                    color = Provincia,
                    group = Provincia))+
  geom_line(size=2)+
  geom_point(size=3)+
  scale_color_manual(values= c( "Mendoza"= "cadetblue", "San Luis"= "aquamarine3", "San Juan"= "cyan4"))+
  scale_x_continuous(breaks = base_cuyo_hist$Año)+
  scale_y_continuous(labels = scales:: comma)+
  labs(title = "Accesos a internet totales en la región cuyana",
       subtitle = "Período 2014-2024",
       caption = "Fuente de datos: Enacom",
       x= "Año",
       y= "Accesos totales")+
  theme_minimal()+
  theme(plot.title = element_text(hjust = 0.5),
        plot.subtitle = element_text(hjust = 0.5),
        plot.caption = element_text(hjust = 0.5),
        axis.title.x = element_text(size = 11),
        axis.text.x = element_text(size = 8),
        axis.title.y = element_text(size = 11),
        axis.text.y = element_text(size = 8))

El gráfico anterior nos permite visualizar que en el caso de San Luis el total de accesos en la provincia tuvo un primer pico de crecimento en el 2018, que se corresponde con el período de mayor crecimiento de la Autopista de la Información, con nuevas conexiones y un aumento de cableado así como con la implementación del plan provincial San Luis 3.0 en el cual se digitalizaron diferentes áreas del Estado provincial. Ello llevó a que se invirtiera en mejoras del piso de infraestructura necesario para la conexión y, al mismo tiempo, generó un aumento del uso de la población.

Tipos de tecnologías de conexión

Teniendo la distribución temporal de los accesos totales en cada provincia, interesa ahora conocer cuáles son los tipos de tecnologías más utilizados en cada uno. Para eso primero creamos un nuevo data.frame

base_cuyo_tecnologias <- base_combinada %>%
  select("Provincia", 4, 5, 6, 7, 8) %>%
  filter(Provincia %in% c("Mendoza", "San Luis", "San Juan"))

Y ahora voy a usar group_by y summarise para ordenarla y poder visualizarla mejor

tabla_tecnologias <- base_cuyo_tecnologias %>%
  group_by(Provincia) %>%
  summarise(ADSL= sum(ADSL, na.rm = TRUE),
            Cablemodem= sum(Cablemodem, na.rm = TRUE),
            Fibra_Optica = sum(Fibra.Optica, na.rm = TRUE),
            Wireless= sum(Wireless, na.rm = TRUE),
            Otros= sum(Otros, na.rm = TRUE))
## # A tibble: 3 × 6
##   Provincia    ADSL Cablemodem Fibra_Optica Wireless  Otros
##   <chr>       <int>      <int>        <int>    <int>  <int>
## 1 Mendoza   4604884    1977615      2535363   569714  72009
## 2 San Juan  1741419     368404       464916   404836 191156
## 3 San Luis   387975     637591       235900  1767879 515170

A partir de la tabla anterior podemos ver la sumatoria de accesos por tipos de tecnología que hay en cada provincia. Deducimos, por ejemplo, que San Luis presenta un acceso mayoritario a través de Wireless, lo cual podría estar directamente vinculado con la existencia de la Autopista de la Información. A su vez, Mendoza, registra un nivel elevado de accesos vía Fibra öptica. Veamos ahora los promedios y las medianas de la misma información. Y, para que quede una tabla más amable de leer usaremos pivot_longer

tabla_tecnologias_valores <- base_cuyo %>%
  group_by(Provincia) %>%
    summarise(adsl_promedio= round(mean(ADSL, na.rm=TRUE), 2),
            adsl_mediana= round(median(ADSL, na.rm = TRUE), 2),
            cablemodem_promedio= round(mean(Cablemodem, na.rm=TRUE), 2),
            cablemodem_mediana= round(median(Cablemodem, na.rm = TRUE), 2),
            fibra_promedio= round(mean(Fibra.Optica, na.rm=TRUE), 2),
            fibra_mediana= round(median(Fibra.Optica, na.rm = TRUE), 2),
            wireless_promedio= round(mean(Wireless, na.rm=TRUE), 2),
            wireless_mediana= round(median(Wireless, na.rm = TRUE), 2 ),
            otros_promedio= round(mean(Otros, na.rm=TRUE), 2),
            otros_mediana= round(median(Otros, na.rm = TRUE), 2)) %>%
  pivot_longer(cols = -Provincia,
               names_to = c("Tecnologia", ".value"),
               names_sep = "_")
print(tabla_tecnologias_valores)
## # A tibble: 15 × 4
##    Provincia Tecnologia promedio mediana
##    <chr>     <chr>         <dbl>   <dbl>
##  1 Mendoza   adsl         13744.  17671 
##  2 Mendoza   cablemodem   66691.  66094.
##  3 Mendoza   fibra       201998. 191157 
##  4 Mendoza   wireless     27960.  27946.
##  5 Mendoza   otros         2038.   1730 
##  6 San Juan  adsl          9875   12669 
##  7 San Juan  cablemodem   17025.  16803 
##  8 San Juan  fibra        54060.  46652.
##  9 San Juan  wireless     23594   23594 
## 10 San Juan  otros         7264    7164 
## 11 San Luis  adsl          3588.   4038 
## 12 San Luis  cablemodem   46106.  46248.
## 13 San Luis  fibra        36688.  35688 
## 14 San Luis  wireless     77632.  77632.
## 15 San Luis  otros          972.    719

Conocer el promedio y la mediana nos sirve para poder atender a los valores extremos que pueden darse debido a las grandes diferencias territoriales. Con todos los datos vamos a generar algunos gráficos que nos ayuden a sacar mejores conclusiones.

ggplot(data = tabla_tecnologias_valores, aes(x=Provincia, Promedio, y=promedio, fill = Tecnologia))+
  geom_bar(stat = "identity", position = "dodge")+
  scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"= "#6B990F", "fibra"="#0F6B99", "wireless"="#260F99", "otros"="#99540F"))+
  coord_flip()+
  labs(title = "Tipos de tecnologías predominantes en cada provincia",
       subtitle = "Región Cuyana",
       caption = "Fuente de datos del Enacom")+
  theme_minimal()+
  theme(plot.title = element_text(hjust = 0.5),
        plot.subtitle = element_text(hjust = 0.5),
        plot.caption = element_text(hjust = 0.5))

El gráfico anterior nos permite visualizar rápidamente cuál es la tecnología de acceso a internet predominante en cada provincia, sin necesidad de ir a ver la tabla. En San Luis predomina la conexión vía Wireless, mientras que en San Juan y en Mendoza la Fibra Óptica. [Calculado cada 100 hogares en base solo al año 2024]

Ahora nos interesa ver cómo esas predominancias de unas u otras tecnologías se han modificado a lo largo del tiempo, razón por la cual volveremos a los datos 2014-2024.

tabla_tecnologias_hist <- base_combinada %>%
  select(-starts_with("acc")) %>%
  filter(Provincia %in% c("Mendoza", "San Luis", "San Juan")) %>%
  group_by(Provincia, Año) %>%
  summarise(adsl= sum(ADSL),
            cablemodem= sum(Cablemodem),
            fibra= sum(Fibra.Optica),
            wireless= sum(Wireless),
            otros= sum(Otros)) %>%
    pivot_longer(cols= c (adsl, cablemodem, fibra, wireless, otros),
               names_to = "Tecnología",
               values_to= "Accesos")

Ahora que tenemos la información en la nueva tabla que contempla: Años, provincias y cantidades de acceso por cada tecnología vamos a graficar.

  ggplot(data = tabla_tecnologias_hist, mapping = aes(x=Año, y= Accesos, fill = Tecnología, Tecnología))+
  geom_bar(stat = "identity")+
  scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"="#6B990F", "fibra"= "#0F6B99", "wireless"= "#260F99", "otros"= "#99540F"))+
  scale_x_continuous(breaks = tabla_tecnologias_hist$Año)+
  scale_y_continuous(labels = scales::comma)+
  labs(title = "Evolución del tipo de tecnología predominante a través del tiempo",
       subtitle = "Región cuyana- Período 2014-2024",
       caption = "Fuente de datos del Enacom")+
  theme_minimal()+
  theme(plot.title = element_text(hjust = 0.5),
        plot.subtitle = element_text(hjust = 0.5),
        plot.caption = element_text(hjust = 0.5))

El gráfico anterior nos muestra la evolución histórica del tipo de tecnología utilizada para acceder a internet en el período de 2014 a 2024 para la Región de Cuyo en general. A continuación veremos cómo ha sido la evolución en cada una de las tres provincias. Comenzando por San Luis

  ggplot(data = tabla_tecnologias_hist %>% filter(Provincia== "San Luis"), mapping = aes(x=Año, y= Accesos, fill = Tecnología, Tecnología))+
  geom_bar(stat = "identity")+
  scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"="#6B990F", "fibra"= "#0F6B99", "wireless"= "#260F99", "otros"= "#99540F"))+
  scale_x_continuous(breaks = tabla_tecnologias_hist$Año)+
  scale_y_continuous(labels = scales::comma)+
  labs(title = "Evolución del tipo de tecnología predominante a través del tiempo",
       subtitle = "San Luis- Período 2014-2024",
       caption = "Fuente de datos del Enacom")+
  theme_minimal()+
  theme(plot.title = element_text(hjust = 0.5),
        plot.subtitle = element_text(hjust = 0.5),
        plot.caption = element_text(hjust = 0.5))

Veremos ahora el caso de Mendoza

ggplot(data = tabla_tecnologias_hist %>% filter(Provincia== "Mendoza"), mapping = aes(x=Año, y= Accesos, fill = Tecnología, Tecnología))+
  geom_bar(stat = "identity")+
  scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"="#6B990F", "fibra"= "#0F6B99", "wireless"= "#260F99", "otros"= "#99540F"))+
  scale_x_continuous(breaks = tabla_tecnologias_hist$Año)+
  scale_y_continuous(labels = scales::comma)+
  labs(title = "Evolución del tipo de tecnología predominante a través del tiempo",
       subtitle = "Mendoza- Período 2014-2024",
       caption = "Fuente de datos del Enacom")+
  theme_minimal()+
  theme(plot.title = element_text(hjust = 0.5),
        plot.subtitle = element_text(hjust = 0.5),
        plot.caption = element_text(hjust = 0.5))

Por último, analizaremos lo ocurrido en la provincia de San Juan, la que registra las menores tasas de acceso de la región.

ggplot(data = tabla_tecnologias_hist %>% filter(Provincia== "San Juan"), mapping = aes(x=Año, y= Accesos, fill = Tecnología, Tecnología))+
  geom_bar(stat = "identity")+
  scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"="#6B990F", "fibra"= "#0F6B99", "wireless"= "#260F99", "otros"= "#99540F"))+
  scale_x_continuous(breaks = tabla_tecnologias_hist$Año)+
  scale_y_continuous(labels = scales::comma)+
  labs(title = "Evolución del tipo de tecnología predominante a través del tiempo",
       subtitle = "San Juan- Período 2014-2024",
       caption = "Fuente de datos del Enacom")+
  theme_minimal()+
  theme(plot.title = element_text(hjust = 0.5),
        plot.subtitle = element_text(hjust = 0.5),
        plot.caption = element_text(hjust = 0.5))

De los gráficos anteriores puede deducirse que San Luis ha tenido un acceso vía Wireless y Fibra óptica más temprano que las otras dos provincias, razón por la cual en 2024 registra pocos accesos mediante adsl y Cablemodem. La tecnología predominante de acceso desde 2018 es el Wireless con un crecimiento notable de la fibra entre 2023 y 2024. En el caso de Mendoza, el acceso vía Wireless registra muy poco crecimiento y hay una marcada predominancia de la Fibra óptica, desde 202, año de la pandmeia por Covid-19, se evidencia un ritmo de crecimiento que ha dejado por debajo a las otras tecnologías. San Juan, la provincia con menor acceso a internet cada 100 hogares y cada 100 habitantes, tuvo hasta 2020 altos índices de acceso vía adsl que fueron disminuyendo progresivamente en relación al crecimiento de la Fibra óptica y del Wireless.

Conclusión

El trabajo presentado tenía como principal interrogante el estado de conectividad de la región cuyana, que comprende tres provincias con marcadas diferencias entre si. San Luis, con un gran desarrollo de políticas públicas provinciales de inclusión a internet alcanza las mayores tasas de penetración de internet, cuya tecnología predominante de conexión es el Wireless, evidenciandose un marcado incremento de estas tasas a partir del 2018, consecuente con la mayor cantidad de inversión provincial realizada. Mendoza por su parte, registra un gran crecimiento en las tasas de penetración pero que aún no logran igualar a San Luis. Lo llamativo de la provincia es el crecimiento de los accesos vía Fibra óptica. Sería interesante analizar si hay una relación con los metros de fibra iluminados por la política pública nacional REFEFO. San Juan tiene una gran materia pendiente en garantizar el acceso a internet de su población, registrando las menores tasas de acceso y los crecimientos menos notables en conexiones de tipo Wireless y Fibra óptica. Con mejoras a raíz de la incidencia de la pandemia, que pbligó al estado provincial a invertir en la conectividad, aún le queda un largo recorrido para estar a la par de las otras provincias cuyanas.