El siguiente trabajo buscará analizar el estado de la conectividad a internet en la región cuyana (Mendoza, San Luis y San Juan) para poder conocer la realidad de cada una y pensar políticas públicas focalizadas en las singularidades al tiempo de conocer cómo ha sido la evolución histórica en materia de conectividad. Para ello se utilizarán dos bases de datos del Enacom: una contiene las tasas de penetración (cada 100 hogares y acda 100 habitantes, por provincia) de internet y la otra contiene el acceso por tipo de tecnología a nivel provincial. Se usarán ambas porque la información de la unión permitirá sacar conclusiones más integrales del problema a tratar. Para realizar el trabajo se utilizarán las librerías tidyverse: readr/dplyr/tidyr/magrittr/ggplot2 y se trabajará desde un proyecto R, archivos de Rmakdown y se exportará el reporte en html.
En primer lugar voy a activar los paquetes necesarios (en mi caso de a uno puesto que linuxmint no me reconoce levantar tydiverse entero)
Ahora voy a levantar dos bases de datos extraídas del sitio oficial de ENACOM, en formato csv. Una contiene la penetración de internet cada 100 habitantes y cada 100 hogares para las provincias argentinas y la otra contiene los accesos a internet por tipo de tecnología a nivel provincia.
base_penetracion <- read.csv(file = "data/penetracion_provincias.csv")
base_accesos <- read.csv(file = "data/accesos_tecnologias_provincias.csv")
Ahora voy a probar combinar las dos bases para trabajarlas conjuntamente usando la función merge, para eso primero tengo que renombrar una variable que aparece como “Provincias” a “Provincia” de modo que coincidan en ambas bases.
base_penetracion1 <- base_penetracion %>%
mutate("Provincia" = Provincias) %>%
mutate(Provincias= NULL)
base_combinada <- merge(base_accesos, base_penetracion1, by= c("Año", "Trimestre", "Provincia"))
A continuación voy a filtrar mi df para quedarme solo con las provincias que integran la región de Cuyo, en Argentina, que son: Mendoza, San Luis y San Juan. Y además, quedarme con el año 2024 porque me interesa ver cómo están las conexiones en la actualidad
base_cuyo <- base_combinada %>%
filter(Provincia %in% c( "Mendoza", "San Juan", "San Luis") & Año== 2024)
Lo primero que quiero saber es cuál es el promedio de acceso cada 100 hogares y cada 100 habitantes que hay en cada provincia de la región y en Cuyo en su totalidad. Para averiguarlo voy a usar las funciones groupby y summarize. No sé porqué me mostraba las variables de acceso como character y son numéricas así que me daba nulo los promedios. Para poder sacarlos debo primero indicarle que se trata de una variable numérica. En primer lugar voy a usar gsub porque el problema es que tiene los valores separados por comas en vez de puntos.
base_cuyo$Acceso_hogares <- gsub(",", ".", base_cuyo$Accesos.cada.100.Hogares)
base_cuyo$Acceso_habitantes <- gsub(",", ".", base_cuyo$Accesos.cada.100.Habitantes)
base_cuyo <- base_cuyo %>%
mutate(Accesos.cada.100.Hogares= NULL, Accesos.cada.100.Habitantes = NULL)
Luego de eso voy a corroborar como considera ahora a la variable con class. Si las sigue colocando como character voy a usar as.numeric para indicarle que es numérica.
class(base_cuyo$Acceso_hogares)
class(base_cuyo$Acceso_habitantes)
base_cuyo$Acceso_hogares <- base_cuyo$Acceso_hogares %>%
as.numeric(base_cuyo$Acceso_hogares)
base_cuyo$Acceso_habitantes <- base_cuyo$Acceso_habitantes %>%
as.numeric(base_cuyo$Acceso_habitantes)
class(base_cuyo$Acceso_hogares)
class(base_cuyo$Acceso_habitantes)
Ahora si, con los datos arreglados vamos por los promedios y por la mediana.
base_cuyo %>%
group_by(Provincia) %>%
summarise(Prom_hab = mean(Acceso_habitantes),
Media_hab= median(Acceso_habitantes),
Prom_hog= mean(Acceso_hogares),
Media_hog= median(Acceso_hogares))
## # A tibble: 3 × 5
## Provincia Prom_hab Media_hab Prom_hog Media_hog
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Mendoza 15.1 14.8 54.1 52.9
## 2 San Juan 13.7 13.2 53.9 51.8
## 3 San Luis 30.9 30.8 108. 107.
Sgún el cálculo previo San Luis es la provincia cuyana con mayor penetración de internet cada 100 hogares, con un promedio de 108 y cada 100 habitantes con un promedio de 30.9. Sin embargo, solo el dato de la penetración no logra demostrar el estado de conectividad porque no permite ver la distribución de las conexiones, los accesos por tipos de tecnologías ni otras variables vinculadas. Aún así, para tener estos datos visualizados de manera más práctica haré un gráfico de barras que permita ver la diferencia de penetración en Cuyo por provincia.
base_cuyo_hogares <- base_cuyo %>%
group_by(Provincia) %>%
summarise(Acceso_hogares= round (mean(Acceso_hogares),2))
ggplot(data = base_cuyo_hogares,
mapping = aes(x= Provincia,
y= Acceso_hogares))+
geom_col(data= base_cuyo_hogares, aes(fill= Provincia))+
geom_text(aes(label=Acceso_hogares),
position = position_stack(vjust = 1.2))+
scale_fill_manual(values= c("Mendoza"= "cadetblue", "San Luis"= "aquamarine3", "San Juan"= "cyan4"))+
labs(title = "Acceso a internet cada 100 hogares",
subtitle = "Región de Cuyo",
caption = "Fuente de datos Enacom")+
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5),
plot.subtitle = element_text(hjust = 0.5),
plot.caption = element_text(hjust = 0.5))
El gráfico anterior nos permite visualizar con mayor claridad que San
Luis es la provincia cuyana con mayor penetración de internet cada 100
hogares, arrojando un promedio de 108.08. A
continuación, se mostrará la penetración en cada provincia cada 100
habitantes
base_cuyo_habitantes <- base_cuyo %>%
group_by(Provincia) %>%
summarise(Acceso_habitantes= round(mean(Acceso_habitantes), 2))
ggplot(data = base_cuyo_habitantes,
mapping = aes(x= Provincia,
y= Acceso_habitantes))+
geom_col(data = base_cuyo_habitantes, aes(fill=Provincia))+
geom_text(aes(label = Acceso_habitantes),
position = position_stack(vjust = 1.2))+
scale_fill_manual(values= c("Mendoza"= "cadetblue", "San Luis"= "aquamarine3", "San Juan"= "cyan4"))+
labs(title = "Acceso a internet cada 100 habitantes",
subtitle = "Región de Cuyo",
caption = "Fuente de datos Enacom")+
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5),
plot.subtitle = element_text(hjust = 0.5),
plot.caption = element_text(hjust = 0.5))
Una vez obtenidos estos datos, en los cuales también San Luis presenta un mayor promedio de acceso cada 100 habitantes que las otras provincias cuyanas, nos interesa conocer cómo ha cambiado el acceso a internet en las provincias en los últimos 10 años. Para eso primero vamos a crear un nuevo dataframe que contenga los accesos totales, las provincias de Cuyo y los últimos 10 años.
base_cuyo_hist <- base_combinada %>%
select(1, 3, 9) %>%
filter(Provincia %in% c("Mendoza", "San Luis", "San Juan"))
Voy a corroborar mi nueva tabla
head(base_cuyo_hist)
## Año Provincia Total
## 1 2014 Mendoza 165845
## 2 2014 Mendoza 166807
## 3 2014 San Juan 51646
## 4 2014 San Luis 13055
## 5 2014 Mendoza 167924
## 6 2014 San Juan 51779
Ahora vamos a graficar la distribución temporal de los totales de acceso a internet por provincia utilizando los gráficos geom_line y geom_point
ggplot(data = base_cuyo_hist,
mapping= aes(x= Año,
y=Total,
color = Provincia,
group = Provincia))+
geom_line(size=2)+
geom_point(size=3)+
scale_color_manual(values= c( "Mendoza"= "cadetblue", "San Luis"= "aquamarine3", "San Juan"= "cyan4"))+
scale_x_continuous(breaks = base_cuyo_hist$Año)+
scale_y_continuous(labels = scales:: comma)+
labs(title = "Accesos a internet totales en la región cuyana",
subtitle = "Período 2014-2024",
caption = "Fuente de datos: Enacom",
x= "Año",
y= "Accesos totales")+
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5),
plot.subtitle = element_text(hjust = 0.5),
plot.caption = element_text(hjust = 0.5),
axis.title.x = element_text(size = 11),
axis.text.x = element_text(size = 8),
axis.title.y = element_text(size = 11),
axis.text.y = element_text(size = 8))
El gráfico anterior nos permite visualizar que en el caso de San Luis el total de accesos en la provincia tuvo un primer pico de crecimento en el 2018, que se corresponde con el período de mayor crecimiento de la Autopista de la Información, con nuevas conexiones y un aumento de cableado así como con la implementación del plan provincial San Luis 3.0 en el cual se digitalizaron diferentes áreas del Estado provincial. Ello llevó a que se invirtiera en mejoras del piso de infraestructura necesario para la conexión y, al mismo tiempo, generó un aumento del uso de la población.
Teniendo la distribución temporal de los accesos totales en cada provincia, interesa ahora conocer cuáles son los tipos de tecnologías más utilizados en cada uno. Para eso primero creamos un nuevo data.frame
base_cuyo_tecnologias <- base_combinada %>%
select("Provincia", 4, 5, 6, 7, 8) %>%
filter(Provincia %in% c("Mendoza", "San Luis", "San Juan"))
Y ahora voy a usar group_by y summarise para ordenarla y poder visualizarla mejor
tabla_tecnologias <- base_cuyo_tecnologias %>%
group_by(Provincia) %>%
summarise(ADSL= sum(ADSL, na.rm = TRUE),
Cablemodem= sum(Cablemodem, na.rm = TRUE),
Fibra_Optica = sum(Fibra.Optica, na.rm = TRUE),
Wireless= sum(Wireless, na.rm = TRUE),
Otros= sum(Otros, na.rm = TRUE))
## # A tibble: 3 × 6
## Provincia ADSL Cablemodem Fibra_Optica Wireless Otros
## <chr> <int> <int> <int> <int> <int>
## 1 Mendoza 4604884 1977615 2535363 569714 72009
## 2 San Juan 1741419 368404 464916 404836 191156
## 3 San Luis 387975 637591 235900 1767879 515170
A partir de la tabla anterior podemos ver la sumatoria de accesos por tipos de tecnología que hay en cada provincia. Deducimos, por ejemplo, que San Luis presenta un acceso mayoritario a través de Wireless, lo cual podría estar directamente vinculado con la existencia de la Autopista de la Información. A su vez, Mendoza, registra un nivel elevado de accesos vía Fibra öptica. Veamos ahora los promedios y las medianas de la misma información. Y, para que quede una tabla más amable de leer usaremos pivot_longer
tabla_tecnologias_valores <- base_cuyo %>%
group_by(Provincia) %>%
summarise(adsl_promedio= round(mean(ADSL, na.rm=TRUE), 2),
adsl_mediana= round(median(ADSL, na.rm = TRUE), 2),
cablemodem_promedio= round(mean(Cablemodem, na.rm=TRUE), 2),
cablemodem_mediana= round(median(Cablemodem, na.rm = TRUE), 2),
fibra_promedio= round(mean(Fibra.Optica, na.rm=TRUE), 2),
fibra_mediana= round(median(Fibra.Optica, na.rm = TRUE), 2),
wireless_promedio= round(mean(Wireless, na.rm=TRUE), 2),
wireless_mediana= round(median(Wireless, na.rm = TRUE), 2 ),
otros_promedio= round(mean(Otros, na.rm=TRUE), 2),
otros_mediana= round(median(Otros, na.rm = TRUE), 2)) %>%
pivot_longer(cols = -Provincia,
names_to = c("Tecnologia", ".value"),
names_sep = "_")
print(tabla_tecnologias_valores)
## # A tibble: 15 × 4
## Provincia Tecnologia promedio mediana
## <chr> <chr> <dbl> <dbl>
## 1 Mendoza adsl 13744. 17671
## 2 Mendoza cablemodem 66691. 66094.
## 3 Mendoza fibra 201998. 191157
## 4 Mendoza wireless 27960. 27946.
## 5 Mendoza otros 2038. 1730
## 6 San Juan adsl 9875 12669
## 7 San Juan cablemodem 17025. 16803
## 8 San Juan fibra 54060. 46652.
## 9 San Juan wireless 23594 23594
## 10 San Juan otros 7264 7164
## 11 San Luis adsl 3588. 4038
## 12 San Luis cablemodem 46106. 46248.
## 13 San Luis fibra 36688. 35688
## 14 San Luis wireless 77632. 77632.
## 15 San Luis otros 972. 719
Conocer el promedio y la mediana nos sirve para poder atender a los valores extremos que pueden darse debido a las grandes diferencias territoriales. Con todos los datos vamos a generar algunos gráficos que nos ayuden a sacar mejores conclusiones.
ggplot(data = tabla_tecnologias_valores, aes(x=Provincia, Promedio, y=promedio, fill = Tecnologia))+
geom_bar(stat = "identity", position = "dodge")+
scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"= "#6B990F", "fibra"="#0F6B99", "wireless"="#260F99", "otros"="#99540F"))+
coord_flip()+
labs(title = "Tipos de tecnologías predominantes en cada provincia",
subtitle = "Región Cuyana",
caption = "Fuente de datos del Enacom")+
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5),
plot.subtitle = element_text(hjust = 0.5),
plot.caption = element_text(hjust = 0.5))
El gráfico anterior nos permite visualizar rápidamente cuál es la tecnología de acceso a internet predominante en cada provincia, sin necesidad de ir a ver la tabla. En San Luis predomina la conexión vía Wireless, mientras que en San Juan y en Mendoza la Fibra Óptica. [Calculado cada 100 hogares en base solo al año 2024]
Ahora nos interesa ver cómo esas predominancias de unas u otras tecnologías se han modificado a lo largo del tiempo, razón por la cual volveremos a los datos 2014-2024.
tabla_tecnologias_hist <- base_combinada %>%
select(-starts_with("acc")) %>%
filter(Provincia %in% c("Mendoza", "San Luis", "San Juan")) %>%
group_by(Provincia, Año) %>%
summarise(adsl= sum(ADSL),
cablemodem= sum(Cablemodem),
fibra= sum(Fibra.Optica),
wireless= sum(Wireless),
otros= sum(Otros)) %>%
pivot_longer(cols= c (adsl, cablemodem, fibra, wireless, otros),
names_to = "Tecnología",
values_to= "Accesos")
Ahora que tenemos la información en la nueva tabla que contempla: Años, provincias y cantidades de acceso por cada tecnología vamos a graficar.
ggplot(data = tabla_tecnologias_hist, mapping = aes(x=Año, y= Accesos, fill = Tecnología, Tecnología))+
geom_bar(stat = "identity")+
scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"="#6B990F", "fibra"= "#0F6B99", "wireless"= "#260F99", "otros"= "#99540F"))+
scale_x_continuous(breaks = tabla_tecnologias_hist$Año)+
scale_y_continuous(labels = scales::comma)+
labs(title = "Evolución del tipo de tecnología predominante a través del tiempo",
subtitle = "Región cuyana- Período 2014-2024",
caption = "Fuente de datos del Enacom")+
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5),
plot.subtitle = element_text(hjust = 0.5),
plot.caption = element_text(hjust = 0.5))
El gráfico anterior nos muestra la evolución histórica del tipo de tecnología utilizada para acceder a internet en el período de 2014 a 2024 para la Región de Cuyo en general. A continuación veremos cómo ha sido la evolución en cada una de las tres provincias. Comenzando por San Luis
ggplot(data = tabla_tecnologias_hist %>% filter(Provincia== "San Luis"), mapping = aes(x=Año, y= Accesos, fill = Tecnología, Tecnología))+
geom_bar(stat = "identity")+
scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"="#6B990F", "fibra"= "#0F6B99", "wireless"= "#260F99", "otros"= "#99540F"))+
scale_x_continuous(breaks = tabla_tecnologias_hist$Año)+
scale_y_continuous(labels = scales::comma)+
labs(title = "Evolución del tipo de tecnología predominante a través del tiempo",
subtitle = "San Luis- Período 2014-2024",
caption = "Fuente de datos del Enacom")+
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5),
plot.subtitle = element_text(hjust = 0.5),
plot.caption = element_text(hjust = 0.5))
Veremos ahora el caso de Mendoza
ggplot(data = tabla_tecnologias_hist %>% filter(Provincia== "Mendoza"), mapping = aes(x=Año, y= Accesos, fill = Tecnología, Tecnología))+
geom_bar(stat = "identity")+
scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"="#6B990F", "fibra"= "#0F6B99", "wireless"= "#260F99", "otros"= "#99540F"))+
scale_x_continuous(breaks = tabla_tecnologias_hist$Año)+
scale_y_continuous(labels = scales::comma)+
labs(title = "Evolución del tipo de tecnología predominante a través del tiempo",
subtitle = "Mendoza- Período 2014-2024",
caption = "Fuente de datos del Enacom")+
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5),
plot.subtitle = element_text(hjust = 0.5),
plot.caption = element_text(hjust = 0.5))
Por último, analizaremos lo ocurrido en la provincia de San Juan, la que registra las menores tasas de acceso de la región.
ggplot(data = tabla_tecnologias_hist %>% filter(Provincia== "San Juan"), mapping = aes(x=Año, y= Accesos, fill = Tecnología, Tecnología))+
geom_bar(stat = "identity")+
scale_fill_manual(values = c("adsl"= "brown2", "cablemodem"="#6B990F", "fibra"= "#0F6B99", "wireless"= "#260F99", "otros"= "#99540F"))+
scale_x_continuous(breaks = tabla_tecnologias_hist$Año)+
scale_y_continuous(labels = scales::comma)+
labs(title = "Evolución del tipo de tecnología predominante a través del tiempo",
subtitle = "San Juan- Período 2014-2024",
caption = "Fuente de datos del Enacom")+
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5),
plot.subtitle = element_text(hjust = 0.5),
plot.caption = element_text(hjust = 0.5))
De los gráficos anteriores puede deducirse que San Luis ha tenido un
acceso vía Wireless y Fibra óptica más temprano que las otras dos
provincias, razón por la cual en 2024 registra pocos accesos mediante
adsl y Cablemodem. La tecnología predominante de acceso desde 2018 es el
Wireless con un crecimiento notable de la fibra entre 2023 y 2024. En el
caso de Mendoza, el acceso vía Wireless registra muy poco crecimiento y
hay una marcada predominancia de la Fibra óptica, desde 202, año de la
pandmeia por Covid-19, se evidencia un ritmo de crecimiento que ha
dejado por debajo a las otras tecnologías. San Juan, la provincia con
menor acceso a internet cada 100 hogares y cada 100 habitantes, tuvo
hasta 2020 altos índices de acceso vía adsl que fueron disminuyendo
progresivamente en relación al crecimiento de la Fibra óptica y del
Wireless.
El trabajo presentado tenía como principal interrogante el estado de conectividad de la región cuyana, que comprende tres provincias con marcadas diferencias entre si. San Luis, con un gran desarrollo de políticas públicas provinciales de inclusión a internet alcanza las mayores tasas de penetración de internet, cuya tecnología predominante de conexión es el Wireless, evidenciandose un marcado incremento de estas tasas a partir del 2018, consecuente con la mayor cantidad de inversión provincial realizada. Mendoza por su parte, registra un gran crecimiento en las tasas de penetración pero que aún no logran igualar a San Luis. Lo llamativo de la provincia es el crecimiento de los accesos vía Fibra óptica. Sería interesante analizar si hay una relación con los metros de fibra iluminados por la política pública nacional REFEFO. San Juan tiene una gran materia pendiente en garantizar el acceso a internet de su población, registrando las menores tasas de acceso y los crecimientos menos notables en conexiones de tipo Wireless y Fibra óptica. Con mejoras a raíz de la incidencia de la pandemia, que pbligó al estado provincial a invertir en la conectividad, aún le queda un largo recorrido para estar a la par de las otras provincias cuyanas.