La base de datos utilizada para el análisis contiene elementos sociodemográficos y tecnológicos de los participantes encuestados, de modo que indagan en aspectos como la edad, el sexo, el grupo etnico y categorias relacionadas con aspectos socioeconomicos, mientras que a su vez, contiene informacion del acesso de los encuestados a herramientas tegnologicas, como a su uso, esto mediante variables tanto categoricas como cuantitativas continuas que permitan un acercamiento directo a la informacion.
Esto es fundamental ya que nos permite encontrar una posible relación entre varios elementos sociodemográficos fundamentales para el funcionamiento de una sociedad y el acceso a la tecnología, demostrando que existe una problemática que afecta a cierto sector de la población y brinda limitaciones socioeconómicas considerables que limitan sus oportunidades tanto de utilizar recursos tecnológicos, como el acceso a otras necesidades sociales para el dia a dia, como úede ser la educación.
Con esto en mente, el objetivo del taller es realizar un análisis estadístico de las distintas variables sociodemográficas y tecnológicas, para así describir las principales características de la población y explorar posibles brechas sociales tanto en el acceso y uso de la tecnología, como a la educación.
# Cargar la base de datos
load("C:/Users/USUARIO/Downloads/datos.Rdata")
head(datos) #Se hizo una visualizacion de las primeras filas.
## id edad genero grupo_etnico zona educ_anios ocupacion
## 1 1 22 Mujer Mestizo/Blanco Urbana 11 Informal
## 2 2 43 Hombre Mestizo/Blanco Rural 11 Estudiante
## 3 3 31 Hombre Mestizo/Blanco Urbana 13 Informal
## 4 4 33 Mujer Mestizo/Blanco Urbana 6 Informal
## 5 5 31 Hombre Mestizo/Blanco Rural 7 Informal
## 6 6 46 No binarie Afrodescendiente Urbana 10 Estudiante
## ingreso_mensual smartphone internet_hogar horas_online_sem horas_redes_dia
## 1 534000 0 1 15.8 3.0
## 2 927000 1 1 25.1 1.1
## 3 4358000 0 1 0.0 0.7
## 4 568000 1 0 1.6 2.2
## 5 2516000 1 1 25.6 3.5
## 6 813000 0 1 27.4 3.2
## habilidad_digital fintech cuidados_horas_sem discriminacion_12m
## 1 81 Avanzado 25.7 0
## 2 77 Avanzado 15.5 0
## 3 59 Básico 40.5 1
## 4 35 Avanzado 21.9 1
## 5 49 Avanzado 14.3 0
## 6 60 Avanzado 41.6 1
## gasto_tec_mensual
## 1 63000
## 2 304000
## 3 95000
## 4 43000
## 5 134000
## 6 216000
dim(datos) # Se busco comprobar el tamaño del dataset
## [1] 900 17
names(datos) # Nombre de las variables
## [1] "id" "edad" "genero"
## [4] "grupo_etnico" "zona" "educ_anios"
## [7] "ocupacion" "ingreso_mensual" "smartphone"
## [10] "internet_hogar" "horas_online_sem" "horas_redes_dia"
## [13] "habilidad_digital" "fintech" "cuidados_horas_sem"
## [16] "discriminacion_12m" "gasto_tec_mensual"
str(datos) # Estructura en la que estan dispuestos los datos
## 'data.frame': 900 obs. of 17 variables:
## $ id : int 1 2 3 4 5 6 7 8 9 10 ...
## $ edad : num 22 43 31 33 31 46 26 29 36 29 ...
## $ genero : chr "Mujer" "Hombre" "Hombre" "Mujer" ...
## $ grupo_etnico : chr "Mestizo/Blanco" "Mestizo/Blanco" "Mestizo/Blanco" "Mestizo/Blanco" ...
## $ zona : chr "Urbana" "Rural" "Urbana" "Urbana" ...
## $ educ_anios : num 11 11 13 6 7 10 14 4 9 7 ...
## $ ocupacion : chr "Informal" "Estudiante" "Informal" "Informal" ...
## $ ingreso_mensual : num 534000 927000 4358000 568000 2516000 ...
## $ smartphone : int 0 1 0 1 1 0 1 0 1 1 ...
## $ internet_hogar : int 1 1 1 0 1 1 1 0 0 0 ...
## $ horas_online_sem : num 15.8 25.1 0 1.6 25.6 27.4 11.4 13.4 19.3 19.5 ...
## $ horas_redes_dia : num 3 1.1 0.7 2.2 3.5 3.2 2.2 3.3 3.5 3.1 ...
## $ habilidad_digital : num 81 77 59 35 49 60 69 13 23 24 ...
## $ fintech : chr "Avanzado" "Avanzado" "Básico" "Avanzado" ...
## $ cuidados_horas_sem: num 25.7 15.5 40.5 21.9 14.3 41.6 24.6 7.4 23.5 8.5 ...
## $ discriminacion_12m: int 0 0 1 1 0 1 0 0 1 1 ...
## $ gasto_tec_mensual : num 63000 304000 95000 43000 134000 216000 180000 142000 253000 156000 ...
summary(datos) # Resumen de los datos
## id edad genero grupo_etnico
## Min. : 1.0 Min. :18.00 Length:900 Length:900
## 1st Qu.:225.8 1st Qu.:27.00 Class :character Class :character
## Median :450.5 Median :34.00 Mode :character Mode :character
## Mean :450.5 Mean :34.35
## 3rd Qu.:675.2 3rd Qu.:41.00
## Max. :900.0 Max. :67.00
## zona educ_anios ocupacion ingreso_mensual
## Length:900 Min. : 3.00 Length:900 Min. : 178000
## Class :character 1st Qu.:10.00 Class :character 1st Qu.:1126750
## Mode :character Median :12.00 Mode :character Median :1729500
## Mean :12.11 Mean :2093117
## 3rd Qu.:14.00 3rd Qu.:2692750
## Max. :20.00 Max. :9520000
## smartphone internet_hogar horas_online_sem horas_redes_dia
## Min. :0.0000 Min. :0.0000 Min. : 0.00 Min. :0.000
## 1st Qu.:1.0000 1st Qu.:0.0000 1st Qu.:14.70 1st Qu.:1.900
## Median :1.0000 Median :1.0000 Median :19.90 Median :2.700
## Mean :0.7844 Mean :0.7478 Mean :19.86 Mean :2.673
## 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:25.00 3rd Qu.:3.500
## Max. :1.0000 Max. :1.0000 Max. :43.20 Max. :6.900
## habilidad_digital fintech cuidados_horas_sem discriminacion_12m
## Min. : 0.00 Length:900 Min. : 0.00 Min. :0.0000
## 1st Qu.: 40.00 Class :character 1st Qu.:13.60 1st Qu.:0.0000
## Median : 52.00 Mode :character Median :20.75 Median :0.0000
## Mean : 52.37 Mean :20.99 Mean :0.2667
## 3rd Qu.: 64.25 3rd Qu.:28.00 3rd Qu.:1.0000
## Max. :100.00 Max. :48.90 Max. :1.0000
## gasto_tec_mensual
## Min. : 0
## 1st Qu.:120750
## Median :170000
## Mean :172049
## 3rd Qu.:216000
## Max. :527000
#Diccionario básico de variables
diccionario <- data.frame(
Variable = c(
"id","edad","genero","grupo_etnico","zona","educ_anios","ocupacion",
"ingreso_mensual","smartphone","internet_hogar","horas_online_sem",
"horas_redes_dia","habilidad_digital","fintech","cuidados_horas_sem",
"discriminacion_12m","gasto_tec_mensual"
),
Descripcion = c(
"Identificador unico de cada persona",
"Edad",
"Sexo o identidad de genero",
"Grupo etnico de pertenencia",
"Zona de residencia",
"Años de educacion formal aprobados",
"Actividad principal u ocupacion",
"Ingreso mensual en pesos",
"Tenencia de smartphone",
"Acceso a internet en el hogar",
"Horas conectadas a internet por semana",
"Horas diarias dedicadas a redes sociales",
"Nivel de habilidades digitales",
"Uso de servicios financieros digitales",
"Horas dedicadas al trabajo de cuidado por semana",
"Experiencia de discriminación en los ultimos 12 meses",
"Gasto mensual en tecnologia"
),
Nivel_medicion = c(
"Nominal","Razon","Nominal","Nominal","Nominal","Razon","Nominal",
"Razon","Nominal","Nominal","Razon","Razon","Intervalo","Nominal",
"Razon","Nominal","Razon"
),
Escala = c(
"Identificador",
"Tiempo de vida",
"Categorías de género",
"Categorias étnicas",
"Urbana/Rural",
"Numero de la edad",
"Categorias ocupacionales",
"Pesos",
"0 = No, 1 = Si",
"0 = No, 1 = Si",
"Horas por semana",
"Horas por dia",
"0–100",
"Si/No",
"Horas por semana",
"0 = No, 1 = Si",
"Pesos"
),
stringsAsFactors = FALSE
)
#se identifican los valores que son NA utilizando is.na
colSums(is.na(datos))
## id edad genero grupo_etnico
## 0 0 0 0
## zona educ_anios ocupacion ingreso_mensual
## 0 0 0 0
## smartphone internet_hogar horas_online_sem horas_redes_dia
## 0 0 0 0
## habilidad_digital fintech cuidados_horas_sem discriminacion_12m
## 0 0 0 0
## gasto_tec_mensual
## 0
colMeans(is.na(datos)) * 100
## id edad genero grupo_etnico
## 0 0 0 0
## zona educ_anios ocupacion ingreso_mensual
## 0 0 0 0
## smartphone internet_hogar horas_online_sem horas_redes_dia
## 0 0 0 0
## habilidad_digital fintech cuidados_horas_sem discriminacion_12m
## 0 0 0 0
## gasto_tec_mensual
## 0
En la base de datos no se encontró la presencia de valores NA, por lo que se procede sin la obligación de utilizar funciones de filtros que los eliminen.
Edad:
library(psych)
## Warning: package 'psych' was built under R version 4.4.3
library(lsr)
## Warning: package 'lsr' was built under R version 4.4.3
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
library(dplyr)
mean(datos$edad, na.rm = T) # Media
## [1] 34.35
median(datos$edad, na.rm = T) # Mediana
## [1] 34
mean(datos$edad, na.rm = T, trim = 0.05) # Media recortada
## [1] 34.02593
range(datos$edad, na.rm = T) # Rango
## [1] 18 67
quantile(datos$edad, probs = c(0.25, 0.5, 0.75), na.rm = T) # Cuartiles
## 25% 50% 75%
## 27 34 41
var(datos$edad, na.rm = T) # Varianza
## [1] 106.0253
sd(datos$edad, na.rm = T) # Asimetría
## [1] 10.29686
summary(datos$edad)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18.00 27.00 34.00 34.35 41.00 67.00
library(ggplot2)
##
## Adjuntando el paquete: 'ggplot2'
## The following objects are masked from 'package:psych':
##
## %+%, alpha
library(dplyr)
ggplot(datos, aes(x = edad)) +
geom_histogram(binwidth = 5, fill = "steelblue", color = "black") +
labs(
title = "Distribución de la edad",
x = "Edad",
y = "Frecuencia"
) +
theme_minimal()
La primera variable evaluada es la edad, que sepresenta un promedio de 34.35 años y una media de 34 años, lo que indica que la distribución de la edad en la muestra es relativamente equilibrada de este valor central. El rango de edad va desde los 18 hasta los 67 años. Los cuartiles indican que el 25% de los individuos tiene 27 años o menos, mientras que el 75% tiene 41 años o menos, lo que sugiere que la población está centrada desde la adultez joven hasta los inicios de la tercera edad, así como una concentración importante en los adultos jóvenes, la distribución estándar es de aproximadamente 10.30 años, lo que refleja una variabilidad moderada en las edades, que continúa mostrando un énfasis por la adultez joven y media. En la distribución, la asimetría es ligeramente positiva con (0.33), indicando una leve tendencia hacia las edades mayores. Por su parte, la curtosis es negativa (-0,39), lo que sugiere una distribución ligeramente más aplanada que una distribución normal. Estos datos reflejan que la muestra se concentra principalmente en la población adulta joven, descartando etapas previas o la adultez mayor.
Años de educación:
library(dplyr)
# Años de educación
mean(datos$educ_anios, na.rm = T)
## [1] 12.11333
median(datos$educ_anios, na.rm = T)
## [1] 12
mean(datos$educ_anios, na.rm = T, trim = 0.05)
## [1] 12.11605
range(datos$educ_anios, na.rm = T)
## [1] 3 20
quantile(datos$educ_anios, probs = c(0.25, 0.5, 0.75), na.rm = T)
## 25% 50% 75%
## 10 12 14
var(datos$educ_anios, na.rm = T)
## [1] 9.217397
sd(datos$educ_anios, na.rm = T)
## [1] 3.036017
skew(datos$educ_anios, na.rm = T)
## [1] -0.01114518
kurtosi(datos$educ_anios, na.rm = T)
## [1] -0.06359317
summary(datos$educ_anios)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.00 10.00 12.00 12.11 14.00 20.00
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = educ_anios)) +
geom_histogram(binwidth = 1, fill = "darkorange", color = "black") +
labs(title = "años de educación", x = "Años de educación", y = "Frecuencia") +
theme_minimal()
La variable años de educación muestra una media de 12.11 años con una mediana de 12 años, lo que indica que la mayoría de encuestados ha alcanzado un nivel educativo equivalente a terminar el bachiller. La media recortada no varía de forma considerable, con 12,12 años. El rango de la variable va desde los 3 hasta los 20 años de educación, lo que muestra lo volátil que es el acceso a la educación, que permite que existan casos donde apenas estuvieron unos años en la escuela antes de abandonar, contra personas que alcanzaron a completar el máximo nivel de educación disponible. Los cuartiles indican que el 25% de los individuos tiene 10 años de educación o menos, mientras que el 75% posee 14 años o menos, lo que sugiere que la mayor parte de la educacion se concentra en la educacion media/bachiller. La desviación estándar es de aproximadamente 3,04 años, lo que indica una dispersión moderada de los datos sobre los niveles educativos. En cuanto a la forma de la distribución, la asimetría es prácticamente nula (-0,01), lo que sugiere una distribución bastante simétrica. Asimismo, la curtosis es ligeramente negativa (-0,06), indicando una distribución muy cercana a la normal y levemente más aplanada. Esto muestra como en el contexto social de los encuestados la posibilidad de acceder a una educación superior como la universidad es mínima y está destinada a una población con recursos económicos o sociales específicos.
Ingreso mensual
library(dplyr)
# Ingreso mensual
mean(datos$ingreso_mensual, na.rm = T)
## [1] 2093117
median(datos$ingreso_mensual, na.rm = T)
## [1] 1729500
mean(datos$ingreso_mensual, na.rm = T, trim = 0.05)
## [1] 1957156
range(datos$ingreso_mensual, na.rm = T)
## [1] 178000 9520000
quantile(datos$ingreso_mensual, probs = c(0.25, 0.5, 0.75), na.rm = T)
## 25% 50% 75%
## 1126750 1729500 2692750
var(datos$ingreso_mensual, na.rm = T)
## [1] 1.866948e+12
sd(datos$ingreso_mensual, na.rm = T)
## [1] 1366363
skew(datos$ingreso_mensual, na.rm = T)
## [1] 1.70768
kurtosi(datos$ingreso_mensual, na.rm = T)
## [1] 4.115157
summary(datos$ingreso_mensual)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 178000 1126750 1729500 2093117 2692750 9520000
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = "", y = ingreso_mensual)) +
geom_boxplot(fill = "darkgreen") +
labs(title = "Diagrama de caja del ingreso mensual", x = "", y = "Ingreso mensual") +
theme_minimal()
El ingreso mensual muestra una media de aproximadamente 2.093.117 pesos y una mediana de 1.729.500 pesos, lo que parece indicar que la distribución del ingreso está ligeramente sesgada hacia valores más altos. Por otro lado, la media recortada es de 1.957.156 es menor que la media simple, lo que confirma la presencia de ingresos altos que elevan los resultados de la media. El rango del ingreso es amplio, variando desde 178.000 hasta 9.520.000 pesos mensuales. Los cuartiles muestran que el 25% de los encuestados gana menos de 1.126.750 mientras que el 75% percibe menos de 2.692.750 pesos, demostrando que aquellos con un ingreso mensual alto son minoría y casos atípicos que crean una desviación respecto a la media . La desviación estándar es de aproximadamente 1.366.363 pesos, lo que significa un alto nivel de dispersión en los niveles de ingreso. Además, la asimetría positiva (1,71) y la curtosis elevada (4,12) indican una distribución con cola hacia valores altos y presencia de ingresos significativamente mayores en una pequeña parte de la muestra
Horas conectadas a internet por semana
library(dplyr)
# Horas online por semana
mean(datos$horas_online_sem, na.rm = T)
## [1] 19.85833
median(datos$horas_online_sem, na.rm = T)
## [1] 19.9
range(datos$horas_online_sem, na.rm = T)
## [1] 0.0 43.2
quantile(datos$horas_online_sem, probs = c(0.25, 0.5, 0.75), na.rm = T)
## 25% 50% 75%
## 14.7 19.9 25.0
var(datos$horas_online_sem, na.rm = T)
## [1] 56.79654
sd(datos$horas_online_sem, na.rm = T)
## [1] 7.536348
skew(datos$horas_online_sem, na.rm = T)
## [1] -0.04921578
kurtosi(datos$horas_online_sem, na.rm = T)
## [1] -0.08548418
summary(datos$horas_online_sem)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 14.70 19.90 19.86 25.00 43.20
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = horas_online_sem)) +
geom_histogram(binwidth = 2, fill = "purple", color = "black") +
labs(title = "Histograma de horas conectadas a internet por semana", x = "Horas online por semana", y = "Frecuencia") +
theme_minimal()
La variable horas conectadas a internet por semana demuestra una media de 19.86 horas y una mediana de 19.9 horas, que indican una distribución bastante equilibrada alrededor del valor central. El rango está desde 0 hasta 43.2 horas semanales, mostrando que existen individuos con un muy bajo nivel de conexión y otros con uso intensivo de internet . Los cuartiles demuestran que el 25% de las personas se conectan menos de 14.7 horas a la semana, mientras que el 75% lo hace menos de 25 horas. La desviación estándar varia en 7.54, lo que parece mostrar una variabilidad moderada en el uso de internet. La asimetría es prácticamente nula (-0,05) y la curtosis también cercana a cero (-0,09), lo que indica que la distribución es bastante cercana a una distribución normal.
Horas dedicadas a redes sociales
library(dplyr)
# Horas en redes sociales al día
mean(datos$horas_redes_dia, na.rm = T)
## [1] 2.673333
median(datos$horas_redes_dia, na.rm = T)
## [1] 2.7
range(datos$horas_redes_dia, na.rm = T)
## [1] 0.0 6.9
quantile(datos$horas_redes_dia, probs = c(0.25, 0.5, 0.75), na.rm = T)
## 25% 50% 75%
## 1.9 2.7 3.5
var(datos$horas_redes_dia, na.rm = T)
## [1] 1.497998
sd(datos$horas_redes_dia, na.rm = T)
## [1] 1.223927
skew(datos$horas_redes_dia, na.rm = T)
## [1] 0.05648705
kurtosi(datos$horas_redes_dia, na.rm = T)
## [1] -0.2267891
summary(datos$horas_redes_dia)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 1.900 2.700 2.673 3.500 6.900
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = horas_redes_dia)) +
geom_histogram(binwidth = 0.5, fill = "tomato", color = "black") +
labs(title = "Histograma de horas en redes sociales por día", x = "Horas en redes sociales", y = "Frecuencia") +
theme_minimal()
El tiempo dedicado a las redes sociales tiene una media de 2.67 horas diarias y una mediana de 2.7 horas que sugieren una distribucion equilibrada. El rango se encuentra con un valor minimo de 0 y un valor maximo de 6.9 horas al dia, resultado que evidencia unas considerables diferencias en los habitos de uso e introduce un factor de accesibilidad en esta, resultado que da fuerza al planteamiento que afirma que existe una brecha en el acceso a la tegnologia, de modo que unas poblaciones se vean favorecidas de esto que otras. La desviación estándar es de aproximadamente 1,22 horas, lo que refleja una variabilidad relativamente moderada. La asimetría (0,06) y la curtosis (-0,23) indican que la distribución es bastante simétrica y ligeramente más aplanada que una distribución normal.
Nivel de habilidad digital
library(dplyr)
# Habilidad digital
mean(datos$habilidad_digital, na.rm = T)
## [1] 52.36667
median(datos$habilidad_digital, na.rm = T)
## [1] 52
range(datos$habilidad_digital, na.rm = T)
## [1] 0 100
quantile(datos$habilidad_digital, probs = c(0.25, 0.5, 0.75), na.rm = T)
## 25% 50% 75%
## 40.00 52.00 64.25
var(datos$habilidad_digital, na.rm = T)
## [1] 325.9611
sd(datos$habilidad_digital, na.rm = T)
## [1] 18.05439
skew(datos$habilidad_digital, na.rm = T)
## [1] -0.01746489
kurtosi(datos$habilidad_digital, na.rm = T)
## [1] -0.1797208
summary(datos$habilidad_digital)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 40.00 52.00 52.37 64.25 100.00
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = habilidad_digital)) +
geom_histogram(bins = 15, fill = "purple", color = "black") +
labs(
title = "Distribución de la habilidad digital",
x = "Habilidad digital",
y = "Frecuencia"
) +
theme_minimal()
El nivel de las habilidades digitales presenta una media de 52.37 puntos y una mediana de 52 puntos en un sistema de escala de 0 a 100, lo que sugiere que en promedio, los individuos poseen un nivel intermedio de competencia digitales, sugiriendo que aquellos con habilidades avanzadas son una minoría dentro de los encuestados. El rango de valores es alto, desde un valor minimo de 0 hasta un valor máximo de 100, demostrando la existencia de una considerable diferencia de las capacidades tecnológicas de la población, donde la posibilidad de que no exista ninguna familiaridad con la tecnología está presente. La desviación estándar es de aproximadamente 18,05 puntos, lo que sugiere una variabilidad considerable en estas competencias, que puede estar ligada con la experiencia de los encuestados con la tecnología y su uso. La asimetría (-0,02) y la curtosis (-0,18) indican que la distribución es bastante simétrica y cercana a una distribución normal.
Horas de cuidado por semana
library(dplyr)
# Horas de cuidado por semana
mean(datos$cuidados_horas_sem, na.rm = T)
## [1] 20.98978
median(datos$cuidados_horas_sem, na.rm = T)
## [1] 20.75
range(datos$cuidados_horas_sem, na.rm = T)
## [1] 0.0 48.9
quantile(datos$cuidados_horas_sem, probs = c(0.25, 0.5, 0.75), na.rm = T)
## 25% 50% 75%
## 13.60 20.75 28.00
var(datos$cuidados_horas_sem, na.rm = T)
## [1] 111.3735
sd(datos$cuidados_horas_sem, na.rm = T)
## [1] 10.55336
skew(datos$cuidados_horas_sem, na.rm = T)
## [1] 0.09842583
kurtosi(datos$cuidados_horas_sem, na.rm = T)
## [1] -0.4876568
summary(datos$cuidados_horas_sem)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 13.60 20.75 20.99 28.00 48.90
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = cuidados_horas_sem)) +
geom_histogram(binwidth = 2, fill = "goldenrod", color = "black") +
labs(title = "Histograma horas de cuidado por semana", x = "Horas de cuidado", y = "Frecuencia") +
theme_minimal()
La variable de horas dedicadas al trabajo de cuidado presenta una media de 20.99 horas semanales, acompañado de una mediana de 20.75 horas, que propone la posibilidad de una distribución relativamente equilibrada. El rango va desde un valor mínimo de 0 hasta un valor máximo de 48.9 horas semanales, lo que muestra importantes diferencias en la carga de trabajo de cuidado entre los diferentes individuos encuestados. Esto a su vez sugiere la posibilidad de que variables externas influyan en este resultado. La desviación estándar encontrada es de 10.55 horas, lo que indica una discordancia entre las horas de cuidado que dedican los individuos, esto al presentar una variabilidad moderada. La asimetría positiva leve (0,10) sugiere que algunos individuos presentan cargas de cuidado más altas que el promedio, mientras que la curtosis negativa (-0,49) indica una distribución ligeramente más aplanada.
Gasto tecnológico mensual
library(dplyr)
# Gasto tecnológico mensual
mean(datos$gasto_tec_mensual, na.rm = T)
## [1] 172048.9
median(datos$gasto_tec_mensual, na.rm = T)
## [1] 170000
mean(datos$gasto_tec_mensual, na.rm = T, trim = 0.05)
## [1] 169907.4
range(datos$gasto_tec_mensual, na.rm = T)
## [1] 0 527000
quantile(datos$gasto_tec_mensual, probs = c(0.25, 0.5, 0.75), na.rm = T)
## 25% 50% 75%
## 120750 170000 216000
var(datos$gasto_tec_mensual, na.rm = T)
## [1] 5911185594
sd(datos$gasto_tec_mensual, na.rm = T)
## [1] 76884.24
skew(datos$gasto_tec_mensual, na.rm = T)
## [1] 0.4513505
kurtosi(datos$gasto_tec_mensual, na.rm = T)
## [1] 0.7459128
summary(datos$gasto_tec_mensual)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0 120750 170000 172049 216000 527000
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = "", y = gasto_tec_mensual)) +
geom_boxplot(fill = "deepskyblue4") +
labs(title = "Diagrama de caja del gasto tecnológico mensual", x = "", y = "Gasto tecnológico mensual") +
theme_minimal()
El gasto tecnológico mensual muestra una media de 172.049 pesos, asi como una mediana de 170.000 pesos, resultados que indican que el promedio no esta fuertemente afectado por valores extremos. La media recortada es similar a la media simple, aspecto que sugiere una distribución relativamente estable de los datos. El rango del gasto tecnológico va desde un valor mínimo de 0 hasta uno máximo de 527.000 pesos mensuales lo que refleja una variabilidad moderada en el gasto. La asimetría positiva (0,45) indica una ligera concentración de valores bajos con algunos individuos que presentan gastos tecnológicos más elevados, mostrando que aquellos individuos que pueden invertir en gastos tegnologicos elevados son pocos a comparacion de los que invierten en gastos tegnologicos bajos o moderados.
Género
library(dplyr)
# Género
table(datos$genero)
##
## Hombre Mujer No binarie Prefiere no decir
## 383 478 26 13
prop.table(table(datos$genero)) * 100
##
## Hombre Mujer No binarie Prefiere no decir
## 42.555556 53.111111 2.888889 1.444444
modeOf(datos$genero)
## [1] "Mujer"
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = genero, fill = genero)) +
geom_bar() +
labs(title = "Distribución por género", x = "Género", y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none")
La distribución por género muestra que la mayor proporción de participantes se identifica como mujer (53.1%), seguida por hombre (42.6%). Las categorías no binarie (2.9%) y prefiere no decir (1.4%) presentan proporciones considerablemente menores dentro de la muestra. Estos resultados sugieren una ligera mayor representación femenina en el conjunto de datos, aunque también evidencian la presencia de identidades de género diversas, lo cual introduce un elemento de pluralidad dentro de la población analizada.
Grupo étnico
library(dplyr)
# Grupo étnico
table(datos$grupo_etnico)
##
## Afrodescendiente Indígena Mestizo/Blanco Otro
## 191 108 568 15
## Raizal Rrom
## 10 8
prop.table(table(datos$grupo_etnico)) * 100
##
## Afrodescendiente Indígena Mestizo/Blanco Otro
## 21.2222222 12.0000000 63.1111111 1.6666667
## Raizal Rrom
## 1.1111111 0.8888889
modeOf(datos$grupo_etnico)
## [1] "Mestizo/Blanco"
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = grupo_etnico, fill = grupo_etnico)) +
geom_bar() +
labs(title = "Distribución por grupo étnico", x = "Grupo étnico", y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none",
axis.text.x = element_text(angle = 45, hjust = 1))
En cuanto a la composición étnica, la mayoría de los participantes se identifica como mestizo/blanco (63.1%), lo que indica que este grupo representa la mayor parte de la muestra. En segundo lugar se encuentran los afrodescendientes (21.2%), seguidos por los indígenas (12%). Los grupos raizal (1.1%), rrom (0.9%) y otros (1.7%) presentan una participación significativamente menor. Esta distribución sugiere que, aunque existe diversidad étnica en la muestra, algunos grupos están menos representados, lo cual puede reflejar tanto su menor presencia demográfica como posibles limitaciones en la representación dentro del estudio.
Zona de residencia
library(dplyr)
# Zona
table(datos$zona)
##
## Rural Urbana
## 236 664
prop.table(table(datos$zona)) * 100
##
## Rural Urbana
## 26.22222 73.77778
modeOf(datos$zona)
## [1] "Urbana"
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = zona, fill = zona)) +
geom_bar() +
labs(title = "Distribución por zona de residencia", x = "Zona", y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none")
La variable zona de residencia indica que la mayoría de los participantes vive en zonas urbanas (73.8%), mientras que 26.2% reside en zonas rurales. Esta distribución evidencia una clara predominancia de población urbana en la muestra, lo que puede estar relacionado con mayores niveles de acceso a servicios, infraestructura digital y oportunidades económicas en contextos urbanos.
Ocupación
library(dplyr)
# Ocupación
table(datos$ocupacion)
##
## Desempleo Estudiante Formal Informal
## 19 209 242 430
prop.table(table(datos$ocupacion)) * 100
##
## Desempleo Estudiante Formal Informal
## 2.111111 23.222222 26.888889 47.777778
modeOf(datos$ocupacion)
## [1] "Informal"
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = ocupacion, fill = ocupacion)) +
geom_bar() +
labs(title = "Distribución por ocupación", x = "Ocupación", y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none",
axis.text.x = element_text(angle = 45, hjust = 1))
En relación con la ocupación, el grupo más numeroso corresponde a quienes trabajan en el sector informal (47.8%), seguido por personas con empleo formal (26.9%) y estudiantes (23.2%). Por otro lado, la proporción de personas en situación de desempleo (2.1%) es relativamente baja. Estos resultados sugieren una fuerte presencia de actividades económicas informales dentro de la población analizada, lo que podría estar asociado a dinámicas del mercado laboral caracterizadas por menor estabilidad laboral y mayor flexibilidad en los ingresos.
Acceso a tecnología
library(dplyr)
# Smartphone
table(datos$smartphone)
##
## 0 1
## 194 706
prop.table(table(datos$smartphone)) * 100
##
## 0 1
## 21.55556 78.44444
modeOf(datos$smartphone)
## [1] 1
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = factor(smartphone, labels = c("No", "Sí")),
fill = factor(smartphone, labels = c("No", "Sí")))) +
geom_bar() +
labs(title = "Tenencia de smartphone", x = "Smartphone", y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none")
Respecto al acceso a dispositivos y conectividad, se observa que 78.4% de los participantes posee smartphone, mientras que 21.6% no dispone de este tipo de dispositivo. En cuanto al acceso a internet en el hogar, el 74.8% reporta contar con conexión, mientras que 25.2% no dispone de este servicio. Estos resultados muestran que, aunque el acceso a tecnología es relativamente alto dentro de la muestra, todavía existe un apartado importante de la población que enfrenta limitaciones en términos de conectividad digital.
Uso de servicios financieros digitales (Fintech)
library(dplyr)
# Fintech
table(datos$fintech)
##
## Avanzado Básico Ninguno
## 463 358 79
prop.table(table(datos$fintech)) * 100
##
## Avanzado Básico Ninguno
## 51.444444 39.777778 8.777778
modeOf(datos$fintech)
## [1] "Avanzado"
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = fintech, fill = fintech)) +
geom_bar() +
labs(title = "Uso de servicios financieros digitales", x = "Nivel de uso fintech", y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none")
El uso de servicios financieros digitales presenta tres niveles de adopción. La mayoría de los participantes reporta un uso avanzado (51.4%), seguido por uso básico (39.8%), mientras que 8.8% indica no utilizar este tipo de servicios. Esta distribución sugiere una adopción relativamente amplia de herramientas financieras digitales, aunque aún existe una parte de la población que permanece excluida de estas tecnologías.
Internet en el hogar
library(dplyr)
table(datos$internet_hogar)
##
## 0 1
## 227 673
prop.table(table(datos$internet_hogar)) * 100
##
## 0 1
## 25.22222 74.77778
modeOf(datos$internet_hogar)
## [1] 1
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = factor(internet_hogar, labels = c("No", "Sí")),
fill = factor(internet_hogar, labels = c("No", "Sí")))) +
geom_bar() +
labs(title = "Acceso a internet en el hogar", x = "Internet en el hogar", y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none")
Experiencia de discriminación
library(dplyr)
# Discriminación últimos 12 meses
table(datos$discriminacion_12m)
##
## 0 1
## 660 240
prop.table(table(datos$discriminacion_12m)) * 100
##
## 0 1
## 73.33333 26.66667
modeOf(datos$discriminacion_12m)
## [1] 0
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = factor(discriminacion_12m, labels = c("No", "Sí")),
fill = factor(discriminacion_12m, labels = c("No", "Sí")))) +
geom_bar() +
labs(title = "Experiencia de discriminación en los últimos 12 meses", x = "Discriminación", y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none")
En lo qu respecta a la experiencia de discriminación durante los últimos 12 meses, el 73.3% de los participantes señala no haber experimentado discriminación, mientras que 26.7% reporta haber vivido este tipo de situaciones. Aunque la mayoría no reporta experiencias recientes de discriminación, el hecho de que más de una cuarta parte de los participantes sí lo haya experimentado indica que estas dinámicas continúan presentes dentro de ciertos contextos sociales, lo que nos permite entender que no es un fenomeno al que le han encontrado solucion, sino uno que aun se busca minimizar e invisibilizar.
library(psych)
library(lsr)
library(dplyr)
library(knitr)
resumen_genero <- datos %>%
group_by(genero) %>%
summarise(
media_edad = mean(edad, na.rm = T),
media_educ = mean(educ_anios, na.rm = T),
media_ingreso = mean(ingreso_mensual, na.rm = T),
media_online = mean(horas_online_sem, na.rm = T),
media_redes = mean(horas_redes_dia, na.rm = T),
media_habilidad = mean(habilidad_digital, na.rm = T),
media_cuidados = mean(cuidados_horas_sem, na.rm = T),
media_gasto = mean(gasto_tec_mensual, na.rm = T),
des_est_ingreso = sd(ingreso_mensual, na.rm = T),
min_ingreso = min(ingreso_mensual, na.rm = T),
max_ingreso = max(ingreso_mensual, na.rm = T)
)
resumen_genero[,-1] <- round(resumen_genero[,-1], 2)
resumen_genero
## # A tibble: 4 × 12
## genero media_edad media_educ media_ingreso media_online media_redes
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Hombre 35.0 12.2 2166736. 19.7 2.69
## 2 Mujer 33.8 12.0 2012703. 19.9 2.63
## 3 No binarie 33.4 12.4 2333538. 20.4 2.87
## 4 Prefiere no decir 37.5 12.5 2400077. 20.9 3.24
## # ℹ 6 more variables: media_habilidad <dbl>, media_cuidados <dbl>,
## # media_gasto <dbl>, des_est_ingreso <dbl>, min_ingreso <dbl>,
## # max_ingreso <dbl>
kable(resumen_genero)
| genero | media_edad | media_educ | media_ingreso | media_online | media_redes | media_habilidad | media_cuidados | media_gasto | des_est_ingreso | min_ingreso | max_ingreso |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Hombre | 34.99 | 12.20 | 2166736 | 19.73 | 2.69 | 51.96 | 17.84 | 173156.7 | 1446069 | 178000 | 9404000 |
| Mujer | 33.80 | 12.02 | 2012703 | 19.91 | 2.63 | 52.79 | 23.57 | 169424.7 | 1260997 | 257000 | 8953000 |
| No binarie | 33.35 | 12.42 | 2333538 | 20.35 | 2.87 | 54.77 | 20.71 | 200307.7 | 1860228 | 391000 | 9520000 |
| Prefiere no decir | 37.46 | 12.54 | 2400077 | 20.91 | 3.24 | 43.77 | 19.33 | 179384.6 | 1491403 | 1185000 | 6828000 |
# Comparación de variables categóricas por género
table(datos$genero, datos$smartphone)
##
## 0 1
## Hombre 85 298
## Mujer 103 375
## No binarie 4 22
## Prefiere no decir 2 11
prop.table(table(datos$genero, datos$smartphone), 1) * 100
##
## 0 1
## Hombre 22.19321 77.80679
## Mujer 21.54812 78.45188
## No binarie 15.38462 84.61538
## Prefiere no decir 15.38462 84.61538
table(datos$genero, datos$internet_hogar)
##
## 0 1
## Hombre 90 293
## Mujer 121 357
## No binarie 10 16
## Prefiere no decir 6 7
prop.table(table(datos$genero, datos$internet_hogar), 1) * 100
##
## 0 1
## Hombre 23.49869 76.50131
## Mujer 25.31381 74.68619
## No binarie 38.46154 61.53846
## Prefiere no decir 46.15385 53.84615
table(datos$genero, datos$fintech)
##
## Avanzado Básico Ninguno
## Hombre 196 159 28
## Mujer 248 185 45
## No binarie 12 10 4
## Prefiere no decir 7 4 2
prop.table(table(datos$genero, datos$fintech), 1) * 100
##
## Avanzado Básico Ninguno
## Hombre 51.174935 41.514360 7.310705
## Mujer 51.882845 38.702929 9.414226
## No binarie 46.153846 38.461538 15.384615
## Prefiere no decir 53.846154 30.769231 15.384615
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = genero, y = ingreso_mensual, fill = genero)) +
geom_boxplot() +
labs(
title = "Ingreso mensual según género",
x = "Género",
y = "Ingreso mensual"
) +
theme_minimal() +
theme(legend.position = "none")
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = genero, y = cuidados_horas_sem, fill = genero)) +
geom_boxplot() +
labs(
title = "Horas de cuidado por semana según género",
x = "Género",
y = "Horas de cuidado por semana"
) +
theme_minimal() +
theme(legend.position = "none")
library(ggplot2)
library(dplyr)
smart_genero <- datos %>%
group_by(genero, smartphone) %>%
summarise(n = n(), .groups = "drop") %>%
group_by(genero) %>%
mutate(porcentaje = n / sum(n) * 100)
ggplot(smart_genero,
aes(x = genero,
y = porcentaje,
fill = factor(smartphone, labels = c("No", "Sí")))) +
geom_col(position = "stack") +
labs(
title = "Acceso a smartphone según género",
x = "Género",
y = "Porcentaje",
fill = "Smartphone"
) +
theme_minimal()
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = grupo_etnico, y = ingreso_mensual, fill = grupo_etnico)) +
geom_boxplot() +
labs(
title = "Ingreso mensual según grupo étnico",
x = "Grupo étnico",
y = "Ingreso mensual"
) +
theme_minimal() +
theme(
legend.position = "none",
axis.text.x = element_text(angle = 45, hjust = 1)
)
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = grupo_etnico, y = habilidad_digital, fill = grupo_etnico)) +
geom_boxplot() +
labs(
title = "Habilidad digital según grupo étnico",
x = "Grupo étnico",
y = "Habilidad digital"
) +
theme_minimal() +
theme(
legend.position = "none",
axis.text.x = element_text(angle = 45, hjust = 1)
)
Entre las variables y factores más importantes de la base de datos se encuentra el género. De la cual, en sus resultados se pudo encontrar diferencias moderadas en variables socioeconómicas y de acceso tecnológico. En términos de edad promedio, los hombres presentan una media de 34.99 años, las mujeres 33.80 años y las personas no binarias 33.35 años, lo que indica que la distribución etaria es relativamente similar entre los grupos.
En relación con el nivel educativo, los años promedio de educación formal se mantienen cercanos a 12 años para todos los grupos, lo que sugiere que no existen diferencias educativas sustanciales por genero dentro de la muestra.
En cuanto al ingreso mensual promedio, se observa que los hombres presentan un ingreso medio de aproximadamente 2.17 millones de pesos, mientras que las mujeres registran un ingreso promedio ligeramente menor de 2.01 millones de pesos. Las personas no binarias presentan un ingreso promedio más alto (aproximadamente 2.33 millones), aunque este resultado debe interpretarse con mesura debido al menor tamaño de este grupo dentro de la muestra. Las personas que prefirieron no declarar su género registran el ingreso promedio más alto (2.40 millones de pesos).
Un patrón que da un indicio relevante aparece en la distribución del trabajo de cuidado. Que nos empieza a hablar de las diferencias sociales presentes entre los generos, que nos hablan de una presión adicional hacia las mujeres respecto a los hombres, quienes dedican en promedio 23.57 horas semanales a actividades de cuidado, significativamente más que los hombres, quienes dedican aproximadamente 17.84 horas. Este resultado refleja una posible persistencia de desigualdades en la distribución del trabajo doméstico y de cuidado, que nos hablan de los roles de género que siguen presentes en la sociedad.
En lo que Respecta al uso de tecnologías digitales, las diferencias por género son relativamente pequeñas. El acceso a smartphones supera el 77 % en todos los grupos, lo que indica un alto uso de este tipo de dispositivos. De manera similar, el acceso a internet en el hogar se sitúa entre el 74 % y el 76 % para hombres y mujeres, aunque es ligeramente menor en algunos grupos minoritarios.
En el uso de servicios financieros digitales (fintech), aproximadamente la mitad de los hombres y mujeres se ubican en el nivel avanzado (51 % aproximadamente). Sin embargo, se observa que los grupos de menor tamaño presentan porcentajes ligeramente mayores de personas que no utilizan estos servicios, lo que podría reflejar diferencias en inclusión financiera digital.
Teniendo esto en mente, podemos observar que los resultados sugieren que las brechas de género en educación y habilidades digitales son relativamente pequeñas en esta muestra, pero persisten diferencias en el ingreso promedio y en la carga de trabajo de cuidado que nos hablan de la persistencia de en prácticas, roles y creencias discriminatorias que no permiten que exista una igualdad de oportunidades en los distintos géneros.
Analisis por grupo etnico-racial
library(psych)
library(lsr)
library(dplyr)
library(knitr)
resumen_etnico <- datos %>%
group_by(grupo_etnico) %>%
summarise(
media_edad = mean(edad, na.rm = T),
media_educ = mean(educ_anios, na.rm = T),
media_ingreso = mean(ingreso_mensual, na.rm = T),
media_online = mean(horas_online_sem, na.rm = T),
media_habilidad = mean(habilidad_digital, na.rm = T),
media_cuidados = mean(cuidados_horas_sem, na.rm = T),
media_gasto = mean(gasto_tec_mensual, na.rm = T)
)
resumen_etnico[,-1] <- round(resumen_etnico[,-1], 2)
resumen_etnico
## # A tibble: 6 × 8
## grupo_etnico media_edad media_educ media_ingreso media_online media_habilidad
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Afrodescendi… 33.4 12.0 1878115. 19.7 52.6
## 2 Indígena 34.3 12.8 1894713. 21.2 52.8
## 3 Mestizo/Blan… 34.7 12.1 2210993. 19.6 52.4
## 4 Otro 32 11.5 1740000 20.8 49.2
## 5 Raizal 33.7 10.2 2897300 23.7 52.3
## 6 Rrom 38.5 10.6 1192375 16.5 44.1
## # ℹ 2 more variables: media_cuidados <dbl>, media_gasto <dbl>
kable(resumen_etnico)
| grupo_etnico | media_edad | media_educ | media_ingreso | media_online | media_habilidad | media_cuidados | media_gasto |
|---|---|---|---|---|---|---|---|
| Afrodescendiente | 33.43 | 12.02 | 1878115 | 19.69 | 52.55 | 20.85 | 164565.5 |
| Indígena | 34.32 | 12.75 | 1894713 | 21.21 | 52.81 | 21.35 | 172416.7 |
| Mestizo/Blanco | 34.68 | 12.10 | 2210993 | 19.61 | 52.42 | 21.14 | 174533.5 |
| Otro | 32.00 | 11.47 | 1740000 | 20.81 | 49.20 | 22.65 | 151866.7 |
| Raizal | 33.70 | 10.20 | 2897300 | 23.72 | 52.30 | 8.80 | 217000.0 |
| Rrom | 38.50 | 10.62 | 1192375 | 16.47 | 44.12 | 21.05 | 151000.0 |
table(datos$grupo_etnico, datos$smartphone)
##
## 0 1
## Afrodescendiente 39 152
## Indígena 20 88
## Mestizo/Blanco 123 445
## Otro 3 12
## Raizal 4 6
## Rrom 5 3
prop.table(table(datos$grupo_etnico, datos$smartphone), 1) * 100
##
## 0 1
## Afrodescendiente 20.41885 79.58115
## Indígena 18.51852 81.48148
## Mestizo/Blanco 21.65493 78.34507
## Otro 20.00000 80.00000
## Raizal 40.00000 60.00000
## Rrom 62.50000 37.50000
table(datos$grupo_etnico, datos$internet_hogar)
##
## 0 1
## Afrodescendiente 54 137
## Indígena 25 83
## Mestizo/Blanco 139 429
## Otro 5 10
## Raizal 2 8
## Rrom 2 6
prop.table(table(datos$grupo_etnico, datos$internet_hogar), 1) * 100
##
## 0 1
## Afrodescendiente 28.27225 71.72775
## Indígena 23.14815 76.85185
## Mestizo/Blanco 24.47183 75.52817
## Otro 33.33333 66.66667
## Raizal 20.00000 80.00000
## Rrom 25.00000 75.00000
table(datos$grupo_etnico, datos$fintech)
##
## Avanzado Básico Ninguno
## Afrodescendiente 104 75 12
## Indígena 54 46 8
## Mestizo/Blanco 289 222 57
## Otro 8 5 2
## Raizal 4 6 0
## Rrom 4 4 0
prop.table(table(datos$grupo_etnico, datos$fintech), 1) * 100
##
## Avanzado Básico Ninguno
## Afrodescendiente 54.450262 39.267016 6.282723
## Indígena 50.000000 42.592593 7.407407
## Mestizo/Blanco 50.880282 39.084507 10.035211
## Otro 53.333333 33.333333 13.333333
## Raizal 40.000000 60.000000 0.000000
## Rrom 50.000000 50.000000 0.000000
El análisis por grupo étnico evidencia algunas diferencias considerables en variables socioeconómicas y de acceso a tecnologías digitales. En términos de edad promedio, la mayoría de los grupos presentan valores cercanos a los 33–35 años, con excepción del grupo Rrom, que presenta una edad promedio mayor (38.5 años).
En relación con la educación, los grupos afrodescendiente, indígena y mestizo/blanco presentan niveles educativos similares, cercanos a 12 años de escolaridad. Sin embargo, algunos grupos presentan valores más bajos, como el grupo raizal (10.2 años) y el grupo Rrom (10.6 años), lo que podría reflejar desigualdades estructurales en acceso a educación avanzada que limita las posibilidades de ciertos encuestados de integrarse en ciertos aspectos de la sociedad moderna y dificulta la oportunidad de cumplir con las necesidades sociales.
En cuanto al ingreso mensual, se observan diferencias más marcadas. El grupo mestizo/blanco presenta un ingreso promedio de aproximadamente 2.21 millones de pesos, mientras que los grupos afrodescendiente e indígena presentan ingresos promedio más bajos, cercanos a 1.88 millones. El grupo Rrom registra el ingreso promedio más bajo de la muestra (1.19 millones), lo que podría indicar una mayor vulnerabilidad económica, consecuencia de una persistente discriminacion racial.
Por otro lado, el grupo raizal presenta el ingreso promedio más alto (2.89 millones de pesos), aunque este resultado debe interpretarse con cautela debido al tamaño reducido de ese grupo dentro de la muestra.
En lo que respecta al acceso a tecnología, el uso de smartphones es alto en la mayoría de los grupos (alrededor del 78–81 %), aunque el grupo Rrom presenta un porcentaje considerablemente menor (37.5 %). Esto sugiere posibles brechas en acceso a dispositivos tecnológicos.El acceso a internet en el hogar se mantiene entre el 71 % y el 76 % en la mayoría de los grupos, con niveles ligeramente más altos en algunos casos como el grupo raizal.Finalmente, en el uso de servicios financieros digitales, aproximadamente la mitad de los individuos en la mayoría de los grupos se ubican en el nivel avanzado, aunque algunos grupos presentan porcentajes ligeramente mayores de personas que no utilizan estos servicios.
En conjunto, estos resultados sugieren la existencia de brechas socioeconómicas y tecnológicas asociadas a la pertenencia étnico-racial, particularmente en variables como ingreso y acceso a dispositivos digitales.
library(psych)
library(lsr)
library(dplyr)
library(knitr)
# Género + ingreso + habilidad digital + gasto en tecnología
multi_genero <- datos %>%
group_by(genero) %>%
summarise(
ingreso = mean(ingreso_mensual, na.rm = T),
habilidad = mean(habilidad_digital, na.rm = T),
gasto_tecnologia = mean(gasto_tec_mensual, na.rm = T)
)
multi_genero[,-1] <- round(multi_genero[,-1], 2)
multi_genero
## # A tibble: 4 × 4
## genero ingreso habilidad gasto_tecnologia
## <chr> <dbl> <dbl> <dbl>
## 1 Hombre 2166736. 52.0 173157.
## 2 Mujer 2012703. 52.8 169425.
## 3 No binarie 2333538. 54.8 200308.
## 4 Prefiere no decir 2400077. 43.8 179385.
kable(multi_genero)
| genero | ingreso | habilidad | gasto_tecnologia |
|---|---|---|---|
| Hombre | 2166736 | 51.96 | 173156.7 |
| Mujer | 2012703 | 52.79 | 169424.7 |
| No binarie | 2333538 | 54.77 | 200307.7 |
| Prefiere no decir | 2400077 | 43.77 | 179384.6 |
# Grupo étnico + ingreso + internet hogar + habilidad digital
multi_etnico <- datos %>%
group_by(grupo_etnico) %>%
summarise(
ingreso = mean(ingreso_mensual, na.rm = T),
internet = mean(internet_hogar, na.rm = T) * 100,
habilidad = mean(habilidad_digital, na.rm = T)
)
multi_etnico[,-1] <- round(multi_etnico[,-1], 2)
multi_etnico
## # A tibble: 6 × 4
## grupo_etnico ingreso internet habilidad
## <chr> <dbl> <dbl> <dbl>
## 1 Afrodescendiente 1878115. 71.7 52.6
## 2 Indígena 1894713. 76.8 52.8
## 3 Mestizo/Blanco 2210993. 75.5 52.4
## 4 Otro 1740000 66.7 49.2
## 5 Raizal 2897300 80 52.3
## 6 Rrom 1192375 75 44.1
kable(multi_etnico)
| grupo_etnico | ingreso | internet | habilidad |
|---|---|---|---|
| Afrodescendiente | 1878115 | 71.73 | 52.55 |
| Indígena | 1894713 | 76.85 | 52.81 |
| Mestizo/Blanco | 2210993 | 75.53 | 52.42 |
| Otro | 1740000 | 66.67 | 49.20 |
| Raizal | 2897300 | 80.00 | 52.30 |
| Rrom | 1192375 | 75.00 | 44.12 |
# Género + fintech + ingreso + horas online
multi_fintech <- datos %>%
group_by(genero, fintech) %>%
summarise(
ingreso = mean(ingreso_mensual, na.rm = T),
habilidad = mean(habilidad_digital, na.rm = T),
horas_online = mean(horas_online_sem, na.rm = T),
.groups = "drop"
)
multi_fintech[,3:5] <- round(multi_fintech[,3:5], 2)
multi_fintech
## # A tibble: 12 × 5
## genero fintech ingreso habilidad horas_online
## <chr> <chr> <dbl> <dbl> <dbl>
## 1 Hombre Avanzado 2274204. 53.8 20.0
## 2 Hombre Básico 2138994. 51.9 19.6
## 3 Hombre Ninguno 1572000 39.5 18.5
## 4 Mujer Avanzado 2082101. 53.8 19.5
## 5 Mujer Básico 1904178. 53.4 20.0
## 6 Mujer Ninguno 2076400 44.6 21.5
## 7 No binarie Avanzado 2029083. 62.2 21.2
## 8 No binarie Básico 3062600 51.1 21.0
## 9 No binarie Ninguno 1424250 41.8 16.2
## 10 Prefiere no decir Avanzado 2603429. 51.4 18.4
## 11 Prefiere no decir Básico 2435000 46.5 21.0
## 12 Prefiere no decir Ninguno 1618500 11.5 29.6
kable(multi_fintech)
| genero | fintech | ingreso | habilidad | horas_online |
|---|---|---|---|---|
| Hombre | Avanzado | 2274204 | 53.82 | 19.99 |
| Hombre | Básico | 2138994 | 51.87 | 19.62 |
| Hombre | Ninguno | 1572000 | 39.50 | 18.53 |
| Mujer | Avanzado | 2082101 | 53.80 | 19.54 |
| Mujer | Básico | 1904178 | 53.45 | 20.03 |
| Mujer | Ninguno | 2076400 | 44.56 | 21.46 |
| No binarie | Avanzado | 2029083 | 62.17 | 21.15 |
| No binarie | Básico | 3062600 | 51.10 | 21.03 |
| No binarie | Ninguno | 1424250 | 41.75 | 16.25 |
| Prefiere no decir | Avanzado | 2603429 | 51.43 | 18.39 |
| Prefiere no decir | Básico | 2435000 | 46.50 | 20.95 |
| Prefiere no decir | Ninguno | 1618500 | 11.50 | 29.65 |
# Zona + género + acceso digital
multi_zona <- datos %>%
group_by(zona, genero) %>%
summarise(
smartphone = mean(smartphone, na.rm = T) * 100,
internet = mean(internet_hogar, na.rm = T) * 100,
habilidad = mean(habilidad_digital, na.rm = T),
.groups = "drop"
)
multi_zona[,3:5] <- round(multi_zona[,3:5], 2)
multi_zona
## # A tibble: 8 × 5
## zona genero smartphone internet habilidad
## <chr> <chr> <dbl> <dbl> <dbl>
## 1 Rural Hombre 70 63.3 52.3
## 2 Rural Mujer 74.1 60.7 49.1
## 3 Rural No binarie 87.5 50 51
## 4 Rural Prefiere no decir 100 66.7 62.3
## 5 Urbana Hombre 80.2 80.6 51.8
## 6 Urbana Mujer 80.2 80.2 54.2
## 7 Urbana No binarie 83.3 66.7 56.4
## 8 Urbana Prefiere no decir 80 50 38.2
kable(multi_zona)
| zona | genero | smartphone | internet | habilidad |
|---|---|---|---|---|
| Rural | Hombre | 70.00 | 63.33 | 52.32 |
| Rural | Mujer | 74.07 | 60.74 | 49.14 |
| Rural | No binarie | 87.50 | 50.00 | 51.00 |
| Rural | Prefiere no decir | 100.00 | 66.67 | 62.33 |
| Urbana | Hombre | 80.20 | 80.55 | 51.85 |
| Urbana | Mujer | 80.17 | 80.17 | 54.23 |
| Urbana | No binarie | 83.33 | 66.67 | 56.44 |
| Urbana | Prefiere no decir | 80.00 | 50.00 | 38.20 |
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = genero, y = ingreso_mensual, fill = fintech)) +
geom_boxplot() +
labs(
title = "Ingreso mensual según género y nivel de uso fintech",
x = "Género",
y = "Ingreso mensual",
fill = "Fintech"
) +
theme_minimal()
library(ggplot2)
library(dplyr)
ggplot(datos, aes(x = grupo_etnico, y = habilidad_digital, fill = zona)) +
geom_boxplot() +
labs(
title = "Habilidad digital según grupo étnico y zona",
x = "Grupo étnico",
y = "Habilidad digital",
fill = "Zona"
) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
library(ggplot2)
library(dplyr)
datos_educ <- datos %>%
mutate(nivel_educ = case_when(
educ_anios <= 5 ~ "Primaria o menos",
educ_anios <= 11 ~ "Secundaria",
educ_anios <= 15 ~ "Técnico / Tecnológico",
TRUE ~ "Universitario o más"
))
ggplot(datos_educ, aes(x = nivel_educ, y = ingreso_mensual, fill = genero)) +
geom_boxplot() +
labs(
title = "Ingreso mensual según nivel educativo y género",
x = "Nivel educativo",
y = "Ingreso mensual",
fill = "Género"
) +
theme_minimal()
Para realizar el análisis multivariado, se utilizaron las variables género, ingreso, habilidades digitales y gasto en tecnología. En los resultados se observa que las personas no binarias presentan el mayor nivel promedio de habilidades digitales (54.77 puntos) y también uno de los mayores niveles de gasto tecnológico (200 mil pesos mensuales aproximadamente). Por su parte, las mujeres presentan habilidades digitales ligeramente superiores a las de los hombres, aunque con ingresos promedio menores.
Al analizar conjuntamente grupo étnico, ingreso, acceso a internet y habilidades digitales, se observa que los grupos con mayores ingresos tienden también a presentar mayores niveles de acceso a internet y habilidades digitales. Sin embargo, existen excepciones que muestran que el acceso a tecnología no depende exclusivamente del ingreso.
El análisis que integra género y uso de servicios fintech muestra que las personas con un nivel avanzado de uso de servicios financieros digitales tienden a presentar mayores ingresos y mayores niveles de habilidades digitales. Por ejemplo, los hombres y mujeres con uso avanzado de fintech registran habilidades digitales cercanas a 54 puntos, mientras que quienes no utilizan estos servicios presentan habilidades considerablemente menores.
Para finalizar, el análisis por zona de residencia y género muestra una brecha territorial clara. En las zonas urbanas el acceso a smartphones y a internet en el hogar es significativamente mayor (alrededor del 80 %) en comparación con las zonas rurales, donde estos valores se sitúan entre el 60 % y el 70 %. Esto sugiere que el lugar de residencia sigue siendo un factor importante en la desigualdad digital.
Con todo en mente, estos resultados indican que el acceso a tecnología y el desarrollo de habilidades digitales están influenciados por múltiples factores sociales, incluyendo el género, la pertenencia étnica, el nivel de ingreso y la localización territorial.
Con los resultados obtenidos podemos encontrar un patrón en común a lo largo de los diferentes análisis realizados, así como una clara relación entre las distintas variables estudiadas. En primer lugar, podemos encontrar que existe una diferencia por género en aspectos fundamentales como son el ingreso mensual o las cargas de trabajo no remunerado, que hablan de un descuido social por aplicar políticas de inclusión o diversidad, donde los distintos géneros tengan igualdad de condiciones laborales y presenten una recompensa similar por el servicio realizado. Sumado a esto, se encuentra una clara distinción étnica en donde aspectos como el salario, la educación, el acceso a la tecnología son alteradas por esta variable sociodemográfica que habla de una persistente marginación hacia cierto sector de la población, lo cual limita sus posibilidades de acceso a distintos beneficios, que cambian sus posibilidades dentro de una estructura social.
Estos resultados son fundamentales ya que muestran y visibilizan la forma en que existe una clara diferencia en los aspectos sociales, políticos y económicos de ciertas poblaciones específicas, lo que termina por generar vulnerabilidades en estos, limitar sus posibilidades y crear problemáticas con las que deben lidiar, afectando a su bienestar y la forma en que estos se integran en la sociedad.
Con esto, entendemos que el análisis descriptivo permitió identificar las principales características sociodemográficas y tecnológicas de la población estudiada. En general, la edad promedio y los años de educación son similares entre los distintos grupos, lo que indica una distribución educativa relativamente homogénea. Sin embargo, se observaron diferencias en variables económicas y sociales, especialmente en el ingreso promedio y en la distribución del trabajo de cuidado, donde las mujeres dedican más horas semanales que los hombres.
En cuanto al acceso a tecnologías digitales, la mayoría de las personas posee smartphone y tiene acceso a internet en el hogar. No obstante, el análisis también sugiere la existencia de algunas brechas digitales asociadas al grupo étnico y a la zona de residencia, especialmente entre áreas urbanas y rurales.
Entre las limitaciones del estudio se encuentra que algunos grupos tienen un número reducido de observaciones, lo que puede afectar la precisión de los promedios y que estos no logren ser representativos, ademas es posible que existan otras variables sociales que influyan en el acceso y uso a la tegnologia y no hayan sido abordadas en el analisis.
Como posible pregunta de investigacion futura, sería relevante profundizar en las desigualdades digitales mediante análisis estadísticos más avanzados y explorar con mayor detalle la relación entre variables sociales, económicas y tecnológicas.