Introducción

[…]

La capacitación digital se evalúa a través de una encuesta simplificada de la rúbrica DigComp publicada en 2018 por el Instituto Nacional de Tecnologías Educativas y Formación del Profesorado, INTEF (ver encuesta). La simplificación utilizada se puede consultar en este enlace, que resume a un total de 21 items la evaluación de las cinco áreas competenciales. Dicha encuesta se proporcionó al inicio de curso y durante tres cursos consecutivos desde 2017-18. al alumnado del MasterProfUMH, que la contestó de manera voluntaria. La encuesta proporciona una evaluación autoperceptiva de la competencia digital en cada una de las cinco áreas competenciales definidas por INTEF, valorada en una escala del 1 al 5, donde el 1 representa el mínimo nivel competencial y el 5 el máximo para cada uno de los items. La capacitación digital en cada área se obtiene promediendo las valoraciones de los items que la definen en la encuesta. La capacitación digital global se obtiene con el promedio de todos los items en la encuesta.

Las cinco áreas competenciales evaluadas son:

C1. Información y alfabetización informacional (3 items). C2. Comunicación y colaboración (6 items). C3. Creación de contenidos digitales (4 items). C4. Seguridad (4 items). C5. Resolución de problemas (4 items).

Objetivos

El objetivo general es estudiar, desde una perspectiva de género, la capacitación digital del alumnado que inicia sus estudios de máster. Los objetivos específicos son:

  1. Estudiar si hay diferencias entre los tres cursos disponibles. Si no las hay, reunir todos los datos disponibles obviando el efecto curso.
  2. La autopercepción sobre las habilidades tecnológicas, ¿cómo está relacionada con la evaluación competencial digital global? La relación ¿es similar para hombres y mujeres? ¿Es mayor la autopercepción de capacidad que la evaluación estructurada media?
  3. Distribución por rama de acceso y comparación con los egresados en universidades públicas valencianas. ¿Cuál es el peso de estudiantado en cada una de las ramas, comparado con los estudiantes que egresan en la Comunidad Valenciana? ¿Todos los estudiantes en todas las ramas optan por la educación en la misma proporción en la que egresan, o hay determinadas ramas en las que se recibe más estudiantado interesado por la Educación?
  4. ¿Se da una segregación por sexo en las diversas ramas de conocimiento? ¿Cuál es la relevancia/peso de las mujeres en cada una de las ramas de conocimiento? ¿Es similar a la que se observa en todos los másteres de España?
  5. ¿Se aprecia un efecto generacional en la capacitación digital? ¿Es similar para hombres y mujeres?
  6. ¿Cuál es la capacitación digital del alumnado en cada una de las áreas competenciales? ¿Se aprecian diferencias entre hombres y mujeres?
  7. ¿Cuál es la capacitación digital del alumnado en cada una de las áreas competenciales en función de la rama de acceso al máster? ¿Se aprecia alguna capacitación específica en algún grupo de titulados?
  8. ¿Existe alguna área competencial en la que la evaluación competencial esté próxima a la autopercepción tecnológica del alumnado? ¿Coincide en hombres y mujeres?
  9. Construir un modelo de predicción que explique la competencia digital en función de las variables disponibles. ¿Cuál es el efecto del sexo?

Datos disponibles

Se dispone de las respuestas a la simplificación de la rúbrica de evaluación competencial DigComp INTEF, relativas a los cursos 2017-18, 2018-19 y 2019-20, con un total de registros disponibles de 485. Las variables utilizadas para el estudio son:

La distribución de los datos en función del curso, la rama de acceso, el sexo, y la rama de acceso se muestra a continuación. La escasez de hombres en Ciencias de la Salud justifica colapsar esta con la rama de Ciencias (CC):

La escasez de datos al seccionar por rama, sexo y habilidad tecnológica, justifica reagrupar niveles en una nueva variable:

*habil.tecno3, autopercepción de las habilidades tecnológicas en la vida cotidiana, con tres niveles de respuesta, con la siguiente correspondencia con los 5 niveles de habil.tecno: “min=1-2”, “med=3-4” y “max=5”.

Revisamos el volumen de datos en los diversos cruces plausibles para investigar relaciones. Si prettendemos estudiar todos los cruces, observamos la escasez de datos:

Sexo C1 C2 C3 C4 C5 ramaa habil.tecno3 generacionz
Hombre 3.51(0.83) 3.25(0.77) 2.29(0.86) 3.03(0.87) 2.99(0.88) NA NA NA
Mujer 3.31(0.79) 3.17(0.81) 2.14(0.81) 2.9(0.88) 2.72(0.85) NA NA NA
NA 3.34(0.9) 3.2(0.86) 2.24(0.83) 2.99(0.88) 2.8(0.94) AH NA NA
NA 3.31(0.74) 3.06(0.77) 2.03(0.71) 2.83(0.87) 2.65(0.85) CC NA NA
NA 3.33(0.8) 3.18(0.78) 2.14(0.85) 2.9(0.87) 2.76(0.83) CCSSJJ NA NA
NA 3.66(0.69) 3.39(0.72) 2.45(0.89) 3.11(0.89) 3.18(0.74) INA NA NA
NA 2.24(0.85) 2.07(0.71) 1.32(0.6) 1.91(0.82) 1.66(0.74) NA Min NA
NA 3.07(0.66) 2.89(0.65) 1.9(0.65) 2.67(0.8) 2.44(0.65) NA Med NA
NA 3.7(0.67) 3.51(0.68) 2.47(0.81) 3.23(0.77) 3.17(0.76) NA Max NA
NA 3.26(0.89) 3.04(0.86) 2.03(0.84) 2.81(0.94) 2.7(0.89) NA NA [1960,1990)
NA 3.5(0.73) 3.33(0.72) 2.34(0.8) 3.06(0.81) 2.92(0.84) NA NA [1990,2005)
Sexo msd ramaa habil.tecno3 generacionz
Hombre 3.01(0.72) NA NA NA
Mujer 2.85(0.68) NA NA NA
NA 2.92(0.75) AH NA NA
NA 2.78(0.65) CC NA NA
NA 2.86(0.69) CCSSJJ NA NA
NA 3.16(0.64) INA NA NA
NA 1.84(0.61) NA Min NA
NA 2.59(0.49) NA Med NA
NA 3.22(0.59) NA Max NA
NA 2.77(0.77) NA NA [1960,1990)
NA 3.03(0.62) NA NA [1990,2005)
## 
##  Welch Two Sample t-test
## 
## data:  datos$comp.dig[datos$rama == "CC"] and datos$comp.dig[datos$rama == "CCS"]
## t = 0.24813, df = 50.833, p-value = 0.805
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.2657417  0.3406888
## sample estimates:
## mean of x mean of y 
##  2.788426  2.750952

Se asume que la muestra disponible es representativa del colectivo íntegro de estudiantado del máster durante los cursos 2017-18, 2018-19 y 2019-20, colectivo total que supera en poco los 1200 estudiantes. La muestra disponible supondría pues, un 40.4% del colectivo total, para el que generalizaremos las conclusiones de este estudio.

1. Diferencias entre los tres cursos

Cuando diferenciamos por áreas competenciales, apreciamos diferencias entre áreas, pero no por cursos (Fig1.1).

## Warning: `fun.y` is deprecated. Use `fun` instead.
Para testarlo estadísticamente utilizamos una prueba de Anova, que no resulta significativa para reconocer diferencias por curso e incluso diferencias entre curso interconectadas con las competencias. Se excluye así la variable “curso” como variable de clasificación, y se realizan los análisis consecutivos con el total de datos conseguidos durante los tres cursos académicos.
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(fit)
## W = 0.99629, p-value = 0.3214
## 
##  Shapiro-Wilk normality test
## 
## data:  datos$comp.dig
## W = 0.99639, p-value = 0.3444

2. Relación entre evaluación competencial digital y autopercepción de habilidades tecnológicas

Se observa en la Fig2.1 una relación directa entre la autopercepción y la evaluación competencial media, tanto para hombres como para mujeres, y en cualquiera de las tres ramas de acceso del alumnado.

## `geom_smooth()` using formula 'y ~ x'

La correlación positiva la testamos con el test de correlación de Pearson con alternativa unilateral (correlación positiva). La correlación resulta de 0.65, y el p-valor significativo al 0.01%.

## 
##  Pearson's product-moment correlation
## 
## data:  datos$habil.tecno and datos$comp.dig
## t = 18.808, df = 483, p-value < 2.2e-16
## alternative hypothesis: true correlation is greater than 0
## 95 percent confidence interval:
##  0.6048323 1.0000000
## sample estimates:
##       cor 
## 0.6502046

Con todo, atendiendo a la tendencia general, apreciamos que la autopercepción de competencias es superior a la evaluación: el alumnado a priori cree que sabe más de lo que sabe. Seccionamos para ello la variable “competencia digital media” en 5 categorías de respuesta, para conseguir la equivalencia con las cinco categorías de respuesta en habilidades tecnológicas:

##           
## comp.dig.c   1   2   3   4   5
##          1   2   8   1   0   0
##          2   0  23  63  35   0
##          3   0   4  86 137  28
##          4   0   1   3  50  40
##          5   0   0   0   2   2

Se observa en la tabla anterior que para los sujetos que se consideran poco habilidosos tecnológicamente, habil.tecno=1,2 o 3, su evaluación competencial corrobora dicha autopercepción. Sin embargo, aquellos que se consideran bastante o muy habilidosos tecnológicamente, habil.tecno=4 o 5, obtienen, en una gran mayoría, una evaluación competencial en un nivel inferior de la escala, esto es, sobreestiman su capacitación competencial. En concreto,un 75% de los sujetos que se autoperciben en nivel 4 tecnológicamente, obtienen una evaluación competencial digital media inferior a 3.5, y el 95.7% de los que se autoperciben en un nivel 5, son evaluados digitalmente con una media inferior a 4.5. Este hecho no ocurre para los que se autoevalúan tecnológicamente en niveles 1, 2 o 3, donde una mayoría obtiene una evaluación competencial digital acorde con dicha autopercepción.

Estudiamos a continuación si este hecho se manifiesta por igual entre hombres y mujeres.

## Warning: Removed 2 rows containing missing values (geom_point).
## Warning: Removed 2 row(s) containing missing values (geom_path).

Se observa en la Fig2.2 que en hombres y mujeres que se reconocen poco habilidosos tecnológicamente (habil.tecno=1,2), la mayoría tienen una evaluación competencial coherente (72,7% hombres y 84% mujeres) y los porcentajes del colectivo que sobrevalora sus habilidades tecnológicas está por debajo del 50%. En habil.tecno=3 disminuyen las cifras, y tenemos un 63% de hombres coherentes y un 58.6% de mujeres coherentes. Para habil.tecno=4, tanto en hombres como en mujeres obtenemos unos porcentajes considerables de personas que sobrevaloran sus habilidades tecnológicas respecto de lo que obtiene en su evaluación competencial: 70.7% de los hombres y 78% de las mujeres. Para los que se posicionan inicialmente con habil.tecno=5, el porcentaje de los sobrevalorados es aún mayor: 93.1% en hombres y 97.6% en mujeres.

Ajustamos un modelo para estudiar estas diferencias por sexo y en función también del posicionamiento inicial de los sujetos respecto de sus habilidades tecnológicas. Calculamos una nueva variable “diferencias” que contiene la diferencia entre las habilidades tecnológicas que declaran (en la escala entera del 1 al 5) y competencia digital media (en una escala continua entre el 1 y el 5). Al ajustar un modelo lineal (tras hacerlo no apreciamos desviaciones de las hipótesis que lo avalan), obtenemos que efectivamente las diferencias vienen marcadas de modo diferente según el posicionamiento tecnológico inicial de los sujetos, y también se aprecia un efecto por sexo. Los sujetos que responden en categorías tecnológicas inferiores (1, 2 y 3), disntancian en menos de 0,5 puntos su respuesta de la competencia digital evaluada. Los que están en categoría habil.tecno=4 la distancian 1 punto, y los que responden en habil.tecno=5 llegan a distanciarse respecto de su evaluación competencial en 1.5 puntos (en media). Además, las mujeres también suelen sobreestimar sus habilidades tecnológicas respecto de los hombres, si bien en no más de 0.112 puntos en media.

## 
## Call:
## lm(formula = diferencia ~ factor(habil.tecno) + Sexo, data = df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.15391 -0.33486  0.01057  0.35586  1.51057 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -0.17988    0.37702  -0.477 0.633499    
## factor(habil.tecno)2  0.22403    0.38663   0.579 0.562570    
## factor(habil.tecno)3  0.51474    0.37872   1.359 0.174740    
## factor(habil.tecno)4  1.02621    0.37790   2.716 0.006856 ** 
## factor(habil.tecno)5  1.49654    0.38156   3.922 0.000101 ***
## SexoMujer             0.10977    0.04977   2.206 0.027889 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.532 on 479 degrees of freedom
## Multiple R-squared:  0.3371, Adjusted R-squared:  0.3302 
## F-statistic: 48.72 on 5 and 479 DF,  p-value: < 2.2e-16

3. Distribución por rama de acceso y respecto de la distribución en las universidades públicas españolas

Consultamos, para obtener los datos relativos a la distribución por ramas de conocimiento de las titulaciones que cursan los estudiantes en las universidades españolas, la fuente de Educación del Gobierno de España. En concreto, accedemos a las cifras de egresados de estudios de grado por rama y sexo, y matriculados de máster por rama y sexo durante el curso 2017-18.

Comparamos con el reparto por rama de acceso (de la titulación con la que acceden al máster de profesorado) del alumnado matriculado en el máster en los tres cursos disponibles (desde 2017-18 a 2019-20). Ver Figura3.1.

Observamos pues en la Fig3.1 que acceden al máster una proporción de ingenieros y arquitectos (INA) similar a la de egresados en el territorio español, en torno al 17.8%. En las ramas de Ciencias de la Salud (CCS) y Ciencias Sociales y Jurídicas (CCSSJJ), al parecer, el ámbito no educativo absorbe una buena parte de los egresados, especialmente en CCS: el estudiantado de CCS representa sólo un 7.2% del alumnado del máster frente al la proporción de estudiantes que finalizan sus estudios en CCS en España, que supone un 20.3%. En CCSSJJ las cifras también son distintas: este estudiantado representa un 30.1% en el máster, frente a un 49.8% entre los egresados de grado en España. La situación cambia para Ciencias (CC) y especialmente Artes y Humanidades (AH): una buena parte de este estudiantado se orienta profesionalmente hacia el ámbito educativo, llegando a representar unos porcentajes de estudiantado en el máster del 14.8% para CC y hasta 30.1% para AH, frente a sus cifras de egresados en España, que se quedan en 5.8% y 8.3% respectivamente.

Si bien lo que vendría a ser el mercado laboral de egresados de grado en universidades españolas está conformado en su mayoría por profesionales de CCSSJJ y CCS (un 70.1%), en el máster de profesorado hay una predominancia clara de titulados en CCSSJJ y AH, que representan conjuntamente un 60.2% del estudiantado del máster.

4. Segregración por sexo en las ramas de conocimiento

Estudiamos a continuación la distribución por sexos en el máster, en cada una de las ramas de enseñanza, y las comparamos con el referente a nivel nacional de los matriculados en másteres en España durante el curso 2017-18. Comparamos para ello la proporción de mujeres en cada una de las ramas de enseñanza.

Mientras que en AH y CCSSJJ apreciamos un porcentaje de mujeres en el máster similar al porcentaje de mujeres matriculadas en otros másteres, la variación es sustancial en Ciencias (CC), Ciencias de la Salud (CCS) e Ingeniería y Arquitectura (INA). Extraemos las siguientes conclusiones:

Dentro del máster de profesorado, al igual que ocurre con el resto de másteres en España, la distribución de mujeres y hombres está estadísticamente relacionada con la rama de acceso, como se demuestra con la significatividad del test Chi-cuadrado en ambos colectivos.

## [1] "Máster profesorado UMH"
## 
##  Pearson's Chi-squared test
## 
## data:  table(datos$rama, datos$Sexo)
## X-squared = 21.942, df = 4, p-value = 0.0002058
## [1] "Másteres en España"
## 
##  Pearson's Chi-squared test
## 
## data:  table.global
## X-squared = 14782, df = 4, p-value < 2.2e-16

5. Efecto generacional en la capacitación digital. Diferencias por sexo

Al estudiar la relación entre la competencia digital promedio evaluada con la escala propuesta, y la edad de los individuos, apreciamos una dispersión notable en cualquier grupo de edad. En el eje horizontal de la Fig5.1 se representa la edad y en el vertical la competencia digital media. Al haber pintado en colores las nubes de puntos de los sujetos nacidos en cada una de las décadas de nacimiento de los alumnos disponibles (esto es, desde 1960 hasta el año 2000), se aprecia que en cualquier franja la dispersión es notable, y se cuenta tanto con individuos muy compentetes, como con otros con muy pocas competencias digitales, sin ninguna tendencia apreciable, como manifiestan las líneas de tendencia superpuestas.

## `geom_smooth()` using formula 'y ~ x'

Ni siquiera al diferenciar por sexo, esta ausencia de tendencia parece desaparecer (ver Fig5.2): a pesar de que las tendencias se pronuncian en algunos grupos, la dispersión es excesivamente relevante y las tendencias no se mantienen en grupos de edad correlativos, por lo no se puede hablar de un efecto específico marcado por la edad. Al no apreciar ninguna tendencia clara, no tiene sentido ajustar modelo alguno para explicar la competencia digital en función de la edad.

## `geom_smooth()` using formula 'y ~ x'

Con el fin de profundizar algo más en la explicación de lo que se ha dado en llamar Generación Z, categorizamos a los sujetos en dos grupos de edad: los previos a la generación Z (nacidos antes de 1995) y los de la generación Z (nacidos entre 1995 y 2005). El objetivo es investigar si la generación Z, denominada también como la de los nativos digitales, muestra diferencias significativas en su competencia digital media respecto de los nacidos antes. Así mismo, indagamos si existe un efecto sexo patente en estas dos generaciones.

Según lo que se observa en la Fig5.3 las diferencias entre las dos generaciones, pre-Z y Z, no resultan claras, ni tampoco la diferencia entre sexos. Contrastamos dicho efecto a través de un test de Anova a continuación.

Al testar si el hecho de pertenecer o no a la Generación Z explica unas competencias digitales mayores, así como si hay diferencias entre hombres y mujeres respecto a su competencia digital global, comprobamos que las diferencias entre hombres y mujeres son similares en cualquiera de las dos generaciones (la interacción sexo:generacionz no es significativa; pvalor=0.25). Sí es significativo no obstante para explicar la competencia digital media, el haber nacido antes o después de 1995, y el ser hombre o mujer. Los nacidos después de 1995 son algo más competentes que los nacidos antes: difieren en 0.16 puntos en la escala de 1 a 5. También los hombres, en media, son más competentes que las mujeres en cualquiera de las dos generaciones: difieren en 0.17 puntos en la escala de 1 a 5.
## 
## Call:
## lm(formula = comp.dig ~ generacionz + Sexo, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.87683 -0.45332 -0.00209  0.42317  1.87317 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             2.87683    0.05912  48.657  < 2e-16 ***
## generacionz[1990,2005)  0.27526    0.06287   4.378 1.47e-05 ***
## SexoMujer              -0.19018    0.06425  -2.960  0.00323 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6862 on 482 degrees of freedom
## Multiple R-squared:  0.05104,    Adjusted R-squared:  0.0471 
## F-statistic: 12.96 on 2 and 482 DF,  p-value: 3.289e-06

6. Competencia digital por área competencial y sexo.

Cuando diferencimos por área competencial, el posicionamiento del alumnado varía claramente según se aprecia en la Fig6.1:

Sin tener en cuenta ningún otro efecto, realizamos las comparaciones múltiples con el test de Tukey y encontramos diferencias significativas en la capacitación digital de todas las áreas competenciales entre sí, salvo entre la C4 y la C5.

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = valor ~ competencia, data = datos.lon)
## 
## $competencia
##             diff        lwr         upr     p adj
## C2-C1 -0.1886598 -0.3354409 -0.04187872 0.0041835
## C3-C1 -1.1888316 -1.3356127 -1.04205054 0.0000000
## C4-C1 -0.4388316 -0.5856127 -0.29205054 0.0000000
## C5-C1 -0.5676976 -0.7144787 -0.42091652 0.0000000
## C3-C2 -1.0001718 -1.1469529 -0.85339075 0.0000000
## C4-C2 -0.2501718 -0.3969529 -0.10339075 0.0000340
## C5-C2 -0.3790378 -0.5258189 -0.23225673 0.0000000
## C4-C3  0.7500000  0.6032189  0.89678108 0.0000000
## C5-C3  0.6211340  0.4743529  0.76791510 0.0000000
## C5-C4 -0.1288660 -0.2756471  0.01791510 0.1164997

Estudiamos a continuación si además, en cada una de las áreas competenciales existen diferencias entre hombres y mujeres. En la Fig6.2 están representadas las calificaciones obtenidas en cada una de las áreas competenciales, diferenciadas por sexo. Sí se aprecia en la mayoría una tendencia a la baja (al menos marcada por las medianas) en la evaluación de las mujeres respecto de los hombres.

## $fill
## [1] "Sexo"
## 
## attr(,"class")
## [1] "labels"
Constatamos esta apreciación estadísticamente, prescindiendo de cualquier otro factor condicionante, a través de un análisis de Anova en el que tratamos de explicar la variabilidad de los datos por área competencial y sexo. No resulta significativa una interacción competencia:sexo que hable sobre efectos dispares entre hombres y mujeres en diferentes áreas competenciales (p-valor=0.47 en Anova). Sí resulta significativa una diferencia entre competencias (tal y como habíamos probado anteriormente) y también por sexo. Al ajustar el modelo, efectivamente la capacitación competencial de las mujeres resulta 0.17 puntos en media por debajo de la de los hombres en cualquiera de las áreas competenciales. Recordar que la escala de valoración está entre 1 y 5.
## 
## Call:
## lm(formula = valor ~ competencia + Sexo, data = datos.lon)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.49053 -0.55170  0.00916  0.61466  2.61466 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    3.49053    0.04347  80.307  < 2e-16 ***
## competenciaC2 -0.18866    0.05353  -3.525 0.000432 ***
## competenciaC3 -1.18883    0.05353 -22.210  < 2e-16 ***
## competenciaC4 -0.43883    0.05353  -8.198 3.91e-16 ***
## competenciaC5 -0.56770    0.05353 -10.606  < 2e-16 ***
## SexoMujer     -0.16635    0.03478  -4.783 1.83e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8336 on 2419 degrees of freedom
## Multiple R-squared:  0.1988, Adjusted R-squared:  0.1971 
## F-statistic:   120 on 5 and 2419 DF,  p-value: < 2.2e-16

7. Evaluación competencial por rama de conocimiento y sexo

Dada la escasez de alumnado masculino en la rama de Ciencias de la Salud, ya comentamos que carece de sentido realizar una comparación por sexo teniendo en cuenta la clasificación original por rama de acceso. Reagrupamos al estudiantado de Ciencias de la Salud junto al de Ciencias (por tener sus medias más similares entre sí en la variable competencia digital media; 2.79 y 2.75), y procedemos con esta categorización, a un estudio por rama de acceso al máster y sexo.

A la vista de los datos mostrados en la Fig7.1, la diferenciación entre hombres y mujeres resulta algo irregular en función de la rama de acceso.

Con el fin de tener una visualización algo más clara en términos de medias, calculamos estas y las confrontamos por áreas competenciales, ramas de acceso y sexo en la Fig7.2. En este gráfico se aprecia una mayor capacitación digital clara de los hombres frente a las mujeres en los titulados que provienen de la rama de Ciencias Sociales y Jurídicas (CCSSJJ), pero no tan clara en el resto y para todas las áreas competenciales.

Testamos, ajustando un modelo lineal que prescinda de cualquier otro efecto condicionante, la relación por área competencial, entre hombres y mujeres en las distintas ramas de acceso.
## 
## Call:
## lm(formula = valor ~ competencia + Sexo + ramaa + Sexo:ramaa, 
##     data = datos.lon)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.50509 -0.56626  0.00339  0.56455  2.50339 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)            3.43545    0.06030  56.974  < 2e-16 ***
## competenciaC2         -0.18866    0.05292  -3.565 0.000371 ***
## competenciaC3         -1.18883    0.05292 -22.463  < 2e-16 ***
## competenciaC4         -0.43883    0.05292  -8.292  < 2e-16 ***
## competenciaC5         -0.56770    0.05292 -10.727  < 2e-16 ***
## SexoMujer             -0.06915    0.06318  -1.094 0.273877    
## ramaaCC               -0.22331    0.08916  -2.505 0.012323 *  
## ramaaCCSSJJ            0.06964    0.06763   1.030 0.303236    
## ramaaINA               0.26874    0.07583   3.544 0.000401 ***
## SexoMujer:ramaaCC      0.12243    0.10527   1.163 0.244938    
## SexoMujer:ramaaCCSSJJ -0.23538    0.08802  -2.674 0.007544 ** 
## SexoMujer:ramaaINA    -0.06467    0.10156  -0.637 0.524316    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8241 on 2413 degrees of freedom
## Multiple R-squared:  0.2187, Adjusted R-squared:  0.2152 
## F-statistic: 61.42 on 11 and 2413 DF,  p-value: < 2.2e-16

A la vista de este modelo concluimos con un diferenciación significativa entre sexos en cada una de las áreas competenciales, también por rama, y en concreto con un comportamiento diverso entre hombres y mujeres en distintas ramas de acceso (como ya comentamos a partir de las Figuras 7.1 y 7.2). A la vista de este ajuste, la predicción de capacitación media en cada una de las áreas competenciales se muestra en la Fig7.3. En las áreas AH y CC prácticamente no se aprecian diferencias entre hombres y mujeres, algo se aprecian en INA, y finalmente en CCSSJJ en en la rama de acceso en la que las diferencias por sexo resultan más marcadas.

8. Evaluación competencial por área competencial y autopercepción tecnológica.

Nos planteamos a continuación la pregunta de si la autopercepción sobre la capacitación tecnológica está más ligada a alguna de las áreas competenciales evaluadas. Ya demostramos anteriormente que en términos medios, los sujetos -especialmente los que se reconocían como avanzados tecnológicamente- tendían a sobrevalorar su competencia digital respecto a la evaluación media conseguida promediando la evaluación en cada una de las áreas competenciales. Estudiemos ahora si hay alguna área competencial en la que la autopercepción tecnológica esté próxima a la evaluación competencial.

En la Fig8.1 están representados los valores observados en cada una de las variables consideradas, con el fin de hacer visibles gráficamente las correlaciones entre las evaluaciones en las distintas áreas competenciales y la autopercepción tecnológica.

## `geom_smooth()` using formula 'y ~ x'

Para profundizar algo más en la identificación del área competencial más relacionada con la autopercepción tecnológica, calculamos las correlaciones de Spearman (para salvar las carencias que una escala entre 1 y 5 puede reportar a unas correlaciones habituales de Pearson). Como vemos en la Fig8.2, el área competencial más relacionada con la autopercepción tecnológica de los sujetos es la “C5. Resolución de problemas”, con una correlación (significativa) de 0.59. El resto de correlaciones se muestra en la Tabla 2; realmente no varían mucho entre sí, en un rango de 0.55 puntos (en una escala de 1 a 5).

Tabla 2: Correlaciones de Spearman entre autopercepción tecnológica (habil.tecno) y evaluación competencial en cada área (C1, … C5).
habil.tecno C1 C2 C3 C4 C5
habil.tecno 1.00 0.56 0.55 0.48 0.45 0.59
C1 0.56 1.00 0.66 0.57 0.53 0.62
C2 0.55 0.66 1.00 0.65 0.60 0.69
C3 0.48 0.57 0.65 1.00 0.55 0.67
C4 0.45 0.53 0.60 0.55 1.00 0.59
C5 0.59 0.62 0.69 0.67 0.59 1.00

Si seguimos indagando sobre diferencias entre hombres y mujeres al respecto de qué áreas competenciales están más relacionadas con la autopercepción tecnológica, encontramos diferencias, como se manifiesta en la Tabla3. En hombres la autopercepción tecnológica está más relacionada con la evaluación del área C1 (correlación 0.648). En mujeres, la mayor correlación se da con el área C5 (correlación 0.556). Concluimos pues, que en función de sexo la autopercepción tecnológica está más ligada a la evaluación de una u otra área competencial.

Por último, nos preguntamos si la autopercepción tecnológica está relacionada con la Generación Z. Para ello, calculamos el test t de Student para comparar ambos grupos (Generación z y anteriores), con la alternativa de que la autopercepción tecnológica de la Generación Z es superior a la de los nacidos antes. Aunque la diferencia en medias es apenas de dos décimas, el p-valor es significativo (p=), por lo que podemos aceptar estadísticamente dicha alternativa.

9. Modelización

En pos de aproximarnos a lo que puede ser un buen modelo de predicción de la evaluación competencial que tenga en cuenta la rama de acceso, el sexo, el área competencial y las habilidades tecnológicas de los sujetos, dada la escasez de datos (sólo 1) en algunos de los cruces, creamos una nueva variable para representar/clasificar a los sujetos respecto a su autopercepción tecnológica. Esta nueva variable agrupa en un nivel “Mínimo” a todos los sujetos que se autoperciben con 1 y 2, en un nivel “Medio” a los que declaran habilidades tecnológicas de 3 y 4, y “Máximo” a los que se asignan un 5 en habilidades tecnológicas. En la Fig9.1 se muestra las medias de la evaluación competencial en cada una de las áreas y en función de la autoclasificación tecnológica comentada. Sin diferenciar por sexo, apreciamos diferencias en la evaluación competencial en cualquiera de las áreas, entre los sujetos que se autodefinen con poca, media y avanzada habilidad tecnológica en su vida ordinaria.

Como apreciamos en la Fig9.2, para los sujetos con menor autopercepción tecnológica (habilidad tecnológica 1 o 2) es mayor la diferencia en la evaluación competencial entre hombres y mujeres. De hecho, los hombres obtienen una evaluación competencial inferior a las mujeres en todas las áreas evaluadas. Es menor la diferencia por sexo en los grupos de autopercepción tecnológica media (Med) y alta (Max), si bien los hombres quedan ligeramente por encima de las mujeres en su evaluación competencial. Esto nos hace pensar que las mujeres con pocas habilidades tecnológicas tienden a reconocerse menos habilidosas de lo que realmente demuestran en la evaluación competencial digital.

Como ya vimos anteriormente, la autopercepción tecnológica añade información sobre la evaluación competencial, como bien apreciamos en la distinta altura de las curvas en la Fig9.3. En ella están representadas las medias en la evaluación competencial que se obtienen en cada área competencial, diferenciada por rama de acceso (colores), sexo (filas) y autopercepción tecnológica (columnas).

Si incluimos el efecto generacional de la Generación Z, observamos en la Fig9.4 cómo en el grupo de los que se perciben menos habilidosos tecnológicamente (Min) los sujetos de la Generación Z consiguen una evaluación competencial superior a los que nacieron antes, en todas las áreas competenciales. Aun poco tecnológicos, la Generación Z sí demuestra una capacitación digital superior a los que nacieron antes de 1995. En los otros dos grupos de sujetos (habilidades tecnológicas medias y avanzadas), las diferencias entre los sujetos de la Generación Z y el resto son mínimas.

Para explicar el resultado de la evaluación competencial de los sujetos en función de sus características utilizamos las siguientes variables, que hemos estudiado de forma marginal previamente:

Ajustamos, desde la perspectiva Bayesiana, un modelo lineal normal en el que vinculamos las 5 mediciones de cada sujeto en las 5 áreas competenciales DIGCOMP a través de un efecto aleatorio. Puesto que todas las variables explicativas consideradas son categóricas, podemos incluir interacciones. No iremos más allá de las interacciones dobles para evitar modelos excesivamente complejos y difíciles de explicar y también para aprovechar al máximo los datos disponibles en la estimación de los efectos y su error. Con el fin de ser coherentes con los resultados previos, consideramos en el modelo de partida todas las variables anteriores y sus interacciones dobles, mas la interacción triple que previamente habíamos testado rama:Sexo:habil.tecno en ausencia del resto de variables involucradas ahora en el modelo.

Procedemos con la selección del modelo hacia atrás partiendo del modelo más complejo que asumimos viable, y vamos identificando qué efectos son poco significativos mediante la visualización de los intervales HPD al 95% (Highest Posterior Density): si el HPD de todos los parámetros asociados a un efecto contienen el cero, entonces lo proponemos como efecto para ser excluido del modelo. Como criterio de selección utilizamos el DIC (Deviance Information Criterion, see Spiegelhalter et al., 2002) y en el número de parámetros efectivos estimados o ENP (Effective number of parameters; see Spiegelhalter et al, 1998): preferiremos modelos más simples (en número de efectos) que vayan proporcionando una reducción del DIC y del ENP. Cuando no consigamos reducir o mantener el DIC con una reducción del número de efectos y de parámetros efectivos, pararemos de excluir efectos.

## 
## Attaching package: 'lmerTest'
## The following object is masked from 'package:lme4':
## 
##     lmer
## The following object is masked from 'package:stats':
## 
##     step
## Linear mixed model fit by REML. t-tests use Satterthwaite's method [
## lmerModLmerTest]
## Formula: formula
##    Data: datos.lon
## 
## REML criterion at convergence: 4511.1
## 
## Scaled residuals: 
##     Min      1Q  Median      3Q     Max 
## -3.2659 -0.5797 -0.0010  0.5907  3.3586 
## 
## Random effects:
##  Groups   Name        Variance Std.Dev.
##  id       (Intercept) 0.2513   0.5013  
##  Residual             0.2575   0.5074  
## Number of obs: 2425, groups:  id, 485
## 
## Fixed effects:
##                                          Estimate Std. Error         df t value
## (Intercept)                               2.10707    0.14262  855.06127  14.774
## competenciaC2                            -0.16228    0.11641 1927.99993  -1.394
## competenciaC3                            -0.91447    0.11641 1927.99993  -7.856
## competenciaC4                            -0.32895    0.11641 1927.99993  -2.826
## competenciaC5                            -0.57895    0.11641 1927.99993  -4.973
## SexoMujer                                -0.11341    0.05246  474.99999  -2.162
## ramaaCC                                  -0.11395    0.07056  474.99999  -1.615
## ramaaCCSSJJ                              -0.09121    0.06546  474.99999  -1.393
## ramaaINA                                  0.08780    0.07958  474.99999   1.103
## habil.tecno3Med                           1.07022    0.15252  907.04820   7.017
## habil.tecno3Max                           1.59869    0.14857  877.68026  10.761
## generacionz[1990,2005)                    0.69848    0.18577  474.99999   3.760
## competenciaC2:habil.tecno3Med            -0.02182    0.13007 1927.99995  -0.168
## competenciaC3:habil.tecno3Med            -0.26418    0.13007 1927.99995  -2.031
## competenciaC4:habil.tecno3Med            -0.07029    0.13007 1927.99995  -0.540
## competenciaC5:habil.tecno3Med            -0.05885    0.13007 1927.99995  -0.452
## competenciaC2:habil.tecno3Max            -0.03216    0.12371 1927.99994  -0.260
## competenciaC3:habil.tecno3Max            -0.31512    0.12371 1927.99994  -2.547
## competenciaC4:habil.tecno3Max            -0.14469    0.12371 1927.99994  -1.170
## competenciaC5:habil.tecno3Max             0.04919    0.12371 1927.99994   0.398
## habil.tecno3Med:generacionz[1990,2005)   -0.65912    0.20591  474.99999  -3.201
## habil.tecno3Max:generacionz[1990,2005)   -0.55048    0.19790  474.99999  -2.782
##                                        Pr(>|t|)    
## (Intercept)                             < 2e-16 ***
## competenciaC2                          0.163467    
## competenciaC3                          6.56e-15 ***
## competenciaC4                          0.004766 ** 
## competenciaC5                          7.17e-07 ***
## SexoMujer                              0.031128 *  
## ramaaCC                                0.106988    
## ramaaCCSSJJ                            0.164171    
## ramaaINA                               0.270457    
## habil.tecno3Med                        4.44e-12 ***
## habil.tecno3Max                         < 2e-16 ***
## generacionz[1990,2005)                 0.000191 ***
## competenciaC2:habil.tecno3Med          0.866818    
## competenciaC3:habil.tecno3Med          0.042383 *  
## competenciaC4:habil.tecno3Med          0.588971    
## competenciaC5:habil.tecno3Med          0.650975    
## competenciaC2:habil.tecno3Max          0.794889    
## competenciaC3:habil.tecno3Max          0.010932 *  
## competenciaC4:habil.tecno3Max          0.242286    
## competenciaC5:habil.tecno3Max          0.690968    
## habil.tecno3Med:generacionz[1990,2005) 0.001461 ** 
## habil.tecno3Max:generacionz[1990,2005) 0.005625 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Correlation matrix not shown by default, as p = 22 > 12.
## Use print(x, correlation=TRUE)  or
##     vcov(x)        if you need it

El primer efecto en desaparecer del modelo es la interacción triple rama:sexo:habil.tecno (todos los intervalos HPD en los que está involucrada la interacción triple contienen al cero, como se muestra en la figura anterior). De manera que es razonable partir del modelo con sólo las interacciones dobles.

Coefficients mean sd X0.025quant X0.5quant X0.975quant mode kld
(Intercept) 2.11 0.14 1.83 2.11 2.39 2.11 0
competenciaC2 -0.16 0.12 -0.39 -0.16 0.07 -0.16 0
competenciaC3 -0.91 0.12 -1.14 -0.91 -0.69 -0.91 0
competenciaC4 -0.33 0.12 -0.56 -0.33 -0.10 -0.33 0
competenciaC5 -0.58 0.12 -0.81 -0.58 -0.35 -0.58 0
SexoMujer -0.11 0.05 -0.22 -0.11 -0.01 -0.11 0
ramaaCC -0.11 0.07 -0.25 -0.11 0.02 -0.11 0
ramaaCCSSJJ -0.09 0.07 -0.22 -0.09 0.04 -0.09 0
ramaaINA 0.09 0.08 -0.07 0.09 0.24 0.09 0
habil.tecno3Med 1.07 0.15 0.77 1.07 1.37 1.07 0
habil.tecno3Max 1.60 0.15 1.31 1.60 1.89 1.60 0
generacionz[1990,2005) 0.70 0.19 0.33 0.70 1.06 0.70 0
competenciaC2:habil.tecno3Med -0.02 0.13 -0.28 -0.02 0.23 -0.02 0
competenciaC3:habil.tecno3Med -0.26 0.13 -0.52 -0.26 -0.01 -0.26 0
competenciaC4:habil.tecno3Med -0.07 0.13 -0.33 -0.07 0.18 -0.07 0
competenciaC5:habil.tecno3Med -0.06 0.13 -0.31 -0.06 0.20 -0.06 0
competenciaC2:habil.tecno3Max -0.03 0.12 -0.28 -0.03 0.21 -0.03 0
competenciaC3:habil.tecno3Max -0.32 0.12 -0.56 -0.32 -0.07 -0.32 0
competenciaC4:habil.tecno3Max -0.14 0.12 -0.39 -0.14 0.10 -0.14 0
competenciaC5:habil.tecno3Max 0.05 0.12 -0.19 0.05 0.29 0.05 0
habil.tecno3Med:generacionz[1990,2005) -0.66 0.21 -1.06 -0.66 -0.26 -0.66 0
habil.tecno3Max:generacionz[1990,2005) -0.55 0.20 -0.94 -0.55 -0.16 -0.55 0

Mostramos a continuación los HPD para los parámetros que se estiman en el modelo final resultante tras la selección de variables. Si bien existen HPD que contienen al cero (en rojo), no afecta a todos parámetros relacionados con un mismo efecto (por ejemplo la interacción competencia:habil.tecno, que es roja en algunas combinaciones de competencia-habil.tecno, pero no para otras).

Tras este proceso de selección de variables, el modelo resultante es:

\[valor \sim competencia + sexo + habil.tecno + generacionz + competencia:habil.tecno + competencia:generacionz+ habil.tecno:generacionz \] Con ello, estamos afirmando que la evaluación competencial de los sujetos es diferente en las diferentes áreas competenciales, pero además difiere en cada área en función de la autopercepción de los sujetos respecto a sus habilidades tecnológicas, y del hecho de que el sujeto pertenezca o no a la Generación Z. Además, hay un efecto diferenciador entre hombres y mujeres, que si bien podía verse relacionado en una primera inspección independiente de los datos con la rama de enseñanza a la que pertenece el título de acceso al máster de los estudiantes, el efecto rama ha sido excluido por no explicar/diferenciar sustancialmente. Es un hecho que la autopercepción sobre sus habilidades tecnológicas explica la evaluación competencial, así como el hecho de que el sujeto pertenezca o no a la Generación Z.

Concluimos estadísticamente que:

Efecto Sexo

Pintamos a continuación la distribución posterior sobre la diferencia en la evaluación competencial, en cualquier área DIGCOMP, entre hombres y mujeres, y damos una estimación del tamaño del efecto de -0.11 puntos en una escala del 1 al 5, y con un intervalo creíble al 95% de [-0.216,-0.011].

Predicción evaluación competencial

## [1] NaN
## [1] 0

Table: Data summary

Name varianza
Number of rows 100000
Number of columns 1
_______________________
Column type frequency:
numeric 1
________________________
Group variables None

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
data 0 1 0.26 0.01 0.22 0.25 0.26 0.26 0.3 ▁▅▇▁▁
##      2.5%     97.5% 
## 0.2412127 0.2737797

Tablas

Modelo 2: media blogal

Sólo empleamos a los sujetos susceptibles de iniciar un grado universitario en el formato Bologna, esto es, nacidos desde el 1991, dado que Bologna se inició el curso 2009-10.

## 
## Call:
##    c("inla(formula = formula, family = \"gaussian\", data = 
##    datos[datos$Nace >= ", " 1991, ], control.compute = list(mlik = TRUE, 
##    dic = TRUE, ", " cpo = TRUE), control.predictor = list(compute = 
##    TRUE))") 
## Time used:
##     Pre = 1.59, Running = 0.277, Post = 0.123, Total = 1.99 
## Fixed effects:
##                   mean    sd 0.025quant 0.5quant 0.975quant   mode kld
## (Intercept)      2.397 0.154      2.094    2.397      2.700  2.397   0
## SexoMujer       -0.108 0.070     -0.245   -0.108      0.029 -0.108   0
## habil.tecno3Med  0.288 0.158     -0.022    0.288      0.598  0.288   0
## habil.tecno3Max  0.931 0.150      0.636    0.931      1.227  0.931   0
## 
## Model hyperparameters:
##                                         mean    sd 0.025quant 0.5quant
## Precision for the Gaussian observations 3.70 0.331       3.08     3.69
##                                         0.975quant mode
## Precision for the Gaussian observations       4.38 3.67
## 
## Expected number of effective parameters(stdev): 4.01(0.001)
## Number of equivalent replicates : 62.66 
## 
## Deviance Information Criterion (DIC) ...............: 391.82
## Deviance Information Criterion (DIC, saturated) ....: 259.17
## Effective number of parameters .....................: 5.09
## 
## Marginal log-Likelihood:  -220.96 
## CPO and PIT are computed
## 
## Posterior marginals for the linear predictor and
##  the fitted values are computed