Introducción

Este trabajo final lo estoy realizando con la base de datos del proyecto de investigación EdDit: Corporaciones tecnológicas, plataformas educativas digitales y garantía de los derechos de la infancia con enfoque de género https://esbrina.eu/es/portfolio/corporacions-tecnologiques-plataformes-educatives-digitals-i-garantia-dels-drets-de-la-infancia-amb-enfocament-de-genere-2/. El objetivo de este proyecto fue la exploración y análisis de las políticas, preocupaciones y prácticas de uso de estas plataformas digitales en las escuelas públicas que proveen enseñanzas obligatorias en Cataluña. Como parte de este proyecto se buscó indagar en al opinión sobre los familiares. En este proyecto participé muy activamente en el diseño, validación y aplicación del cuestionario utilizado para la recopilación de datos. De este proyecto ya se han publicado varios artículos. Entre ellos, he participado en:

Calderón-Garrido, D., Parcerisa, L., Rivera-Vargas, P., y Moreno-Gonzàlez, A. (2023). Opiniones de las familias sobre corporaciones tecnológicas, plataformas digitales educativas y derechos de la infancia: validación psicométrica de un instrumento. Revista Aloma. 41(1), 141-148. https://doi.org/10.51698/aloma.2023.41.1.141-148

Moreno-González, A., Caderón-Garrido, D., Parcerisa, Ll., Rivera-Vargas, P., y Jacovkis, J. (2023). Survey data on Families’ perceptions of ed-tech corporations, educational digital platforms and children’s rights. Data in brief, https://doi.org/10.1016/j.dib.2023.109017

Jacovkis, J., Rivera-Vargas, P., Parcerisa, L., y Calderón, D. (2022). Resistir, alinear o adherir. Los centros educativos y las familias ante las BigTech y sus plataformas educativas digitales. Edutec. Revista Electrónica de Tecnología Educativa, (82), 104-118. https://doi.org/10.21556/edutec.2022.82.2615 Este trabajo final me está sirviendo también para analizar los datos desde otra perspectiva y así poder publicar nuevos artículos.

Hipótesis de partida

Entre las preguntas de este cuestionario, había una sobre la confizana que tenían las famílias en la escuela. Así pues, nuestra hipótesis de partida será que la confizana en la escuela está mediada por las preocupación y opiniones que tienen las familias respecto a los datos que se generan por el uso de plataformas educativas. Por este motivo, crearemos un modelo de predicción de una regresión en la que la confianza en la escuela será la variable dependiente.

Preparación

En primer lugar cargamos todas las librerías que usaremos en este trabajo.

library(tidyverse)
library(gtsummary)
library(knitr)
library(pls)
library(leaps)
library(apaTables)
library (MASS)
library(readxl)
library(car)
library(glmnet)
library(caret)
library(rpart)
library(rpart.plot)

A continuación, cargamos la base de datos de un archivo excel externo.

EdDit <- read_excel("EdDit.xlsx")

Estudio de la base de datos

Estudiamos la base de datos.

names(EdDit)

##  [1] "Género Familia"                      "Edad Familia"                       
##  [3] "Nivel de estudios"                   "Género alumnado"                    
##  [5] "Edad alumando"                       "Etapa educativa"                    
##  [7] "Riesgo gestión pública educación"    "Colaboración necesaria"             
##  [9] "Clave derecho educación"             "Principios democráticos"            
## [11] "Mejora proceso de aprendizaje"       "Trabajo coperativo"                 
## [13] "Disfrutar uso"                       "Intuitivas acompañamiento"          
## [15] "Favorecen la comunicación"           "Reproducción roles género"          
## [17] "Utilización/comercialización"        "Pagar por su uso"                   
## [19] "Vulneración privacidad"              "Condicionar"                        
## [21] "Creación perfiles"                   "Fuente de distracción"              
## [23] "Reducción socialización"             "Uso suficientement supervisado"     
## [25] "Creación perfiles usos comerciales"  "Mejorar experiencia de los usuarios"
## [27] "Protección escuela"

str(EdDit)

## tibble [1,639 × 27] (S3: tbl_df/tbl/data.frame)
##  $ Género Familia                     : chr [1:1639] "Femenino" "Femenino" "Femenino" "Femenino" ...
##  $ Edad Familia                       : num [1:1639] 46 43 47 46 43 46 45 44 45 50 ...
##  $ Nivel de estudios                  : chr [1:1639] "Postuniversitarios" "Postuniversitarios" "Preuniversitarios" "Universitarios" ...
##  $ Género alumnado                    : chr [1:1639] "Femenino" "Femenino" "Femenino" "Masculino" ...
##  $ Edad alumando                      : num [1:1639] 13 13 9 13 10 15 14 13 9 14 ...
##  $ Etapa educativa                    : chr [1:1639] "Secundaria" "Secundaria" "Primaria" "Secundaria" ...
##  $ Riesgo gestión pública educación   : num [1:1639] 6 4 3 2 1 6 5 2 3 5 ...
##  $ Colaboración necesaria             : num [1:1639] 1 4 5 5 1 5 6 5 4 4 ...
##  $ Clave derecho educación            : num [1:1639] 4 1 2 4 1 5 5 5 4 5 ...
##  $ Principios democráticos            : num [1:1639] 6 3 2 3 1 3 3 2 3 4 ...
##  $ Mejora proceso de aprendizaje      : num [1:1639] 3 2 2 4 1 5 4 2 3 6 ...
##  $ Trabajo coperativo                 : num [1:1639] 6 1 4 4 1 5 5 4 2 6 ...
##  $ Disfrutar uso                      : num [1:1639] 3 1 4 4 1 5 4 3 4 6 ...
##  $ Intuitivas acompañamiento          : num [1:1639] 6 1 3 4 1 4 5 1 3 6 ...
##  $ Favorecen la comunicación          : num [1:1639] 5 1 5 4 1 5 6 2 2 6 ...
##  $ Reproducción roles género          : num [1:1639] 2 2 2 3 1 2 4 1 3 2 ...
##  $ Utilización/comercialización       : num [1:1639] 6 6 6 6 6 6 1 6 6 6 ...
##  $ Pagar por su uso                   : num [1:1639] 6 6 6 3 6 6 1 4 5 4 ...
##  $ Vulneración privacidad             : num [1:1639] 6 6 6 5 6 6 1 6 6 6 ...
##  $ Condicionar                        : num [1:1639] 6 6 4 6 6 5 2 1 6 5 ...
##  $ Creación perfiles                  : num [1:1639] 6 6 6 6 6 6 3 4 6 5 ...
##  $ Fuente de distracción              : num [1:1639] 4 6 4 3 6 3 1 6 6 2 ...
##  $ Reducción socialización            : num [1:1639] 4 6 2 4 6 4 1 6 6 4 ...
##  $ Uso suficientement supervisado     : num [1:1639] 4 6 5 5 6 4 1 6 6 3 ...
##  $ Creación perfiles usos comerciales : num [1:1639] 1 1 1 1 1 1 2 6 6 2 ...
##  $ Mejorar experiencia de los usuarios: num [1:1639] 6 4 3 4 6 3 5 3 3 2 ...
##  $ Protección escuela                 : num [1:1639] 1 1 4 4 1 5 4 4 3 4 ...

DT::datatable(head(EdDit))

Para poder trabajar más fácilmente, usamos la función attach()

attach(EdDit)

Realizamos un estudio de las variables sociodemográficas.

tbl_summary(EdDit[1:6])

Characteristic	N = 1,639¹
Género Familia
Femenino	1,339 (82%)
Masculino	288 (18%)
No binario	12 (0.7%)
Edad Familia	44.0 (41.0, 48.0)
Nivel de estudios
Postuniversitarios	300 (18%)
Preuniversitarios	568 (35%)
Universitarios	771 (47%)
Género alumnado
Femenino	784 (48%)
Masculino	847 (52%)
No binario	8 (0.5%)
Edad alumando	11.00 (8.00, 13.00)
Etapa educativa
Primaria	1,053 (64%)
Secundaria	586 (36%)
¹ n (%); Median (IQR)

ggplot(data = EdDit, aes(x =`Género Familia`, fill = as.factor(`Género Familia`))) + 
  geom_bar() + 
  xlab("Género de los familiares") + 
  ylab("Muestra") + labs(fill = "Género") +  theme_minimal()

kable(table(`Género Familia`, `Género alumnado`))

	Femenino	Masculino	No binario
Femenino	641	692	6
Masculino	139	149	0
No binario	4	6	2

ggplot(data = EdDit, aes(x = `Género Familia`, fill = `Género alumnado`)) + 
  geom_bar() + 
  xlab("Género de la familia") + 
  ylab("Muestra") +  theme_minimal()

kable(table(`Género Familia`, `Etapa educativa`))

	Primaria	Secundaria
Femenino	871	468
Masculino	172	116
No binario	10	2

kable(table(`Género Familia`, `Nivel de estudios`))

	Postuniversitarios	Preuniversitarios	Universitarios
Femenino	242	472	625
Masculino	56	92	140
No binario	2	4	6

kable(table(`Género alumnado`, `Etapa educativa`))

	Primaria	Secundaria
Femenino	516	268
Masculino	532	315
No binario	5	3

 ggplot(data = EdDit, aes(x = `Género alumnado`, fill = `Etapa educativa`)) + 
  geom_bar() + 
  xlab("Género del alumnado") + 
  ylab("Muestra") +  theme_minimal()

ggplot(EdDit) + 
  geom_histogram(binwidth = 1, aes(x = `Edad Familia`, fill = `Nivel de estudios`)) + 
  xlab("Edad de la familia") + 
  ylab("Frecuencia")  +
  theme_minimal()

Finalmente, y ya que será nuestra variable dependiente, incluimos algún gráfico relacionado con con la protección por parte de la escuela.

ggplot(data = EdDit, aes(x =`Etapa educativa`, y = `Protección escuela`)) + 
  geom_jitter(aes(color = `Etapa educativa`), size = 1, alpha = 0.8) +
  geom_boxplot(aes(color = `Etapa educativa`), alpha = 0.5) +
  ylab('Protección por parte de la escuela') +
  theme_minimal()

ggplot(data = EdDit, aes(x = `Género Familia`, y = `Protección escuela`)) + 
  geom_jitter(aes(color = `Género Familia`), size = 1, alpha = 0.8) +
  geom_boxplot(aes(color = `Género Familia`), alpha = 0.5) +
  ylab('Protección por parte de la escuela') +
  theme_minimal()

ggplot(data = EdDit, aes(x = `Género alumnado`, y = `Protección escuela`)) + 
  geom_jitter(aes(color = `Género alumnado`), size = 1, alpha = 0.8) +
  geom_boxplot(aes(color = `Género alumnado`), alpha = 0.5) +
  ylab('Protección por parte de la escuela') +  coord_flip() +
  theme_minimal()

 ggplot(data = EdDit, aes(x = `Nivel de estudios`, y = `Protección escuela`)) + 
    geom_jitter(size = 1, , color = "gray", alpha = 0.5) +
    geom_violin(aes(fill = `Nivel de estudios`),color = 'black', alpha = 0.8) + 
    geom_boxplot (color = 'black', alpha = 0.7) + 
    xlab("Nivel de estudios de la familia") + 
    ylab('Protección por parte de la escuela') +
    theme_minimal()

Regresión Lineal con todas las variables

Realizamos una regresión lineal con todos las variables.

lm.fit <- lm(`Protección escuela`~ . , data = EdDit)
summary(lm.fit)

## 
## Call:
## lm(formula = `Protección escuela` ~ ., data = EdDit)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.9283 -0.7035  0.0338  0.7189  3.9815 
## 
## Coefficients:
##                                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                            3.227772   0.336136   9.603  < 2e-16 ***
## `Género Familia`Masculino             -0.147893   0.073556  -2.011 0.044534 *  
## `Género Familia`No binario            -0.272660   0.326702  -0.835 0.404077    
## `Edad Familia`                         0.004001   0.005878   0.681 0.496225    
## `Nivel de estudios`Preuniversitarios   0.315794   0.080305   3.932 8.77e-05 ***
## `Nivel de estudios`Universitarios      0.115624   0.075134   1.539 0.124027    
## `Género alumnado`Masculino            -0.057201   0.054833  -1.043 0.297026    
## `Género alumnado`No binario            0.277765   0.398923   0.696 0.486349    
## `Edad alumando`                        0.020396   0.017019   1.198 0.230932    
## `Etapa educativa`Secundaria           -0.374420   0.093410  -4.008 6.39e-05 ***
## `Riesgo gestión pública educación`    -0.077321   0.019859  -3.894 0.000103 ***
## `Colaboración necesaria`               0.162903   0.022511   7.237 7.09e-13 ***
## `Clave derecho educación`             -0.030993   0.024902  -1.245 0.213469    
## `Principios democráticos`             -0.021951   0.019990  -1.098 0.272319    
## `Mejora proceso de aprendizaje`        0.067997   0.031427   2.164 0.030639 *  
## `Trabajo coperativo`                   0.035347   0.027469   1.287 0.198347    
## `Disfrutar uso`                        0.110050   0.027971   3.934 8.69e-05 ***
## `Intuitivas acompañamiento`            0.086236   0.026255   3.285 0.001043 ** 
## `Favorecen la comunicación`            0.070608   0.022152   3.187 0.001463 ** 
## `Reproducción roles género`           -0.023023   0.020998  -1.096 0.273047    
## `Utilización/comercialización`        -0.044381   0.029304  -1.515 0.130092    
## `Pagar por su uso`                     0.045959   0.019463   2.361 0.018324 *  
## `Vulneración privacidad`               0.005926   0.028507   0.208 0.835363    
## Condicionar                           -0.060870   0.027309  -2.229 0.025956 *  
## `Creación perfiles`                   -0.021574   0.023474  -0.919 0.358211    
## `Fuente de distracción`               -0.007902   0.023987  -0.329 0.741891    
## `Reducción socialización`              0.058575   0.024809   2.361 0.018342 *  
## `Uso suficientement supervisado`      -0.132005   0.026323  -5.015 5.89e-07 ***
## `Creación perfiles usos comerciales`  -0.001264   0.013988  -0.090 0.928021    
## `Mejorar experiencia de los usuarios` -0.113262   0.019653  -5.763 9.88e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.092 on 1609 degrees of freedom
## Multiple R-squared:  0.4144, Adjusted R-squared:  0.4039 
## F-statistic: 39.27 on 29 and 1609 DF,  p-value: < 2.2e-16

Como podemos obervar, hay muchas variables que tienen un p valor alto y que, por tanto, no influyen en el modelo

Método Backward selection

Así pues iremos eliminando una a una las variables empezando por las que tienen un p valor más alto (método Backward selection) y creando nueva data frame y volviendo a hacer la regresión lineal. Usamos la técnica de Backaward selection para concretar las variables que intervienen en la regresión.

EdDit.lm2 <- EdDit [ , - 25]
lm.fit2 <- lm(`Protección escuela`~ . , data = EdDit.lm2)
summary(lm.fit2)

## 
## Call:
## lm(formula = `Protección escuela` ~ ., data = EdDit.lm2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.9262 -0.7020  0.0347  0.7188  3.9836 
## 
## Coefficients:
##                                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                            3.224444   0.334009   9.654  < 2e-16 ***
## `Género Familia`Masculino             -0.148044   0.073515  -2.014  0.04420 *  
## `Género Familia`No binario            -0.272416   0.326590  -0.834  0.40434    
## `Edad Familia`                         0.004001   0.005876   0.681  0.49603    
## `Nivel de estudios`Preuniversitarios   0.315485   0.080207   3.933 8.73e-05 ***
## `Nivel de estudios`Universitarios      0.115503   0.075099   1.538  0.12424    
## `Género alumnado`Masculino            -0.057119   0.054809  -1.042  0.29750    
## `Género alumnado`No binario            0.278189   0.398772   0.698  0.48552    
## `Edad alumando`                        0.020390   0.017014   1.198  0.23093    
## `Etapa educativa`Secundaria           -0.374518   0.093375  -4.011 6.33e-05 ***
## `Riesgo gestión pública educación`    -0.077399   0.019834  -3.902 9.92e-05 ***
## `Colaboración necesaria`               0.162924   0.022503   7.240 6.91e-13 ***
## `Clave derecho educación`             -0.031095   0.024869  -1.250  0.21135    
## `Principios democráticos`             -0.021974   0.019982  -1.100  0.27162    
## `Mejora proceso de aprendizaje`        0.068040   0.031414   2.166  0.03046 *  
## `Trabajo coperativo`                   0.035378   0.027458   1.288  0.19778    
## `Disfrutar uso`                        0.110017   0.027960   3.935 8.68e-05 ***
## `Intuitivas acompañamiento`            0.086276   0.026243   3.288  0.00103 ** 
## `Favorecen la comunicación`            0.070694   0.022125   3.195  0.00142 ** 
## `Reproducción roles género`           -0.023043   0.020990  -1.098  0.27247    
## `Utilización/comercialización`        -0.044453   0.029284  -1.518  0.12921    
## `Pagar por su uso`                     0.045979   0.019455   2.363  0.01823 *  
## `Vulneración privacidad`               0.005889   0.028496   0.207  0.83630    
## Condicionar                           -0.060777   0.027281  -2.228  0.02603 *  
## `Creación perfiles`                   -0.021583   0.023467  -0.920  0.35786    
## `Fuente de distracción`               -0.007957   0.023972  -0.332  0.73998    
## `Reducción socialización`              0.058578   0.024801   2.362  0.01830 *  
## `Uso suficientement supervisado`      -0.132044   0.026311  -5.019 5.78e-07 ***
## `Mejorar experiencia de los usuarios` -0.113074   0.019537  -5.788 8.56e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.092 on 1610 degrees of freedom
## Multiple R-squared:  0.4144, Adjusted R-squared:  0.4042 
## F-statistic: 40.69 on 28 and 1610 DF,  p-value: < 2.2e-16