Introducción
La distinción por sector de gestión de la educación constituye una de las formas de la diferenciación educativa y su estudio forma parte de las preocupaciones dentro del campo de investigación dedicado a lo que se suele denominar la segmentación escolar. Sin embargo, las características que asume en cada país del mundo son muy disímiles. De manera que en este trabajo nos proponemos realizar una aproximación a este tema a partir de conocer: a. Cuál es el porcentaje de estudiantes que asisten a la educación privada en cada país, b. Si existen diferencias segun regiones del mundo, c. Si pueden encontrarse diferencias en las caracteristicas que asume la escolarización en el sector privado entre los diferentes países.
Para este análisis se utilizan dos data sets que, al combinarlos, resultan útiles para respondernos a las preguntas recien planteadas. En primer lugar, el data set de monitoreo nacional del Instituto de Estadísticas de la UNESCO tiene información actualizada sobre este tema para la mayor parte de los países del mundo y desagregada por nivel educativo. También, admite el análisis por regiones. Para el trabajo con esta información se recorto el dato para el nivel secundario dado que es el nivel al que asiste la amplia mayoría de la poblacion del segundo data set que utilizaremos, surgido de la prueba PISA, de la OCDE. La misma se trata de una evaluacion de competencias que se toma a adolescentes de 15 años de diferentes paaies del mundo desde el año 2000 y cada tres años. La última se llevo a cabo en 2018 y abarco 78 países. Lo interesante de esta prueba es que se acompaña de cuestionarios complementarios a estudiantes y personal de las escuelas (entre otros), por lo que permite conocer información demogáfica, socioeconómica y sobre las características de las escuelas a las que asisten los evaluados. De manera que la combinación de los data sets surgidos de las encuestas a los estudiantes y las escuelas proporciona información valiosa para complementar este análisis.
Primera parte
En la primera parte de este trabajo se realiza una aproximación al porcentaje de estudiantes de nivel secundario que asiste a la educación privada en el mundo. Para tal fin, la primera tarea es preparar el data frame con el que se trabajara, es decir, seleccionar el indicador y el año. También es necesario seleccionar las regiones dado que este data set incluye varios casos por país segun diferentes agrupamientos por region. Aqui se decide trabajar con la clasificacion propia de la UNESCO y con el año 2018 dado que es el mismo año de la base de PISA con la que se trabajara luego. Finalmente, se excluye a la región Macao de China dado que corresponde a una región administrativa especial dentro de China a la vez que presenta un porcentaje muy alto de estudiantes de sector privado. Una primera mirada al data frame preparado permite saber que la base arroja información sobre el indicador de interes para 128 países. También, que el país con mayor porcentaje tiene un 75% de estudiantes de nivel secundario en educación privada y el menor, 0%. La media, por su parte, es de 17%.
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.4 v dplyr 1.0.7
## v tidyr 1.1.3 v stringr 1.4.0
## v readr 2.0.1 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
setwd("C:/Users/vicuc/Documents/Ciencias computacionales/TP")
uis <- read.csv("NATMON_DATA_NATIONAL.csv")
country <- read.csv("NATMON_COUNTRY.csv")
label <- read.csv("NATMON_LABEL.csv")
region <- read.csv("NATMON_REGION.csv")
uis <- left_join(uis, country, by = "COUNTRY_ID")
uis <- left_join(uis, label, by = "INDICATOR_ID")
secondary_private <- uis %>%
filter(INDICATOR_ID == "PRP.2T3")
secondary_private <- left_join(secondary_private, region, by = "COUNTRY_ID")
colnames(secondary_private)[7] <- "COUNTRY"
secondary_private2018 <- secondary_private %>%
select(COUNTRY, VALUE, REGION_ID, YEAR) %>%
filter(YEAR==2018) %>%
filter(REGION_ID == "UIS: Arab States" | REGION_ID =="UIS: Central and Eastern Europe" | REGION_ID =="UIS: Central Asia" | REGION_ID =="UIS: East Asia and the Pacific" | REGION_ID =="UIS: Latin America and the Caribbean" | REGION_ID == "UIS: North America and Western Europe" | REGION_ID =="UIS: South and West Asia" |REGION_ID == "UIS: Sub-Saharan Africa") %>%
filter(COUNTRY != "China, Macao Special Administrative Region") %>%
mutate(region = case_when(REGION_ID == "UIS: Arab States" ~ "Estados arabes",
REGION_ID =="UIS: Central and Eastern Europe" ~ "Europa central y del este",
REGION_ID =="UIS: Central Asia" ~ "Asia central",
REGION_ID =="UIS: East Asia and the Pacific" ~ "Este de Asia y Pacifico",
REGION_ID =="UIS: Latin America and the Caribbean" ~ "Latinoamerica y el Caribe",
REGION_ID == "UIS: North America and Western Europe" ~ "Norteamerica y Europa occidental",
REGION_ID =="UIS: South and West Asia" ~ "Sur de Asia y Asia occidental",
REGION_ID == "UIS: Sub-Saharan Africa" ~ "Africa Sub-Sahariana")) %>%
mutate(porcentaje = round(VALUE,
digits = 2)) %>%
summarise(COUNTRY, porcentaje, region)
summary (secondary_private2018)
## COUNTRY porcentaje region
## Length:128 Min. : 0.000 Length:128
## Class :character 1st Qu.: 5.115 Class :character
## Mode :character Median :11.860 Mode :character
## Mean :17.209
## 3rd Qu.:23.315
## Max. :74.760
Una vez preparada la base, una de las mejores formas para ver de manera rapida la distribucion es a partir de un mapa. Cabe aclarar que como la base no contiene datos georeferenciados, se tuvo que descargar una que si, a traves de la libreria worldmap y gracias al codigo de país normalizado ISO_A3 fue posible unirla al data frame con los datos de interes. Este ejercicio permite tener una primera impresion e identificar algunos países con porcentajes muy bajos o nulos (como Rusia) y otros muy altos (como India). También, una primera mirada advierte una diferencia entre países del sur y del norte, estos últimos con mayoría de colores azul y violeta, lo que indica porcentajes menores a los 20 puntos, aunque rápidamente también se advierte la necesidad de mirarlo con mayor detalle.
library(ggplot2)
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
library(rnaturalearth)
worldmap <- rnaturalearth::ne_download(scale = 110,
type = "countries",
category = "cultural",
destdir = tempdir(),
load = TRUE,
returnclass = "sp")
## OGR data source with driver: ESRI Shapefile
## Source: "C:\Users\vicuc\AppData\Local\Temp\RtmpS2sR2G", layer: "ne_110m_admin_0_countries"
## with 177 features
## It has 94 fields
## Integer64 fields read as strings: POP_EST NE_ID
worldmap_sf <- sf::st_as_sf(worldmap)
worldmap_sf$COUNTRY_ID=worldmap_sf$ISO_A3
secondary_private_CNT <- secondary_private %>%
select(COUNTRY, COUNTRY_ID)
secondary_private_CNT <- unique(secondary_private_CNT[,1:2])
secondary_private2018 <- left_join (secondary_private2018, secondary_private_CNT, by="COUNTRY")
mapa <- left_join(worldmap_sf, secondary_private2018, by= "COUNTRY_ID")
library(plotly)
p <- ggplot(mapa)+
geom_sf(aes(fill=porcentaje), color="white", size=.1)+
scale_fill_gradient(low = "blue", high = "red", na.value = "light grey", "Porcentaje")+
theme(axis.title.y = element_blank(),
axis.title.x = element_blank(),
legend.title = element_blank())+
labs(title = "Gráfico 1: Porcentaje de estudiantes\n de nivel secundario que asisten al sector privado, 2018",
caption = "Fuente: elaboracion propia en base al Instituto de Estadística de la UNESCO")+
theme_grey()
ggplotly (p, tooltip = "fill")
Por su parte, para el análisis agregado por región, un boxplot permite conocer el rango de porcentajes máximo y mínimo de cada país, la media y la variabilidad dentro de la region. Asi, como se muestra en el gráfico 2, los países con menos porcentaje de estudiantes de nivel secundario en el sector privado estan en Europa, Asia central y Norteamerica. Además, estas regiones son las que presentan menor variabilidad de datos. Por el contrario, las regiones del Sur de Asia y Asia occidental y Africa Sub Sahariana son las que presentan mayor variabilidad entre países y dentro de las cuales se encuentran los países con mayor porcentaje de estudiantes de nivel secundario.
ggplot(secondary_private2018) +
geom_boxplot( aes(x = region, y = porcentaje, fill=region))+
coord_flip()+
theme_minimal()+
theme(axis.title.y = element_blank(),
axis.title.x = element_blank(),
legend.position = "none")+
labs(title = "Grafico 2: países segun porcentaje de estudiantes de nivel\n secundario de sector privado, por región del mundo, 2018",
caption = "Fuente: Elaboracion propia en base al Instituto de Estadísticas de la UNESCO")
Por último, es posible conocer, en particular, los países con mayor porcentaje de estudiantes de nivel secundario y la región a la que pertenecen. Asi, de los seis primeros países, dos pertenecen a la región de Europa occidental (Reino Unido y Belgica) y dos a Latinoamerica y el Caribe (Chile, Granada y Guatemala). Finalmente, 2 son del continentes africano (Mauricio y Comoras)y uno, asiático. En noveno y decimo lugar se encuentran Australia e India. También, es interesante ver que en los diez países con mayores porcentajes, los estudiantes de nivel secundario que asistian al sector privado represesntaban más de la mitad.
library (kableExtra)
##
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
max <- secondary_private2018 %>%
summarise(COUNTRY, porcentaje) %>%
slice_max(porcentaje, n =10)
library(kableExtra)
kbl(max)
COUNTRY | porcentaje |
---|---|
United Kingdom of Great Britain and Northern Ireland | 74.76 |
Grenada | 63.11 |
Guatemala | 63.00 |
Chile | 61.91 |
Lebanon | 59.10 |
Belgium | 58.76 |
Mauritius | 56.59 |
Comoros | 55.01 |
Australia | 52.76 |
India | 51.13 |
Segunda parte
Analizar de manera complementaria los datos recien vistos junto con los que pueden obtenerse de las bases de la prueba PISA permite analizar algunas caracteristicas de la educación privada en cada país. En este caso, se debe aclarar que el universo son estudiantes de 15 años por lo que no son representativos del conjunto del nivel secundario de cada país. Además, la prueba abarca una cantidad de un poco más de 70 países. Sin embargo, su riqueza se encuentra en que permite conocer que tipo de “gestión privada” se trata para cada país (si es una escuela subvencionada por el estado o que depende del estado, o es una escuela privada independiente) así como caracteristicas de los estudiantes que asisten a este sector de gestión.
Nuevamente, fue necesario preparar el data frame con el que se trabajo a partir de unir las bases de estudiantes con las de escuelas y seleccionar las variables de interes. Además, es preciso calcular los porcentajes de estudiantes encuestados que asisten a educación privada por país dado que, en este data set, cada caso representa un estudiante, a diferencia del anterior donde este porcentaje ya era una variable para cada país. Por otro lado, como se trata de una muestra, es necesario ponderar los casos. Ello se hizo de manera sencilla generando una nueva variable del tipo de escuela (privada, privada dependiente del gobierno o con subsidios a la que se optó, para simplificar, llamarla “semi-privada”, y pública), pero con los casos ponderados (aplicando la función de sumar a la variable del ponderador). Con esta nueva variable, se calcularon los porcentajes a partir de transformar cada posible respuesta en un porcentaje del total. Cabe aclarar que, para esto, fue necesario previamente agrupar los casos tanto por país como por tipo de escuela. Finalmente, una vez calculados los porcentajes, la función “pivot wider” permite convertir cada “sector de gestión” en una nueva variable y asi contar con un data frame que resuma los porcentajes por país y sector de gestión. Por último, es posible agregar a este data frame una columna que indique el porcentaje de estudiantes de nivel secundario en educación privada del data set anterior (UNESCO). Si bien se observan diferencias en los porcentajes dado que en un caso se trata del total de la secundaria y en el otro, de los estudiantes de 15 años, lo que puede verse es que hay mucha difernecia entre los países cuando se desagrega por tipo de escuela privada. Esto permite saber que, por ejemplo, mientras que más del 70% de los estudiantes de nivel secundario asistia a una escuela privada en el Reino Unido, la mayoría se trataba de escuelas subvencionadas o dependientes del gobierno, mientras que en El Libano, por ejemplo, o Qatar, casi todos los estudiantes que asistian al sector privado lo hacian a una escuela privada independiente.
library(haven)
memory.limit(20000)
## [1] 20000
escuelas <- read_sav("CY07_MSU_SCH_QQQ.sav")
estudiantes <- read_sav("CY07_MSU_STU_QQQ.sav")
escuelas_privadas <- escuelas %>%
select("CNTSCHID", "SCHLTYPE")
estudiantes_privadas <- estudiantes %>%
select ("CNT", "CNTSCHID", "W_FSTUWT", "CNTRYID")
base_privadas <- left_join(estudiantes_privadas, escuelas_privadas, by = "CNTSCHID")
colnames(country) [1] = "CNT"
base_privadas <- left_join(base_privadas, country, by = "CNT")
colnames(base_privadas) [6] = "COUNTRY"
base_privadas <- left_join(base_privadas, country, by= "CNT")
privadas <- base_privadas %>%
group_by(COUNTRY, SCHLTYPE) %>%
summarise(poblacion_sector = sum(W_FSTUWT[!is.na(SCHLTYPE)]))%>%
transmute(SCHLTYPE, porcentaje_pisa = round(poblacion_sector/sum(poblacion_sector)*100,
digits = 2)) %>%
mutate(sector = case_when(SCHLTYPE == 1 ~ "privado",
SCHLTYPE == 2 ~ "semi_privado",
SCHLTYPE == 3 ~ "publico")) %>%
select(COUNTRY, sector, porcentaje_pisa) %>%
filter(sector == "publico" | sector == "privado" | sector == "semi_privado")
## `summarise()` has grouped output by 'COUNTRY'. You can override using the `.groups` argument.
colnames(privadas)[1] = "COUNTRY"
pivot <- pivot_wider(privadas, names_from = "sector", values_from = "porcentaje_pisa")
pivot_uis <- pivot[c(1,4,3,2)]
nueva_base_privadas <- secondary_private2018 %>%
summarise(COUNTRY, porcentaje)
pivot_uis <- left_join(pivot, nueva_base_privadas, by = "COUNTRY")
pivot_uis <- pivot_uis %>%
summarise(porcentaje, privado, `semi_privado`)
colnames(pivot_uis) [1] = "País"
colnames(pivot_uis) [2] = "UIS_2018"
colnames(pivot_uis) [3] = "privada_PISA"
colnames(pivot_uis) [4] = "semi_privada_PISA"
colnames(pivot) [1] = "País"
max2 <- pivot_uis %>%
slice_max(UIS_2018, n = 10)
kbl(max2)
País | UIS_2018 | privada_PISA | semi_privada_PISA |
---|---|---|---|
United Kingdom of Great Britain and Northern Ireland | 74.76 | 9.04 | 54.61 |
Chile | 61.91 | 13.71 | 49.18 |
Lebanon | 59.10 | 34.67 | 1.55 |
Australia | 52.76 | 14.51 | 23.17 |
Qatar | 49.18 | 41.21 | 1.51 |
Indonesia | 42.14 | 17.69 | 23.06 |
Malta | 35.81 | 13.76 | 31.31 |
Republic of Korea | 30.75 | 5.22 | 34.13 |
Spain | 30.23 | 6.12 | 24.50 |
Argentina | 26.99 | 8.02 | 21.37 |
Peru | 26.99 | 24.48 | 0.26 |
Por último, la base permite conocer el nivel socio economico de los estudiantes que asiste a cada sector de gestión. Esta variable es un indice dentro de la base que fue calculado a partir de respuestas de los estudiantes sobre el nivel educativo de su madre y padre, los ingresos del hogar, las pertenencias, etc. Para este analis, se dividio a la poblacion en cuatro percentiles segun el indice del nivel socio economico y se seleccionaron tres de los países con mayores porcentajes de estudiantes en sector privado, que estuvieran presentes en la base PISA y fueran de tres regiones diferentes. Para una visualizacion de la información, se selecciono a la poblacion del cuartil de mayor nivel socio economico y se opto por un grafico de barras apiladas ya que muestra de manera sencilla las proporciones dentro de esta poblacion que asistian a cada tipo de escuela. Asi, como se muestra en el grafico 3, mientras que en Chile, más de la mitad de estudiantes de mayor nivel socio economico asistia a escuelas privadas independientes, en inglaterra era el 25%. En Qatar, por su parte, este porcentaje era de más del 60% y representa a casi la totalidad de este grupo de estudiantes en educación privada. Por su parte, la asistencia al sector publico era minoritaria entre los jóvenes de mayor nivel socioeconómico en Chile (menos del 10%), mientras que en Qatar e Inglaterra, representaba más del 25%.
estudiantes_privadas_NSE <- estudiantes %>%
select ("CNT", "CNTSCHID", "W_FSTUWT", "CNTRYID", "ESCS")
estudiantes_escuelas <- left_join(estudiantes_privadas_NSE, escuelas_privadas, by = "CNTSCHID")
estudiantes_escuelas$CNTRYID = as.character(estudiantes_escuelas$CNTRYID)
estudiantes_escuelas <- left_join (estudiantes_escuelas, country, by= "CNT")
colnames(estudiantes_escuelas) [7] = "COUNTRY"
estudiantes_NSE <- estudiantes_escuelas %>%
group_by(COUNTRY) %>%
mutate(cuartiles = ntile(ESCS,4)) %>%
group_by(COUNTRY, SCHLTYPE, cuartiles) %>%
mutate(poblacion_sector = sum(W_FSTUWT[SCHLTYPE])) %>%
filter(!is.na(SCHLTYPE))
estudiantes_NSE$SCHLTYPE <- haven::as_factor(estudiantes_NSE$SCHLTYPE)
estudiantes_NSE_filter <- estudiantes_NSE %>%
filter(COUNTRY == "United Kingdom of Great Britain and Northern Ireland" | COUNTRY == "Chile" | COUNTRY == "Qatar") %>%
filter(cuartiles == "4") %>%
filter(!is.na(SCHLTYPE)) %>%
mutate(sector = case_when(SCHLTYPE == "Private Independent" ~ "privado",
SCHLTYPE == "Private Government-dependent" ~ "semi privado",
SCHLTYPE == "Public" ~ "publico")) %>%
mutate(País = case_when(COUNTRY == "United Kingdom of Great Britain and Northern Ireland" ~ "UK",
COUNTRY== "Chile" ~ "Chile",
COUNTRY == "Qatar" ~ "Qatar")) %>%
summarise(País, sector,W_FSTUWT)
## `summarise()` has grouped output by 'COUNTRY', 'SCHLTYPE', 'cuartiles'. You can override using the `.groups` argument.
estudiantes_NSE_filter$sector <- factor(estudiantes_NSE_filter$sector, levels=c("privado", "semi privado", "publico"))
ggplot(estudiantes_NSE_filter, aes(x=País, y= W_FSTUWT, fill=sector))+
geom_col (position="fill", stat="identity")+
theme_minimal()+
scale_fill_discrete() +
theme(axis.title.y = element_blank(),
axis.title.x = element_blank())+
labs(title = "Grafico 3: Porcentaje de estudiantes del cuartil de mayor NSE\nsegun sector de gestión al que asisten, Chile, Reino Unido y Qatar 2018",
caption = "Fuente: Elaboracion propia en base a PISA 2018, OCDE")
## Warning: Ignoring unknown parameters: stat
En conclusión, la diferenciación por sector de gestión, al menos en el nivel secundario, presenta divergencias importantes entre regiones y países que requieren de un análisis más pormenorizado. Entre las cuestiones a tenerse en cuenta, resulta central indagar sobre las formásque asume este sector de gestión en diferentes países y en que medida constituye una forma de la segmentacion educativa. Asi, esta primera aproximacion requiere de análisis másminuciosos ulteriores en torno a estas cuestiones.