La pregunta que hem decidit respondre segons les nostres variables és: “Hi ha més gent a la facultat d’informàtica per ebau que gent que ha entrat a Facultat de Biologia per FP?”
El nostre conjunt de dades escollit és el recull de dades d’inscripcions a universitats, segons els diferents mètodes d’entrada a universitats (ebau, cicle…).
Utilitzarem les següents variables: centro, matriculados_ebau, matriculados_de_fp. Com ja ens indica el nom centro ens dona el nom del centre, matriculados_ebau ens retorna el nombre de gent que ha entrat al centre per ebau i matriculados_fp ens retorna el nombre de gent que ha entrat al centre a través d’fp.
Les dades són del curs 2023-2024 justament de l’Universitat de Múrcia i no hem afegit cap variable.
Aquí tenim una taula amb les columnes necessàries per a respondre la nostre pregunta:
data %>%
select(centro, matriculados_ebau, matriculados_de_fp)
## centro
## 1 Isen Formación Universitaria
## 2 Isen Formación Universitaria
## 3 Escuela Universitaria Adscrita de Enfermería de la Comunidad Autonoma
## 4 Facultad de Turismo
## 5 Isen Formación Universitaria
## 6 Facultad de Turismo
## 7 Isen Formación Universitaria
## 8 Facultad de Economía y Empresa
## 9 Facultad de Bellas Artes
## 10 Facultad de Biología
## 11 Facultad de Química
## 12 Facultad de Biología
## 13 Facultad de Informática
## 14 Facultad de Letras
## 15 Facultad de Veterinaria
## 16 Facultad de Biología
## 17 Facultad de Derecho
## 18 Facultad de Ciencias del Deporte
## 19 Facultad de Comunicación y Documentación
## 20 Facultad de Derecho
## 21 Facultad de Derecho
## 22 Facultad de Economía y Empresa
## 23 Facultad de Educación
## 24 Facultad de Educación
## 25 Facultad de Educación
## 26 Facultad de Ciencias Sociosanitarias
## 27 Facultad de Enfermería
## 28 Facultad de Letras
## 29 Facultad de Letras
## 30 Facultad de Comunicación y Documentación
## 31 Facultad de Medicina
## 32 Facultad de Letras
## 33 Facultad de Filosofía
## 34 Facultad de Medicina
## 35 Facultad de Química
## 36 Facultad de Comunicación y Documentación
## 37 Facultad de Letras
## 38 Facultad de Letras
## 39 Facultad de Informática
## 40 Facultad de Química
## 41 Facultad de Letras
## 42 Facultad de Psicología
## 43 Facultad de Economía y Empresa
## 44 Facultad de Matemáticas
## 45 Facultad de Medicina
## 46 Facultad de Ciencias Sociosanitarias
## 47 Facultad de Medicina
## 48 Facultad de Educación
## 49 Facultad de Comunicación y Documentación
## 50 Facultad de Psicología
## 51 Facultad de Comunicación y Documentación
## 52 Facultad de Química
## 53 Facultad de Ciencias del Trabajo
## 54 Facultad de Economía y Empresa
## 55 Facultad de Ciencias Sociosanitarias
## 56 Facultad de Trabajo Social
## 57 Facultad de Letras
## 58 Facultad de Letras
## 59 Facultad de Veterinaria
## 60 Facultad de Óptica y Optometría
## 61 Facultad de Educación
## 62 Facultad de Matemáticas
## 63 Facultad de Matemáticas
## 64 Facultad de Derecho
## 65 Facultad de Química
## 66 Facultad de Educación
## 67 Facultad de Ciencias del Deporte
## 68 Facultad de Derecho
## matriculados_ebau matriculados_de_fp
## 1 30 14
## 2 83 4
## 3 32 12
## 4 90 5
## 5 14 3
## 6 17 3
## 7 40 0
## 8 319 26
## 9 85 9
## 10 79 7
## 11 75 3
## 12 50 6
## 13 41 0
## 14 9 0
## 15 43 6
## 16 31 2
## 17 33 3
## 18 85 16
## 19 58 3
## 20 54 0
## 21 343 3
## 22 137 2
## 23 115 19
## 24 251 14
## 25 90 39
## 26 40 23
## 27 135 32
## 28 11 1
## 29 141 0
## 30 30 1
## 31 49 1
## 32 41 0
## 33 38 2
## 34 54 18
## 35 61 0
## 36 48 2
## 37 113 4
## 38 49 3
## 39 226 4
## 40 68 0
## 41 78 1
## 42 57 13
## 43 68 3
## 44 68 0
## 45 171 27
## 46 24 22
## 47 25 13
## 48 72 7
## 49 51 3
## 50 189 7
## 51 55 6
## 52 57 5
## 53 95 12
## 54 14 5
## 55 11 15
## 56 99 34
## 57 25 0
## 58 71 0
## 59 66 17
## 60 47 12
## 61 58 14
## 62 40 0
## 63 20 0
## 64 24 0
## 65 18 1
## 66 66 1
## 67 19 1
## 68 92 0
Podem apreciar que les tendències a simple vista: Sembla que hi ha més gent que entra per ebau que per fp i sembla que hi ha més gent que entra a la Facultat de Dret que de lletres.
descriptives <- data %>%
summarise(
mitjana_ebau = mean(matriculados_ebau),
mediana_ebau = median(matriculados_ebau),
desviacio_ebau = sd(matriculados_ebau),
mitjana_fp = mean(matriculados_de_fp),
mediana_fp = median(matriculados_de_fp),
desviacio_fp = sd(matriculados_de_fp)
)
descriptives
## mitjana_ebau mediana_ebau desviacio_ebau mitjana_fp mediana_fp desviacio_fp
## 1 73.35294 56 66.02369 7.485294 3 9.211435
Un cop feta la taula podem apreciar que: Segons la mitjana d’estudiants per EBAU es veu que és molt superior a la mitjana per FP. Això confirmant-nos que la via EBAU és la principal porta d’entrada a la universitat.
La mediana també és molt més alta per EBAU, cosa que indica que no només hi ha alguns centres molt grans que distorsionin la mitjana, sinó que la tendència general és que la major part dels centres tenen més estudiants per EBAU que per FP.
La desviació estàndard d’EBAU és elevada, fet que ens suggereix molta variabilitat entre centres: alguns tenen pocs estudiants i d’altres en tenen molts, ja que cada centre té les seves capacitats màximes d’alumnes i també tenen diferents nivells de popularitat, fent que els més populars estiguin normalment més plens.
La desviació estàndard d’FP és més baixa, però continua reflectint casos puntuals amb xifres altes que augmenten la variabilitat. Tot i això, els valors es mantenen significativament per sota dels d’EBAU.
Com podem apreciar en aquest gràfic podem veure quants centres tenim depenent del nombre d’entrades per EBAU a diferents carreres.
ggplot(data, aes(x = matriculados_ebau)) +
geom_histogram(bins = 20)
En aquest gràfic es pot apreciar el mateix, però en comptes d’entrades a carreres per EBAU observem entrades per Formació Professional (FP).
ggplot(data, aes(x = matriculados_de_fp)) +
geom_histogram(bins = 20)
En aquests dos gràfics es pot apreciar clarament que el nombre de gent que entra a les diferents carreres és més alt per EBAU i no per Formació Professional.
Es genera un boxplot on l’eix horitzontal (X) mostra les dues formes d’accés i l’eix vertical (Y) representa el nombre d’estudiants matriculats.
La part central de la caixa representa el 50% dels valors (entre el primer i el tercer quartil), mentre que la línia dins la caixa de color negre indica la mediana dels valors seleccionats.
Podem també apreciar els “bigotis” (Whiskers) de les caixes que ens determinen fins a on són típiques les dades, si una dada surt d’aquests “bigotis” ens suposa una dada atípica.
data %>%
pivot_longer(cols = c(matriculados_ebau, matriculados_de_fp),
names_to = "via",
values_to = "matriculats") %>%
ggplot(aes(x = via, y = matriculats)) +
geom_boxplot()
### 4.3 Comparativa de centres
Generant aquesta última gràfica podem acabar de concloure que moltíssima més gent entra a les carreres per EBAU que per Formació Professional, podent assegurar que és un 100% dels cops (almenys aquest any).
data %>%
pivot_longer(cols = c(matriculados_ebau, matriculados_de_fp),
names_to = "via",
values_to = "matriculats") %>%
ggplot(aes(x = centro, y = matriculats, fill = via)) +
geom_col(position = "dodge") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Segons la informació extreta de les gràfiques generades podem assegurar en relació a la nostre pregunta: “Hi ha més gent a la facultat d’informàtica per EBAU que gent que ha entrat a la Facultat de Biologia per FP?”.
Hi ha més gent a la facultat d’informàtica que a la de biologia, hi ha més matriculats per ebau que per FP en general i que la majoria de la gent que entra a la Facultat de Biologia entra per ebau. Aquestes conclusions les hem pogut extreure a partir d’observar els diferents gràfics obtinguts partir del conjunt de dades i també observant el conjunt de dades en si mateix, per exemple als gràfics es veu clarament que la majoria de matriculats provenen de l’ebau i no d’FP ni d’altres mètodes.
Tant al dataset com a l’anàlisi no hem trobat cap limitació relacionada amb la nostra pregunta, ja que les dades que hi ha al conjunt, considerem que són tan prou clares i no ens falten dades, perquè el nostre conjunt ja recopila totes les dades possibles (per respondre la nostra pregunta), llavors tampoc es pot dir que faltaven dades, per aquestes raons considerem que al moment de respondre la pregunta ni el dataset, ni l’anàlisi, ni el conjunt de dades presenten cap dificultat.
Les pròximes passes a fer seria netejar millor les nostres dades, ja que tenim moltes que no fem servir a l’hora de respondre la nostra pregunta i dades irrellevants que segurament no utilitzarem al llarg del treball i menys per respondre la pregunta, per exemple el número de matriculats que no vinguin d’ebau ni per FP, el número de matriculats a les facultats no implicades a la pregunta… Un pròxim pas, podria seria usar un model predictiu per a calcular els matriculats tant d’ebau com d’FP que hi haurà l’any vinent basant-nos en les dades d’aquest any.