Expliqueu breument: - D’on prové el conjunt de dades: El conjunt de dades prové d’una pàgina web anomenada datos.gob.es, que conté molts conjunts de dades de diferents temes.
Quin és l’objectiu del projecte: Aprendre a utilitzar RStudio i respondre la pregunta proposada la sessió 1 de problemes.
Quina pregunta voleu respondre: La nostre pregunta és: “Hi ha més gent a la facultat d’informatica per ebau que gent que ha entrat a facultat de biologia per fp?”
Per què aquestes dades són adequades per aquesta pregunta: Perquè son les uniques estan relacionades a la pregunta que hem plantejat.
Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.
# Exemple d'importació (modifiqueu segons calgui)
dades <- read_csv("matriculados-forma-acceso-grado-2023-2024.csv")
## Rows: 68 Columns: 37
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (8): curso_academico, tipo_centro, centro_cod, centro, ciclo_titulacion...
## dbl (29): curso_academico_cod, centro_cod_mec, titulacion_cod, titulacion_co...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Expliqueu: - Quin era el format original (CSV, XLSX, txt…): EL format original del fitxer CSV
dim(dades)
## [1] 68 37
glimpse(dades)
## Rows: 68
## Columns: 37
## $ curso_academico_cod <dbl> 2023, 2023, 2023, 2023, 2023, 2…
## $ curso_academico <chr> "2023/2024", "2023/2024", "2023…
## $ tipo_centro <chr> "Centros adscritos", "Centros a…
## $ centro_cod <chr> "0E94", "0E94", "0E18", "0E92",…
## $ centro_cod_mec <dbl> 30011545, 30011545, 30013116, 3…
## $ centro <chr> "Isen Formación Universitaria",…
## $ ciclo_titulacion_cod <chr> "G", "G", "G", "G", "G", "G", "…
## $ ciclo_titulacion <chr> "Grado", "Grado", "Grado", "Gra…
## $ titulacion_cod <dbl> 242, 255, 238, 261, 260, 247, 2…
## $ titulacion_cod_mec <dbl> 2500379, 2500380, 2500942, 2503…
## $ titulacion <chr> "Grado en Educación Infantil (C…
## $ especialidad <chr> "No Aplica", "No Aplica", "No A…
## $ matriculados_preinscripcion <dbl> 45, 88, 52, 99, 25, 21, 42, 364…
## $ matriculados_preinscripcion_mujer <dbl> 42, 55, 41, 65, 8, 13, 41, 154,…
## $ matriculados_preinscripcion_hombre <dbl> 3, 33, 11, 34, 17, 8, 1, 210, 2…
## $ porc_matr_preinscripcion_mujer <dbl> 93.33333, 62.50000, 78.84615, 6…
## $ porc_matr_preinscripcion_hombre <dbl> 6.666667, 37.500000, 21.153846,…
## $ matriculados_ebau <dbl> 30, 83, 32, 90, 14, 17, 40, 319…
## $ matriculados_ebau_mujer <dbl> 29, 50, 25, 58, 4, 11, 39, 139,…
## $ matriculados_ebau_hombre <dbl> 1, 33, 7, 32, 10, 6, 1, 180, 13…
## $ porc_matriculados_ebau_mujer <dbl> 96.66667, 60.24096, 78.12500, 6…
## $ porc_matriculados_ebau_hombre <dbl> 3.333333, 39.759036, 21.875000,…
## $ matriculados_titulados <dbl> 0, 1, 2, 1, 2, 0, 0, 2, 2, 1, 0…
## $ matriculados_titulados_mujer <dbl> 0, 1, 1, 1, 2, 0, 0, 1, 1, 1, 0…
## $ matriculados_titulados_hombre <dbl> 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0…
## $ porc_matriculados_titulados_mujer <dbl> NA, 100.00000, 50.00000, 100.00…
## $ porc_matriculados_titulados_hombre <dbl> NA, 0.00000, 50.00000, 0.00000,…
## $ matriculados_de_fp <dbl> 14, 4, 12, 5, 3, 3, 0, 26, 9, 7…
## $ matriculados_de_fp_mujer <dbl> 12, 4, 10, 4, 2, 1, 0, 8, 5, 2,…
## $ matriculados_de_fp_hombre <dbl> 2, 0, 2, 1, 1, 2, 0, 18, 4, 5, …
## $ porc_matriculados_de_fp_mujer <dbl> 85.71429, 100.00000, 83.33333, …
## $ porc_matriculados_de_fp_hombre <dbl> 14.285714, 0.000000, 16.666667,…
## $ matriculados_otros_accesos <dbl> 1, 0, 6, 3, 6, 1, 2, 17, 9, 3, …
## $ matriculados_otros_accesos_mujer <dbl> 1, 0, 5, 2, 0, 1, 2, 6, 7, 3, 2…
## $ matriculados_otros_accesos_hombre <dbl> 0, 0, 1, 1, 6, 0, 0, 11, 2, 0, …
## $ porc_matriculados_otros_accesos_mujer <dbl> 100.00000, NA, 83.33333, 66.666…
## $ porc_matriculados_otros_accesos_hombre <dbl> 0.00000, NA, 16.66667, 33.33333…
Incloeu: - Nombre de files: 68 - Nombre de columnes: 37 - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…): Persones
Descriviu cada variable del dataset.
| Variable | Tipus | Descripció | Valors possibles / rang |
|---|---|---|---|
| exemple_var | numèrica | Significat de la variable | 0–100 |
tibble(
variable = names(dades),
tipus = sapply(dades, class)
)
## # A tibble: 37 × 2
## variable tipus
## <chr> <chr>
## 1 curso_academico_cod numeric
## 2 curso_academico character
## 3 tipo_centro character
## 4 centro_cod character
## 5 centro_cod_mec numeric
## 6 centro character
## 7 ciclo_titulacion_cod character
## 8 ciclo_titulacion character
## 9 titulacion_cod numeric
## 10 titulacion_cod_mec numeric
## # ℹ 27 more rows
Cada fila ens retorna un centre, la carrera i especialitat (que pot ser nul·la) i per la forma d’entrar a aquesta carrera el nombre de gent (homes, dones i conjunt) i els percentatges.
Les columnes son o numeric o characters.
summary(dades)
## curso_academico_cod curso_academico tipo_centro centro_cod
## Min. :2023 Length:68 Length:68 Length:68
## 1st Qu.:2023 Class :character Class :character Class :character
## Median :2023 Mode :character Mode :character Mode :character
## Mean :2023
## 3rd Qu.:2023
## Max. :2023
##
## centro_cod_mec centro ciclo_titulacion_cod ciclo_titulacion
## Min. :30008224 Length:68 Length:68 Length:68
## 1st Qu.:30008248 Class :character Class :character Class :character
## Median :30011430 Mode :character Mode :character Mode :character
## Mean :30010984
## 3rd Qu.:30011961
## Max. :30013992
##
## titulacion_cod titulacion_cod_mec titulacion especialidad
## Min. :200.0 Min. :2500124 Length:68 Length:68
## 1st Qu.:217.8 1st Qu.:2500382 Class :character Class :character
## Median :237.5 Median :2500804 Mode :character Mode :character
## Mean :238.3 Mean :3096782
## 3rd Qu.:260.2 3rd Qu.:2503603
## Max. :279.0 Max. :7001133
##
## matriculados_preinscripcion matriculados_preinscripcion_mujer
## Min. : 9.00 Min. : 2.00
## 1st Qu.: 42.00 1st Qu.: 23.50
## Median : 63.50 Median : 41.00
## Mean : 86.31 Mean : 54.51
## 3rd Qu.: 94.50 3rd Qu.: 67.00
## Max. :375.00 Max. :273.00
##
## matriculados_preinscripcion_hombre porc_matr_preinscripcion_mujer
## Min. : 1.00 Min. :17.50
## 1st Qu.: 12.00 1st Qu.:46.07
## Median : 20.50 Median :63.90
## Mean : 31.79 Mean :61.81
## 3rd Qu.: 37.25 3rd Qu.:78.96
## Max. :210.00 Max. :97.62
##
## porc_matr_preinscripcion_hombre matriculados_ebau matriculados_ebau_mujer
## Min. : 2.381 Min. : 9.00 Min. : 2.00
## 1st Qu.:21.038 1st Qu.: 32.75 1st Qu.: 18.75
## Median :36.103 Median : 56.00 Median : 33.50
## Mean :38.193 Mean : 73.35 Mean : 45.97
## 3rd Qu.:53.932 3rd Qu.: 85.00 3rd Qu.: 58.25
## Max. :82.500 Max. :343.00 Max. :252.00
##
## matriculados_ebau_hombre porc_matriculados_ebau_mujer
## Min. : 1.00 Min. :16.81
## 1st Qu.: 8.00 1st Qu.:47.97
## Median : 15.50 Median :65.28
## Mean : 27.38 Mean :62.40
## 3rd Qu.: 33.25 3rd Qu.:79.32
## Max. :188.00 Max. :97.50
##
## porc_matriculados_ebau_hombre matriculados_titulados
## Min. : 2.50 Min. :0.000
## 1st Qu.:20.68 1st Qu.:0.000
## Median :34.72 Median :1.000
## Mean :37.60 Mean :1.176
## 3rd Qu.:52.03 3rd Qu.:2.000
## Max. :83.19 Max. :6.000
##
## matriculados_titulados_mujer matriculados_titulados_hombre
## Min. :0.0000 Min. :0.0000
## 1st Qu.:0.0000 1st Qu.:0.0000
## Median :0.0000 Median :0.0000
## Mean :0.7647 Mean :0.4118
## 3rd Qu.:1.0000 3rd Qu.:1.0000
## Max. :3.0000 Max. :3.0000
##
## porc_matriculados_titulados_mujer porc_matriculados_titulados_hombre
## Min. : 0.00 Min. : 0.00
## 1st Qu.: 50.00 1st Qu.: 0.00
## Median : 66.67 Median : 33.33
## Mean : 64.42 Mean : 35.58
## 3rd Qu.:100.00 3rd Qu.: 50.00
## Max. :100.00 Max. :100.00
## NA's :28 NA's :28
## matriculados_de_fp matriculados_de_fp_mujer matriculados_de_fp_hombre
## Min. : 0.000 Min. : 0.0 Min. : 0.000
## 1st Qu.: 1.000 1st Qu.: 0.0 1st Qu.: 0.000
## Median : 3.000 Median : 2.0 Median : 1.500
## Mean : 7.485 Mean : 5.0 Mean : 2.485
## 3rd Qu.:12.250 3rd Qu.: 6.5 3rd Qu.: 3.250
## Max. :39.000 Max. :35.0 Max. :18.000
##
## porc_matriculados_de_fp_mujer porc_matriculados_de_fp_hombre
## Min. : 0.00 Min. : 0.00
## 1st Qu.: 33.33 1st Qu.: 14.29
## Median : 66.67 Median : 33.33
## Mean : 58.26 Mean : 41.74
## 3rd Qu.: 85.71 3rd Qu.: 66.67
## Max. :100.00 Max. :100.00
## NA's :15 NA's :15
## matriculados_otros_accesos matriculados_otros_accesos_mujer
## Min. : 0.000 Min. : 0.000
## 1st Qu.: 1.000 1st Qu.: 0.000
## Median : 3.000 Median : 2.000
## Mean : 4.294 Mean : 2.779
## 3rd Qu.: 6.000 3rd Qu.: 4.000
## Max. :23.000 Max. :17.000
##
## matriculados_otros_accesos_hombre porc_matriculados_otros_accesos_mujer
## Min. : 0.000 Min. : 0.00
## 1st Qu.: 0.000 1st Qu.: 47.50
## Median : 1.000 Median : 71.43
## Mean : 1.515 Mean : 63.83
## 3rd Qu.: 2.000 3rd Qu.:100.00
## Max. :11.000 Max. :100.00
## NA's :12
## porc_matriculados_otros_accesos_hombre
## Min. : 0.00
## 1st Qu.: 0.00
## Median : 28.57
## Mean : 36.17
## 3rd Qu.: 52.50
## Max. :100.00
## NA's :12
Comenteu: - Si hi ha valors perduts: Si entenem que perduts son valors NA només hi ha valors perduts on no hi hagi inscripcions d’aquell tipus per home o dona. - Si alguna variable s’hauria de transformar: No faria falta transformar cap. - Outliers o valors estranys: No.
Incloeu una o dues gràfiques exploratòries: La primera gràfica ens exposa el nombre de centres on ha entrat gent matriculada per l’ebau. I la segona gràfica és el mateix però unicament les dones.
# Exemple:
ggplot(dades, aes(x = matriculados_ebau)) + geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
ggplot(dades, aes(x = matriculados_ebau_mujer)) + geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
Expliqueu: - Si necessitareu dades externes per completar l’anàlisi: No ens faria falta cap dada externa. - On les podríeu trobar: A la mateixa web d’on hem extret el conjunt de dades. - Si falten variables per respondre la pregunta inicial: No ens falta cap variable.
Incloeu qualsevol altre detall rellevant del procés de preparació de dades.