1. Introducció

Expliqueu breument: - D’on prové el conjunt de dades: El conjunt de dades prové d’una pàgina web anomenada datos.gob.es, que conté molts conjunts de dades de diferents temes.

2. Importació de les dades

Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.

# Exemple d'importació (modifiqueu segons calgui)
 dades <- read_csv("matriculados-forma-acceso-grado-2023-2024.csv")
## Rows: 68 Columns: 37
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr  (8): curso_academico, tipo_centro, centro_cod, centro, ciclo_titulacion...
## dbl (29): curso_academico_cod, centro_cod_mec, titulacion_cod, titulacion_co...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Expliqueu: - Quin era el format original (CSV, XLSX, txt…): EL format original del fitxer CSV

3. Dimensions del dataset

 dim(dades)
## [1] 68 37
 glimpse(dades)
## Rows: 68
## Columns: 37
## $ curso_academico_cod                    <dbl> 2023, 2023, 2023, 2023, 2023, 2…
## $ curso_academico                        <chr> "2023/2024", "2023/2024", "2023…
## $ tipo_centro                            <chr> "Centros adscritos", "Centros a…
## $ centro_cod                             <chr> "0E94", "0E94", "0E18", "0E92",…
## $ centro_cod_mec                         <dbl> 30011545, 30011545, 30013116, 3…
## $ centro                                 <chr> "Isen Formación Universitaria",…
## $ ciclo_titulacion_cod                   <chr> "G", "G", "G", "G", "G", "G", "…
## $ ciclo_titulacion                       <chr> "Grado", "Grado", "Grado", "Gra…
## $ titulacion_cod                         <dbl> 242, 255, 238, 261, 260, 247, 2…
## $ titulacion_cod_mec                     <dbl> 2500379, 2500380, 2500942, 2503…
## $ titulacion                             <chr> "Grado en Educación Infantil (C…
## $ especialidad                           <chr> "No Aplica", "No Aplica", "No A…
## $ matriculados_preinscripcion            <dbl> 45, 88, 52, 99, 25, 21, 42, 364…
## $ matriculados_preinscripcion_mujer      <dbl> 42, 55, 41, 65, 8, 13, 41, 154,…
## $ matriculados_preinscripcion_hombre     <dbl> 3, 33, 11, 34, 17, 8, 1, 210, 2…
## $ porc_matr_preinscripcion_mujer         <dbl> 93.33333, 62.50000, 78.84615, 6…
## $ porc_matr_preinscripcion_hombre        <dbl> 6.666667, 37.500000, 21.153846,…
## $ matriculados_ebau                      <dbl> 30, 83, 32, 90, 14, 17, 40, 319…
## $ matriculados_ebau_mujer                <dbl> 29, 50, 25, 58, 4, 11, 39, 139,…
## $ matriculados_ebau_hombre               <dbl> 1, 33, 7, 32, 10, 6, 1, 180, 13…
## $ porc_matriculados_ebau_mujer           <dbl> 96.66667, 60.24096, 78.12500, 6…
## $ porc_matriculados_ebau_hombre          <dbl> 3.333333, 39.759036, 21.875000,…
## $ matriculados_titulados                 <dbl> 0, 1, 2, 1, 2, 0, 0, 2, 2, 1, 0…
## $ matriculados_titulados_mujer           <dbl> 0, 1, 1, 1, 2, 0, 0, 1, 1, 1, 0…
## $ matriculados_titulados_hombre          <dbl> 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0…
## $ porc_matriculados_titulados_mujer      <dbl> NA, 100.00000, 50.00000, 100.00…
## $ porc_matriculados_titulados_hombre     <dbl> NA, 0.00000, 50.00000, 0.00000,…
## $ matriculados_de_fp                     <dbl> 14, 4, 12, 5, 3, 3, 0, 26, 9, 7…
## $ matriculados_de_fp_mujer               <dbl> 12, 4, 10, 4, 2, 1, 0, 8, 5, 2,…
## $ matriculados_de_fp_hombre              <dbl> 2, 0, 2, 1, 1, 2, 0, 18, 4, 5, …
## $ porc_matriculados_de_fp_mujer          <dbl> 85.71429, 100.00000, 83.33333, …
## $ porc_matriculados_de_fp_hombre         <dbl> 14.285714, 0.000000, 16.666667,…
## $ matriculados_otros_accesos             <dbl> 1, 0, 6, 3, 6, 1, 2, 17, 9, 3, …
## $ matriculados_otros_accesos_mujer       <dbl> 1, 0, 5, 2, 0, 1, 2, 6, 7, 3, 2…
## $ matriculados_otros_accesos_hombre      <dbl> 0, 0, 1, 1, 6, 0, 0, 11, 2, 0, …
## $ porc_matriculados_otros_accesos_mujer  <dbl> 100.00000, NA, 83.33333, 66.666…
## $ porc_matriculados_otros_accesos_hombre <dbl> 0.00000, NA, 16.66667, 33.33333…

Incloeu: - Nombre de files: 68 - Nombre de columnes: 37 - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…): Persones

4. Diccionari de variables

Descriviu cada variable del dataset.

Variable Tipus Descripció Valors possibles / rang
exemple_var numèrica Significat de la variable 0–100
 tibble(
   variable = names(dades),
   tipus = sapply(dades, class)
 )
## # A tibble: 37 × 2
##    variable             tipus    
##    <chr>                <chr>    
##  1 curso_academico_cod  numeric  
##  2 curso_academico      character
##  3 tipo_centro          character
##  4 centro_cod           character
##  5 centro_cod_mec       numeric  
##  6 centro               character
##  7 ciclo_titulacion_cod character
##  8 ciclo_titulacion     character
##  9 titulacion_cod       numeric  
## 10 titulacion_cod_mec   numeric  
## # ℹ 27 more rows

Cada fila ens retorna un centre, la carrera i especialitat (que pot ser nul·la) i per la forma d’entrar a aquesta carrera el nombre de gent (homes, dones i conjunt) i els percentatges.

Les columnes son o numeric o characters.

5. Estadístiques descriptives

 summary(dades)
##  curso_academico_cod curso_academico    tipo_centro         centro_cod       
##  Min.   :2023        Length:68          Length:68          Length:68         
##  1st Qu.:2023        Class :character   Class :character   Class :character  
##  Median :2023        Mode  :character   Mode  :character   Mode  :character  
##  Mean   :2023                                                                
##  3rd Qu.:2023                                                                
##  Max.   :2023                                                                
##                                                                              
##  centro_cod_mec        centro          ciclo_titulacion_cod ciclo_titulacion  
##  Min.   :30008224   Length:68          Length:68            Length:68         
##  1st Qu.:30008248   Class :character   Class :character     Class :character  
##  Median :30011430   Mode  :character   Mode  :character     Mode  :character  
##  Mean   :30010984                                                             
##  3rd Qu.:30011961                                                             
##  Max.   :30013992                                                             
##                                                                               
##  titulacion_cod  titulacion_cod_mec  titulacion        especialidad      
##  Min.   :200.0   Min.   :2500124    Length:68          Length:68         
##  1st Qu.:217.8   1st Qu.:2500382    Class :character   Class :character  
##  Median :237.5   Median :2500804    Mode  :character   Mode  :character  
##  Mean   :238.3   Mean   :3096782                                         
##  3rd Qu.:260.2   3rd Qu.:2503603                                         
##  Max.   :279.0   Max.   :7001133                                         
##                                                                          
##  matriculados_preinscripcion matriculados_preinscripcion_mujer
##  Min.   :  9.00              Min.   :  2.00                   
##  1st Qu.: 42.00              1st Qu.: 23.50                   
##  Median : 63.50              Median : 41.00                   
##  Mean   : 86.31              Mean   : 54.51                   
##  3rd Qu.: 94.50              3rd Qu.: 67.00                   
##  Max.   :375.00              Max.   :273.00                   
##                                                               
##  matriculados_preinscripcion_hombre porc_matr_preinscripcion_mujer
##  Min.   :  1.00                     Min.   :17.50                 
##  1st Qu.: 12.00                     1st Qu.:46.07                 
##  Median : 20.50                     Median :63.90                 
##  Mean   : 31.79                     Mean   :61.81                 
##  3rd Qu.: 37.25                     3rd Qu.:78.96                 
##  Max.   :210.00                     Max.   :97.62                 
##                                                                   
##  porc_matr_preinscripcion_hombre matriculados_ebau matriculados_ebau_mujer
##  Min.   : 2.381                  Min.   :  9.00    Min.   :  2.00         
##  1st Qu.:21.038                  1st Qu.: 32.75    1st Qu.: 18.75         
##  Median :36.103                  Median : 56.00    Median : 33.50         
##  Mean   :38.193                  Mean   : 73.35    Mean   : 45.97         
##  3rd Qu.:53.932                  3rd Qu.: 85.00    3rd Qu.: 58.25         
##  Max.   :82.500                  Max.   :343.00    Max.   :252.00         
##                                                                           
##  matriculados_ebau_hombre porc_matriculados_ebau_mujer
##  Min.   :  1.00           Min.   :16.81               
##  1st Qu.:  8.00           1st Qu.:47.97               
##  Median : 15.50           Median :65.28               
##  Mean   : 27.38           Mean   :62.40               
##  3rd Qu.: 33.25           3rd Qu.:79.32               
##  Max.   :188.00           Max.   :97.50               
##                                                       
##  porc_matriculados_ebau_hombre matriculados_titulados
##  Min.   : 2.50                 Min.   :0.000         
##  1st Qu.:20.68                 1st Qu.:0.000         
##  Median :34.72                 Median :1.000         
##  Mean   :37.60                 Mean   :1.176         
##  3rd Qu.:52.03                 3rd Qu.:2.000         
##  Max.   :83.19                 Max.   :6.000         
##                                                      
##  matriculados_titulados_mujer matriculados_titulados_hombre
##  Min.   :0.0000               Min.   :0.0000               
##  1st Qu.:0.0000               1st Qu.:0.0000               
##  Median :0.0000               Median :0.0000               
##  Mean   :0.7647               Mean   :0.4118               
##  3rd Qu.:1.0000               3rd Qu.:1.0000               
##  Max.   :3.0000               Max.   :3.0000               
##                                                            
##  porc_matriculados_titulados_mujer porc_matriculados_titulados_hombre
##  Min.   :  0.00                    Min.   :  0.00                    
##  1st Qu.: 50.00                    1st Qu.:  0.00                    
##  Median : 66.67                    Median : 33.33                    
##  Mean   : 64.42                    Mean   : 35.58                    
##  3rd Qu.:100.00                    3rd Qu.: 50.00                    
##  Max.   :100.00                    Max.   :100.00                    
##  NA's   :28                        NA's   :28                        
##  matriculados_de_fp matriculados_de_fp_mujer matriculados_de_fp_hombre
##  Min.   : 0.000     Min.   : 0.0             Min.   : 0.000           
##  1st Qu.: 1.000     1st Qu.: 0.0             1st Qu.: 0.000           
##  Median : 3.000     Median : 2.0             Median : 1.500           
##  Mean   : 7.485     Mean   : 5.0             Mean   : 2.485           
##  3rd Qu.:12.250     3rd Qu.: 6.5             3rd Qu.: 3.250           
##  Max.   :39.000     Max.   :35.0             Max.   :18.000           
##                                                                       
##  porc_matriculados_de_fp_mujer porc_matriculados_de_fp_hombre
##  Min.   :  0.00                Min.   :  0.00                
##  1st Qu.: 33.33                1st Qu.: 14.29                
##  Median : 66.67                Median : 33.33                
##  Mean   : 58.26                Mean   : 41.74                
##  3rd Qu.: 85.71                3rd Qu.: 66.67                
##  Max.   :100.00                Max.   :100.00                
##  NA's   :15                    NA's   :15                    
##  matriculados_otros_accesos matriculados_otros_accesos_mujer
##  Min.   : 0.000             Min.   : 0.000                  
##  1st Qu.: 1.000             1st Qu.: 0.000                  
##  Median : 3.000             Median : 2.000                  
##  Mean   : 4.294             Mean   : 2.779                  
##  3rd Qu.: 6.000             3rd Qu.: 4.000                  
##  Max.   :23.000             Max.   :17.000                  
##                                                             
##  matriculados_otros_accesos_hombre porc_matriculados_otros_accesos_mujer
##  Min.   : 0.000                    Min.   :  0.00                       
##  1st Qu.: 0.000                    1st Qu.: 47.50                       
##  Median : 1.000                    Median : 71.43                       
##  Mean   : 1.515                    Mean   : 63.83                       
##  3rd Qu.: 2.000                    3rd Qu.:100.00                       
##  Max.   :11.000                    Max.   :100.00                       
##                                    NA's   :12                           
##  porc_matriculados_otros_accesos_hombre
##  Min.   :  0.00                        
##  1st Qu.:  0.00                        
##  Median : 28.57                        
##  Mean   : 36.17                        
##  3rd Qu.: 52.50                        
##  Max.   :100.00                        
##  NA's   :12

Comenteu: - Si hi ha valors perduts: Si entenem que perduts son valors NA només hi ha valors perduts on no hi hagi inscripcions d’aquell tipus per home o dona. - Si alguna variable s’hauria de transformar: No faria falta transformar cap. - Outliers o valors estranys: No.

6. Visualització inicial

Incloeu una o dues gràfiques exploratòries: La primera gràfica ens exposa el nombre de centres on ha entrat gent matriculada per l’ebau. I la segona gràfica és el mateix però unicament les dones.

# Exemple:
 ggplot(dades, aes(x = matriculados_ebau)) + geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.

 ggplot(dades, aes(x = matriculados_ebau_mujer)) + geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.

7. Variables externes i dades addicionals

Expliqueu: - Si necessitareu dades externes per completar l’anàlisi: No ens faria falta cap dada externa. - On les podríeu trobar: A la mateixa web d’on hem extret el conjunt de dades. - Si falten variables per respondre la pregunta inicial: No ens falta cap variable.

8. Altres comentaris

Incloeu qualsevol altre detall rellevant del procés de preparació de dades.