## Descriptive Statistics  
## SB11_20221$ESTU_INSE_INDIVIDUAL  
## N: 12859  
## 
##                     ESTU_INSE_INDIVIDUAL
## ----------------- ----------------------
##              Mean                  69.06
##           Std.Dev                   7.28
##               Min                  44.98
##                Q1                  63.61
##            Median                  69.32
##                Q3                  74.25
##               Max                  84.84
##               MAD                   7.87
##               IQR                  10.63
##                CV                   0.11
##          Skewness                  -0.04
##       SE.Skewness                   0.02
##          Kurtosis                  -0.54
##           N.Valid               12400.00
##         Pct.Valid                  96.43

Los resultados indica que Los datos del Índice Socioeconómico Individual (INSE) examinadas entran entre 44.98 y 84.84 presentando un valor medio de 69.32 y la media siendo 69.06 Esto sugiere que, en general, la distribución de los valores de INSE no está fuertemente sesgada debido a valores atípicos extremadamente altos o bajos. Sin embargo, la ligera discrepancia podría indicar una leve asimetría en la distribución. Y un coeficiente de variacion del 11%indica que la variabilidad de los valores de INSE en relación con su media es relativamente baja, lo que sugiere una mayor homogeneidad en los datos y un menor nivel de riesgo o incertidumbre en los resultados de esta variable. Podemos mencionar tambien que la asimetira al ser -0.04 que la distribución de los valores de INSE es ligeramente asimétrica hacia la izquierda, pero la asimetría es pequeña. La mayoría de los valores se encuentran cerca de la media, y no hay una concentración significativa de valores extremadamente bajos en el lado izquierdo de la distribución, como lo podemos ver en el diagrama de cajas y bigotes que hay unos cuantos datos atipicos.

## Descriptive Statistics  
## SB11_20221$PUNT_GLOBAL  
## N: 12859  
## 
##                     PUNT_GLOBAL
## ----------------- -------------
##              Mean        315.32
##           Std.Dev         47.71
##               Min        100.00
##                Q1        285.00
##            Median        321.00
##                Q3        350.00
##               Max        476.00
##               MAD         47.44
##               IQR         65.00
##                CV          0.15
##          Skewness         -0.47
##       SE.Skewness          0.02
##          Kurtosis          0.04
##           N.Valid      12859.00
##         Pct.Valid        100.00

Los resultados indica que Los datos de la puntuacion global examinadas entran entre 100.00 y 476.00 presentando un valor medio de 321.00 y la media siendo 315.32 Esto sugiere que podría haber una ligera asimetría o valores atípicos en la distribución de las puntuaciones, con algunos estudiantes obteniendo puntuaciones significativamente más altas que la mayoría. Y un coeficiente de variacion del 15% indica una variabilidad moderada en relación con la media. Las puntuaciones pueden fluctuar dentro de un rango razonable en comparación con el valor promedio, lo que sugiere cierta consistencia en los resultados, pero aún con una variabilidad que debe ser considerada al analizar los datos. Podemos mencionar tambien que la asimetira al ser -0.47sugiere que la distribución de las puntuaciones es moderadamente asimétrica hacia la izquierda. Esto indica que la mayoría de las puntuaciones se concentran en el extremo inferior de la distribución, con relativamente pocos valores extremadamente bajos que están alejados de la media.

El hecho de que el coeficiente de correlación sea positivo (en lugar de negativo) sugiere que, en general, cuando el valor de “ESTU_INSE_INDIVIDUAL” aumenta, el valor de “PUNT_GLOBAL” tiende a aumentar. Esto significa que los estudiantes con un índice socioeconómico individual más alto tienden a obtener puntajes globales más altos en el examen.

Ademas de esto un valor de 0.48 indica una correlación moderada, lo que significa que hay una relación observable entre las dos variables, pero no es extremadamente fuerte. Las correlaciones pueden variar de -1 (correlación negativa perfecta) a 1 (correlación positiva perfecta), por lo que 0.48 se encuentra en el rango medio.

## Frequencies  
## SB11_20221$ESTU_DEPTO_RESIDE  
## Type: Character  
## 
##                          Freq    % Valid    % Total
## --------------------- ------- ---------- ----------
##             ANTIOQUIA     592     4.6045     4.6038
##             ATLANTICO     599     4.6589     4.6582
##                BOGOTÁ    2825    21.9725    21.9690
##               BOLIVAR     174     1.3533     1.3531
##                CALDAS     166     1.2911     1.2909
##              CASANARE       1     0.0078     0.0078
##                 CAUCA     632     4.9156     4.9148
##                 CESAR      55     0.4278     0.4277
##               CORDOBA      27     0.2100     0.2100
##          CUNDINAMARCA     468     3.6400     3.6395
##            LA GUAJIRA      40     0.3111     0.3111
##             MAGDALENA      77     0.5989     0.5988
##                NARIÑO     320     2.4889     2.4885
##       NORTE SANTANDER       1     0.0078     0.0078
##               QUINDIO      50     0.3889     0.3888
##             RISARALDA     157     1.2211     1.2209
##             SANTANDER     115     0.8945     0.8943
##                 VALLE    6558    51.0072    50.9993
##                  <NA>       2                0.0156
##                 Total   12859   100.0000   100.0000

Podemos observar es que hay 18 tipos diferentes de departamentos de los cuales provienen los estudiantes en los datos, siendo valle la moda con un 51%, despues viene bogota con un 21.97% y despues atlantico con 4.65% y apartir de alli van disminuyendo los porcentajes de los departamentos.

## Frequencies  
## SB11_20221$COLE_BILINGUE  
## Type: Character  
## 
##                Freq   % Valid   % Total
## ----------- ------- --------- ---------
##           N    7421     66.72     57.71
##           S    3702     33.28     28.79
##        <NA>    1736               13.50
##       Total   12859    100.00    100.00

Como podemos obervar la mayoría colegios en nuestra muestra no son bilingues, lo que sugiere que hay una mayoria amplia sobre los bilingues,Los no bilingues tiene 66.727% mientras que los bilingues se queda con restante 33.28%.