## Descriptive Statistics
## SB11_20221$ESTU_INSE_INDIVIDUAL
## N: 12859
##
## ESTU_INSE_INDIVIDUAL
## ----------------- ----------------------
## Mean 69.06
## Std.Dev 7.28
## Min 44.98
## Q1 63.61
## Median 69.32
## Q3 74.25
## Max 84.84
## MAD 7.87
## IQR 10.63
## CV 0.11
## Skewness -0.04
## SE.Skewness 0.02
## Kurtosis -0.54
## N.Valid 12400.00
## Pct.Valid 96.43
Los resultados indica que Los datos del Índice Socioeconómico Individual (INSE) examinadas entran entre 44.98 y 84.84 presentando un valor medio de 69.32 y la media siendo 69.06 Esto sugiere que, en general, la distribución de los valores de INSE no está fuertemente sesgada debido a valores atípicos extremadamente altos o bajos. Sin embargo, la ligera discrepancia podría indicar una leve asimetría en la distribución. Y un coeficiente de variacion del 11%indica que la variabilidad de los valores de INSE en relación con su media es relativamente baja, lo que sugiere una mayor homogeneidad en los datos y un menor nivel de riesgo o incertidumbre en los resultados de esta variable. Podemos mencionar tambien que la asimetira al ser -0.04 que la distribución de los valores de INSE es ligeramente asimétrica hacia la izquierda, pero la asimetría es pequeña. La mayoría de los valores se encuentran cerca de la media, y no hay una concentración significativa de valores extremadamente bajos en el lado izquierdo de la distribución, como lo podemos ver en el diagrama de cajas y bigotes que hay unos cuantos datos atipicos.
## Descriptive Statistics
## SB11_20221$PUNT_GLOBAL
## N: 12859
##
## PUNT_GLOBAL
## ----------------- -------------
## Mean 315.32
## Std.Dev 47.71
## Min 100.00
## Q1 285.00
## Median 321.00
## Q3 350.00
## Max 476.00
## MAD 47.44
## IQR 65.00
## CV 0.15
## Skewness -0.47
## SE.Skewness 0.02
## Kurtosis 0.04
## N.Valid 12859.00
## Pct.Valid 100.00
Los resultados indica que Los datos de la puntuacion global
examinadas entran entre 100.00 y 476.00 presentando un valor medio de
321.00 y la media siendo 315.32 Esto sugiere que podría haber una ligera
asimetría o valores atípicos en la distribución de las puntuaciones, con
algunos estudiantes obteniendo puntuaciones significativamente más altas
que la mayoría. Y un coeficiente de variacion del 15% indica una
variabilidad moderada en relación con la media. Las puntuaciones pueden
fluctuar dentro de un rango razonable en comparación con el valor
promedio, lo que sugiere cierta consistencia en los resultados, pero aún
con una variabilidad que debe ser considerada al analizar los datos.
Podemos mencionar tambien que la asimetira al ser -0.47sugiere que la
distribución de las puntuaciones es moderadamente asimétrica hacia la
izquierda. Esto indica que la mayoría de las puntuaciones se concentran
en el extremo inferior de la distribución, con relativamente pocos
valores extremadamente bajos que están alejados de la media.
El hecho de que el coeficiente de correlación sea positivo (en lugar de negativo) sugiere que, en general, cuando el valor de “ESTU_INSE_INDIVIDUAL” aumenta, el valor de “PUNT_GLOBAL” tiende a aumentar. Esto significa que los estudiantes con un índice socioeconómico individual más alto tienden a obtener puntajes globales más altos en el examen.
Ademas de esto un valor de 0.48 indica una correlación moderada, lo que significa que hay una relación observable entre las dos variables, pero no es extremadamente fuerte. Las correlaciones pueden variar de -1 (correlación negativa perfecta) a 1 (correlación positiva perfecta), por lo que 0.48 se encuentra en el rango medio.
## Frequencies
## SB11_20221$ESTU_DEPTO_RESIDE
## Type: Character
##
## Freq % Valid % Total
## --------------------- ------- ---------- ----------
## ANTIOQUIA 592 4.6045 4.6038
## ATLANTICO 599 4.6589 4.6582
## BOGOTÁ 2825 21.9725 21.9690
## BOLIVAR 174 1.3533 1.3531
## CALDAS 166 1.2911 1.2909
## CASANARE 1 0.0078 0.0078
## CAUCA 632 4.9156 4.9148
## CESAR 55 0.4278 0.4277
## CORDOBA 27 0.2100 0.2100
## CUNDINAMARCA 468 3.6400 3.6395
## LA GUAJIRA 40 0.3111 0.3111
## MAGDALENA 77 0.5989 0.5988
## NARIÑO 320 2.4889 2.4885
## NORTE SANTANDER 1 0.0078 0.0078
## QUINDIO 50 0.3889 0.3888
## RISARALDA 157 1.2211 1.2209
## SANTANDER 115 0.8945 0.8943
## VALLE 6558 51.0072 50.9993
## <NA> 2 0.0156
## Total 12859 100.0000 100.0000
Podemos observar es que hay 18 tipos diferentes de departamentos de los cuales provienen los estudiantes en los datos, siendo valle la moda con un 51%, despues viene bogota con un 21.97% y despues atlantico con 4.65% y apartir de alli van disminuyendo los porcentajes de los departamentos.
## Frequencies
## SB11_20221$COLE_BILINGUE
## Type: Character
##
## Freq % Valid % Total
## ----------- ------- --------- ---------
## N 7421 66.72 57.71
## S 3702 33.28 28.79
## <NA> 1736 13.50
## Total 12859 100.00 100.00
Como podemos obervar la mayoría colegios en nuestra muestra no son bilingues, lo que sugiere que hay una mayoria amplia sobre los bilingues,Los no bilingues tiene 66.727% mientras que los bilingues se queda con restante 33.28%.