Observar qué factores psicológicos y familiares influyen en el rendimiento académico y la satisfacción escolar de los estudiantes.
-Analizar la relación entre el nivel de autoestima y rendimiento académico.*
-Comprobar si los estudiantes con mayor apoyo familiar están más satisfechos en la escuela.
-Identificar si existe una relación entre el uso de redes sociales y las calificaciones.*
-Comparar si existen diferencias en la satisfacción escolar de acuerdo a las dificultades de aprendizaje.*
-Determinar si hay una asociación entre la asistencia al psicólogo escolar y la participación en clase.
Este análisis es de suma importancia porque a través de él y sus resultados podremos observar los factores que influyen en el rendimiento académico y la satisfacción de los estudiantes para mejorar su desempeño y experiencia escolar.
Este artículo habla sobre como la estadística es esencial para recopinar, analizar e interpretar datos para tomar decisiones acertadas. Se mencionan distintos tipos de estadística, entre ellos la inferencial, y cómo se usan para evaluar rendimiento académico y realizar investigaciones para mejorar el proceso de enseñanza y aprendizaje.
Referencias:
Colegio de Psicólogos de San Juan. (s.f.). Estadística en psicología y educación: conceptos y aplicaciones. Recuperado de https://colegiodepsicologossj.com.ar/estadistica-para-psicologia-y-educacion/
install.packages("readxl")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("dplyr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("ggplot2")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("tidyr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(readxl)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(tidyr)
datos <- read_excel("Base_Psicologia_Educativa.xlsx")
head(datos)
## # A tibble: 6 × 11
## edad sexo grado rendimiento_academico apoyo_familiar nivel_autoestima
## <dbl> <chr> <chr> <dbl> <chr> <dbl>
## 1 14 Femenino 10º 3 Bajo 2
## 2 18 Femenino 9º 3 Bajo 6
## 3 12 Femenino 9º 4 Bajo 1
## 4 17 Masculino 9º 4 Bajo 9
## 5 14 Femenino 10º 5 Bajo 7
## 6 17 Femenino 7º 1 Alto 9
## # ℹ 5 more variables: uso_redes_sociales_diario <dbl>,
## # dificultades_aprendizaje <chr>, participacion_clases <chr>,
## # asiste_psicologo_escolar <chr>, satisfaccion_escolar <dbl>
datos_numericos <- select_if(datos, is.numeric)
# Detectar datos atípicos usando la regla del IQR (valores fuera de [Q1 - 1.5*IQR, Q3 + 1.5*IQR])
outliers <- datos_numericos %>%
gather(variable, valor) %>%
group_by(variable) %>%
mutate(
Q1 = quantile(valor, 0.25, na.rm = TRUE),
Q3 = quantile(valor, 0.75, na.rm = TRUE),
IQR = Q3 - Q1,
fuera_de_rango = valor < (Q1 - 1.5 * IQR) | valor > (Q3 + 1.5 * IQR)
) %>%
filter(fuera_de_rango)
# Ver los valores atípicos encontrados
print(outliers)
## # A tibble: 0 × 6
## # Groups: variable [0]
## # ℹ 6 variables: variable <chr>, valor <dbl>, Q1 <dbl>, Q3 <dbl>, IQR <dbl>,
## # fuera_de_rango <lgl>
library(dplyr)
library(tidyr)
iqr_resumen <- datos_numericos %>%
gather(variable, valor) %>%
group_by(variable) %>%
summarise(
Q1 = quantile(valor, 0.25, na.rm = TRUE),
Q3 = quantile(valor, 0.75, na.rm = TRUE),
IQR = Q3 - Q1,
Limite_inferior = Q1 - 1.5 * IQR,
Limite_superior = Q3 + 1.5 * IQR
)
print(iqr_resumen)
## # A tibble: 5 × 6
## variable Q1 Q3 IQR Limite_inferior Limite_superior
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 edad 13 17 4 7 23
## 2 nivel_autoestima 3 8 5 -4.5 15.5
## 3 rendimiento_academico 2 4 2 -1 7
## 4 satisfaccion_escolar 3 9 6 -6 18
## 5 uso_redes_sociales_diario 1 4 3 -3.5 8.5
ggplot(gather(datos_numericos), aes(x = key, y = value)) +
geom_boxplot(fill = "lightblue") +
labs(title = "Boxplots para detección de outliers",
x = "Variable", y = "Valor") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Se realizó una revisión de datos faltantes y no se encontró ninguno. También, se revisaron los datos atípicos en las variables numéricas del estudio (edad, nivel de autoestima, rendimiento académico, satisfacción escolar y uso de redes sociales ). Para hacer esto se aplicó la regla del rango intercuartílico (IQR) y se utilizaron boxplots para la visualización. Los resultados indicaron que no se encontraron valores atípicos y puede observarse en los boxplots, ya que no presentan puntos fuera de los límites de los bigotes. Esto sugiere que los datos se distribuyen de manera relativamente homogénea y no hay casos extremos que puedan distorsionar el análisis estadístico.
Tabla nivel de autoestima
library(readxl)
nivel_autoestima <- read_excel("nivel_autoestima.xlsx")
nivel_autoestima
## # A tibble: 100 × 7
## nivel_autoestima Media Mediana Moda `Desviación estándar` Máximo Mínimo
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2 5.61 6 7 3.00 10 1
## 2 6 NA NA NA NA NA NA
## 3 1 NA NA NA NA NA NA
## 4 9 NA NA NA NA NA NA
## 5 7 NA NA NA NA NA NA
## 6 9 NA NA NA NA NA NA
## 7 9 NA NA NA NA NA NA
## 8 2 NA NA NA NA NA NA
## 9 1 NA NA NA NA NA NA
## 10 3 NA NA NA NA NA NA
## # ℹ 90 more rows
Tabla rendimiento académico
library(readxl)
rendimiento_academico <- read_excel("rendimiento_academico.xlsx")
rendimiento_academico
## # A tibble: 100 × 7
## rendimiento_academico Media Mediana Moda `Desviación estándar` Máximo Mínimo
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 3 3.24 3 4 1.38 5 1
## 2 3 NA NA NA NA NA NA
## 3 4 NA NA NA NA NA NA
## 4 4 NA NA NA NA NA NA
## 5 5 NA NA NA NA NA NA
## 6 1 NA NA NA NA NA NA
## 7 2 NA NA NA NA NA NA
## 8 5 NA NA NA NA NA NA
## 9 4 NA NA NA NA NA NA
## 10 3 NA NA NA NA NA NA
## # ℹ 90 more rows
Tabla apoyo familiar
library(readxl)
apoyo_familiar <- read_excel("apoyo_familiar.xlsx")
apoyo_familiar
## # A tibble: 100 × 4
## apoyo_familiar Escala `Frecuencia absoluta` `Frecuencia relativa`
## <chr> <chr> <dbl> <dbl>
## 1 Bajo Bajo 34 0.34
## 2 Bajo Medio 32 0.32
## 3 Bajo Alto 34 0.34
## 4 Bajo <NA> NA NA
## 5 Bajo <NA> NA NA
## 6 Alto <NA> NA NA
## 7 Medio <NA> NA NA
## 8 Bajo <NA> NA NA
## 9 Alto <NA> NA NA
## 10 Alto <NA> NA NA
## # ℹ 90 more rows
Tabla Satisfacción escolar
library(readxl)
satisfacción_escolar <- read_excel("satisfacción_escolar.xlsx")
satisfacción_escolar
## # A tibble: 100 × 7
## satisfaccion_escolar Media Mediana Moda `Desviación estándar` Máximo Mínimo
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 3 5.99 6 10 3.00 10 1
## 2 9 NA NA NA NA NA NA
## 3 1 NA NA NA NA NA NA
## 4 9 NA NA NA NA NA NA
## 5 1 NA NA NA NA NA NA
## 6 1 NA NA NA NA NA NA
## 7 1 NA NA NA NA NA NA
## 8 8 NA NA NA NA NA NA
## 9 3 NA NA NA NA NA NA
## 10 8 NA NA NA NA NA NA
## # ℹ 90 more rows
Tabla uso de redes sociales
library(readxl)
uso_de_redes <- read_excel("uso_de_redes.xlsx")
uso_de_redes
## # A tibble: 100 × 7
## uso_redes_sociales_diario Media Mediana Moda Desviación Máximo Mínimo
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 3 2.5 2 2 1.64 5 0
## 2 2 NA NA NA NA NA NA
## 3 4 NA NA NA NA NA NA
## 4 5 NA NA NA NA NA NA
## 5 4 NA NA NA NA NA NA
## 6 2 NA NA NA NA NA NA
## 7 2 NA NA NA NA NA NA
## 8 2 NA NA NA NA NA NA
## 9 2 NA NA NA NA NA NA
## 10 0 NA NA NA NA NA NA
## # ℹ 90 more rows
Tabla dificultades de aprendizaje
library(readxl)
dificultades_aprendizaje <- read_excel("dificultades_aprendizaje.xlsx")
dificultades_aprendizaje
## # A tibble: 100 × 4
## dificultades_aprendizaje Escala `Frecuencia absoluta` `Frecuencia relativa`
## <chr> <chr> <dbl> <dbl>
## 1 No Sí 28 0.28
## 2 No No 71 0.71
## 3 No <NA> NA NA
## 4 No <NA> NA NA
## 5 Sí <NA> NA NA
## 6 No <NA> NA NA
## 7 No <NA> NA NA
## 8 No <NA> NA NA
## 9 No <NA> NA NA
## 10 No <NA> NA NA
## # ℹ 90 more rows
Tabla asistencia al psicólogo escolar
library(readxl)
Asistencia_psicologo <- read_excel("Asistencia_psicologo.xlsx")
Asistencia_psicologo
## # A tibble: 100 × 4
## asiste_psicologo_escolar Escala `Frecuencia absoluta` `Frecuencia relativa`
## <chr> <chr> <dbl> <lgl>
## 1 No Sí 25 NA
## 2 Sí No 74 NA
## 3 No <NA> NA NA
## 4 Sí <NA> NA NA
## 5 No <NA> NA NA
## 6 No <NA> NA NA
## 7 No <NA> NA NA
## 8 No <NA> NA NA
## 9 No <NA> NA NA
## 10 Sí <NA> NA NA
## # ℹ 90 more rows
Tabla participación en clase
library(readxl)
participacion <- read_excel("Participacion.xlsx")
participacion
## # A tibble: 100 × 4
## participacion_clases Escala `Frecuencia absoluta` `Frecuencia relativa`
## <chr> <chr> <dbl> <dbl>
## 1 Baja Baja 32 0.32
## 2 Media Media 33 0.33
## 3 Media Alta 35 0.35
## 4 Alta <NA> NA NA
## 5 Alta <NA> NA NA
## 6 Media <NA> NA NA
## 7 Media <NA> NA NA
## 8 Baja <NA> NA NA
## 9 Alta <NA> NA NA
## 10 Media <NA> NA NA
## # ℹ 90 more rows
Gráfico nivel de autoestima
hist(nivel_autoestima[[1]],
main = "Distribución del Nivel de Autoestima",
xlab = "Nivel de Autoestima",
ylab = "Frecuencia",
col = "skyblue",
breaks = 10)
Gráfico rendimiento académico
barplot(table(rendimiento_academico[[1]]),
main = "Rendimiento Académico",
xlab = "Nivel",
ylab = "Frecuencia",
col = "lightgreen")
Gráfico apoyo familiar
barplot(table(apoyo_familiar[[1]]),
main = "Nivel de Apoyo Familiar",
xlab = "Categoría",
ylab = "Frecuencia",
col = "salmon")
Gráfico Satisfacción escolar
hist(satisfacción_escolar[[1]],
main = "Satisfacción Escolar",
xlab = "Nivel",
ylab = "Frecuencia",
col = "orange",
breaks = 10)
Gráfico uso de redes sociales
barplot(table(uso_de_redes[[1]]),
main = "Uso de Redes Sociales",
xlab = "Nivel",
ylab = "Frecuencia",
col = "purple")
Gráfico dificultades de aprendizaje
barplot(table(dificultades_aprendizaje[[1]]),
main = "Dificultades de Aprendizaje",
xlab = "Respuesta",
ylab = "Frecuencia",
col = "lightblue")
Gráfico
barplot(table(Asistencia_psicologo[[1]]),
main = "Asistencia al psicólogo escolar",
xlab = "Respuesta",
ylab = "Frecuencia",
col = "violet")
Gráfico participación en clase
barplot(table(participacion[[1]]),
main = "participacion en clase",
xlab = "Categoría",
ylab = "Frecuencia",
col = "magenta")
Supuesto de Normalidad
H0: Los datos siguen una distribución normal H1: Los datos no siguen una distribución normal
library(readxl)
nivel_autoestima <- read_excel("nivel_autoestima.xlsx")
autoestima <- nivel_autoestima[[1]]
rendimiento_academico <- read_excel("rendimiento_academico.xlsx")
rendimiento <- rendimiento_academico[[1]]
shapiro.test(autoestima)
##
## Shapiro-Wilk normality test
##
## data: autoestima
## W = 0.91777, p-value = 1.074e-05
shapiro.test(rendimiento)
##
## Shapiro-Wilk normality test
##
## data: rendimiento
## W = 0.88509, p-value = 3e-07
No cumplen con el supuesto de normalidad: El p valor es menor que la significancia (0.05) por lo tanto se rechaza la hipotesis nula, es decir, los datos no siguen una distribución normal.
Correlación de Spearman
Se utiliza la correlación de Spearman porque buscamos analizar si existe una relación entre dos variables: el nivel de autoestima y el rendimiento académico, son escalas pero se encuentran representadas numericamente. Además, se realizó la prueba de Shapiro-Wilk y se observó que los datos no cumplen el principio de normalidad. Dado que la correlación de Pearson requiere una distribución normal de los datos, obtamos por escoger correlación de Spearman, ya que no exige este supuesto.
autoestima <- nivel_autoestima[[1]]
rendimiento <- rendimiento_academico[[1]]
cor.test(autoestima, rendimiento, method = "spearman")
## Warning in cor.test.default(autoestima, rendimiento, method = "spearman"):
## Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: autoestima and rendimiento
## S = 150776, p-value = 0.3458
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.09525146
Interpretación: El estadistico de Spearman sugiere una correlación positiva muy débil, practicamente nula, entre el nivel de autoestima y el rendimiento académico, ya que el valor se encuentra más cercano al cero que al uno. Sin embargo, esta correlación no fue estadisticamente significativa. No se rechaza la hipotesis nula porque el valor p es mayor a la significancia (0.05), por ende no se puede afirmar que si exista una relación significativa entre el rendimiento académico y el nivel de autoestima, ya que no existe suficiente evidencia en esta muestra.
Se utiliza ANOVA porque se quiere comparar la media de la variable satisfacción escolar (medida en escala de 1 a 10) entre tres grupos independientes niveles de apoyo familiar (bajo, medio, alto). Se realizó una prueba ANOVA y no T-student debido a que la variable independiente presenta más de dos niveles. Además, por fines prácticos se asume que se cumplen los supuestos de normalidad.
Aunque la variable satisfacción escolar está medida en una escala ordinal ( del 1 al 10), se trata como una variable numérica continua para el análisis. Esto es porque la escala tiene suficientes niveles y se asume que las diferencias entre los números son aproximadamente iguales, lo que permite comparar las medias entre grupos usando ANOVA.
apoyo_familiar <- read_excel("apoyo_familiar.xlsx")
satisfaccion_escolar <- read_excel("satisfacción_escolar.xlsx")
datos <- data.frame(
apoyo_familiar = apoyo_familiar[[1]],
satisfaccion_escolar = satisfacción_escolar[[1]]
)
datos$apoyo_familiar <- as.factor(datos$apoyo_familiar)
modelo_anova <- aov(satisfaccion_escolar ~ apoyo_familiar, data = datos)
summary(modelo_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## apoyo_familiar 2 0.6 0.275 0.03 0.97
## Residuals 97 888.4 9.159
Estadistico de prueba F= 0.03 P-valor= 0.97
Interpretación: El p valor es mayor que la significancia, por lo que no se puede rechazar la hipótesis nula, es decir, no hay diferencias estadísticamente significativas en los niveles promedio de satisfacción escolar según los diferentes niveles de apoyo familiar.Esto sugiere que, según los datos analizados, el grado de apoyo familiar no está asociado con variaciones en la satisfacción escolar.
Se utilizó la prueba t de medias, ya que analizamos una variable categórica (dicotómica) y una variable numérica. Además, porque se busca comparar las medias de satisfacción escolar entre dos grupos: estudiantes con y sin dificultades de aprendizaje.
Hipotesis nula: No hay una diferencia significativa en la satisfacción escolar entre estudiantes con y sin dificultades de aprendizaje.
Hipotesis alternativa: Hay una diferencia significativa en la satisfacción escolar entre estudiantes con y sin dificultades de aprendizaje.
dificultades <- as.factor(dificultades_aprendizaje[[1]])
satisfaccion <- satisfacción_escolar[[1]]
levels(dificultades)
## [1] "No" "Sí"
t.test(satisfaccion ~ dificultades)
##
## Welch Two Sample t-test
##
## data: satisfaccion by dificultades
## t = 0.59957, df = 42.782, p-value = 0.552
## alternative hypothesis: true difference in means between group No and group Sí is not equal to 0
## 95 percent confidence interval:
## -1.022551 1.887630
## sample estimates:
## mean in group No mean in group Sí
## 6.111111 5.678571
T= 0.59957 Valor P: 0.552
Interpretación: Debido a que el p valor es mayor a la signifancia (0.05) no se rechaza la hipótesis nula. Esto sugiere que no existe una diferencia estadísticamente significativa en la satisfacción escolar entre estudiantes que presentan dificultades de aprendizaje y los que no las presentan.
Para este análisis se utilizó la prueba de Chi-cuadrado de independencia, ya que ambas variables asistencia al psicólogo escolar y participación en clase son de tipo categórico. Esta prueba permite evaluar si existe una relación de dependencia entre las dos variables, es decir, si una de ellas varía en función de la otra.
Hipótesis Nula: No existe asociación significativa entre la asistencia al psicólogo y la participación en clase. Las variables son independientes. Hipótesis Alternativa: Si existe una asociación entre la asistencia al psicólogo y la participación en clase. Las variables son dependientes.
asistencia_vec <- Asistencia_psicologo[[1]]
participacion_vec <- participacion[[1]]
valido <- !is.na(asistencia_vec) & !is.na(participacion_vec)
asistencia_vec <- asistencia_vec[valido]
participacion_vec <- participacion_vec[valido]
asistencia_vec <- factor(asistencia_vec, levels = c("No", "Sí"))
participacion_vec <- factor(participacion_vec, levels = c("Baja", "Media", "Alta"))
tabla <- table(asistencia_vec, participacion_vec)
print(tabla)
## participacion_vec
## asistencia_vec Baja Media Alta
## No 26 26 23
## Sí 6 7 12
resultado_chi <- chisq.test(tabla)
print(resultado_chi)
##
## Pearson's Chi-squared test
##
## data: tabla
## X-squared = 2.5287, df = 2, p-value = 0.2824
print(resultado_chi$residuals)
## participacion_vec
## asistencia_vec Baja Media Alta
## No 0.4082483 0.2512595 -0.6343350
## Sí -0.7071068 -0.4351941 1.0987005
Estadístico Chi-cuadrado (X²): 2.5287 p-valor: 0.2824
Interpretación: Dado el p valor es mayor a la significancia (0.05) no se rechaza la hipotesis nula. Esto indica que no se encontró una relación estadísticamente significativa entre la asistencia al psicólogo escolar y la participación en clase. Es decir, los estudiantes que asisten a sesiones con el psicólogo no tienden a participar más o menos en clase que aquellos que no lo hacen.
En este trabajo se analizó la relación entre factores psicológicos y familiares con el rendimiento académico y la satisfacción escolar de una muestra de 100 estudiantes. Sin embargo, en la mayoría de los casos no se hallaron relaciones estadísticamente significativas entre las variables evaluadas.
En primer lugar, se halló una correlación positiva muy débil entre el nivel de autoestima y el rendimiento académico, la cual no fue estadísticamente significativa. Asimismo, no se encontraron diferencias significativas en los niveles de satisfacción escolar según el nivel de apoyo familiar (alto, medio o bajo). También se observó una correlación negativa muy débil entre el uso de redes sociales y las calificaciones, pero sin significancia estadística.
Por otro lado, no se encontraron diferencias significativas en la satisfacción escolar entre estudiantes que presentan o no dificultades de aprendizaje. Y por último, no se encontró una relación significativa entre la asistencia al psicólogo escolar y la participación en clase.
Estos hallazgos sugieren que en esta muestra de 100 estudiantes, los factores que analizamos no mostraron una influencia significativa sobre el rendimiento académico ni la satisfacción escolar. Es posible que existan otras variables que influyan pero que no se tuvieron en cuenta en este estudio o que el tamaño de la muestra haya limitado la capacidad para detectar efectos sutiles.
Ampliar las variables a estudiar: Se sugiere analizar otros factores que podrían tener mayor influencia como el estrés, la motivación intrínseca, el ambiente educativo, la necesidad psicológica de autonomía y competencia, entre otras. Las cuales podrían tener una mayor relación con el rendimiento académico y la satisfacción escolar.
Aumentar el tamaño y la diversidad de la muestra: Es posible que la falta de relación significativa entre las variables se deba a que el tamaño muestral era reducido. Por lo que incluir una muestra más grande podría permitir detectar más efectos significativos y generalizables.
Considerar estudios con diseños longitudinales: Dado que los efectos de variables como la autoestima o el apoyo familiar pueden manifestarse a lo largo del tiempo, un seguimiento prolongado permitiría captar relaciones que no se evidencian en un análisis transversal.
Reforzar programas de orientación y bienestar escolar: A pesar de la ausencia de significancia estadística, variables como la autoestima, el apoyo familiar o la asistencia psicológica siguen siendo elementos importantes en el desarrollo estudiantil. Por tanto, se recomienda fortalecer iniciativas de apoyo psicológico, educación socioemocional y orientación académica.