La base contiene información de 100 estudiantes de secundaria, con variables relacionadas con edad, género, grado escolar, rendimiento académico, apoyo familiar, autoestima, uso de redes sociales, dificultades de aprendizaje, participación en clases, asistencia a psicólogo escolar y satisfacción escolar.
• edad (numerica): Edad de los estudiantes.
• sexo (categórica): Masculino/Femenino.
• grado (categórica): Nivel escolar (9º, 10º, etc.).
• rendimiento_academico (numérica): Escala 1–10 (desempeño académico).
• apoyo_familiar (categórica): Bajo/Medio/Alto.
• nivel_autoestima (numérica): Escala 1–10.
• uso_redes_sociales_diario (numérica): Horas promedio al dÃa.
• dificultades_aprendizaje (categórica): SÃ/No.
• participacion_clases (categórica): Baja/Media/Alta.
• asiste_psicologo_escolar (categórica): SÃ/No.
• satisfaccion_escolar (numérica): Escala 1–10.
library(readxl)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(skimr)
datos <- read_excel("Base_Psicologia_Educativa.xlsx")
EN PRIMER LUGAR SE VISUALIZAN LAS DIMENSIONES DE LA BASE DE DATOS, EL CUAL CONSTA DE 100 OBS. Y 11 VARIABLES.
SE PROCEDE A VERIFICAR CUANTO ES EL PORCENTAJE DE DNA DE LA DATA.
dim(datos)
## [1] 100 11
colnames(datos)
## [1] "edad" "sexo"
## [3] "grado" "rendimiento_academico"
## [5] "apoyo_familiar" "nivel_autoestima"
## [7] "uso_redes_sociales_diario" "dificultades_aprendizaje"
## [9] "participacion_clases" "asiste_psicologo_escolar"
## [11] "satisfaccion_escolar"
str(datos)
## tibble [100 × 11] (S3: tbl_df/tbl/data.frame)
## $ edad : num [1:100] 14 18 12 17 14 17 13 16 13 14 ...
## $ sexo : chr [1:100] "Femenino" "Femenino" "Femenino" "Masculino" ...
## $ grado : chr [1:100] "10º" "9º" "9º" "9º" ...
## $ rendimiento_academico : num [1:100] 3 3 4 4 5 1 2 5 4 3 ...
## $ apoyo_familiar : chr [1:100] "Bajo" "Bajo" "Bajo" "Bajo" ...
## $ nivel_autoestima : num [1:100] 2 6 1 9 7 9 9 2 1 3 ...
## $ uso_redes_sociales_diario: num [1:100] 3 2 4 5 4 2 2 2 2 0 ...
## $ dificultades_aprendizaje : chr [1:100] "No" "No" "No" "No" ...
## $ participacion_clases : chr [1:100] "Baja" "Media" "Media" "Alta" ...
## $ asiste_psicologo_escolar : chr [1:100] "No" "SÃ" "No" "SÃ" ...
## $ satisfaccion_escolar : num [1:100] 3 9 1 9 1 1 1 8 3 8 ...
#VARIABLES NUMERICAS
summary(select(datos, edad, rendimiento_academico, nivel_autoestima,
uso_redes_sociales_diario, satisfaccion_escolar))
## edad rendimiento_academico nivel_autoestima
## Min. :11.00 Min. :1.00 Min. : 1.00
## 1st Qu.:13.00 1st Qu.:2.00 1st Qu.: 3.00
## Median :14.00 Median :3.00 Median : 6.00
## Mean :14.74 Mean :3.24 Mean : 5.61
## 3rd Qu.:17.00 3rd Qu.:4.00 3rd Qu.: 8.00
## Max. :18.00 Max. :5.00 Max. :10.00
## uso_redes_sociales_diario satisfaccion_escolar
## Min. :0.0 Min. : 1.00
## 1st Qu.:1.0 1st Qu.: 3.00
## Median :2.0 Median : 6.00
## Mean :2.5 Mean : 5.99
## 3rd Qu.:4.0 3rd Qu.: 9.00
## Max. :5.0 Max. :10.00
#HISTOGRAMAS
hist(datos$edad, main="Distribución de edades", xlab="Edad", col="lightblue")
hist(datos$nivel_autoestima, main="Distribución nivel de autoestima",
xlab="Nivel de Autoestima", col="lightgreen")
hist(datos$satisfaccion_escolar, main="Distribución satisfacción escolar",
xlab="Satisfacción", col="lightcoral")
#VARIABLES CATEGORICAS
table(datos$sexo)
##
## Femenino Masculino Otro
## 51 42 7
table(datos$grado)
##
## 10º 11º 6º 7º 8º 9º
## 13 15 17 17 20 18
table(datos$apoyo_familiar)
##
## Alto Bajo Medio
## 34 34 32
table(datos$dificultades_aprendizaje)
##
## No SÃ
## 72 28
table(datos$participacion_clases)
##
## Alta Baja Media
## 35 32 33
table(datos$asiste_psicologo_escolar)
##
## No SÃ
## 75 25
#GRAFICO DE BARRAS
barplot(table(datos$sexo), main="Distribución por sexo", col=c("lightpink","lightblue"))
barplot(table(datos$apoyo_familiar), main="Apoyo familiar", col="lightgreen")
barplot(table(datos$participacion_clases), main="Participación en clases", col="orange")
#REVISION DE VALORES FALTANTES
colSums(is.na(datos))
## edad sexo grado
## 0 0 0
## rendimiento_academico apoyo_familiar nivel_autoestima
## 0 0 0
## uso_redes_sociales_diario dificultades_aprendizaje participacion_clases
## 0 0 0
## asiste_psicologo_escolar satisfaccion_escolar
## 0 0
#DETECCIÓN DE DATOS ATIPICOS
boxplot(datos$edad, main="Boxplot Edad", col="lightblue")
boxplot(datos$rendimiento_academico, main="Boxplot Rendimiento Académico", col="lightgreen")
boxplot(datos$nivel_autoestima, main="Boxplot Nivel Autoestima", col="lightpink")
boxplot(datos$uso_redes_sociales_diario, main="Boxplot Uso de Redes Sociales", col="orange")
boxplot(datos$satisfaccion_escolar, main="Boxplot Satisfacción Escolar", col="lightcoral")