CONTEXTO

La base contiene información de 100 estudiantes de secundaria, con variables relacionadas con edad, género, grado escolar, rendimiento académico, apoyo familiar, autoestima, uso de redes sociales, dificultades de aprendizaje, participación en clases, asistencia a psicólogo escolar y satisfacción escolar.

VARIABLES

• edad (numerica): Edad de los estudiantes.

•   sexo (categórica): Masculino/Femenino.
•   grado (categórica): Nivel escolar (9º, 10º, etc.).
•   rendimiento_academico (numérica): Escala 1–10 (desempeño académico).
•   apoyo_familiar (categórica): Bajo/Medio/Alto.
•   nivel_autoestima (numérica): Escala 1–10.
•   uso_redes_sociales_diario (numérica): Horas promedio al día.
•   dificultades_aprendizaje (categórica): Sí/No.
•   participacion_clases (categórica): Baja/Media/Alta.
•   asiste_psicologo_escolar (categórica): Sí/No.
•   satisfaccion_escolar (numérica): Escala 1–10.
library(readxl)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(skimr)
datos <- read_excel("Base_Psicologia_Educativa.xlsx")

EN PRIMER LUGAR SE VISUALIZAN LAS DIMENSIONES DE LA BASE DE DATOS, EL CUAL CONSTA DE 100 OBS. Y 11 VARIABLES.

SE PROCEDE A VERIFICAR CUANTO ES EL PORCENTAJE DE DNA DE LA DATA.

dim(datos)                
## [1] 100  11
colnames(datos)           
##  [1] "edad"                      "sexo"                     
##  [3] "grado"                     "rendimiento_academico"    
##  [5] "apoyo_familiar"            "nivel_autoestima"         
##  [7] "uso_redes_sociales_diario" "dificultades_aprendizaje" 
##  [9] "participacion_clases"      "asiste_psicologo_escolar" 
## [11] "satisfaccion_escolar"
str(datos)            
## tibble [100 × 11] (S3: tbl_df/tbl/data.frame)
##  $ edad                     : num [1:100] 14 18 12 17 14 17 13 16 13 14 ...
##  $ sexo                     : chr [1:100] "Femenino" "Femenino" "Femenino" "Masculino" ...
##  $ grado                    : chr [1:100] "10º" "9º" "9º" "9º" ...
##  $ rendimiento_academico    : num [1:100] 3 3 4 4 5 1 2 5 4 3 ...
##  $ apoyo_familiar           : chr [1:100] "Bajo" "Bajo" "Bajo" "Bajo" ...
##  $ nivel_autoestima         : num [1:100] 2 6 1 9 7 9 9 2 1 3 ...
##  $ uso_redes_sociales_diario: num [1:100] 3 2 4 5 4 2 2 2 2 0 ...
##  $ dificultades_aprendizaje : chr [1:100] "No" "No" "No" "No" ...
##  $ participacion_clases     : chr [1:100] "Baja" "Media" "Media" "Alta" ...
##  $ asiste_psicologo_escolar : chr [1:100] "No" "Sí" "No" "Sí" ...
##  $ satisfaccion_escolar     : num [1:100] 3 9 1 9 1 1 1 8 3 8 ...

#VARIABLES NUMERICAS

summary(select(datos, edad, rendimiento_academico, nivel_autoestima,
               uso_redes_sociales_diario, satisfaccion_escolar))
##       edad       rendimiento_academico nivel_autoestima
##  Min.   :11.00   Min.   :1.00          Min.   : 1.00   
##  1st Qu.:13.00   1st Qu.:2.00          1st Qu.: 3.00   
##  Median :14.00   Median :3.00          Median : 6.00   
##  Mean   :14.74   Mean   :3.24          Mean   : 5.61   
##  3rd Qu.:17.00   3rd Qu.:4.00          3rd Qu.: 8.00   
##  Max.   :18.00   Max.   :5.00          Max.   :10.00   
##  uso_redes_sociales_diario satisfaccion_escolar
##  Min.   :0.0               Min.   : 1.00       
##  1st Qu.:1.0               1st Qu.: 3.00       
##  Median :2.0               Median : 6.00       
##  Mean   :2.5               Mean   : 5.99       
##  3rd Qu.:4.0               3rd Qu.: 9.00       
##  Max.   :5.0               Max.   :10.00

#HISTOGRAMAS

hist(datos$edad, main="Distribución de edades", xlab="Edad", col="lightblue")

hist(datos$nivel_autoestima, main="Distribución nivel de autoestima", 
     xlab="Nivel de Autoestima", col="lightgreen")

hist(datos$satisfaccion_escolar, main="Distribución satisfacción escolar", 
     xlab="Satisfacción", col="lightcoral")

#VARIABLES CATEGORICAS

table(datos$sexo)
## 
##  Femenino Masculino      Otro 
##        51        42         7
table(datos$grado)
## 
## 10º 11º  6º  7º  8º  9º 
##  13  15  17  17  20  18
table(datos$apoyo_familiar)
## 
##  Alto  Bajo Medio 
##    34    34    32
table(datos$dificultades_aprendizaje)
## 
## No Sí 
## 72 28
table(datos$participacion_clases)
## 
##  Alta  Baja Media 
##    35    32    33
table(datos$asiste_psicologo_escolar)
## 
## No Sí 
## 75 25

#GRAFICO DE BARRAS

barplot(table(datos$sexo), main="Distribución por sexo", col=c("lightpink","lightblue"))

barplot(table(datos$apoyo_familiar), main="Apoyo familiar", col="lightgreen")

barplot(table(datos$participacion_clases), main="Participación en clases", col="orange")

#REVISION DE VALORES FALTANTES

colSums(is.na(datos))
##                      edad                      sexo                     grado 
##                         0                         0                         0 
##     rendimiento_academico            apoyo_familiar          nivel_autoestima 
##                         0                         0                         0 
## uso_redes_sociales_diario  dificultades_aprendizaje      participacion_clases 
##                         0                         0                         0 
##  asiste_psicologo_escolar      satisfaccion_escolar 
##                         0                         0

#DETECCIÓN DE DATOS ATIPICOS

boxplot(datos$edad, main="Boxplot Edad", col="lightblue")

boxplot(datos$rendimiento_academico, main="Boxplot Rendimiento Académico", col="lightgreen")

boxplot(datos$nivel_autoestima, main="Boxplot Nivel Autoestima", col="lightpink")

boxplot(datos$uso_redes_sociales_diario, main="Boxplot Uso de Redes Sociales", col="orange")

boxplot(datos$satisfaccion_escolar, main="Boxplot Satisfacción Escolar", col="lightcoral")