library(readr) install.packages(“ggplot2”) library(ggplot2)
###2. Análisis univariado de las variables cuantitativas
#Histograma Edad hist(CSE_student_performances\(Age,
col="skyblue",main="Edad",freq=TRUE,
xlab="Edad", ylab = "Freecuencia")
##boxplothorasdesueño
boxplot(CSE_student_performances\)SleepPerDayHours, main =
“Boxplot de horas de sueño”) ##boxplonumero de amigos
boxplot(CSE_student_performances\(NumberOfFriend,
main = "Numero de amigos")
###3. Analisis de dos variables
ggplot(CSE_student_performances, aes(x =
CSE_student_performances\)AcademicPerformance, y =
CSE_student_performances\(SleepPerDayHours),
xlab= "Academic performance",ylab= "Sleep Day
Hours") +
geom_boxplot() +
geom_jitter(width = 0.2, color = "blue", alpha = 0.5)
##4. Relacion entre las variables cuantitativas
ggplot(CSE_student_performances, aes(x = Age, y = SleepPerDayHours)) +
geom_point(color = "blue") +
labs(title = "Edad vs. Horas de Sueño por Día",
x = "Edad",
y = "Horas de Sueño por Día") +
theme_minimal()
ggplot(CSE_student_performances, aes(x = Age, y = NumberOfFriend)) +
geom_point() +
labs(title = "Relación entre edad y número de amigos",
x = "edad",
y = "Número de amigos") +
theme_minimal()
# Correlación de Pearson
correlacion <-
cor(CSE_student_performances\)SleepPerDayHours,
CSE_student_performances$Age, method = “pearson”)
print(correlacion)
#5 Otros analisis # Prueba de normalidad
shapiro.test(CSE_student_performances\(SleepPerDayHours)
shapiro.test(CSE_student_performances\)Age) # Regresión lineal
modelo <- lm(Age ~ SleepPerDayHours, data =
CSE_student_performances) summary(modelo)
ggplot(CSE_student_performances, aes(x = SleepPerDayHours, y = Age)) +
geom_point() + geom_smooth(method = “lm”, se = FALSE) + labs(title =
“Regresión Lineal entre SleepPerDayHours y Age”, x = “SleepPerDayHours”,
y = “Age”) + theme_minimal()
#objetivo 1 #Analizar la relación entre la cantidad de horas de sueño y el rendimiento académico de los estudiantes universitarios # Histograma de Edad hist(CSE_student_performances$Age, col=“skyblue”, main=“Edad”, freq=TRUE, xlab=“Edad”, ylab=“Frecuencia”) #rendimiento academico ggplot(CSE_student_performances, aes(x = AcademicPerformance)) + geom_bar(fill = “skyblue”) +labs(title = “Distribución del Rendimiento Académico”, x = “Rendimiento Académico”,y = “Frecuencia”) + theme_minimal()
#horas de sueño en funcion del rendimiento academico ggplot(CSE_student_performances, aes(x = AcademicPerformance, y = SleepPerDayHours, fill = AcademicPerformance)) +geom_boxplot() +labs(title = “Comparación de Horas de Sueño por Día según el Rendimiento Académico”,x = “Rendimiento Académico”,y = “Horas de Sueño por Día”) + theme_minimal()
#objetivo 2 #Evaluar cómo el estado de depresión afecta el desempeño académico de los estudiantes #estado de depresion ggplot(CSE_student_performances, aes(x = DepressionStatus)) + geom_bar(fill = “lightcoral”) + labs(title = “Distribución del Estado de Depresión”,x = “Estado de Depresión”,y = “Frecuencia”) + theme_minimal() #depresion como afecta el desempeño academico ggplot(CSE_student_performances, aes(x = AcademicPerformance, fill = DepressionStatus)) + geom_bar(position = “fill”) + scale_y_continuous(labels =scales::percent) + labs(title = “Relación entre Estado de Depresión y Desempeño Académico”,x = “Desempeño Académico”,y = “Proporción”, fill = “Estado de Depresión”) + theme_minimal()
#objetivo 3 #Identificar diferencias significativas en el rendimiento académico entre hombres y mujeres #Rendimiento academico segun genero ggplot(CSE_student_performances, aes(x = AcademicPerformance, fill = Gender)) + geom_bar(position = “dodge”) + labs(title = “Distribución del Rendimiento Académico según Género”, x = “Rendimiento Académico”, y = “Frecuencia”, fill = “Género”) + theme_minimal()
tabla_contingencia <- table(CSE_student_performances\(Gender, CSE_student_performances\)AcademicPerformance) fisher.test(tabla_contingencia)