HƁBITOS DE SUEƑO DE LOS ESTUDIANTES DE LA UTEC Y SU RELACIƓN CON EL RENDIMIENTO ACADƉMICO

UTEC

EstadĆ­stica y probabilidades ā… 

Objetivos

  1. Evaluar la prevalencia de los problemas de sueƱo en los estudiantes de la UTEC.

  2. Analizar si la cantidad de cursos que lleva un estudiante influye en las horas de sueƱo.

  3. Generar información sobre las preferencias y hÔbitos de descanso de los estudiantes de UTEC con el fin de promover la mejora de estos espacios.

Analisis de la variable ā€˜Espacios_de_descanso’

Dado que nuestro estudio tuvo una muestra de 227 personas y que se aprecia un aproximado de 40 estudiantes que marcaron esa opción, podemos decir que la proporción es 1 de cada 5 estudiantes

Probabilidad empĆ­rica y eventos atomicos

ĀæCuĆ”l es la probabilidad de obtener al azar un alumno que lleva 5 cursos de una muestra de 227 alumnos? (eventos posibles)/(total de eventos) Probabilidad del valor 5: 52/227 = 0.23 … etc. Conclusión:

## 
##    3    4    5    6    7    8 
## 0.06 0.07 0.23 0.44 0.18 0.03

Tabla de intervalos

Probabilidades:

(P)[1.99, 3.6]: 5/227 = 0.02, (P)[3.6, 5.2]: 56/227 = 0.25, (P)[5.2, 6.8]: 77/227 = 0.34, (P)[6.8, 8.4]: 82/227 = 0.36, (P)[8.4, 10]: 6/227 = 0,03

Probabilidad condicional

## Warning: Removed 4 rows containing missing values (`geom_point()`).

## La correlation es : -0.06603187

Comprobando la indenpendencia de eventos

  • Evento A: Estudiante que duerma 4 horas cada dĆ­a, (P(A)=0.4).

  • Evento B: Un estudiante estudia menos de 15 horas semanales, (P(B)=0.6).

  • Si es independienete, se cumple que: P(A∩B) = P(A)*P(B).

  • Sabemos que si estos eventos son independientes, entonces P(A∩B)=P(A)*P(B), Entonces, la probabilidad de que duerma 4 horas al dĆ­a y estudie 15 horas semanales es: P(A∩B) = P(A)* P(B)

  • Si calculamos las probabilidades condicionales:

P(A|B) = P(A ∩ B) / P(B) = 0.24 / 0.6 = 0.4.

P(B|A) = P(A ∩ B) / P(A) = 0.24 / 0.4 = 0.6.

En este caso, ambas probabilidades condicionales son iguales a las probabilidades individuales de los eventos A y B, respectivamente

dormir4 = 4/10
Prob15semanales = 0.6
Phorasdormidasyestudiadas = Prob15semanales*dormir4
Phorasdormidasyestudiadas
## [1] 0.24
ProbBtalqueA = Phorasdormidasyestudiadas/dormir4
ProbAtalqueB = Phorasdormidasyestudiadas/Prob15semanales

Comprobando la dependencia de eventos

  • Evento A: El tiempo que te quedaste dormido en clase es mayor a 1hora.

  • Evento B: Las horas que duermes en promedio son menores a 8.

  • Tenemos una muestra de 227 datos.

  • La probabilidad de que se quede dormido en clase por mĆ”s de una hora, segĆŗn los datos proporcionados, es de 84/227, lo cual es aproximadamente igual a 0.369.

  • Verificando la dependencia de los eventos A y B, mediante la probabilidad conjunta: P(A ∩ B) y la comparación con el producto de las probabilidades individuales P(A) * P(B). Entonces, P(A ∩ B) = 11/227, que es aproximadamente igual a 0.048.

  • El producto de las probabilidades individuales P(A) * P(B) es aproximadamente igual a 0.369 * 0.542 = 0.203.

  • Como P(A ∩ B) ≠ P(A) * P(B), podemos concluir que los eventos A y B son dependientes. P(B|A) = P(A ∩ B) / P(A) = 0.24 / 0.4 = 0.6.

Probdormir2horas  = 1/227
Probdormir4horas  = 4/227
Probdormir5horas  = 11/227
Probdormir8horas  = 18/227
Probdormir6horas  = 45/227
Probdormir7horas  = 44/227
## Probconjunta = 11/227: 0.04845815

Variables discretas

  1. Cantidad de cursos

Para realizar el experimento debemos conocer la probabilidad de cada uno, entonces:

Opciones Probabilidad Unidad
Nivel 1 0 Probabilidad que se escoja 1 curso
Nivel 2 0 Probabilidad que se escoja 2 curso
Nivel 3 0.0617 Probabilidad que se escoja 3 curso
Nivel 4 0.0661 Probabilidad que se escoja 4 curso
Nivel 5 0.2291 Probabilidad que se escoja 5 curso
Nivel 6 0.4361 Probabilidad que se escoja 6 curso
Nivel 7 0.1806 Probabilidad que se escoja 7 curso
Nivel 8 0.0264 Probabilidad que se escoja 8 curso

CASO I:

¿CuÔl es la probabilidad de seleccionar a 80 alumnos y que este hayan llevado 6 cursos en el ciclo?

P6 <- dbinom(80 , nrow(DF),  sum(DF$Cant.Cursos == "6")/nrow(DF) )
n <- 80  # NĆŗmero de ensayos
p <- P6  # Probabilidad de Ʃxito
valor_esperado <- n * p
varianza <- n * p * (1 - p)
cat("el valor esperado es: ", valor_esperado)
## el valor esperado es:  0.1637209
cat("La probabilidad de seleccionar a 80 alumnos y que este hayan llevado 6 cursos en el ciclo es:", P6)
## La probabilidad de seleccionar a 80 alumnos y que este hayan llevado 6 cursos en el ciclo es: 0.002046511

GrÔfica de nuestra función probabilidad binomial negativa

## La varianza es:  0.1633858

  1. Calidad de sueƱo

Opciones Probabilidad Unidad
Nivel 1 0.0661 Probabilidad que se escoja el nivel 1
Nivel 2 0.1630 Probabilidad que se escoja el nivel 2
Nivel 3 0.4581 Probabilidad que se escoja el nivel 3
Nivel 4 0.2203 Probabilidad que se escoja el nivel 4
Nivel 5 0.0925 Probabilidad que se escoja el nivel 5
  • En este experimento, la muestra consiste en seleccionar Ćŗnicamente 5 niveles de satisfacción (1, 2, 3, 4, 5), lo que representa un conjunto finito. Por lo tanto, utilizaremos una distribución hipergeomĆ©trica para analizar cuĆ”n probable es que los encuestados estĆ©n mĆ”s satisfechos que otros en cuanto a la calidad del sueƱo.

  • DespuĆ©s de analizar los datos, se observa que de un total de 227 entrevistados, 104 de ellos seleccionaron el nivel de desempeƱo igual a 3. En este modelo probabilĆ­stico, nuestro objetivo es determinar la probabilidad de que, en una muestra de 150 entrevistados, se encuentre aproximadamente el 50% del nĆŗmero de entrevistados que eligieron la opción 3. AdemĆ”s, buscaremos calcular el valor esperado de esta probabilidad.

  • Datos : P(x = 104), k=75, p = 50/201

GrÔfica de nuestra función probabilidad binomial negativa

CASO II:

¿CuÔl es la probabilidad de que al agarrar una muestra al azar de 50 personas encuestadas, a lo mÔs 10 personas tengan un nivel de satisfacción de 3 en la calidad de sueño, sabiendo que la población es de 227 personas encuestadas?

  • Ɖxito: Que una persona encuestada tenga 3 como nivel de satisfacción en la categorĆ­a de ā€œcalidad de sueƱoā€
## Probabilidad (phyper(x, M, N āˆ’ M, n)): 0.2199186
## Valor esperado (E(X)= n*M/N): 22.90749
## Varianza (V(X) = (n*M/N)(1 āˆ’ M/N)(N-n)/(N-1)): 6.725528
## Desviación estĆ”ndar (D(x)=((n*M/N)(1 āˆ’ M/N)(N-n)/(N-1))^0.5: 2.593362
  • Cuando:

M= 104 (cantidad de alumnos que escogieron el nivel 3), N = 227 (tamaño de la población), n = 50 (tamaño de la muestra), k = 104 (éxitos en la población), x <= 20 (personas de la muestra con 3 de satisfacción ).

Variables continuas

  • Trabajaremos con las variables ā€œPromedioā€ y ā€œhoras.de.estudioā€:
  1. Promedio
  • Lo primero que haremos es identificar esta variable a travĆ©s de un histograma:

Consideramos la grƔfica como una normal, para asƭ poder seguir con los pasos dados para variables continuas, Validar la normal:

## El promedio es:  14.97808
## La mediana es:  14.92
## El promedio es:  14.97808
## La desviación estandar es:  1.646526
## La varianza es:  2.711049
## El valor de vartd2 es:  2.697889
  • Podemos observar que son prĆ”cticamente lo mismo
## La varianza es:  2.711049
## La esperanza es:  14.97808

  • Tal que: X ~ N(14.98, 2.71)

  • Ejemplo:

¿CuÔl es la probabilidad de que un estudiante seleccionado al azar de la UTEC duerma mÔs de 9 horas al día, basÔndonos en los datos del estudio que muestra un promedio de 14.98 horas y una desviación estÔndar de 2.71 horas en una muestra de 227 estudiantes de los ciclos 3 y 4?

# ParƔmetros
promedio <- 14.98
desviacion <- 2.71
umbral <- 9

# CÔlculo de la probabilidad P(X > 9) utilizando la función de distribución acumulativa (pnorm) y complementando con 1
probabilidad <- 1 - pnorm(umbral, mean = promedio, sd = desviacion)
cat("El probabilidad es: ", probabilidad ) 
## El probabilidad es:  0.9863305

Horas.de.estudio

  • Consideramos la grĆ”fica como una normal, para asĆ­ poder seguir con los pasos dados para variables continuas
## La media es:  8.975
## La mediana es:  6.383534
## La media es:  8.975
## La mediana es:  7.3

vartd <- var(DF$Horas.de.estudio, na.rm = TRUE)
print(vartd)
## [1] 40.74951
vartd2 <- sum((DF$Horas.de.estudio - medtd)^2, na.rm = TRUE) / (length(DF$Horas.de.estudio) - sum(is.na(DF$Horas.de.estudio)))
print(vartd2)
## [1] 40.56759
vartd <- var(DF$Horas.de.estudio, na.rm = TRUE)
print(vartd)
## [1] 40.74951
espetd <- mean(DF$Horas.de.estudio, na.rm = TRUE)
print(espetd)
## [1] 8.975

Tal que: X ~ N(8.98,40.75)

  • EJEMPLO: se estĆ” llevando a cabo un estudio sobre los hĆ”bitos de sueƱo de los estudiantes y su relación con el rendimiento acadĆ©mico. La universidad busca entender cómo los hĆ”bitos de sueƱo pueden afectar el desempeƱo estudiantil. Se recolectaron datos sobre los hĆ”bitos de sueƱo de una muestra de estudiantes de la UTEC. El promedio aritmĆ©tico del tiempo de sueƱo de la muestra fue de 8.98 horas, con una desviación estĆ”ndar de 40.75 horas.

  • La pregunta que nos interesa responder es: ĀæCuĆ”l es la probabilidad de que un estudiante seleccionado al azar de la UTEC duerma mĆ”s de X horas al dĆ­a?

#Utilizando los datos proporcionados, podemos utilizar la distribución normal para calcular la probabilidad. Por ejemplo, si estamos interesados en calcular la probabilidad de que un estudiante duerma mÔs de 10 horas al día, podemos utilizar el siguiente código en R:
promedio <- 8.98
desviacion <- 40.75
umbral <- 10

# CÔlculo de la probabilidad P(X > X) utilizando la función de distribución acumulativa (pnorm) y complementando con 1
probabilidad <- 1 - pnorm(umbral, mean = promedio, sd = desviacion)
print(probabilidad)
## [1] 0.4900152

Conclusiones

  • Tras los estudios realizados, se concluye que las horas que duerme un estudiante influyen en su rendimiento acadĆ©mico. Esto se demostró mediante anĆ”lisis y evidencia empĆ­rica.

  • Por otro lado, se concluye que las horas que un estudiante le dedica al estudio no tienen influencia en las horas que duerme. Esta conclusión se obtuvo a travĆ©s del cĆ”lculo de probabilidades.

  • Al analizar los grĆ”ficos, se observa que a medida que un estudiante lleva mĆ”s cursos, sus horas de sueƱo disminuyen gradualmente. Sin embargo, no se puede afirmar que exista una influencia directa, ya que esto depende de otros factores distintos a la cantidad de cursos.

  • Los estudios realizados indican que es mĆ”s probable encontrar estudiantes insatisfechos con la calidad de su sueƱo que estudiantes satisfechos.

  • Al analizar los grĆ”ficos y la información obtenida, se observa que hay una mayor cantidad de estudiantes que prefieren descansar en el piso 11. AdemĆ”s, se nota que existe una mayor cantidad de estudiantes que no se sienten satisfechos con los espacios de descanso.