EstadĆstica y probabilidades ā
Evaluar la prevalencia de los problemas de sueƱo en los estudiantes de la UTEC.
Analizar si la cantidad de cursos que lleva un estudiante influye en las horas de sueƱo.
Generar información sobre las preferencias y hÔbitos de descanso de los estudiantes de UTEC con el fin de promover la mejora de estos espacios.
Dado que nuestro estudio tuvo una muestra de 227 personas y que se aprecia un aproximado de 40 estudiantes que marcaron esa opción, podemos decir que la proporción es 1 de cada 5 estudiantes
¿CuÔl es la probabilidad de obtener al azar un alumno que lleva 5 cursos de una muestra de 227 alumnos? (eventos posibles)/(total de eventos) Probabilidad del valor 5: 52/227 = 0.23 ⦠etc. Conclusión:
##
## 3 4 5 6 7 8
## 0.06 0.07 0.23 0.44 0.18 0.03
## Warning: Removed 4 rows containing missing values (`geom_point()`).
## La correlation es : -0.06603187
Evento A: Estudiante que duerma 4 horas cada dĆa, (P(A)=0.4).
Evento B: Un estudiante estudia menos de 15 horas semanales, (P(B)=0.6).
Si es independienete, se cumple que: P(Aā©B) = P(A)*P(B).
Sabemos que si estos eventos son independientes, entonces P(Aā©B)=P(A)*P(B), Entonces, la probabilidad de que duerma 4 horas al dĆa y estudie 15 horas semanales es: P(Aā©B) = P(A)* P(B)
Si calculamos las probabilidades condicionales:
P(A|B) = P(A ā© B) / P(B) = 0.24 / 0.6 = 0.4.
P(B|A) = P(A ā© B) / P(A) = 0.24 / 0.4 = 0.6.
En este caso, ambas probabilidades condicionales son iguales a las probabilidades individuales de los eventos A y B, respectivamente
dormir4 = 4/10
Prob15semanales = 0.6
Phorasdormidasyestudiadas = Prob15semanales*dormir4
Phorasdormidasyestudiadas## [1] 0.24
Evento A: El tiempo que te quedaste dormido en clase es mayor a 1hora.
Evento B: Las horas que duermes en promedio son menores a 8.
Tenemos una muestra de 227 datos.
La probabilidad de que se quede dormido en clase por mÔs de una hora, según los datos proporcionados, es de 84/227, lo cual es aproximadamente igual a 0.369.
Verificando la dependencia de los eventos A y B, mediante la probabilidad conjunta: P(A ⩠B) y la comparación con el producto de las probabilidades individuales P(A) * P(B). Entonces, P(A ⩠B) = 11/227, que es aproximadamente igual a 0.048.
El producto de las probabilidades individuales P(A) * P(B) es aproximadamente igual a 0.369 * 0.542 = 0.203.
Como P(A ā© B) ā P(A) * P(B), podemos concluir que los eventos A y B son dependientes. P(B|A) = P(A ā© B) / P(A) = 0.24 / 0.4 = 0.6.
Probdormir2horas = 1/227
Probdormir4horas = 4/227
Probdormir5horas = 11/227
Probdormir8horas = 18/227
Probdormir6horas = 45/227
Probdormir7horas = 44/227## Probconjunta = 11/227: 0.04845815
Para realizar el experimento debemos conocer la probabilidad de cada uno, entonces:
| Opciones | Probabilidad | Unidad |
|---|---|---|
| Nivel 1 | 0 | Probabilidad que se escoja 1 curso |
| Nivel 2 | 0 | Probabilidad que se escoja 2 curso |
| Nivel 3 | 0.0617 | Probabilidad que se escoja 3 curso |
| Nivel 4 | 0.0661 | Probabilidad que se escoja 4 curso |
| Nivel 5 | 0.2291 | Probabilidad que se escoja 5 curso |
| Nivel 6 | 0.4361 | Probabilidad que se escoja 6 curso |
| Nivel 7 | 0.1806 | Probabilidad que se escoja 7 curso |
| Nivel 8 | 0.0264 | Probabilidad que se escoja 8 curso |
¿CuÔl es la probabilidad de seleccionar a 80 alumnos y que este hayan llevado 6 cursos en el ciclo?
P6 <- dbinom(80 , nrow(DF), sum(DF$Cant.Cursos == "6")/nrow(DF) )
n <- 80 # NĆŗmero de ensayos
p <- P6 # Probabilidad de Ʃxito
valor_esperado <- n * p
varianza <- n * p * (1 - p)
cat("el valor esperado es: ", valor_esperado)## el valor esperado es: 0.1637209
cat("La probabilidad de seleccionar a 80 alumnos y que este hayan llevado 6 cursos en el ciclo es:", P6)## La probabilidad de seleccionar a 80 alumnos y que este hayan llevado 6 cursos en el ciclo es: 0.002046511
## La varianza es: 0.1633858
| Opciones | Probabilidad | Unidad |
|---|---|---|
| Nivel 1 | 0.0661 | Probabilidad que se escoja el nivel 1 |
| Nivel 2 | 0.1630 | Probabilidad que se escoja el nivel 2 |
| Nivel 3 | 0.4581 | Probabilidad que se escoja el nivel 3 |
| Nivel 4 | 0.2203 | Probabilidad que se escoja el nivel 4 |
| Nivel 5 | 0.0925 | Probabilidad que se escoja el nivel 5 |
En este experimento, la muestra consiste en seleccionar únicamente 5 niveles de satisfacción (1, 2, 3, 4, 5), lo que representa un conjunto finito. Por lo tanto, utilizaremos una distribución hipergeométrica para analizar cuÔn probable es que los encuestados estén mÔs satisfechos que otros en cuanto a la calidad del sueño.
DespuĆ©s de analizar los datos, se observa que de un total de 227 entrevistados, 104 de ellos seleccionaron el nivel de desempeƱo igual a 3. En este modelo probabilĆstico, nuestro objetivo es determinar la probabilidad de que, en una muestra de 150 entrevistados, se encuentre aproximadamente el 50% del nĆŗmero de entrevistados que eligieron la opción 3. AdemĆ”s, buscaremos calcular el valor esperado de esta probabilidad.
Datos : P(x = 104), k=75, p = 50/201
¿CuÔl es la probabilidad de que al agarrar una muestra al azar de 50 personas encuestadas, a lo mÔs 10 personas tengan un nivel de satisfacción de 3 en la calidad de sueño, sabiendo que la población es de 227 personas encuestadas?
## Probabilidad (phyper(x, M, N ā M, n)): 0.2199186
## Valor esperado (E(X)= n*M/N): 22.90749
## Varianza (V(X) = (n*M/N)(1 ā M/N)(N-n)/(N-1)): 6.725528
## Desviación estĆ”ndar (D(x)=((n*M/N)(1 ā M/N)(N-n)/(N-1))^0.5: 2.593362
M= 104 (cantidad de alumnos que escogieron el nivel 3), N = 227 (tamaño de la población), n = 50 (tamaño de la muestra), k = 104 (éxitos en la población), x <= 20 (personas de la muestra con 3 de satisfacción ).
Consideramos la grÔfica como una normal, para asà poder seguir con los pasos dados para variables continuas, Validar la normal:
## El promedio es: 14.97808
## La mediana es: 14.92
## El promedio es: 14.97808
## La desviación estandar es: 1.646526
## La varianza es: 2.711049
## El valor de vartd2 es: 2.697889
## La varianza es: 2.711049
## La esperanza es: 14.97808
ĀæCuĆ”l es la probabilidad de que un estudiante seleccionado al azar de la UTEC duerma mĆ”s de 9 horas al dĆa, basĆ”ndonos en los datos del estudio que muestra un promedio de 14.98 horas y una desviación estĆ”ndar de 2.71 horas en una muestra de 227 estudiantes de los ciclos 3 y 4?
# ParƔmetros
promedio <- 14.98
desviacion <- 2.71
umbral <- 9
# CÔlculo de la probabilidad P(X > 9) utilizando la función de distribución acumulativa (pnorm) y complementando con 1
probabilidad <- 1 - pnorm(umbral, mean = promedio, sd = desviacion)
cat("El probabilidad es: ", probabilidad ) ## El probabilidad es: 0.9863305
## La media es: 8.975
## La mediana es: 6.383534
## La media es: 8.975
## La mediana es: 7.3
## [1] 40.74951
vartd2 <- sum((DF$Horas.de.estudio - medtd)^2, na.rm = TRUE) / (length(DF$Horas.de.estudio) - sum(is.na(DF$Horas.de.estudio)))
print(vartd2)## [1] 40.56759
## [1] 40.74951
## [1] 8.975
EJEMPLO: se estÔ llevando a cabo un estudio sobre los hÔbitos de sueño de los estudiantes y su relación con el rendimiento académico. La universidad busca entender cómo los hÔbitos de sueño pueden afectar el desempeño estudiantil. Se recolectaron datos sobre los hÔbitos de sueño de una muestra de estudiantes de la UTEC. El promedio aritmético del tiempo de sueño de la muestra fue de 8.98 horas, con una desviación estÔndar de 40.75 horas.
La pregunta que nos interesa responder es: ĀæCuĆ”l es la probabilidad de que un estudiante seleccionado al azar de la UTEC duerma mĆ”s de X horas al dĆa?
#Utilizando los datos proporcionados, podemos utilizar la distribución normal para calcular la probabilidad. Por ejemplo, si estamos interesados en calcular la probabilidad de que un estudiante duerma mĆ”s de 10 horas al dĆa, podemos utilizar el siguiente código en R:
promedio <- 8.98
desviacion <- 40.75
umbral <- 10
# CÔlculo de la probabilidad P(X > X) utilizando la función de distribución acumulativa (pnorm) y complementando con 1
probabilidad <- 1 - pnorm(umbral, mean = promedio, sd = desviacion)
print(probabilidad)## [1] 0.4900152
Tras los estudios realizados, se concluye que las horas que duerme un estudiante influyen en su rendimiento acadĆ©mico. Esto se demostró mediante anĆ”lisis y evidencia empĆrica.
Por otro lado, se concluye que las horas que un estudiante le dedica al estudio no tienen influencia en las horas que duerme. Esta conclusión se obtuvo a través del cÔlculo de probabilidades.
Al analizar los grƔficos, se observa que a medida que un estudiante lleva mƔs cursos, sus horas de sueƱo disminuyen gradualmente. Sin embargo, no se puede afirmar que exista una influencia directa, ya que esto depende de otros factores distintos a la cantidad de cursos.
Los estudios realizados indican que es mƔs probable encontrar estudiantes insatisfechos con la calidad de su sueƱo que estudiantes satisfechos.
Al analizar los grÔficos y la información obtenida, se observa que hay una mayor cantidad de estudiantes que prefieren descansar en el piso 11. AdemÔs, se nota que existe una mayor cantidad de estudiantes que no se sienten satisfechos con los espacios de descanso.