Ejercicio 2: EDA (Exploratory Data Aanalysis) Utilizando el conjunto de datos conocido como “Student’s Sleep Data”
sueño de los estudiante
Los datos muestran el efecto de dos fármacos soporíferos (aumento de las horas de sueño respecto al control) en 10 pacientes estudiantes.
library(pacman)
p_load("datasets","DT","fdth")
data("sleep")
dim(sleep)
## [1] 20 3
datatable(sleep)
table(sleep$extra)
##
## -1.6 -1.2 -0.2 -0.1 0 0.1 0.7 0.8 1.1 1.6 1.9 2 3.4 3.7 4.4 4.6
## 1 1 1 2 1 1 1 2 1 1 1 1 2 1 1 1
## 5.5
## 1
summary(sleep)
## extra group ID
## Min. :-1.600 1:10 1 :2
## 1st Qu.:-0.025 2:10 2 :2
## Median : 0.950 3 :2
## Mean : 1.540 4 :2
## 3rd Qu.: 3.400 5 :2
## Max. : 5.500 6 :2
## (Other):8
boxplot(sleep)
# Para dibujar una linea roja de la media del largo del pétalo
abline(h = mean(sleep$extra), col = "red")
Varianza:
var(sleep$extra)
## [1] 4.072
Desviación estándar
sd(sleep$extra)
## [1] 2.01792
tabla <- fdt(sleep$extra, breaks = "Sturges")
tabla
## Class limits f rf rf(%) cf cf(%)
## [-1.616,-0.4208) 2 0.10 10 2 10
## [-0.4208,0.7743) 6 0.30 30 8 40
## [0.7743,1.969) 5 0.25 25 13 65
## [1.969,3.165) 1 0.05 5 14 70
## [3.165,4.36) 3 0.15 15 17 85
## [4.36,5.555) 3 0.15 15 20 100
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual
plot(tabla, type="fh")
plot(tabla, type="rfh")
plot(tabla, type="cfh")
plot(tabla, type="fp")
plot(tabla, type="rfp")
plot(tabla, type="cfp")