Ejercicio 2: EDA (Exploratory Data Aanalysis) Utilizando el conjunto de datos conocido como “Student’s Sleep Data”

sueño de los estudiante

Los datos muestran el efecto de dos fármacos soporíferos (aumento de las horas de sueño respecto al control) en 10 pacientes estudiantes.

Paquetes

library(pacman)
p_load("datasets","DT","fdth")

Datos

data("sleep")
dim(sleep)
## [1] 20  3

Conociendo los datos por medio de una tabla interactiva

datatable(sleep)

Contando los datos en sus clases

table(sleep$extra)
## 
## -1.6 -1.2 -0.2 -0.1    0  0.1  0.7  0.8  1.1  1.6  1.9    2  3.4  3.7  4.4  4.6 
##    1    1    1    2    1    1    1    2    1    1    1    1    2    1    1    1 
##  5.5 
##    1

Medidas de tendencia central del conjunto de datos

summary(sleep)
##      extra        group        ID   
##  Min.   :-1.600   1:10   1      :2  
##  1st Qu.:-0.025   2:10   2      :2  
##  Median : 0.950          3      :2  
##  Mean   : 1.540          4      :2  
##  3rd Qu.: 3.400          5      :2  
##  Max.   : 5.500          6      :2  
##                          (Other):8

Ilustrando las MTC con un gráfico de caja y bigote

boxplot(sleep)
# Para dibujar una linea roja de la media del largo del pétalo
abline(h = mean(sleep$extra), col = "red")

Varianza:

var(sleep$extra)
## [1] 4.072

Desviación estándar

sd(sleep$extra)
## [1] 2.01792

Tabla de frecuencia, histogramas y polígonos

Tabla de frecuencia

tabla <- fdt(sleep$extra, breaks = "Sturges")
tabla
##      Class limits f   rf rf(%) cf cf(%)
##  [-1.616,-0.4208) 2 0.10    10  2    10
##  [-0.4208,0.7743) 6 0.30    30  8    40
##    [0.7743,1.969) 5 0.25    25 13    65
##     [1.969,3.165) 1 0.05     5 14    70
##      [3.165,4.36) 3 0.15    15 17    85
##      [4.36,5.555) 3 0.15    15 20   100
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual

histogramas

Histograma de frecuencia absoluta

plot(tabla, type="fh")

Histograma de frecuencia relativa

plot(tabla, type="rfh")

Histograma de frecuencia acumulada

plot(tabla, type="cfh")

polígonos

Polígono de frecuencia absoluta

plot(tabla, type="fp")

Polígono de frecuencia relativa

plot(tabla, type="rfp")

Polígono de frecuencia acumulada

plot(tabla, type="cfp")