Utilizando el conjunto conocido como “faithful dataset”

El conjunto de datos proviene del R Dataset “Faithful: Old Faithful Geyser Data”

Esquema del lenguaje natural

Los datos comparan los tiempos de espera en minutos entre las erupciones y la duracíon en minutos de las erupciones del geyser Old Faithful, el cual se encuentra en Yellowstone National Park, Wyoming, Estados Unidos.

Paquetes

library(pacman)
p_load("datasets" , "DT" , "fdth")

Datos

data("faithful")
dim(faithful)
## [1] 272   2

Conociendo los datos por medio de una tabla interactiva

datatable(faithful)

Contando los datos en sus clases

table(faithful$waiting)
## 
## 43 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 62 63 64 65 66 67 68 69 70 
##  1  3  5  4  3  5  5  6  5  7  9  6  4  3  4  7  6  4  3  4  3  2  1  1  2  4 
## 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 96 
##  5  1  7  6  8  9 12 15 10  8 13 12 14 10  6  6  2  6  3  6  1  1  2  1  1

Medidas de tendencia central del conjunto de datos

summary(faithful)
##    eruptions        waiting    
##  Min.   :1.600   Min.   :43.0  
##  1st Qu.:2.163   1st Qu.:58.0  
##  Median :4.000   Median :76.0  
##  Mean   :3.488   Mean   :70.9  
##  3rd Qu.:4.454   3rd Qu.:82.0  
##  Max.   :5.100   Max.   :96.0

Ilustrando las MTC con un gráfico de caja y bigote

boxplot(faithful)
abline(h = mean(faithful$waiting), col = "red")

Varianza

var(faithful$waiting)
## [1] 184.8233

Desviación estandar

sd(faithful$waiting)
## [1] 13.59497

Tabla de frecuencia, histogramas y poligonos

Tabla de frecuencia

tabla <- fdt(faithful$waiting, breaks = "Sturges")
tabla
##     Class limits  f   rf rf(%)  cf  cf(%)
##   [42.57,48.009) 16 0.06  5.88  16   5.88
##  [48.009,53.448) 28 0.10 10.29  44  16.18
##  [53.448,58.887) 26 0.10  9.56  70  25.74
##  [58.887,64.326) 24 0.09  8.82  94  34.56
##  [64.326,69.765)  9 0.03  3.31 103  37.87
##  [69.765,75.204) 31 0.11 11.40 134  49.26
##  [75.204,80.643) 54 0.20 19.85 188  69.12
##  [80.643,86.082) 61 0.22 22.43 249  91.54
##  [86.082,91.521) 18 0.07  6.62 267  98.16
##   [91.521,96.96)  5 0.02  1.84 272 100.00
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual

Histogramas

Histograma de frecuencia absoluta

plot(tabla, type="fh", ylab="Frecuencia", xlab="Minutos", main="Histograma de frecuencia absoluta del\ntiempo de espera entre erupciones", col="#00688B")

Histogramas

Histograma de frecuencia relativa

plot(tabla, type="rfh", ylab="Frecuencia", xlab="Minutos", main="Histograma de frecuencia relativa del\ntiempo de espera entre erupciones", col="#008B8B")

Histograma de frecuencia acumulada

plot(tabla, type="cfh", ylab="Frecuencia", xlab="Minutos", main="Histograma de frecuencia acumulada del\ntiempo de espera entre erupciones", col="#53868B")

Poligonos

Polígono de frecuencia absoluta

plot(tabla, type="fp", ylab="Frecuencia", xlab="Minutos", main="Polígono de frecuencia absoluta del\ntiempo de espera entre erupciones", col="#00688B")

Polígono de frecuencia relativa

plot(tabla, type="rfp", ylab="Frecuencia", xlab="Minutos", main="Polígono de frecuencia relativa del\ntiempo de espera entre erupciones", col="#008B8B")

Polígono de frecuencia acumulada

plot(tabla, type="cfp", ylab="Frecuencia", xlab="Minutos", main="Polígono de frecuencia acumulada del\ntiempo de espera entre erupciones", col="#53868B")