Utilizando el conjunto conocido como “faithful dataset”
El conjunto de datos proviene del R Dataset “Faithful: Old Faithful Geyser Data”
Esquema del lenguaje natural
Los datos comparan los tiempos de espera en minutos entre las erupciones y la duracíon en minutos de las erupciones del geyser Old Faithful, el cual se encuentra en Yellowstone National Park, Wyoming, Estados Unidos.
library(pacman)
p_load("datasets" , "DT" , "fdth")
data("faithful")
dim(faithful)
## [1] 272 2
datatable(faithful)
table(faithful$waiting)
##
## 43 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 62 63 64 65 66 67 68 69 70
## 1 3 5 4 3 5 5 6 5 7 9 6 4 3 4 7 6 4 3 4 3 2 1 1 2 4
## 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 96
## 5 1 7 6 8 9 12 15 10 8 13 12 14 10 6 6 2 6 3 6 1 1 2 1 1
summary(faithful)
## eruptions waiting
## Min. :1.600 Min. :43.0
## 1st Qu.:2.163 1st Qu.:58.0
## Median :4.000 Median :76.0
## Mean :3.488 Mean :70.9
## 3rd Qu.:4.454 3rd Qu.:82.0
## Max. :5.100 Max. :96.0
boxplot(faithful)
abline(h = mean(faithful$waiting), col = "red")
var(faithful$waiting)
## [1] 184.8233
sd(faithful$waiting)
## [1] 13.59497
tabla <- fdt(faithful$waiting, breaks = "Sturges")
tabla
## Class limits f rf rf(%) cf cf(%)
## [42.57,48.009) 16 0.06 5.88 16 5.88
## [48.009,53.448) 28 0.10 10.29 44 16.18
## [53.448,58.887) 26 0.10 9.56 70 25.74
## [58.887,64.326) 24 0.09 8.82 94 34.56
## [64.326,69.765) 9 0.03 3.31 103 37.87
## [69.765,75.204) 31 0.11 11.40 134 49.26
## [75.204,80.643) 54 0.20 19.85 188 69.12
## [80.643,86.082) 61 0.22 22.43 249 91.54
## [86.082,91.521) 18 0.07 6.62 267 98.16
## [91.521,96.96) 5 0.02 1.84 272 100.00
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual
plot(tabla, type="fh", ylab="Frecuencia", xlab="Minutos", main="Histograma de frecuencia absoluta del\ntiempo de espera entre erupciones", col="#00688B")
plot(tabla, type="rfh", ylab="Frecuencia", xlab="Minutos", main="Histograma de frecuencia relativa del\ntiempo de espera entre erupciones", col="#008B8B")
plot(tabla, type="cfh", ylab="Frecuencia", xlab="Minutos", main="Histograma de frecuencia acumulada del\ntiempo de espera entre erupciones", col="#53868B")
plot(tabla, type="fp", ylab="Frecuencia", xlab="Minutos", main="Polígono de frecuencia absoluta del\ntiempo de espera entre erupciones", col="#00688B")
plot(tabla, type="rfp", ylab="Frecuencia", xlab="Minutos", main="Polígono de frecuencia relativa del\ntiempo de espera entre erupciones", col="#008B8B")
plot(tabla, type="cfp", ylab="Frecuencia", xlab="Minutos", main="Polígono de frecuencia acumulada del\ntiempo de espera entre erupciones", col="#53868B")