Considere los siguientes datos que especifican la “vida” de 40 baterías para automóvil similares, registradas al décimo de año más cercano. Las baterías se garantizan por tres años.
2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5
Suponga que estamos interesados en conocer cómo se comportan nuestros datos, además de las medidas de tendencia central y varia bilidad.
x1 <- c(2.2, 4.1, 3.5, 4.5, 3.2, 3.7, 3.0, 2.6,
3.4, 1.6, 3.1, 3.3, 3.8, 3.1, 4.7, 3.7,
2.5, 4.3, 3.4, 3.6, 2.9, 3.3, 3.9, 3.1,
3.3, 3.1, 3.7, 4.4, 3.2, 4.1, 1.9, 3.4,
4.7, 3.8, 3.2, 2.6, 3.9, 3.0, 4.2, 3.5)
data_1 <- as.data.frame(x1)
library(agricolae)
variable <- as.numeric(data_1$x1)
Lista <- hist(variable,plot=FALSE)
Tabla1 <- data.frame(table.freq(Lista))
Tabla1
## Lower Upper Main Frequency Percentage CF CPF
## 1 1.5 2.0 1.75 2 5.0 2 5.0
## 2 2.0 2.5 2.25 2 5.0 4 10.0
## 3 2.5 3.0 2.75 5 12.5 9 22.5
## 4 3.0 3.5 3.25 15 37.5 24 60.0
## 5 3.5 4.0 3.75 8 20.0 32 80.0
## 6 4.0 4.5 4.25 6 15.0 38 95.0
## 7 4.5 5.0 4.75 2 5.0 40 100.0
h1 <- hist(data_1$x1, col = "green", breaks = 7, main="Histograma", xlab="Intervalos")
library(ggplot2)
ggplot(Tabla1, aes(x = Main, y=Percentage/100)) +
geom_col()+xlab("Marca de clase")+ylab("Frecuencia relativa")