Situación problema

Considere los siguientes datos que especifican la “vida” de 40 baterías para automóvil similares, registradas al décimo de año más cercano. Las baterías se garantizan por tres años.

2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6

3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7

2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1

3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4

4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5

Suponga que estamos interesados en conocer cómo se comportan nuestros datos, además de las medidas de tendencia central y varia bilidad.

Marco de datos

x1 <- c(2.2, 4.1, 3.5, 4.5, 3.2, 3.7, 3.0, 2.6,
           3.4, 1.6, 3.1, 3.3, 3.8, 3.1, 4.7, 3.7,
           2.5, 4.3, 3.4, 3.6, 2.9, 3.3, 3.9, 3.1,
           3.3, 3.1, 3.7, 4.4, 3.2, 4.1, 1.9, 3.4,
           4.7, 3.8, 3.2, 2.6, 3.9, 3.0, 4.2, 3.5)

data_1 <- as.data.frame(x1)

Tabla de frecuencias

library(agricolae)
variable <- as.numeric(data_1$x1)  
Lista <- hist(variable,plot=FALSE)
Tabla1 <- data.frame(table.freq(Lista))
Tabla1
##   Lower Upper Main Frequency Percentage CF   CPF
## 1   1.5   2.0 1.75         2        5.0  2   5.0
## 2   2.0   2.5 2.25         2        5.0  4  10.0
## 3   2.5   3.0 2.75         5       12.5  9  22.5
## 4   3.0   3.5 3.25        15       37.5 24  60.0
## 5   3.5   4.0 3.75         8       20.0 32  80.0
## 6   4.0   4.5 4.25         6       15.0 38  95.0
## 7   4.5   5.0 4.75         2        5.0 40 100.0

Histogramas

h1 <- hist(data_1$x1, col = "green", breaks = 7, main="Histograma", xlab="Intervalos")

library(ggplot2)
ggplot(Tabla1, aes(x = Main, y=Percentage/100)) + 
  geom_col()+xlab("Marca de clase")+ylab("Frecuencia relativa")