Definición: Una distribución de frecuencias es una tabla en la cual se agrupan, en clases, los valores que toma una variable, y se registra el número de valores observados que corresponde a cada clase.
Ejemplo. A partir de las facturas, en un restaurante se registró el tipo de bebida que los clientes toman con sus comidas. Las posibles opciones son: agua (A), café (C), gaseosa (G), jugo (J) o té (T).
\[\begin{array} {r|r} J & C & A & G & A & T & T & J & C & J & T & C & G & J & J\\ J & A & G & T & C & A & A & T & J & A & J & A & T & C & J \end{array}\]Solución
# Variable
bebida = c("C","A","G","A","T","T","J","C","J","T","C",
"G","J","J","J","A","G","T","C","A","A","T","J",
"A","J","A","T","C","J")## bebida
## A C G J T
## 7 5 3 8 6
## bebida
## A C G J T
## 0.2413793 0.1724138 0.1034483 0.2758621 0.2068966
Ejemplo. En un portal web en el que venden sus productos diferentes empresas, luego de realizada la compra se pide a los usuarios que califiquen la calidad del servicio que recibieron como pésimo (P),malo (M), regular (R), bueno (B) o excelente (E). En una muestra de 40 usuarios sobre la calidad de servicio recibido dio los siguientes resultados.
\[\begin{array} {r|r|r|r} E & B & B & R & R & M & M & E & B & B\\ P & B & B & P & B & M & B & B & R & B\\ R & M & M & M & R & E & R & B & B & M\\ R & E & B & B & B & P & R & P & B & B \end{array}\]Solución
# Variable
servicio = c("E","B","B","R","R","M","M","E","B","B",
"P", "B", "B","P","B","M","B","B","R","B",
"R","M","M","M","R","E","R","B","B","M",
"R","E","B","B","B","P","R","P","B","B")## servicio
## B E M P R
## 17 4 7 4 8
## n_i f_i
## B 17 0.425
## E 4 0.100
## M 7 0.175
## P 4 0.100
## R 8 0.200
## n_i f_i N_i F_i
## B 17 0.425 17 0.425
## E 4 0.100 21 0.525
## M 7 0.175 28 0.700
## P 4 0.100 32 0.800
## R 8 0.200 40 1.000
Solución
## celulares
## 2 3 4 5 6 7 9
## 3 5 3 6 2 1 1
## n_i f_i
## 2 3 0.14285714
## 3 5 0.23809524
## 4 3 0.14285714
## 5 6 0.28571429
## 6 2 0.09523810
## 7 1 0.04761905
## 9 1 0.04761905
## n_i f_i N_i F_i
## 2 3 0.14285714 3 0.1428571
## 3 5 0.23809524 8 0.3809524
## 4 3 0.14285714 11 0.5238095
## 5 6 0.28571429 17 0.8095238
## 6 2 0.09523810 19 0.9047619
## 7 1 0.04761905 20 0.9523810
## 9 1 0.04761905 21 1.0000000
Ejemplo. Al realizar un inventario de los libros que se venden en una librería, se registraron los siguientes precios de 40 títulos:
\[\begin{array} {|r|r|r|r|} 27 & 13 & 8 & 22 & 32 & 9 & 20 & 20 & 18 & 26\\ 36 & 24 & 27 & 38 & 16 & 27 & 25 & 34 & 18 & 41\\ 32 & 11 & 19 & 17 & 26 & 32 & 22 & 31 & 13 & 11\\ 39 & 24 & 23 & 33 & 27 & 39 & 27 & 25 & 12 & 37 \end{array}\]Solución
# Variable
precios = c(27,13, 8, 22, 32, 9, 20, 20, 18, 26,
36, 24, 27, 38, 16, 27, 25, 34, 18, 41,
32, 11, 19, 17, 26, 32, 22, 31, 13, 11,
39, 24, 23, 33, 27, 39, 27, 25, 12, 37)## [1] 6
## [1] 7 7 9 9 5 3
## n_i f_i
## [1,] 7 0.175
## [2,] 7 0.175
## [3,] 9 0.225
## [4,] 9 0.225
## [5,] 5 0.125
## [6,] 3 0.075
cbind(LI = intervalos[1:length(intervalos)-1],
LS = intervalos[2:length(intervalos)],
n_i,f_i,N_i,F_i)## LI LS n_i f_i N_i F_i
## [1,] 8 14 7 0.175 7 0.175
## [2,] 14 20 7 0.175 14 0.350
## [3,] 20 26 9 0.225 23 0.575
## [4,] 26 32 9 0.225 32 0.800
## [5,] 32 38 5 0.125 37 0.925
## [6,] 38 44 3 0.075 40 1.000
Ejemplo. En la cuarentena debida a la pandemia del COVID-19, uno de los pasatiempos favoritos de la gente fue mirar vídeos por YouTube. Una empresa de publicidad contrató un estudio para determinar el tiempo diario que las familias se dedicaron a ver YouTube en ese periodo, para lo cual se registró la información de 44 hogares, con los siguientes resultados (en horas)
\[\begin{array} {|r|r|r|r|} 2.6 & 2.9 & 3.1 & 3.5 & 3.5 & 3.6 & 3.7 & 3.7 & 3.9 & 3.9 & 4.0 \\ 4.1 & 4.3 & 4.3 & 4.3 & 4.3 & 4.4 & 4.4 & 4.5 & 4.5 & 4.5 & 4.5 \\ 4.6 & 4.7 & 4.7 & 4.7 & 4.8 & 4.9 & 5.0 & 5.1 & 5.1 & 5.3 & 5.3\\ 5.4 & 5.6 & 5.8 & 6.0 & 6.1 & 6.3 & 6.3 & 6.5 & 6.8 & 7.1 & 7.3 \end{array}\]Solución
# Variable
horas = c(2.6, 2.9, 3.1, 3.5, 3.5, 3.6, 3.7, 3.7, 3.9, 3.9,
4.0, 4.1, 4.3, 4.3, 4.3, 4.3, 4.4, 4.4, 4.5,
4.5, 4.5, 4.5,4.6, 4.7, 4.7, 4.7, 4.8, 4.9, 5.0,
5.1, 5.1, 5.3, 5.3,5.4, 5.6, 5.8, 6.0, 6.1, 6.3,
6.3, 6.5, 6.8, 7.1, 7.3)## [1] 0.8
## [1] 3 9 17 7 5 3
## n_i f_i
## [1,] 3 0.06818182
## [2,] 9 0.20454545
## [3,] 17 0.38636364
## [4,] 7 0.15909091
## [5,] 5 0.11363636
## [6,] 3 0.06818182
cbind(LI = intervalos[1:length(intervalos)-1],
LS = intervalos[2:length(intervalos)],
n_i,f_i,N_i,F_i)## LI LS n_i f_i N_i F_i
## [1,] 2.6 3.4 3 0.06818182 3 0.06818182
## [2,] 3.4 4.2 9 0.20454545 12 0.27272727
## [3,] 4.2 5.0 17 0.38636364 29 0.65909091
## [4,] 5.0 5.8 7 0.15909091 36 0.81818182
## [5,] 5.8 6.6 5 0.11363636 41 0.93181818
## [6,] 6.6 7.4 3 0.06818182 44 1.00000000