1 Tabla de distribución de frecuencias

Definición: Una distribución de frecuencias es una tabla en la cual se agrupan, en clases, los valores que toma una variable, y se registra el número de valores observados que corresponde a cada clase.

1.1 Tablas de frecuencias para datos cualitativos nominales

Ejemplo. A partir de las facturas, en un restaurante se registró el tipo de bebida que los clientes toman con sus comidas. Las posibles opciones son: agua (A), café (C), gaseosa (G), jugo (J) o té (T).

\[\begin{array} {r|r} J & C & A & G & A & T & T & J & C & J & T & C & G & J & J\\ J & A & G & T & C & A & A & T & J & A & J & A & T & C & J \end{array}\]

Solución

  • Crear una variable de nombre bebida e ingresar los datos.
  • Utilizar la función table para crear una tabla con la frecuencias absolutas \(n_{i}\) y guarde en una variable de nombre tb_bebidas
  • Para visualizar la tabla solo debe ejecutar el nombre de la variable
## bebida
## A C G J T 
## 7 5 3 8 6
  • Para calcular las frecuencias relativas utilizar prop.table
## bebida
##         A         C         G         J         T 
## 0.2413793 0.1724138 0.1034483 0.2758621 0.2068966

1.2 Tablas de frecuencias para datos ordinales

Ejemplo. En un portal web en el que venden sus productos diferentes empresas, luego de realizada la compra se pide a los usuarios que califiquen la calidad del servicio que recibieron como pésimo (P),malo (M), regular (R), bueno (B) o excelente (E). En una muestra de 40 usuarios sobre la calidad de servicio recibido dio los siguientes resultados.

\[\begin{array} {r|r|r|r} E & B & B & R & R & M & M & E & B & B\\ P & B & B & P & B & M & B & B & R & B\\ R & M & M & M & R & E & R & B & B & M\\ R & E & B & B & B & P & R & P & B & B \end{array}\]

Solución

  • Crear una variable de nombre servicio e ingresar los datos.
  • Utilzar la función table para crear una tabla con las frecuencias absolutas \(n_{i}\) y guarde en una variable de nombre n_i
  • Para visualizar la tabla solo debe ejecutar el nombre de la variable
## servicio
##  B  E  M  P  R 
## 17  4  7  4  8
  • Para calcular las frecuencias relativas utilizar prop.table y guardar en la variable f_i
  • Añader la fila de las frecuencias relativas a la variable n_i
##   n_i   f_i
## B  17 0.425
## E   4 0.100
## M   7 0.175
## P   4 0.100
## R   8 0.200
  • Calcular la frecuencias absoluta acumulada y la frecuencia relativa acumulada
  • Crear una tabla de frecuencias
##   n_i   f_i N_i   F_i
## B  17 0.425  17 0.425
## E   4 0.100  21 0.525
## M   7 0.175  28 0.700
## P   4 0.100  32 0.800
## R   8 0.200  40 1.000

1.3 Tablas de frecuencias para datos cuantitativos discretos

Ejemplo. A veinte y dos personas se les preguntó cuántos teléfonos celulares han comprado en los últimos cinco años, con los siguientes resultados: \[\begin{array} {|r|r|} 2 & 3 & 5 & 6 & 5 & 4 & 4 & 3 & 5 & 7 & 3 \\ 5 & 2 & 5 & 5 & 6 & 3 & 3 & 2 & 4 & 5 & 9 \end{array}\]

Solución

  • Crear una variable de nombre celulares e ingresar los datos.
  • Utilzar la función table para crear una tabla con la frecuencias absolutas \(n_{i}\) y guarde en una variable de nombre n_i
  • Para visualizar la tabla solo debe ejecutar el nombre de la variable
## celulares
## 2 3 4 5 6 7 9 
## 3 5 3 6 2 1 1
  • Para calcular las frecuencias relativas utilizar prop.table y guardar en la variable f_i
  • Añader la fila de las frecuencias relativas a la variable n_i
##   n_i        f_i
## 2   3 0.14285714
## 3   5 0.23809524
## 4   3 0.14285714
## 5   6 0.28571429
## 6   2 0.09523810
## 7   1 0.04761905
## 9   1 0.04761905
  • Calcular la frecuencias absoluta acumulada y la frecuencia relativa acumulada
  • Crear una tabla de frecuencias
##   n_i        f_i N_i       F_i
## 2   3 0.14285714   3 0.1428571
## 3   5 0.23809524   8 0.3809524
## 4   3 0.14285714  11 0.5238095
## 5   6 0.28571429  17 0.8095238
## 6   2 0.09523810  19 0.9047619
## 7   1 0.04761905  20 0.9523810
## 9   1 0.04761905  21 1.0000000

1.4 Tabla de frecuencia para datos cuantitativos discretos agrupados

Ejemplo. Al realizar un inventario de los libros que se venden en una librería, se registraron los siguientes precios de 40 títulos:

\[\begin{array} {|r|r|r|r|} 27 & 13 & 8 & 22 & 32 & 9 & 20 & 20 & 18 & 26\\ 36 & 24 & 27 & 38 & 16 & 27 & 25 & 34 & 18 & 41\\ 32 & 11 & 19 & 17 & 26 & 32 & 22 & 31 & 13 & 11\\ 39 & 24 & 23 & 33 & 27 & 39 & 27 & 25 & 12 & 37 \end{array}\]

Solución

  • Primero, encontremos los datos mínimo y máximo, y calculemos el rango de variación de los datos:
  • Primero, encontremos los datos mínimo y máximo, y calculemos el rango de variación de los datos:
  • Calculemos la amplitud, recordar que el número clases es dada por el docente o el problema, en este caso en 6
  • Redonderar la aplitud a un número entero
## [1] 6
  • Crear los intervalos
  • Utilzar la función hist para crear una tabla con la frecuencias absolutas \(n_{i}\) y guarde en una variable de nombre n_i
  • Para visualizar la tabla solo debe ejecutar el nombre de la variable
## [1] 7 7 9 9 5 3
  • Para calcular las frecuencias relativas utilizar prop.table y guardar en la variable f_i
  • Añader la fila de las frecuencias relativas a la variable n_i
##      n_i   f_i
## [1,]   7 0.175
## [2,]   7 0.175
## [3,]   9 0.225
## [4,]   9 0.225
## [5,]   5 0.125
## [6,]   3 0.075
  • Calcular la frecuencias absoluta acumulada y la frecuencia relativa acumulada
  • Crear una tabla de frecuencias
##      LI LS n_i   f_i N_i   F_i
## [1,]  8 14   7 0.175   7 0.175
## [2,] 14 20   7 0.175  14 0.350
## [3,] 20 26   9 0.225  23 0.575
## [4,] 26 32   9 0.225  32 0.800
## [5,] 32 38   5 0.125  37 0.925
## [6,] 38 44   3 0.075  40 1.000

1.5 Tabla de frecuencia para datos cuantitativos continuos agrupados por intervalos

Ejemplo. En la cuarentena debida a la pandemia del COVID-19, uno de los pasatiempos favoritos de la gente fue mirar vídeos por YouTube. Una empresa de publicidad contrató un estudio para determinar el tiempo diario que las familias se dedicaron a ver YouTube en ese periodo, para lo cual se registró la información de 44 hogares, con los siguientes resultados (en horas)

\[\begin{array} {|r|r|r|r|} 2.6 & 2.9 & 3.1 & 3.5 & 3.5 & 3.6 & 3.7 & 3.7 & 3.9 & 3.9 & 4.0 \\ 4.1 & 4.3 & 4.3 & 4.3 & 4.3 & 4.4 & 4.4 & 4.5 & 4.5 & 4.5 & 4.5 \\ 4.6 & 4.7 & 4.7 & 4.7 & 4.8 & 4.9 & 5.0 & 5.1 & 5.1 & 5.3 & 5.3\\ 5.4 & 5.6 & 5.8 & 6.0 & 6.1 & 6.3 & 6.3 & 6.5 & 6.8 & 7.1 & 7.3 \end{array}\]

Solución

  • Primero, encontremos los datos mínimo y máximo, y calculemos el rango de variación de los datos:
  • Primero, encontremos los datos mínimo y máximo, y calculemos el rango de variación de los datos:
  • Calculemos la amplitud, recordar que el número clases es dada por el docente o el problema, en este caso en 6
  • Redonderar la aplitud a un número entero
## [1] 0.8
  • Crear los intervalos
  • Utilzar la función hist para crear una tabla con las frecuencias absolutas \(n_{i}\) y guarde en una variable de nombre n_i
  • Para visualizar la tabla solo debe ejecutar el nombre de la variable
## [1]  3  9 17  7  5  3
  • Para calcular las frecuencias relativas utilizar prop.table y guardar en la variable f_i
  • Añader la fila de las frecuencias relativas a la variable n_i
##      n_i        f_i
## [1,]   3 0.06818182
## [2,]   9 0.20454545
## [3,]  17 0.38636364
## [4,]   7 0.15909091
## [5,]   5 0.11363636
## [6,]   3 0.06818182
  • Calcular la frecuencias absoluta acumulada y la frecuencia relativa acumulada
  • Crear una tabla de frecuencias
##       LI  LS n_i        f_i N_i        F_i
## [1,] 2.6 3.4   3 0.06818182   3 0.06818182
## [2,] 3.4 4.2   9 0.20454545  12 0.27272727
## [3,] 4.2 5.0  17 0.38636364  29 0.65909091
## [4,] 5.0 5.8   7 0.15909091  36 0.81818182
## [5,] 5.8 6.6   5 0.11363636  41 0.93181818
## [6,] 6.6 7.4   3 0.06818182  44 1.00000000