Tablas de frecuencia e histograma

La distribución de frecuencia es la representación estructurada, en forma de tabla o gráfica, de toda la información que se ha recogido sobre la variable que se estudia.La idea que se persigue en la estadística descriptiva es dar una estructura a los datos que permita al lector identificar sus aspectos más importantes.

A continuación se observará un proceso de organización creciente que permite distinguir mejor las características más sobresalientes de los datos numéricos. Generalmente cuando se recogen los datos de un estudio no tienen una estructura de presentación definida. En esta representación no hay mucho que se pueda decir de los datos.

Ejercicio 1

Puntuaciones en un examen de estadística de una clase de 50 estudiantes

setwd("~/E1LMV11")

Tabla 1: Calificaciones de estudiantes

Datos ordenados

Después se puede crear una tabla de datos ordenados donde se colocan los datos en orden (de menor a mayor o viceversa). Este primer orden permite identificar los valores extremos, pero no ofrece mucha más información.

setwd("~/E1LMV11")

Tabla 2: Datos ordenados

TABLA DE FRECUENCIAS

Número de intervalos

El número de intervalos depende del número total de observaciones. No debe haber más de 15 ni menos de 5. Si hay muy pocos se pierde mucha información. Si hay muchos no se ven las características más importantes. Pueden usarse algunas de las siguientes reglas además de la ya establecida:

setwd("~/E1LMV11")

Fórmulas

Límite de frecuencias

El alcance va de 99 a 16 y vamos a considerar que el número de intervalos esta dado por la fórmula 1+3.3log(n). Sustituyendo en esta fórmula se obtiene: 1+3.3log(50) =6.6 y se redondea al siguiente entero que es 7. Por lo tanto usaremos 7 clases, por lo cual el ancho será igual a (99-16)/7 = 83/7 = 11.85 , el cual se redondea a 12.

setwd("~/E1LMV11")

Tabla de límites de frecuencias

Asignación 1

  1. Los siguientes 30 datos corresponden a determinaciones de la emisión diarias de óxido de azufre (toneladas) de una planta industrial.
  1. Construya una tabla de frecuencias.
setwd("~/E1LMV11")

Tabla 1. Toneladas diarias de óxido de azufre

Datos ordenados

Después de obtener los datos, se crea una tabla donde los datos se encuentren de manera ordenada; de esta forma es mas sencillo identificar los valores extremos.

setwd("~/E1LMV11")

Tabla 2. Datos ordenados

Tabla de frecuencias

setwd("~/E1LMV11")

Tabla de Frecuencias