Una distribución es el nombre que se da a cualquier conjunto organizado de datos. Esta organización se puede hacer por medio de una tabla o de una gráfica. Cuando en estadística se habla de cómo los datos están distribuidos en una muestra o en una población nos referimos al conjunto de datos organizados en una tabla o en una gráfica. La idea que se persigue en la estadística descriptiva es dar una estructura a los datos que permita al lector identificar sus aspectos más importantes.
A continuación se observará un proceso de organización creciente que permite distinguir mejor las características más sobresalientes de los datos numéricos. Generalmente cuando se recogen los datos de un estudio no tienen una estructura de presentación definida. En esta representación no hay mucho que se pueda decir de los datos.
Puntuaciones en un examen de estadística de una clase de 50 estudiantes
Tabla 1.1: calificaciones de estudiantes
Después se puede crear una tabla de datos ordenados donde se colocan los datos en orden (de menor a mayor o viceversa). Este primer orden permite identificar los valores extremos, pero no ofrece mucha más información.
Tabla 1.2: Datos ordenados
El número de intervalos depende del número total de observaciones. No debe haber más de 15 ni menos de 5. Si hay muy pocos se pierde mucha información. Si hay muchos no se ven las características más importantes. Pueden usarse algunas de las siguientes reglas además de la ya establecida:
Formulas de intervalos
30 datos corresponden a determinaciones de la emisión diarias de óxido de azufre (toneladas) de una planta industrial.
Tabla 2.1: Datos Ordenados
Tabla de frecuencias y calculo de intervalos
Tabla 2.3: Tabla de frecuencias
Histograma de frecuencias
Tabla 2.3: Histograma de frecuancias