Una distribución es el nombre que se da a cualquier conjunto organizado de datos. Esta organización se puede hacer por medio de una tabla o de una gráfica. Cuando en estadÃstica se habla de cómo los datos están distribuidos en una muestra o en una población nos referimos al conjunto de datos organizados en una tabla o en una gráfica. La idea que se persigue en la estadÃstica descriptiva es dar una estructura a los datos que permita al lector identificar sus aspectos más importantes.
A continuación se observará un proceso de organización creciente que permite distinguir mejor las caracterÃsticas más sobresalientes de los datos numéricos. Generalmente cuando se recogen los datos de un estudio no tienen una estructura de presentación definida. En esta representación no hay mucho que se pueda decir de los datos.
Puntuaciones en un examen de estadÃstica de una clase de 50 estudiantes
setwd("~/Estadistica 1")
Tablas
Tabla 1: calificaciones
Datos ordenados Después se puede crear una tabla de datos ordenados donde se colocan los datos en orden (de menor a mayor o viceversa). Este primer orden permite identificar los valores extremos, pero no ofrece mucha más información.
Tabla 2: Datos ordenados
TABLA DE FRECUENCIAS Número de intervalos El número de intervalos depende del número total de observaciones. No debe haber más de 15 ni menos de 5. Si hay muy pocos se pierde mucha información. Si hay muchos no se ven las caracterÃsticas más importantes. Pueden usarse algunas de las siguientes reglas además de la ya establecida:
TABLA DE FRECUENCIAS
El alcance va de 99 a 16 y vamos a considerar que el número de intervalos esta dado por la fórmula 1+3.3log(n). Sustituyendo en esta fórmula se obtiene: 1+3.3log(50) =6.6 y se redondea al siguiente entero que es 7. Por lo tanto usaremos 7 clases, por lo cual el ancho será igual a (99-16)/7 = 83/7 = 11.85 , el cual se redondea a 12.
Tablas
Asignación 1
Los siguientes 30 datos corresponden a determinaciones de la emisión diarias de óxido de azufre (toneladas) de una planta industrial.
Datos
a)Construya una tabla de frecuencias y un histograma de frecuencias usando la regla #intervalos = 1+3.3log(n) Grafique un polÃgono para las frecuencia relativas. b)Calcule la media, la mediana y la moda y diga cuál de estas es la que mejor representa a los datos según el histograma. c)Calcule e interprete la varianza y la desviación estándar 1+3.3log(30) = 5.8 se redondea a 6 ancho: (24.6 - 14.2)/7 = 1.5 el cual se redondea a 2
Tabla de frecuencias