Datos agrupados

Objetivo: Generar datos agrupados, tabla de frecuencia y gr?fica de los datos agrupados

Proceso:

* Identificar y mostrar datos de la muestra

* Ordenar datos y mostrar

* Encontrar n?mero de elementos n, valores m?nimos y m?ximos , rango y amplitud del rango de la muestra

* Determianr n?mero de int?rvalos igual a 5

* Identificar rango de cada int?rvalo mediante: VALOR MINIMO / INTERVALOS

* Mostrar tabla de frecuencia de datos agrupados

* Plot o graficar tabla de ffrecuencia

Identificar datos de la muestra

muestra <- c(18, 19, 20, 24, 26, 28, 18, 19, 23, 16, 21, 30, 23, 27, 29, 15, 18, 26)
muestra
##  [1] 18 19 20 24 26 28 18 19 23 16 21 30 23 27 29 15 18 26

* Ordenar datos y mostrar

muestraord <- sort(muestra)
muestraord
##  [1] 15 16 18 18 18 19 19 20 21 23 23 24 26 26 27 28 29 30

Encontrar n?mero de elementos n, valores m?ximos y m?ximos , rango y amplitud del rango de la muestra

n <- length(muestra)
n
## [1] 18
max(muestra)
## [1] 30
min(muestra)
## [1] 15
rango <- range(muestra) # Valores mínimo y máximo
rango
## [1] 15 30
amplitud <- diff(rango) # amplitud del rango. Tambien es max(muestra) - min(muestra)
amplitud
## [1] 15

FORMA HABITUAL PARA AGRUPAR DATOS

?Cu?ntos int?rvalos se quiere tener? ?Cu?ntos grupos?]

* Determinar n?mero de intervalos igual a 5

# F?rmula : valor m?nimo / intervalos
nointervalos <- 5   # N?mero de intervalos que se desea
rangointervalos <- amplitud / nointervalos
rangointervalos
## [1] 3
# paste significa concatenar
print(paste("Los valores de cada grupos van ..."," de ", rangointervalos, " en  ", rangointervalos, " a partir de :", min(muestra)))
## [1] "Los valores de cada grupos van ...  de  3  en   3  a partir de : 15"

Mostrar tabla de frecuencia de datos agrupados

Se empieza del valor menor para evitar errores de agrupamiento

tabla.intervalos <- transform(table(cut(muestra, breaks = 5)))
tabla.intervalos
##      Var1 Freq
## 1 (15,18]    5
## 2 (18,21]    4
## 3 (21,24]    3
## 4 (24,27]    3
## 5 (27,30]    3

Plot o graficar tabla de frecuencia

plot(tabla.intervalos, main = "?De cu?l intervalo hay m?s y menos elementos?")

REGLA DE STURGES.

?De manera mantemática sugiere los int?rvalos y las amplitudes de cada intervalo

?Cu?les int?rvalos genra? ?cual es la amplitud de cada int?rvalo?]

F?rmula: K=1+3.322(log N) /* Logaritmo de base 10 */

1 + 3.3222* (log10(n)) ## Redondeado hacia arriba entonces sale 6 igual que siguiente
## [1] 5.170266
nointervalos <- nclass.Sturges(muestra) # igual al numero de intervalos aqui sale 6
nointervalos
## [1] 6
cut(muestra, breaks = nointervalos) #Cortes de cada int?rvalo
##  [1] (17.5,20] (17.5,20] (17.5,20] (22.5,25] (25,27.5] (27.5,30] (17.5,20]
##  [8] (17.5,20] (22.5,25] (15,17.5] (20,22.5] (27.5,30] (22.5,25] (25,27.5]
## [15] (27.5,30] (15,17.5] (17.5,20] (25,27.5]
## Levels: (15,17.5] (17.5,20] (20,22.5] (22.5,25] (25,27.5] (27.5,30]
tabla.intervalos <- transform(table(cut(muestra, breaks = nointervalos))) # son 6
tabla.intervalos
##        Var1 Freq
## 1 (15,17.5]    2
## 2 (17.5,20]    6
## 3 (20,22.5]    1
## 4 (22.5,25]    3
## 5 (25,27.5]    3
## 6 (27.5,30]    3
pie(tabla.intervalos$Freq, labels = paste(tabla.intervalos$Var1, " - ", tabla.intervalos$Freq), main = "?De cu?l intervalo hay m?s y menos elementos?. Sturges")