Agrupacion de Datos

set.seed(1000)
dist1 <- sample(70:100, size = 50, replace=TRUE)

Identificacion de Datos

muestra <- c(18, 19, 20, 24, 26, 28, 18, 19, 23, 16, 21, 30, 23, 27, 29, 15, 18, 26)
muestra
##  [1] 18 19 20 24 26 28 18 19 23 16 21 30 23 27 29 15 18 26

Ordenar datos y mostrarlos

muestraord <- sort(muestra)
muestraord
##  [1] 15 16 18 18 18 19 19 20 21 23 23 24 26 26 27 28 29 30

###Se buscara el numero de elementos n, valores minimos, maximos, rango y amplitud de rango.

n <- length(muestra)
n
## [1] 18
max(muestra)
## [1] 30
min(muestra)
## [1] 15
rango <- range(muestra)
rango
## [1] 15 30
amplitud <- diff(rango)

Determinar numero de intervalos iguales a 5

nointervalos <- 5   # Número de intervalos que se desea
rangointervalos <- amplitud / nointervalos
rangointervalos
## [1] 3
print(paste("Los valores de cada grupos van ..."," de ", rangointervalos, " en  ", rangointervalos, " a partir de :", min(muestra)))
## [1] "Los valores de cada grupos van ...  de  3  en   3  a partir de : 15"

Tabla de frecuencia de datos agrupados

print(paste("Los valores de cada grupos van ..."," de ", rangointervalos, " en  ", rangointervalos, " a partir de :", min(muestra)))
## [1] "Los valores de cada grupos van ...  de  3  en   3  a partir de : 15"

Grafica de frecuencias

tabla.intervalos <- transform(table(cut(muestra, breaks = 5)))
tabla.intervalos
##      Var1 Freq
## 1 (15,18]    5
## 2 (18,21]    4
## 3 (21,24]    3
## 4 (24,27]    3
## 5 (27,30]    3
plot(tabla.intervalos)

### Sturges

1 + 3.3222* (log10(n))
## [1] 5.170266
nointervalos <- nclass.Sturges(muestra)
nointervalos
## [1] 6
cut(muestra, breaks = nointervalos)
##  [1] (17.5,20] (17.5,20] (17.5,20] (22.5,25] (25,27.5] (27.5,30] (17.5,20]
##  [8] (17.5,20] (22.5,25] (15,17.5] (20,22.5] (27.5,30] (22.5,25] (25,27.5]
## [15] (27.5,30] (15,17.5] (17.5,20] (25,27.5]
## Levels: (15,17.5] (17.5,20] (20,22.5] (22.5,25] (25,27.5] (27.5,30]
tabla.intervalos <- transform(table(cut(muestra, breaks = nointervalos)))

Grafica de pastel

pie(tabla.intervalos$Freq, labels = paste(tabla.intervalos$Var1, " - ", tabla.intervalos$Freq), main = "¿De cuál intervalo hay más y menos elementos?. Sturges")

Interpretación

Se genero una semilla con una muestra aleatoria de mil datos aproximadamente con el proposito familiarizarnos con las funciones de datos agrupados por ello una muestra aletaoria que parece sin proposito pues los datos no cuentan con un proposito especifico como tal ademas de mostrarnos la forma de agrupar datos, y los resultados que pueden arrojar en distintos metodos de analizis ya sea tablas, graficas entre otros.