###Agrupacion de Datos
#Se generan un conjunto de 1000 datos con valores entre 70 y 100.
set.seed(1000)
dist1 <- sample(70:100, size = 50, replace=TRUE)
##Identificacion de Datos
muestra <- c(18, 19, 20, 24, 26, 28, 18, 19, 23, 16, 21, 30, 23, 27, 29, 15, 18, 26)
muestra
## [1] 18 19 20 24 26 28 18 19 23 16 21 30 23 27 29 15 18 26
##Ordenar datos y mostrarlos
muestraord <- sort(muestra)
muestraord
## [1] 15 16 18 18 18 19 19 20 21 23 23 24 26 26 27 28 29 30
##Se buscara el numero de elementos n, valores minimos, maximos, rango y amplitud de rango.
#Numero de elementos
n <- length(muestra)
n
## [1] 18
#Maximo de la muestra
max(muestra)
## [1] 30
#Minimo de la muestra
min(muestra)
## [1] 15
#Rango de la muestra
rango <- range(muestra)
rango
## [1] 15 30
#Amplitud
amplitud <- diff(rango)
###Determinar numero de intervalos iguales a 5
nointervalos <- 5 # Número de intervalos que se desea
rangointervalos <- amplitud / nointervalos
rangointervalos
## [1] 3
print(paste("Los valores de cada grupos van ..."," de ", rangointervalos, " en ", rangointervalos, " a partir de :", min(muestra)))
## [1] "Los valores de cada grupos van ... de 3 en 3 a partir de : 15"
###Tabla de frecuencia de datos agrupados
print(paste("Los valores de cada grupos van ..."," de ", rangointervalos, " en ", rangointervalos, " a partir de :", min(muestra)))
## [1] "Los valores de cada grupos van ... de 3 en 3 a partir de : 15"
##Grafica de frecuencias
tabla.intervalos <- transform(table(cut(muestra, breaks = 5)))
tabla.intervalos
## Var1 Freq
## 1 (15,18] 5
## 2 (18,21] 4
## 3 (21,24] 3
## 4 (24,27] 3
## 5 (27,30] 3
plot(tabla.intervalos)
###Sturges
1 + 3.3222* (log10(n))
## [1] 5.170266
nointervalos <- nclass.Sturges(muestra)
nointervalos
## [1] 6
cut(muestra, breaks = nointervalos)
## [1] (17.5,20] (17.5,20] (17.5,20] (22.5,25] (25,27.5] (27.5,30] (17.5,20]
## [8] (17.5,20] (22.5,25] (15,17.5] (20,22.5] (27.5,30] (22.5,25] (25,27.5]
## [15] (27.5,30] (15,17.5] (17.5,20] (25,27.5]
## Levels: (15,17.5] (17.5,20] (20,22.5] (22.5,25] (25,27.5] (27.5,30]
tabla.intervalos <- transform(table(cut(muestra, breaks = nointervalos)))
##Grafica de pastel
pie(tabla.intervalos$Freq, labels = paste(tabla.intervalos$Var1, " - ", tabla.intervalos$Freq), main = "¿De cuál intervalo hay más y menos elementos?. Sturges")
Se genero una semilla con una muestra aleatoria de mil datos aproximadamente con el proposito familiarizarnos con las funciones de datos agrupados por ello una muestra aletaoria que parece sin proposito pues los datos no cuentan con un proposito especifico como tal ademas de mostrarnos la forma de agrupar datos, y los resultados que pueden arrojar en distintos metodos de analizis ya sea tablas, graficas entre otros.