Generamos, y ordenamos el conjunto de datos.
datos = sample(70:100, 1000, replace = TRUE)
orden = sort(datos)
orden
## [1] 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70
## [19] 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70
## [37] 70 70 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71
## [55] 71 71 71 71 71 71 71 71 71 71 72 72 72 72 72 72 72 72
## [73] 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 73 73 73
## [91] 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73
## [109] 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 74 74 74
## [127] 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 75 75
## [145] 75 75 75 75 75 75 75 75 75 75 75 75 75 75 75 75 75 75
## [163] 75 75 75 75 75 75 75 75 75 75 75 76 76 76 76 76 76 76
## [181] 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76
## [199] 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76
## [217] 76 76 76 76 76 77 77 77 77 77 77 77 77 77 77 77 77 77
## [235] 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77
## [253] 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78
## [271] 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 79 79
## [289] 79 79 79 79 79 79 79 79 79 79 79 79 79 79 79 79 79 79
## [307] 79 79 79 79 79 79 79 79 79 79 79 79 79 79 80 80 80 80
## [325] 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80
## [343] 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 81 81 81
## [361] 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81
## [379] 81 81 81 81 81 81 81 81 81 82 82 82 82 82 82 82 82 82
## [397] 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 83
## [415] 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83
## [433] 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83
## [451] 83 83 83 83 83 84 84 84 84 84 84 84 84 84 84 84 84 84
## [469] 84 84 84 84 84 84 84 84 84 84 84 84 84 84 84 84 84 84
## [487] 84 84 84 84 85 85 85 85 85 85 85 85 85 85 85 85 85 85
## [505] 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85
## [523] 85 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86
## [541] 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86
## [559] 86 86 86 86 87 87 87 87 87 87 87 87 87 87 87 87 87 87
## [577] 87 87 87 87 87 87 87 87 87 87 87 87 87 87 87 87 87 87
## [595] 87 87 87 87 87 88 88 88 88 88 88 88 88 88 88 88 88 88
## [613] 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88
## [631] 88 88 88 89 89 89 89 89 89 89 89 89 89 89 89 89 89 89
## [649] 89 89 89 89 89 89 89 89 89 90 90 90 90 90 90 90 90 90
## [667] 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90
## [685] 90 90 90 90 90 90 91 91 91 91 91 91 91 91 91 91 91 91
## [703] 91 91 91 91 91 91 91 91 91 91 91 91 91 92 92 92 92 92
## [721] 92 92 92 92 92 92 92 92 92 92 92 92 92 92 92 92 92 92
## [739] 92 92 92 92 92 92 92 93 93 93 93 93 93 93 93 93 93 93
## [757] 93 93 93 93 93 93 93 93 93 93 93 93 93 93 93 93 93 93
## [775] 93 93 93 93 93 93 94 94 94 94 94 94 94 94 94 94 94 94
## [793] 94 94 94 94 94 94 94 94 94 94 94 94 94 94 94 94 94 94
## [811] 94 94 94 94 94 94 94 94 95 95 95 95 95 95 95 95 95 95
## [829] 95 95 95 95 95 95 95 95 95 95 95 95 95 95 95 96 96 96
## [847] 96 96 96 96 96 96 96 96 96 96 96 96 96 96 96 96 96 96
## [865] 96 96 96 96 96 96 96 96 96 96 96 96 97 97 97 97 97 97
## [883] 97 97 97 97 97 97 97 97 97 97 97 97 97 97 97 97 97 97
## [901] 97 97 97 97 97 97 97 97 97 97 98 98 98 98 98 98 98 98
## [919] 98 98 98 98 98 98 98 98 98 98 98 98 98 98 98 98 98 98
## [937] 98 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99
## [955] 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99
## [973] 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100
## [991] 100 100 100 100 100 100 100 100 100 100
Localizamos el número de registros, el valor máximo, el valor mínimo, y el rango del conjunto.
registros = length(datos)
registros
## [1] 1000
maximo = max(datos)
maximo
## [1] 100
mini = min(datos)
mini
## [1] 70
rango = maximo - mini
rango
## [1] 30
Determinar la aplitud de los 5 intérvalos en los que se dividirá el conjunto.
largoint = rango/5
largoint
## [1] 6
Creamos una tabla con los intervalos. Se empieza con el valor más pequeño para evitar problemas.
tabla.intervalos <- transform(table(cut(datos, breaks = 5)))
tabla.intervalos
## Var1 Freq
## 1 (70,76] 221
## 2 (76,82] 192
## 3 (82,88] 220
## 4 (88,94] 185
## 5 (94,100] 182
Creamos un histograma con los intervalos y sus frecuencias.
plot(tabla.intervalos, main = "Frecuencias de cada intervalo.")

Regla de Sturges
Para determinar intervalos recomendados y su amplitud.
sturg = 1 + 3.3222* (log10(registros))
sturg
## [1] 10.9666
nointer = nclass.Sturges(datos)
nointer
## [1] 11
Tabla de intervalos recomendados por la regla de Sturges.
tabla.intervalos <- transform(table(cut(datos, breaks = nointer)))
tabla.intervalos
## Var1 Freq
## 1 (70,72.7] 87
## 2 (72.7,75.5] 86
## 3 (75.5,78.2] 113
## 4 (78.2,80.9] 71
## 5 (80.9,83.6] 98
## 6 (83.6,86.4] 107
## 7 (86.4,89.1] 95
## 8 (89.1,91.8] 58
## 9 (91.8,94.5] 103
## 10 (94.5,97.3] 92
## 11 (97.3,100] 90
Graficamos los intervalos generados por la Regla de Sturges en una gráfica de pastel.
pie(tabla.intervalos$Freq, labels = paste(tabla.intervalos$Var1, " - ", tabla.intervalos$Freq), main = "Frecuencias de cada intervalo de la regla de Sturges.")

Descripción de la práctica
En esta práctica se generaró aleatoriamente un conjunto de 1000 datos comprendidos por valores entre 70 a 100, del cual se obtuvieron sus valores máximo, mínimo, y el valor de su rango. Después, se dividió en manualmente en 5 intervalos para además revisar la frecuencia de cada uno de estos. Acto seguido, se realizó una gráfica a forma de histograma de dichos intervalos.
Después, se realizó lo mismo pero esta vez tomando en cuenta la recomendación de intervalos sugerida por la Regla de Sturges. Como resultado, se crearon 10 intervalos automáticamente generados por R, para luego ser graficados en una gráfica de pastel.
Esta práctica, además de reforzar los conocimientos en los comandos de la herramienta RStudio, se repasaron algunos conceptos desarrollados en la clase de Probabilidad y Estadística, tratándose de los valores máximos, mínimos e intervalos de un conjunto. Además, se vio y aplicó la fórmula de la Regla de Sturges para sugerir una cantidad adecuada de intervalos en base a la cantidad de datos que conforman el conjunto.