Se descarga y se integra la librería modeest para poder determinar la moda de un conjunto.
library(modeest)
Se generan los conjuntos de datos y luego se muestran.
dist1 <- sample(70:100, size = 100, replace=TRUE)
dist2 <- sample(70:100, size = 100, replace=TRUE)
dist3 <- sample(70:100, size = 100, replace=TRUE)
dist1
## [1] 77 90 87 74 74 100 84 88 91 73 82 100 71 85 93 76 83 74
## [19] 73 71 91 71 83 77 73 89 96 94 86 81 88 100 98 83 88 90
## [37] 97 71 82 76 78 98 91 70 75 96 83 88 97 100 70 84 100 70
## [55] 92 96 85 77 82 74 94 77 96 89 90 70 99 76 76 96 98 74
## [73] 100 90 83 80 79 90 90 91 84 91 82 77 95 92 78 89 100 98
## [91] 75 92 97 81 92 98 79 74 84 77
dist2
## [1] 94 94 75 83 85 98 83 90 85 86 80 88 84 87 87 99 91 71
## [19] 90 82 85 92 92 86 77 91 79 85 77 77 76 71 73 98 84 80
## [37] 95 98 73 80 85 92 93 89 74 77 77 73 94 97 73 99 72 77
## [55] 100 91 94 76 72 75 86 73 70 91 87 79 94 99 72 99 76 85
## [73] 99 94 87 76 73 83 92 100 87 85 70 71 100 100 97 75 83 97
## [91] 84 75 98 84 77 94 72 93 95 89
dist3
## [1] 71 85 93 73 88 81 77 79 73 100 83 75 80 74 90 94 88 76
## [19] 78 93 96 89 80 84 74 96 98 73 92 94 84 91 98 71 99 87
## [37] 99 79 78 76 70 85 77 98 78 77 88 98 81 90 76 92 76 87
## [55] 88 97 84 94 94 90 72 92 75 82 91 88 78 92 82 86 82 71
## [73] 78 70 77 80 90 95 95 81 71 76 74 80 90 88 72 88 83 99
## [91] 85 72 99 80 94 75 92 77 91 74
Histogramas de cada distribución.
histogram1 = hist(dist1)

histogram1
## $breaks
## [1] 70 75 80 85 90 95 100
##
## $counts
## [1] 19 15 17 15 13 21
##
## $density
## [1] 0.038 0.030 0.034 0.030 0.026 0.042
##
## $mids
## [1] 72.5 77.5 82.5 87.5 92.5 97.5
##
## $xname
## [1] "dist1"
##
## $equidist
## [1] TRUE
##
## attr(,"class")
## [1] "histogram"
histogram2 = hist(dist2)

histogram2
## $breaks
## [1] 70 75 80 85 90 95 100
##
## $counts
## [1] 20 16 16 13 19 16
##
## $density
## [1] 0.040 0.032 0.032 0.026 0.038 0.032
##
## $mids
## [1] 72.5 77.5 82.5 87.5 92.5 97.5
##
## $xname
## [1] "dist2"
##
## $equidist
## [1] TRUE
##
## attr(,"class")
## [1] "histogram"
histogram3 = hist(dist3)

histogram3
## $breaks
## [1] 70 75 80 85 90 95 100
##
## $counts
## [1] 19 22 14 16 17 12
##
## $density
## [1] 0.038 0.044 0.028 0.032 0.034 0.024
##
## $mids
## [1] 72.5 77.5 82.5 87.5 92.5 97.5
##
## $xname
## [1] "dist3"
##
## $equidist
## [1] TRUE
##
## attr(,"class")
## [1] "histogram"
Cuartiles de cada distribución.
cuartiles1 = quantile(dist1)
cuartiles1
## 0% 25% 50% 75% 100%
## 70.00 77.00 85.00 92.25 100.00
cuartiles2 = quantile(dist2)
cuartiles2
## 0% 25% 50% 75% 100%
## 70.00 77.00 85.00 93.25 100.00
cuartiles3 = quantile(dist3)
cuartiles3
## 0% 25% 50% 75% 100%
## 70 77 84 92 100
Rango de cada distribución.
rango1 = max(dist1)-min(dist1)
rango1
## [1] 30
rango2 = max(dist2)-min(dist2)
rango2
## [1] 30
rango3 = max(dist3)-min(dist3)
rango3
## [1] 30
Rango intercuartílico de cada distribución.
rinterq1 = IQR(dist1)
rinterq1
## [1] 15.25
rinterq2 = IQR(dist2)
rinterq2
## [1] 16.25
rinterq3 = IQR(dist3)
rinterq3
## [1] 15
Varianza de cada distribución.
var1 = var(dist1)
var1
## [1] 87.02818
var2 = var(dist2)
var2
## [1] 84.63798
var3 = var(dist3)
var3
## [1] 76.01253
Desviación estándar de cada distribución.
desv1 = sd(dist1)
desv1
## [1] 9.32889
desv2 = sd(dist2)
desv2
## [1] 9.19989
desv2 = sd(dist2)
desv2
## [1] 9.19989
Coeficiente de variación para cada distribución.
coef1 = (desv1/media1)*100
coef1
## [1] 10.92504
coef2 = (desv1/media1)*100
coef2
## [1] 10.92504
coef3 = (desv1/media1)*100
coef3
## [1] 10.92504
Diagramas de dispersión de cada distribución.
disp1 = plot(dist1, col = "red")

disp1
## NULL
disp2 = plot(dist2, col = "blue")

disp2
## NULL
disp3 = plot(dist3, col = "green")

disp3
## NULL
Descripción de la práctica
En esta práctica se generaron aleatoriamente 3 conjuntos diferentes de 100 datos similares cada uno, de los cuales se obtuvieron sus correspondientes medidas de tendencia central y de dispersión, y de forma consiguiente sus coeficientes de variación, para poder analizarlos y determinar cuál de ellos es el que tiene mayor variabilidad y heterogeneidad. Además, de también generar sus diagramas de dispersión e histogramas para poder representar su dispersión y frecuencia de manera gráfica.
Esta práctica, además de reforzar los conocimientos en los comandos de la herramienta RStudio, se aplicaron directamente varios de los conceptos desarrollados en la clase de Probabilidad y Estadística, particularmente las Medidas de Tendencia Central, además de las Medidas de Dispersión de un conjunto de datos.