Se descarga y se integra la librería modeest para poder determinar la moda de un conjunto.

library(modeest)

Se generan los conjuntos de datos y luego se muestran.

dist1 <- sample(70:100, size = 100, replace=TRUE)
dist2 <- sample(70:100, size = 100, replace=TRUE)
dist3 <- sample(70:100, size = 100, replace=TRUE)

dist1
##   [1]  77  90  87  74  74 100  84  88  91  73  82 100  71  85  93  76  83  74
##  [19]  73  71  91  71  83  77  73  89  96  94  86  81  88 100  98  83  88  90
##  [37]  97  71  82  76  78  98  91  70  75  96  83  88  97 100  70  84 100  70
##  [55]  92  96  85  77  82  74  94  77  96  89  90  70  99  76  76  96  98  74
##  [73] 100  90  83  80  79  90  90  91  84  91  82  77  95  92  78  89 100  98
##  [91]  75  92  97  81  92  98  79  74  84  77
dist2
##   [1]  94  94  75  83  85  98  83  90  85  86  80  88  84  87  87  99  91  71
##  [19]  90  82  85  92  92  86  77  91  79  85  77  77  76  71  73  98  84  80
##  [37]  95  98  73  80  85  92  93  89  74  77  77  73  94  97  73  99  72  77
##  [55] 100  91  94  76  72  75  86  73  70  91  87  79  94  99  72  99  76  85
##  [73]  99  94  87  76  73  83  92 100  87  85  70  71 100 100  97  75  83  97
##  [91]  84  75  98  84  77  94  72  93  95  89
dist3
##   [1]  71  85  93  73  88  81  77  79  73 100  83  75  80  74  90  94  88  76
##  [19]  78  93  96  89  80  84  74  96  98  73  92  94  84  91  98  71  99  87
##  [37]  99  79  78  76  70  85  77  98  78  77  88  98  81  90  76  92  76  87
##  [55]  88  97  84  94  94  90  72  92  75  82  91  88  78  92  82  86  82  71
##  [73]  78  70  77  80  90  95  95  81  71  76  74  80  90  88  72  88  83  99
##  [91]  85  72  99  80  94  75  92  77  91  74

Media, mediana y moda de cada distribución.

media1 = mean(dist1)
median1 = median(dist1)
moda1 = mfv(dist1)

media1
## [1] 85.39
median1
## [1] 85
moda1
## [1] 100
media2 = mean(dist2)
median2 = median(dist2)
moda2 = mfv(dist2)

media2
## [1] 85.22
median2
## [1] 85
moda2
## [1] 77 85 94
media3 = mean(dist3)
median3 = median(dist3)
moda3 = mfv(dist3)

media3
## [1] 84.26
median3
## [1] 84
moda3
## [1] 88

Histogramas de cada distribución.

histogram1 = hist(dist1)

histogram1
## $breaks
## [1]  70  75  80  85  90  95 100
## 
## $counts
## [1] 19 15 17 15 13 21
## 
## $density
## [1] 0.038 0.030 0.034 0.030 0.026 0.042
## 
## $mids
## [1] 72.5 77.5 82.5 87.5 92.5 97.5
## 
## $xname
## [1] "dist1"
## 
## $equidist
## [1] TRUE
## 
## attr(,"class")
## [1] "histogram"
histogram2 = hist(dist2)

histogram2
## $breaks
## [1]  70  75  80  85  90  95 100
## 
## $counts
## [1] 20 16 16 13 19 16
## 
## $density
## [1] 0.040 0.032 0.032 0.026 0.038 0.032
## 
## $mids
## [1] 72.5 77.5 82.5 87.5 92.5 97.5
## 
## $xname
## [1] "dist2"
## 
## $equidist
## [1] TRUE
## 
## attr(,"class")
## [1] "histogram"
histogram3 = hist(dist3)

histogram3
## $breaks
## [1]  70  75  80  85  90  95 100
## 
## $counts
## [1] 19 22 14 16 17 12
## 
## $density
## [1] 0.038 0.044 0.028 0.032 0.034 0.024
## 
## $mids
## [1] 72.5 77.5 82.5 87.5 92.5 97.5
## 
## $xname
## [1] "dist3"
## 
## $equidist
## [1] TRUE
## 
## attr(,"class")
## [1] "histogram"

Cuartiles de cada distribución.

cuartiles1 = quantile(dist1)
cuartiles1
##     0%    25%    50%    75%   100% 
##  70.00  77.00  85.00  92.25 100.00
cuartiles2 = quantile(dist2)
cuartiles2
##     0%    25%    50%    75%   100% 
##  70.00  77.00  85.00  93.25 100.00
cuartiles3 = quantile(dist3)
cuartiles3
##   0%  25%  50%  75% 100% 
##   70   77   84   92  100

Rango de cada distribución.

rango1 = max(dist1)-min(dist1)
rango1
## [1] 30
rango2 = max(dist2)-min(dist2)
rango2
## [1] 30
rango3 = max(dist3)-min(dist3)
rango3
## [1] 30

Rango intercuartílico de cada distribución.

rinterq1 = IQR(dist1)
rinterq1
## [1] 15.25
rinterq2 = IQR(dist2)
rinterq2
## [1] 16.25
rinterq3 = IQR(dist3)
rinterq3
## [1] 15

Varianza de cada distribución.

var1 = var(dist1)
var1
## [1] 87.02818
var2 = var(dist2)
var2
## [1] 84.63798
var3 = var(dist3)
var3
## [1] 76.01253

Desviación estándar de cada distribución.

desv1 = sd(dist1)
desv1
## [1] 9.32889
desv2 = sd(dist2)
desv2
## [1] 9.19989
desv2 = sd(dist2)
desv2
## [1] 9.19989

Coeficiente de variación para cada distribución.

coef1 = (desv1/media1)*100
coef1
## [1] 10.92504
coef2 = (desv1/media1)*100
coef2
## [1] 10.92504
coef3 = (desv1/media1)*100
coef3
## [1] 10.92504

Diagramas de dispersión de cada distribución.

disp1 = plot(dist1, col = "red")

disp1
## NULL
disp2 = plot(dist2, col = "blue")

disp2
## NULL
disp3 = plot(dist3, col = "green")

disp3
## NULL

Descripción de la práctica

En esta práctica se generaron aleatoriamente 3 conjuntos diferentes de 100 datos similares cada uno, de los cuales se obtuvieron sus correspondientes medidas de tendencia central y de dispersión, y de forma consiguiente sus coeficientes de variación, para poder analizarlos y determinar cuál de ellos es el que tiene mayor variabilidad y heterogeneidad. Además, de también generar sus diagramas de dispersión e histogramas para poder representar su dispersión y frecuencia de manera gráfica.

Esta práctica, además de reforzar los conocimientos en los comandos de la herramienta RStudio, se aplicaron directamente varios de los conceptos desarrollados en la clase de Probabilidad y Estadística, particularmente las Medidas de Tendencia Central, además de las Medidas de Dispersión de un conjunto de datos.