Generar datos

set.seed(1000)

dist1 <- sample(70:100, size = 50, replace=TRUE)
dist2 <- sample(70:100, size = 50, replace=TRUE)
dist3 <- sample(70:100, size = 50, replace=TRUE)

dist1
##  [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95 95 97 92 87 74 99 88
## [26] 85 95 98 79 78 95 76 93 81 86 91 93 97 96 77 88 72 96 75 76 82 91 75 76 85
dist2
##  [1]  97  77  72  90  87  82  99  87  85  86  86  72  82  83  77 100  77  80  93
## [20]  96  81  81  95  79  80  93  95  85  84  81  75  78  91  90  80  90 100  80
## [39]  79  79  70  96  94  78  76  83 100  94  86  71
dist3
##  [1]  76  76  86  72  94  83  71  70  88  90  75  77  89 100  73  78  91  92  83
## [20]  94  85  97  74  88  94  95 100  88 100 100  98  90  72  86  93  78  91  97
## [39]  78  99  74  85  73  78  75  97  81  94  80  88

Media, mediana y moda de cada distribución

Medias de cada distribución

mean(dist1)
## [1] 85.94
mean(dist2)
## [1] 85.04
mean(dist3)
## [1] 85.72

Mediana de cada distribución

median(dist1)
## [1] 87
median(dist2)
## [1] 83.5
median(dist3)
## [1] 87

Moda de cada distribución

mode(dist1)
## [1] "numeric"
mode(dist2)
## [1] "numeric"
mode(dist3)
## [1] "numeric"

Histogramas

hist(dist1)

hist(dist2)

hist(dist3)

### Cuartiles

quantile (dist1, prob = c(0.25, 0.50, 0.75))
##   25%   50%   75% 
## 77.25 87.00 94.50
quantile (dist2, prob = c(0.25, 0.50, 0.75))
##  25%  50%  75% 
## 79.0 83.5 92.5
quantile (dist3, prob = c(0.25, 0.50, 0.75))
##   25%   50%   75% 
## 77.25 87.00 94.00

Rango de las distribuciones

range(dist1)
## [1] 70 99
range(dist2)
## [1]  70 100
range(dist3)
## [1]  70 100

Rango intercuartilico

IQR(dist1)
## [1] 17.25
IQR(dist2)
## [1] 13.5
IQR(dist3)
## [1] 16.75

Varianza de las distribuciones

var(dist1)
## [1] 79.73102
var(dist2)
## [1] 69.01878
var(dist3)
## [1] 88.65469

Desviación estandar

sd(dist1)
## [1] 8.929223
sd(dist2)
## [1] 8.307754
sd(dist3)
## [1] 9.415662

Coeficiente de variación

sd(dist1) / mean(dist1) * 100
## [1] 10.39007
sd(dist2) / mean(dist2) * 100
## [1] 9.769231
sd(dist3) / mean(dist3) * 100
## [1] 10.98421

¿Cuál distribución tiene mayor variabilidad? ¿Por qué?

La distribución con menos variabilidad es la segunda, ya que al tener datos en un rango más cerrado se alejan menos de su media.

Diagramas de dispersión

plot(dist1, col = "red")

plot(dist2, col = "blue")

plot(dist3, col = "green")

Interpretación

Estos datos podrían representar, por ejemplo, las calificaciones de los alumnos de tres salones distintos que estuvieron en un rango de entre 70 y 100. Imaginando que fuera este el significado de los datos, podríamos saber cuál es la calificación más recurrente en cada uno de estos grupos, así como también que tanto se salen de un rango tantos alumnos y hacia qué lado se inclinan estos.

Siguiendo con la interpretación anterior, esta información podría ayudar en saber a qué salón se le debe de prestar más atención para mejorar sus calificaciones o en que salón se pueden enfocar para concursos de intelecto en ciertas áreas.