Objetivo. Generar medidas centrales, de dispersión y el Coeficiente de Variación con tres conjuntos de datos

# Generar los datos
set.seed(1000)

dist1 <- sample(70:100, size = 50, replace=TRUE)
dist2 <- sample(70:100, size = 50, replace=TRUE)
dist3 <- sample(70:100, size = 50, replace=TRUE)

dist1
##  [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95 95 97 92 87 74 99 88
## [26] 85 95 98 79 78 95 76 93 81 86 91 93 97 96 77 88 72 96 75 76 82 91 75 76 85
dist2
##  [1]  97  77  72  90  87  82  99  87  85  86  86  72  82  83  77 100  77  80  93
## [20]  96  81  81  95  79  80  93  95  85  84  81  75  78  91  90  80  90 100  80
## [39]  79  79  70  96  94  78  76  83 100  94  86  71
dist3
##  [1]  76  76  86  72  94  83  71  70  88  90  75  77  89 100  73  78  91  92  83
## [20]  94  85  97  74  88  94  95 100  88 100 100  98  90  72  86  93  78  91  97
## [39]  78  99  74  85  73  78  75  97  81  94  80  88

Media de cada distribución

# Media distribución 1
mean(dist1)
## [1] 85.94
# Media distribución 2
mean(dist2)
## [1] 85.04
# Media distrubución 3
mean(dist3)
## [1] 85.72

Mediana de cada distribución

# Mediana distribución 1
median(dist1)
## [1] 87
# Mediana distribución 2
median(dist2)
## [1] 83.5
# Mediana distribución 3
median(dist3)
## [1] 87

Moda de cada distribución

library(modes)
# Moda distribución 1
modes(dist1)
##        [,1] [,2] [,3] [,4]
## Value    75   91   95   98
## Length    4    4    4    4
# Moda distribución 2
modes(dist2)
##        [,1]
## Value    80
## Length    4
# Moda distribución 3
modes(dist3)
##        [,1] [,2] [,3] [,4]
## Value    78   88   94  100
## Length    4    4    4    4

Ordenar datos, histograma, gráfica de tallo y hoja, generar frecuencias, ordenar frecuencias

# Datos 1
sort(dist1)
##  [1] 70 72 72 73 74 75 75 75 75 76 76 76 77 78 78 79 80 81 82 82 85 85 85 86 87
## [26] 87 88 88 88 91 91 91 91 92 93 93 93 95 95 95 95 96 96 97 97 98 98 98 98 99
hist(dist1)

stem(dist1)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   7 | 02234
##   7 | 55556667889
##   8 | 0122
##   8 | 555677888
##   9 | 11112333
##   9 | 5555667788889
table(dist1)
## dist1
## 70 72 73 74 75 76 77 78 79 80 81 82 85 86 87 88 91 92 93 95 96 97 98 99 
##  1  2  1  1  4  3  1  2  1  1  1  2  3  1  2  3  4  1  3  4  2  2  4  1
sort(table(dist1))
## dist1
## 70 73 74 77 79 80 81 86 92 99 72 78 82 87 96 97 76 85 88 93 75 91 95 98 
##  1  1  1  1  1  1  1  1  1  1  2  2  2  2  2  2  3  3  3  3  4  4  4  4
# Datos 2
sort(dist2)
##  [1]  70  71  72  72  75  76  77  77  77  78  78  79  79  79  80  80  80  80  81
## [20]  81  81  82  82  83  83  84  85  85  86  86  86  87  87  90  90  90  91  93
## [39]  93  94  94  95  95  96  96  97  99 100 100 100
hist(dist2)

stem(dist2)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    7 | 0122
##    7 | 5677788999
##    8 | 000011122334
##    8 | 5566677
##    9 | 00013344
##    9 | 556679
##   10 | 000
table(dist2)
## dist2
##  70  71  72  75  76  77  78  79  80  81  82  83  84  85  86  87  90  91  93  94 
##   1   1   2   1   1   3   2   3   4   3   2   2   1   2   3   2   3   1   2   2 
##  95  96  97  99 100 
##   2   2   1   1   3
sort(table(dist2))
## dist2
##  70  71  75  76  84  91  97  99  72  78  82  83  85  87  93  94  95  96  77  79 
##   1   1   1   1   1   1   1   1   2   2   2   2   2   2   2   2   2   2   3   3 
##  81  86  90 100  80 
##   3   3   3   3   4
# Datos 3
sort(dist3)
##  [1]  70  71  72  72  73  73  74  74  75  75  76  76  77  78  78  78  78  80  81
## [20]  83  83  85  85  86  86  88  88  88  88  89  90  90  91  91  92  93  94  94
## [39]  94  94  95  97  97  97  98  99 100 100 100 100
hist(dist3)

stem(dist3)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    7 | 01223344
##    7 | 556678888
##    8 | 0133
##    8 | 556688889
##    9 | 0011234444
##    9 | 577789
##   10 | 0000
table(dist3)
## dist3
##  70  71  72  73  74  75  76  77  78  80  81  83  85  86  88  89  90  91  92  93 
##   1   1   2   2   2   2   2   1   4   1   1   2   2   2   4   1   2   2   1   1 
##  94  95  97  98  99 100 
##   4   1   3   1   1   4
sort(table(dist3))
## dist3
##  70  71  77  80  81  89  92  93  95  98  99  72  73  74  75  76  83  85  86  90 
##   1   1   1   1   1   1   1   1   1   1   1   2   2   2   2   2   2   2   2   2 
##  91  97  78  88  94 100 
##   2   3   4   4   4   4

Plots

plot(dist1, col = "red")

plot(dist2, col = "blue")

plot(dist3, col = "green")

#### Rangos

range(dist1)
## [1] 70 99
max(dist1) - min(dist1)
## [1] 29
range(dist2)
## [1]  70 100
max(dist2) - min(dist2)
## [1] 30
range(dist3)
## [1]  70 100
max(dist3) - min(dist3)
## [1] 30

####Determinar el Rango Intercuatílico de cada conjunto de datos

#Rango Intercuatilico dist1
IQR(dist1)
## [1] 17.25
#Rango Intercuatilico dist2
IQR(dist2)
## [1] 13.5
#Rango Intercuatilico dist3
IQR(dist3)
## [1] 16.75

Varianza y Desviación estándar de cada distribución

var(dist1)
## [1] 79.73102
var(dist2)
## [1] 69.01878
var(dist3)
## [1] 88.65469
sd(dist1)
## [1] 8.929223
sd(dist2)
## [1] 8.307754
sd(dist3)
## [1] 9.415662

Determina el coeficiente de variación para cada distribución y mencione ¿CUÁL? distribución tiene mayor variabilidad y¿PORQUÉ?

sd(dist1)/mean(dist1)
## [1] 0.1039007
sd(dist2)/mean(dist2)
## [1] 0.09769231
sd(dist3)/mean(dist3)
## [1] 0.1098421

Generar cuartiles de cada distribucion

quantile (dist1, prob = c(0.25, 0.50, 0.75))
##   25%   50%   75% 
## 77.25 87.00 94.50
quantile (dist2, prob = c(0.25, 0.50, 0.75))
##  25%  50%  75% 
## 79.0 83.5 92.5
quantile (dist3, prob = c(0.25, 0.50, 0.75))
##   25%   50%   75% 
## 77.25 87.00 94.00

Conclución

Como conclución en esta práctica se generaron 3 distribuciones de 100 datos entre 70 y 100, cada una.
En ella realizamos los calculos de media, moda y mediana al igual que en practicas anteriores, tambien se realizaron los histogramas, y algo que recientemente vimos en clase que son los cuartiles, rango de los conjuntos de datos, rango intercuartilico, varianza y desviacion estandar.
De los calculos realizados se observo que la media ronda el 85 en cada conjunto, la mediana 2 de los conjuntos generaron 87 como valor y uno 83.5; y en el calculo de la moda en 2 de los conjuntos 4 valores tenian una frecuencia de 4 y en la distribución 2 la moda es 84 con 4 de frecuencia.
Con las gráficas plot se observo la dispercion de los datos, y con los rangos al ser 100 datos entre 70 y 100 dos de los conjuntos de datos generaron rangos de 30 y uno de 29, con los rangos intercuartilicos se obtuvieron resultaods muy similares para los tres conjuntos de datos, al igual que con la varianza y la desviación.