set.seed(1000)
dist1 <- sample(70:100, size = 50, replace=TRUE)
dist2 <- sample(70:100, size = 50, replace=TRUE)
dist3 <- sample(70:100, size = 50, replace=TRUE)
###Datos de la distribucion 1
dist1
## [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95 95 97 92 87 74 99 88
## [26] 85 95 98 79 78 95 76 93 81 86 91 93 97 96 77 88 72 96 75 76 82 91 75 76 85
###Datos de la distribucion 2
dist2
## [1] 97 77 72 90 87 82 99 87 85 86 86 72 82 83 77 100 77 80 93
## [20] 96 81 81 95 79 80 93 95 85 84 81 75 78 91 90 80 90 100 80
## [39] 79 79 70 96 94 78 76 83 100 94 86 71
###Datos de la distribucion 3
dist3
## [1] 76 76 86 72 94 83 71 70 88 90 75 77 89 100 73 78 91 92 83
## [20] 94 85 97 74 88 94 95 100 88 100 100 98 90 72 86 93 78 91 97
## [39] 78 99 74 85 73 78 75 97 81 94 80 88
Ordenar Datos 1
sort(dist1)
## [1] 70 72 72 73 74 75 75 75 75 76 76 76 77 78 78 79 80 81 82 82 85 85 85 86 87
## [26] 87 88 88 88 91 91 91 91 92 93 93 93 95 95 95 95 96 96 97 97 98 98 98 98 99
Histograma datos 1
hist(dist1)
Grafica de tallo de datos 1
stem(dist1)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 02234
## 7 | 55556667889
## 8 | 0122
## 8 | 555677888
## 9 | 11112333
## 9 | 5555667788889
Frecuencias de datos 1
table(dist1)
## dist1
## 70 72 73 74 75 76 77 78 79 80 81 82 85 86 87 88 91 92 93 95 96 97 98 99
## 1 2 1 1 4 3 1 2 1 1 1 2 3 1 2 3 4 1 3 4 2 2 4 1
Ordenar Frecuencias de datos 1
sort(table(dist1))
## dist1
## 70 73 74 77 79 80 81 86 92 99 72 78 82 87 96 97 76 85 88 93 75 91 95 98
## 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 4
Ordenar Datos 2
sort(dist2)
## [1] 70 71 72 72 75 76 77 77 77 78 78 79 79 79 80 80 80 80 81
## [20] 81 81 82 82 83 83 84 85 85 86 86 86 87 87 90 90 90 91 93
## [39] 93 94 94 95 95 96 96 97 99 100 100 100
Histograma datos 2
hist(dist2)
Grafica de tallo de datos 2
stem(dist2)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 0122
## 7 | 5677788999
## 8 | 000011122334
## 8 | 5566677
## 9 | 00013344
## 9 | 556679
## 10 | 000
Frecuencias de datos 2
table(dist2)
## dist2
## 70 71 72 75 76 77 78 79 80 81 82 83 84 85 86 87 90 91 93 94
## 1 1 2 1 1 3 2 3 4 3 2 2 1 2 3 2 3 1 2 2
## 95 96 97 99 100
## 2 2 1 1 3
Ordenar Frecuencias de datos 2
sort(table(dist2))
## dist2
## 70 71 75 76 84 91 97 99 72 78 82 83 85 87 93 94 95 96 77 79
## 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3
## 81 86 90 100 80
## 3 3 3 3 4
Ordenar Datos 3
sort(dist3)
## [1] 70 71 72 72 73 73 74 74 75 75 76 76 77 78 78 78 78 80 81
## [20] 83 83 85 85 86 86 88 88 88 88 89 90 90 91 91 92 93 94 94
## [39] 94 94 95 97 97 97 98 99 100 100 100 100
Histograma datos 3
hist(dist3)
Grafica de tallo de datos 3
stem(dist3)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 01223344
## 7 | 556678888
## 8 | 0133
## 8 | 556688889
## 9 | 0011234444
## 9 | 577789
## 10 | 0000
Frecuencias de datos 3
table(dist3)
## dist3
## 70 71 72 73 74 75 76 77 78 80 81 83 85 86 88 89 90 91 92 93
## 1 1 2 2 2 2 2 1 4 1 1 2 2 2 4 1 2 2 1 1
## 94 95 97 98 99 100
## 4 1 3 1 1 4
Ordenar Frecuencias de datos 3
sort(table(dist3))
## dist3
## 70 71 77 80 81 89 92 93 95 98 99 72 73 74 75 76 83 85 86 90
## 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
## 91 97 78 88 94 100
## 2 3 4 4 4 4
Plots #####Plots para datos 1
plot(dist1, col = "red")
#####Plots para datos 2
plot(dist2, col = "blue")
#####Plots para datos 3
plot(dist3, col = "green")
#### Medias de cada distribución Media para datos 1
mean(dist1)
## [1] 85.94
Media para datos 2
mean(dist2)
## [1] 85.04
Media para datos 3
mean(dist3)
## [1] 85.72
Varianza para datos 1
var(dist1)
## [1] 79.73102
Varianza para datos 2
var(dist2)
## [1] 69.01878
Varianza para datos 3
var(dist3)
## [1] 88.65469
#Desviaciones Esándard de cada distribución Desviacion para datos 1
sd(dist1)
## [1] 8.929223
Desviacion para datos 2
sd(dist2)
## [1] 8.307754
Desviacion para datos 3
sd(dist3)
## [1] 9.415662
Coeficiente para datos 1
sd(dist1) / mean(dist1) * 100
## [1] 10.39007
Coeficiente para datos 2
sd(dist2) / mean(dist2) * 100
## [1] 9.769231
Coeficiente para datos 3
sd(dist3) / mean(dist3) * 100
## [1] 10.98421
##El conjunto de datos que tiene la mayor distribucion de variacion es el tercero, como podemos observar los 3 datos a simple vista se nota la diferencia de que hay entre los demas
Percentiles para datos 1
quantile (dist1, prob = c(0.60, 0.80))
## 60% 80%
## 91 95
Percentiles para datos 2
quantile (dist2, prob = c(0.60, 0.80))
## 60% 80%
## 86 94
Percentiles para datos 3
quantile (dist3, prob = c(0.60, 0.80))
## 60% 80%
## 89.4 94.2
Cuartiles Para distribucion 1
quantile (dist1, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 77.25 87.00 94.50
Cuartiles Para distribucion 2
quantile (dist2, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 79.0 83.5 92.5
Cuartiles Para distribucion 3
quantile (dist3, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 77.25 87.00 94.00
##La practica que aqui se enseña podemos observar que se muestra de manera grafica así como numerica las medidas de tendencia y de dispersion con las que se generaron los coeficientes de variacion, los cuartiles, histogramas y graficas de las tres distribuciones de datos generadas a las cuales se les aplica las tendencias ya mencionadas y generar los histogramas y las graficas para poder observar la distribucion de cada uno del los conjuntos de datos, con el fin de poder observar los datos de una mejor manera y poder comparar los conjuntos de datos de una forma mas facil con el uso de esta herramienta (RStudio).