Objetivo Generar medidas centrales,de dispercion y el coeficiente de variacion con tres conjuntos de datos
Establecer semilla
set.seed(1000)
Generar los datos
dist1= sample(70:100, size =100, replace = T )
dist2= sample(70:100, size =100, replace = T )
dist3= sample(70:100, size =100, replace = T )
Mostrar los datos de cada distribucion
dist1
## [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95
## [19] 95 97 92 87 74 99 88 85 95 98 79 78 95 76 93 81 86 91
## [37] 93 97 96 77 88 72 96 75 76 82 91 75 76 85 97 77 72 90
## [55] 87 82 99 87 85 86 86 72 82 83 77 100 77 80 93 96 81 81
## [73] 95 79 80 93 95 85 84 81 75 78 91 90 80 90 100 80 79 79
## [91] 70 96 94 78 76 83 100 94 86 71
dist2
## [1] 76 76 86 72 94 83 71 70 88 90 75 77 89 100 73 78 91 92
## [19] 83 94 85 97 74 88 94 95 100 88 100 100 98 90 72 86 93 78
## [37] 91 97 78 99 74 85 73 78 75 97 81 94 80 88 79 77 100 84
## [55] 79 93 88 98 88 87 77 86 100 85 72 82 72 94 75 99 74 92
## [73] 72 96 84 84 94 75 78 71 89 87 98 77 98 70 80 93 86 74
## [91] 74 97 99 85 100 84 99 78 89 93
dist3
## [1] 92 84 92 95 96 92 92 71 85 87 87 89 74 70 92 85 75 94
## [19] 97 86 93 77 93 88 93 100 76 91 96 77 100 89 94 98 82 93
## [37] 72 73 76 89 92 88 87 88 87 97 86 74 75 76 90 75 97 89
## [55] 78 89 73 89 72 79 74 80 72 92 70 82 70 82 91 97 74 90
## [73] 78 89 71 77 100 70 70 71 70 70 85 72 90 76 81 95 84 93
## [91] 78 77 95 88 76 71 95 88 96 84
Media de cada distribucion
Distribucion 1
mean(dist1)
## [1] 85.49
Distribucion 2
mean(dist2)
## [1] 85.71
Distribucion 3
mean(dist3)
## [1] 84.3
Moda de cada distribución
library(modes)
modes(dist1)
## [,1]
## Value 95
## Length 6
modes(dist2)
## [,1]
## Value 100
## Length 7
modes(dist3)
## [,1] [,2] [,3]
## Value 70 89 92
## Length 7 7 7
Mediana de cada distribucion
Distribucion 1
sort(dist1)
## [1] 70 70 71 72 72 72 72 73 74 75 75 75 75 75 76 76 76 76
## [19] 77 77 77 77 78 78 78 78 79 79 79 79 80 80 80 80 80 81
## [37] 81 81 81 82 82 82 82 83 83 84 85 85 85 85 85 86 86 86
## [55] 86 87 87 87 87 88 88 88 90 90 90 91 91 91 91 91 92 93
## [73] 93 93 93 93 94 94 95 95 95 95 95 95 96 96 96 96 97 97
## [91] 97 98 98 98 98 99 99 100 100 100
median(dist1)
## [1] 85
Distribucion 2
sort(dist2)
## [1] 70 70 71 71 72 72 72 72 72 73 73 74 74 74 74 74 75 75
## [19] 75 75 76 76 77 77 77 77 78 78 78 78 78 78 79 79 80 80
## [37] 81 82 83 83 84 84 84 84 85 85 85 85 86 86 86 86 87 87
## [55] 88 88 88 88 88 88 89 89 89 90 90 91 91 92 92 93 93 93
## [73] 93 94 94 94 94 94 94 95 96 97 97 97 97 98 98 98 98 99
## [91] 99 99 99 100 100 100 100 100 100 100
median(dist2)
## [1] 86
Distribucion 3
sort(dist3)
## [1] 70 70 70 70 70 70 70 71 71 71 71 72 72 72 72 73 73 74
## [19] 74 74 74 75 75 75 76 76 76 76 76 77 77 77 77 78 78 78
## [37] 79 80 81 82 82 82 84 84 84 85 85 85 86 86 87 87 87 87
## [55] 88 88 88 88 88 89 89 89 89 89 89 89 90 90 90 91 91 92
## [73] 92 92 92 92 92 92 93 93 93 93 93 94 94 95 95 95 95 96
## [91] 96 96 97 97 97 97 98 100 100 100
median(dist3)
## [1] 86.5
Histograma para cada distribucion
Histograma Distribucion 1
hist(dist1)

Histograma Distribucion 2
hist(dist2)

Histograma Distribucion 3
hist(dist3)

Cuartiles para cada distribucion
quantile (dist1, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 78 85 93
quantile (dist2, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 77 86 94
quantile (dist3, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 76.0 86.5 92.0
Rango de cada conjunto de Datos
range(dist1)
## [1] 70 100
range(dist2)
## [1] 70 100
range(dist3)
## [1] 70 100
Rango Intercuartilico de cada conjunto de Datos
IQR(dist1)
## [1] 15
IQR(dist2)
## [1] 17
IQR(dist3)
## [1] 16
Varianza cada distribución
var(dist1)
## [1] 73.82818
var(dist2)
## [1] 87.96556
var(dist3)
## [1] 83.86869
Desviación estándar de cada distribución
sd(dist1)
## [1] 8.592333
sd(dist2)
## [1] 9.378995
sd(dist3)
## [1] 9.157985
Coeficiente de variacion de cada distribucion
sd(dist1) / mean(dist1) * 100
## [1] 10.05069
sd(dist2) / mean(dist2) * 100
## [1] 10.94271
sd(dist3) / mean(dist3) * 100
## [1] 10.86356
print("La Distribucion 2 tiene la mayor variacion ya que es la que tiene el numero mayor ")
## [1] "La Distribucion 2 tiene la mayor variacion ya que es la que tiene el numero mayor "
Diagramas de dispersion
Distribucion 1 Color Rojo
plot(dist1,col= "red")

Distribucion 2 Color Azul
plot(dist1,col= "blue")

Distribucion 3 Color Verde
plot(dist1,col= "green")

Generar el percentil 60 y 80 de cada distribución
quantile (dist1, prob = c(0.60, 0.80))
## 60% 80%
## 88 95
quantile (dist2, prob = c(0.60, 0.80))
## 60% 80%
## 88.4 95.2
quantile (dist3, prob = c(0.60, 0.80))
## 60% 80%
## 89 93
En esta pequeña practica pusimos a prueba los nuevos conocimientos que obtuvimos previamente en clase, del conjunto de datos que se generó aleatoriamente en Rstudio desarrollamos se le hizo un análisis a los datos obteniendo las medidas de tendencia central las cuales son media, mediana y moda, de igual manera el histograma, cuartiles, rango, rango intercuartílico, varianza y desviación estándar las cuales básicamente nos sirven para conocer qué tan dispersos están nuestros datos y a partir de esta información llevar a cabo una toma de decisiones en cuanto a los datos se refiere. El software Rstudio nos ayuda mucho obteniendo todos estos tipos de datos, que bien también se pueden obtener a mano, pero se pierde mucho tiempo, en cambio en R se convierte en procesos automáticos que pueden tratar millones de datos.