Objetivo Generar medidas centrales,de dispercion y el coeficiente de variacion con tres conjuntos de datos

Establecer semilla

set.seed(1000)

Generar los datos

dist1= sample(70:100, size =100, replace = T )
dist2= sample(70:100, size =100, replace = T )
dist3= sample(70:100, size =100, replace = T )

Mostrar los datos de cada distribucion

dist1
##   [1]  85  73  80  91  88  93  98  72  98  87  91  75  82  75  70  78  98  95
##  [19]  95  97  92  87  74  99  88  85  95  98  79  78  95  76  93  81  86  91
##  [37]  93  97  96  77  88  72  96  75  76  82  91  75  76  85  97  77  72  90
##  [55]  87  82  99  87  85  86  86  72  82  83  77 100  77  80  93  96  81  81
##  [73]  95  79  80  93  95  85  84  81  75  78  91  90  80  90 100  80  79  79
##  [91]  70  96  94  78  76  83 100  94  86  71
dist2
##   [1]  76  76  86  72  94  83  71  70  88  90  75  77  89 100  73  78  91  92
##  [19]  83  94  85  97  74  88  94  95 100  88 100 100  98  90  72  86  93  78
##  [37]  91  97  78  99  74  85  73  78  75  97  81  94  80  88  79  77 100  84
##  [55]  79  93  88  98  88  87  77  86 100  85  72  82  72  94  75  99  74  92
##  [73]  72  96  84  84  94  75  78  71  89  87  98  77  98  70  80  93  86  74
##  [91]  74  97  99  85 100  84  99  78  89  93
dist3
##   [1]  92  84  92  95  96  92  92  71  85  87  87  89  74  70  92  85  75  94
##  [19]  97  86  93  77  93  88  93 100  76  91  96  77 100  89  94  98  82  93
##  [37]  72  73  76  89  92  88  87  88  87  97  86  74  75  76  90  75  97  89
##  [55]  78  89  73  89  72  79  74  80  72  92  70  82  70  82  91  97  74  90
##  [73]  78  89  71  77 100  70  70  71  70  70  85  72  90  76  81  95  84  93
##  [91]  78  77  95  88  76  71  95  88  96  84

Media de cada distribucion

Distribucion 1

mean(dist1)
## [1] 85.49

Distribucion 2

mean(dist2)
## [1] 85.71

Distribucion 3

mean(dist3)
## [1] 84.3

Moda de cada distribución

library(modes)
modes(dist1)
##        [,1]
## Value    95
## Length    6
modes(dist2)
##        [,1]
## Value   100
## Length    7
modes(dist3)
##        [,1] [,2] [,3]
## Value    70   89   92
## Length    7    7    7

Mediana de cada distribucion

Distribucion 1

sort(dist1)
##   [1]  70  70  71  72  72  72  72  73  74  75  75  75  75  75  76  76  76  76
##  [19]  77  77  77  77  78  78  78  78  79  79  79  79  80  80  80  80  80  81
##  [37]  81  81  81  82  82  82  82  83  83  84  85  85  85  85  85  86  86  86
##  [55]  86  87  87  87  87  88  88  88  90  90  90  91  91  91  91  91  92  93
##  [73]  93  93  93  93  94  94  95  95  95  95  95  95  96  96  96  96  97  97
##  [91]  97  98  98  98  98  99  99 100 100 100
median(dist1)
## [1] 85

Distribucion 2

sort(dist2)
##   [1]  70  70  71  71  72  72  72  72  72  73  73  74  74  74  74  74  75  75
##  [19]  75  75  76  76  77  77  77  77  78  78  78  78  78  78  79  79  80  80
##  [37]  81  82  83  83  84  84  84  84  85  85  85  85  86  86  86  86  87  87
##  [55]  88  88  88  88  88  88  89  89  89  90  90  91  91  92  92  93  93  93
##  [73]  93  94  94  94  94  94  94  95  96  97  97  97  97  98  98  98  98  99
##  [91]  99  99  99 100 100 100 100 100 100 100
median(dist2)
## [1] 86

Distribucion 3

sort(dist3)
##   [1]  70  70  70  70  70  70  70  71  71  71  71  72  72  72  72  73  73  74
##  [19]  74  74  74  75  75  75  76  76  76  76  76  77  77  77  77  78  78  78
##  [37]  79  80  81  82  82  82  84  84  84  85  85  85  86  86  87  87  87  87
##  [55]  88  88  88  88  88  89  89  89  89  89  89  89  90  90  90  91  91  92
##  [73]  92  92  92  92  92  92  93  93  93  93  93  94  94  95  95  95  95  96
##  [91]  96  96  97  97  97  97  98 100 100 100
median(dist3)
## [1] 86.5

Histograma para cada distribucion

Histograma Distribucion 1

hist(dist1)

Histograma Distribucion 2

hist(dist2)

Histograma Distribucion 3

hist(dist3)

Cuartiles para cada distribucion

quantile (dist1, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75% 
##  78  85  93
quantile (dist2, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75% 
##  77  86  94
quantile (dist3, prob = c(0.25, 0.50, 0.75))
##  25%  50%  75% 
## 76.0 86.5 92.0

Rango de cada conjunto de Datos

range(dist1)
## [1]  70 100
range(dist2)
## [1]  70 100
range(dist3)
## [1]  70 100

Rango Intercuartilico de cada conjunto de Datos

IQR(dist1)
## [1] 15
IQR(dist2)
## [1] 17
IQR(dist3)
## [1] 16

Varianza cada distribución

var(dist1)
## [1] 73.82818
var(dist2)
## [1] 87.96556
var(dist3)
## [1] 83.86869

Desviación estándar de cada distribución

sd(dist1)
## [1] 8.592333
sd(dist2)
## [1] 9.378995
sd(dist3)
## [1] 9.157985

Coeficiente de variacion de cada distribucion

sd(dist1) / mean(dist1) * 100
## [1] 10.05069
sd(dist2) / mean(dist2) * 100
## [1] 10.94271
sd(dist3) / mean(dist3) * 100
## [1] 10.86356
print("La Distribucion 2 tiene la mayor variacion ya que es la que tiene el numero mayor ")
## [1] "La Distribucion 2 tiene la mayor variacion ya que es la que tiene el numero mayor "

Diagramas de dispersion

Distribucion 1 Color Rojo

plot(dist1,col= "red")

Distribucion 2 Color Azul

plot(dist1,col= "blue")

Distribucion 3 Color Verde

plot(dist1,col= "green")

Generar el percentil 60 y 80 de cada distribución

quantile (dist1, prob = c(0.60, 0.80))
## 60% 80% 
##  88  95
quantile (dist2, prob = c(0.60, 0.80))
##  60%  80% 
## 88.4 95.2
quantile (dist3, prob = c(0.60, 0.80))
## 60% 80% 
##  89  93
En esta pequeña practica pusimos a prueba los nuevos conocimientos que obtuvimos previamente en clase, del conjunto de datos que se generó aleatoriamente en Rstudio desarrollamos se le hizo un análisis a los datos obteniendo las medidas de tendencia central las cuales son media, mediana y moda, de igual manera el histograma, cuartiles, rango, rango intercuartílico, varianza y desviación estándar las cuales básicamente nos sirven para conocer qué tan dispersos están nuestros datos y a partir de esta información llevar a cabo una toma de decisiones en cuanto a los datos se refiere. El software Rstudio nos ayuda mucho obteniendo todos estos tipos de datos, que bien también se pueden obtener a mano, pero se pierde mucho tiempo, en cambio en R se convierte en procesos automáticos que pueden tratar millones de datos.