Medidas de centrales, de dispersión y coeficiente de variación

Objetivo: Generar 3 muestras de poblacion de 50 observaciones con un rango entre 70 y 100

Generar datos:

set.seed(1000)

dist1 <- sample(70:100, size = 50, replace=TRUE)
dist2 <- sample(70:100, size = 50, replace=TRUE)
dist3 <- sample(70:100, size = 50, replace=TRUE)

dist1

##  [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95 95 97 92 87 74 99 88
## [26] 85 95 98 79 78 95 76 93 81 86 91 93 97 96 77 88 72 96 75 76 82 91 75 76 85

dist2

##  [1]  97  77  72  90  87  82  99  87  85  86  86  72  82  83  77 100  77  80  93
## [20]  96  81  81  95  79  80  93  95  85  84  81  75  78  91  90  80  90 100  80
## [39]  79  79  70  96  94  78  76  83 100  94  86  71

dist3

##  [1]  76  76  86  72  94  83  71  70  88  90  75  77  89 100  73  78  91  92  83
## [20]  94  85  97  74  88  94  95 100  88 100 100  98  90  72  86  93  78  91  97
## [39]  78  99  74  85  73  78  75  97  81  94  80  88

Ordenar datos: Dist 1

sort(dist1)

##  [1] 70 72 72 73 74 75 75 75 75 76 76 76 77 78 78 79 80 81 82 82 85 85 85 86 87
## [26] 87 88 88 88 91 91 91 91 92 93 93 93 95 95 95 95 96 96 97 97 98 98 98 98 99

Histograma: Dist 1

hist(dist1)

Grárfica de tallo y hoja: Dist 1

stem(dist1)

## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   7 | 02234
##   7 | 55556667889
##   8 | 0122
##   8 | 555677888
##   9 | 11112333
##   9 | 5555667788889

Generar frecuencias: Dist 1

table(dist1)

## dist1
## 70 72 73 74 75 76 77 78 79 80 81 82 85 86 87 88 91 92 93 95 96 97 98 99 
##  1  2  1  1  4  3  1  2  1  1  1  2  3  1  2  3  4  1  3  4  2  2  4  1

Ordenar frecuencias: Dist 1

sort(table(dist1))

## dist1
## 70 73 74 77 79 80 81 86 92 99 72 78 82 87 96 97 76 85 88 93 75 91 95 98 
##  1  1  1  1  1  1  1  1  1  1  2  2  2  2  2  2  3  3  3  3  4  4  4  4

Ordenar datos: Dist 2

sort(dist2)

##  [1]  70  71  72  72  75  76  77  77  77  78  78  79  79  79  80  80  80  80  81
## [20]  81  81  82  82  83  83  84  85  85  86  86  86  87  87  90  90  90  91  93
## [39]  93  94  94  95  95  96  96  97  99 100 100 100

Histograma: Dist 2

hist(dist2)

Grárfica de tallo y hoja: Dist 2

stem(dist2)

## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    7 | 0122
##    7 | 5677788999
##    8 | 000011122334
##    8 | 5566677
##    9 | 00013344
##    9 | 556679
##   10 | 000

Generar frecuencias: Dist 2

table(dist2)

## dist2
##  70  71  72  75  76  77  78  79  80  81  82  83  84  85  86  87  90  91  93  94 
##   1   1   2   1   1   3   2   3   4   3   2   2   1   2   3   2   3   1   2   2 
##  95  96  97  99 100 
##   2   2   1   1   3

Ordenar frecuencias: Dist 2

sort(table(dist2))

## dist2
##  70  71  75  76  84  91  97  99  72  78  82  83  85  87  93  94  95  96  77  79 
##   1   1   1   1   1   1   1   1   2   2   2   2   2   2   2   2   2   2   3   3 
##  81  86  90 100  80 
##   3   3   3   3   4

Ordenar datos: Dist 3

sort(dist3)

##  [1]  70  71  72  72  73  73  74  74  75  75  76  76  77  78  78  78  78  80  81
## [20]  83  83  85  85  86  86  88  88  88  88  89  90  90  91  91  92  93  94  94
## [39]  94  94  95  97  97  97  98  99 100 100 100 100

Histograma: Dist 3

hist(dist3)

Grárfica de tallo y hoja: Dist 3

stem(dist3)

## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    7 | 01223344
##    7 | 556678888
##    8 | 0133
##    8 | 556688889
##    9 | 0011234444
##    9 | 577789
##   10 | 0000

Generar frecuencias: Dist 3

table(dist3)

## dist3
##  70  71  72  73  74  75  76  77  78  80  81  83  85  86  88  89  90  91  92  93 
##   1   1   2   2   2   2   2   1   4   1   1   2   2   2   4   1   2   2   1   1 
##  94  95  97  98  99 100 
##   4   1   3   1   1   4

Ordenar frecuencias: Dist 3

sort(table(dist3))

## dist3
##  70  71  77  80  81  89  92  93  95  98  99  72  73  74  75  76  83  85  86  90 
##   1   1   1   1   1   1   1   1   1   1   1   2   2   2   2   2   2   2   2   2 
##  91  97  78  88  94 100 
##   2   3   4   4   4   4

Plots

Dist 1:

plot(dist1, col = "red")

Dist 2:

plot(dist2, col = "blue")

Dist 3:

plot(dist3, col = "green")

Medias de cada distribución:

mean(dist1)

## [1] 85.94

mean(dist2)

## [1] 85.04

mean(dist3)

## [1] 85.72

Varianzas de cada distribución:

var(dist1)

## [1] 79.73102

var(dist2)

## [1] 69.01878

var(dist3)

## [1] 88.65469

Desviaciones Esándard de cada distribución:

sd(dist1)

## [1] 8.929223

sd(dist2)

## [1] 8.307754

sd(dist3)

## [1] 9.415662

Coeficiente de variación:

sd(dist1) / mean(dist1) * 100

## [1] 10.39007

sd(dist2) / mean(dist2) * 100

## [1] 9.769231

sd(dist3) / mean(dist3) * 100

## [1] 10.98421

print("La distribución 3 tiene variación mayor.")

## [1] "La distribución 3 tiene variación mayor."

Rango de cada distribución:

range(dist1)

## [1] 70 99

range(dist2)

## [1]  70 100

range(dist3)

## [1]  70 100

Rango intercuartílico de cada distribución:

IQR(dist1)

## [1] 17.25

IQR(dist2)

## [1] 13.5

IQR(dist3)

## [1] 16.75

Generar el percentil 60 y 80 de cada distribución:

quantile (dist1, prob = c(0.60, 0.80))

## 60% 80% 
##  91  95

quantile (dist2, prob = c(0.60, 0.80))

## 60% 80% 
##  86  94

quantile (dist3, prob = c(0.60, 0.80))

##  60%  80% 
## 89.4 94.2

Generar cuartiles de cada distribución:

quantile (dist1, prob = c(0.25, 0.50, 0.75))

##   25%   50%   75% 
## 77.25 87.00 94.50

quantile (dist2, prob = c(0.25, 0.50, 0.75))

##  25%  50%  75% 
## 79.0 83.5 92.5

quantile (dist3, prob = c(0.25, 0.50, 0.75))

##   25%   50%   75% 
## 77.25 87.00 94.00

Generar mediana de cada distribución:

median(dist1)

## [1] 87

median(dist2)

## [1] 83.5

median(dist3)

## [1] 87

Generar moda de cada distribución:

library(modes)
modes(dist1)

##        [,1] [,2] [,3] [,4]
## Value    75   91   95   98
## Length    4    4    4    4

modes(dist2)

##        [,1]
## Value    80
## Length    4

modes(dist3)

##        [,1] [,2] [,3] [,4]
## Value    78   88   94  100
## Length    4    4    4    4

En esta práctica lo que se está llevando a cabo es generar datos aleatorios de 100 elementos entre 70 y 100, en tres distribuciones diferentes y en cada una de estas se determinara la media, mediana y moda, histograma, cuartiles, rango, rango intercuartilico, varianza y desviación estándar, así como también el diagrama de dispersión para cada distribución, también sus frecuencias y sus respectivas tablas de frecuencia, esto para tener un mejor ordenamiento de datos. Todo esto nos sirve a la hora de querer hacer distribuciones de un conjunto de datos o una muestra de población y visualizar los datos de otra manera o para calcular medias, medianas, modas, varianzas, histogramas, etc.

Medidas de centrales, de dispersión y coeficiente de variación

Luis Fernando Rivera Morales

20/02/2020

Objetivo: Generar 3 muestras de poblacion de 50 observaciones con un rango entre 70 y 100

Generar datos:

Ordenar datos: Dist 1

Histograma: Dist 1

Grárfica de tallo y hoja: Dist 1

Generar frecuencias: Dist 1

Ordenar frecuencias: Dist 1

Ordenar datos: Dist 2

Histograma: Dist 2

Grárfica de tallo y hoja: Dist 2

Generar frecuencias: Dist 2

Ordenar frecuencias: Dist 2

Ordenar datos: Dist 3

Histograma: Dist 3

Grárfica de tallo y hoja: Dist 3

Generar frecuencias: Dist 3

Ordenar frecuencias: Dist 3

Plots

Dist 1:

Dist 2:

Dist 3:

Medias de cada distribución:

Varianzas de cada distribución:

Desviaciones Esándard de cada distribución:

Coeficiente de variación:

Rango de cada distribución:

Rango intercuartílico de cada distribución:

Generar el percentil 60 y 80 de cada distribución:

Generar cuartiles de cada distribución:

Generar mediana de cada distribución:

Generar moda de cada distribución: