Equipo

Jesus Ruiz Tinajero

No de Control: 19041250

Angel Rafael Olivas Garcia

No de Control: 19041232

Oscar Ivan Alonso Simental

No de Control: 19041186

Juan Manuel Salcido Ruelas

No de Control: 19041252

Generar Datos:

En esta seccion se generan 3 conjuntos de datos de 70 a 100
set.seed(1000)
dist1 <- sample(70:100, size = 50, replace=TRUE)
dist1
##  [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95 95 97 92 87 74 99 88
## [26] 85 95 98 79 78 95 76 93 81 86 91 93 97 96 77 88 72 96 75 76 82 91 75 76 85
dist2 <- sample(70:100, size = 50, replace=TRUE)
dist2
##  [1]  97  77  72  90  87  82  99  87  85  86  86  72  82  83  77 100  77  80  93
## [20]  96  81  81  95  79  80  93  95  85  84  81  75  78  91  90  80  90 100  80
## [39]  79  79  70  96  94  78  76  83 100  94  86  71
dist3 <- sample(70:100, size = 50, replace=TRUE)
dist3
##  [1]  76  76  86  72  94  83  71  70  88  90  75  77  89 100  73  78  91  92  83
## [20]  94  85  97  74  88  94  95 100  88 100 100  98  90  72  86  93  78  91  97
## [39]  78  99  74  85  73  78  75  97  81  94  80  88

Media, mediana y moda:

library(modes)
# DATOS 1
mean(dist1)
## [1] 85.94
median(dist1)
## [1] 87
modes(dist1)
##        [,1] [,2] [,3] [,4]
## Value    75   91   95   98
## Length    4    4    4    4
# DATOS 2
mean(dist2)
## [1] 85.04
median(dist2)
## [1] 83.5
modes(dist2)
##        [,1]
## Value    80
## Length    4
# DATOS 3
mean(dist3)
## [1] 85.72
median(dist3)
## [1] 87
modes(dist3)
##        [,1] [,2] [,3] [,4]
## Value    78   88   94  100
## Length    4    4    4    4

Ordenar datos, histograma, gráfica de tallo y hoja, generar frecuencias, ordenar frecuencias

#DATOS 1
sort(dist1)
##  [1] 70 72 72 73 74 75 75 75 75 76 76 76 77 78 78 79 80 81 82 82 85 85 85 86 87
## [26] 87 88 88 88 91 91 91 91 92 93 93 93 95 95 95 95 96 96 97 97 98 98 98 98 99
hist(dist1)

stem(dist1)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   7 | 02234
##   7 | 55556667889
##   8 | 0122
##   8 | 555677888
##   9 | 11112333
##   9 | 5555667788889
table(dist1)
## dist1
## 70 72 73 74 75 76 77 78 79 80 81 82 85 86 87 88 91 92 93 95 96 97 98 99 
##  1  2  1  1  4  3  1  2  1  1  1  2  3  1  2  3  4  1  3  4  2  2  4  1
sort(table(dist1))
## dist1
## 70 73 74 77 79 80 81 86 92 99 72 78 82 87 96 97 76 85 88 93 75 91 95 98 
##  1  1  1  1  1  1  1  1  1  1  2  2  2  2  2  2  3  3  3  3  4  4  4  4
# DATOS 2
sort(dist2)
##  [1]  70  71  72  72  75  76  77  77  77  78  78  79  79  79  80  80  80  80  81
## [20]  81  81  82  82  83  83  84  85  85  86  86  86  87  87  90  90  90  91  93
## [39]  93  94  94  95  95  96  96  97  99 100 100 100
hist(dist2)

stem(dist2)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    7 | 0122
##    7 | 5677788999
##    8 | 000011122334
##    8 | 5566677
##    9 | 00013344
##    9 | 556679
##   10 | 000
table(dist2)
## dist2
##  70  71  72  75  76  77  78  79  80  81  82  83  84  85  86  87  90  91  93  94 
##   1   1   2   1   1   3   2   3   4   3   2   2   1   2   3   2   3   1   2   2 
##  95  96  97  99 100 
##   2   2   1   1   3
sort(table(dist2))
## dist2
##  70  71  75  76  84  91  97  99  72  78  82  83  85  87  93  94  95  96  77  79 
##   1   1   1   1   1   1   1   1   2   2   2   2   2   2   2   2   2   2   3   3 
##  81  86  90 100  80 
##   3   3   3   3   4
# DATOS 3
sort(dist3)
##  [1]  70  71  72  72  73  73  74  74  75  75  76  76  77  78  78  78  78  80  81
## [20]  83  83  85  85  86  86  88  88  88  88  89  90  90  91  91  92  93  94  94
## [39]  94  94  95  97  97  97  98  99 100 100 100 100
hist(dist3)

stem(dist3)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    7 | 01223344
##    7 | 556678888
##    8 | 0133
##    8 | 556688889
##    9 | 0011234444
##    9 | 577789
##   10 | 0000
table(dist3)
## dist3
##  70  71  72  73  74  75  76  77  78  80  81  83  85  86  88  89  90  91  92  93 
##   1   1   2   2   2   2   2   1   4   1   1   2   2   2   4   1   2   2   1   1 
##  94  95  97  98  99 100 
##   4   1   3   1   1   4
sort(table(dist3))
## dist3
##  70  71  77  80  81  89  92  93  95  98  99  72  73  74  75  76  83  85  86  90 
##   1   1   1   1   1   1   1   1   1   1   1   2   2   2   2   2   2   2   2   2 
##  91  97  78  88  94 100 
##   2   3   4   4   4   4

Plots:

En esta seccion se generan graficas de dispersion de los datos 1, 2 y 3, con los colores rojo, azul y verde respectivamente.
plot(dist1, col = "red")

plot(dist2, col = "blue")

plot(dist3, col = "green")

Rango

# DATOS 1
range(dist1)
## [1] 70 99
max(dist1) - min(dist1)
## [1] 29
# DATOS 2
range(dist2)
## [1]  70 100
max(dist2) - min(dist2)
## [1] 30
# DATOS 3
range(dist3)
## [1]  70 100
max(dist3) - min(dist3)
## [1] 30

Rango Intercuatílico de cada conjunto de datos:

Rango Intercuatilico dist1
IQR(dist1)
## [1] 17.25
Rango Intercuatilico dist2
IQR(dist2)
## [1] 13.5
Rango Intercuatilico dist3
IQR(dist3)
## [1] 16.75

Varianza y Desviación estándar de cada distribución

Varianza
var(dist1)
## [1] 79.73102
var(dist2)
## [1] 69.01878
var(dist3)
## [1] 88.65469
Desviacion Estandar
sd(dist1)
## [1] 8.929223
sd(dist2)
## [1] 8.307754
sd(dist3)
## [1] 9.415662

Determina el coeficiente de variación para cada distribución

La distribucion con mayor variabilidad es el conjunto de datos 3
sd(dist1)/mean(dist1) * 100
## [1] 10.39007
sd(dist2)/mean(dist2) * 100
## [1] 9.769231
sd(dist3)/mean(dist3) * 100
## [1] 10.98421

Generar cuartiles de cada distribucion

quantile (dist1, prob = c(0.25, 0.50, 0.75))
##   25%   50%   75% 
## 77.25 87.00 94.50
quantile (dist2, prob = c(0.25, 0.50, 0.75))
##  25%  50%  75% 
## 79.0 83.5 92.5
quantile (dist3, prob = c(0.25, 0.50, 0.75))
##   25%   50%   75% 
## 77.25 87.00 94.00

Conclusion:

En esta práctica se trabajó con 3 conjuntos completamente al azar en rango de datos similares con 50 valores diferentes. En estos se generó la media, la moda, la mediana, su frecuencia, etc. Estos diversos valores en la estadística nos permiten comparar diferentes muestras de una determinada población, utilizando los percentiles, cuantiles, graficas de barras e incluso histogramas y así en un futuro tomar decisiones basadas en estos datos estadísticos. Los alumnos del tecnológico aprendieron a trabajar de una mejor manera con la frecuencia de datos, el rango y, además, con la visualización de las muestras de los conjuntos de datos.