Equipo
Jesus Ruiz Tinajero
No de Control: 19041250
Angel Rafael Olivas Garcia
No de Control: 19041232
Oscar Ivan Alonso Simental
No de Control: 19041186
Juan Manuel Salcido Ruelas
No de Control: 19041252
Generar Datos:
En esta seccion se generan 3 conjuntos de datos de 70 a 100
set.seed(1000)
dist1 <- sample(70:100, size = 50, replace=TRUE)
dist1
## [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95 95 97 92 87 74 99 88
## [26] 85 95 98 79 78 95 76 93 81 86 91 93 97 96 77 88 72 96 75 76 82 91 75 76 85
dist2 <- sample(70:100, size = 50, replace=TRUE)
dist2
## [1] 97 77 72 90 87 82 99 87 85 86 86 72 82 83 77 100 77 80 93
## [20] 96 81 81 95 79 80 93 95 85 84 81 75 78 91 90 80 90 100 80
## [39] 79 79 70 96 94 78 76 83 100 94 86 71
dist3 <- sample(70:100, size = 50, replace=TRUE)
dist3
## [1] 76 76 86 72 94 83 71 70 88 90 75 77 89 100 73 78 91 92 83
## [20] 94 85 97 74 88 94 95 100 88 100 100 98 90 72 86 93 78 91 97
## [39] 78 99 74 85 73 78 75 97 81 94 80 88
Ordenar datos, histograma, gráfica de tallo y hoja, generar frecuencias, ordenar frecuencias
#DATOS 1
sort(dist1)
## [1] 70 72 72 73 74 75 75 75 75 76 76 76 77 78 78 79 80 81 82 82 85 85 85 86 87
## [26] 87 88 88 88 91 91 91 91 92 93 93 93 95 95 95 95 96 96 97 97 98 98 98 98 99
hist(dist1)

stem(dist1)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 02234
## 7 | 55556667889
## 8 | 0122
## 8 | 555677888
## 9 | 11112333
## 9 | 5555667788889
table(dist1)
## dist1
## 70 72 73 74 75 76 77 78 79 80 81 82 85 86 87 88 91 92 93 95 96 97 98 99
## 1 2 1 1 4 3 1 2 1 1 1 2 3 1 2 3 4 1 3 4 2 2 4 1
sort(table(dist1))
## dist1
## 70 73 74 77 79 80 81 86 92 99 72 78 82 87 96 97 76 85 88 93 75 91 95 98
## 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 4
# DATOS 2
sort(dist2)
## [1] 70 71 72 72 75 76 77 77 77 78 78 79 79 79 80 80 80 80 81
## [20] 81 81 82 82 83 83 84 85 85 86 86 86 87 87 90 90 90 91 93
## [39] 93 94 94 95 95 96 96 97 99 100 100 100
hist(dist2)

stem(dist2)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 0122
## 7 | 5677788999
## 8 | 000011122334
## 8 | 5566677
## 9 | 00013344
## 9 | 556679
## 10 | 000
table(dist2)
## dist2
## 70 71 72 75 76 77 78 79 80 81 82 83 84 85 86 87 90 91 93 94
## 1 1 2 1 1 3 2 3 4 3 2 2 1 2 3 2 3 1 2 2
## 95 96 97 99 100
## 2 2 1 1 3
sort(table(dist2))
## dist2
## 70 71 75 76 84 91 97 99 72 78 82 83 85 87 93 94 95 96 77 79
## 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3
## 81 86 90 100 80
## 3 3 3 3 4
# DATOS 3
sort(dist3)
## [1] 70 71 72 72 73 73 74 74 75 75 76 76 77 78 78 78 78 80 81
## [20] 83 83 85 85 86 86 88 88 88 88 89 90 90 91 91 92 93 94 94
## [39] 94 94 95 97 97 97 98 99 100 100 100 100
hist(dist3)

stem(dist3)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 01223344
## 7 | 556678888
## 8 | 0133
## 8 | 556688889
## 9 | 0011234444
## 9 | 577789
## 10 | 0000
table(dist3)
## dist3
## 70 71 72 73 74 75 76 77 78 80 81 83 85 86 88 89 90 91 92 93
## 1 1 2 2 2 2 2 1 4 1 1 2 2 2 4 1 2 2 1 1
## 94 95 97 98 99 100
## 4 1 3 1 1 4
sort(table(dist3))
## dist3
## 70 71 77 80 81 89 92 93 95 98 99 72 73 74 75 76 83 85 86 90
## 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
## 91 97 78 88 94 100
## 2 3 4 4 4 4
Plots:
En esta seccion se generan graficas de dispersion de los datos 1, 2 y 3, con los colores rojo, azul y verde respectivamente.
plot(dist1, col = "red")

plot(dist2, col = "blue")

plot(dist3, col = "green")

Rango
# DATOS 1
range(dist1)
## [1] 70 99
max(dist1) - min(dist1)
## [1] 29
# DATOS 2
range(dist2)
## [1] 70 100
max(dist2) - min(dist2)
## [1] 30
# DATOS 3
range(dist3)
## [1] 70 100
max(dist3) - min(dist3)
## [1] 30
Rango Intercuatílico de cada conjunto de datos:
Rango Intercuatilico dist1
IQR(dist1)
## [1] 17.25
Rango Intercuatilico dist2
IQR(dist2)
## [1] 13.5
Rango Intercuatilico dist3
IQR(dist3)
## [1] 16.75
Varianza y Desviación estándar de cada distribución
Varianza
var(dist1)
## [1] 79.73102
var(dist2)
## [1] 69.01878
var(dist3)
## [1] 88.65469
Desviacion Estandar
sd(dist1)
## [1] 8.929223
sd(dist2)
## [1] 8.307754
sd(dist3)
## [1] 9.415662
Determina el coeficiente de variación para cada distribución
La distribucion con mayor variabilidad es el conjunto de datos 3
sd(dist1)/mean(dist1) * 100
## [1] 10.39007
sd(dist2)/mean(dist2) * 100
## [1] 9.769231
sd(dist3)/mean(dist3) * 100
## [1] 10.98421
Generar cuartiles de cada distribucion
quantile (dist1, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 77.25 87.00 94.50
quantile (dist2, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 79.0 83.5 92.5
quantile (dist3, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 77.25 87.00 94.00
Conclusion:
En esta práctica se trabajó con 3 conjuntos completamente al azar en rango de datos similares con 50 valores diferentes. En estos se generó la media, la moda, la mediana, su frecuencia, etc. Estos diversos valores en la estadística nos permiten comparar diferentes muestras de una determinada población, utilizando los percentiles, cuantiles, graficas de barras e incluso histogramas y así en un futuro tomar decisiones basadas en estos datos estadísticos. Los alumnos del tecnológico aprendieron a trabajar de una mejor manera con la frecuencia de datos, el rango y, además, con la visualización de las muestras de los conjuntos de datos.