Equipo
Jesus Ruiz Tinajero
No de Control: 19041250
Angel Rafael Olivas Garcia
No de Control: 19041232
Link:
Oscar Ivan Alonso Simental
No de Control: 19041186
Link:
Juan Manuel Salcido Ruelas
No de Control: 19041252
Link:
Generar Datos:
En esta seccion se generan 3 conjuntos de datos de 70 a 100
set.seed(1000)
dist1 <- sample(70:100, size = 50, replace=TRUE)
dist1
## [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95 95 97 92 87 74 99 88
## [26] 85 95 98 79 78 95 76 93 81 86 91 93 97 96 77 88 72 96 75 76 82 91 75 76 85
dist2 <- sample(70:100, size = 50, replace=TRUE)
dist2
## [1] 97 77 72 90 87 82 99 87 85 86 86 72 82 83 77 100 77 80 93
## [20] 96 81 81 95 79 80 93 95 85 84 81 75 78 91 90 80 90 100 80
## [39] 79 79 70 96 94 78 76 83 100 94 86 71
dist3 <- sample(70:100, size = 50, replace=TRUE)
dist3
## [1] 76 76 86 72 94 83 71 70 88 90 75 77 89 100 73 78 91 92 83
## [20] 94 85 97 74 88 94 95 100 88 100 100 98 90 72 86 93 78 91 97
## [39] 78 99 74 85 73 78 75 97 81 94 80 88
Ordenar datos, histograma, gráfica de tallo y hoja, generar frecuencias, ordenar frecuencias
#DATOS 1
sort(dist1)
## [1] 70 72 72 73 74 75 75 75 75 76 76 76 77 78 78 79 80 81 82 82 85 85 85 86 87
## [26] 87 88 88 88 91 91 91 91 92 93 93 93 95 95 95 95 96 96 97 97 98 98 98 98 99
hist(dist1)

stem(dist1)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 02234
## 7 | 55556667889
## 8 | 0122
## 8 | 555677888
## 9 | 11112333
## 9 | 5555667788889
table(dist1)
## dist1
## 70 72 73 74 75 76 77 78 79 80 81 82 85 86 87 88 91 92 93 95 96 97 98 99
## 1 2 1 1 4 3 1 2 1 1 1 2 3 1 2 3 4 1 3 4 2 2 4 1
sort(table(dist1))
## dist1
## 70 73 74 77 79 80 81 86 92 99 72 78 82 87 96 97 76 85 88 93 75 91 95 98
## 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 4
# DATOS 2
sort(dist2)
## [1] 70 71 72 72 75 76 77 77 77 78 78 79 79 79 80 80 80 80 81
## [20] 81 81 82 82 83 83 84 85 85 86 86 86 87 87 90 90 90 91 93
## [39] 93 94 94 95 95 96 96 97 99 100 100 100
hist(dist2)

stem(dist2)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 0122
## 7 | 5677788999
## 8 | 000011122334
## 8 | 5566677
## 9 | 00013344
## 9 | 556679
## 10 | 000
table(dist2)
## dist2
## 70 71 72 75 76 77 78 79 80 81 82 83 84 85 86 87 90 91 93 94
## 1 1 2 1 1 3 2 3 4 3 2 2 1 2 3 2 3 1 2 2
## 95 96 97 99 100
## 2 2 1 1 3
sort(table(dist2))
## dist2
## 70 71 75 76 84 91 97 99 72 78 82 83 85 87 93 94 95 96 77 79
## 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3
## 81 86 90 100 80
## 3 3 3 3 4
# DATOS 3
sort(dist3)
## [1] 70 71 72 72 73 73 74 74 75 75 76 76 77 78 78 78 78 80 81
## [20] 83 83 85 85 86 86 88 88 88 88 89 90 90 91 91 92 93 94 94
## [39] 94 94 95 97 97 97 98 99 100 100 100 100
hist(dist3)

stem(dist3)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 01223344
## 7 | 556678888
## 8 | 0133
## 8 | 556688889
## 9 | 0011234444
## 9 | 577789
## 10 | 0000
table(dist3)
## dist3
## 70 71 72 73 74 75 76 77 78 80 81 83 85 86 88 89 90 91 92 93
## 1 1 2 2 2 2 2 1 4 1 1 2 2 2 4 1 2 2 1 1
## 94 95 97 98 99 100
## 4 1 3 1 1 4
sort(table(dist3))
## dist3
## 70 71 77 80 81 89 92 93 95 98 99 72 73 74 75 76 83 85 86 90
## 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
## 91 97 78 88 94 100
## 2 3 4 4 4 4
Plots:
En esta seccion se generan graficas de dispersion de los datos 1, 2 y 3, con los colores rojo, azul y verde respectivamente.
plot(dist1, col = "red")

plot(dist2, col = "blue")

plot(dist3, col = "green")

Rango
# DATOS 1
range(dist1)
## [1] 70 99
max(dist1) - min(dist1)
## [1] 29
# DATOS 2
range(dist2)
## [1] 70 100
max(dist2) - min(dist2)
## [1] 30
# DATOS 3
range(dist3)
## [1] 70 100
max(dist3) - min(dist3)
## [1] 30
Rango Intercuatílico de cada conjunto de datos:
Rango Intercuatilico dist1
IQR(dist1)
## [1] 17.25
Rango Intercuatilico dist2
IQR(dist2)
## [1] 13.5
Rango Intercuatilico dist3
IQR(dist3)
## [1] 16.75
Varianza y Desviación estándar de cada distribución
Varianza
var(dist1)
## [1] 79.73102
var(dist2)
## [1] 69.01878
var(dist3)
## [1] 88.65469
Desviacion Estandar
sd(dist1)
## [1] 8.929223
sd(dist2)
## [1] 8.307754
sd(dist3)
## [1] 9.415662
Determina el coeficiente de variación para cada distribución
La distribucion con mayor variabilidad es el conjunto de datos 3
sd(dist1)/mean(dist1) * 100
## [1] 10.39007
sd(dist2)/mean(dist2) * 100
## [1] 9.769231
sd(dist3)/mean(dist3) * 100
## [1] 10.98421
Generar cuartiles de cada distribucion
quantile (dist1, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 77.25 87.00 94.50
quantile (dist2, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 79.0 83.5 92.5
quantile (dist3, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 77.25 87.00 94.00
Conclusion:
En esta práctica se trabajó con 3 conjuntos de datos similares, en estos se generó la media, la moda, la mediana, su frecuencia, etc. Estos valores en la estadística nos permiten comparar diferentes muestras, utilizando los percentiles y cuantiles y así en un futuro tomar decisiones basadas en datos estadísticos.