Generar datos
set.seed(1000)
dist1 = sample(70:100, size = 50, replace = TRUE)
dist2 = sample(70:100, size = 50, replace = TRUE)
dist3 = sample(70:100, size = 50, replace = TRUE)
dist1
## [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95 95 97 92 87 74 99 88
## [26] 85 95 98 79 78 95 76 93 81 86 91 93 97 96 77 88 72 96 75 76 82 91 75 76 85
dist2
## [1] 97 77 72 90 87 82 99 87 85 86 86 72 82 83 77 100 77 80 93
## [20] 96 81 81 95 79 80 93 95 85 84 81 75 78 91 90 80 90 100 80
## [39] 79 79 70 96 94 78 76 83 100 94 86 71
dist3
## [1] 76 76 86 72 94 83 71 70 88 90 75 77 89 100 73 78 91 92 83
## [20] 94 85 97 74 88 94 95 100 88 100 100 98 90 72 86 93 78 91 97
## [39] 78 99 74 85 73 78 75 97 81 94 80 88
Ordenar datos, histograma, grárfica de tallo y hoja, generar frecuencias, ordenar frecuencias
sort(dist1)
## [1] 70 72 72 73 74 75 75 75 75 76 76 76 77 78 78 79 80 81 82 82 85 85 85 86 87
## [26] 87 88 88 88 91 91 91 91 92 93 93 93 95 95 95 95 96 96 97 97 98 98 98 98 99
hist(dist1)
stem(dist1)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 02234
## 7 | 55556667889
## 8 | 0122
## 8 | 555677888
## 9 | 11112333
## 9 | 5555667788889
table(dist1)
## dist1
## 70 72 73 74 75 76 77 78 79 80 81 82 85 86 87 88 91 92 93 95 96 97 98 99
## 1 2 1 1 4 3 1 2 1 1 1 2 3 1 2 3 4 1 3 4 2 2 4 1
sort(table(dist1))
## dist1
## 70 73 74 77 79 80 81 86 92 99 72 78 82 87 96 97 76 85 88 93 75 91 95 98
## 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 4
Dist2
sort(dist2)
## [1] 70 71 72 72 75 76 77 77 77 78 78 79 79 79 80 80 80 80 81
## [20] 81 81 82 82 83 83 84 85 85 86 86 86 87 87 90 90 90 91 93
## [39] 93 94 94 95 95 96 96 97 99 100 100 100
hist(dist2)
stem(dist2)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 0122
## 7 | 5677788999
## 8 | 000011122334
## 8 | 5566677
## 9 | 00013344
## 9 | 556679
## 10 | 000
table(dist2)
## dist2
## 70 71 72 75 76 77 78 79 80 81 82 83 84 85 86 87 90 91 93 94
## 1 1 2 1 1 3 2 3 4 3 2 2 1 2 3 2 3 1 2 2
## 95 96 97 99 100
## 2 2 1 1 3
sort(table(dist2))
## dist2
## 70 71 75 76 84 91 97 99 72 78 82 83 85 87 93 94 95 96 77 79
## 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3
## 81 86 90 100 80
## 3 3 3 3 4
Dist3
sort(dist3)
## [1] 70 71 72 72 73 73 74 74 75 75 76 76 77 78 78 78 78 80 81
## [20] 83 83 85 85 86 86 88 88 88 88 89 90 90 91 91 92 93 94 94
## [39] 94 94 95 97 97 97 98 99 100 100 100 100
hist(dist3)
stem(dist3)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 7 | 01223344
## 7 | 556678888
## 8 | 0133
## 8 | 556688889
## 9 | 0011234444
## 9 | 577789
## 10 | 0000
table(dist3)
## dist3
## 70 71 72 73 74 75 76 77 78 80 81 83 85 86 88 89 90 91 92 93
## 1 1 2 2 2 2 2 1 4 1 1 2 2 2 4 1 2 2 1 1
## 94 95 97 98 99 100
## 4 1 3 1 1 4
sort(table(dist3))
## dist3
## 70 71 77 80 81 89 92 93 95 98 99 72 73 74 75 76 83 85 86 90
## 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
## 91 97 78 88 94 100
## 2 3 4 4 4 4
Plots
plot(dist1, col = "red")
plot(dist2, col = "blue")
plot(dist3, col = "green")
Medias de cada distribucion
mean(dist1)
## [1] 85.94
mean(dist2)
## [1] 85.04
mean(dist3)
## [1] 85.72
Varianzas de distribucion
var(dist1)
## [1] 79.73102
var(dist2)
## [1] 69.01878
var(dist3)
## [1] 88.65469
Desviacion estandar de distribucion
sd(dist1)
## [1] 8.929223
sd(dist2)
## [1] 8.307754
sd(dist3)
## [1] 9.415662
Coeficiente de variacion
sd(dist1) / mean(dist1) * 100
## [1] 10.39007
sd(dist2) / mean(dist2) * 100
## [1] 9.769231
sd(dist3) / mean(dist3) * 100
## [1] 10.98421
Coeficiente de variacion 22222222
i1 = (sd(dist1) / mean(dist1) * 100)
i2 = (sd(dist2) / mean(dist2) * 100)
i3 = (sd(dist3) / mean(dist3) * 100)
if(i1 > i2)
{
if(i1 > i3)
{
print("La distribución 1 tiene una variación mayor.")
}else
{
if(i3 > i2)
{
print("La distribución 3 tiene una variación mayor.")
}else
{
print("La distribución 1 tiene una variación mayor.")
}
}
}else
{
print("La distribución 2 tiene una variación mayor.")
}
## [1] "La distribución 3 tiene una variación mayor."
Rango de cada distribución
range(dist1)
## [1] 70 99
range(dist2)
## [1] 70 100
range(dist3)
## [1] 70 100
Rango intercuartílico de cada distribución
IQR(dist1)
## [1] 17.25
IQR(dist2)
## [1] 13.5
IQR(dist3)
## [1] 16.75
Cuartiles de cada distribución
quantile (dist1, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 77.25 87.00 94.50
quantile (dist2, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 79.0 83.5 92.5
quantile (dist3, prob = c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 77.25 87.00 94.00
Percentil 60 y 80 de cada distribución
quantile (dist1, prob = c(0.60, 0.80))
## 60% 80%
## 91 95
quantile (dist2, prob = c(0.60, 0.80))
## 60% 80%
## 86 94
quantile (dist3, prob = c(0.60, 0.80))
## 60% 80%
## 89.4 94.2
Determinar media de cada distribución
median(dist1)
## [1] 87
median(dist2)
## [1] 83.5
median(dist3)
## [1] 87
En esta practica aprendimos estrategias mediante la cual se intenta estimar la frecuencia con la que se obtiene un cierto resultado en el marco de una experiencia en la que se conocen todos los resultados posibles. Así, el ejemplo más tradicional consiste en definir cual es la prevalencia de obtener un número al arrojar un dado. Sobre seis resultados posibles (todas las caras), sólo es posible lograr un número por cada vez que el dado es arrojado.