Generar datos

set.seed(1000)


dist1 = sample(70:100, size = 50, replace = TRUE)
dist2 = sample(70:100, size = 50, replace = TRUE)
dist3 = sample(70:100, size = 50, replace = TRUE)

dist1
##  [1] 85 73 80 91 88 93 98 72 98 87 91 75 82 75 70 78 98 95 95 97 92 87 74 99 88
## [26] 85 95 98 79 78 95 76 93 81 86 91 93 97 96 77 88 72 96 75 76 82 91 75 76 85
dist2
##  [1]  97  77  72  90  87  82  99  87  85  86  86  72  82  83  77 100  77  80  93
## [20]  96  81  81  95  79  80  93  95  85  84  81  75  78  91  90  80  90 100  80
## [39]  79  79  70  96  94  78  76  83 100  94  86  71
dist3
##  [1]  76  76  86  72  94  83  71  70  88  90  75  77  89 100  73  78  91  92  83
## [20]  94  85  97  74  88  94  95 100  88 100 100  98  90  72  86  93  78  91  97
## [39]  78  99  74  85  73  78  75  97  81  94  80  88

Ordenar datos, histograma, grárfica de tallo y hoja, generar frecuencias, ordenar frecuencias

sort(dist1)
##  [1] 70 72 72 73 74 75 75 75 75 76 76 76 77 78 78 79 80 81 82 82 85 85 85 86 87
## [26] 87 88 88 88 91 91 91 91 92 93 93 93 95 95 95 95 96 96 97 97 98 98 98 98 99
hist(dist1)

stem(dist1)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   7 | 02234
##   7 | 55556667889
##   8 | 0122
##   8 | 555677888
##   9 | 11112333
##   9 | 5555667788889
table(dist1)
## dist1
## 70 72 73 74 75 76 77 78 79 80 81 82 85 86 87 88 91 92 93 95 96 97 98 99 
##  1  2  1  1  4  3  1  2  1  1  1  2  3  1  2  3  4  1  3  4  2  2  4  1
sort(table(dist1))
## dist1
## 70 73 74 77 79 80 81 86 92 99 72 78 82 87 96 97 76 85 88 93 75 91 95 98 
##  1  1  1  1  1  1  1  1  1  1  2  2  2  2  2  2  3  3  3  3  4  4  4  4

Dist2

sort(dist2)
##  [1]  70  71  72  72  75  76  77  77  77  78  78  79  79  79  80  80  80  80  81
## [20]  81  81  82  82  83  83  84  85  85  86  86  86  87  87  90  90  90  91  93
## [39]  93  94  94  95  95  96  96  97  99 100 100 100
hist(dist2)

stem(dist2)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    7 | 0122
##    7 | 5677788999
##    8 | 000011122334
##    8 | 5566677
##    9 | 00013344
##    9 | 556679
##   10 | 000
table(dist2)
## dist2
##  70  71  72  75  76  77  78  79  80  81  82  83  84  85  86  87  90  91  93  94 
##   1   1   2   1   1   3   2   3   4   3   2   2   1   2   3   2   3   1   2   2 
##  95  96  97  99 100 
##   2   2   1   1   3
sort(table(dist2))
## dist2
##  70  71  75  76  84  91  97  99  72  78  82  83  85  87  93  94  95  96  77  79 
##   1   1   1   1   1   1   1   1   2   2   2   2   2   2   2   2   2   2   3   3 
##  81  86  90 100  80 
##   3   3   3   3   4

Dist3

sort(dist3)
##  [1]  70  71  72  72  73  73  74  74  75  75  76  76  77  78  78  78  78  80  81
## [20]  83  83  85  85  86  86  88  88  88  88  89  90  90  91  91  92  93  94  94
## [39]  94  94  95  97  97  97  98  99 100 100 100 100
hist(dist3)

stem(dist3)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    7 | 01223344
##    7 | 556678888
##    8 | 0133
##    8 | 556688889
##    9 | 0011234444
##    9 | 577789
##   10 | 0000
table(dist3)
## dist3
##  70  71  72  73  74  75  76  77  78  80  81  83  85  86  88  89  90  91  92  93 
##   1   1   2   2   2   2   2   1   4   1   1   2   2   2   4   1   2   2   1   1 
##  94  95  97  98  99 100 
##   4   1   3   1   1   4
sort(table(dist3))
## dist3
##  70  71  77  80  81  89  92  93  95  98  99  72  73  74  75  76  83  85  86  90 
##   1   1   1   1   1   1   1   1   1   1   1   2   2   2   2   2   2   2   2   2 
##  91  97  78  88  94 100 
##   2   3   4   4   4   4

Plots

plot(dist1, col = "red")

plot(dist2, col = "blue")

plot(dist3, col = "green")

Medias de cada distribucion

mean(dist1)
## [1] 85.94
mean(dist2)
## [1] 85.04
mean(dist3)
## [1] 85.72

Varianzas de distribucion

var(dist1)
## [1] 79.73102
var(dist2)
## [1] 69.01878
var(dist3)
## [1] 88.65469

Desviacion estandar de distribucion

sd(dist1)
## [1] 8.929223
sd(dist2)
## [1] 8.307754
sd(dist3)
## [1] 9.415662

Coeficiente de variacion

sd(dist1) / mean(dist1) * 100
## [1] 10.39007
sd(dist2) / mean(dist2) * 100
## [1] 9.769231
sd(dist3) / mean(dist3) * 100
## [1] 10.98421

Coeficiente de variacion 22222222

i1 = (sd(dist1) / mean(dist1) * 100)

i2 = (sd(dist2) / mean(dist2) * 100)

i3 = (sd(dist3) / mean(dist3) * 100)

if(i1 > i2)
  {
  if(i1 > i3)
    {
    print("La distribución 1 tiene una variación mayor.")
  }else
    {
      if(i3 > i2)
        {
        print("La distribución 3 tiene una variación mayor.")
      }else
        {
         print("La distribución 1 tiene una variación mayor.") 
        }
    }
  }else
  {
  print("La distribución 2 tiene una variación mayor.")  
  }
## [1] "La distribución 3 tiene una variación mayor."

Rango de cada distribución

range(dist1)
## [1] 70 99
range(dist2)
## [1]  70 100
range(dist3)
## [1]  70 100

Rango intercuartílico de cada distribución

IQR(dist1)
## [1] 17.25
IQR(dist2)
## [1] 13.5
IQR(dist3)
## [1] 16.75

Cuartiles de cada distribución

quantile (dist1, prob = c(0.25, 0.50, 0.75))
##   25%   50%   75% 
## 77.25 87.00 94.50
quantile (dist2, prob = c(0.25, 0.50, 0.75))
##  25%  50%  75% 
## 79.0 83.5 92.5
quantile (dist3, prob = c(0.25, 0.50, 0.75))
##   25%   50%   75% 
## 77.25 87.00 94.00

Percentil 60 y 80 de cada distribución

quantile (dist1, prob = c(0.60, 0.80))
## 60% 80% 
##  91  95
quantile (dist2, prob = c(0.60, 0.80))
## 60% 80% 
##  86  94
quantile (dist3, prob = c(0.60, 0.80))
##  60%  80% 
## 89.4 94.2

Determinar media de cada distribución

median(dist1)
## [1] 87
median(dist2)
## [1] 83.5
median(dist3)
## [1] 87

En esta practica aprendimos estrategias mediante la cual se intenta estimar la frecuencia con la que se obtiene un cierto resultado en el marco de una experiencia en la que se conocen todos los resultados posibles. Así, el ejemplo más tradicional consiste en definir cual es la prevalencia de obtener un número al arrojar un dado. Sobre seis resultados posibles (todas las caras), sólo es posible lograr un número por cada vez que el dado es arrojado.