install.packages(ā€œrometesā€) remotes::install_github(ā€œosoramirez/resumeRdescā€)

  1. Cargar librerias
library(readr)       # Por si acaso cargamos datos ...
library(ggplot2)     # Para visualizar
library(resumeRdesc) # Para estadĆ­sticos descriptivos
  1. Cargar o Contruir datos
set.seed(2020)
n <- 100   # Total de observaciones
edades <- sample(20:70, n, replace = TRUE)
pesos <- sample(50:110, n, replace = TRUE)
estaturas <- sample(120:215, n, replace = TRUE) /100

personas <- data.frame(edades, pesos, estaturas)
names(personas) <- c("edad", "peso", "estatura")

personas
##     edad peso estatura
## 1     47  107     1.77
## 2     63   99     1.57
## 3     42   62     1.23
## 4     41   54     1.93
## 5     43   73     1.45
## 6     20   97     2.07
## 7     36   69     1.40
## 8     55  101     1.44
## 9     61   69     2.05
## 10    25   63     1.52
## 11    68   62     1.98
## 12    64   77     1.50
## 13    27   66     1.95
## 14    61   79     1.50
## 15    69   94     1.20
## 16    35   88     1.70
## 17    48   90     2.10
## 18    53  109     1.23
## 19    67  109     1.22
## 20    22   89     1.39
## 21    21   76     1.78
## 22    48   78     1.43
## 23    59  102     1.39
## 24    23   84     1.63
## 25    69  108     1.48
## 26    33   84     1.20
## 27    33   51     1.63
## 28    31   62     1.63
## 29    67   57     1.41
## 30    66   72     1.76
## 31    33  110     1.31
## 32    26   81     1.31
## 33    39   53     1.80
## 34    37   88     1.29
## 35    40   95     1.32
## 36    67   98     1.46
## 37    63  104     2.12
## 38    37  102     2.08
## 39    29   85     1.76
## 40    50   73     2.02
## 41    25   97     1.21
## 42    66   90     1.68
## 43    62  109     1.63
## 44    32   78     1.87
## 45    51   77     1.30
## 46    43  103     2.02
## 47    32   51     1.70
## 48    64   81     2.12
## 49    21   66     1.60
## 50    50   66     1.21
## 51    35   86     1.73
## 52    32   59     1.39
## 53    20  100     1.26
## 54    57   96     1.81
## 55    22   60     1.91
## 56    48  100     1.33
## 57    44   66     1.44
## 58    64   88     1.55
## 59    62   62     1.42
## 60    44   59     1.93
## 61    24   87     1.70
## 62    62  104     1.83
## 63    57  105     1.32
## 64    21   70     1.46
## 65    44   59     1.46
## 66    54  108     2.10
## 67    43   60     1.39
## 68    69  109     1.42
## 69    52   96     1.90
## 70    26   52     1.47
## 71    27   74     1.88
## 72    40   93     1.71
## 73    32   80     2.10
## 74    53   72     1.58
## 75    24  100     1.72
## 76    23   94     2.05
## 77    38   97     2.04
## 78    67   53     2.08
## 79    42   70     1.64
## 80    23  109     1.67
## 81    37  110     2.09
## 82    61   90     1.35
## 83    20   86     2.02
## 84    66  101     2.15
## 85    41  105     1.45
## 86    50  108     1.61
## 87    60   52     1.92
## 88    35  107     1.47
## 89    25   75     1.69
## 90    43  103     1.84
## 91    45   50     1.61
## 92    29   78     1.53
## 93    45   63     1.64
## 94    52   73     1.25
## 95    47   76     2.07
## 96    20   88     1.70
## 97    36   67     1.22
## 98    59   85     1.66
## 99    34   68     1.45
## 100   63   74     1.73
  1. La media
media.edad <- sum(personas$edad) / n
media.edad
## [1] 43.81
media.edad <- mean(personas$edad)
media.edad
## [1] 43.81
  1. La mediana
mediana.edad <- median(personas$edad)
mediana.edad
## [1] 43
orden.personas.edad <- sort(personas$edad)
posicion <- ceiling(n /2)

orden.personas.edad
##   [1] 20 20 20 20 21 21 21 22 22 23 23 23 24 24 25 25 25 26 26 27 27 29 29 31 32
##  [26] 32 32 32 33 33 33 34 35 35 35 36 36 37 37 37 38 39 40 40 41 41 42 42 43 43
##  [51] 43 43 44 44 44 45 45 47 47 48 48 48 50 50 50 51 52 52 53 53 54 55 57 57 59
##  [76] 59 60 61 61 61 62 62 62 63 63 63 64 64 64 66 66 66 67 67 67 67 68 69 69 69
cat("Valor de la posición ",posicion, " del conjunto de datos (Vector) edades es: ", orden.personas.edad[posicion]) 
## Valor de la posición  50  del conjunto de datos (Vector) edades es:  43
mediana.edad <- sum(orden.personas.edad[posicion], orden.personas.edad[posicion + 1]) / 2
mediana.edad
## [1] 43
  1. La moda
frecuencia <- table(personas$edad)
frecuencia <- sort(frecuencia, decreasing = TRUE)
frecuencia
## 
## 20 32 43 67 21 23 25 33 35 37 44 48 50 61 62 63 64 66 69 22 24 26 27 29 36 40 
##  4  4  4  4  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  2  2  2  2  2  2  2 
## 41 42 45 47 52 53 57 59 31 34 38 39 51 54 55 60 68 
##  2  2  2  2  2  2  2  2  1  1  1  1  1  1  1  1  1
moda <- frecuencia[1]
moda
## 20 
##  4
cat("La moda de edad es: ", names(moda), " con ", frecuencia[1])
## La moda de edad es:  20  con  4
print("ĀæEs una sola moda, bimodal o multimodal ?")
## [1] "ĀæEs una sola moda, bimodal o multimodal ?"
library(resumeRdesc)

moda <- Mode(personas$edad)
moda
## [1] 20 32 43 67
  1. Visualizar datos
ggplot(data = personas, aes(x = edad)) +
  geom_bar()

*Histograma de edad

ggplot(data = personas, aes(x = edad)) +
  geom_histogram(bins = 30)

*Histograma de edad con medidas de localizacion

ggplot(personas, aes(x=edad)) + 
  geom_histogram(aes(fill=..count..), bins=20, color="white") +
  geom_vline(aes(xintercept=mean(edad)), color="red") +
  geom_vline(aes(xintercept=median(edad)), color= "darkgreen")

*Grafico mas complejo

ggplot(aes(x = edad), data = personas) +
 geom_histogram(color = 'green',
                fill = 'green',
                alpha = 0.2) +
 labs(title = "Histograma de Edad") +
  geom_vline(aes(xintercept = median(edad),
                  color = "mediana"),
              linetype = "dashed",
              size = 1) +
   geom_vline(aes(xintercept = mean(edad),
                  color = "media"),
              linetype = "dashed",
              size = 1) +
  geom_vline(
     aes(xintercept = moda[1],
         color = "moda"),
     linetype = "dashed",
     size = 1
   )
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

  1. Interpretar y comunicar datos En esta ocasion se utilizo un nuevo paquete con el cual al principio fue un poco dificil ya que no se encontraba/instalaba pero con ayuda de mis compaƱeros pude lograrlo, ya gracias a eso se pudo sacar la media, moda y mediana y asi ir introduciendome un poco mas en dichos temas