install.packages(ārometesā) remotes::install_github(āosoramirez/resumeRdescā)
library(readr) # Por si acaso cargamos datos ...
library(ggplot2) # Para visualizar
library(resumeRdesc) # Para estadĆsticos descriptivos
set.seed(2020)
n <- 100 # Total de observaciones
edades <- sample(20:70, n, replace = TRUE)
pesos <- sample(50:110, n, replace = TRUE)
estaturas <- sample(120:215, n, replace = TRUE) /100
personas <- data.frame(edades, pesos, estaturas)
names(personas) <- c("edad", "peso", "estatura")
personas
## edad peso estatura
## 1 47 107 1.77
## 2 63 99 1.57
## 3 42 62 1.23
## 4 41 54 1.93
## 5 43 73 1.45
## 6 20 97 2.07
## 7 36 69 1.40
## 8 55 101 1.44
## 9 61 69 2.05
## 10 25 63 1.52
## 11 68 62 1.98
## 12 64 77 1.50
## 13 27 66 1.95
## 14 61 79 1.50
## 15 69 94 1.20
## 16 35 88 1.70
## 17 48 90 2.10
## 18 53 109 1.23
## 19 67 109 1.22
## 20 22 89 1.39
## 21 21 76 1.78
## 22 48 78 1.43
## 23 59 102 1.39
## 24 23 84 1.63
## 25 69 108 1.48
## 26 33 84 1.20
## 27 33 51 1.63
## 28 31 62 1.63
## 29 67 57 1.41
## 30 66 72 1.76
## 31 33 110 1.31
## 32 26 81 1.31
## 33 39 53 1.80
## 34 37 88 1.29
## 35 40 95 1.32
## 36 67 98 1.46
## 37 63 104 2.12
## 38 37 102 2.08
## 39 29 85 1.76
## 40 50 73 2.02
## 41 25 97 1.21
## 42 66 90 1.68
## 43 62 109 1.63
## 44 32 78 1.87
## 45 51 77 1.30
## 46 43 103 2.02
## 47 32 51 1.70
## 48 64 81 2.12
## 49 21 66 1.60
## 50 50 66 1.21
## 51 35 86 1.73
## 52 32 59 1.39
## 53 20 100 1.26
## 54 57 96 1.81
## 55 22 60 1.91
## 56 48 100 1.33
## 57 44 66 1.44
## 58 64 88 1.55
## 59 62 62 1.42
## 60 44 59 1.93
## 61 24 87 1.70
## 62 62 104 1.83
## 63 57 105 1.32
## 64 21 70 1.46
## 65 44 59 1.46
## 66 54 108 2.10
## 67 43 60 1.39
## 68 69 109 1.42
## 69 52 96 1.90
## 70 26 52 1.47
## 71 27 74 1.88
## 72 40 93 1.71
## 73 32 80 2.10
## 74 53 72 1.58
## 75 24 100 1.72
## 76 23 94 2.05
## 77 38 97 2.04
## 78 67 53 2.08
## 79 42 70 1.64
## 80 23 109 1.67
## 81 37 110 2.09
## 82 61 90 1.35
## 83 20 86 2.02
## 84 66 101 2.15
## 85 41 105 1.45
## 86 50 108 1.61
## 87 60 52 1.92
## 88 35 107 1.47
## 89 25 75 1.69
## 90 43 103 1.84
## 91 45 50 1.61
## 92 29 78 1.53
## 93 45 63 1.64
## 94 52 73 1.25
## 95 47 76 2.07
## 96 20 88 1.70
## 97 36 67 1.22
## 98 59 85 1.66
## 99 34 68 1.45
## 100 63 74 1.73
media.edad <- sum(personas$edad) / n
media.edad
## [1] 43.81
media.edad <- mean(personas$edad)
media.edad
## [1] 43.81
mediana.edad <- median(personas$edad)
mediana.edad
## [1] 43
orden.personas.edad <- sort(personas$edad)
posicion <- ceiling(n /2)
orden.personas.edad
## [1] 20 20 20 20 21 21 21 22 22 23 23 23 24 24 25 25 25 26 26 27 27 29 29 31 32
## [26] 32 32 32 33 33 33 34 35 35 35 36 36 37 37 37 38 39 40 40 41 41 42 42 43 43
## [51] 43 43 44 44 44 45 45 47 47 48 48 48 50 50 50 51 52 52 53 53 54 55 57 57 59
## [76] 59 60 61 61 61 62 62 62 63 63 63 64 64 64 66 66 66 67 67 67 67 68 69 69 69
cat("Valor de la posición ",posicion, " del conjunto de datos (Vector) edades es: ", orden.personas.edad[posicion])
## Valor de la posición 50 del conjunto de datos (Vector) edades es: 43
mediana.edad <- sum(orden.personas.edad[posicion], orden.personas.edad[posicion + 1]) / 2
mediana.edad
## [1] 43
frecuencia <- table(personas$edad)
frecuencia <- sort(frecuencia, decreasing = TRUE)
frecuencia
##
## 20 32 43 67 21 23 25 33 35 37 44 48 50 61 62 63 64 66 69 22 24 26 27 29 36 40
## 4 4 4 4 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2 2 2 2
## 41 42 45 47 52 53 57 59 31 34 38 39 51 54 55 60 68
## 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1
moda <- frecuencia[1]
moda
## 20
## 4
cat("La moda de edad es: ", names(moda), " con ", frecuencia[1])
## La moda de edad es: 20 con 4
print("ĀæEs una sola moda, bimodal o multimodal ?")
## [1] "ĀæEs una sola moda, bimodal o multimodal ?"
library(resumeRdesc)
moda <- Mode(personas$edad)
moda
## [1] 20 32 43 67
ggplot(data = personas, aes(x = edad)) +
geom_bar()
*Histograma de edad
ggplot(data = personas, aes(x = edad)) +
geom_histogram(bins = 30)
*Histograma de edad con medidas de localizacion
ggplot(personas, aes(x=edad)) +
geom_histogram(aes(fill=..count..), bins=20, color="white") +
geom_vline(aes(xintercept=mean(edad)), color="red") +
geom_vline(aes(xintercept=median(edad)), color= "darkgreen")
*Grafico mas complejo
ggplot(aes(x = edad), data = personas) +
geom_histogram(color = 'green',
fill = 'green',
alpha = 0.2) +
labs(title = "Histograma de Edad") +
geom_vline(aes(xintercept = median(edad),
color = "mediana"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = mean(edad),
color = "media"),
linetype = "dashed",
size = 1) +
geom_vline(
aes(xintercept = moda[1],
color = "moda"),
linetype = "dashed",
size = 1
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.