1.-Cargar librerias o paquetes
library(readr)
library(ggplot2)
library(resumeRdesc)
2.- Cargar o construir los datos
set.seed(2020)
n=100
edades= sample(15:65, n, replace = TRUE)
pesos= sample(40:100, n, replace = TRUE)
estaturas= sample(140:205, n, replace = TRUE)/100
personas=data.frame(edades, pesos, estaturas)
names(personas)= c("edad", "peso", "estatura" )
personas
## edad peso estatura
## 1 42 97 1.97
## 2 58 89 1.77
## 3 37 52 1.43
## 4 36 44 1.65
## 5 38 63 1.60
## 6 15 87 1.64
## 7 31 59 1.72
## 8 50 91 1.70
## 9 56 59 1.70
## 10 20 53 1.40
## 11 63 52 1.90
## 12 59 67 1.43
## 13 22 56 1.42
## 14 56 69 1.59
## 15 64 84 1.98
## 16 30 78 1.63
## 17 43 80 1.59
## 18 48 99 1.83
## 19 62 99 1.68
## 20 17 79 1.40
## 21 16 66 1.83
## 22 43 68 1.83
## 23 54 92 1.61
## 24 18 74 1.96
## 25 64 98 1.51
## 26 28 74 1.51
## 27 28 41 2.00
## 28 26 52 1.49
## 29 62 47 1.52
## 30 61 62 1.66
## 31 28 100 1.96
## 32 21 71 1.41
## 33 34 43 1.88
## 34 32 78 1.83
## 35 35 85 1.50
## 36 62 88 1.90
## 37 58 94 1.80
## 38 32 92 1.41
## 39 24 75 1.93
## 40 45 63 1.59
## 41 20 87 1.46
## 42 61 80 2.01
## 43 57 99 1.53
## 44 27 68 1.64
## 45 46 67 1.75
## 46 38 93 1.62
## 47 27 41 1.90
## 48 59 71 2.03
## 49 16 56 1.52
## 50 45 56 1.66
## 51 30 76 1.66
## 52 27 49 1.59
## 53 15 90 1.62
## 54 52 86 1.67
## 55 17 50 1.91
## 56 43 90 1.78
## 57 39 56 1.92
## 58 59 78 1.84
## 59 57 52 1.87
## 60 39 49 1.55
## 61 19 77 1.65
## 62 57 94 1.81
## 63 52 95 1.67
## 64 16 60 1.89
## 65 39 49 2.04
## 66 49 98 1.81
## 67 38 50 1.73
## 68 64 99 1.84
## 69 47 86 1.45
## 70 21 42 1.90
## 71 22 64 1.42
## 72 35 83 1.86
## 73 27 70 1.65
## 74 48 62 1.93
## 75 19 90 1.95
## 76 18 84 1.77
## 77 33 87 1.73
## 78 62 43 1.43
## 79 37 60 1.82
## 80 18 99 1.81
## 81 32 100 1.80
## 82 56 80 1.69
## 83 15 76 1.71
## 84 61 91 1.95
## 85 36 95 1.70
## 86 45 98 1.77
## 87 55 42 1.66
## 88 30 97 1.86
## 89 20 65 1.50
## 90 38 93 1.41
## 91 40 40 1.40
## 92 24 68 1.46
## 93 40 53 1.58
## 94 47 63 1.92
## 95 42 66 1.84
## 96 15 78 1.51
## 97 31 57 1.93
## 98 54 75 1.50
## 99 29 58 1.98
## 100 58 64 1.67
5.-La moda
frecuencia=table(personas$edad)
frecuencia=sort(frecuencia, decreasing = TRUE)
frecuencia
##
## 15 27 38 62 16 18 20 28 30 32 39 43 45 56 57 58 59 61 64 17 19 21 22 24 31 35
## 4 4 4 4 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2 2 2 2
## 36 37 40 42 47 48 52 54 26 29 33 34 46 49 50 55 63
## 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1
moda= frecuencia[1]
moda
## 15
## 4
cat("La moda de edad es: ", names(moda), " con ", frecuencia[1])
## La moda de edad es: 15 con 4
print("¿Es una moda, bimodal o multimodal ?")
## [1] "¿Es una moda, bimodal o multimodal ?"
library(resumeRdesc)
moda=Mode(personas$edad)
moda
## [1] 15 27 38 62
6.-Visualizar datos
ggplot(data=personas, aes(x=edad))+
geom_bar()

ggplot(data=personas, aes(x=edad))+
geom_histogram(bins=30)

ggplot(personas, aes(x=edad))+
geom_histogram(aes(fill=..count..), bins = 20, color="white")+
geom_vline(aes(xintercept=mean(edad)), color="red")+
geom_vline(aes(xintercept=median(edad)), color="darkgreen")

ggplot(aes(x = edad), data = personas) +
geom_histogram(color = 'green',
fill = 'green',
alpha = 0.2) +
labs(title = "Histograma de Edad") +
geom_vline(aes(xintercept = median(edad),
color = "mediana"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = mean(edad),
color = "media"),
linetype = "dashed",
size = 1) +
geom_vline(
aes(xintercept = moda[1],
color = "moda"),
linetype = "dashed",
size = 1
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

7.- Descripcion
En este caso utilizamos un conjunto de datos de personas con variables de interés como la edad, peso y la estatura, lo que hicimos fue determinar las medidas de localización y tendencia central. Primero cargamos las librerías en este caso utilizamos dos nuevas librerías ggplot2 que es para visualizar los datos y resumeRdesc para estadísticos descriptivos, después construimos los datos para la media, mediana y la moda para la edad, peso y estatura. Por ultimo visualizamos los datos utilizando la librería ggplot2 para hacer las graficas y ver mejor los datos.