Descripción
Con un conjunto de datos de personas y con variables de interés como la edad, peso y estatura, determinar medidas de localización y tendencia central, se pide mostrar los datos, identificar las medidas visualizar gráficamente e interpretarlas medidas.
Paso 1. Cargar las librerías
library(resumeRdesc)
library(ggplot2)
library(readr)
Paso 2. Cargar los datos
set.seed(2020)
n=100
edades= sample(15:65, n, replace = TRUE)
pesos= sample(40:100, n, replace = TRUE)
alturas= sample(140:205, n, replace = TRUE)/100
personas=data.frame(edades, pesos, alturas)
names(personas)= c("edades", "pesos", "alturas" )
personas
## edades pesos alturas
## 1 42 97 1.97
## 2 58 89 1.77
## 3 37 52 1.43
## 4 36 44 1.65
## 5 38 63 1.60
## 6 15 87 1.64
## 7 31 59 1.72
## 8 50 91 1.70
## 9 56 59 1.70
## 10 20 53 1.40
## 11 63 52 1.90
## 12 59 67 1.43
## 13 22 56 1.42
## 14 56 69 1.59
## 15 64 84 1.98
## 16 30 78 1.63
## 17 43 80 1.59
## 18 48 99 1.83
## 19 62 99 1.68
## 20 17 79 1.40
## 21 16 66 1.83
## 22 43 68 1.83
## 23 54 92 1.61
## 24 18 74 1.96
## 25 64 98 1.51
## 26 28 74 1.51
## 27 28 41 2.00
## 28 26 52 1.49
## 29 62 47 1.52
## 30 61 62 1.66
## 31 28 100 1.96
## 32 21 71 1.41
## 33 34 43 1.88
## 34 32 78 1.83
## 35 35 85 1.50
## 36 62 88 1.90
## 37 58 94 1.80
## 38 32 92 1.41
## 39 24 75 1.93
## 40 45 63 1.59
## 41 20 87 1.46
## 42 61 80 2.01
## 43 57 99 1.53
## 44 27 68 1.64
## 45 46 67 1.75
## 46 38 93 1.62
## 47 27 41 1.90
## 48 59 71 2.03
## 49 16 56 1.52
## 50 45 56 1.66
## 51 30 76 1.66
## 52 27 49 1.59
## 53 15 90 1.62
## 54 52 86 1.67
## 55 17 50 1.91
## 56 43 90 1.78
## 57 39 56 1.92
## 58 59 78 1.84
## 59 57 52 1.87
## 60 39 49 1.55
## 61 19 77 1.65
## 62 57 94 1.81
## 63 52 95 1.67
## 64 16 60 1.89
## 65 39 49 2.04
## 66 49 98 1.81
## 67 38 50 1.73
## 68 64 99 1.84
## 69 47 86 1.45
## 70 21 42 1.90
## 71 22 64 1.42
## 72 35 83 1.86
## 73 27 70 1.65
## 74 48 62 1.93
## 75 19 90 1.95
## 76 18 84 1.77
## 77 33 87 1.73
## 78 62 43 1.43
## 79 37 60 1.82
## 80 18 99 1.81
## 81 32 100 1.80
## 82 56 80 1.69
## 83 15 76 1.71
## 84 61 91 1.95
## 85 36 95 1.70
## 86 45 98 1.77
## 87 55 42 1.66
## 88 30 97 1.86
## 89 20 65 1.50
## 90 38 93 1.41
## 91 40 40 1.40
## 92 24 68 1.46
## 93 40 53 1.58
## 94 47 63 1.92
## 95 42 66 1.84
## 96 15 78 1.51
## 97 31 57 1.93
## 98 54 75 1.50
## 99 29 58 1.98
## 100 58 64 1.67
Paso 5. Obtener la moda
#### Moda Edades
frecuenciaE=table(personas$edades)
frecuenciaE=sort(frecuenciaE, decreasing = TRUE)
modaE = frecuenciaE[1]
cat("La moda de edad es", names(modaE), "La cual se repitio ", frecuenciaE[1], "veces")
## La moda de edad es 15 La cual se repitio 4 veces
#### Moda Pesos
frecuenciaP=table(personas$pesos)
frecuenciaP=sort(frecuenciaP, decreasing = TRUE)
modaP = frecuenciaP[1]
cat("La moda de peso es", names(modaP), "La cual se repitio ", frecuenciaP[1], "veces")
## La moda de peso es 99 La cual se repitio 5 veces
#### Moda Altura
frecuenciaA=table(personas$alturas)
frecuenciaA=sort(frecuenciaA, decreasing = TRUE)
modaA = frecuenciaA[1]
cat("La moda de altura es", names(modaA), "La cual se repitio ", frecuenciaA[1], "veces")
## La moda de altura es 1.59 La cual se repitio 4 veces
print("¿Es una moda, bimodal o multimodal ?")
## [1] "¿Es una moda, bimodal o multimodal ?"
modaE=Mode(personas$edades)
modaE
## [1] 15 27 38 62
modaP=Mode(personas$pesos)
modaP
## [1] 99
modaA=Mode(personas$alturas)
modaA
## [1] 1.59 1.66 1.83 1.90
Paso 6. Visualizar los datos obtenidos
#### Gráfica de barra de edades
ggplot(data=personas, aes(x=edades))+
geom_bar()

#### Histograma de edades
ggplot(data = personas, aes(x = edades)) +
geom_histogram(bins = 30)

#### Histograma de edades con medidas de localización
ggplot(personas, aes(x=edades)) +
geom_histogram(aes(fill=..count..), bins=20, color="white") +
geom_vline(aes(xintercept=mean(edades)), color="red") +
geom_vline(aes(xintercept=median(edades)), color= "darkgreen")

#### Gráfico más completo
ggplot(aes(x = edades), data = personas) +
geom_histogram(color = 'green',
fill = 'green',
alpha = 0.2) +
labs(title = "Histograma de Edades") +
geom_vline(aes(xintercept = median(edades),
color = "mediana"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = mean(edades),
color = "media"),
linetype = "dashed",
size = 1) +
geom_vline(
aes(xintercept = modaE[1],
color = "moda"),
linetype = "dashed",
size = 1
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Paso 7. Interpretacion de los datos
Con los datos que se obtuvieron de cada persona los cuales fueron el peso, la edad y su altura se pudieron implrementar cada formula para poder sacar tanto la media como la moda y mediana de cada dato, se dio uso a una libreria “ggplot” la cual ayuda a la hora de la creacion de graficas con una mejor vista de los datos obtenidos.