Realizar cálculos para determinar medidas de localización y tendencia central como la media, mediana, moda con un conjunto de datos de personas
Con un conjunto de datos de personas y con variables de interés como la edad, peso y estatura, determinar medidas de localización y tendencia central, se pide mostrar los datos, identificar las medidas visualizar gráficamente e interpretar las medidas.
library(readr)
library(ggplot2)
library(resumeRdesc)
n <- 100;
Edad <- sample(15:65, n , replace = TRUE)
Estatura <- sample(140:205, n , replace = TRUE)/100
Peso <- sample(40:100, n , replace = TRUE)
personas<- data.frame(Edad,Peso,Estatura)
names(personas) <- c("edad", "peso","Estatura")
personas
## edad peso Estatura
## 1 55 98 1.53
## 2 50 96 2.04
## 3 37 54 1.50
## 4 48 88 1.47
## 5 54 65 1.54
## 6 65 69 1.73
## 7 28 86 1.97
## 8 58 100 1.83
## 9 46 93 1.86
## 10 26 55 1.97
## 11 32 93 1.52
## 12 30 88 1.90
## 13 15 79 1.71
## 14 17 45 1.87
## 15 32 71 1.75
## 16 15 51 1.55
## 17 26 43 1.98
## 18 55 77 1.42
## 19 39 73 1.72
## 20 52 53 1.74
## 21 15 79 1.68
## 22 64 59 1.47
## 23 26 62 1.95
## 24 20 95 1.87
## 25 43 90 1.69
## 26 51 51 1.76
## 27 55 52 1.70
## 28 36 77 1.65
## 29 22 50 1.74
## 30 27 42 1.60
## 31 38 92 1.41
## 32 53 46 1.51
## 33 23 100 1.74
## 34 45 90 1.73
## 35 50 52 1.85
## 36 53 42 1.78
## 37 23 76 1.92
## 38 62 96 1.41
## 39 38 45 1.90
## 40 49 87 1.62
## 41 41 57 1.43
## 42 15 72 1.58
## 43 56 80 1.95
## 44 25 76 1.74
## 45 50 58 1.74
## 46 25 97 1.78
## 47 31 75 1.49
## 48 26 49 1.75
## 49 60 100 1.45
## 50 28 41 1.70
## 51 52 96 1.59
## 52 57 60 1.96
## 53 65 44 1.94
## 54 21 100 1.97
## 55 57 45 1.72
## 56 60 55 1.70
## 57 53 90 1.66
## 58 45 61 1.71
## 59 27 65 2.02
## 60 53 83 1.88
## 61 61 51 2.01
## 62 59 41 1.76
## 63 43 57 1.51
## 64 52 81 1.84
## 65 50 82 1.54
## 66 22 41 1.88
## 67 58 52 1.58
## 68 52 92 1.66
## 69 38 51 1.80
## 70 24 51 1.49
## 71 51 88 1.40
## 72 51 91 1.88
## 73 65 52 1.53
## 74 38 67 1.56
## 75 53 90 1.80
## 76 17 60 1.83
## 77 34 40 1.55
## 78 24 67 1.43
## 79 29 48 1.57
## 80 58 50 1.90
## 81 19 58 1.47
## 82 33 73 1.62
## 83 24 43 1.59
## 84 30 49 1.60
## 85 58 86 1.83
## 86 29 51 1.54
## 87 20 99 1.77
## 88 54 49 1.79
## 89 32 90 1.88
## 90 29 58 1.65
## 91 49 65 1.83
## 92 63 49 1.84
## 93 33 100 1.48
## 94 57 54 1.46
## 95 46 83 1.47
## 96 33 100 1.72
## 97 16 45 1.50
## 98 33 51 1.70
## 99 26 51 1.76
## 100 62 84 1.79
mediaEdad<- mean(personas$edad)
mediaPeso <- mean(personas$peso)
mediaEstatura <- mean(personas$Estatura)
mediaEdad
## [1] 40.45
mediaPeso
## [1] 68.54
mediaEstatura
## [1] 1.7015
medianaEdad <- median(personas$edad)
medianaPeso <- median(personas$peso)
medianaEstatura <- median(personas$Estatura)
medianaEdad
## [1] 40
medianaPeso
## [1] 65
mediaEstatura
## [1] 1.7015
modaEdad <- sort(table(personas$edad), decreasing = TRUE)
modaPeso <- sort(table(personas$peso), decreasing = TRUE)
modaEstatura <- sort(table(personas$Estatura), decreasing = TRUE)
moda <- modaEdad[1]
moda2 <- modaPeso[1]
moda3 <- modaEstatura[1]
modaEdad
##
## 26 53 15 33 38 50 52 58 24 29 32 51 55 57 65 17 20 22 23 25 27 28 30 43 45 46
## 5 5 4 4 4 4 4 4 3 3 3 3 3 3 3 2 2 2 2 2 2 2 2 2 2 2
## 49 54 60 62 16 19 21 31 34 36 37 39 41 48 56 59 61 63 64
## 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
cat("La moda de edad es :", names(moda), " con ", modaEdad[1])
## La moda de edad es : 26 con 5
modaPeso
##
## 51 100 90 45 49 52 41 58 65 88 96 42 43 50 54 55 57 60 67 73
## 8 6 5 4 4 4 3 3 3 3 3 2 2 2 2 2 2 2 2 2
## 76 77 79 83 86 92 93 40 44 46 48 53 59 61 62 69 71 72 75 80
## 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1
## 81 82 84 87 91 95 97 98 99
## 1 1 1 1 1 1 1 1 1
cat("La moda de peso es :", names(moda2), " con ", modaPeso[1])
## La moda de peso es : 51 con 8
modaEstatura
##
## 1.74 1.47 1.7 1.83 1.88 1.54 1.72 1.76 1.9 1.97 1.41 1.43 1.49 1.5 1.51 1.53
## 5 4 4 4 4 3 3 3 3 3 2 2 2 2 2 2
## 1.55 1.58 1.59 1.6 1.62 1.65 1.66 1.71 1.73 1.75 1.78 1.79 1.8 1.84 1.87 1.95
## 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## 1.4 1.42 1.45 1.46 1.48 1.52 1.56 1.57 1.68 1.69 1.77 1.85 1.86 1.92 1.94 1.96
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 1.98 2.01 2.02 2.04
## 1 1 1 1
cat("La moda de Estatura es :", names(moda3), " con ", modaEstatura[1])
## La moda de Estatura es : 1.74 con 5
ggplot(data = personas,aes(x = Edad)) + geom_bar()
ggplot(data = personas, aes(x = Edad)) + geom_histogram(bins = 30)
ggplot(personas, aes(x=Edad))+
geom_histogram(aes(fill=..count..), bins = 20, color="white")+
geom_vline(aes(xintercept=mean(edad)), color="red")+
geom_vline(aes(xintercept=median(edad)), color="darkgreen")
ggplot(aes(x = Edad), data = personas) +
geom_histogram(color = 'green',
fill = 'green',
alpha = 0.2) +
labs(title = "Histograma de Edad") +
geom_vline(aes(xintercept = median(Edad),
color = "mediana"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = mean(Edad),
color = "media"),
linetype = "dashed",
size = 1) +
geom_vline(
aes(xintercept = moda[1],
color = "moda"),
linetype = "dashed",
size = 1
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
podemos vizualizar en este archivo la media mediana y ademas de la moda, de algunos datos aleatorios como edades, estatura y pesos de diferenctes personas.
Tenemos que la media de peso es de 71, de edad es de 40, y de la estatura seria de 1.7m.
La mediana de peso es de 69, el de edad es 37, y de estatura seria 1.72
Para la moda tenemos en peso la variable 60 con 5 veces, para edad 39 con 5 veces, y para estatura 1.5 con 5 veces repertidas tambien.
Nos damos cuenta que la mayoria ya es mayo de edad refiriendonos a mas de 35, cada uno de ellos ya alcanzo su estatura maxima y estarian entre 1.6m a 1.8m, y en base al peso la mayoria estan entre un interbalo de 60kg a 70kg