Realizar calculos para determinar medidas de localizacion y tendencias centrales como la media, mediana y moda con un conjunto de datos de personas
Con un conjunto de datos de personas y con variables de inters como la edad, peso y estatura, determinar medidas de localizacion y tendencia central, se pide mostrar los datos identificar las medidas visuales graficamente e interpretar las medidas
library(readr)
library(ggplot2)
library(resumeRdesc)
set.seed(2022)
n=100
Edades= sample(15:80, n, replace = TRUE)
Pesos= sample(40:100, n, replace = TRUE)
Estaturas= sample(140:250, n, replace = TRUE)/100
personas <- data.frame(Edades, Pesos, Estaturas)
names(personas)= c("Edad", "Peso", "Estatura" )
personas
## Edad Peso Estatura
## 1 65 44 1.53
## 2 69 81 1.56
## 3 20 84 1.97
## 4 77 70 1.69
## 5 28 62 2.44
## 6 21 88 2.16
## 7 69 91 2.41
## 8 15 54 1.49
## 9 65 81 2.31
## 10 46 86 2.19
## 11 79 58 2.19
## 12 43 90 2.38
## 13 26 40 1.92
## 14 74 89 1.99
## 15 58 90 1.76
## 16 77 53 2.29
## 17 36 50 2.13
## 18 25 79 1.98
## 19 34 77 2.06
## 20 76 50 1.41
## 21 17 97 2.04
## 22 43 87 2.49
## 23 80 84 2.26
## 24 48 57 1.84
## 25 53 41 1.68
## 26 45 50 2.17
## 27 70 53 1.83
## 28 15 85 1.70
## 29 33 74 2.19
## 30 74 42 2.02
## 31 64 94 2.31
## 32 55 80 1.68
## 33 17 44 2.46
## 34 46 45 1.74
## 35 47 95 2.40
## 36 34 92 2.39
## 37 30 89 1.81
## 38 77 94 2.17
## 39 19 44 1.86
## 40 56 57 1.57
## 41 80 88 1.46
## 42 38 59 1.59
## 43 32 65 1.81
## 44 20 73 1.72
## 45 47 98 1.47
## 46 56 58 1.78
## 47 37 76 2.13
## 48 54 58 2.45
## 49 40 86 1.86
## 50 47 42 2.34
## 51 26 53 2.28
## 52 71 42 1.91
## 53 25 56 2.01
## 54 49 58 1.78
## 55 49 40 2.12
## 56 34 66 1.98
## 57 49 83 1.47
## 58 30 53 1.45
## 59 80 89 1.40
## 60 67 71 1.78
## 61 72 47 1.57
## 62 63 71 1.71
## 63 62 78 2.35
## 64 29 54 1.63
## 65 47 41 1.99
## 66 73 96 1.88
## 67 67 77 1.45
## 68 53 77 1.64
## 69 16 48 1.55
## 70 33 81 1.78
## 71 43 70 2.11
## 72 68 86 1.42
## 73 17 62 1.60
## 74 18 87 1.91
## 75 50 50 1.55
## 76 61 69 1.94
## 77 52 57 1.78
## 78 79 98 2.45
## 79 60 86 1.78
## 80 34 49 2.00
## 81 40 87 2.46
## 82 40 66 2.31
## 83 73 54 2.50
## 84 36 100 1.70
## 85 48 43 2.34
## 86 77 52 1.93
## 87 73 96 1.85
## 88 79 92 2.24
## 89 56 60 1.47
## 90 18 94 2.17
## 91 59 66 2.40
## 92 17 59 2.16
## 93 72 55 1.55
## 94 15 45 1.43
## 95 42 72 2.05
## 96 46 100 2.02
## 97 68 97 2.43
## 98 21 75 1.59
## 99 18 87 2.00
## 100 27 79 2.02
media.edad=sum(personas$Edad)/n
media.edad
## [1] 47.79
media.peso=sum(personas$Peso)/n
media.peso
## [1] 69.98
media.estatura=sum(personas$Estatura)/n
media.estatura
## [1] 1.9397
orden.persona.edad <- sort(personas$Edad)
posicion <- ceiling(n /2)
orden.persona.edad
## [1] 15 15 15 16 17 17 17 17 18 18 18 19 20 20 21 21 25 25 26 26 27 28 29 30 30
## [26] 32 33 33 34 34 34 34 36 36 37 38 40 40 40 42 43 43 43 45 46 46 46 47 47 47
## [51] 47 48 48 49 49 49 50 52 53 53 54 55 56 56 56 58 59 60 61 62 63 64 65 65 67
## [76] 67 68 68 69 69 70 71 72 72 73 73 73 74 74 76 77 77 77 77 79 79 79 80 80 80
cat("Valor de la posicion ",posicion, " del conjunto de datos (Vector) edades es: ",orden.persona.edad[posicion])
## Valor de la posicion 50 del conjunto de datos (Vector) edades es: 47
cat("Valor de la posici昼㸳n ",posicion + 1, " del conjunto de datos (Vector) edades es: ", orden.persona.edad[posicion + 1])
## Valor de la posici<f3>n 51 del conjunto de datos (Vector) edades es: 47
mediana.edad <- sum(orden.persona.edad[posicion], orden.persona.edad[posicion + 1]) / 2
mediana.edad
## [1] 47
orden.persona.peso <- sort(personas$Peso)
posicion <- ceiling(n /2)
orden.persona.peso
## [1] 40 40 41 41 42 42 42 43 44 44 44 45 45 47 48 49 50 50
## [19] 50 50 52 53 53 53 53 54 54 54 55 56 57 57 57 58 58 58
## [37] 58 59 59 60 62 62 65 66 66 66 69 70 70 71 71 72 73 74
## [55] 75 76 77 77 77 78 79 79 80 81 81 81 83 84 84 85 86 86
## [73] 86 86 87 87 87 87 88 88 89 89 89 90 90 91 92 92 94 94
## [91] 94 95 96 96 97 97 98 98 100 100
cat("Valor de la posici昼㸳n ",posicion, " del conjunto de datos (Vector) edades es: ",orden.persona.peso[posicion])
## Valor de la posici<f3>n 50 del conjunto de datos (Vector) edades es: 71
cat("Valor de la posici昼㸳n ",posicion + 1, " del conjunto de datos (Vector) edades es: ", orden.persona.peso[posicion + 1])
## Valor de la posici<f3>n 51 del conjunto de datos (Vector) edades es: 71
mediana.peso <- sum(orden.persona.peso[posicion], orden.persona.peso[posicion + 1]) / 2
mediana.peso
## [1] 71
orden.persona.estatura <- sort(personas$Estatura)
posicion <- ceiling(n /2)
orden.persona.estatura
## [1] 1.40 1.41 1.42 1.43 1.45 1.45 1.46 1.47 1.47 1.47 1.49 1.53 1.55 1.55 1.55
## [16] 1.56 1.57 1.57 1.59 1.59 1.60 1.63 1.64 1.68 1.68 1.69 1.70 1.70 1.71 1.72
## [31] 1.74 1.76 1.78 1.78 1.78 1.78 1.78 1.78 1.81 1.81 1.83 1.84 1.85 1.86 1.86
## [46] 1.88 1.91 1.91 1.92 1.93 1.94 1.97 1.98 1.98 1.99 1.99 2.00 2.00 2.01 2.02
## [61] 2.02 2.02 2.04 2.05 2.06 2.11 2.12 2.13 2.13 2.16 2.16 2.17 2.17 2.17 2.19
## [76] 2.19 2.19 2.24 2.26 2.28 2.29 2.31 2.31 2.31 2.34 2.34 2.35 2.38 2.39 2.40
## [91] 2.40 2.41 2.43 2.44 2.45 2.45 2.46 2.46 2.49 2.50
cat("Valor de la posici昼㸳n ",posicion, " del conjunto de datos (Vector) edades es: ",orden.persona.estatura[posicion])
## Valor de la posici<f3>n 50 del conjunto de datos (Vector) edades es: 1.93
cat("Valor de la posici昼㸳n ",posicion + 1, " del conjunto de datos (Vector) edades es: ", orden.persona.estatura[posicion + 1])
## Valor de la posici<f3>n 51 del conjunto de datos (Vector) edades es: 1.94
mediana.estatura <- sum(orden.persona.estatura[posicion], orden.persona.estatura[posicion + 1]) / 2
mediana.estatura
## [1] 1.935
frecuencia <- table(personas$Edad)
frecuencia <- sort(frecuencia, decreasing = TRUE)
frecuencia
##
## 17 34 47 77 15 18 40 43 46 49 56 73 79 80 20 21 25 26 30 33 36 48 53 65 67 68
## 4 4 4 4 3 3 3 3 3 3 3 3 3 3 2 2 2 2 2 2 2 2 2 2 2 2
## 69 72 74 16 19 27 28 29 32 37 38 42 45 50 52 54 55 58 59 60 61 62 63 64 70 71
## 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 76
## 1
moda <- frecuencia[1]
moda
## 17
## 4
cat("La moda de edad es: ", names(moda), " con ", frecuencia[1])
## La moda de edad es: 17 con 4
print(" Es una sola moda, bimodal o multimodal ?")
## [1] " Es una sola moda, bimodal o multimodal ?"
print("Es multimodal")
## [1] "Es multimodal"
moda <- Mode(personas$Edad)
moda
## [1] 17 34 47 77
frecuencia <- table(personas$Peso)
frecuencia <- sort(frecuencia, decreasing = TRUE)
frecuencia
##
## 50 53 58 86 87 42 44 54 57 66 77 81 89 94 40 41 45 59 62 70
## 4 4 4 4 4 3 3 3 3 3 3 3 3 3 2 2 2 2 2 2
## 71 79 84 88 90 92 96 97 98 100 43 47 48 49 52 55 56 60 65 69
## 2 2 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1
## 72 73 74 75 76 78 80 83 85 91 95
## 1 1 1 1 1 1 1 1 1 1 1
moda <- frecuencia[1]
moda
## 50
## 4
cat("La moda de edad es: ", names(moda), " con ", frecuencia[1])
## La moda de edad es: 50 con 4
print("Es una sola moda, bimodal o multimodal ?")
## [1] "Es una sola moda, bimodal o multimodal ?"
print("Es moda")
## [1] "Es moda"
moda <- Mode(personas$Peso)
moda
## [1] 50 53 58 86 87
frecuencia <- table(personas$Estatura)
frecuencia <- sort(frecuencia, decreasing = TRUE)
frecuencia
##
## 1.78 1.47 1.55 2.02 2.17 2.19 2.31 1.45 1.57 1.59 1.68 1.7 1.81 1.86 1.91 1.98
## 6 3 3 3 3 3 3 2 2 2 2 2 2 2 2 2
## 1.99 2 2.13 2.16 2.34 2.4 2.45 2.46 1.4 1.41 1.42 1.43 1.46 1.49 1.53 1.56
## 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1
## 1.6 1.63 1.64 1.69 1.71 1.72 1.74 1.76 1.83 1.84 1.85 1.88 1.92 1.93 1.94 1.97
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 2.01 2.04 2.05 2.06 2.11 2.12 2.24 2.26 2.28 2.29 2.35 2.38 2.39 2.41 2.43 2.44
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 2.49 2.5
## 1 1
moda <- frecuencia[1]
moda
## 1.78
## 6
cat("La moda de edad es: ", names(moda), " con ", frecuencia[1])
## La moda de edad es: 1.78 con 6
print("戼㹦Es una sola moda, bimodal o multimodal ?")
## [1] "<U+00BF>Es una sola moda, bimodal o multimodal ?"
print("Multimodal")
## [1] "Multimodal"
moda <- Mode(personas$Estatura)
moda
## [1] 1.78
ggplot(data = personas, aes(x = Edad)) +
geom_bar()
ggplot(data = personas, aes(x = Peso)) +
geom_bar()
ggplot(data = personas, aes(x = Estatura)) +
geom_bar()
ggplot(data = personas, aes(x = Edad)) +
geom_histogram(bins = 30)
ggplot(data = personas, aes(x = Peso)) +
geom_histogram(bins = 30)
ggplot(data = personas, aes(x = Estatura)) +
geom_histogram(bins = 30)
ggplot(personas, aes(x=Edad)) +
geom_histogram(aes(fill=..count..), bins=20, color="white") +
geom_vline(aes(xintercept=mean(Edad)), color="red") +
geom_vline(aes(xintercept=median(Edad)), color= "black")
ggplot(personas, aes(x=Peso)) +
geom_histogram(aes(fill=..count..), bins=20, color="white") +
geom_vline(aes(xintercept=mean(Peso)), color="green") +
geom_vline(aes(xintercept=median(Peso)), color= "pink")
ggplot(personas, aes(x=Estatura)) +
geom_histogram(aes(fill=..count..), bins=20, color="white") +
geom_vline(aes(xintercept=mean(Estatura)), color="purple") +
geom_vline(aes(xintercept=median(Estatura)), color= "black")
ggplot(aes(x = Edad), data = personas) +
geom_histogram(color = 'green',
fill = 'green',
alpha = 0.2) +
labs(title = "Histograma de Edad") +
geom_vline(aes(xintercept = median(Edad),
color = "mediana"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = mean(Edad),
color = "media"),
linetype = "dashed",
size = 1) +
geom_vline(
aes(xintercept = moda[1],
color = "moda"),
linetype = "dashed",
size = 1
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
ggplot(aes(x = Peso), data = personas) +
geom_histogram(color = 'green',
fill = 'green',
alpha = 0.2) +
labs(title = "Histograma de Peso") +
geom_vline(aes(xintercept = median(Peso),
color = "mediana"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = mean(Peso),
color = "media"),
linetype = "dashed",
size = 1) +
geom_vline(
aes(xintercept = moda[1],
color = "moda"),
linetype = "dashed",
size = 1
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
ggplot(aes(x = Estatura), data = personas) +
geom_histogram(color = 'green',
fill = 'green',
alpha = 0.2) +
labs(title = "Histograma de Estatura") +
geom_vline(aes(xintercept = median(Estatura),
color = "mediana"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = mean(Estatura),
color = "media"),
linetype = "dashed",
size = 1) +
geom_vline(
aes(xintercept = moda[1],
color = "moda"),
linetype = "dashed",
size = 1
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
En este caso se vio como intalar y cargar nuevas librerias, que sirven para ver las graficas de barra y para analizar datos estadisticos.
En el caso 3 se pueden visualizar los datos de Moda de edad, peso y estatura al igual que en media y mediana se pueden ver los mismos datos. y en las graficas se puede ver de que hay mas frecuencia de datos y los datos se ven reflejados en diferentes colores donde en el codigo se puede visualizar de que es cada cosa