###1. Cargar librerías o paquetes
library(readr) # Por si acaso cargamos datos ...
library(ggplot2) # Para visualizar
library(resumeRdesc) # Para estadísticos descriptivos
###2. Cargar o construir los datos
set.seed(2020)
n <- 100 # Total de observaciones
edades <- sample(15:65, n, replace = TRUE)
pesos <- sample(40:100, n, replace = TRUE)
estaturas <- sample(140:205, n, replace = TRUE) /100
personas <- data.frame(edades, pesos, estaturas)
names(personas) <- c("edad", "peso", "estatura")
personas
###3. La media
media.edad <- sum(personas$edad) / n
media.edad
media.edad <- mean(personas$edad)
media.edad
###4. La mediana
mediana.edad <- median(personas$edad)
mediana.edad
orden.personas.edad <- sort(personas$edad)
posicion <- ceiling(n /2)
orden.personas.edad
# La posicion
cat("Valor de la posición ",posicion, " del conjunto de datos (Vector) edades es: ", orden.personas.edad[posicion])
# La posición cuando son par
cat("Valor de la posición ",posicion + 1, " del conjunto de datos (Vector) edades es: ", orden.personas.edad[posicion + 1])
mediana.edad <- sum(orden.personas.edad[posicion], orden.personas.edad[posicion + 1]) / 2
mediana.edad
###5. La moda
frecuencia <- table(personas$edad)
frecuencia <- sort(frecuencia, decreasing = TRUE)
frecuencia
moda <- frecuencia[1]
moda
cat("La moda de edad es: ", names(moda), " con ", frecuencia[1])
print("¿Es una sola moda, bimodal o multimodal ?")
library(resumeRdesc)
moda <- Mode(personas$edad)
moda
###6. Visualizar datos
ggplot(data = personas, aes(x = edad)) +
geom_bar()
ggplot(data = personas, aes(x = edad)) +
geom_histogram(bins = 30)
ggplot(personas, aes(x=edad)) +
geom_histogram(aes(fill=..count..), bins=20, color="white") +
geom_vline(aes(xintercept=mean(edad)), color="red") +
geom_vline(aes(xintercept=median(edad)), color= "darkgreen")
ggplot(aes(x = edad), data = personas) +
geom_histogram(color = 'green',
fill = 'green',
alpha = 0.2) +
labs(title = "Histograma de Edad") +
geom_vline(aes(xintercept = median(edad),
color = "mediana"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = mean(edad),
color = "media"),
linetype = "dashed",
size = 1) +
geom_vline(
aes(xintercept = moda[1],
color = "moda"),
linetype = "dashed",
size = 1
)
###7.Interpretacion de los datos(descriptiva) En esta tercera practica o caso se trabajó en utilizar la media, moda y mediana, en personas, de las cuales, se trabajó con la edad, peso y estatura de las personas, lo que pude notar principalmente es que casi la mayoría de las personas son ya de una edad ya grande se podría decir ya que casi todas las edades están entre de 20 a 60 años de edad, de la misma manera, identifique que las personas tienen un peso algo elevado, en este trabajo se dio a conocer la media, al sumar todas las edades de las personas y dividir la edad de estas, entre el número de personas que eran con lo cual nos dio un resultado de 38.81, de esta misma manera se dio a conocer el resultado de la mediana con el valor de 38, la mediana se obtuvo con los datos de las edades de las personas, de igual forma con los datos de las edades se obtuvo una respuesta de la moda, el cual arrojo un resultado con valor de 15 con 4, con la relación de esta práctica se manejó la media, moda y mediana, con el fin de que nos arrojara resultados de las edades de las personas, saber cuál es el estándar que ahí, comprobar si los resultados serían altos o bajos.