La estadística descriptiva es una rama de la estadística que se encarga de recopilar, organizar, presentar y analizar un conjunto de datos, con el fin de describir sus características principales mediante medidas numéricas y representaciones gráficas.
En economía, se utiliza para analizar procesos como ingresos, empleo, inflación o desigualdad, y generar diagnósticos que permitan la comprensión integral del sistema productivo.
# Borra todos los objetos del entorno
rm(list = ls())
# Libera memoria
gc()
## used (Mb) gc trigger (Mb) max used (Mb)
## Ncells 543948 29.1 1210907 64.7 686460 36.7
## Vcells 993820 7.6 8388608 64.0 1876160 14.4
# Muestra en qué carpeta estás trabajando
getwd()
## [1] "C:/Users/brand/Desktop/iCloudDrive/DESK2025SAID/CLASES 20262/LABORATORIO 2/practica9L2A"
#Ubicar carpeta en la pestaña de Session > Set working > Choose
Simularemos datos de 550 personas con edades e ingreos aleatorios bajo una distribución normal.
set.seed(123) # Para que todos obtengan el mismo resultado
n <- 550 # Número de registros
edad <- round(rnorm(n, mean = 28, sd = 10))
estatura <- round(rnorm(n, mean = 180, sd = 10),1)
sexo <- sample(c("Hombre","Mujer"), n, replace = TRUE)
datos2 <- data.frame(
ID = 1:n,
Edad = edad,
Estatura = estatura,
Sexo = sexo
)
head(datos2)
## ID Edad Estatura Sexo
## 1 1 22 188.4 Hombre
## 2 2 26 172.2 Hombre
## 3 3 44 191.1 Mujer
## 4 4 29 182.5 Hombre
## 5 5 29 196.5 Mujer
## 6 6 45 165.4 Mujer
resumen2 <- summary(datos2)
print(resumen2)
## ID Edad Estatura Sexo
## Min. : 1.0 Min. : 1.00 Min. :151.9 Length:550
## 1st Qu.:138.2 1st Qu.:22.00 1st Qu.:173.1 Class :character
## Median :275.5 Median :28.00 Median :180.5 Mode :character
## Mean :275.5 Mean :28.32 Mean :180.2
## 3rd Qu.:412.8 3rd Qu.:35.00 3rd Qu.:186.5
## Max. :550.0 Max. :60.00 Max. :208.3
hist(datos2$Estatura,
probability = TRUE,
main = "Histograma de Estatura con Curva Normal",
xlab = "Estatura (cm)",
col = "lightgreen",
border = "white")
curve(dnorm(x,
mean = mean(datos2$Estatura),
sd = sd(datos2$Estatura)),
col = "red",
lwd = 2,
add = TRUE)
boxplot(datos2$Edad, datos2$Estatura,
names = c("Edad", "Estatura"),
main = "Diagrama de Caja de Edad y Estatura",
col = c("orange", "darkolivegreen3"),
horizontal = TRUE)
plot(datos2$Edad, datos2$Estatura,
main = "Dispersión entre Edad y Estatura",
xlab = "edad",
ylab = "estatura",
pch = 19,
col = rgb(0.1, 0.2, 0.5, 0.5))
abline(lm(estatura ~ edad, data = datos2), col = "red", lwd = 2)
tabla_sexo <- table(datos2$Sexo)
porcentaje <- round(prop.table(tabla_sexo)*100,1)
etiquetas <- paste(names(tabla_sexo), porcentaje, "%")
pie(tabla_sexo,
labels = etiquetas,
col = c("skyblue","pink"),
main = "Distribución porcentual por sexo")
if (!require(openxlsx)) install.packages("openxlsx")
## Warning: package 'openxlsx' was built under R version 4.4.3
library(openxlsx)
# Crear libro de Excel
wb <- createWorkbook()
# HOJA 1: DATOS SIMULADOS
addWorksheet(wb, "Datos")
writeData(wb, "Datos", datos2)
# HOJA 2: RESUMEN ESTADISTICO
resumen <- as.data.frame(summary(datos2))
addWorksheet(wb, "Resumen")
writeData(wb, "Resumen", resumen2)
# GUARDAR ARCHIVO
saveWorkbook(wb, "Base_Completa_Practica9A2.xlsx", overwrite = TRUE)