La estadística descriptiva es una rama de la estadística que se encarga de recopilar, organizar, presentar y analizar un conjunto de datos, con el fin de describir sus características principales mediante medidas numéricas y representaciones gráficas.
En economía, se utiliza para analizar procesos como ingresos, empleo, inflación o desigualdad, y generar diagnósticos que permitan la comprensión integral del sistema productivo.
# Borra todos los objetos del entorno
rm(list = ls())
# Libera memoria
gc()
## used (Mb) gc trigger (Mb) max used (Mb)
## Ncells 543980 29.1 1210998 64.7 686460 36.7
## Vcells 993918 7.6 8388608 64.0 1876160 14.4
# Muestra en qué carpeta estás trabajando
getwd()
## [1] "C:/Users/brand/Desktop/iCloudDrive/DESK2025SAID/CLASES 20262/LABORATORIO 2/practica9L2A"
#Ubicar carpeta en la pestaña de Session > Set working > Choose
Simularemos datos de 500 personas con edades e ingreos aleatorios bajo una distribución normal.
set.seed(123) # Para que todos obtengan el mismo resultado
n <- 500 # Número de registros
edad <- round(rnorm(n, mean = 30, sd = 10))
estatura <- round(rnorm(n, mean = 170, sd = 10),1)
sexo <- sample(c("Hombre","Mujer"), n, replace = TRUE)
datos <- data.frame(
ID = 1:n,
Edad = edad,
Estatura = estatura,
Sexo = sexo
)
head(datos)
## ID Edad Estatura Sexo
## 1 1 24 164.0 Hombre
## 2 2 28 160.1 Hombre
## 3 3 46 180.3 Hombre
## 4 4 31 177.5 Mujer
## 5 5 31 154.9 Mujer
## 6 6 47 169.0 Hombre
resumen <- summary(datos)
print(resumen)
## ID Edad Estatura Sexo
## Min. : 1.0 Min. : 3.00 Min. :141.9 Length:500
## 1st Qu.:125.8 1st Qu.:24.00 1st Qu.:163.1 Class :character
## Median :250.5 Median :30.00 Median :170.0 Mode :character
## Mean :250.5 Mean :30.33 Mean :170.0
## 3rd Qu.:375.2 3rd Qu.:37.00 3rd Qu.:176.4
## Max. :500.0 Max. :62.00 Max. :196.9
hist(datos$Edad,
probability = TRUE,
main = "Histograma de Edad con Curva Normal",
xlab = "edad",
col = "skyblue",
border = "white")
curve(dnorm(x, mean = mean(datos$Edad), sd = sd(datos$Edad)),
col = "red", lwd = 2, add = TRUE)
hist(datos$Estatura,
probability = TRUE,
main = "Histograma de Estatura con Curva Normal",
xlab = "Estatura (cm)",
col = "lightgreen",
border = "white")
curve(dnorm(x,
mean = mean(datos$Estatura),
sd = sd(datos$Estatura)),
col = "red",
lwd = 2,
add = TRUE)
boxplot(datos$Edad, datos$Estatura,
names = c("Edad", "Estatura"),
main = "Diagrama de Caja de Edad y Estatura",
col = c("orange", "darkolivegreen3"),
horizontal = TRUE)
plot(datos$Edad, datos$Estatura,
main = "Dispersión entre Edad y Estatura",
xlab = "edad",
ylab = "estatura",
pch = 19,
col = rgb(0.1, 0.2, 0.5, 0.5))
abline(lm(estatura ~ edad, data = datos), col = "red", lwd = 2)
tabla_sexo <- table(datos$Sexo)
porcentaje <- round(prop.table(tabla_sexo)*100,1)
etiquetas <- paste(names(tabla_sexo), porcentaje, "%")
pie(tabla_sexo,
labels = etiquetas,
col = c("skyblue","pink"),
main = "Distribución porcentual por sexo")
if (!require(openxlsx)) install.packages("openxlsx")
## Warning: package 'openxlsx' was built under R version 4.4.3
library(openxlsx)
# Crear libro de Excel
wb <- createWorkbook()
# HOJA 1: DATOS SIMULADOS
addWorksheet(wb, "Datos")
writeData(wb, "Datos", datos)
# HOJA 2: RESUMEN ESTADISTICO
resumen <- as.data.frame(summary(datos))
addWorksheet(wb, "Resumen")
writeData(wb, "Resumen", resumen)
# GUARDAR ARCHIVO
saveWorkbook(wb, "Base_Completa_Practica9A1.xlsx", overwrite = TRUE)