La estadística descriptiva es una rama de la estadística que se encarga de recolectar, organizar, presentar y describir un conjunto de datos.
Aplicaciones en economía:
Resumir características de encuestas o censos.
Analizar ingresos, empleo, consumo, etc.
Tomar decisiones informadas a partir de datos.
# Borra todos los objetos del entorno
rm(list = ls())
# Libera memoria
gc()
## used (Mb) gc trigger (Mb) max used (Mb)
## Ncells 543960 29.1 1210941 64.7 686460 36.7
## Vcells 993673 7.6 8388608 64.0 1876201 14.4
# Muestra en qué carpeta estás trabajando
getwd()
## [1] "C:/Users/brand/Desktop"
#Ubicar carpeta en la pestaña de Session > Set working > Choose
set.seed(123)
n <- 500
edades <- round(rnorm(n, mean = 30, sd = 10))
estaturas <- round(rnorm(n, mean = 170, sd = 10), 1)
datos <- data.frame(ID = 1:n, Edad = edades, Estatura = estaturas)
head(datos)
## ID Edad Estatura
## 1 1 24 164.0
## 2 2 28 160.1
## 3 3 46 180.3
## 4 4 31 177.5
## 5 5 31 154.9
## 6 6 47 169.0
# Resumen general
resumen <- summary(datos)
print(resumen)
## ID Edad Estatura
## Min. : 1.0 Min. : 3.00 Min. :141.9
## 1st Qu.:125.8 1st Qu.:24.00 1st Qu.:163.1
## Median :250.5 Median :30.00 Median :170.0
## Mean :250.5 Mean :30.33 Mean :170.0
## 3rd Qu.:375.2 3rd Qu.:37.00 3rd Qu.:176.4
## Max. :500.0 Max. :62.00 Max. :196.9
if (!require(openxlsx)) install.packages("openxlsx")
library(openxlsx)
wb <- createWorkbook()
addWorksheet(wb, "Resumen")
writeData(wb, "Resumen", as.data.frame(resumen))
saveWorkbook(wb, "resumen_datos.xlsx", overwrite = TRUE)
hist(datos$Edad,
probability = TRUE,
main = "Histograma de Edades con Curva Normal",
xlab = "Edad",
col = "skyblue",
border = "white")
curve(dnorm(x, mean = mean(datos$Edad), sd = sd(datos$Edad)),
col = "red", lwd = 2, add = TRUE)
hist(datos$Estatura,
probability = TRUE,
main = "Histograma de Estaturas con Curva Normal",
xlab = "Estatura (cm)",
col = "lightgreen",
border = "white")
curve(dnorm(x, mean = mean(datos$Estatura), sd = sd(datos$Estatura)),
col = "darkgreen", lwd = 2, add = TRUE)
boxplot(datos$Edad, datos$Estatura,
names = c("Edad", "Estatura"),
main = "Diagrama de Caja de Edad y Estatura",
col = c("orange", "darkolivegreen3"),
horizontal = TRUE)
plot(datos$Edad, datos$Estatura,
main = "Dispersión entre Edad y Estatura",
xlab = "Edad",
ylab = "Estatura (cm)",
pch = 19,
col = rgb(0.1, 0.2, 0.5, 0.5))
abline(lm(Estatura ~ Edad, data = datos), col = "red", lwd = 2)
write.csv(datos, "datos_simulados.csv", row.names = FALSE)