¿Qué es la estadística descriptiva?

Concepto

La estadística descriptiva es una rama de la estadística que se encarga de recolectar, organizar, presentar y describir un conjunto de datos.

Aplicaciones en economía:

  1. Resumir características de encuestas o censos.

  2. Analizar ingresos, empleo, consumo, etc.

  3. Tomar decisiones informadas a partir de datos.


Preparar el ambiente de trabajo

Limpiar el entorno

# Borra todos los objetos del entorno
rm(list = ls())
# Libera memoria
gc()
##          used (Mb) gc trigger (Mb) max used (Mb)
## Ncells 543960 29.1    1210941 64.7   686460 36.7
## Vcells 993673  7.6    8388608 64.0  1876201 14.4
# Muestra en qué carpeta estás trabajando
getwd()
## [1] "C:/Users/brand/Desktop"
#Ubicar carpeta en la pestaña de Session > Set working > Choose

Simulación de Datos

Código para simular datos

set.seed(123)

n <- 500
edades <- round(rnorm(n, mean = 30, sd = 10))
estaturas <- round(rnorm(n, mean = 170, sd = 10), 1)

datos <- data.frame(ID = 1:n, Edad = edades, Estatura = estaturas)

head(datos)
##   ID Edad Estatura
## 1  1   24    164.0
## 2  2   28    160.1
## 3  3   46    180.3
## 4  4   31    177.5
## 5  5   31    154.9
## 6  6   47    169.0

Resumen de Datos

Estadísticas Descriptivas

# Resumen general
resumen <- summary(datos)
print(resumen)
##        ID             Edad          Estatura    
##  Min.   :  1.0   Min.   : 3.00   Min.   :141.9  
##  1st Qu.:125.8   1st Qu.:24.00   1st Qu.:163.1  
##  Median :250.5   Median :30.00   Median :170.0  
##  Mean   :250.5   Mean   :30.33   Mean   :170.0  
##  3rd Qu.:375.2   3rd Qu.:37.00   3rd Qu.:176.4  
##  Max.   :500.0   Max.   :62.00   Max.   :196.9

Exportar resumen a Excel

if (!require(openxlsx)) install.packages("openxlsx")
library(openxlsx)

wb <- createWorkbook()
addWorksheet(wb, "Resumen")
writeData(wb, "Resumen", as.data.frame(resumen))
saveWorkbook(wb, "resumen_datos.xlsx", overwrite = TRUE)

Visualizacion de datos en gráficos

Edades - Histograma

hist(datos$Edad,
     probability = TRUE,
     main = "Histograma de Edades con Curva Normal",
     xlab = "Edad",
     col = "skyblue",
     border = "white")
curve(dnorm(x, mean = mean(datos$Edad), sd = sd(datos$Edad)),
      col = "red", lwd = 2, add = TRUE)

Estaturas - Histograma

hist(datos$Estatura,
     probability = TRUE,
     main = "Histograma de Estaturas con Curva Normal",
     xlab = "Estatura (cm)",
     col = "lightgreen",
     border = "white")
curve(dnorm(x, mean = mean(datos$Estatura), sd = sd(datos$Estatura)),
      col = "darkgreen", lwd = 2, add = TRUE)

Diagramas de Caja Comparativos

boxplot(datos$Edad, datos$Estatura,
        names = c("Edad", "Estatura"),
        main = "Diagrama de Caja de Edad y Estatura",
        col = c("orange", "darkolivegreen3"),
        horizontal = TRUE)

Dispersión Edad vs Estatura

plot(datos$Edad, datos$Estatura,
     main = "Dispersión entre Edad y Estatura",
     xlab = "Edad",
     ylab = "Estatura (cm)",
     pch = 19,
     col = rgb(0.1, 0.2, 0.5, 0.5))
abline(lm(Estatura ~ Edad, data = datos), col = "red", lwd = 2)


Exportar datos a CSV

write.csv(datos, "datos_simulados.csv", row.names = FALSE)