Tarea 4

install.packages("haven")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.2'
## (as 'lib' is unspecified)
library(haven)

datos <- read_dta("Casen2020_factorCenso2017_Nueva Metodología calibración STATA.dta")


datos
## # A tibble: 185,437 × 4
##           folio     o id_persona expr_C2017_NM
##           <dbl> <dbl>      <dbl>         <dbl>
##  1 110130010501     2       1086            17
##  2 110130010601     3        624            17
##  3 110130011001     4        912            20
##  4 110130010601     1        622            17
##  5 110130011001     1        910            20
##  6 110130011201     1         92            22
##  7 110130010301     1        729            10
##  8 110130010601     2        623            17
##  9 110130011001     2        909            20
## 10 110130010501     1       1085            17
## # ℹ 185,427 more rows
media <- mean(datos$id_persona)
moda <- names(sort(-table(datos$id_persona)))[1]
mediana <- median(datos$id_persona)

# Imprimir los resultados
cat("La media es:", media, "\n")
## La media es: 538.4713
cat("La moda es:", moda, "\n")
## La moda es: 45
cat("La mediana es:", mediana, "\n")
## La mediana es: 420
# Crear un histograma de la columna "col1"
hist(datos$id_persona, breaks = 10, main = "Histograma de CASEN", xlab = "id_personas", ylab = "o")