Tarea 4
install.packages("haven")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.2'
## (as 'lib' is unspecified)
library(haven)
datos <- read_dta("Casen2020_factorCenso2017_Nueva Metodología calibración STATA.dta")
datos
## # A tibble: 185,437 × 4
## folio o id_persona expr_C2017_NM
## <dbl> <dbl> <dbl> <dbl>
## 1 110130010501 2 1086 17
## 2 110130010601 3 624 17
## 3 110130011001 4 912 20
## 4 110130010601 1 622 17
## 5 110130011001 1 910 20
## 6 110130011201 1 92 22
## 7 110130010301 1 729 10
## 8 110130010601 2 623 17
## 9 110130011001 2 909 20
## 10 110130010501 1 1085 17
## # ℹ 185,427 more rows
media <- mean(datos$id_persona)
moda <- names(sort(-table(datos$id_persona)))[1]
mediana <- median(datos$id_persona)
# Imprimir los resultados
cat("La media es:", media, "\n")
## La media es: 538.4713
cat("La moda es:", moda, "\n")
## La moda es: 45
cat("La mediana es:", mediana, "\n")
## La mediana es: 420
# Crear un histograma de la columna "col1"
hist(datos$id_persona, breaks = 10, main = "Histograma de CASEN", xlab = "id_personas", ylab = "o")
