Tarea 2,
Utilice la estructura de control case_when() para imputar el nombre de la entidad federativa (o pais) a cada uno de los alumnos de las diferentes generaciones de la maestria en economia de la BUAP.
Tome como referencia lo viste en clase y el catalogo de inegi.
nombre<-c("Alam","Enrique","Eddy","Cesar","Marcel","Surya","Jany","Yubi","Noelia","Micelle","Juan","Christian")
nombre
## [1] "Alam" "Enrique" "Eddy" "Cesar" "Marcel" "Surya"
## [7] "Jany" "Yubi" "Noelia" "Micelle" "Juan" "Christian"
Edad:
edad<-c(32,27,35,35,26,32,29,24,39,40,50,30)
edad
## [1] 32 27 35 35 26 32 29 24 39 40 50 30
Estatura:
estatura<-c(1.73,1.75,1.7,1.74,1.55,1.56,1.65,1.58,1.59,1.6,1.7,1.72)
estatura
## [1] 1.73 1.75 1.70 1.74 1.55 1.56 1.65 1.58 1.59 1.60 1.70 1.72
Estado:
estado<-c(21,21,21,30,30,30,200,200,21,13,14,19)
estado
## [1] 21 21 21 30 30 30 200 200 21 13 14 19
data<-data.frame(nombre,edad,estatura,estado)
data
## nombre edad estatura estado
## 1 Alam 32 1.73 21
## 2 Enrique 27 1.75 21
## 3 Eddy 35 1.70 21
## 4 Cesar 35 1.74 30
## 5 Marcel 26 1.55 30
## 6 Surya 32 1.56 30
## 7 Jany 29 1.65 200
## 8 Yubi 24 1.58 200
## 9 Noelia 39 1.59 21
## 10 Micelle 40 1.60 13
## 11 Juan 50 1.70 14
## 12 Christian 30 1.72 19
Aplicamos structure:
str(data)
## 'data.frame': 12 obs. of 4 variables:
## $ nombre : chr "Alam" "Enrique" "Eddy" "Cesar" ...
## $ edad : num 32 27 35 35 26 32 29 24 39 40 ...
## $ estatura: num 1.73 1.75 1.7 1.74 1.55 1.56 1.65 1.58 1.59 1.6 ...
## $ estado : num 21 21 21 30 30 30 200 200 21 13 ...
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.5.1
## Warning: package 'readr' was built under R version 4.5.1
## Warning: package 'stringr' was built under R version 4.5.1
## Warning: package 'forcats' was built under R version 4.5.1
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.1 ✔ stringr 1.5.2
## ✔ ggplot2 3.5.2 ✔ tibble 3.2.1
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.0.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
datanew<- data %>%
mutate(estado_origen = case_when(
estado == 30 ~ "Veracruz",
estado == 21 ~ "Puebla",
estado == 13 ~ "Hidalgo",
estado == 14 ~ "Jalisco",
estado == 19 ~ "Nuevo Leon",
estado == 200 ~ "Otros paises de America"))
datanew
## nombre edad estatura estado estado_origen
## 1 Alam 32 1.73 21 Puebla
## 2 Enrique 27 1.75 21 Puebla
## 3 Eddy 35 1.70 21 Puebla
## 4 Cesar 35 1.74 30 Veracruz
## 5 Marcel 26 1.55 30 Veracruz
## 6 Surya 32 1.56 30 Veracruz
## 7 Jany 29 1.65 200 Otros paises de America
## 8 Yubi 24 1.58 200 Otros paises de America
## 9 Noelia 39 1.59 21 Puebla
## 10 Micelle 40 1.60 13 Hidalgo
## 11 Juan 50 1.70 14 Jalisco
## 12 Christian 30 1.72 19 Nuevo Leon
4.Compare su base original, data, con esta nueva base:
data
## nombre edad estatura estado
## 1 Alam 32 1.73 21
## 2 Enrique 27 1.75 21
## 3 Eddy 35 1.70 21
## 4 Cesar 35 1.74 30
## 5 Marcel 26 1.55 30
## 6 Surya 32 1.56 30
## 7 Jany 29 1.65 200
## 8 Yubi 24 1.58 200
## 9 Noelia 39 1.59 21
## 10 Micelle 40 1.60 13
## 11 Juan 50 1.70 14
## 12 Christian 30 1.72 19
Despues de ver las dos bases lado a lado, se puede observar que en data (la primera), solo se observan los numeros de los estados, mientras que en datanew viene el numero del estado, acompañado del nombre del estado.