Tarea 2,

Utilice la estructura de control case_when() para imputar el nombre de la entidad federativa (o pais) a cada uno de los alumnos de las diferentes generaciones de la maestria en economia de la BUAP.

Tome como referencia lo viste en clase y el catalogo de inegi.

  1. Realice los vectores correspondientes y declarelos con los nombres de las columnas. Nombre:
nombre<-c("Alam","Enrique","Eddy","Cesar","Marcel","Surya","Jany","Yubi","Noelia","Micelle","Juan","Christian")

nombre
##  [1] "Alam"      "Enrique"   "Eddy"      "Cesar"     "Marcel"    "Surya"    
##  [7] "Jany"      "Yubi"      "Noelia"    "Micelle"   "Juan"      "Christian"

Edad:

edad<-c(32,27,35,35,26,32,29,24,39,40,50,30)

edad
##  [1] 32 27 35 35 26 32 29 24 39 40 50 30

Estatura:

estatura<-c(1.73,1.75,1.7,1.74,1.55,1.56,1.65,1.58,1.59,1.6,1.7,1.72)

estatura
##  [1] 1.73 1.75 1.70 1.74 1.55 1.56 1.65 1.58 1.59 1.60 1.70 1.72

Estado:

estado<-c(21,21,21,30,30,30,200,200,21,13,14,19)

estado
##  [1]  21  21  21  30  30  30 200 200  21  13  14  19
  1. Conviertalo en data frame y declarelo con el nombre “data”. Aplique str() para conocer sus datos
data<-data.frame(nombre,edad,estatura,estado)

data
##       nombre edad estatura estado
## 1       Alam   32     1.73     21
## 2    Enrique   27     1.75     21
## 3       Eddy   35     1.70     21
## 4      Cesar   35     1.74     30
## 5     Marcel   26     1.55     30
## 6      Surya   32     1.56     30
## 7       Jany   29     1.65    200
## 8       Yubi   24     1.58    200
## 9     Noelia   39     1.59     21
## 10   Micelle   40     1.60     13
## 11      Juan   50     1.70     14
## 12 Christian   30     1.72     19

Aplicamos structure:

str(data)
## 'data.frame':    12 obs. of  4 variables:
##  $ nombre  : chr  "Alam" "Enrique" "Eddy" "Cesar" ...
##  $ edad    : num  32 27 35 35 26 32 29 24 39 40 ...
##  $ estatura: num  1.73 1.75 1.7 1.74 1.55 1.56 1.65 1.58 1.59 1.6 ...
##  $ estado  : num  21 21 21 30 30 30 200 200 21 13 ...
  1. Complete el codigo con lo aprendido el dia de hoy y en clases anteriores.
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.5.1
## Warning: package 'readr' was built under R version 4.5.1
## Warning: package 'stringr' was built under R version 4.5.1
## Warning: package 'forcats' was built under R version 4.5.1
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.1     ✔ stringr   1.5.2
## ✔ ggplot2   3.5.2     ✔ tibble    3.2.1
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.0.4     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
datanew<- data %>%
   mutate(estado_origen = case_when(
 estado == 30 ~ "Veracruz",
 estado == 21 ~ "Puebla",
 estado == 13 ~ "Hidalgo",
 estado == 14 ~ "Jalisco",
 estado == 19 ~ "Nuevo Leon",
 estado == 200 ~ "Otros paises de America"))

datanew
##       nombre edad estatura estado           estado_origen
## 1       Alam   32     1.73     21                  Puebla
## 2    Enrique   27     1.75     21                  Puebla
## 3       Eddy   35     1.70     21                  Puebla
## 4      Cesar   35     1.74     30                Veracruz
## 5     Marcel   26     1.55     30                Veracruz
## 6      Surya   32     1.56     30                Veracruz
## 7       Jany   29     1.65    200 Otros paises de America
## 8       Yubi   24     1.58    200 Otros paises de America
## 9     Noelia   39     1.59     21                  Puebla
## 10   Micelle   40     1.60     13                 Hidalgo
## 11      Juan   50     1.70     14                 Jalisco
## 12 Christian   30     1.72     19              Nuevo Leon

4.Compare su base original, data, con esta nueva base:

data
##       nombre edad estatura estado
## 1       Alam   32     1.73     21
## 2    Enrique   27     1.75     21
## 3       Eddy   35     1.70     21
## 4      Cesar   35     1.74     30
## 5     Marcel   26     1.55     30
## 6      Surya   32     1.56     30
## 7       Jany   29     1.65    200
## 8       Yubi   24     1.58    200
## 9     Noelia   39     1.59     21
## 10   Micelle   40     1.60     13
## 11      Juan   50     1.70     14
## 12 Christian   30     1.72     19

Despues de ver las dos bases lado a lado, se puede observar que en data (la primera), solo se observan los numeros de los estados, mientras que en datanew viene el numero del estado, acompañado del nombre del estado.