Cargue el conjunto de datos “BasePrograma.xlsx” a RStudio. El archivo se encuentra en la carpeta compartida del Programa.
library(readr)
library(tibble)
library(stringr)
library(forcats)
library(readxl)
library(haven)
library(tidyr)
library(tidyverse)
library(lubridate)
library(hms)
library(ggplot2)
library(dplyr)
library(tidyr)
library(magrittr)
Utilizamos el código:
Taller1 <- read_excel("data/BasePrograma (1).xlsx")
Modifique las observaciones de la variable Genero
para que se muestre el texto, para esto usa la función
transmute() de la librería dplyr. transmute()
agrega una nueva variable y corrige las existentes. Muestra el código y
las primeras 5 filas del conjunto de datos para que verifiques que el
cambió se realizó correctamente.
GeneroTaller1$Genero<-transmute(Taller1, Genero=case_when(Genero== 1 ~ "Mujer", Genero == 2 ~ "LGBTI", Genero == 3 ~"Hombre"))
head(Taller1, n=5)
## # A tibble: 5 × 8
## Genero$Genero `Estado Civil` Nivel de …¹ Edad Estat…² Tiene…³ Qué t…⁴ Perso…⁵
## <chr> <chr> <chr> <dbl> <dbl> <dbl> <chr> <dbl>
## 1 Hombre Soltero Pregrado 28 178 1 A pie 1
## 2 Hombre Soltero Posgrado 41 170 1 Sedan 2
## 3 Mujer Divorciado Pregrado 44 156 1 A pie 3
## 4 Hombre Soltero Posgrado 46 165 1 SuV 3
## 5 Hombre Soltero Pregrado 29 176 0 Sedan 3
## # … with abbreviated variable names ¹`Nivel de Escolaridad`, ²Estatura,
## # ³`Tiene Mascota`, ⁴`Qué tipo de auto tiene`, ⁵`Personas en cuarentena`
Modifique la variable ¿Tiene Mascota?, donde 1 es Si
y 0 es No.
¿Tiene Mascota?Taller1$'Tiene Mascota'<-transmute(Taller1,
'Tiene Mascota'=case_when('Tiene Mascota'== 1 ~ "Si",
'Tiene Mascota'== 0 ~ "No"))
Corrija el tipo de dato de la variable
Nivel de Escolaridad. Verique la estructura del conjunto de
datos con str()
str()## tibble [75 × 8] (S3: tbl_df/tbl/data.frame)
## $ Genero : tibble [75 × 1] (S3: tbl_df/tbl/data.frame)
## ..$ Genero: chr [1:75] "Hombre" "Hombre" "Mujer" "Hombre" ...
## $ Estado Civil : chr [1:75] "Soltero" "Soltero" "Divorciado" "Soltero" ...
## $ Nivel de Escolaridad : chr [1:75] "Pregrado" "Posgrado" "Pregrado" "Posgrado" ...
## $ Edad : num [1:75] 28 41 44 46 29 38 30 27 34 42 ...
## $ Estatura : num [1:75] 178 170 156 165 176 158 168 171 172 165 ...
## $ Tiene Mascota : tibble [75 × 1] (S3: tbl_df/tbl/data.frame)
## ..$ Tiene Mascota: chr [1:75] NA NA NA NA ...
## $ Qué tipo de auto tiene: chr [1:75] "A pie" "Sedan" "A pie" "SuV" ...
## $ Personas en cuarentena: num [1:75] 1 2 3 3 3 1 4 4 1 6 ...
unique(Taller1$`Nivel de Escolaridad`)
## [1] "Pregrado" "Posgrado" "Colegio"
Taller1$`Nivel de Escolaridad`<-factor(Taller1$`Nivel de Escolaridad`,
levels = c("Colegio", "Pregrado", "Posgrado"))
class(Taller1$`Nivel de Escolaridad`)
## [1] "factor"
Recree el código R para generar la siguiente tabla
8 Se generó el siguiente código:
Taller1 %>%
group_by(`Estado Civil`) %>% summarise('Total de encuestados' = n(), Edad = round(mean(Edad)), Estatura = min(Estatura), 'Personas en cuarentena' = max(`Personas en cuarentena`)) %>% view()
| Estado Civil | Total de encuestados | Edad | Estatura | Personas en cuarentena |
|---|---|---|---|---|
| Casado | 16 | 36 | 158 | 4 |
| Divorciado | 3 | 36 | 156 | 3 |
| Soltero | 52 | 30 | 150 | 70 |
| Unión libre | 4 | 33 | 163 | 6 |
Recree el código R para generar la siguiente gráfica:
Taller1 %>% ggplot(aes(x = `Nivel de Escolaridad`, fill= `Nivel de Escolaridad`, y = Edad, alpha=8.0))+geom_point()+ geom_boxplot()+ theme_minimal()+ labs(title= "Edades por niveles de escolaridad")
FIN