Descripción
Nota importante: todos los ejercicios deben ser
resueltos a través de código, no son válidas las soluciones
manuales .
Descarga y ejecución: para responder cada pregunta
del taller se recomienda descargar el documento .Rmd y editarlo
desde su computador. También es posible hacerlo desde la página web, sin
embargo, tenga paciencia porque puede ser lenta la
ejecución.
Entregable: documento .Rmd con solución a
cada pregunta. Enviar este documento a mi correo.
Fecha de entrega: máximo el lunes 14 de
noviembre de 2022
Activación de R
Clic en Activate para activar el
kernel de R y poder ejecutar (run) cada fragmento
de código desde el navegador. Tenga paciencia ⌛⌛⌛
Activate
Bibliotecas
library (tidyverse)
library (lubridate)
Pregunta 1
Complete el siguiente fragmento ingresando su nombre en la variable
texto2 y corrija el código…🤯🤯🤯
Rta: "Hola, mi nombre es Edimer"
texto1 <- "Hola, mi nombre es"
texto2 <- " Estefani"
str_c (texto1, texto2)
Pregunta 2
Use la función mean() para calcular el promedio del
siguiente vector 🤔🤔🤔:
numeros <- c (23 , 12.2 , "13,5" , 11L, 210.14 )
numeros_1 <- str_replace_all (string = numeros, pattern = "," , replacement = "." ) %>% as.numeric ()
class (numeros_1)
mean (numeros_1, na.rm = TRUE )
Pregunta 3
Construya una base de datos con los siguientes vectores y obtenga el
promedio de los números impares al cuadrado (v3) 😨😨😨:
v1 <- c (1 , 2 , 3 , 4 , 5 , 6 )
v2 <- c ("Impar" , "Par" , "Impar" , "Par" , "Impar" )
v3 <- c (1 , 4 , 9 , 16 , 25 , 36 )
# Solucion
v2_c <- c (v2, "Par" )
dtf <- data.frame (
v2_c,
v1,
v3
)
# se extrae V3
impar_v3 <- impar[,3 ]
impar_v3
mean (impar_v3)
Pregunta 4
En la base de datos PlantGrowth hay información de peso
para tres grupos de plantas (control, tratamiento 1 y tratamiento 2).
¿Cuántos registros superan el promedio general (media_p4)
de peso (weight) para el tratamiento 1? 💡💡💡
# tener en cuenta para arreglos mas grandes y conocer el nombre de las entradas
entradas <- PlantGrowth %>%
select (c (group)) %>%
filter (! duplicated (group))
entradas
media_p4 <- PlantGrowth %>%
pull (weight) %>%
mean ()
media_p4
trat_1 <- PlantGrowth %>%
filter (group == "trt1" , weight > media_p4)
trat_1 %>%
count ()
Pregunta 5
Los siguientes vectores poseen información de fechas iniciales y
fechas finales para ciclos hipotéticos de cultivos. Obtenga el vector
con la diferencia de días para cada cultivo y calcule el promedio de
días. 🔂🔂🔂
fecha_inicial <- c ("2010-01-01" , "2020-01-01" , "2021-01-01" , "2022-01-01" )
fecha_final <- c ("2010-03-25" , "2020-04-17" , "2021-03-10" , "2022-05-29" )
# Se establecen como fechas
fecha_inicial <- c ("2010-01-01" , "2020-01-01" , "2021-01-01" , "2022-01-01" ) %>% as.Date ()
fecha_final <- c ("2010-03-25" , "2020-04-17" , "2021-03-10" , "2022-05-29" ) %>% as.Date ()
# Se crea una data.frame
tabla_fechas <- data.frame (
fecha_final,
fecha_inicial
)
# Se muta el data.frame y se operan con diferencia entre los vectores
tabla_diferencia <- tabla1 %>% mutate (
difere = fecha_final - fecha_inicial
)
tabla_diferencia
# Promedio
meandife <- tabla_diferencia[,3 ]
meandife
mean (meandife)
Pregunta 6
arboles <- read_csv ("_rboles_plantados_en_el_municipio_de_Cota.csv" )
arboles
head (arboles)
# por cantidad
arboles %>%
filter (Cantidad > 187 ) %>%
count ()
Pregunta 7
arboles <- read_csv ("_rboles_plantados_en_el_municipio_de_Cota.csv" )
arboles <- read_csv ("_rboles_plantados_en_el_municipio_de_Cota.csv" )
arb_2021 <- arboles %>%
mutate (fecha2 = dmy_hms (Fecha),
anual = year (fecha2)) %>%
filter (anual == 2021 )
sum (arboles_2021$ Cantidad)
Pregunta 8
¿Cuál es el día con mayor número de registros en el siguiente vector
de fechas?
vector_year <- seq (from = 1990 , to = 2021 , by = 2 )
vector_mes <- rep (1 : 12 , each = 5 )
vector_dia <- rep (1 : 30 , each = 3 )
vector_fechas <- str_c (vector_year, "-" , vector_mes, "-" , vector_dia) %>% as.Date ()
vector_fechas
