Descripción

  • Nota importante: todos los ejercicios deben ser resueltos a través de código, no son válidas las soluciones manuales.
  • Descarga y ejecución: para responder cada pregunta del taller se recomienda descargar el documento .Rmd y editarlo desde su computador. También es posible hacerlo desde la página web, sin embargo, tenga paciencia porque puede ser lenta la ejecución.
  • Entregable: documento .Rmd con solución a cada pregunta. Enviar este documento a mi correo.
  • Fecha de entrega: máximo el lunes 14 de noviembre de 2022

Activación de R

Clic en Activate para activar el kernel de R y poder ejecutar (run) cada fragmento de código desde el navegador. Tenga paciencia ⌛⌛⌛

Bibliotecas

library(tidyverse)
library(lubridate)

Pregunta 1

  • Complete el siguiente fragmento ingresando su nombre en la variable texto2 y corrija el código…🤯🤯🤯
    • Rta: "Hola, mi nombre es Edimer"
texto1 <- "Hola, mi nombre es"
texto2 <- " Estefani"
str_c(texto1, texto2)

Pregunta 2

  • Use la función mean() para calcular el promedio del siguiente vector 🤔🤔🤔:
    • Rta: 53.968
numeros <- c(23, 12.2, "13,5", 11L, 210.14)

numeros_1 <- str_replace_all(string = numeros, pattern = ",", replacement = ".") %>% as.numeric()
class(numeros_1)

mean(numeros_1, na.rm = TRUE)

Pregunta 3

  • Construya una base de datos con los siguientes vectores y obtenga el promedio de los números impares al cuadrado (v3) 😨😨😨:
    • Rta: 11.66667
v1 <- c(1, 2, 3, 4, 5, 6)
v2 <- c("Impar", "Par", "Impar", "Par", "Impar")
v3 <- c(1, 4, 9, 16, 25, 36)

# Solucion 
v2_c <- c(v2, "Par")

dtf <- data.frame(
  v2_c,
  v1,
  v3
)

# se extrae V3

impar_v3 <- impar[,3]
impar_v3

mean(impar_v3)

Pregunta 4

  • En la base de datos PlantGrowth hay información de peso para tres grupos de plantas (control, tratamiento 1 y tratamiento 2). ¿Cuántos registros superan el promedio general (media_p4) de peso (weight) para el tratamiento 1? 💡💡💡
    • Rta: 2 registros
head(PlantGrowth)
# tener en cuenta para arreglos mas grandes y conocer el nombre de las entradas

entradas <- PlantGrowth %>% 
  select(c(group)) %>% 
filter(!duplicated(group))
entradas 
media_p4 <- PlantGrowth %>% 
  pull(weight) %>% 
  mean()
media_p4

trat_1 <- PlantGrowth %>% 
  filter(group == "trt1", weight > media_p4) 
trat_1 %>% 
  count()

Pregunta 5

  • Los siguientes vectores poseen información de fechas iniciales y fechas finales para ciclos hipotéticos de cultivos. Obtenga el vector con la diferencia de días para cada cultivo y calcule el promedio de días. 🔂🔂🔂
    • Rta: 101.5
fecha_inicial <- c("2010-01-01", "2020-01-01", "2021-01-01", "2022-01-01")
fecha_final <- c("2010-03-25", "2020-04-17", "2021-03-10", "2022-05-29")

# Se establecen como fechas
fecha_inicial <- c("2010-01-01", "2020-01-01", "2021-01-01", "2022-01-01") %>% as.Date()
fecha_final <- c("2010-03-25", "2020-04-17", "2021-03-10", "2022-05-29") %>% as.Date()

# Se crea una data.frame 

tabla_fechas <- data.frame(
  fecha_final, 
  fecha_inicial
  )

# Se muta el data.frame y se operan con diferencia entre los vectores 

tabla_diferencia <- tabla1 %>% mutate(
  difere = fecha_final - fecha_inicial
  )
tabla_diferencia

# Promedio 

meandife <- tabla_diferencia[,3]
meandife

mean(meandife)

Pregunta 6

arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")
arboles

head(arboles)

# por cantidad 

 arboles %>% 
  filter (Cantidad > 187) %>% 
   count()

Pregunta 7

arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")

arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")

arb_2021 <- arboles %>% 
  mutate(fecha2 = dmy_hms(Fecha),
         anual = year(fecha2)) %>% 
  filter(anual == 2021)

sum(arboles_2021$Cantidad)

Pregunta 8

  • ¿Cuál es el día con mayor número de registros en el siguiente vector de fechas?
    • Rta: lunes: 15
vector_year <- seq(from = 1990, to = 2021, by = 2)
vector_mes <- rep(1:12, each = 5)
vector_dia <- rep(1:30, each = 3)

vector_fechas <- str_c(vector_year, "-", vector_mes, "-", vector_dia) %>% as.Date()
vector_fechas
