Descripción

  • Nota importante: todos los ejercicios deben ser resueltos a través de código, no son válidas las soluciones manuales.
  • Descarga y ejecución: para responder cada pregunta del taller se recomienda descargar el documento .Rmd y editarlo desde su computador. También es posible hacerlo desde la página web, sin embargo, tenga paciencia porque puede ser lenta la ejecución.
  • Entregable: documento .Rmd con solución a cada pregunta. Enviar este documento a mi correo.
  • Fecha de entrega: máximo el lunes 14 de noviembre de 2022

Activación de R

Clic en Activate para activar el kernel de R y poder ejecutar (run) cada fragmento de código desde el navegador. Tenga paciencia ⌛⌛⌛

Bibliotecas

library(tidyverse)
library(lubridate)

Pregunta 1

  • Complete el siguiente fragmento ingresando su nombre en la variable texto2 y corrija el código…🤯🤯🤯
    • Rta: "Hola, mi nombre es Edimer"
texto1 <- "Hola, mi nombre es"
texto2 <- " Estefani"
str_c(texto1, texto2)

Pregunta 2

  • Use la función mean() para calcular el promedio del siguiente vector 🤔🤔🤔:
    • Rta: 53.968
numeros <- c(23, 12.2, "13,5", 11L, 210.14)

numeros_1 <- str_replace_all(string = numeros, pattern = ",", replacement = ".") %>% as.numeric()
class(numeros_1)

mean(numeros_1, na.rm = TRUE)

Pregunta 3

  • Construya una base de datos con los siguientes vectores y obtenga el promedio de los números impares al cuadrado (v3) 😨😨😨:
    • Rta: 11.66667
v1 <- c(1, 2, 3, 4, 5, 6)
v2 <- c("Impar", "Par", "Impar", "Par", "Impar")
v3 <- c(1, 4, 9, 16, 25, 36)

# Solucion 
v2_c <- c(v2, "Par")

dtf <- data.frame(
  v2_c,
  v1,
  v3
)

# se extrae V3

impar_v3 <- impar[,3]
impar_v3

mean(impar_v3)

Pregunta 4

  • En la base de datos PlantGrowth hay información de peso para tres grupos de plantas (control, tratamiento 1 y tratamiento 2). ¿Cuántos registros superan el promedio general (media_p4) de peso (weight) para el tratamiento 1? 💡💡💡
    • Rta: 2 registros
head(PlantGrowth)
# tener en cuenta para arreglos mas grandes y conocer el nombre de las entradas

entradas <- PlantGrowth %>% 
  select(c(group)) %>% 
filter(!duplicated(group))
entradas 
media_p4 <- PlantGrowth %>% 
  pull(weight) %>% 
  mean()
media_p4

trat_1 <- PlantGrowth %>% 
  filter(group == "trt1", weight > media_p4) 
trat_1 %>% 
  count()

Pregunta 5

  • Los siguientes vectores poseen información de fechas iniciales y fechas finales para ciclos hipotéticos de cultivos. Obtenga el vector con la diferencia de días para cada cultivo y calcule el promedio de días. 🔂🔂🔂
    • Rta: 101.5
fecha_inicial <- c("2010-01-01", "2020-01-01", "2021-01-01", "2022-01-01")
fecha_final <- c("2010-03-25", "2020-04-17", "2021-03-10", "2022-05-29")

# Se establecen como fechas
fecha_inicial <- c("2010-01-01", "2020-01-01", "2021-01-01", "2022-01-01") %>% as.Date()
fecha_final <- c("2010-03-25", "2020-04-17", "2021-03-10", "2022-05-29") %>% as.Date()

# Se crea una data.frame 

tabla_fechas <- data.frame(
  fecha_final, 
  fecha_inicial
  )

# Se muta el data.frame y se operan con diferencia entre los vectores 

tabla_diferencia <- tabla1 %>% mutate(
  difere = fecha_final - fecha_inicial
  )
tabla_diferencia

# Promedio 

meandife <- tabla_diferencia[,3]
meandife

mean(meandife)

Pregunta 6

arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")
arboles

head(arboles)

# por cantidad 

 arboles %>% 
  filter (Cantidad > 187) %>% 
   count()

Pregunta 7

arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")

arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")

arb_2021 <- arboles %>% 
  mutate(fecha2 = dmy_hms(Fecha),
         anual = year(fecha2)) %>% 
  filter(anual == 2021)

sum(arboles_2021$Cantidad)

Pregunta 8

  • ¿Cuál es el día con mayor número de registros en el siguiente vector de fechas?
    • Rta: lunes: 15
vector_year <- seq(from = 1990, to = 2021, by = 2)
vector_mes <- rep(1:12, each = 5)
vector_dia <- rep(1:30, each = 3)

vector_fechas <- str_c(vector_year, "-", vector_mes, "-", vector_dia) %>% as.Date()
vector_fechas
---
title: "Ejercicios de clase"
subtitle: "Fundamentos de R"
author: "Estefani Cardenas"
date: "27/10/2022"
output: 
  html_document:
    code_download: true
    toc: true
    toc_float:
      collapsed: false
      smooth_scroll: false
    highlight: kate
---

<!-- Some stuff from thebelab required for the magic -->
<!-- Configure and load Thebe !-->
<script type="text/x-thebe-config">
  {
    requestKernel: true,
    binderOptions: {
      repo: "binder-examples/r",
    },
    kernelOptions: {
      name: "R",
      kernelName: "ir",
    },
  }
</script>

<!-- script for thebelab -->
<script src="https://unpkg.com/thebelab@latest/lib/index.js"></script>

```{r setup, include = FALSE}
knitr::opts_chunk$set(eval = FALSE, warning = FALSE, message = FALSE)
```

# Descripción

- **Nota importante:** todos los ejercicios deben ser resueltos a través de código, **no son válidas las  soluciones manuales**.
- **Descarga y ejecución:** para responder cada pregunta del taller se recomienda descargar el documento *.Rmd* y editarlo desde su computador. También es posible hacerlo desde la página web, sin embargo, tenga paciencia porque puede ser **lenta** la ejecución.
- **Entregable:** documento *.Rmd* con solución a cada pregunta. Enviar este documento a mi correo.
- **Fecha de entrega:** máximo el **lunes 14 de noviembre de 2022**


<center>
<img src = "https://github.com/web-edimer/rproject_udea/blob/gh-pages/temas/Guides/img/img1.PNG?raw=true" />
</center>

# Activación de R

> Clic en **`Activate`** para activar el *kernel* de R y poder ejecutar (`run`) cada fragmento de código desde el navegador. Tenga paciencia ⌛⌛⌛

```{r, eval = TRUE, echo = FALSE}
# ad a button
htmltools::tags$button(
  id = "activateButton",
  style="width: 800px; height: 50px; font-size: 2.5em;", 
  "Activate"
)
```

```{js, eval=TRUE, echo = FALSE}
// thebelab js script
var bootstrapThebe = function() {
    thebelab.bootstrap();
}
document.querySelector("#activateButton").addEventListener('click', bootstrapThebe)
```

# Bibliotecas

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
library(tidyverse)
library(lubridate)
```

# Pregunta 1

- Complete el siguiente fragmento ingresando su nombre en la variable `texto2` y corrija el código...🤯🤯🤯
  - **Rta:** `"Hola, mi nombre es Edimer"`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
texto1 <- "Hola, mi nombre es"
texto2 <- " Estefani"
str_c(texto1, texto2)
```

# Pregunta 2

- Use la función `mean()` para calcular el promedio del siguiente vector 🤔🤔🤔:
  - **Rta:** `53.968`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}

numeros <- c(23, 12.2, "13,5", 11L, 210.14)

numeros_1 <- str_replace_all(string = numeros, pattern = ",", replacement = ".") %>% as.numeric()
class(numeros_1)

mean(numeros_1, na.rm = TRUE)

```

# Pregunta 3

- Construya una base de datos  con los siguientes vectores y obtenga el promedio de los números impares al cuadrado (`v3`) 😨😨😨:
  - **Rta:** `11.66667`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
v1 <- c(1, 2, 3, 4, 5, 6)
v2 <- c("Impar", "Par", "Impar", "Par", "Impar")
v3 <- c(1, 4, 9, 16, 25, 36)

# Solucion 
v2_c <- c(v2, "Par")

dtf <- data.frame(
  v2_c,
  v1,
  v3
)

# se extrae V3

impar_v3 <- impar[,3]
impar_v3

mean(impar_v3)

```

# Pregunta 4

- En la base de datos `PlantGrowth` hay información de peso para tres grupos de plantas (control, tratamiento 1 y tratamiento 2). ¿Cuántos registros superan el promedio general (`media_p4`) de peso (`weight`) para el tratamiento 1? 💡💡💡
  - **Rta:** `2 registros`

```{r}
head(PlantGrowth)
```

```{r}
# tener en cuenta para arreglos mas grandes y conocer el nombre de las entradas

entradas <- PlantGrowth %>% 
  select(c(group)) %>% 
filter(!duplicated(group))
entradas 

```

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
media_p4 <- PlantGrowth %>% 
  pull(weight) %>% 
  mean()
media_p4

trat_1 <- PlantGrowth %>% 
  filter(group == "trt1", weight > media_p4) 
trat_1 %>% 
  count()

```

# Pregunta 5

- Los siguientes vectores poseen información de fechas iniciales y fechas finales para ciclos hipotéticos de cultivos. Obtenga el vector con la diferencia de días para cada cultivo y calcule el promedio de días. 🔂🔂🔂
  - **Rta:** `101.5`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
fecha_inicial <- c("2010-01-01", "2020-01-01", "2021-01-01", "2022-01-01")
fecha_final <- c("2010-03-25", "2020-04-17", "2021-03-10", "2022-05-29")

# Se establecen como fechas
fecha_inicial <- c("2010-01-01", "2020-01-01", "2021-01-01", "2022-01-01") %>% as.Date()
fecha_final <- c("2010-03-25", "2020-04-17", "2021-03-10", "2022-05-29") %>% as.Date()

# Se crea una data.frame 

tabla_fechas <- data.frame(
  fecha_final, 
  fecha_inicial
  )

# Se muta el data.frame y se operan con diferencia entre los vectores 

tabla_diferencia <- tabla1 %>% mutate(
  difere = fecha_final - fecha_inicial
  )
tabla_diferencia

# Promedio 

meandife <- tabla_diferencia[,3]
meandife

mean(meandife)

```

# Pregunta 6

- Con la base de datos de [árboles plantados en el municipio de Cota 2020-2022](https://www.datos.gov.co/Agricultura-y-Desarrollo-Rural/-rboles-plantados-en-el-municipio-de-Cota/6hhh-tp4r) responda ¿cuántos predios superan los 187 árboles plantados?
  - **Rta:** `47`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")
arboles

head(arboles)

# por cantidad 

 arboles %>% 
  filter (Cantidad > 187) %>% 
   count()

```



# Pregunta 7

- Con la base de datos de [árboles plantados en el municipio de Cota 2020-2022](https://www.datos.gov.co/Agricultura-y-Desarrollo-Rural/-rboles-plantados-en-el-municipio-de-Cota/6hhh-tp4r) responda ¿cuántos árboles fueron plantados en el 2021?
  - **Rta:** `16365`
  
```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")

arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")

arb_2021 <- arboles %>% 
  mutate(fecha2 = dmy_hms(Fecha),
         anual = year(fecha2)) %>% 
  filter(anual == 2021)

sum(arboles_2021$Cantidad)
```  

# Pregunta 8

- ¿Cuál es el día con mayor número de registros en el siguiente vector de fechas?
  - **Rta:** `lunes: 15`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
vector_year <- seq(from = 1990, to = 2021, by = 2)
vector_mes <- rep(1:12, each = 5)
vector_dia <- rep(1:30, each = 3)

vector_fechas <- str_c(vector_year, "-", vector_mes, "-", vector_dia) %>% as.Date()
vector_fechas




``` 

