Descripción
Nota importante: todos los ejercicios deben ser
resueltos a través de código, no son válidas las soluciones
manuales .
Descarga y ejecución: para responder cada pregunta
del taller se recomienda descargar el documento .Rmd y editarlo
desde su computador. También es posible hacerlo desde la página web, sin
embargo, tenga paciencia porque puede ser lenta la
ejecución.
Entregable: documento .Rmd con solución a
cada pregunta. Enviar este documento a mi correo.
Fecha de entrega: máximo el lunes 14 de
noviembre de 2022
Activación de R
Clic en Activate para activar el
kernel de R y poder ejecutar (run) cada fragmento
de código desde el navegador. Tenga paciencia ⌛⌛⌛
Activate
Bibliotecas
library (tidyverse)
library (lubridate)
Pregunta 1
Complete el siguiente fragmento ingresando su nombre en la variable
texto2 y corrija el código…🤯🤯🤯
Rta: "Hola, mi nombre es Edimer"
texto1 <- "Hola, mi nombre es"
texto2 <- " Estefani"
str_c (texto1, texto2)
Pregunta 2
Use la función mean() para calcular el promedio del
siguiente vector 🤔🤔🤔:
numeros <- c (23 , 12.2 , "13,5" , 11L, 210.14 )
numeros_1 <- str_replace_all (string = numeros, pattern = "," , replacement = "." ) %>% as.numeric ()
class (numeros_1)
mean (numeros_1, na.rm = TRUE )
Pregunta 3
Construya una base de datos con los siguientes vectores y obtenga el
promedio de los números impares al cuadrado (v3) 😨😨😨:
v1 <- c (1 , 2 , 3 , 4 , 5 , 6 )
v2 <- c ("Impar" , "Par" , "Impar" , "Par" , "Impar" )
v3 <- c (1 , 4 , 9 , 16 , 25 , 36 )
# Solucion
v2_c <- c (v2, "Par" )
dtf <- data.frame (
v2_c,
v1,
v3
)
# se extrae V3
impar_v3 <- impar[,3 ]
impar_v3
mean (impar_v3)
Pregunta 4
En la base de datos PlantGrowth hay información de peso
para tres grupos de plantas (control, tratamiento 1 y tratamiento 2).
¿Cuántos registros superan el promedio general (media_p4)
de peso (weight) para el tratamiento 1? 💡💡💡
# tener en cuenta para arreglos mas grandes y conocer el nombre de las entradas
entradas <- PlantGrowth %>%
select (c (group)) %>%
filter (! duplicated (group))
entradas
media_p4 <- PlantGrowth %>%
pull (weight) %>%
mean ()
media_p4
trat_1 <- PlantGrowth %>%
filter (group == "trt1" , weight > media_p4)
trat_1 %>%
count ()
Pregunta 5
Los siguientes vectores poseen información de fechas iniciales y
fechas finales para ciclos hipotéticos de cultivos. Obtenga el vector
con la diferencia de días para cada cultivo y calcule el promedio de
días. 🔂🔂🔂
fecha_inicial <- c ("2010-01-01" , "2020-01-01" , "2021-01-01" , "2022-01-01" )
fecha_final <- c ("2010-03-25" , "2020-04-17" , "2021-03-10" , "2022-05-29" )
# Se establecen como fechas
fecha_inicial <- c ("2010-01-01" , "2020-01-01" , "2021-01-01" , "2022-01-01" ) %>% as.Date ()
fecha_final <- c ("2010-03-25" , "2020-04-17" , "2021-03-10" , "2022-05-29" ) %>% as.Date ()
# Se crea una data.frame
tabla_fechas <- data.frame (
fecha_final,
fecha_inicial
)
# Se muta el data.frame y se operan con diferencia entre los vectores
tabla_diferencia <- tabla1 %>% mutate (
difere = fecha_final - fecha_inicial
)
tabla_diferencia
# Promedio
meandife <- tabla_diferencia[,3 ]
meandife
mean (meandife)
Pregunta 6
arboles <- read_csv ("_rboles_plantados_en_el_municipio_de_Cota.csv" )
arboles
head (arboles)
# por cantidad
arboles %>%
filter (Cantidad > 187 ) %>%
count ()
Pregunta 7
arboles <- read_csv ("_rboles_plantados_en_el_municipio_de_Cota.csv" )
arboles <- read_csv ("_rboles_plantados_en_el_municipio_de_Cota.csv" )
arb_2021 <- arboles %>%
mutate (fecha2 = dmy_hms (Fecha),
anual = year (fecha2)) %>%
filter (anual == 2021 )
sum (arboles_2021$ Cantidad)
Pregunta 8
¿Cuál es el día con mayor número de registros en el siguiente vector
de fechas?
vector_year <- seq (from = 1990 , to = 2021 , by = 2 )
vector_mes <- rep (1 : 12 , each = 5 )
vector_dia <- rep (1 : 30 , each = 3 )
vector_fechas <- str_c (vector_year, "-" , vector_mes, "-" , vector_dia) %>% as.Date ()
vector_fechas
---
title: "Ejercicios de clase"
subtitle: "Fundamentos de R"
author: "Estefani Cardenas"
date: "27/10/2022"
output: 
  html_document:
    code_download: true
    toc: true
    toc_float:
      collapsed: false
      smooth_scroll: false
    highlight: kate
---

<!-- Some stuff from thebelab required for the magic -->
<!-- Configure and load Thebe !-->
<script type="text/x-thebe-config">
  {
    requestKernel: true,
    binderOptions: {
      repo: "binder-examples/r",
    },
    kernelOptions: {
      name: "R",
      kernelName: "ir",
    },
  }
</script>

<!-- script for thebelab -->
<script src="https://unpkg.com/thebelab@latest/lib/index.js"></script>

```{r setup, include = FALSE}
knitr::opts_chunk$set(eval = FALSE, warning = FALSE, message = FALSE)
```

# Descripción

- **Nota importante:** todos los ejercicios deben ser resueltos a través de código, **no son válidas las  soluciones manuales**.
- **Descarga y ejecución:** para responder cada pregunta del taller se recomienda descargar el documento *.Rmd* y editarlo desde su computador. También es posible hacerlo desde la página web, sin embargo, tenga paciencia porque puede ser **lenta** la ejecución.
- **Entregable:** documento *.Rmd* con solución a cada pregunta. Enviar este documento a mi correo.
- **Fecha de entrega:** máximo el **lunes 14 de noviembre de 2022**


<center>
<img src = "https://github.com/web-edimer/rproject_udea/blob/gh-pages/temas/Guides/img/img1.PNG?raw=true" />
</center>

# Activación de R

> Clic en **`Activate`** para activar el *kernel* de R y poder ejecutar (`run`) cada fragmento de código desde el navegador. Tenga paciencia ⌛⌛⌛

```{r, eval = TRUE, echo = FALSE}
# ad a button
htmltools::tags$button(
  id = "activateButton",
  style="width: 800px; height: 50px; font-size: 2.5em;", 
  "Activate"
)
```

```{js, eval=TRUE, echo = FALSE}
// thebelab js script
var bootstrapThebe = function() {
    thebelab.bootstrap();
}
document.querySelector("#activateButton").addEventListener('click', bootstrapThebe)
```

# Bibliotecas

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
library(tidyverse)
library(lubridate)
```

# Pregunta 1

- Complete el siguiente fragmento ingresando su nombre en la variable `texto2` y corrija el código...🤯🤯🤯
  - **Rta:** `"Hola, mi nombre es Edimer"`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
texto1 <- "Hola, mi nombre es"
texto2 <- " Estefani"
str_c(texto1, texto2)
```

# Pregunta 2

- Use la función `mean()` para calcular el promedio del siguiente vector 🤔🤔🤔:
  - **Rta:** `53.968`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}

numeros <- c(23, 12.2, "13,5", 11L, 210.14)

numeros_1 <- str_replace_all(string = numeros, pattern = ",", replacement = ".") %>% as.numeric()
class(numeros_1)

mean(numeros_1, na.rm = TRUE)

```

# Pregunta 3

- Construya una base de datos  con los siguientes vectores y obtenga el promedio de los números impares al cuadrado (`v3`) 😨😨😨:
  - **Rta:** `11.66667`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
v1 <- c(1, 2, 3, 4, 5, 6)
v2 <- c("Impar", "Par", "Impar", "Par", "Impar")
v3 <- c(1, 4, 9, 16, 25, 36)

# Solucion 
v2_c <- c(v2, "Par")

dtf <- data.frame(
  v2_c,
  v1,
  v3
)

# se extrae V3

impar_v3 <- impar[,3]
impar_v3

mean(impar_v3)

```

# Pregunta 4

- En la base de datos `PlantGrowth` hay información de peso para tres grupos de plantas (control, tratamiento 1 y tratamiento 2). ¿Cuántos registros superan el promedio general (`media_p4`) de peso (`weight`) para el tratamiento 1? 💡💡💡
  - **Rta:** `2 registros`

```{r}
head(PlantGrowth)
```

```{r}
# tener en cuenta para arreglos mas grandes y conocer el nombre de las entradas

entradas <- PlantGrowth %>% 
  select(c(group)) %>% 
filter(!duplicated(group))
entradas 

```

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
media_p4 <- PlantGrowth %>% 
  pull(weight) %>% 
  mean()
media_p4

trat_1 <- PlantGrowth %>% 
  filter(group == "trt1", weight > media_p4) 
trat_1 %>% 
  count()

```

# Pregunta 5

- Los siguientes vectores poseen información de fechas iniciales y fechas finales para ciclos hipotéticos de cultivos. Obtenga el vector con la diferencia de días para cada cultivo y calcule el promedio de días. 🔂🔂🔂
  - **Rta:** `101.5`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
fecha_inicial <- c("2010-01-01", "2020-01-01", "2021-01-01", "2022-01-01")
fecha_final <- c("2010-03-25", "2020-04-17", "2021-03-10", "2022-05-29")

# Se establecen como fechas
fecha_inicial <- c("2010-01-01", "2020-01-01", "2021-01-01", "2022-01-01") %>% as.Date()
fecha_final <- c("2010-03-25", "2020-04-17", "2021-03-10", "2022-05-29") %>% as.Date()

# Se crea una data.frame 

tabla_fechas <- data.frame(
  fecha_final, 
  fecha_inicial
  )

# Se muta el data.frame y se operan con diferencia entre los vectores 

tabla_diferencia <- tabla1 %>% mutate(
  difere = fecha_final - fecha_inicial
  )
tabla_diferencia

# Promedio 

meandife <- tabla_diferencia[,3]
meandife

mean(meandife)

```

# Pregunta 6

- Con la base de datos de [árboles plantados en el municipio de Cota 2020-2022](https://www.datos.gov.co/Agricultura-y-Desarrollo-Rural/-rboles-plantados-en-el-municipio-de-Cota/6hhh-tp4r) responda ¿cuántos predios superan los 187 árboles plantados?
  - **Rta:** `47`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")
arboles

head(arboles)

# por cantidad 

 arboles %>% 
  filter (Cantidad > 187) %>% 
   count()

```



# Pregunta 7

- Con la base de datos de [árboles plantados en el municipio de Cota 2020-2022](https://www.datos.gov.co/Agricultura-y-Desarrollo-Rural/-rboles-plantados-en-el-municipio-de-Cota/6hhh-tp4r) responda ¿cuántos árboles fueron plantados en el 2021?
  - **Rta:** `16365`
  
```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")

arboles <- read_csv("_rboles_plantados_en_el_municipio_de_Cota.csv")

arb_2021 <- arboles %>% 
  mutate(fecha2 = dmy_hms(Fecha),
         anual = year(fecha2)) %>% 
  filter(anual == 2021)

sum(arboles_2021$Cantidad)
```  

# Pregunta 8

- ¿Cuál es el día con mayor número de registros en el siguiente vector de fechas?
  - **Rta:** `lunes: 15`

```{r, attr.source = c('data-executable="true"', 'data-language="r"')}
vector_year <- seq(from = 1990, to = 2021, by = 2)
vector_mes <- rep(1:12, each = 5)
vector_dia <- rep(1:30, each = 3)

vector_fechas <- str_c(vector_year, "-", vector_mes, "-", vector_dia) %>% as.Date()
vector_fechas




``` 

