library(readxl)
read_excel("encuesta.xlsx")
encuesta_mal <- encuesta_mal
Marca temporal <dttm> | 1. ¿Cuál es su promedio académico actual? <chr> | |
---|---|---|
2021-03-19 12:10:50 | 3.53 | |
2021-03-19 12:16:32 | 3.8 | |
2021-03-19 12:21:45 | 4.02 | |
2021-03-19 12:26:28 | 4.39 | |
2021-03-19 12:35:05 | 3.99 | |
2021-03-19 12:47:10 | 3.8 | |
2021-03-19 12:48:21 | 3.83 | |
2021-03-19 12:55:22 | 3.8 | |
2021-03-19 12:56:28 | 3.8 | |
2021-03-19 13:04:40 | 3.88 |
library(tidyverse)
glimpse(encuesta_mal)
## Rows: 30
## Columns: 11
## $ `Marca temporal` <dttm> …
## $ `1. ¿Cuál es su promedio académico actual?` <chr> …
## $ `2. ¿Cuál es su color favorito?` <chr> …
## $ `3. En promedio, ¿Cuántas horas de la semana dedica a actividades académicas (estudiar, leer, clases, etc.)?` <chr> …
## $ `4. En promedio, ¿Cuántas horas duerme al día?` <chr> …
## $ `5. ¿En cuántas redes sociales está inscrito actualmente?` <dbl> …
## $ `6. ¿Cuál es la red social que más frecuenta?` <chr> …
## $ `7. Desde que terminó el bachillerato, ¿Cuánto tiempo tardó en ingresar a la universidad?` <chr> …
## $ `8. ¿Tiene usted hábito de lectura?` <chr> …
## $ `9. En promedio, ¿Cuántas horas a la semana permanece conectado a internet (redes sociales, Whatsapp, otras páginas)?` <chr> …
## $ `10. ¿Actualmente trabaja?` <chr> …
# Vector de nombres
c("fecha", "promedio_academico", "color_favorito",
nombres <-"horas_estudiar", "horas_dormir", "redes_sociales",
"redsocial_favorita", "bachiller_universidad",
"lectura", "horas_internet", "trabajo")
encuesta_mal %>%
encuesta_bien <- set_names(nombres) %>%
select(-fecha) %>%
mutate(
promedio_academico = as.numeric(promedio_academico),
horas_estudiar = parse_number(horas_estudiar),
horas_dormir = parse_number(horas_dormir),
horas_internet = parse_number(horas_internet),
color_favorito = str_to_lower(color_favorito),
color_favorito = str_to_sentence(color_favorito)
)
encuesta_bien
promedio_academico <dbl> | color_favorito <chr> | horas_estudiar <dbl> | horas_dormir <dbl> | redes_sociales <dbl> | |
---|---|---|---|---|---|
3.53 | Verde | 30 | 7.0 | 4 | |
3.80 | Amarillo | 12 | 6.0 | 9 | |
4.02 | Rojo | 45 | 6.0 | 3 | |
4.39 | Negro | 60 | 6.0 | 2 | |
3.99 | Azul | 50 | 8.0 | 9 | |
3.80 | Vino tinto | 25 | 2.0 | 5 | |
3.83 | Rosado | 28 | 2.0 | 2 | |
3.80 | Negro | 40 | 6.0 | 4 | |
3.80 | Negro | 40 | 6.0 | 4 | |
3.88 | Azul | 36 | 7.0 | 5 |
write_csv(encuesta_bien, "encuesta_bien.csv")
library(writexl)
write_xlsx(encuesta_bien, "encuesta_bien_excel.xlsx")
library(tidyverse)
read_csv("Superficie_Sembrada_con_Frutales_en_el_departamento_del_Valle_del_Cauca.csv") %>%
area_sembrada <- rename(Year = Año,
bana = `Guana bana`,
Guanátricos = Citricos) %>%
Cí pivot_longer(cols = -c(Municipios, Year),
names_to = "Cultivo",
values_to = "area_sembrada")
area_sembrada
Municipios <chr> | Year <dbl> | Cultivo <chr> | area_sembrada <dbl> | |
---|---|---|---|---|
Cali | 2018 | Aguacate | 5.0 | |
Cali | 2018 | Bananito | 0.0 | |
Cali | 2018 | Banano | 0.0 | |
Cali | 2018 | Borojó | 0.0 | |
Cali | 2018 | Chontaduro | 0.0 | |
Cali | 2018 | Cítricos | 28.0 | |
Cali | 2018 | Coco | 0.0 | |
Cali | 2018 | Granadilla | 0.0 | |
Cali | 2018 | Guanábana | 0.0 | |
Cali | 2018 | Lulo | 0.0 |
read_csv("Superficie_Cosechada_con_Frutales_en_el_Valle_del_Cauca_del_A_o_2000_al_2018.csv") %>%
area_cosechada <- rename(Year = año,
tricos = Citricos,
Cíbana = `Guana bana`,
Guaná`Melón A` = `Melón a`,
`Melón B` = `Melon b`) %>%
filter(Year != "año") %>%
mutate(
across(c(Year:Vid), as.numeric)
%>%
) pivot_longer(cols = -c(Municipios, Year),
names_to = "Cultivo",
values_to = "area_cosechada")
area_cosechada
Municipios <chr> | Year <dbl> | Cultivo <chr> | area_cosechada <dbl> | |
---|---|---|---|---|
Cali | 2018 | Aguacate | 5.0 | |
Cali | 2018 | Bananito | 0.0 | |
Cali | 2018 | Banano | 0.0 | |
Cali | 2018 | Borojó | 0.0 | |
Cali | 2018 | Chontaduro | 0.0 | |
Cali | 2018 | Cítricos | 28.0 | |
Cali | 2018 | Coco | 0.0 | |
Cali | 2018 | Granadilla | 0.0 | |
Cali | 2018 | Guanábana | 0.0 | |
Cali | 2018 | Guayaba | 12.0 |
read_csv(
produccion <-"Producci_n_de_Frutales_en_el_departamento_del_valle_del_cauca_del_a_o_2000_al_2018.csv"
%>%
) rename(
Year = año,
tricos = Citricos,
Cíbana = `Guana bana`,
Guaná`Melón A` = `Melón a`,
`Melón B` = `Melon b`
%>%
) filter(Year != "año") %>%
mutate(across(
.cols = c(Year:Vid),
.fns = ~ str_replace_all(
string = .x,
pattern = ",",
replacement = "."
)%>%
)) mutate(across(c(Year:Vid), as.numeric)) %>%
pivot_longer(cols = -c(Municipios, Year),
names_to = "Cultivo",
values_to = "produccion")
produccion
Municipios <chr> | Year <dbl> | Cultivo <chr> | produccion <dbl> | |
---|---|---|---|---|
Cali | 2018 | Aguacate | 20.000 | |
Cali | 2018 | Bananito | 0.000 | |
Cali | 2018 | Banano | 0.000 | |
Cali | 2018 | Borojó | 0.000 | |
Cali | 2018 | Chontaduro | 0.000 | |
Cali | 2018 | Cítricos | 224.000 | |
Cali | 2018 | Coco | 0.000 | |
Cali | 2018 | Granadilla | 0.000 | |
Cali | 2018 | Guanábana | 0.000 | |
Cali | 2018 | Guayaba | 108.000 |
# Invertir pasos
read_csv(
"Producci_n_de_Frutales_en_el_departamento_del_valle_del_cauca_del_a_o_2000_al_2018.csv"
%>%
) rename(
Year = año,
tricos = Citricos,
Cíbana = `Guana bana`,
Guaná`Melón A` = `Melón a`,
`Melón B` = `Melon b`
%>%
) filter(Year != "año") %>%
pivot_longer(cols = -c(Municipios, Year),
names_to = "Cultivo",
values_to = "produccion") %>%
mutate(Year = as.numeric(Year),
produccion = str_replace_all(string = produccion, pattern = ",",
replacement = "."),
produccion = as.numeric(produccion))
Municipios <chr> | Year <dbl> | Cultivo <chr> | produccion <dbl> | |
---|---|---|---|---|
Cali | 2018 | Aguacate | 20.000 | |
Cali | 2018 | Bananito | 0.000 | |
Cali | 2018 | Banano | 0.000 | |
Cali | 2018 | Borojó | 0.000 | |
Cali | 2018 | Chontaduro | 0.000 | |
Cali | 2018 | Cítricos | 224.000 | |
Cali | 2018 | Coco | 0.000 | |
Cali | 2018 | Granadilla | 0.000 | |
Cali | 2018 | Guanábana | 0.000 | |
Cali | 2018 | Guayaba | 108.000 |
read_csv("Rendimiento_de_Superficie_Sembrada_con_Frutales_en_el_Departamento_del_Valle_del_Cauca.csv") %>%
rendimiento <- rename(
Year = año,
tricos = Citricos,
Cíbana = `Guana bana`,
Guaná`Melón A` = `Melón a`,
`Melón B` = `Melon b`
%>%
) pivot_longer(cols = -c(Municipios, Year),
names_to = "Cultivo",
values_to = "rendimiento")
rendimiento
Municipios <chr> | Year <dbl> | Cultivo <chr> | rendimiento <dbl> | |
---|---|---|---|---|
Dagua | 2010 | Aguacate | 7.00 | |
Dagua | 2010 | Bananito | 11.00 | |
Dagua | 2010 | Banano | NA | |
Dagua | 2010 | Borojó | NA | |
Dagua | 2010 | Chontaduro | 13.00 | |
Dagua | 2010 | Cítricos | 7.00 | |
Dagua | 2010 | Coco | NA | |
Dagua | 2010 | Granadilla | NA | |
Dagua | 2010 | Guanábana | NA | |
Dagua | 2010 | Guayaba | NA |
inner_join(x = area_sembrada, y = area_cosechada,
frutales <-by = c("Municipios", "Year", "Cultivo")) %>%
inner_join(y = produccion, by = c("Municipios", "Year", "Cultivo")) %>%
inner_join(y = rendimiento, by = c("Municipios", "Year", "Cultivo"))
frutales
Municipios <chr> | Year <dbl> | Cultivo <chr> | area_sembrada <dbl> | area_cosechada <dbl> | produccion <dbl> | |
---|---|---|---|---|---|---|
Cali | 2018 | Aguacate | 5.0 | 5.0 | 20.000 | |
Cali | 2018 | Bananito | 0.0 | 0.0 | 0.000 | |
Cali | 2018 | Banano | 0.0 | 0.0 | 0.000 | |
Cali | 2018 | Borojó | 0.0 | 0.0 | 0.000 | |
Cali | 2018 | Chontaduro | 0.0 | 0.0 | 0.000 | |
Cali | 2018 | Cítricos | 28.0 | 28.0 | 224.000 | |
Cali | 2018 | Coco | 0.0 | 0.0 | 0.000 | |
Cali | 2018 | Granadilla | 0.0 | 0.0 | 0.000 | |
Cali | 2018 | Guanábana | 0.0 | 0.0 | 0.000 | |
Cali | 2018 | Lulo | 0.0 | 0.0 | 0.000 |
relocate(year, everything())
library(tidyverse)
library(janitor)
library(lubridate) # manejo de fechas
read_csv("Caudal_Rio_Chinchina_2016.csv") %>%
datos_caudal <- clean_names() %>%
slice(1:31) %>%
pivot_longer(cols = -dia, names_to = "mes", values_to = "caudal") %>%
mutate(year = "2016",
mes = str_c(mes, ".")) %>%
unite(year, mes, dia, sep = "-", col = "fecha") %>%
mutate(fecha = ymd(fecha))
datos_caudal
fecha <date> | caudal <dbl> | |||
---|---|---|---|---|
2016-01-01 | 499.600 | |||
2016-02-01 | 441.700 | |||
2016-03-01 | 500.200 | |||
2016-04-01 | 615.800 | |||
2016-05-01 | 1020.300 | |||
2016-06-01 | 1020.300 | |||
2016-07-01 | 904.700 | |||
2016-08-01 | 962.500 | |||
2016-09-01 | 1932.100 | |||
2016-10-01 | 1479.800 |
plot(x = datos_caudal$fecha, y = datos_caudal$caudal)
%>%
datos_caudal ggplot(mapping = aes(x = fecha, y = caudal)) +
geom_line()
"2020-01-01"
ejemplo <- ymd(ejemplo)
ejemplo_fecha <-
class(ejemplo)
## [1] "character"
class(ejemplo_fecha)
## [1] "Date"
weekdays(ejemplo_fecha)
## [1] "miércoles"
week(ejemplo_fecha)
## [1] 1
month(ejemplo_fecha, label = TRUE, abbr = FALSE)
## [1] enero
## 12 Levels: enero < febrero < marzo < abril < mayo < junio < ... < diciembre
day(ejemplo_fecha)
## [1] 1
year(ejemplo_fecha)
## [1] 2020
# Error
"2016-ene.-1"
ejemplo2 <-ymd(ejemplo2)
## [1] "2016-01-01"
str_c("ene", ".")
## [1] "ene."