library(tidyverse)
library(janitor)
datos <- read_csv("Evaluaciones_Agropecuarias_Municipales___EVA._2019_-_2020.csv") %>%
clean_names()
datos %>% head()
codigo_del_departamento <dbl> | departamento <chr> | codigo_del_municipio <dbl> | municipio <chr> | grupo_cultivo_segun_especie <chr> | |
---|---|---|---|---|---|
5 | Antioquia | 5002 | Abejorral | Leguminosas Y Oleaginosas | |
5 | Antioquia | 5002 | Abejorral | Frutales | |
5 | Antioquia | 5002 | Abejorral | Frutales | |
5 | Antioquia | 5002 | Abejorral | Frutales | |
5 | Antioquia | 5002 | Abejorral | Frutales | |
5 | Antioquia | 5002 | Abejorral | Leguminosas Y Oleaginosas |
datos %>%
count(cultivo, sort = TRUE, name = "frecuencia_absoluta") %>%
mutate(frecuencia_relativa = frecuencia_absoluta / 39945)
cultivo <chr> | frecuencia_absoluta <int> | frecuencia_relativa <dbl> | ||
---|---|---|---|---|
Maíz | 3655 | 9.150081e-02 | ||
Fríjol | 2675 | 6.696708e-02 | ||
Yuca | 2504 | 6.268619e-02 | ||
Tomate | 1740 | 4.355989e-02 | ||
Plátano | 1584 | 3.965452e-02 | ||
Café | 1255 | 3.141820e-02 | ||
Arveja | 1220 | 3.054200e-02 | ||
Aguacate | 1160 | 2.903993e-02 | ||
Cacao | 1130 | 2.828890e-02 | ||
Caña panelera | 1122 | 2.808862e-02 |
table(datos$cultivo)
##
## Acelga Achiote
## 71 27
## Achira Agraz
## 114 23
## Aguacate Ahuyama
## 1160 739
## Ají Ajo
## 372 65
## Ajonjolí Albahaca
## 105 42
## Algodón Anón
## 87 8
## Apio Arándano
## 39 55
## Arazá Arracacha
## 28 631
## Arroz Arveja
## 1116 1220
## Asaí Avena
## 33 44
## Badea Banano
## 40 550
## Batata Berenjena
## 54 97
## Borojó Brevo
## 79 42
## Brócoli Cacao
## 89 1130
## Caducifolios Café
## 8 1255
## Caímo Calabacín
## 5 68
## Calabaza Caña azucarera
## 21 104
## Caña miel Caña panelera
## 109 1122
## Cardamomo Cebada
## 12 112
## Cebolla de bulbo Cebolla de rama
## 488 441
## Chamba Chirimoya
## 6 22
## Chontaduro Cilantro
## 110 440
## Cimarrón Ciruela
## 39 74
## Cítricos Cocculus
## 544 2
## Coco Col
## 151 24
## Coliflor Copoazú
## 62 14
## Cúrcuma Curuba
## 5 102
## Dátil Durazno
## 2 183
## Espárrago Espinaca
## 5 32
## Feijoa Fique
## 66 129
## Frambuesa Fresa
## 7 229
## Fríjol Frutales varios
## 2675 18
## Garbanzo Granadilla
## 11 348
## Guama Guanábana
## 3 322
## Guatila Guayaba
## 17 343
## Gulupa o cholupa Haba
## 222 183
## Habichuela Higo
## 699 17
## Hortalizas varias Iraca
## 540 8
## Jengibre Laurel
## 7 4
## Lechuga Lima
## 242 79
## Limón Limonaria
## 480 9
## Lulo Macadamia
## 637 17
## Maíz Malanga
## 3655 217
## Mamoncillo Mandarina
## 9 216
## Mango Mangostino
## 478 20
## Maní Manzana
## 76 33
## Maracuyá Marañón
## 474 19
## Melón Menta
## 391 2
## Mora Moringa
## 589 4
## Nabo Naranja
## 12 419
## Níspero Noni
## 13 2
## Ñame Palma de aceite
## 346 278
## Palmito Papa
## 4 1076
## Papaya Papayuela
## 349 8
## Patilla Pepa de pan
## 509 12
## Pepino cohombro Pepino guiso
## 311 71
## Pera Perejil
## 14 21
## Pimentón Pimienta
## 445 16
## Piña Pitahaya
## 460 164
## Plantas aromáticas Plantas aromáticas y medicinales
## 129 13
## Plantas medicinales Plátano
## 7 1584
## Pomelo Quinua
## 10 74
## Rábano Remolacha
## 6 60
## Repollo Romero
## 178 8
## Ruda Ruscus
## 2 6
## Sábila Sacha inchi
## 105 131
## Sorgo Soya
## 103 55
## Stevia Tabaco
## 7 150
## Tamarindo Tangelo
## 5 14
## Té Tomate
## 2 1740
## Tomate de árbol Tomillo
## 509 5
## Trigo Uchuva
## 160 152
## Ulluco Uva
## 50 112
## Uva caimarona Yuca
## 5 2504
## Zanahoria Zapote
## 345 67
prop.table(table(datos$cultivo))
##
## Acelga Achiote
## 1.777444e-03 6.759294e-04
## Achira Agraz
## 2.853924e-03 5.757917e-04
## Aguacate Ahuyama
## 2.903993e-02 1.850044e-02
## Ají Ajo
## 9.312805e-03 1.627237e-03
## Ajonjolí Albahaca
## 2.628614e-03 1.051446e-03
## Algodón Anón
## 2.177995e-03 2.002754e-04
## Apio Arándano
## 9.763425e-04 1.376893e-03
## Arazá Arracacha
## 7.009638e-04 1.579672e-02
## Arroz Arveja
## 2.793842e-02 3.054200e-02
## Asaí Avena
## 8.261359e-04 1.101515e-03
## Badea Banano
## 1.001377e-03 1.376893e-02
## Batata Berenjena
## 1.351859e-03 2.428339e-03
## Borojó Brevo
## 1.977719e-03 1.051446e-03
## Brócoli Cacao
## 2.228064e-03 2.828890e-02
## Caducifolios Café
## 2.002754e-04 3.141820e-02
## Caímo Calabacín
## 1.251721e-04 1.702341e-03
## Calabaza Caña azucarera
## 5.257229e-04 2.603580e-03
## Caña miel Caña panelera
## 2.728752e-03 2.808862e-02
## Cardamomo Cebada
## 3.004131e-04 2.803855e-03
## Cebolla de bulbo Cebolla de rama
## 1.221680e-02 1.104018e-02
## Chamba Chirimoya
## 1.502065e-04 5.507573e-04
## Chontaduro Cilantro
## 2.753786e-03 1.101515e-02
## Cimarrón Ciruela
## 9.763425e-04 1.852547e-03
## Cítricos Cocculus
## 1.361873e-02 5.006884e-05
## Coco Col
## 3.780198e-03 6.008261e-04
## Coliflor Copoazú
## 1.552134e-03 3.504819e-04
## Cúrcuma Curuba
## 1.251721e-04 2.553511e-03
## Dátil Durazno
## 5.006884e-05 4.581299e-03
## Espárrago Espinaca
## 1.251721e-04 8.011015e-04
## Feijoa Fique
## 1.652272e-03 3.229440e-03
## Frambuesa Fresa
## 1.752410e-04 5.732883e-03
## Fríjol Frutales varios
## 6.696708e-02 4.506196e-04
## Garbanzo Granadilla
## 2.753786e-04 8.711979e-03
## Guama Guanábana
## 7.510327e-05 8.061084e-03
## Guatila Guayaba
## 4.255852e-04 8.586807e-03
## Gulupa o cholupa Haba
## 5.557642e-03 4.581299e-03
## Habichuela Higo
## 1.749906e-02 4.255852e-04
## Hortalizas varias Iraca
## 1.351859e-02 2.002754e-04
## Jengibre Laurel
## 1.752410e-04 1.001377e-04
## Lechuga Lima
## 6.058330e-03 1.977719e-03
## Limón Limonaria
## 1.201652e-02 2.253098e-04
## Lulo Macadamia
## 1.594693e-02 4.255852e-04
## Maíz Malanga
## 9.150081e-02 5.432470e-03
## Mamoncillo Mandarina
## 2.253098e-04 5.407435e-03
## Mango Mangostino
## 1.196645e-02 5.006884e-04
## Maní Manzana
## 1.902616e-03 8.261359e-04
## Maracuyá Marañón
## 1.186632e-02 4.756540e-04
## Melón Menta
## 9.788459e-03 5.006884e-05
## Mora Moringa
## 1.474527e-02 1.001377e-04
## Nabo Naranja
## 3.004131e-04 1.048942e-02
## Níspero Noni
## 3.254475e-04 5.006884e-05
## Ñame Palma de aceite
## 8.661910e-03 6.959569e-03
## Palmito Papa
## 1.001377e-04 2.693704e-02
## Papaya Papayuela
## 8.737013e-03 2.002754e-04
## Patilla Pepa de pan
## 1.274252e-02 3.004131e-04
## Pepino cohombro Pepino guiso
## 7.785705e-03 1.777444e-03
## Pera Perejil
## 3.504819e-04 5.257229e-04
## Pimentón Pimienta
## 1.114032e-02 4.005508e-04
## Piña Pitahaya
## 1.151583e-02 4.105645e-03
## Plantas aromáticas Plantas aromáticas y medicinales
## 3.229440e-03 3.254475e-04
## Plantas medicinales Plátano
## 1.752410e-04 3.965452e-02
## Pomelo Quinua
## 2.503442e-04 1.852547e-03
## Rábano Remolacha
## 1.502065e-04 1.502065e-03
## Repollo Romero
## 4.456127e-03 2.002754e-04
## Ruda Ruscus
## 5.006884e-05 1.502065e-04
## Sábila Sacha inchi
## 2.628614e-03 3.279509e-03
## Sorgo Soya
## 2.578546e-03 1.376893e-03
## Stevia Tabaco
## 1.752410e-04 3.755163e-03
## Tamarindo Tangelo
## 1.251721e-04 3.504819e-04
## Té Tomate
## 5.006884e-05 4.355989e-02
## Tomate de árbol Tomillo
## 1.274252e-02 1.251721e-04
## Trigo Uchuva
## 4.005508e-03 3.805232e-03
## Ulluco Uva
## 1.251721e-03 2.803855e-03
## Uva caimarona Yuca
## 1.251721e-04 6.268619e-02
## Zanahoria Zapote
## 8.636876e-03 1.677306e-03
datos %>%
count(cultivo, departamento)
cultivo <chr> | departamento <chr> | n <int> | ||
---|---|---|---|---|
Acelga | Antioquia | 4 | ||
Acelga | Cauca | 12 | ||
Acelga | Cundinamarca | 22 | ||
Acelga | Huila | 2 | ||
Acelga | Nariño | 14 | ||
Acelga | Norte de Santander | 4 | ||
Acelga | Santander | 2 | ||
Acelga | Tolima | 1 | ||
Acelga | Valle del Cauca | 10 | ||
Achiote | Antioquia | 4 |
datos_maiz <- datos %>%
filter(cultivo == "Maíz")
datos_maiz %>%
count(departamento) %>%
ggplot(mapping = aes(x = departamento, y = n)) +
geom_col()
datos_maiz %>%
count(departamento) %>%
ggplot(mapping = aes(x = fct_reorder(departamento, n), y = n)) +
geom_col(color = "blue", fill = "dodgerblue") +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
labs(x = "Departamento", y = "Total de registros")
datos_maiz %>%
count(departamento) %>%
ggplot(mapping = aes(x = fct_reorder(departamento, n), y = n)) +
geom_col(color = "blue", fill = "dodgerblue") +
coord_flip() +
labs(x = "Departamento", y = "Total de registros")
datos_maiz %>%
filter(ano == 2020) %>%
group_by(departamento) %>%
summarise(promedio_rto = mean(rendimiento_t_ha)) %>%
ggplot(mapping = aes(x = fct_reorder(departamento, promedio_rto), y = promedio_rto)) +
geom_col() +
coord_flip()
datos_maiz %>%
filter(ano == 2020) %>%
group_by(departamento) %>%
summarise(total_area = sum(area_sembrada_ha)) %>%
ggplot(mapping = aes(x = fct_reorder(departamento, total_area), y = total_area)) +
geom_col() +
coord_flip()
datos_maiz %>%
ggplot(mapping = aes(x = rendimiento_t_ha)) +
geom_histogram()
datos_maiz %>%
ggplot(mapping = aes(x = rendimiento_t_ha)) +
geom_histogram(color = "black", fill = "lightblue1") +
labs(x = "Rendimiento (t/ha)", y = "Frecuencia",
title = "Distribución de la variable rendimiento")
datos_maiz %>%
ggplot(mapping = aes(x = rendimiento_t_ha)) +
geom_histogram(color = "black", fill = "lightblue1") +
labs(x = "Rendimiento (t/ha)", y = "Frecuencia",
title = "Distribución de la variable rendimiento") +
scale_x_log10()
datos_maiz %>%
ggplot(mapping = aes(x = rendimiento_t_ha)) +
geom_density(color = "black", fill = "lightblue1") +
labs(x = "Rendimiento (t/ha)", y = "Densidad",
title = "Distribución de la variable rendimiento") +
scale_x_log10()
datos_maiz %>%
ggplot(mapping = aes(x = departamento, y = rendimiento_t_ha)) +
geom_boxplot() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
datos_maiz %>%
ggplot(mapping = aes(x = rendimiento_t_ha, color = as.factor(ano))) +
geom_density() +
labs(x = "Rendimiento (t/ha)", y = "Densidad",
color = "Año")
datos_maiz %>%
ggplot(mapping = aes(x = rendimiento_t_ha, color = as.factor(ano))) +
geom_density() +
labs(x = "Rendimiento (t/ha)", y = "Densidad",
color = "Año") +
scale_x_log10()
datos_maiz %>%
ggplot(mapping = aes(x = rendimiento_t_ha, fill = as.factor(ano))) +
geom_density(alpha = 0.6) +
labs(x = "Rendimiento (t/ha)", y = "Densidad",
fill = "Año") +
scale_x_log10()
datos_maiz %>%
ggplot(mapping = aes(x = departamento, y = rendimiento_t_ha,
fill = as.factor(ano))) +
geom_boxplot() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
labs(x = "Departamento", y = "Rendimiento (t/ha)", fill = "Año")
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha)) +
geom_point()
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha)) +
geom_point() +
scale_x_log10()
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha)) +
geom_point() +
scale_x_log10() +
scale_y_log10()
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha)) +
geom_point() +
scale_x_log10() +
scale_y_log10() +
geom_smooth(method = "lm")
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha)) +
scale_x_log10() +
scale_y_log10() +
geom_smooth(method = "lm")
library(plotly)
ggplotly(
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha)) +
scale_x_log10() +
scale_y_log10() +
geom_smooth(method = "lm")
)
ejemplo <- datos_maiz %>%
select(area_sembrada_ha, area_cosechada_ha, produccion_t, rendimiento_t_ha)
library(GGally)
ggpairs(ejemplo)
matriz_cor <- ejemplo %>%
cor()
matriz_cor
## area_sembrada_ha area_cosechada_ha produccion_t
## area_sembrada_ha 1.0000000 0.9983778 0.9170828
## area_cosechada_ha 0.9983778 1.0000000 0.9216648
## produccion_t 0.9170828 0.9216648 1.0000000
## rendimiento_t_ha 0.1652755 0.1672953 0.2237398
## rendimiento_t_ha
## area_sembrada_ha 0.1652755
## area_cosechada_ha 0.1672953
## produccion_t 0.2237398
## rendimiento_t_ha 1.0000000
library(corrplot)
matriz_cor %>%
corrplot()
matriz_cor %>%
corrplot(
diag = FALSE,
type = "lower",
tl.srt = 25,
tl.col = "black",
method = "pie"
)
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha, color = as.factor(ano))) +
geom_point() +
scale_x_log10()
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha, color = as.factor(ano))) +
geom_point() +
scale_x_log10() +
geom_smooth(method = "lm")
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha, color = as.factor(ano))) +
scale_x_log10() +
geom_smooth(method = "lm", se = FALSE)
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha)) +
facet_wrap(facets = ~departamento) +
geom_point() +
scale_x_log10() +
geom_smooth(method = "lm")
datos_maiz %>%
ggplot(mapping = aes(x = area_sembrada_ha, y = rendimiento_t_ha)) +
facet_wrap(facets = ~departamento, scales = "free", ncol = 4) +
geom_point() +
scale_x_log10() +
geom_smooth(method = "lm")
datos_maiz %>%
group_by(periodo) %>%
summarise(promedio = mean(rendimiento_t_ha),
desv = sd(rendimiento_t_ha)) %>%
ggplot(mapping = aes(x = periodo, y = promedio,
ymin = promedio - desv,
ymax = promedio + desv)) +
geom_col() +
geom_errorbar(width = 0)
datos_maiz %>%
group_by(periodo) %>%
summarise(promedio = mean(rendimiento_t_ha),
desv = sd(rendimiento_t_ha)) %>%
ggplot(mapping = aes(x = periodo, y = promedio,
ymin = promedio - desv,
ymax = promedio + desv)) +
geom_point() +
geom_errorbar(width = 0)