## Análisis Flores y Plantas Ornamentales España y por CCAA 2023 ##
# Datos del ministerio, anuario 2023 #
library(readxl)
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(descr)
ruta <- "C:/Users/Portatil.1/Desktop/Jorge Precedo Rey/Análisis R Flores y plantas Ornamentales 2023 España.xlsx"
plantas_flores <- read_excel(ruta)
## Aunque en la variable producción en miles, hay que tener en cuenta que:
# Los claveles y las plantas ornamentales, están en producción en miles de plantas, el resto es producción en miles de docenas.
## quiero ver sólo los casos de Galicia.
datos_galicia <- plantas_flores[plantas_flores$`Comunidad Autónoma` == "Galicia",]
datos_claveles <- plantas_flores[plantas_flores$`Tipología de planta` == "Claveles",]
## DATOS ESPECÍFICOS CON FLORES.
datos_plantas <- plantas_flores[plantas_flores$`Tipología de planta` == "Plantas",]
datos_plantas <- datos_plantas %>%
select(-`Tipología de planta`)
grafica_plantas <- ggplot(datos_plantas, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de docenas",
title = "Gráfica sobre la producción de plantas España 2023",
subtitle = "En relación a las hectáreas utilizadas") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_plantas_CCAA <- ggplot(datos_plantas, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
title = "Gráfica sobre la producción de plantas en España 2023",
subtitle = "En relación a las CCAA que confeccinan los datos") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_plantas_ha <- ggplot(datos_plantas, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
title = "Gráfica sobre la producción de plantas España 2023",
subtitle = "En relación a las CCAA y las hectáreas utilizadas") +
geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()
summary(datos_plantas$`nº hectáreas producidas`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 2.007 14.080 75.473 102.950 436.910 1
summary(datos_plantas$`producción en miles`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.0 109.5 829.0 6130.8 4175.5 46483.0 1
## DATOS ESPECÍFICOS CON CLAVELES.
# recordar que los datos de claveles son en miles de plantas. º
datos_claveles <- plantas_flores[plantas_flores$`Tipología de planta` == "Claveles",]
datos_claveles <- datos_claveles %>%
select(-`Tipología de planta`)
View(datos_claveles)
plot(datos_claveles$`nº hectáreas producidas`, datos_claveles$`producción en miles`,
xlab = "nº de hectáreas", ylab = "producción en miles de plantas",
main = "Gráfico sobre la producción de claveles en España 2023",
text(datos_claveles$`nº hectáreas producidas`, datos_claveles$`producción en miles`, labels = datos_claveles$`producción en miles`, pos = 4))

## otra opción es con ggplot:
grafica_claveles <- ggplot(datos_claveles, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de plantas",
title = "Gráfica sobre la producción de claveles España 2023",
subtitle = "En relación a las hectáreas utilizadas") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_claveles_CCAA <- ggplot(datos_claveles, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
title = "Gráfica sobre la producción de claveles España 2023",
subtitle = "En relación a las CCAA que confeccinan los datos") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_claveles_ha <- ggplot(datos_claveles, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
title = "Gráfica sobre la producción de claveles España 2023",
subtitle = "En relación a las CCAA y las hectáreas utilizadas") +
geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()
View(datos_claveles)
datos_claveles
## # A tibble: 17 × 4
## `Comunidad Autónoma` Año `nº hectáreas producidas` `producción en miles`
## <chr> <dbl> <dbl> <dbl>
## 1 Andalucía 2023 206. 28580
## 2 Aragón 2023 NA NA
## 3 Asturias 2023 1 135
## 4 Baleares 2023 0.03 2
## 5 Canarias 2023 15.5 1986
## 6 Cantabria 2023 NA NA
## 7 Castilla La Mancha 2023 2.25 62
## 8 Castilla y León 2023 0.12 7
## 9 Cataluña 2023 2 178
## 10 Comunidad Valenciana 2023 2 100
## 11 Extremadura 2023 0.22 8
## 12 Galicia 2023 56.3 4194
## 13 La Rioja 2023 NA NA
## 14 Madrid 2023 NA NA
## 15 Murcia 2023 69 10470
## 16 Navarra 2023 NA NA
## 17 País Vasco 2023 0.08 4
histograma_hectareas <- ggplot(datos_claveles, aes(x = `nº hectáreas producidas`)) +
geom_histogram(binwidth = 5, fill = "forestgreen") +
labs(x = "Nº de hectáreas", y = "frecuencia",
title = "Producción claveles en hectáreas 2023") +
theme_minimal()
table(datos_claveles$`Comunidad Autónoma`, datos_claveles$`nº hectáreas producidas`)
##
## 0.03 0.08 0.12 0.22 1 2 2.25 15.5 56.3 69 205.7
## Andalucía 0 0 0 0 0 0 0 0 0 0 1
## Aragón 0 0 0 0 0 0 0 0 0 0 0
## Asturias 0 0 0 0 1 0 0 0 0 0 0
## Baleares 1 0 0 0 0 0 0 0 0 0 0
## Canarias 0 0 0 0 0 0 0 1 0 0 0
## Cantabria 0 0 0 0 0 0 0 0 0 0 0
## Castilla La Mancha 0 0 0 0 0 0 1 0 0 0 0
## Castilla y León 0 0 1 0 0 0 0 0 0 0 0
## Cataluña 0 0 0 0 0 1 0 0 0 0 0
## Comunidad Valenciana 0 0 0 0 0 1 0 0 0 0 0
## Extremadura 0 0 0 1 0 0 0 0 0 0 0
## Galicia 0 0 0 0 0 0 0 0 1 0 0
## La Rioja 0 0 0 0 0 0 0 0 0 0 0
## Madrid 0 0 0 0 0 0 0 0 0 0 0
## Murcia 0 0 0 0 0 0 0 0 0 1 0
## Navarra 0 0 0 0 0 0 0 0 0 0 0
## País Vasco 0 1 0 0 0 0 0 0 0 0 0
summary(datos_claveles$`nº hectáreas producidas`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.030 0.195 2.000 29.517 25.700 205.700 5
summary(datos_claveles$`producción en miles`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 2.00 7.75 117.50 3810.50 2538.00 28580.00 5
# DATOS ESPECÍFICOS OTRAS FLORES.
datos_otras_flores <- plantas_flores[plantas_flores$`Tipología de planta` == "Otras flores",]
datos_otras_flores <- datos_otras_flores %>%
select(-`Tipología de planta`)
grafica_otras_flores <- ggplot(datos_otras_flores, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de plantas",
title = "Gráfica sobre la producción de otras flores España 2023",
subtitle = "En relación a las hectáreas utilizadas") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_otras_flores_CCAA <- ggplot(datos_claveles, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
title = "Gráfica sobre la producción de otras flores España 2023",
subtitle = "En relación a las CCAA que confeccinan los datos") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_otras_flores_ha <- ggplot(datos_otras_flores, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
title = "Gráfica sobre la producción de otras flores España 2023",
subtitle = "En relación a las CCAA y las hectáreas utilizadas") +
geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()
summary(datos_otras_flores$`nº hectáreas producidas`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.97 2.00 13.97 48.71 77.00 225.11 1
summary(datos_otras_flores$`producción en miles`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.0 101.8 602.0 2979.9 3255.0 17371.0 1
# DATOS ESPECÍFICOS PLANTAS ORNAMENTALES.
#Recordar que los datos de ornamentales son en miles de plantas
datos_ornamentales <- plantas_flores[plantas_flores$`Tipología de planta` == "Plantas Ornamentales",]
datos_ornamentales <- datos_ornamentales %>%
select(-`Tipología de planta`)
grafica_ornamentales <- ggplot(datos_ornamentales, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de plantas",
title = "Gráfica sobre la producción de plantas ornamentales España 2023",
subtitle = "En relación a las hectáreas utilizadas") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_ornamentales_CCAA <- ggplot(datos_ornamentales, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
title = "Gráfica sobre la producción de plantas ornamentales España 2023",
subtitle = "En relación a las CCAA que confeccinan los datos") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_ornamentales_ha <- ggplot(datos_ornamentales, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
title = "Gráfica sobre la producción de plantas ornamentales España 2023",
subtitle = "En relación a las CCAA y las hectáreas utilizadas") +
geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()
summary(datos_ornamentales$`nº hectáreas producidas`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.320 7.645 22.000 326.261 365.200 2126.000 2
summary(datos_ornamentales$`producción en miles`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 6.0 328.5 1232.0 20237.7 25074.0 115659.0 2
# DATOS ESPECÍFICOS ROSAS.
datos_rosas <- plantas_flores[plantas_flores$`Tipología de planta` == "Rosas",]
datos_rosas <- datos_rosas %>%
select(-`Tipología de planta`)
grafica_rosas <- ggplot(datos_rosas, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de docenas plantas",
title = "Gráfica sobre la producción de rosas España 2023",
subtitle = "En relación a las hectáreas utilizadas") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_rosas_CCAA <- ggplot(datos_rosas, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
title = "Gráfica sobre la producción de rosas España 2023",
subtitle = "En relación a las CCAA que confeccinan los datos") +
geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()
grafica_rosas_ha <- ggplot(datos_rosas, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
title = "Gráfica sobre la producción de rosas en España 2023",
subtitle = "En relación a las CCAA y las hectáreas utilizadas") +
geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()
summary(datos_rosas$`nº hectáreas producidas`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.080 1.438 4.525 7.406 9.500 26.000 7
summary(datos_rosas$`producción en miles`)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.0 37.0 463.5 468.8 744.2 1435.0 7