## Análisis Flores y Plantas Ornamentales España y por CCAA 2023 ## 
# Datos del ministerio, anuario 2023 # 

library(readxl)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(descr)

ruta <- "C:/Users/Portatil.1/Desktop/Jorge Precedo Rey/Análisis R Flores y plantas Ornamentales 2023 España.xlsx"

plantas_flores <- read_excel(ruta)

## Aunque en la variable producción en miles, hay que tener en cuenta que: 
# Los claveles y las plantas ornamentales, están en producción en miles de plantas, el resto es producción en miles de docenas. 

## quiero ver sólo los casos de Galicia. 

datos_galicia <- plantas_flores[plantas_flores$`Comunidad Autónoma` == "Galicia",]

datos_claveles <- plantas_flores[plantas_flores$`Tipología de planta` == "Claveles",]

## DATOS ESPECÍFICOS CON FLORES. 

datos_plantas <- plantas_flores[plantas_flores$`Tipología de planta` == "Plantas",]
datos_plantas <- datos_plantas %>% 
  select(-`Tipología de planta`)

grafica_plantas <- ggplot(datos_plantas, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
  geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de docenas",
                                            title = "Gráfica sobre la producción de plantas España 2023",
                                            subtitle = "En relación a las hectáreas utilizadas") + 
  geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_plantas_CCAA <- ggplot(datos_plantas, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
                                            title = "Gráfica sobre la producción de plantas en España 2023",
                                            subtitle = "En relación a las CCAA que confeccinan los datos") + 
  geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_plantas_ha <- ggplot(datos_plantas, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
                                            title = "Gráfica sobre la producción de plantas España 2023",
                                            subtitle = "En relación a las CCAA y las hectáreas utilizadas") + 
  geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()

summary(datos_plantas$`nº hectáreas producidas`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   2.007  14.080  75.473 102.950 436.910       1
summary(datos_plantas$`producción en miles`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##     1.0   109.5   829.0  6130.8  4175.5 46483.0       1
## DATOS ESPECÍFICOS CON CLAVELES. 
# recordar que los datos de claveles son en miles de plantas. º

datos_claveles <- plantas_flores[plantas_flores$`Tipología de planta` == "Claveles",]

datos_claveles <- datos_claveles %>% 
  select(-`Tipología de planta`)

View(datos_claveles)

plot(datos_claveles$`nº hectáreas producidas`, datos_claveles$`producción en miles`,
     xlab = "nº de hectáreas", ylab = "producción en miles de plantas",
     main = "Gráfico sobre la producción de claveles en España 2023",
     text(datos_claveles$`nº hectáreas producidas`, datos_claveles$`producción en miles`, labels = datos_claveles$`producción en miles`, pos = 4))

## otra opción es con ggplot: 

grafica_claveles <- ggplot(datos_claveles, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
                           geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de plantas",
                                  title = "Gráfica sobre la producción de claveles España 2023",
                                  subtitle = "En relación a las hectáreas utilizadas") + 
                             geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_claveles_CCAA <- ggplot(datos_claveles, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
                                            title = "Gráfica sobre la producción de claveles España 2023",
                                            subtitle = "En relación a las CCAA que confeccinan los datos") + 
  geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_claveles_ha <- ggplot(datos_claveles, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
                                            title = "Gráfica sobre la producción de claveles España 2023",
                                            subtitle = "En relación a las CCAA y las hectáreas utilizadas") + 
  geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()
View(datos_claveles)
datos_claveles
## # A tibble: 17 × 4
##    `Comunidad Autónoma`   Año `nº hectáreas producidas` `producción en miles`
##    <chr>                <dbl>                     <dbl>                 <dbl>
##  1 Andalucía             2023                    206.                   28580
##  2 Aragón                2023                     NA                       NA
##  3 Asturias              2023                      1                      135
##  4 Baleares              2023                      0.03                     2
##  5 Canarias              2023                     15.5                   1986
##  6 Cantabria             2023                     NA                       NA
##  7 Castilla La Mancha    2023                      2.25                    62
##  8 Castilla y León       2023                      0.12                     7
##  9 Cataluña              2023                      2                      178
## 10 Comunidad Valenciana  2023                      2                      100
## 11 Extremadura           2023                      0.22                     8
## 12 Galicia               2023                     56.3                   4194
## 13 La Rioja              2023                     NA                       NA
## 14 Madrid                2023                     NA                       NA
## 15 Murcia                2023                     69                    10470
## 16 Navarra               2023                     NA                       NA
## 17 País Vasco            2023                      0.08                     4
histograma_hectareas <- ggplot(datos_claveles, aes(x = `nº hectáreas producidas`)) + 
  geom_histogram(binwidth = 5, fill = "forestgreen") + 
  labs(x = "Nº de hectáreas", y = "frecuencia",
       title = "Producción claveles en hectáreas 2023") + 
  theme_minimal()

table(datos_claveles$`Comunidad Autónoma`, datos_claveles$`nº hectáreas producidas`)
##                       
##                        0.03 0.08 0.12 0.22 1 2 2.25 15.5 56.3 69 205.7
##   Andalucía               0    0    0    0 0 0    0    0    0  0     1
##   Aragón                  0    0    0    0 0 0    0    0    0  0     0
##   Asturias                0    0    0    0 1 0    0    0    0  0     0
##   Baleares                1    0    0    0 0 0    0    0    0  0     0
##   Canarias                0    0    0    0 0 0    0    1    0  0     0
##   Cantabria               0    0    0    0 0 0    0    0    0  0     0
##   Castilla La Mancha      0    0    0    0 0 0    1    0    0  0     0
##   Castilla y León         0    0    1    0 0 0    0    0    0  0     0
##   Cataluña                0    0    0    0 0 1    0    0    0  0     0
##   Comunidad Valenciana    0    0    0    0 0 1    0    0    0  0     0
##   Extremadura             0    0    0    1 0 0    0    0    0  0     0
##   Galicia                 0    0    0    0 0 0    0    0    1  0     0
##   La Rioja                0    0    0    0 0 0    0    0    0  0     0
##   Madrid                  0    0    0    0 0 0    0    0    0  0     0
##   Murcia                  0    0    0    0 0 0    0    0    0  1     0
##   Navarra                 0    0    0    0 0 0    0    0    0  0     0
##   País Vasco              0    1    0    0 0 0    0    0    0  0     0
summary(datos_claveles$`nº hectáreas producidas`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.030   0.195   2.000  29.517  25.700 205.700       5
summary(datos_claveles$`producción en miles`)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max.     NA's 
##     2.00     7.75   117.50  3810.50  2538.00 28580.00        5
# DATOS ESPECÍFICOS OTRAS FLORES. 

datos_otras_flores <- plantas_flores[plantas_flores$`Tipología de planta` == "Otras flores",]
datos_otras_flores <- datos_otras_flores %>% 
  select(-`Tipología de planta`)

grafica_otras_flores <- ggplot(datos_otras_flores, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
  geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de plantas",
                                            title = "Gráfica sobre la producción de otras flores España 2023",
                                            subtitle = "En relación a las hectáreas utilizadas") + 
  geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_otras_flores_CCAA <- ggplot(datos_claveles, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
                                            title = "Gráfica sobre la producción de otras flores España 2023",
                                            subtitle = "En relación a las CCAA que confeccinan los datos") + 
  geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_otras_flores_ha <- ggplot(datos_otras_flores, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
                                            title = "Gráfica sobre la producción de otras flores España 2023",
                                            subtitle = "En relación a las CCAA y las hectáreas utilizadas") + 
  geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()

summary(datos_otras_flores$`nº hectáreas producidas`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.97    2.00   13.97   48.71   77.00  225.11       1
summary(datos_otras_flores$`producción en miles`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##     1.0   101.8   602.0  2979.9  3255.0 17371.0       1
# DATOS ESPECÍFICOS PLANTAS ORNAMENTALES. 
#Recordar que los datos de ornamentales son en miles de plantas 

datos_ornamentales <- plantas_flores[plantas_flores$`Tipología de planta` == "Plantas Ornamentales",]
datos_ornamentales <- datos_ornamentales %>% 
  select(-`Tipología de planta`)

grafica_ornamentales <- ggplot(datos_ornamentales, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
  geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de plantas",
                                            title = "Gráfica sobre la producción de plantas ornamentales España 2023",
                                            subtitle = "En relación a las hectáreas utilizadas") + 
  geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_ornamentales_CCAA <- ggplot(datos_ornamentales, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
                                            title = "Gráfica sobre la producción de plantas ornamentales España 2023",
                                            subtitle = "En relación a las CCAA que confeccinan los datos") + 
  geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_ornamentales_ha <- ggplot(datos_ornamentales, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
                                            title = "Gráfica sobre la producción de plantas ornamentales España 2023",
                                            subtitle = "En relación a las CCAA y las hectáreas utilizadas") + 
  geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()

summary(datos_ornamentales$`nº hectáreas producidas`)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max.     NA's 
##    0.320    7.645   22.000  326.261  365.200 2126.000        2
summary(datos_ornamentales$`producción en miles`)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max.     NA's 
##      6.0    328.5   1232.0  20237.7  25074.0 115659.0        2
# DATOS ESPECÍFICOS ROSAS. 

datos_rosas <- plantas_flores[plantas_flores$`Tipología de planta` == "Rosas",]
datos_rosas <- datos_rosas %>% 
  select(-`Tipología de planta`)

grafica_rosas <- ggplot(datos_rosas, aes(x = `nº hectáreas producidas`, y = `producción en miles`)) +
  geom_point(colour = "forestgreen") + labs(x = "nº de hectáreas producidas", y = "Producción en miles de docenas plantas",
                                            title = "Gráfica sobre la producción de rosas España 2023",
                                            subtitle = "En relación a las hectáreas utilizadas") + 
  geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_rosas_CCAA <- ggplot(datos_rosas, aes(x = `Comunidad Autónoma`, y = `producción en miles`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Producción en miles de plantas",
                                            title = "Gráfica sobre la producción de rosas España 2023",
                                            subtitle = "En relación a las CCAA que confeccinan los datos") + 
  geom_text(aes(label = `producción en miles`), hjust = 0, vjust = 0) + theme_minimal()

grafica_rosas_ha <- ggplot(datos_rosas, aes(x = `Comunidad Autónoma`, y = `nº hectáreas producidas`)) +
  geom_point(colour = "forestgreen") + labs(x = "", y = "Hectáreas utilizadas para la producción",
                                            title = "Gráfica sobre la producción de rosas en España 2023",
                                            subtitle = "En relación a las CCAA y las hectáreas utilizadas") + 
  geom_text(aes(label = `nº hectáreas producidas`), hjust = 0, vjust = 0) + theme_minimal()


summary(datos_rosas$`nº hectáreas producidas`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.080   1.438   4.525   7.406   9.500  26.000       7
summary(datos_rosas$`producción en miles`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##     1.0    37.0   463.5   468.8   744.2  1435.0       7