Indice

Introducción

La selección de la base de datos proviene de una propuesta realizada desde la plataforma Kopuru. Kopuru es una plataforma online que conecta empresas y científicos de datos.

El día 8 de abril en LinkedIn vi una publicación de Kopuru donde hablaban del Reto Vespa Velutina.

LinkedIn

El reto que propone Kopuru es el de realizar una predicción sobre la cantidad de nidos que se van a retirar en cada municipio de Bizkaia en el 2020 y visualizar los resultados.

La relevancia del conjunto de datos en su contexto. (15%)

La relevancia proviene de mi preocupación por la dramatica reducción de la población de avejas en el mundo.

“El 40% de los polinizadores invertebrados, en particular abejas y mariposas, se enfrentan a la extinción, según la Plataforma Intergubernamental sobre Biodiversidad y Servicios de los Ecosistemas (IPBES). Aunque no es del todo cierto que “Si la abeja desapareciera del planeta, al hombre sólo le quedarían cuatro años de vida”, una célebre frase falsamente atribuida a Albert Einstein, sí es cierto que estos insectos juegan un papel clave en la naturaleza. Son los encargados de ‘fecundar’ las flores para que luego den frutos y semillas. Se estima que más del 75 % de los cultivos alimentarios del mundo dependen en cierta medida de la polinización."

Uno de los grandes causantes de la reducción de la población de las avejas (en España) es la aparición de la Avispa Asiatica o Vespa velutina. Este insecto está catalogado como Especie Exótica Invasora (EEI), que constituyen la segunda causa de perdida de biodiversidad en el mundo tras la modificación del hábitat.

Se consideran 3 consecuencia:

  • El avispón asiático preda sobre las abejas melíferas, pero también sobre otros polinizadores.
  • El segundo efecto es económico, con la actividad apícola directamente afectada debido a las perdidas en las colonias.
  • La afección a la población humana.

La temperatura, la humedad, la intensidad de la luz, el refugio de la lluvia, y la protección contra el viento son importantes para la selección de sitios de anidación debido a que estos factores determinan la preservación del nido, esencial para la supervivencia de la colonia.

La diversidad de presas del avispón aumenta cuanto más rico es el entorno en insectos; sin embargo, en zonas urbanas y periurbanas o incluso en áreas boscosas, el 65% de las presas de Vespa velutina son las abejas domésticas de los apicultores.

Las avispas obreras detectan las colonias de abejas por el olor de la miel y del polen ensilado en las colmenas Los insectos adultos se alimentan de diferentes líquidos azucarados como néctares de flores de árboles y arbustos, zumos de frutas maduras, excreciones azucaradas de pulgones y savia de cortezas de árboles.

¿ Son datos actuales?

Contamos con los datos hasta el 2019.

El objetivo principal es obtener la evolución de los nidos de avispas para el 2020.

¿Tratan un tema importante para algún colectivo concreto?

Si. Es un tema muy importante para el futuro de la humanidad. Dependemos de la supervivencia de las abejas

Las abejasamenazados por los efectos de la actividad humana.

La polinización es un proceso fundamental para la supervivencia de los ecosistemas, esencial para la producción y reproducción de muchos cultivos y plantas silvestres. Casi el 90 por ciento de las plantas con flores dependen de la polinización para reproducirse; asimismo, el 75 por ciento de los cultivos alimentarios del mundo dependen en cierta medida de la polinización y el 35 de las tierras agrícolas mundiales. Los polinizadores no solo contribuyen directamente a la seguridad alimentaria, sino que además son indispensables para conservar la biodiversidad.

¿Se ha tenido en cuenta la perspectiva de género?

No

La complejidad (tamaño, variables disponibles, tipos de datos, etc.). Nota: Evita los conjuntos excesivamente simples. (30%)

El dataset principal es:

Datos de nidos de avispa asiática

Se recogen los datos de la ubicación de los nidos de avispas asiáticas en Bizkaia (actualizados a 31/12/2019).

##       X_id        URTEA.ANIO   JARDUERA_ZENBAKIA.NUM_ACTUACION
##  Min.   :   1   Min.   :2017   Min.   :        1              
##  1st Qu.:1698   1st Qu.:2018   1st Qu.:      864              
##  Median :3396   Median :2018   Median :     1714              
##  Mean   :3396   Mean   :2018   Mean   :  6571164              
##  3rd Qu.:5093   3rd Qu.:2019   3rd Qu.:     2849              
##  Max.   :6790   Max.   :2019   Max.   :201905384              
##                                                               
##  ALTA_DATA.FECHA.ALTA ERABILTZAILEA_EU.USUARIO_EU ERABILTZAILEA_CAS.USUARIO_CAS
##  Length:6790          Length:6790                 Length:6790                  
##  Class :character     Class :character            Class :character             
##  Mode  :character     Mode  :character            Mode  :character             
##                                                                                
##                                                                                
##                                                                                
##                                                                                
##  UDALERRIA.MUNICIPIO HELBIDEA.DIRECCION ESPEZIE.ESPECIE    KOKALEKUA.UBICACION
##  Length:6790         Length:6790        Length:6790        Length:6790        
##  Class :character    Class :character   Class :character   Class :character   
##  Mode  :character    Mode  :character   Mode  :character   Mode  :character   
##                                                                               
##                                                                               
##                                                                               
##                                                                               
##  ALTUERA.ALTURA    DIAMETROA.DIAMETRO  longitude           latitude        
##  Min.   :  0.000   Min.   :  0.0      Length:6790        Length:6790       
##  1st Qu.:  2.000   1st Qu.: 10.0      Class :character   Class :character  
##  Median :  6.000   Median : 25.0      Mode  :character   Mode  :character  
##  Mean   :  8.183   Mean   : 29.2                                           
##  3rd Qu.: 10.000   3rd Qu.: 40.0                                           
##  Max.   :250.000   Max.   :255.0                                           
##  NA's   :221       NA's   :221                                             
##  EGOERA_EU.ESTADO_EU EGOERA_CAS.ESTADO_CAS ITXIERA_DATA.FECHA.CIERRE
##  Length:6790         Length:6790           Length:6790              
##  Class :character    Class :character      Class :character         
##  Mode  :character    Mode  :character      Mode  :character         
##                                                                     
##                                                                     
##                                                                     
##                                                                     
##  ITXIERAKO.AGENTEA_EU.AGENTE.CIERRE_EU ITXIERAKO.AGENTEA_CAS.AGENTE.CIERRE_CAS
##  Length:6790                           Length:6790                            
##  Class :character                      Class :character                       
##  Mode  :character                      Mode  :character                       
##                                                                               
##                                                                               
##                                                                               
## 

La complejidad data de las diferentes fuentes que nos ofrecen y su futura integración con los siguientes datasets:

¿ Tiene cientos o miles de registros?

Tiene maś de 6.000 registros

Detallamos:

## [1] "Dimensión nidos de Avispas Asiaticas"
## [1] 6790   19
## [1] ""
## [1] "Dimensión Del resto de datasets"
## [1] "Dimensión colmenas"
## [1] 103   4
## [1] "Dimensión frutales"
## [1] 4404    3
## [1] "Dimensión localizacion"
## [1] 102   6

¿ Tiene decenas de variables?

Tiene hasta 2 decenas de variables y hasta 6 mil registros

##¿ Combina datos categóricos y cuantitativos?

Combinan datos categóricos y cuantitativos.

## 'data.frame':    6790 obs. of  19 variables:
##  $ X_id                                   : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ URTEA.ANIO                             : int  2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 ...
##  $ JARDUERA_ZENBAKIA.NUM_ACTUACION        : int  214 22 434 565 766 1012 1081 1420 1790 1975 ...
##  $ ALTA_DATA.FECHA.ALTA                   : chr  "2019-07-06 00:00:00" "2019-03-25 00:00:00" "2019-08-07 00:00:00" "2019-07-20 00:00:00" ...
##  $ ERABILTZAILEA_EU.USUARIO_EU            : chr  "ABADIÑOKO UDALA" "BASALAN" "ABADIÑOKO UDALA" "ABADIÑOKO UDALA" ...
##  $ ERABILTZAILEA_CAS.USUARIO_CAS          : chr  "AYUNTAMIENTO ABADIÑO" "BASALAN" "AYUNTAMIENTO ABADIÑO" "AYUNTAMIENTO ABADIÑO" ...
##  $ UDALERRIA.MUNICIPIO                    : chr  "ABADIÑO" "ABADIÑO" "ABADIÑO" "ABADIÑO" ...
##  $ HELBIDEA.DIRECCION                     : chr  "OLALDE" "MCDONALD'S ABADIÑO" "GEREDIAGA AUZOA 2  " "MUNTSARATZ Nº 19 A" ...
##  $ ESPEZIE.ESPECIE                        : chr  "AVISPA ASIÁTICA" "AVISPA ASIÁTICA" "AVISPA COMÚN" "AVISPA ASIÁTICA" ...
##  $ KOKALEKUA.UBICACION                    : chr  "CONSTRUCCIÓN" "CONSTRUCCIÓN" "CONSTRUCCIÓN" "CONSTRUCCIÓN" ...
##  $ ALTUERA.ALTURA                         : int  0 8 2 4 10 3 10 2 0 1 ...
##  $ DIAMETROA.DIAMETRO                     : int  1 10 2 20 30 30 30 10 30 1 ...
##  $ longitude                              : chr  "532124,0816" "531000,5783" "532159,4404" "532457,6901" ...
##  $ latitude                               : chr  "4777436,519" "4779715,773" "4779313,024" "4777072,989" ...
##  $ EGOERA_EU.ESTADO_EU                    : chr  "ITXITA - EZABATUTA" "ITXITA - EZABATUTA" "ITXITA - EZABATUTA" "ITXITA - EZABATUTA" ...
##  $ EGOERA_CAS.ESTADO_CAS                  : chr  "CERRADA - ELIMINADO" "CERRADA - ELIMINADO" "CERRADA - ELIMINADO" "CERRADA - ELIMINADO" ...
##  $ ITXIERA_DATA.FECHA.CIERRE              : chr  "2019-06-15 00:00:00" "2019-03-25 00:00:00" "2019-09-07 00:00:00" "2019-07-20 00:00:00" ...
##  $ ITXIERAKO.AGENTEA_EU.AGENTE.CIERRE_EU  : chr  "SUHILTZAILEAK" "BASALAN" "SUHILTZAILEAK" "SUHILTZAILEAK" ...
##  $ ITXIERAKO.AGENTEA_CAS.AGENTE.CIERRE_CAS: chr  "BOMBEROS" "BASALAN" "BOMBEROS" "BOMBEROS" ...

La originalidad. No repitas los conjuntos de datos clásicos; puedes, sin embargo, mejorar visualizaciones existentes. (20%)

Creo que es un dataset totalmente original.

¿ Hay otras visualizaciones basadas en este conjunto de datos?

Que yo conozca, no! Este reto no muestra las visualización, sino los [resultados](https://kopuru.com/desafio/vespa-velutina/.

resultados

¿Es una evolución o actualización de un conjunto anterior?

No

¿Has enriquecido un conjunto de datos ya existente?

No, pero se pueden enriquecer, con los datasets adjuntos.

Para obtener un conjunto de visualizaciones que nos permitan mostrar la evolución de las avispas asiáticas, creo que es un reto importantes es la integración del conjunto de datos que nos ofrecen.

Las cuestiones que responderás con la visualización de datos: (35%)

Evolución de los nidos de avispas asiáticas durante los últimos años.

¿Como incluye el número de colmenas de abejas con el número de nidos de avispas?

¿Hay relación de la temperatura y precipitaciones en el número de nidos de avispas?

¿Sigue algún patrón geográfico la disposición de los nidos de avispas?

¿ Tienen en cuenta los puntos anteriores?

Si.

¿ Están bien planteadas?

Creo que sí.

¿Son adecuadas para el conjunto de datos elegido?

Creo que sí.