El acceso cada vez mayor que tenemos a más información es la fuerza que ha impulsado al desarrollo de Machine Learning y la Inteligencia Artificial, pero todos los datos en el mundo son inútiles si no se pueden entender, es por esto que la visualización de datos se trata de cómo presentar los datos, a las personas correctas, en el momento adecuado, para permitirles obtener información de manera más efectiva. Por lo tanto, si una imagen vale más que mil palabras, una visualización de datos vale al menos un millón.
La visualización de datos es un término general que describe cualquier esfuerzo para ayudar a las personas a comprender la importancia de los datos colocándolos en un contexto visual. Los patrones, las tendencias y las correlaciones que, en ocasiones, pueden pasar desapercibidos en los datos pueden exponerse y reconocerse más fácilmente con las librerÃÂas de visualización de datos.
En este curso aprenderas una serie de herramientas en el Campo de Medio ambiente a generar diferentes graficos tanto dinamicos como estaticos que permitiran comprender ciertos datos, como calidad del agua, suelo, etc.
El Objetivo es que los participantes adquieran conocimiento en ocho Herramientas claves en la Ciencia de los Satos, que se describe a continuacion:
Una parte importante en la limpieza y procesamiento de los datos que usaremos para hacer nuestros análisis, consiste en detectar si hay datos faltantes y si éstos faltan al azar o siguen un patrón determinado. En el primer caso podemos tomar la decisión de imputar esos valores, pero en el segundo caso la situación es definitivamente delicada. Si los datos faltan siguiendo un patrón tendremos que determinar el impacto de esa situación en el análisis que realizaremos.
R posee varios paquetes que nos ayudan a diagnosticar los valores faltantes en nuestra data. Uno de esos paquete es VIM
##
## Variables sorted by number of missings:
## Variable Count
## DBO5 0.19047619
## Plomo 0.19047619
## Magnesio 0.14285714
## OD 0.09523810
## SULFUROS 0.09523810
## CE 0.04761905
## Fosfatos 0.04761905
## N-AMONICAL 0.04761905
## pH 0.00000000
## Temperatura 0.00000000
## Turbidez 0.00000000
## DQO 0.00000000
## Calcio 0.00000000
## Cobre 0.00000000
## Cromo 0.00000000
## Hierro 0.00000000
## Cloruros 0.00000000
## NTOTAL 0.00000000
## NITRATOS 0.00000000
## NITRITOS 0.00000000
## SULFATOS 0.00000000
Antes de empezar a graficar cualquier variables, es importante conocer la correlación entre dos variables. Con solo algunos pasos puede generar un grafico dinamico con todas las variables de su interes y poder explorar la correlacion que existe. En el siguiente grafico puede hacer un click y observara la correlacion que existe entre dos parametros, como tambien puede guiarse por la escala de colores, lo cual facilita la interpretacion.
En el siguiente grafico, permite obsevar a travez de un mapa de densidad donde se concentra el mayor valor de densidad. Esto permite tomar medidas y acciones en el lugar que muestra el grafico.
En el siguiente mapa se puede observar los puntos de mayor contaminacion para el caso del DQO, esto permite identificar puntos claves y poder tomar acciones.
## OGR data source with driver: ESRI Shapefile
## Source: "D:\1_PROYECTOS_2020_MIRKO\CURSO_2_CATOLICA\datos.shp", layer: "datos"
## with 21 features
## It has 26 fields
En el siguiente grafico permite de una forma dinamica conocer la evolucion del parametro en cuestion, asi tambie permite manejar a travez de linea de tiempo en forma manual y poder observar en que punto y municipio sobrepasa la norma, para el caso del pH.
La agrupación es una técnica para agrupar puntos de datos similares en un grupo y separar las diferentes observaciones en diferentes grupos. En el siguiente grafico se observa para el caso particular del Rio Rocha ciertos agrupamiento entre puntos de monitoreo.
Con la nueva libreria de RSTUDIO, permite contar con muchas herramientas en temas de suelo, entre las que se muestra a continuacion son del contenido de arcilla de varios horizontes, y la segunda grafica de las clases texturales.
##
## br cl gr l pg sil
## 12 11 1 36 1 9
La metodologia consiste en que el participante replique las herramientas en su lugar de estudio, para lo cual se facilitara antes todas los ejercicios y los codigos respectivos y se explicara en detalle el funcionamiento de las herramientas y su adecuacion para fines de personalizacion.
La capacitacion sera virtual con una carga horaria de dos horas por dia, y se espera que el participante pueda replicar en el mismo tiempo que se imparte las herramientas.
Las fechas de inicio del curso seran desde el 4 al 6 de Mayo, con una carga horaria de dos horas por dia. Los horarios seran en en la noche desde las 8 a 10 pm Hora Boliviana.
El limite de alumnos es de 40 personas, y se recibiran las inscripciones en el correo: mirkodelfinsourco@gmail.com