No-Detectados Data Analisis en Geociencias


con Geociencias

Ing. Alonso Otiniano - Geocientífico Desarrollador

Colegios de Ingenieros del Perú

2022/09/16 (updated: 2022-09-16)

👋 Hola

En el campo :D: Alonso Otiniano

Soy: Geo. Alonso Otiniano Zavala

Continuación

NO DETECTADOS

Son como estrellas tapadas por las nubes. Sabes que existen solo que no las ves, así que no las ignores, es posible que alumbren tu camino!

El Futuro

En la actualidad la capacidad y velocidad de internet ha incrementado, como en algun momento lo predijo Tim Berners-Lee, el internet sufriría de puntos de inflexión respecto al tráfico, transmisión de datos, tipos de datos y el procesamiento online de los datos. En la actualidad nos encontramos en la puerta de entrada a la WEB 3.0.

FRASE MOTIVACIONAL

I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A “Semantic Web,” which makes this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy, and our daily lives will be handled by machines talking to machines.

Tim Berners-Lee, 1999.

Tópicos

¿Qué se verá?

Problemática

Objetivos

Método

Resultados

Futuras Aplicaciones

Algo Adicional

Visualizacion Espacial

Un poco de Machine Learning!

Problematica

  • Determinación de las características de los recursos geológicos.

  • Métodos Comunes para no-detectados con un alto costo de error.

  • El tratamiento-procesamiento de información geológica en herramientas convencionales requiere un mayor rango de tiempo de trabajo.

  • El costo en la adquisión de software para el procesamiento de datos químicos del agua impacta el presupuesto de los investigadores, sobre todo en universidades.

Veamos!!

library(NADA); library(NADA2); library(tidyverse)
#| code-fold: true
#| code-summary: "expand for full code"
#| code-line-numbers: "1"
Zn <- data.frame(1:18, 1:18)
colnames(Zn) <- c("val","lito")
Zn$val <- c("<4", "<4", "<4", "<4","<4" ,"<4","<4", "<4", 4.5, 5, 8, 14, 7, 15, 16, 17, 20, 16)

#Tratamiento con ROS
Zn$lito <- c("sand", "limestone", "limestone","sand", rep(c("sand","limestone"), 7))
Zn$cen <- ifelse(str_detect(Zn$val, pattern = "<"), TRUE, FALSE)
Zn$val <- as.numeric(str_remove(Zn$val, pattern = "<"))

#Convencionalmente (tratando de completar)
Zn_LD.2 <- c(2, 2, 2, 2,2, 2, 2, 2, 4.5, 5, 8, 14, 7, 15, 16, 17, 20, 16)
val lito cen
4.0 sand TRUE
4.0 limestone TRUE
4.0 limestone TRUE
4.0 sand TRUE
4.0 sand TRUE
4.0 limestone TRUE
4.0 sand TRUE
4.0 limestone TRUE
4.5 sand FALSE
5.0 limestone FALSE
8.0 sand FALSE
14.0 limestone FALSE
7.0 sand FALSE
15.0 limestone FALSE
16.0 sand FALSE
17.0 limestone FALSE
20.0 sand FALSE
16.0 limestone FALSE
Code
# Usando tratamiento convencional
summary(Zn_LD.2)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  2.000   2.000   4.750   7.694  14.750  20.000 
Code
# Usando Robust Orden Statistics (ROS)
censummary(Zn$val, Zn$cen)
all:
       n    n.cen  pct.cen      min      max 
18.00000  8.00000 44.44444  4.00000 20.00000 

limits:
  limit n uncen   pexceed
1     4 8    10 0.5555556
Code
censtats(Zn$val, Zn$cen)
       n    n.cen  pct.cen 
18.00000  8.00000 44.44444 
      median     mean        sd
K-M 4.500000 8.805556  5.808516
ROS 4.794610 8.102029  6.305156
MLE 5.023106 8.459291 11.462609

Objetivos

  • Analizar correctamente las variables de los recursos geológicos.

  • No perder información en el análisis, y usar el método más preciso.

  • Tratamiento-procesamiento con eficiencia y eficacia.

  • Generar un flujo de trabajo idóneo para el análisis en recursos geológicos.

Método de Enseñanza

  • El curso constará de partes teórica-práctica, la mayoría estará basado en la práctica con material bibliográfico detallado del proceso.
Teoría: Desarrollada Semidetallada.
Práctica: Desarrollada Exhaustivamente.
  • Toda la información estará como PDFs en los folderes adjuntos, además de formatos .pdf, .html para que lo entregado no pierda interactividad y sea cual se ha desarrollado cada clase. Se puede descargar todo el material desde el repositorio indicado.

Estructura del Curso

La estructura general consta de tres módulos:

  • Intro R y Rstudio.

  • No-Detectados (NDs) y Data Análisis.

  • Guardando NDs en Base de Datos.

  • Ploteando datos con NDs.

  • Estimando Estadísticos Descriptivos con NDs.

  • Computando Intervalos con NDs

  • Comparando data con NDs y Estándares (ECAs - LMP)

  • Test de muestras apareadas con NDs.

  • Test de dos grupos con NDs.

  • Test de tres grupos o + con NDs.

  • Correlación y Regresión con NDs.

  • Modelos de Regresión Logística.

  • Métodos Multivariables.

  • Visualización y Tratamiento Geo-Espacial.

  • Intro Machine Learning.

Resultados Esperados

  • Generación de una estructura para análisis en geociencias eficiente y eficaz.

  • Análisis correcto de las variables de los recursos geológicos.

  • Uso de información completa en el análisis, y usar el método más preciso.

  • Tratar y procesar información con eficiencia y eficacia.

Futuras Aplicaciones

  • Machine Learning Aplicado a Aguas Superficiales (Base on Principal Component Analysis) – A.Otiniano & J.Andrade

  • Machine Learning No Supervisado en Clusterización Geoquímica (Machine Learning No Supervisado) – A.Otiniano & C.Geraldino

  • Artificial Neural Network aplicado a Peligros Geológicos (Susceptibilidad de Movimientos en Masa) – A.Otiniano & J.Andrade

  • Design of a predictive model of a rock breakage by blasting using artificial neural networks – R. Saenz

Algo más

  • Dashboards.

  • Aplicaciones Interactivas.

  • Presentaciones Dinámicas (html – web based).

  • APIs Machine Learning.

  • Creación de Paquetes, Modelos Avanzados Numéricos en geociencias (estadística - geoestadística - Machine Learning).

¿Dónde lo aprendo?

Porsupuesto que en Zoom!! Y con A.Otiniano, click en el azul!

Avanzando en Geociencias - CIP (印)

Siempre Adelante

Muchas Gracias! (Nos Vemos!)

Slides son creados via el R package xaringan.

El chacra proviene de remark.js, knitr, y R Markdown.