Juan Camilo Ramirez Gome

clasificación supervisada con imagenes Lansat 8

Introducción:

La clasificación de imágenes se usa comúnmente para reconocer patrones y características de la superficie terrestre; los ejercicios de mapeo de la cobertura del suelo se basan frecuentemente en clasificación de imágenes evaluando todas las bandas posibles en una imagen, las cuales, pueden ayudar a discriminar entre diferentes coberturas. (Jonse & Coutinho 2016). Las características de las coberturas reflejan y emiten energía electromagnética particular en, los diferentes rangos espectrales, los cuales, son capturados por el sensor y almacenados en cada pixel, con un valor Digital. En el presente estudio se utilizaron como insumo las imágenes de Lansat 8, las cuales cuentan con una resolución de 30 metros, 9 bandas del sensor OLI y dos bandas del sensor infrarrojo TIRs, (U.S. Geological Survey 2016). Estas imágenes son de Nivel 1, es decir cuentan con un dato a nivel del sensor, se aplicaron correcciones para determinar la reflectancia a nivel de la atmosfera TOA. Para la clasificación de imágenes se usaró el modelo CART, la clasificación es una clasificación supervisada en la cual se identifican sitios específicos en el área de estudio que representan ejemplos homogéneos de estos tipos de cobertura terrestre conocidos, estos sitios se identificaron por medio de interpretación visual de las imágenes, coberturas IDEAM y Google Earth. Para realizar el proceso de diagnóstico y clasificación de las imágenes Lansat se utilizó el software R Studio con ayuda de las guías de sensores remotos y análisis de imágenes contenida en rspatial.org, para la preparación inicial de las imágenes se utilizó ArcGIS.

Materiales y métodos:

Área de estudio:

El área de estudio corresponde al ecosistema Paramo de Pisba, mas puntualmente las zonas comprendidas por los municipios de Socotá, Chita, Jerico, La Salina, Socha, Tasco y Gameza, al norte del departamento de Boyaca, esta zona se eligió por sus constantes cambios en la cobertura de páramo por las actividades antrópicas (minería, cultivos, deforestación) las cuales presentan un escenario interesante para zonificar las coberturas del suelo. Esta zona comprende unas 200.000 hectáreas aproximadamente, se encuentra en la cuenca del Río Chicamocha, 115 kilómetros al norte de la capital del departamento (Tunja).

cap

cap

Búsqueda y preparación de las imágenes satelitales

Las imágenes satelitales fueron obtenidas del servicio geológico de los estados unidos con su plataforma https://earthexplorer.usgs.gov/. En esta plataforma se digitalizó el área de estudio y se buscaron todas las imágenes satelitales que cubrían el área correspondientes a Lansat 8, nivel 1. Dichas imágenes, se seleccionaron partiendo de la calidad en cuanto a cobertura de nubes, una vez descargadas se cortron al área de interés por medio del software ArcGIS. Posteriormente se procedió a calcular la reflectancia a nivel de la atmosfera (TOA) ya que estas imágenes nivel 1 traen un dato crudo a nivel del sensor. Esta corrección se realizó mediante la siguiente ecuación: TOA_BAND_x= (RERREFLECTANCE_MULT_BAND_x * DN_Band_x + REFLECTANCE_ADD_BAND_x ) / (Sin (SUN_ELEVATION)). REFLECTANCE_MULT_BAND_x, REFLECTANCE_ADD_BAND_x y SUN_ELEVATION se encontraron dentro del metadata de cada imagen.

Cargue de información en R:

Una preparadas as imágenes y calculado la reflectancia TOA, se procedió cargar las imágenes satelitales a Studio R y las librerías necesarias en este caso: library(raster, sp, rgdal, rasterVis, rpart). cálculo de estadísticas básicas: Una vez cargadas las imágenes se calcularon los índices de vegetación normalizada (NDVI) y índice de suelo desnudo (BSI) grafiando las frecuencias con respecto a cada indicador. Para la gráfica de respuesta espectral se digitalizaron zonas de muestra, las cuales se hicieron basado en la capa de coberturas del suelo, Google Earth e interpretación visual de las imágenes, estas digitalizaciones se hicieron con el software ArcGIS. Posteriormente se realizó la gráfica de respuestas espectrales para las 11 categorías de suelo definidas.

Clasificación supervisada:

Para la clasificación supervisada se utilizaron las zonas de muestras anteriormente digitalizadas como zonas de prueba para asignarlas al modelo, en este caso se usaró el modelo CART. Posteriormente de extrajeron valores de celda de datos de Landsat para los sitios de muestra, se entrenó el clasificador con las muestras de entrenamiento y se clasificaron la imágenes con el modelo.

Resultados

Se importaron las librerías necesarias.

## Loading required package: sp
## rgdal: version: 1.4-8, (SVN revision 845)
##  Geospatial Data Abstraction Library extensions to R successfully loaded
##  Loaded GDAL runtime: GDAL 2.2.3, released 2017/11/20
##  Path to GDAL shared files: C:/Users/jcami/Documents/R/win-library/3.6/rgdal/gdal
##  GDAL binary built with GEOS: TRUE 
##  Loaded PROJ.4 runtime: Rel. 4.9.3, 15 August 2016, [PJ_VERSION: 493]
##  Path to PROJ.4 shared files: C:/Users/jcami/Documents/R/win-library/3.6/rgdal/proj
##  Linking to sp version: 1.4-1
## Loading required package: lattice
## Loading required package: latticeExtra

Inicialmente se cargaron los datos ráster, y se crearon combinaciones de verdadero color (4,3,3) y de falso color (5,4,3)

Se observa que la combinación 543 es muy útil para distinguir la vegetación densa de color rojo, la vegetación de páramo tiene un color verde oscuro y las demás coberturas tienen tonos de cían.

Posteriormente se procedió a graficar las los dos índices de interés para el área estudiada: índice de vegetación normalizada (NDVI) y el índice de suelo desnudo (BSI). Las ecuaciones utilizadas para estos indicadores son las siguientes: 1. NDVI: B5-B4)/(B5+B4) 2. BSI: ((B6 + B4) - (B5 + B2)) / ((B6 + B4) + (B5 + B2))

Se observa que el NDVI que la respuestas de los bosques densos alcanza casi los 0.8, mientras que la cobertura vegetal se mantiene sobre los 0.4. El indicador BSI tiene una respuesta alta sobre la cobertura de páramo y suelo desnudo.

Se graficaron las frecuencias de cada indicador, como se observa a continuación.

Posteriormente se procedió a extraer los valores de cada muestra. Estas muestras fueron digitalizadas en ArGIS, e importadas en formato Shapefile.

##                             Banda1     Banda2     Banda3     Banda4     Banda5
## Arbustal                0.08250537 0.06639587 0.05281558 0.04459717 0.11822953
## Bosque denso            0.08588314 0.06701272 0.05255676 0.03451706 0.22875064
## Cuerpos de agua         0.08238636 0.06485456 0.03887227 0.02329241 0.01611544
## Ecosistema de paramo    0.08595664 0.07285319 0.06350996 0.06190480 0.14693256
## Pastos y cultivos       0.09930162 0.08895441 0.09296875 0.09096157 0.27245722
## Plantaciones forestales 0.08615931 0.06870290 0.05213120 0.04367674 0.14498744
## Suelo Desnudo           0.17910284 0.16965255 0.20621584 0.23359068 0.26294124
## Tejido urbano           0.14095319 0.13288357 0.13788415 0.15185042 0.23012886
## Tierras degradadas      0.12639352 0.11813006 0.13190250 0.14496420 0.22685408
## Vegetacion herbacea     0.10057181 0.08553850 0.07973504 0.07058470 0.20747079
##                             Banda6     Banda7
## Arbustal                0.12149665 0.07410248
## Bosque denso            0.10602198 0.04557825
## Cuerpos de agua         0.01660343 0.01302089
## Ecosistema de paramo    0.19653813 0.12649571
## Pastos y cultivos       0.24933095 0.15180512
## Plantaciones forestales 0.09821615 0.05413869
## Suelo Desnudo           0.36763215 0.28976858
## Tejido urbano           0.27231840 0.23415177
## Tierras degradadas      0.27020154 0.18572721
## Vegetacion herbacea     0.19908694 0.12163044

En la tabla anterior se muestran las respuestas espectrales para cada una de las 11 muestras tomadas.

a continuación se muestra grafica de respuesta de cada cobertura en un perfil espectral, el cual refleja la reflectancia de cada cobertura por banda.

Se observa en la gráfica anterior en su mayoría las coberturas presentan una respuesta espectral diferentes en la banda 5, 6 y 7, esto indica que pueden ser separadas con éxito. Las coberturas de Tejido urbano, tierras degradadas y suelo desnudo tienen respuestas espectrales muy parecidas en todas las bandas lo cual puede dificultar la separación y zonificación de estas coberturas.

la siguiente gráfica se muestra las clases y puntos donde se tomaron las muestras para cada categoría

Para entrenar el clasificador se usaron los valores extraídos anteriormente, y se validó el árbol de clasificación nuevamente.

## class      : RasterLayer 
## dimensions : 2001, 2102, 4206102  (nrow, ncol, ncell)
## resolution : 30, 30  (x, y)
## extent     : 737191.6, 800251.6, 634019.1, 694049.1  (xmin, xmax, ymin, ymax)
## crs        : +proj=utm +zone=18 +datum=WGS84 +units=m +no_defs +ellps=WGS84 +towgs84=0,0,0 
## source     : memory
## names      : layer 
## values     : 1, 11  (min, max)
## attributes :
##        ID value
##  from:  1     1
##   to : 11    11

una vez entrenado el clasificador, se procedió a correr el código para clasificar las imágenes satelitales con base en las muestras.

en el gráfico anterior se observa que la cobertura de páramo se mezcla con la vegetación herbácea en su mayoría. También se observan pixel suelos, por ejemplo los de plantaciones forestales las cuales tienden a confundirse con bosques densos naturales. Como se preveía desde un principio las coberturas de tejido urbano pueden ocasionar problemas en estos casos debido a su respuesta espectral similar a los suelos desnudos, es por ello que se observa el tejido urbano en tantas partes sueltas, donde evidentemente no hay zonas urbanos.

Discusión.

Se puede observar que los indicadores NVDI y BSI son útiles para identificar rápidamente tipos de cobertura y suelos desnudos en este caso, cabe resaltar que existen más indicadores que pueden evidenciar cuerpos de agua, o estados de la cobertura vegetal más avanzados. Para este estudio se decidió tomar estos dos solamente debido a que el fin era identificar las coberturas vegetales y las zonas del páramo donde se va perdido la vegetación.

Respecto a las muestras de coberturas dializadas, en su gran mayoría tuvieron respuestas espectrales diferentes, lo cual ayuda a la discriminación de las mismas. en el caso el tejido urbano, suelo desnudo y tierras degradadas se observa que presentan respuestas similares, lo cual generó problemas a la hora de la clasificación.

la clasificación de coberturas obtenida tiene distintos errores, estos errores se presentan en su mayoría para las coberturas de tejido urbano, suelo desnudo y tierras degradadas, donde se pueden observar pixel suelos en zonas donde evidentemente no existe este uso. Este error se presenta debido a la respuesta espectral similar de las muestras, como se evidenció anteriormente, los cual dificulta la discriminación de estas coberturas.

Conclusiones:

El índice NDVI sirve para identificar la cantidad y calidad de la vegetación, esto fue evidenciado en que los bosques densos del área de estudio tenían una respuesta alta, y se diferenciaban con claridad en la imagen.

El indicador de suelo desnudo en este caso no presentó con claridad los suelos desnudo en la imagen, esto quizá sea por la zona de estudio. Es importante seleccionarlos índices correctamente identificando la zona y lo que se quiere saber.

Si bien el método de CART da resultados aceptables, es pertinente probar otros métodos que quizá se acoplen más a las zonas de estudio. cabe resaltar que ningún método arrojará resultados 100% reales, pero pueden dar una aproximación aceptable.

las zonas urbanas del área de estudio son difíciles de identificar por tratarse de áreas pequeñas, lo cual dificulta la clasificación. Es importante realizar más puntos de muestreo para estas.

Es necesario para cualquier clasificación supervisada la toma de múltiples muestras de coberturas, consultando fuentes diferentes y estableciendo con criterio las mejores zonas, las cuales no deben ser en límites de cobertura ya que diferenciar los limites en coberturas naturales es más complicado.

Bibliografía

Chuvieco, E., 1992. Fundamentos de Teledetección espacial. , p.568. Available at: https://search.proquest.com/openview/fa0851b2def4bc35d8ac1287bd08d7d0/1?pq-origsite=gscholar&cbl=1818083.

Jonse, a P.C. & Coutinho, L.C., 2016. Remote Sensing and Spatial Decision Support System. Comparative and General Pharmacology, 00(1), pp.17–19.

Pablo, J., 2005. Validación de una Metodología de Clasificación de Imágenes Satelitales en un entorno Orientado a Objetos. Ingeniería, 10(1), pp.61–69.

U.S. Geological Survey, 2016. Landsat—Earth observation satellites (ver. 1.1, August 2016): U.S. Geological Survey Fact Sheet 2015–3081. USGS, 2020(August), pp.2013–2016. Available at: http://dx.doi.org/10.3133/fs20153081 [Accessed April 21, 2020].