Visit: https://www.geocaceres.com/
—————————————————————————————————————————————————————————————————
Carlos Eduardo Caceres Gonzalez
Abril 22 del 2019
Una clasificación permite simplificar y generalizar gran cantidad de información en efectivas y significativas categorías, para llevar un relativo orden donde los patrones complejos son representados mas claramente. En una clasificación, los valores son organizados de acuerdo con su grado de similitud, es decir que los valores similares deben ser asignados en la misma categoría y los valores diferentes deben ser asignados en diferentes categorías; el resultado es una agrupación de datos que parece minimizar la cantidad de fluctuación o dispersión de valores dentro de la misma categoría y maximizar la dispersión de valores entre diferentes categorías (Castellanos, 2018).
Hay muchos métodos de clasificación especifica disponibles, y cada aproximación tiene enfoques generales observados desde diferentes perspectivas. En este ejercicio practico, se realizara un clasificación supervisada mediante el metodo Rabdom Forest, realizando previamente una exploración de una imagen Landsat y la observación del comportamiento de sus patrones.
Para la clasificación supervisada se utiliza la escena Landsat identificada como C80080582020082LGN00 de nivel 2, otorgada por mediante la plataforma Earth EXPLORER y sus metadatos pueden ser consultados en: https://earthexplorer.usgs.gov/fgdc/13400/LC80080582020082LGN00/. El área de estudio y las áreas de entrenamiento fueron generadas mediante un software GIS y almacenadas en formato shapefile.
A continuación se presenta una muestra de la información de la banda 2 (azul) del la escena Landsat:
## class : RasterLayer
## dimensions : 7731, 7581, 58608711 (nrow, ncol, ncell)
## resolution : 30, 30 (x, y)
## extent : 411885, 639315, 203385, 435315 (xmin, xmax, ymin, ymax)
## crs : +proj=utm +zone=18 +datum=WGS84 +units=m +no_defs +ellps=WGS84 +towgs84=0,0,0
## source : C:/Users/GEOMATICS/PR/Supervised_Classification_Project/Landsat_Level_2/LC08_L1TP_008058_20200306_20200314_01_T1_sr_band2.tif
## names : LC08_L1TP_008058_20200306_20200314_01_T1_sr_band2
## values : -32768, 32767 (min, max)
El área de estudio corresponde una zona enmarcada entre parte de los municipios de Neiva, Campoalegre, Yaguará y Rivera, en el Departamento del Huila. El área se extiende entre las latitudes 2.677 y 2.988 Norte, y las longitudes 75.234 y 75.477 Oeste (EPSG 4326), como se observa en el mapa 1.
Mapa 1. Ubicacion del area de estudio.
La escena de las imágenes landsat corresponde al path y row 008 y0058 respectivamente y fecha de captura del 22 de marzo del presente año. La extensión total del área de la escena puede observase en el mapa 2 presentado a continuación, resaltando sobre ella cual es el área que será extraída para nuestra zona de interés.
Mapa 2. Ubicacion del area de estudio sobre el area que cubre la escena Landsat.
Se opta por trabajar el proceso de clasificación con las bandas 2 a la 6, correspondientes a las del espectro visible e infrarojos cercanos y medio. A continuación, en las imagenes 1 y 2 se muestra un ejemplo del ploteo de la vista previa de las bandas azul (BLUE) e infrarojo medio (SWIR1).
Inicialmente se realiza la estadística de la escena estudiando sus histogramas individuales y determinando el coeficiente de correlación entre bandas y generando los valores de las firmas espectrales.
Inicialemnte se realiza la estadistica de la imagen. Determinando el coeficiente de correlación entre bandas y generando los valores de las firmas espectrales.
#####C. Composición de imagenes####
Se crea el stack que contiene todas las bandas y se generan las diferentes combinacones para ayudar a detectar las diferentes coberturas y apoyar los segmentos del entrenamiento.
Las areas de entrenamiento se diseñaron de manera aleatoria por medio del uso de la digitalIzación de poligonos en Google Earth, apoyado de las diferentes composiciones RGB de la escena. Se determinó seleccionar 7 clases (las no subrayadas de la lista presentada a continuación) de las 15 exsistentes en el nivel 2 de la metodología Corine Land Cover (CLC) adaptada para colombia, por el IDEAM.
|Id_NCLC | Clase
11 | Zonas Urbanizadas
12 | Zonas industriales o comerciales y redes de comunicación
13 | Zonas de extracción minera y escombreras
14 | Zonas verdes artificializadas, no agricolas
21 | Cultivos transitorios
22 | Cultivos permanentes
23 | Pastos
24 | Areas agricolas heterogeneas
31 | Bosques
32 | Areas con vegetacion herbacea y/o arbustiva
33 | Areas abiertas sin o con poca vegetacion
41 | Areas humedas continentales
42 | Areas humedas costeras
51 | Aguas continentales
52 | Aguas maritimas
Random Forests genera muchos árboles de decisión de clasificación para asignar un píxel no clasificado con sus atributos asociados en una clase (reflectancia espectral, elevación, pendiente). Los valores de píxeles de entrada no clasificados se ejecutan a través de cada uno de los n árboles de decisión. Cada árbol de decisión clasifica el píxel en una de las clases y, es decir, “vota” por determinada clase. Random Forest asigna el píxel a la clase que tiene más votos de todos los árboles de decisión. (Jensen, 2015).
A continuación, se genera el histgrama de cada banda de la escena Landsat8:
## Warning in .hist1(x, maxpixels = maxpixels, main = main, plot = plot, ...): 0%
## of the raster cells were used. 100000 values used.
## Warning in .hist1(x, maxpixels = maxpixels, main = main, plot = plot, ...): 0%
## of the raster cells were used. 100000 values used.
## Warning in .hist1(x, maxpixels = maxpixels, main = main, plot = plot, ...): 0%
## of the raster cells were used. 100000 values used.
## Warning in .hist1(x, maxpixels = maxpixels, main = main, plot = plot, ...): 0%
## of the raster cells were used. 100000 values used.
## Warning in .hist1(x, maxpixels = maxpixels, main = main, plot = plot, ...): 0%
## of the raster cells were used. 100000 values used.
## Warning in .hist1(x, maxpixels = maxpixels, main = main, plot = plot, ...): 0%
## of the raster cells were used. 100000 values used.
Como se observa en la imagen anterior, todos los histogramas sen sesgados a la derehca, las bandas 2 a 4 pertenecientes al espectro visible presentan una dispersión baja, razón por la cual estás bandas limitan la interpretación de algunas cobeturas. Las mayores dispersiones de los histogramas se encuentran en las capas Infrared, lo que resulta una buena opción utilizarlos para estudiar el comportamiento de una variable, como un cultivo pro ejemplo.
Se determina la correlación entre bandas.
## [1] 6
En teledetección, dos bandas situadas muy cerca en el espectro electromagnético tendrán una elevada correlación. Así, en el caso de landsat TM, las tres bandas del visible (muy próximas) aparecen muy correlacionadas, las bandas del infrarrojo cercano (más distantes) aparecen algo menos correlacionadas, lo que ayuda a la diferenciación de patrones en determinadas composiciones al momento de realizar una interpretación visual.
Se realiza la extracción de la zona (crop) de interes de la escena, correspondiente al area de estudio designada en el mapa 1. En la imagen a continuación, se presenta el ara de la escena a clasificar, desplegada en color Verdadero RGB:432 (red-green-blue):
Esta composición constituye la combinación más próxima a la percepción de la tierra con nuestros ojos en el espacio, de allí el nombre de color verdadero. Las bandas visibles dan respuesta a la luz que ha penetrado más profundamente, y por tanto sirve para discriminar agua poco profunda, aguas turbias, corrientes, batimetría y zonas con sedimentos (IGAC, 2010):
• El azul oscuro indica aguas profundas.
• El azul claro representa aguas de mediana profundidad.
• El color verde amarillo indica aguas turbias. • La vegetación se ve con tonalidades verdes.
• El suelo desnudo se observa con tonalidades amarillentas y plateadas.
Composición en Falso Color RGB 543
En esta composición se realza de manera significativa la vegetación, permitiendo determinar su estado sucesional o sanitario. Por otro lado, las zonas urbanas son bien identificables.
El rojo-magenta muestra vegetación vigorosa, cultivos regados, bosques naturales. El color rosa indica la presencia de vegetación menos densa o vegetación en temprano estado de crecimiento. Igual indica la presencia de pastos. Blanco indica la presencia de nubes. El color marrón permite relacionar la presencia de bosques plantados, vegetación arbustiva en función de la densidad. Azul oscuro o negro muestra superficies cubiertas parcial o totalmente por agua: ríos, canales, lagos, embalses y represas. Gris y azul metálico muestran ciudades y áreas pobladas, arenas, suelos desnudos, canteras, depósitos salinos. Verde mate identifica zonas de transición, prados secos frecuentemente asociados a matorrales ralos y vegetación de paramo (IGAC, 2010).
Composición en Falso Color RGB 564
Realza con gran detalle los límites de agua y tierra. El agua se ve de color azul intenso. Los diferentes tipos de vegetación se muestran en colores marrones, verdes y naranja. Realza las diferencias de humedad en el suelo. Es usada para el análisis de humedad en el suelo y en la vegetación. Generalmente el suelo húmedo se observa más oscuro, (IGAC, 2010).
Composición en Falso Color RGB 452
En esta composición la vegetación vigorosa se observa de color verde intenso.
• Las zonas urbanas responden espectralmente con un color violeta.
• De verde a negro, la vegetación arbolada muy densa.
• En negro se observan las zonas cubiertas por agua.
• Zonas de suelos desnudos se observan con colores de rosado a rojo, según el contenido de humedad.
Las areas de entrenamiento fueron trazadas de manera aleatoria y con ayuda de las composiciones anteriormente mencionadas, se lograron 140 areas. En el mapa 3 se presenta la distribución de los puntos.
Mapa 3. Ubicacion de las area de entrenamoento.
Clasificación supervisada se puede definir como el proceso donde se utilizan muestras de pixeles que ya tienen asignadas clases temáticas para asignar píxeles no clasificados a una de estas clases previamente establecidas.
## Loading required package: lattice
## randomForest 4.6-14
## Type rfNews() to see new features/changes/bug fixes.
##
## Attaching package: 'randomForest'
## The following object is masked from 'package:psych':
##
## outlier
## The following object is masked from 'package:ggplot2':
##
## margin
##
## Attaching package: 'e1071'
## The following object is masked from 'package:raster':
##
## interpolate
## note: only 2 unique complexity parameters in default grid. Truncating the grid to 2 .
## 4 cores detected, using 3
## Cropped_landsat.1 Cropped_landsat.2
## Aguas continentales 0.03564762 0.05451429
## Areas abiertas sin o con poca vegetacion 0.05404545 0.08945455
## Areas agricolas heterogeneas 0.04076154 0.07345385
## Bosques 0.03332083 0.06761250
## Pastos 0.04190714 0.07353571
## Zonas Urbanizadas 0.07252143 0.11493929
## Cropped_landsat.3 Cropped_landsat.4
## Aguas continentales 0.03857619 0.06008095
## Areas abiertas sin o con poca vegetacion 0.08836364 0.27109091
## Areas agricolas heterogeneas 0.06095000 0.31731923
## Bosques 0.04827083 0.32216250
## Pastos 0.05795714 0.32150000
## Zonas Urbanizadas 0.11866786 0.26826786
## Cropped_landsat.5 Cropped_landsat.6
## Aguas continentales 0.03279524 0.02026667
## Areas abiertas sin o con poca vegetacion 0.26884545 0.16585455
## Areas agricolas heterogeneas 0.20631923 0.11881154
## Bosques 0.19491250 0.09359167
## Pastos 0.23935714 0.12140000
## Zonas Urbanizadas 0.27033214 0.21178214
## Cropped_landsat.1 Cropped_landsat.2
## Aguas continentales 0.03564762 0.05451429
## Areas abiertas sin o con poca vegetacion 0.05404545 0.08945455
## Areas agricolas heterogeneas 0.04076154 0.07345385
## Bosques 0.03332083 0.06761250
## Pastos 0.04190714 0.07353571
## Zonas Urbanizadas 0.07252143 0.11493929
## Cropped_landsat.3 Cropped_landsat.4
## Aguas continentales 0.03857619 0.06008095
## Areas abiertas sin o con poca vegetacion 0.08836364 0.27109091
## Areas agricolas heterogeneas 0.06095000 0.31731923
## Bosques 0.04827083 0.32216250
## Pastos 0.05795714 0.32150000
## Zonas Urbanizadas 0.11866786 0.26826786
## Cropped_landsat.5 Cropped_landsat.6
## Aguas continentales 0.03279524 0.02026667
## Areas abiertas sin o con poca vegetacion 0.26884545 0.16585455
## Areas agricolas heterogeneas 0.20631923 0.11881154
## Bosques 0.19491250 0.09359167
## Pastos 0.23935714 0.12140000
## Zonas Urbanizadas 0.27033214 0.21178214
Se la imagen de firmas espectrales, el comportamiento de cada clase frente a cada una de las bandas trabajadas. Se verifica la importancia del uso de las bandas del infrarojo para discriminar diferentes tipos de coberturas, como se habia mencionado al momento de la revisión de los histogramas.
Los resultados muestran una clasificación a un nivel de procesamiento con un detalle aceptable. La temática de cuerpos de agua puede observarse facilmente, pero puede apreciarse el efecto del contenido de agua en algunas zonas de vegetación. Se observa similitud entre las clases de tejido urbano y suelos desnudos, lo que conlleva a que el procedimiento debe completar el procedimiento con una revision de formas, patrones y de mas caracteristicas visuales.
En la clasificación supervisada, el analista define las áreas de formación mediante la identificación de regiones o muestras en la imagen que pueden corresponderse claramente con áreas con categoría temática definida, lo que puede llegar a generar un error si no se cuenta con la experiencia tecnica en la selección de las areas de entrenamiento.
Es importante mencionar que la selección de las ares de entrenamiento es clave en la clasificación supervisada.
Independiente del algoritmo o tipo de clasificación que se realice, se requiere de una revisión visual para que se realicen los ajutes necesarios para validar la calidad temática de los resultados.
CASTELLANOS, H. O., Detección de Zonas Mineras a Cielo Abierto. Diseño metodológico con aplicaciones de técnicas de procesamiento digital de imágenes de sensores remotos. 2018.
IGAC. Inerpretación visual de imágenes de sensores remotos y su aplicación en levantamientos de cobertura y uso de la tierra.
JENSEN, J. Introductory Digital Image Processing. A remote Sensing Perspective. 2015.