INTRODUCCIÓN

Las imágenes aéreas de alta resolución admiten una amplia gama de campos de aplicación como la estimación de diferentes parámetros como la estimación de biomasa a partir de las coberturas vegetales que se puedan determinar, contenido de agua, entre otras características que pueden ser extraídas a partir de la información que brindan las bandas según el sensor que registre las fotografías.

Hay dos tipos de clasificación de imágenes, las cuales son: clasificación supervisada y clasificación no supervisada, las cuales permiten explorar los diferentes parámetros según las clases que se definan, mediante la identificación visual por parte del investigador, de los pixeles de una o de varias de las bandas de una imagen raster para que posteriormente se pueda dar categorías y realizar la clasificación de acuerdo a las probabilidades de cada clase, por lo que para este trabajo se realizó el análisis preliminar para obtener una clasificación de coberturas en un lote de cacao ubicado en Granada, Meta, logrando discriminar entre las diferentes coberturas que se presentaron en el lote seleccionado.

DATOS Y MÉTODOS

El área de estudio corresponde a un lote de cacao (Theobroma cacao) ubicado en la finca “El triunfo” en el municipio de Granada (Meta), el lote tiene un área de 9.5 ha aproximadamente, con coordenadas 73.788178 W; 3.622491 N.

Las fotografías fueron tomadas con el uso de una cámara Canon S110, la cual tiene un sensor CMOS de alta sensibilidad de 12.1 Mpx para la toma de las bandas RGB, y una cámara S100 de 12 Mpx, con una modificación la cual se le extrajo el filtro justo delante del sensor CMOS que impide el paso de la radiación IR para la captura de esta banda del espectro, las imágenes tuvieron una resolución radiométrica de 8 bits (256 ND). Las cámaras fueron transportadas en un drone hexacóptero DJI F550, con previa configuración de la misión de vuelo para tomar las fotografías a una altura de 80 metros sobre el terreno, con un overlap y sidelap del 60%. Con las imágenes se realizó el procesamiento para la obtención del ortomosaico y georreferenciación mediante el uso del software Photoscan 1.3 (Agisoft, Devices) obteniendo una única imagen con una resolución espacial de 3 cm píxel-1.

Llamado de las carpetas
Armado de archivos raster, imágenes que cuentan con una resolucion espacial de 3cm

## Banda Azul
banda_azul <- raster("CAPABLUEproy.tif")
banda_azul
class      : RasterLayer 
dimensions : 1184, 1642, 1944128  (nrow, ncol, ncell)
resolution : 0.03, 0.03  (x, y)
extent     : 1032229, 1032278, 892403.9, 892439.5  (xmin, xmax, ymin, ymax)
crs        : +proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs 
source     : C:/Users/BLACK SQUARE/Desktop/BLACKSQUARE_FOLDER/ANDRES/1_Personal/MAESTRIA/PERCEPCION_REMOTA/CACAO_PR/CAPABLUEproy.tif 
names      : CAPABLUEproy 
values     : 0, 255  (min, max)
## Banda Verde
banda_verde <- raster("CAPAGREENproy.tif")
banda_verde
class      : RasterLayer 
dimensions : 1184, 1642, 1944128  (nrow, ncol, ncell)
resolution : 0.03, 0.03  (x, y)
extent     : 1032229, 1032278, 892403.9, 892439.5  (xmin, xmax, ymin, ymax)
crs        : +proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs 
source     : C:/Users/BLACK SQUARE/Desktop/BLACKSQUARE_FOLDER/ANDRES/1_Personal/MAESTRIA/PERCEPCION_REMOTA/CACAO_PR/CAPAGREENproy.tif 
names      : CAPAGREENproy 
values     : 0, 255  (min, max)
## Banda Roja
banda_roja <- raster("CAPAREDproy.tif")
banda_roja
class      : RasterLayer 
dimensions : 1184, 1642, 1944128  (nrow, ncol, ncell)
resolution : 0.03, 0.03  (x, y)
extent     : 1032229, 1032278, 892403.9, 892439.5  (xmin, xmax, ymin, ymax)
crs        : +proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs 
source     : C:/Users/BLACK SQUARE/Desktop/BLACKSQUARE_FOLDER/ANDRES/1_Personal/MAESTRIA/PERCEPCION_REMOTA/CACAO_PR/CAPAREDproy.tif 
names      : CAPAREDproy 
values     : 0, 255  (min, max)
## Banda IR
banda_NIR <- raster("CAPAIRproy.tif")
banda_NIR
class      : RasterLayer 
dimensions : 1184, 1642, 1944128  (nrow, ncol, ncell)
resolution : 0.03, 0.03  (x, y)
extent     : 1032229, 1032278, 892403.9, 892439.5  (xmin, xmax, ymin, ymax)
crs        : +proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs 
source     : C:/Users/BLACK SQUARE/Desktop/BLACKSQUARE_FOLDER/ANDRES/1_Personal/MAESTRIA/PERCEPCION_REMOTA/CACAO_PR/CAPAIRproy.tif 
names      : CAPAIRproy 
values     : 16, 255  (min, max)
### Se genera el Stack de bandas con las 4 que se va a trabajar
lote_cacao <- stack(banda_azul, banda_verde, banda_roja, banda_NIR)
lote_cacao
class      : RasterStack 
dimensions : 1184, 1642, 1944128, 4  (nrow, ncol, ncell, nlayers)
resolution : 0.03, 0.03  (x, y)
extent     : 1032229, 1032278, 892403.9, 892439.5  (xmin, xmax, ymin, ymax)
crs        : +proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs 
names      : CAPABLUEproy, CAPAGREENproy, CAPAREDproy, CAPAIRproy 
min values :            0,             0,           0,         16 
max values :          255,           255,         255,        255 
# Cambio de nombre de las bandas espectrales
names(lote_cacao) <- paste("Banda ", 1:4,sep = "")
lote_cacao
class      : RasterStack 
dimensions : 1184, 1642, 1944128, 4  (nrow, ncol, ncell, nlayers)
resolution : 0.03, 0.03  (x, y)
extent     : 1032229, 1032278, 892403.9, 892439.5  (xmin, xmax, ymin, ymax)
crs        : +proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs 
names      : Banda.1, Banda.2, Banda.3, Banda.4 
min values :       0,       0,       0,      16 
max values :     255,     255,     255,     255 
plot(lote_cacao)

hist(lote_cacao, main="Plot histograma por banda espectral", maxpixels=ncell(lote_cacao), 
ylab='Frecuencia', xlab = 'Valor de luminosidad')

par(mfrow = c(2,2))

plot(lote_cacao[[1]], main = "Blue", col = gray(0:100 / 100), axes=TRUE, ylab='Norte', xlab = 'Este')
plot(lote_cacao[[2]], main = "Green", col = gray(0:100 / 100), axes=TRUE, ylab='Norte', xlab = 'Este')
plot(lote_cacao[[3]], main = "Red", col = gray(0:100 / 100), axes=TRUE, ylab='Norte', xlab = 'Este')
plot(lote_cacao[[4]], main = "NIR", col = gray(0:100 / 100), axes=TRUE, ylab='Norte', xlab = 'Este')

Generación de las estadisticas unibanda para la imágen raster
## Media
print("Media")
[1] "Media"
cellStats(lote_cacao, 'mean')
 Banda.1  Banda.2  Banda.3  Banda.4 
111.9130 155.7412 151.5823 178.8796 
## Desviación estandar
print("Desviación estandar")
[1] "Desviación estandar"
cellStats(lote_cacao, 'sd')
 Banda.1  Banda.2  Banda.3  Banda.4 
52.07704 43.76693 55.08276 31.68573 
## Varianza
print("Varianza")
[1] "Varianza"
cellStats(lote_cacao, 'var')
 Banda.1  Banda.2  Banda.3  Banda.4 
2712.018 1915.544 3034.110 1003.986 
## Mínimos
print("Mínimos")
[1] "Mínimos"
cellStats(lote_cacao, 'min')
[1]  0  0  0 16
## Máximos
print("Máximos")
[1] "Máximos"
cellStats(lote_cacao, 'max')
[1] 255 255 255 255
## Asimetría
print("Asimetría")
[1] "Asimetría"
cellStats(lote_cacao, 'skew')
   Banda.1    Banda.2    Banda.3    Banda.4 
 0.1507564 -0.4598528 -0.2629572 -1.7663963 
## Curtosis
print("Curtosis")
[1] "Curtosis"
cellStats(lote_cacao, 'kurtosis')
 Banda.1  Banda.2  Banda.3  Banda.4 
2.191182 2.835664 2.059116 7.104256 
Generación de las estadisticas multibanda
azul <- raster("CAPABLUE.tif")
verde <- raster("CAPAGREEN.tif")
rojo <- raster("CAPARED.tif")
nir <- raster("CAPAIR.tif")
bandas <- stack(azul, verde, rojo, nir)
## Covarianza
print("Covarianza presente entre las bandas")
[1] "Covarianza presente entre las bandas"
layerStats(bandas, 'cov')
$covariance
           CAPABLUE CAPAGREEN   CAPARED    CAPAIR
CAPABLUE  2709.7552 2032.5574 2605.8503  376.2718
CAPAGREEN 2032.5574 1914.6969 1998.5990  619.5462
CAPARED   2605.8503 1998.5990 3033.0292  719.0478
CAPAIR     376.2718  619.5462  719.0478 1004.6319

$mean
 CAPABLUE CAPAGREEN   CAPARED    CAPAIR 
 111.8997  155.7298  151.5623  178.8694 
## Coeficiente de Correlación
print("Coeficiente de Correlación presente entre las bandas")
[1] "Coeficiente de Correlación presente entre las bandas"
layerStats(bandas, 'pearson')
$`pearson correlation coefficient`
           CAPABLUE CAPAGREEN   CAPARED    CAPAIR
CAPABLUE  1.0000000 0.8923347 0.9089629 0.2280516
CAPAGREEN 0.8923347 1.0000000 0.8293490 0.4467044
CAPARED   0.9089629 0.8293490 1.0000000 0.4119229
CAPAIR    0.2280516 0.4467044 0.4119229 1.0000000

$mean
 CAPABLUE CAPAGREEN   CAPARED    CAPAIR 
 111.8997  155.7298  151.5623  178.8694 
Generación de las salidas de la imágen a color
plotRGB(lote_cacao,r=3, g=2, b=1 , main="Lote de cacao: Composición de color verdadero", maxpixels=ncell(lote_cacao),  axes=TRUE, ylab="NORTE", xlab= "ESTE")


plotRGB(lote_cacao,r=3, g=2, b=1 , main="Lote de cacao: Composición de color verdadero (hist)",stretch="hist",  axes=TRUE, ylab="NORTE", xlab= "ESTE")


plotRGB(lote_cacao,r=3, g=2, b=1 , main="Lote de cacao: Composición de color verdadero (lin)",stretch="lin",  axes=TRUE, ylab="NORTE", xlab= "ESTE")

Generación de las salidas de la imágen en falso color



# En este momento se oprocede a realizar la composicion en falso color realizando el cambio de la banda azul por la banda NIR
plotRGB(lote_cacao,r=3, g=2, b=4 , main="Lote de cacao: Composición en falso color (hist)",stretch="hist",  axes=TRUE, ylab="NORTE", xlab= "ESTE")


plotRGB(lote_cacao,r=3, g=2, b=4 , main="Lote de cacao: Composición en falso color (lin)",stretch="lin",  axes=TRUE, ylab="NORTE", xlab= "ESTE")

Generación de la relacion que se presenta entre las bandas
pairs(lote_cacao[[1:4]], main = "Lote de cacao: Relacion entre las bandas")

Realización del cálculo de índices de vegetación (NDVI)

El uso de índices de vegetación


NDVI <- function(img, k, i) {
    bk <- img[[k]]
    bi <- img[[i]]
    NDVI <- ((bk - bi) / (bk + bi ))
return(NDVI)
}
ndvi_indice <- NDVI  (lote_cacao,4,3)
ndvi_indice
class      : RasterLayer 
dimensions : 1184, 1642, 1944128  (nrow, ncol, ncell)
resolution : 0.03, 0.03  (x, y)
extent     : 1032229, 1032278, 892403.9, 892439.5  (xmin, xmax, ymin, ymax)
crs        : +proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs 
source     : memory
names      : layer 
values     : -0.755102, 1  (min, max)
plot(ndvi_indice, col = rev(terrain.colors(10)), main = "Lote cacao: Indice de Vegetacion - NDVI", axes=TRUE, ylab="NORTE", xlab= "ESTE")

     
vegNDVI <- reclassify(ndvi_indice, cbind(-Inf, 0.0, NA))

plot(vegNDVI, main="Lote cacao: Indice de Vegetacion NDVI - Discriminación de zonas de NO vegetación", axes=TRUE, ylab="NORTE", xlab= "ESTE")


vegNDVIthres <- reclassify(vegNDVI, c(-Inf,0.2,0, 0.2,0.3,1, 0.3,0.4,2, 0.4,0.5,3, 0.5, Inf, 4))

plot(vegNDVIthres,col = rev(terrain.colors(4)), main = 'NDVI based thresholding')

En cuanto al índice de vegetación de diferencia normalizado (NDVI), se puede evidenciar que se puede destacar con mayor claridad la frondosidad y vigorosidad de la vegetación que se presenta en el área seleccionada, presentándose, en este caso, con un color verde más intenso, ya que, al momento de incluir explícitamente el factor del suelo, éste se puede discriminar con mayor facilidad, mostrando en la imagen con colores claros, mientras que las zonas donde se presentan construcciones, carreteras y suelo desnudo o algún porcentaje de deforestación, se pueden denotar con color rosado, pixeles que se presentan con valores bajos o menores a 0, según este índice de vegetación.

CLASIFICACIONES

Procedimiento para la clasificación supervisada y no supervisada

Para la clasificación de la imagen se tuvo en cuenta el tamaño y peso de ésta al momento del procesamiento, por lo que se intentó realizar la clasificación con la totalidad de la imágen (9,5 ha), pero no fue posible, por lo que fue necesario reducir el tamaño y así realiazr los procesos. Se difinió el área que tuviera el mayor número de clases posible, en el caso de la clasificación supervisada, se definieron las coberturas que se encontraban en la zona de estudio. Una vez calibrados los algoritmos a utilizar se realiza la clasificacion de la imagen y se evalúa la calidad de la clasificación realizada, se verifica los resultados. Este proceso se repite y luego se calcula el valor promedio de los índices de validación, mediante el uso del algoritmo Random Forest (RF), se permitió un aprendizaje para clasificación, mediante la construcción de árboles de decisión durante la etapa de entrenamiento, que permitirán la salida de la clasificación

CLASIFICACION NO SUPERVISADA

Se asume que no se tiene conocimiento del área de estudio, los resultados que genera el algoritmo con esta clasificación, teniendo en cuenta de los valores de los pixeles, formaran agrupaciones según la información de las bandas del raster. Los resultados de la clasificación no supervisada generaron 8 clases, destacándose las diferencias que hay entre lo que es vegetación y lo que corresponde a suelo y otras estructuras y construcciones.

# convertir el raster a matriz de vector
nr <- getValues(bandas)
str(nr)
 num [1:1938660, 1:4] 41 49 61 72 53 46 52 72 71 66 ...
 - attr(*, "dimnames")=List of 2
  ..$ : NULL
  ..$ : chr [1:4] "CAPABLUE" "CAPAGREEN" "CAPARED" "CAPAIR"
# Aquí se realizó el análisis mediante el uso del algoritmo de kmeans
# localizaciones al azar 
set.seed(99)
#Se quiso crear 8 grupos, permitir 500 iteraciones, comenzar con 5 conjuntos aleatorios usando el Método "Lloyd"
kmncluster <- kmeans(na.omit(nr), centers = 8, iter.max = 500, nstart = 5, algorithm="Lloyd")

str(kmncluster)
List of 9
 $ cluster     : int [1:1938660] 8 8 5 5 5 8 8 5 5 5 ...
 $ centers     : num [1:8, 1:4] 93.5 197.8 38.7 121.4 71.8 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : chr [1:8] "1" "2" "3" "4" ...
  .. ..$ : chr [1:4] "CAPABLUE" "CAPAGREEN" "CAPARED" "CAPAIR"
 $ totss       : num 1.68e+10
 $ withinss    : num [1:8] 1.91e+08 2.17e+08 1.77e+08 1.09e+08 2.99e+08 ...
 $ tot.withinss: num 1.86e+09
 $ betweenss   : num 1.49e+10
 $ size        : int [1:8] 84986 251599 96246 74902 400299 453995 356321 220312
 $ iter        : int 126
 $ ifault      : NULL
 - attr(*, "class")= chr "kmeans"
knr <- setValues(bandas, kmncluster$cluster)
knr
class      : RasterBrick 
dimensions : 1185, 1636, 1938660, 4  (nrow, ncol, ncell, nlayers)
resolution : 2.709071e-07, 2.709072e-07  (x, y)
extent     : -73.78741, -73.78697, 3.623138, 3.623459  (xmin, xmax, ymin, ymax)
crs        : +proj=longlat +datum=WGS84 +no_defs +ellps=WGS84 +towgs84=0,0,0 
source     : memory
names      : layer.1, layer.2, layer.3, layer.4 
min values :       1,       1,       1,       1 
max values :       8,       8,       8,       8 
# Se define el color para cada uno de los 8 custeres definidos
#mycolor <- c("#ff0000", "#daa520","#0000ff","#00ff00","#cbbeb5",
#"#c3ff5b", "#ff7373", "#808080")

mycolor <- c("#808080","#ff0000","#0000ff","#00ff00","#cbbeb5",
"#c3ff5b", "#ff7373","#fef65b")
par(mfrow = c(1,1))
plot(bandas, col = rev(terrain.colors(8)), main = "Lote cacao", axes=TRUE, ylab="NORTE", xlab= "ESTE")

nc <- plot(knr, main = 'LOTE CACAO: CLASIFICACIÓN NO SUPERVISADA', col = mycolor )

library(raster)
library(randomForest)
library(caret)
library(ggplot2)
library(lattice)

CLASIFICACION SUPERVISADA

Dentro de los algoritmos que se desarrollan dentro del software Rstudio®, está el de Random Forest (RF), el cual permite un aprendizaje para clasificación, mediante la construcción de árboles de decisión durante la etapa de entrenamiento, que permitirán la salida de la clasificación (Del Toro et al., 2015). Para este caso se utilizó un archivo de entrenamiento con 8 clases dadas así: 1: Plástico, 2: Tejado, 3: Pastos, 4: Plantas de plátano, 5: Plantas de cacao, 6: Coberturas o superficies negras, 7: Suelo desnudo, y 8: Árboles (otros), con el cual se le dieron los insumos al algoritmo para que realizara la clasificación solicitada, obteniendo resultados aceptables, teniendo en cuanta las diferencias que existían entre cada una de las clases determinadas.

datostraining <- read.csv("C:\\Users\\BLACK SQUARE\\Desktop\\BLACKSQUARE_FOLDER\\ANDRES\\1_Personal\\MAESTRIA\\PERCEPCION_REMOTA\\CACAO_PR\\TABLA_TRAINING.csv")

datostraining
knitr::kable(datostraining)

OID_ VALUE COUNT COBERTURA
NA 1 23463 Plastico
NA 2 5570 Tejado
NA 3 11097 Pastos
NA 4 1576 Platano
NA 5 15917 Cacao
NA 6 4627 CobNegra
NA 7 46451 Suelos
NA 8 31877 Arbol


fl <- list.files("C:\\Users\\BLACK SQUARE\\Desktop\\BLACKSQUARE_FOLDER\\ANDRES\\1_Personal\\MAESTRIA\\PERCEPCION_REMOTA\\CACAO_PR\\Nueva carpeta", pattern = ".tif$", full.names = TRUE)

rst <- stack(fl)
names(rst) <- c(paste("b",2:4,sep=""))
plotRGB(rst, r=3, g=2, b=1, scale=1E5, stretch="lin", main = "Lote cacao", axes=TRUE, ylab="NORTE", xlab= "ESTE")

rstTrain <- raster("C:\\Users\\BLACK SQUARE\\Desktop\\BLACKSQUARE_FOLDER\\ANDRES\\1_Personal\\MAESTRIA\\PERCEPCION_REMOTA\\CACAO_PR\\entrenamiento.tif")

rstTrain[rstTrain==0] <- NA

# Se convierte a una representacion del tipo discreto
rstTrain <- ratify(rstTrain)
rstTrain
class      : RasterLayer 
dimensions : 1184, 1642, 1944128  (nrow, ncol, ncell)
resolution : 0.03, 0.03  (x, y)
extent     : 1032229, 1032278, 892403.9, 892439.5  (xmin, xmax, ymin, ymax)
crs        : +proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs 
source     : memory
names      : entrenamiento 
values     : 1, 8  (min, max)
attributes :
# Cambio de nombre de la capa
names(rstTrain) <- "trainClass"

# Se visualiza el raster de entrenamiento
plot(rstTrain, col = rev(topo.colors(8)), main="Áreas de entrenamiento")

tab <- table(values(rstTrain))
print(tab)

    1     2     3     4     5     6     7     8 
23531  5731 11021  1412 15468  4563 46450 30917 
rstDF <- na.omit(values(stack(rstTrain, rst)))
rstDF[,"trainClass"] <- as.factor(as.character(rstDF[,"trainClass"]))


rstDF <- na.omit(values(stack(rstTrain, rst)))
rstDF[,"trainClass"] <- as.factor(as.character(rstDF[,"trainClass"]))

nEvalRounds <- 20

pTrain <- 0.5
n <- nrow(rstDF)
nClasses <- length(unique(rstDF[,"trainClass"]))

# Initialize objects

confMats <- array(NA, dim = c(nClasses,nClasses,nEvalRounds))

evalMatrix<-matrix(NA, nrow=nEvalRounds, ncol=3,dimnames=list(paste("R_",1:nEvalRounds,sep=""),c("Accuracy","Kappa","PSS")))

pb <- txtProgressBar(1, nEvalRounds, style = 3)
# Evaluation function
source(url("https://raw.githubusercontent.com/joaofgoncalves/Evaluation/master/eval.R"))

# Se hace correr el clasificador

for(i in 1:nEvalRounds){
 
  # Crear un  índice que es aleatorio que permite la seleccion de las filas 
  sampIdx <- sample(1:n, size = round(n*pTrain))

  # Se calibra el arbol de decisiones 
  rf <- randomForest (y = as.factor(rstDF[sampIdx, "trainClass"]),x = rstDF[sampIdx, -1], ntree = 100)

  # vector que ayuda a predecir el conjunto de prueba
  testSetPred <- predict(rf, newdata = rstDF[-sampIdx,], type = "response")

  # Obtener el vector de las clases observadas de la muestra realizada
  testSetObs <- rstDF[-sampIdx,"trainClass"]
 
  # Se evalua la clasificacion realizada de la muestra
  evalData <- Evaluate(testSetObs, testSetPred)
 
  evalMatrix[i,] <- c(evalData$Metrics["Accuracy",1],evalData$Metrics["Kappa",1],evalData$Metrics["PSS",1])
 
  # Se almacena la matrix y se realiza su evaluación
  confMats[,,i] <- evalData$ConfusionMatrix
 
  # Se clasifica toda la imagen completa
  rstPredClassTMP <- predict(rst, model = rf,factors = levels(rstDF[,"trainClass"]))
 
  if(i==1){
    # Se realiza el raster predicho
    rstPredClass <- rstPredClassTMP
   
    # Se Obtiene la  precisión para cada  clase.
    Precision <- evalData$Metrics["Precision",,drop=FALSE]
    Recall <- evalData$Metrics["Recall",,drop=FALSE]
   
  }else{
    # Se unen todos los raster que se predijeron
    rstPredClass <- stack(rstPredClass, rstPredClassTMP)
   
    # Obtenga precisión que se obtuvo para cada clase
    Precision <- rbind(Precision,evalData$Metrics["Precision",,drop=FALSE])
    Recall <- rbind(Recall,evalData$Metrics["Recall",,drop=FALSE])
  }
   setTxtProgressBar(pb,i)
 }

  |                                                                                                             
  |                                                                                                       |   0%
  |                                                                                                             
  |=====                                                                                                  |   5%
  |                                                                                                             
  |===========                                                                                            |  11%
  |                                                                                                             
  |================                                                                                       |  16%
  |                                                                                                             
  |======================                                                                                 |  21%
  |                                                                                                             
  |===========================                                                                            |  26%
  |                                                                                                             
  |=================================                                                                      |  32%
  |                                                                                                             
  |======================================                                                                 |  37%
  |                                                                                                             
  |===========================================                                                            |  42%
  |                                                                                                             
  |=================================================                                                      |  47%
  |                                                                                                             
  |======================================================                                                 |  53%
  |                                                                                                             
  |============================================================                                           |  58%
  |                                                                                                             
  |=================================================================                                      |  63%
  |                                                                                                             
  |======================================================================                                 |  68%
  |                                                                                                             
  |============================================================================                           |  74%
  |                                                                                                             
  |=================================================================================                      |  79%
  |                                                                                                             
  |=======================================================================================                |  84%
  |                                                                                                             
  |============================================================================================           |  89%
  |                                                                                                             
  |==================================================================================================     |  95%
  |                                                                                                             
  |=======================================================================================================| 100%
knitr::kable(evalMatrix, digits = 3)

Accuracy Kappa PSS
R_1 0.895 0.866 0.860
R_2 0.896 0.867 0.861
R_3 0.893 0.864 0.857
R_4 0.895 0.865 0.859
R_5 0.894 0.864 0.858
R_6 0.893 0.863 0.857
R_7 0.894 0.864 0.858
R_8 0.895 0.866 0.860
R_9 0.893 0.864 0.858
R_10 0.894 0.865 0.858
R_11 0.894 0.865 0.859
R_12 0.894 0.865 0.859
R_13 0.895 0.866 0.860
R_14 0.895 0.866 0.860
R_15 0.894 0.865 0.859
R_16 0.895 0.865 0.859
R_17 0.894 0.864 0.858
R_18 0.894 0.864 0.858
R_19 0.893 0.863 0.857
R_20 0.895 0.866 0.860


round(apply(evalMatrix,2,FUN = function(x,...) c(mean(x,...), sd(x,...))), 3)
     Accuracy Kappa   PSS
[1,]    0.894 0.865 0.859
[2,]    0.001 0.001 0.001
avgPrecision <- apply(Precision,2,mean)
print("Exactitud")
[1] "Exactitud"
print(round(avgPrecision, 3))
    1     2     3     4     5     6     7     8 
0.991 1.000 0.788 0.494 0.689 0.998 0.989 0.774 
print("Exhaustividad")
[1] "Exhaustividad"
avgRecall <- apply(Recall,2,mean)
print(round(avgRecall, 3))
    1     2     3     4     5     6     7     8 
0.981 1.000 0.859 0.062 0.447 1.000 0.995 0.915 
print("Valor F")
[1] "Valor F"
avgF1 <- (2 * avgPrecision * avgRecall) / (avgPrecision+avgRecall)
print(round(avgF1, 3))
    1     2     3     4     5     6     7     8 
0.986 1.000 0.822 0.110 0.542 0.999 0.992 0.839 
evalMatrix[which.max(evalMatrix[,"Kappa"]), , drop=FALSE]
     Accuracy     Kappa       PSS
R_2 0.8959984 0.8672183 0.8611254
# esta sentencia muestra los mejores resultados de la variable kappa
cm <- as.data.frame(confMats[,,which.max(evalMatrix[,"Kappa"])])

# Cambio de nombre filas/columnas
colnames(cm) <- rownames(cm) <- paste(as.factor("c"),levels(as.factor(rstDF[,"trainClass"])),sep="_")

knitr::kable(cm)
c_1 c_2 c_3 c_4 c_5 c_6 c_7 c_8
c_1 11504 0 0 0 1 6 235 0
c_2 0 2905 0 0 0 0 0 0
c_3 0 0 4782 0 503 0 17 229
c_4 0 0 43 53 96 0 0 494
c_5 0 0 856 16 3458 0 12 3333
c_6 2 0 0 0 0 2231 0 0
c_7 82 0 8 0 8 0 23069 0
c_8 1 0 363 31 897 0 0 14312
rstModalClass <- modal(rstPredClass)

rstModalClassFreq <- modal(rstPredClass, freq=TRUE)

medFreq <- zonal(rstModalClassFreq, rstTrain, fun=median)
colnames(medFreq) <- c("Codigo","frecuencia modal")

medFreq[order(medFreq[,2],decreasing = TRUE),]
     Codigo frecuencia modal
[1,]      1               20
[2,]      2               20
[3,]      3               20
[4,]      5               20
[5,]      6               20
[6,]      7               20
[7,]      8               20
[8,]      4               18
par(mfrow=c(1,2), cex.main=0.8, cex.axis=0.8)

plot(rstModalClass, main = "Clasificación Supervisada por arbol de decisiones")
plot(rstModalClassFreq, main = "Clases con mayor problema de Clasificación")

mycolor1 <- c("#808080","#ff0000","#0000ff","#00ff00","#cbbeb5",
"#c3ff5b", "#ff7373","#fef65b")
par(mfrow = c(1,1))

plot(rstModalClassFreq, col = rev(terrain.colors(8)), main = "Lote cacao", axes=TRUE, ylab="NORTE", xlab= "ESTE")

plot(rstModalClass, main = 'LOTE CACAO: CLASIFICACIÓN SUPERVISADA', col = mycolor1 )

NA
NA
cs <- plot(rstModalClass, main = "Clasificación Supervisada por árbol de decisiones")

DISCUSIÓN

Los resultados obtenidos en el análisis estadístico unibanda evidencian que se presenta una alta correlación entre las bandas del espectro visible tomadas por la cámara sin modificar con afinidad promedio del 86%, mientras que la banda del NIR que fue tomada por la cámara modificada presenta una baja correlación con las demás con un valor promedio de 36%, esto se puede deber dado que, al presentarse un cambio en las características propias del equipo fotográfico, puede presentar y generar ruido en dicha banda. Estos resultados difieren a los presentados por Fan et al., (2018), donde aseguran que utilizaron una configuración de similares características y obtuvieron una correlación de los datos provenientes de las 4 bandas, previa calibración con un panel con reflectancia conocida.

En cuanto al índice espectral generado para este caso, el NDVI, se presenta una congruencia con respecto a las superficies o coberturas que se presentan en el área determinada, ya que se obtuvieron valores menores a 0 en superficies como suelo, estructuras y construcciones, mientras que la vegetación tuvo valores mayores a 0, en este caso, los pastos obtuvieron un valor cercano a 0.2, haciendo énfasis en las plantas arbóreas como el cacao y algunos árboles que se presentan en la zona, los cuales obtuvieron valores alrededor de 0.6 y mayores, datos que tiene similitud al estudio realizado por Olukayode et al., (2018), donde evaluaron el estado fisiológico de plantas de cacao mediante sensoramiento remoto con el uso de un espectrorradiómetro y obtuvieron como resultados para las plantas valores del NDVI en promedio de 0.5.

En cuanto a la clasificación no supervisada, los resultados obtenidos fueron aceptables ya que a grandes rasgos, se realizó con claridad la discriminación entre las zonas que presentaban vegetación y las construcciones y suelo desnudo, teniendo en cuenta que al generar el procesamiento por medio de K-means el cual realiza el agrupamiento en clústeres particionando las observaciones en K agrupaciones en las que cada pixel que posee la imagen raster pertenece a la agrupación con la media más cercana, lo que hace que funciones como prototipo de la agrupación que realiza el algoritmo.

Con respecto a las coberturas vegetales, en especial donde se encontraban las especies perennes, el algoritmo de clasificación no supervisada, catalogó cada uno de los individuos con una mezcla entre las categorías Árboles, cacao y plátano, teniendo en cuenta que dependiendo el sombreamiento que tenía cada planta, asignaba la categoría, y en algunas ocasiones los pastos también fueron catalogados en las categorías de vegetación, por lo que este tipo de datos que se generan con las sombras de los objetos que se tengan en la escena, pueden influenciar notoriamente en la clasificación cuando no es supervisada, además, en este caso teniendo en cuenta las diferentes clases de vegetaciones presentes en el lote analizado, no fue adecuadamente clasificado haciendo discriminación entre ellas, por lo que este tipo de clasificación, si bien caracteriza superficies que son totalmente diferentes, no es tan robusto para la discriminación entre especies vegetales.

Con relación a la clasificación supervisada, donde se tuvieron en cuenta variables como la exactitud (accuracy), la exhaustividad (kappa) y la precisión de la clasificación (PSS) para determinar la calidad que presentó el procesamiento y la clasificación, donde se analiza cual es la relación de las distribuciones de probabilidad de la clasificación antes y durante el procesamiento del evento (Sastoque y Gutiérrez, 2016), se tiene en cuenta el archivo de entrenamiento generado previamente para realizar esta clasificación, definiendo que del total de muestras, un 50% fuera de entrenamiento y el restante fuera de validación del proceso, calculando los valores promedio a partir de la información cada clase y las desviaciones estándar en cada una de las rondas de iteración sobre los datos, y con las variables ya mencionadas, se determinó el valor F que nos permite medir la precisión que tiene la clasificación, previa generación de la matriz de confusión entre las clases, lo que permite la visualización del desempeño de algoritmo que se empleó en la clasificación.

Teniendo en cuenta esta información, y según las características que presentan las plantas y la vegetación en general, para este estudio no es conveniente realizar la caracterización y discriminación de plantas de cacao a partir de los datos que se tienen, ya que, por la similitud de las plantas al ser especies leñosas perennes de porte alto, de alta frondosidad y morfológicamente similares, no es posible diferenciar entre la especie de interés y los árboles presente en la finca “el triunfo”. Espectralmente pueden tener características similares en la región del espectro visible y por la calidad de las imágenes, en especial enfatizando en la banda NIR, se debe tener en cuenta que esta información espectral no logra percibir y denotar diferencias que por medio de los algoritmos aplicados puedan destacarse.

CONCLUSIONES

Aunque los resultados del análisis de la exhaustividad, la exactitud y de la precisión de la clasificación supervisada arrojaron un 86% de precisión, los resultados en general presentan una aceptable discriminación entre las diferentes coberturas, sin embargo al realizar el análisis sobre el cacao como especie de interés, un 45% de muestras que fueron clasificadas acertadamente como cacao, no permite establecer un alto rango de confianza alto para realizar la discriminación de esta especie de interés económico y social para la región, lo que no permitiría generar un posible censo de estas plantas de manera eficiente utilizando los datos que se tuvieron para este ejercicio.

Teniendo en cuenta esto, es posible que mediante un aumento en el número de muestras dentro del archivo de entrenamiento, se pueda mejorar el desempeño de clasificación, sin embargo, se evidencia que algunos algoritmos tiene alguna incertidumbre por lo que genera datos que pueden ser incorrectos al momento de hacer la clasificación, sumado a que cuando se maneja gran volumen de información, el procesamiento de esta puede verse limitado a las características que posea el hardware donde se realice el procedimiento, por lo que es necesario recurrir a equipos de mayor capacidad o limitar el tamaño de las imágenes que se trabajan por parte del usuario.

Al comparar los dos tipos de clasificaciones empleadas, se evidencia que la clasificación supervisada obtuvo mejores resultados al realizar un mayor énfasis en cada una de las clases, definiendo mas claramente los limites de y bordes, lo que genera menos distorsión y más calidad en los datos obtenidos, en comparación a la clasificación no supervisada, en la que se percibe mayor confusión al definir las clases en la zona de estudio, en especial en las coberturas de especies vegetales en general.

REFERENCIAS

---
title: "CLASIFICACIÓN DE COBERTURAS CON IMÁGENES DE DRON"
author: "ANDRÉS VELANDIA S."
date: "15/10/2019"
output: html_notebook
---

## INTRODUCCIÓN
Las imágenes aéreas de alta resolución admiten una amplia gama de campos de aplicación como la estimación de diferentes parámetros como la estimación de biomasa a partir de las coberturas vegetales que se puedan determinar, contenido de agua, entre otras características que pueden ser extraídas a partir de la información que brindan las bandas según el sensor que registre las fotografías.

Hay dos tipos de clasificación de imágenes, las cuales son: clasificación supervisada y clasificación no supervisada, las cuales permiten explorar los diferentes parámetros según las clases que se definan, mediante la identificación visual por parte del investigador, de los pixeles de una o de varias de las bandas de una imagen raster para que posteriormente se pueda dar categorías y realizar la clasificación de acuerdo a las probabilidades de cada clase, por lo que para este trabajo se realizó el análisis preliminar para obtener una clasificación de coberturas en un lote de cacao ubicado en Granada, Meta, logrando discriminar entre las diferentes coberturas que se presentaron en el lote seleccionado.

## DATOS Y MÉTODOS
El área de estudio corresponde a un lote de cacao (_Theobroma cacao_) ubicado en la finca “El triunfo” en el municipio de Granada (Meta), el lote tiene un área de 9.5 ha aproximadamente, con coordenadas 73.788178 W; 3.622491 N.

Las fotografías fueron tomadas con el uso de una cámara Canon S110, la cual tiene un sensor CMOS de alta sensibilidad de 12.1 Mpx para la toma de las bandas RGB, y una cámara S100 de 12 Mpx, con una modificación la cual se le extrajo el filtro justo delante del sensor CMOS que impide el paso de la radiación IR para la captura de esta banda del espectro, las imágenes tuvieron una resolución radiométrica de 8 bits (256 ND). Las cámaras fueron transportadas en un drone hexacóptero DJI F550, con previa configuración de la misión de vuelo para tomar las fotografías a una altura de 80 metros sobre el terreno, con un overlap y sidelap del 60%. Con las imágenes se realizó el procesamiento para la obtención del ortomosaico y georreferenciación mediante el uso del software Photoscan 1.3 (Agisoft, Devices) obteniendo una única imagen con una resolución espacial de 3 cm píxel^-1^.

##### Llamado de las carpetas
```{r setup, include=FALSE, cache = F}
knitr::opts_chunk$set(echo = TRUE, warning =FALSE, message =FALSE , cache.lazy=FALSE, error = TRUE)
require("knitr")
opts_knit$set (root.dir = "C:\\Users\\BLACK SQUARE\\Desktop\\BLACKSQUARE_FOLDER\\ANDRES\\1_Personal\\MAESTRIA\\PERCEPCION_REMOTA\\CACAO_PR")
opts_chunk$set(tidy.opts = list(width.cutoff=60),tidy= TRUE)
library(raster)
library(RStoolbox)
library(rgdal)
library(moments)
library(dplyr)
library(stats)
library(sp)
library(ggplot2)
```

##### Armado de archivos raster, imágenes que cuentan con una resolucion espacial de 3cm
```{r cargar bandas, cache=TRUE}

## Banda Azul
banda_azul <- raster("CAPABLUEproy.tif")
banda_azul

## Banda Verde
banda_verde <- raster("CAPAGREENproy.tif")
banda_verde

## Banda Roja
banda_roja <- raster("CAPAREDproy.tif")
banda_roja

## Banda IR
banda_NIR <- raster("CAPAIRproy.tif")
banda_NIR

### Se genera el Stack de bandas con las 4 que se va a trabajar
lote_cacao <- stack(banda_azul, banda_verde, banda_roja, banda_NIR)
lote_cacao

# Cambio de nombre de las bandas espectrales
names(lote_cacao) <- paste("Banda ", 1:4,sep = "")
lote_cacao

plot(lote_cacao)
```

```{r Visualización, cache=TRUE, fig.align='center', fig.height=5, fig.width=5, dpi=300}
hist(lote_cacao, main="Plot histograma por banda espectral", maxpixels=ncell(lote_cacao), 
ylab='Frecuencia', xlab = 'Valor de luminosidad')

par(mfrow = c(2,2))
plot(lote_cacao[[1]], main = "Blue", col = gray(0:100 / 100), axes=TRUE, ylab='Norte', xlab = 'Este')
plot(lote_cacao[[2]], main = "Green", col = gray(0:100 / 100), axes=TRUE, ylab='Norte', xlab = 'Este')
plot(lote_cacao[[3]], main = "Red", col = gray(0:100 / 100), axes=TRUE, ylab='Norte', xlab = 'Este')
plot(lote_cacao[[4]], main = "NIR", col = gray(0:100 / 100), axes=TRUE, ylab='Norte', xlab = 'Este')
```


##### Generación de las estadisticas unibanda para la imágen raster

```{r estadisticas univariadas, cache=TRUE}
## Media
print("Media")
cellStats(lote_cacao, 'mean')

## Desviación estandar
print("Desviación estandar")
cellStats(lote_cacao, 'sd')

## Varianza
print("Varianza")
cellStats(lote_cacao, 'var')

## Mínimos
print("Mínimos")
cellStats(lote_cacao, 'min')

## Máximos
print("Máximos")
cellStats(lote_cacao, 'max')

## Asimetría
print("Asimetría")
cellStats(lote_cacao, 'skew')

## Curtosis
print("Curtosis")
cellStats(lote_cacao, 'kurtosis')
```

##### Generación de las estadisticas multibanda

```{r estadistica multivariada, cache=TRUE}
azul <- raster("CAPABLUE.tif")
verde <- raster("CAPAGREEN.tif")
rojo <- raster("CAPARED.tif")
nir <- raster("CAPAIR.tif")
bandas <- stack(azul, verde, rojo, nir)
## Covarianza
print("Covarianza presente entre las bandas")
layerStats(bandas, 'cov')

## Coeficiente de Correlación
print("Coeficiente de Correlación presente entre las bandas")
layerStats(bandas, 'pearson')
```

##### Generación de las salidas de la imágen a color
```{r SalidaGrafica, cache=TRUE, fig.align='center',fig.height=5,fig.width=5, dpi=300}
plotRGB(lote_cacao,r=3, g=2, b=1 , main="Lote de cacao: Composición de color verdadero", maxpixels=ncell(lote_cacao),  axes=TRUE, ylab="NORTE", xlab= "ESTE")

plotRGB(lote_cacao,r=3, g=2, b=1 , main="Lote de cacao: Composición de color verdadero (hist)",stretch="hist",  axes=TRUE, ylab="NORTE", xlab= "ESTE")

plotRGB(lote_cacao,r=3, g=2, b=1 , main="Lote de cacao: Composición de color verdadero (lin)",stretch="lin",  axes=TRUE, ylab="NORTE", xlab= "ESTE")
```

##### Generación de las salidas de la imágen en falso color
```{r Salida Falso color, cache=TRUE, fig.align='center',fig.height=5,fig.width=5, dpi=300}



# En este momento se oprocede a realizar la composicion en falso color realizando el cambio de la banda azul por la banda NIR
plotRGB(lote_cacao,r=3, g=2, b=4 , main="Lote de cacao: Composición en falso color (hist)",stretch="hist",  axes=TRUE, ylab="NORTE", xlab= "ESTE")

plotRGB(lote_cacao,r=3, g=2, b=4 , main="Lote de cacao: Composición en falso color (lin)",stretch="lin",  axes=TRUE, ylab="NORTE", xlab= "ESTE")
```

##### Generación de la relacion que se presenta entre las bandas 
```{r relacion entre bandas, cache=TRUE, fig.align='center',fig.height=5,fig.width=5, dpi=300}
pairs(lote_cacao[[1:4]], main = "Lote de cacao: Relacion entre las bandas")
```

##### Realización del cálculo de índices de vegetación (NDVI)
El uso de índices de vegetación 
```{r funciones indices (NDVI), cache=TRUE}

NDVI <- function(img, k, i) {
    bk <- img[[k]]
    bi <- img[[i]]
    NDVI <- ((bk - bi) / (bk + bi ))
return(NDVI)
}
```

```{r calculos indices (NDVI), cache=TRUE, fig.align='center', fig.height=5, fig.width=5, cache=TRUE, dpi=300}
ndvi_indice <- NDVI  (lote_cacao,4,3)
ndvi_indice

plot(ndvi_indice, col = rev(terrain.colors(10)), main = "Lote cacao: Indice de Vegetacion - NDVI", axes=TRUE, ylab="NORTE", xlab= "ESTE")
     
vegNDVI <- reclassify(ndvi_indice, cbind(-Inf, 0.0, NA))

plot(vegNDVI, main="Lote cacao: Indice de Vegetacion NDVI - Discriminación de zonas de NO vegetación", axes=TRUE, ylab="NORTE", xlab= "ESTE")

vegNDVIthres <- reclassify(vegNDVI, c(-Inf,0.2,0, 0.2,0.3,1, 0.3,0.4,2, 0.4,0.5,3, 0.5, Inf, 4))

plot(vegNDVIthres,col = rev(terrain.colors(4)), main = 'NDVI based thresholding')
```

En cuanto al índice de vegetación de diferencia normalizado (NDVI), se puede evidenciar que se puede destacar con mayor claridad la frondosidad y vigorosidad de la vegetación que se presenta en el área seleccionada, presentándose, en este caso, con un color verde más intenso, ya que, al momento de incluir explícitamente el factor del suelo, éste se puede discriminar con mayor facilidad, mostrando en la imagen con colores claros, mientras que las zonas donde se presentan construcciones, carreteras y suelo desnudo o algún porcentaje de deforestación, se pueden denotar con color rosado, pixeles que se presentan con valores bajos o menores a 0, según este índice de vegetación.

### CLASIFICACIONES
#### Procedimiento para la clasificación supervisada y no supervisada
Para la clasificación de la imagen se tuvo en cuenta el tamaño y peso de ésta al momento del procesamiento, por lo que se intentó realizar la clasificación con la totalidad de la imágen (9,5 ha), pero no fue posible, por lo que fue necesario reducir el tamaño y así realiazr los procesos. Se difinió el área que tuviera el mayor número de clases posible, en el caso de la clasificación supervisada, se definieron las coberturas que se encontraban en la zona de estudio. Una vez calibrados los algoritmos a utilizar se realiza la clasificacion de la imagen y se evalúa la calidad de la clasificación realizada, se verifica los resultados. Este proceso se repite y luego se calcula el valor promedio de los índices de validación, mediante el uso del algoritmo Random Forest (RF), se permitió un aprendizaje para clasificación, mediante la construcción de árboles de decisión durante la etapa de entrenamiento, que permitirán la salida de la clasificación

### CLASIFICACION NO SUPERVISADA
Se asume que no se tiene conocimiento del área de estudio, los resultados que genera el algoritmo con esta clasificación, teniendo en cuenta de los valores de los pixeles, formaran agrupaciones según la información de las bandas del raster. Los resultados de la clasificación no supervisada generaron 8 clases, destacándose las diferencias que hay entre lo que es vegetación y lo que corresponde a suelo y otras estructuras y construcciones. 

```{r clasificación No SUPERVISADA, cache=TRUE}
# convertir el raster a matriz de vector
nr <- getValues(bandas)
str(nr)
```

```{r ajustes CNS, cache=TRUE}
# Aquí se realizó el análisis mediante el uso del algoritmo de kmeans
# localizaciones al azar 
set.seed(99)
#Se quiso crear 8 grupos, permitir 500 iteraciones, comenzar con 5 conjuntos aleatorios usando el Método "Lloyd"
kmncluster <- kmeans(na.omit(nr), centers = 8, iter.max = 500, nstart = 5, algorithm="Lloyd")

str(kmncluster)
```

```{r ajustes2 CNS, cache=TRUE}
knr <- setValues(bandas, kmncluster$cluster)
knr
```

```{r clasif NO SUPERVISADA PLOTS, cache=TRUE, fig.align='center', fig.height=5, fig.width=5, cache=TRUE, dpi=300}
# Se define el color para cada uno de los 8 custeres definidos
#mycolor <- c("#ff0000", "#daa520","#0000ff","#00ff00","#cbbeb5",
#"#c3ff5b", "#ff7373", "#808080")

mycolor <- c("#808080","#ff0000","#0000ff","#00ff00","#cbbeb5",
"#c3ff5b", "#ff7373","#fef65b")
par(mfrow = c(1,1))
plot(bandas, col = rev(terrain.colors(8)), main = "Lote cacao", axes=TRUE, ylab="NORTE", xlab= "ESTE")
nc <- plot(knr, main = 'LOTE CACAO: CLASIFICACIÓN NO SUPERVISADA', col = mycolor )
```

```{r llamado de nuevas librerias,  cache=TRUE}
library(raster)
library(randomForest)
library(caret)
library(ggplot2)
library(lattice)
```

### CLASIFICACION SUPERVISADA
Dentro de los algoritmos que se desarrollan dentro del software Rstudio®, está el de Random Forest (RF), el cual permite un aprendizaje para clasificación, mediante la construcción de árboles de decisión durante la etapa de entrenamiento, que permitirán la salida de la clasificación (Del Toro et al., 2015). Para este caso se utilizó un archivo de entrenamiento con 8 clases dadas así: 1: Plástico, 2: Tejado, 3: Pastos, 4: Plantas de plátano, 5: Plantas de cacao, 6: Coberturas o superficies negras, 7: Suelo desnudo, y 8: Árboles (otros), con el cual se le dieron los insumos al algoritmo para que realizara la clasificación solicitada, obteniendo resultados aceptables, teniendo en cuanta las diferencias que existían entre cada una de las clases determinadas.

```{r Llamar el raster de entrenamiento, cache=TRUE}
datostraining <- read.csv("C:\\Users\\BLACK SQUARE\\Desktop\\BLACKSQUARE_FOLDER\\ANDRES\\1_Personal\\MAESTRIA\\PERCEPCION_REMOTA\\CACAO_PR\\TABLA_TRAINING.csv")

datostraining
knitr::kable(datostraining)

fl <- list.files("C:\\Users\\BLACK SQUARE\\Desktop\\BLACKSQUARE_FOLDER\\ANDRES\\1_Personal\\MAESTRIA\\PERCEPCION_REMOTA\\CACAO_PR\\Nueva carpeta", pattern = ".tif$", full.names = TRUE)

rst <- stack(fl)
names(rst) <- c(paste("b",2:4,sep=""))
plotRGB(rst, r=3, g=2, b=1, scale=1E5, stretch="lin", main = "Lote cacao", axes=TRUE, ylab="NORTE", xlab= "ESTE")
```

```{r cargar el archivo de training, cache=TRUE}
rstTrain <- raster("C:\\Users\\BLACK SQUARE\\Desktop\\BLACKSQUARE_FOLDER\\ANDRES\\1_Personal\\MAESTRIA\\PERCEPCION_REMOTA\\CACAO_PR\\entrenamiento.tif")
```

```{r visualizacion de areas de training, cache=TRUE}

rstTrain[rstTrain==0] <- NA

# Se convierte a una representacion del tipo discreto
rstTrain <- ratify(rstTrain)
rstTrain

# Cambio de nombre de la capa
names(rstTrain) <- "trainClass"

# Se visualiza el raster de entrenamiento
plot(rstTrain, col = rev(topo.colors(8)), main="Áreas de entrenamiento")
```

```{r tabla de datos de trainig, cache=TRUE}
tab <- table(values(rstTrain))
print(tab)
```

```{r omision de valores, cache=TRUE}
rstDF <- na.omit(values(stack(rstTrain, rst)))
rstDF[,"trainClass"] <- as.factor(as.character(rstDF[,"trainClass"]))


rstDF <- na.omit(values(stack(rstTrain, rst)))
rstDF[,"trainClass"] <- as.factor(as.character(rstDF[,"trainClass"]))

nEvalRounds <- 20

pTrain <- 0.5
```

```{r evaluacion de matriz, cache=TRUE}
n <- nrow(rstDF)
nClasses <- length(unique(rstDF[,"trainClass"]))

# Initialize objects

confMats <- array(NA, dim = c(nClasses,nClasses,nEvalRounds))

evalMatrix<-matrix(NA, nrow=nEvalRounds, ncol=3,dimnames=list(paste("R_",1:nEvalRounds,sep=""),c("Accuracy","Kappa","PSS")))

pb <- txtProgressBar(1, nEvalRounds, style = 3)
```

```{r evaluacion de función, cache=TRUE}
# Evaluation function
source(url("https://raw.githubusercontent.com/joaofgoncalves/Evaluation/master/eval.R"))

# Se hace correr el clasificador

for(i in 1:nEvalRounds){
 
  # Crear un  índice que es aleatorio que permite la seleccion de las filas 
  sampIdx <- sample(1:n, size = round(n*pTrain))

  # Se calibra el arbol de decisiones 
  rf <- randomForest (y = as.factor(rstDF[sampIdx, "trainClass"]),x = rstDF[sampIdx, -1], ntree = 100)

  # vector que ayuda a predecir el conjunto de prueba
  testSetPred <- predict(rf, newdata = rstDF[-sampIdx,], type = "response")

  # Obtener el vector de las clases observadas de la muestra realizada
  testSetObs <- rstDF[-sampIdx,"trainClass"]
 
  # Se evalua la clasificacion realizada de la muestra
  evalData <- Evaluate(testSetObs, testSetPred)
 
  evalMatrix[i,] <- c(evalData$Metrics["Accuracy",1],evalData$Metrics["Kappa",1],evalData$Metrics["PSS",1])
 
  # Se almacena la matrix y se realiza su evaluación
  confMats[,,i] <- evalData$ConfusionMatrix
 
  # Se clasifica toda la imagen completa
  rstPredClassTMP <- predict(rst, model = rf,factors = levels(rstDF[,"trainClass"]))
 
  if(i==1){
    # Se realiza el raster predicho
    rstPredClass <- rstPredClassTMP
   
    # Se Obtiene la  precisión para cada  clase.
    Precision <- evalData$Metrics["Precision",,drop=FALSE]
    Recall <- evalData$Metrics["Recall",,drop=FALSE]
   
  }else{
    # Se unen todos los raster que se predijeron
    rstPredClass <- stack(rstPredClass, rstPredClassTMP)
   
    # Obtenga precisión que se obtuvo para cada clase
    Precision <- rbind(Precision,evalData$Metrics["Precision",,drop=FALSE])
    Recall <- rbind(Recall,evalData$Metrics["Recall",,drop=FALSE])
  }
   setTxtProgressBar(pb,i)
 }
```

```{r aplicación de matriz, cache=TRUE}
knitr::kable(evalMatrix, digits = 3)

round(apply(evalMatrix,2,FUN = function(x,...) c(mean(x,...), sd(x,...))), 3)
```

```{r datos de la precisión, cache=TRUE}
avgPrecision <- apply(Precision,2,mean)
print("Exactitud")
```

```{r print, cache=TRUE}
print(round(avgPrecision, 3))
print("Exhaustividad")
avgRecall <- apply(Recall,2,mean)
print(round(avgRecall, 3))
print("Valor F")

avgF1 <- (2 * avgPrecision * avgRecall) / (avgPrecision+avgRecall)
print(round(avgF1, 3))

evalMatrix[which.max(evalMatrix[,"Kappa"]), , drop=FALSE]

# esta sentencia muestra los mejores resultados de la variable kappa
cm <- as.data.frame(confMats[,,which.max(evalMatrix[,"Kappa"])])

# Cambio de nombre filas/columnas
colnames(cm) <- rownames(cm) <- paste(as.factor("c"),levels(as.factor(rstDF[,"trainClass"])),sep="_")

knitr::kable(cm)
```

```{r datos de zonal, cache=TRUE}
rstModalClass <- modal(rstPredClass)

rstModalClassFreq <- modal(rstPredClass, freq=TRUE)

medFreq <- zonal(rstModalClassFreq, rstTrain, fun=median)
```

```{r frecuencia modal, cache=TRUE}
colnames(medFreq) <- c("Codigo","frecuencia modal")

medFreq[order(medFreq[,2],decreasing = TRUE),]
```

```{r plot de la clasificación supervisada, cache=TRUE}
par(mfrow=c(1,2), cex.main=0.8, cex.axis=0.8)

plot(rstModalClass, main = "Clasificación Supervisada por arbol de decisiones")
plot(rstModalClassFreq, main = "Clases con mayor problema de Clasificación")

mycolor1 <- c("#808080","#ff0000","#0000ff","#00ff00","#cbbeb5",
"#c3ff5b", "#ff7373","#fef65b")
par(mfrow = c(1,1))
plot(rstModalClassFreq, col = rev(terrain.colors(8)), main = "Lote cacao", axes=TRUE, ylab="NORTE", xlab= "ESTE")
plot(rstModalClass, main = 'LOTE CACAO: CLASIFICACIÓN SUPERVISADA', col = mycolor1 )


```

```{r plot final por arbol de decisiones, cache=TRUE}
cs <- plot(rstModalClass, main = "Clasificación Supervisada por árbol de decisiones")
```

## DISCUSIÓN
Los resultados obtenidos en el análisis estadístico unibanda evidencian que se presenta una alta correlación entre las bandas del espectro visible tomadas por la cámara sin modificar con afinidad promedio del 86%, mientras que la banda del NIR que fue tomada por la cámara modificada presenta una baja correlación con las demás con un valor promedio de 36%, esto se puede deber dado que, al presentarse un cambio en las características propias del equipo fotográfico, puede presentar y generar ruido en dicha banda. Estos resultados difieren a los presentados por Fan et al., (2018), donde aseguran que utilizaron una configuración de similares características y obtuvieron una correlación de los datos provenientes de las 4 bandas, previa calibración con un panel con reflectancia conocida.

En cuanto al índice espectral generado para este caso, el NDVI, se presenta una congruencia con respecto a las superficies o coberturas que se presentan en el área determinada, ya que se obtuvieron valores menores a 0 en superficies como suelo, estructuras y construcciones, mientras que la vegetación tuvo valores mayores a 0, en este caso, los pastos obtuvieron un valor cercano a 0.2, haciendo énfasis en las plantas arbóreas como el cacao y algunos árboles que se presentan en la zona, los cuales obtuvieron valores alrededor de 0.6 y mayores, datos que tiene similitud al estudio realizado por Olukayode et al., (2018), donde evaluaron el estado fisiológico de plantas de cacao mediante sensoramiento remoto con el uso de un espectrorradiómetro y obtuvieron como resultados para las plantas valores del NDVI en promedio de 0.5.

En cuanto a la clasificación no supervisada, los resultados obtenidos fueron aceptables ya que a grandes rasgos, se realizó con claridad la discriminación entre las zonas que presentaban vegetación y las construcciones y suelo desnudo, teniendo en cuenta que al generar el procesamiento por medio de K-means el cual realiza el agrupamiento en clústeres particionando las observaciones en K agrupaciones en las que cada pixel que posee la imagen raster pertenece a la agrupación con la media más cercana, lo que hace que funciones como prototipo de la agrupación que realiza el algoritmo.

Con respecto a las coberturas vegetales, en especial donde se encontraban las especies perennes, el algoritmo de clasificación no supervisada, catalogó cada uno de los individuos con una mezcla entre las categorías Árboles, cacao y plátano, teniendo en cuenta que dependiendo el sombreamiento que tenía cada planta, asignaba la categoría, y en algunas ocasiones los pastos también fueron catalogados en las categorías de vegetación, por lo que este tipo de datos que se generan con las sombras de los objetos que se tengan en la escena, pueden influenciar notoriamente en la clasificación cuando no es supervisada, además, en este caso teniendo en cuenta las diferentes clases de vegetaciones presentes en el lote analizado, no fue adecuadamente clasificado haciendo discriminación entre ellas, por lo que este tipo de clasificación, si bien caracteriza superficies que son totalmente diferentes, no es tan robusto para la discriminación entre especies vegetales.

Con relación a la clasificación supervisada, donde se tuvieron en cuenta variables como la exactitud (accuracy), la exhaustividad (kappa) y la precisión de la clasificación (PSS) para determinar la calidad que presentó el procesamiento y la clasificación, donde se analiza cual es la relación de las distribuciones de probabilidad de la clasificación antes y durante el procesamiento del evento (Sastoque y Gutiérrez, 2016), se tiene en cuenta el archivo de entrenamiento generado previamente para realizar esta clasificación, definiendo que del total de muestras, un 50% fuera de entrenamiento y el restante fuera de validación del proceso, calculando los valores promedio a partir de la información cada clase y las desviaciones estándar en cada una de las rondas de iteración sobre los datos, y con las variables ya mencionadas, se determinó el valor F que nos permite medir la precisión que tiene la clasificación, previa generación de la matriz de confusión entre las clases, lo que permite la visualización del desempeño de algoritmo que se empleó en la clasificación.

Teniendo en cuenta esta información, y según las características que presentan las plantas y la vegetación en general, para este estudio no es conveniente realizar la caracterización y discriminación de plantas de cacao a partir de los datos que se tienen, ya que, por la similitud de las plantas al ser especies leñosas perennes de porte alto, de alta frondosidad y morfológicamente similares, no es posible diferenciar entre la especie de interés y los árboles presente en la finca “el triunfo”. Espectralmente pueden tener características similares en la región del espectro visible y por la calidad de las imágenes, en especial enfatizando en la banda NIR, se debe tener en cuenta que esta información espectral no logra percibir y denotar diferencias que por medio de los algoritmos aplicados puedan destacarse.

## CONCLUSIONES
Aunque los resultados del análisis de la exhaustividad, la exactitud y de la precisión de la clasificación supervisada arrojaron un 86% de precisión, los resultados en general presentan una aceptable discriminación entre las diferentes coberturas, sin embargo al realizar el análisis sobre el cacao como especie de interés, un 45% de muestras que fueron clasificadas acertadamente como cacao, no permite establecer un alto rango de confianza alto para realizar la discriminación de esta especie de interés económico y social para la región, lo que no permitiría generar un posible censo de estas plantas de manera eficiente utilizando los datos que se tuvieron para este ejercicio.

Teniendo en cuenta esto, es posible que mediante un aumento en el número de muestras dentro del archivo de entrenamiento, se pueda mejorar el desempeño de clasificación, sin embargo, se evidencia que algunos algoritmos tiene alguna incertidumbre por lo que genera datos que pueden ser incorrectos al momento de hacer la clasificación, sumado a que cuando se maneja gran volumen de información, el procesamiento de esta puede verse limitado a las características que posea el hardware donde se realice el procedimiento, por lo que es necesario recurrir a equipos de mayor capacidad o limitar el tamaño de las imágenes que se trabajan por parte del usuario.

Al comparar los dos tipos de clasificaciones empleadas, se evidencia que la clasificación supervisada obtuvo mejores resultados al realizar un mayor énfasis en cada una de las clases, definiendo mas claramente los limites de y bordes, lo que genera menos distorsión y más calidad en los datos obtenidos, en comparación a la clasificación no supervisada, en la que se percibe mayor confusión al definir las clases en la zona de estudio, en especial en las coberturas de especies vegetales en general.

## REFERENCIAS
- Bordese, M. y Alini, W. (2007). biOps: un paquete de procesamiento de imágenes en R. Facultad de Matemática, Astronomía y Física. Universidad Nacional de Córdoba. España. 
- Del Toro, N., Gomáriz, F., Cánovas, F., Alonso, F. (2015). Comparación de métodos de clasificación de imágenes de satélite en la cuenca del río argos (región de Murcia). Boletín de la asociación de geógrafos españoles No 67. Pág. 327-347.
- Fan, X., Kawamura, K., Guo, W., Xuan, T., Lim, J., Yuba, N., Kurokawa, Y., Obitsu, T., Lv, R., Tsumiyama, Y., Yasudai, T., Wangj, Z. (2018). A simple visible and near-infrared (V-NIR) camera system for monitoring the leaf area index and growth stage of Italian ryegrass. Computers and Electronics in Agriculture. Volume 144, páginas 314-323.
- Macedo, A., Pajares, G., Santos, M. (2010). Clasificación no supervisada con imágenes a color de cobertura terrestre. Agrociencia vol.44 no.6 México.
- Olukayode, O., Olamidotun, L., Rotimi, A., Ayodeji, E. (2018). Assessment of plant health status using remote sensing and GIS techniques. Research Article. Advances in Plants & Agriculture Research. Volume 8 Issue 6.
- Sastoque, L. y Gutiérrez, F. (2016). Espacialización del estrés biótico en los frailejones debido al cambio climático en el parque natural Chingaza mediante UAV´s. Proyecto de grado como requisito parcial para optar al título de ingeniero catastral y geodesta. Universidad Distrital Francisco José De Caldas. Bogotá.
