#UNIVERSIDAD CENTRAL DEL ECUADOR
#FACULTAD: FIGEMPA
#CARRERA: INGENIERIA AMBIENTAL
#AUTOR: KEVIN CHICAIZA
#TEMA DISCRETA
#VARIABLE: POBLACION POR REGIONES DE CHILE

#EXTRAER DATOS#
library(readxl)
datos <- read_excel("C:/Estadistica/iNCENDIOS FORESTALES CHILE DATOS.xlsx")
View(datos)

#CONVERSION A VALOR NUMERICO Y EXTRACCION DE VARIABLE ARBOLADO#
arbolado <-na.omit(as.numeric(datos$arbolado)) 

#ANALIZAR VARIABLE POR DIAGRAMA DE CAJA#
options(scipen = 999)
Caja_arbolado<- boxplot(arbolado, horizontal = T,
                                main = "Gráfica N°48: Distribución de áreas de arbolados afectadas",
                                cex.main = 0.9,
                                xlab = "  Cantidad de especies de arbolados",
                                col =  "green",
                                pch = 1)

#VALORES DE CERO EN LA VARIBALE#
arbolado_cero<-subset(arbolado, arbolado==0)
length(arbolado_cero)
## [1] 4581
#VALORES DIFERENTES DE CERO EN LA VARIABLE# 
arbolado_dcero<- subset(arbolado, arbolado>0)
Caja_arbolado_dcero<- boxplot(arbolado_dcero, horizontal=T,
                                  main = "Gráfica N°49: Distribución de áreas de arbolados
      afectadas mayores a cero",
                                  cex.main = 0.9,
                                  xlab = " Densidad de áreas de arbolados",
                                  col =  "skyblue",
                                  pch = 1)

length(arbolado_dcero)
## [1] 653
#DIVIDIR EN VALORES COMUNES Y NO COMUNES# 
arbolado_comunes<- subset(arbolado_dcero,arbolado_dcero < min(Caja_arbolado_dcero$out))
length(arbolado_comunes)
## [1] 530
arbolado_outliers<-  subset(arbolado_dcero,arbolado_dcero >= min(Caja_arbolado_dcero$out) & arbolado_dcero < 2000000)
length(arbolado_outliers)
## [1] 123
#ESTADISTICA DESCRIPTIVA#
min <- min(arbolado_comunes)
max <- max(arbolado_comunes)
R <- max-min
K <- floor(1+3.33*log10(length(arbolado_comunes)))
K
## [1] 10
A <-  (R/K)
lim_inf <- seq(from=min,to=max-A,by=A)
lim_sup <- seq(from=min+A,to=max+A,by=A)[1:K]
MC <- (lim_inf+lim_sup)/2

ni <- c()
for (i in 1:K) {
  if (i != K) {
    ni[i] <- length(subset(arbolado_comunes,
                          arbolado_comunes >= lim_inf[i] & arbolado_comunes < lim_sup[i]))
  } else {
    ni[i] <- length(subset(arbolado_comunes,
                           arbolado_comunes >= lim_inf[i] & arbolado_comunes <= lim_sup[i]))
  }
}


sum(ni)
## [1] 529
hi <- ni/sum(ni)*100
sum(hi)
## [1] 100
Ni_asc <- cumsum(ni)
Hi_asc <- cumsum(hi)
Ni_desc <- rev(cumsum(rev(ni)))
Hi_desc <- rev(cumsum(rev(hi)))

TDFarbolada <- data.frame(lim_inf,
                                     lim_sup,
                                     MC,ni,
                                     round(hi,2), 
                                     Ni_asc,
                                     Ni_desc,
                                     round(Hi_asc,2),
                                     round(Hi_desc,2))

colnames(TDFarbolada) <- c("Lim inf","Lim sup","MC","ni","hi(%)",
                                      "Ni asc","Hi asc(%)","Ni desc","Hi desc(%)")
TDFarbolada
##    Lim inf Lim sup       MC  ni hi(%) Ni asc Hi asc(%) Ni desc Hi desc(%)
## 1   0.0010  2.6829  1.34195 391 73.91    391       529   73.91     100.00
## 2   2.6829  5.3648  4.02385  55 10.40    446       138   84.31      26.09
## 3   5.3648  8.0467  6.70575  24  4.54    470        83   88.85      15.69
## 4   8.0467 10.7286  9.38765  19  3.59    489        59   92.44      11.15
## 5  10.7286 13.4105 12.06955  12  2.27    501        40   94.71       7.56
## 6  13.4105 16.0924 14.75145   9  1.70    510        28   96.41       5.29
## 7  16.0924 18.7743 17.43335   3  0.57    513        19   96.98       3.59
## 8  18.7743 21.4562 20.11525   7  1.32    520        16   98.30       3.02
## 9  21.4562 24.1381 22.79715   5  0.95    525         9   99.24       1.70
## 10 24.1381 26.8200 25.47905   4  0.76    529         4  100.00       0.76
#SIMPLIFICAR LA TABLA TDF CON HISTOGRAMA#
Hist_arbolado <- hist(arbolado_comunes , main="Gráfica N°50: Distribución de arbolados
    afectados por incendios en Chile",
                      cex.main = 0.9,
                      xlab = "Arbolados afectados" , col = "purple") 

k2 <- length(Hist_arbolado$breaks)
Li<- Hist_arbolado$breaks[1:(length(Hist_arbolado$breaks) - 1)]
Ls <- Hist_arbolado$breaks[2:length(Hist_arbolado$breaks)]
ni2 <- Hist_arbolado$counts
sum(ni2)
## [1] 530
MC2<- Hist_arbolado$mids
hi2 <- (ni2/sum(ni2))
sum(hi2)
## [1] 1
Ni_asc2<- cumsum(ni2)
Hi_asc2 <- cumsum(hi2)
Ni_desc2 <- rev(cumsum(rev(ni2)))
Hi_desc2 <- rev(cumsum(rev(hi2)))
TDFarbolado2 <- data.frame(Li = round(Li, 2),
                                     Ls = round(Ls, 2),
                                     MC2 = round(MC2, 2),
                                     ni2 = ni2,
                                     hi2 = round(hi2 * 100, 2),
                                     Ni_asc2 = Ni_asc2,
                                     Hi_asc2 = round(Hi_asc2 * 100, 2),
                                     Ni_desc2 = Ni_desc2,
                                     Hi_desc2 = round(Hi_desc2 * 100, 2))

colnames(TDFarbolada) <- c("Lim inf","Lim sup","MC","ni","hi(%)",
                                      "Ni asc","Hi asc(%)","Ni desc","Hi desc(%)")

TDFarbolada
##    Lim inf Lim sup       MC  ni hi(%) Ni asc Hi asc(%) Ni desc Hi desc(%)
## 1   0.0010  2.6829  1.34195 391 73.91    391       529   73.91     100.00
## 2   2.6829  5.3648  4.02385  55 10.40    446       138   84.31      26.09
## 3   5.3648  8.0467  6.70575  24  4.54    470        83   88.85      15.69
## 4   8.0467 10.7286  9.38765  19  3.59    489        59   92.44      11.15
## 5  10.7286 13.4105 12.06955  12  2.27    501        40   94.71       7.56
## 6  13.4105 16.0924 14.75145   9  1.70    510        28   96.41       5.29
## 7  16.0924 18.7743 17.43335   3  0.57    513        19   96.98       3.59
## 8  18.7743 21.4562 20.11525   7  1.32    520        16   98.30       3.02
## 9  21.4562 24.1381 22.79715   5  0.95    525         9   99.24       1.70
## 10 24.1381 26.8200 25.47905   4  0.76    529         4  100.00       0.76
########################### DIAGRAMAS ###################################

#HISTOGRAMA CON REGLA DE STURGES#

hist(arbolado_comunes,breaks = K,
     main = "Gráfica N°51: Histograma de áreas de arbolados comúnes
     afectados por incendios",
     cex.main = 0.9,
     col = "red",
     xlab = "Superficie en (ha)",
     ylab = "Cantidad")

#HISTOGRAMA DE ni CON RSTUDIO# 

#LOCAL#
hist(arbolado_comunes,
     main = "Gráfica N°52: Histograma de áreas de arbolados comúnes
     afectados por incendios",
     cex.main = 0.9,
     col = "green",
     xlab = "Superficie en (ha)",
     ylab = "Cantidad")

#GLOBAL#
hist(arbolado_comunes,
     main = "Gráfica N°53: Histograma de áreas de arbolados comúnes
     afectados por incendios",
     cex.main = 0.9,
     col = "orange",
     xlab = "Superficie en (ha)",
     ylab = "Cantidad",
     ylim=c(0,length(arbolado)))

#HISTOGRAMA DE hi CON RSTUDIO#

#GLOBAL#
barplot(hi2*100,space=0,
        col = "yellow",
        main ="Gráfica N°54: Histograma de áreas de arbolados comúnes
     afectados por incendios",
        cex.main = 0.9,
        ylab="Porcentaje (%)",
        xlab="Especies de arbolados",
        ylim = c(0,100), 
        names.arg = MC2)

barplot(hi2*100,space=0,
        col = "lightgreen",
        main ="Gráfica N°55: Histograma de áreas de arbolados comúnes
     afectados por incendios",
        cex.main = 0.9,
        ylab="Porcentaje (%)",
        xlab="Especies de arbolados",
        names.arg = MC2)

#OJIVAS Ni_asc Y Ni_dsc####
plot(MC2, Ni_desc2,
     main = "Gráfica N°56: Ojiva acumulada absoluta de
     áreas de arbolados afectados",
     cex.main = 0.9,
     xlab = "Arbolados comunes",
     ylab = "Cantidad",
     col = "skyblue",
     type = "o",
     lwd = 3,
     pch = 16,
     ylim = c(0,530))
lines(MC2, Ni_asc2,
      col = "red",
      type = "o",
      pch = 16,
      lwd = 3)
legend("bottomright", legend = c("Descendente", "Ascendente"), 
       col = c("skyblue", "red"), pch = 16)

#OJIVAS Hi_asc Y Hi_dsc###

plot(MC2, Hi_desc2*100,
     main = "Gráfica N°57: Ojiva acumulada relativa de
     áreas de arbolados afectados",
     cex.main = 0.9,
     xlab = "Superficie de arbolada comunes",
     ylab = "Cantidad (%)",
     col = "orange",
     type = "o",
     lwd = 3,
     pch = 16,
     ylim = c(0,100))
lines(MC2, Hi_asc2*100,
      col = "green",
      type = "o",
      pch = 16,
      lwd = 3)
legend("topright", legend = c("Descendente", "Ascendente"), 
       col = c("orange", "green"), pch = 16)

caja_arb_comunes<- boxplot(arbolado_comunes, horizontal=T,
                           main = "Gráfica 58: Distribucion de arbolados
   comunes afectados por incendios en Chile",
                           cex.main = 0.9,
                           xlab = "Densidad de arbolados",
                           col =  "gray",
                           pch = 1)

######################## INDICADORES ################################

##INDICADORES DE TENDENCIA CENTRAL##

#MEDIA ARIRMETICA#
x <- mean(arbolado_comunes)
x
## [1] 2.864452
#MEDIANA#
Me <- median(arbolado_comunes)
Me
## [1] 0.6
##INDICADORES DE DISPERSION##

#VARIANZA# 
V<-var(arbolado_comunes)
V
## [1] 24.88608
#DESVIACION ESTANDAR#
desv <- sd(arbolado_comunes)
desv
## [1] 4.988595
#COEFICIENTE DE VARIABILIDAD#
CV <- (desv/x)*100
CV
## [1] 174.1553
##INDICADORES DE FORMA##

#ASIMETRIA#
library(e1071)
As <- skewness(arbolado_comunes)
As
## [1] 2.613782
#CURTOSIS# 
Ku<- kurtosis(arbolado_comunes)
Ku
## [1] 6.889671
#CREACION DE TABLA DE INDICADORES (CONCLUSIONES)# 
tabla_indicadores <- data.frame("Variable" =c("Áreas de arbolados nativos afectados"),
                                "Rango" = " ]0;20891.6]",
                                "X" = " 14.29 ",
                                "Me" = " 6 ",
                                "Mo" = "[0,0010;2,6829]",
                                "V" = " 344.46 ",
                                "Sd" = " 18.55 ",
                                "Cv" = " 129.80 ",
                                "As" = " 2.04 ",
                                "K" = " 3.98 ",
                                "Valores Atipicos" = "[7;27]")
library(knitr)
kable(tabla_indicadores, align = 'c', caption = "Conclusiones de la variable áreas de arbolados afectados por incendios en Chile")
Conclusiones de la variable áreas de arbolados afectados por incendios en Chile
Variable Rango X Me Mo V Sd Cv As K Valores.Atipicos
Áreas de arbolados nativos afectados ]0;20891.6] 14.29 6 [0,0010;2,6829] 344.46 18.55 129.80 2.04 3.98 [7;27]