#UNIVRSIDAD CENTRAL DEL ECUADOR 
#Tema:Estadística Descríptiva-Variables discretas
#AUTOR:Grupo 6


#CARGA DE DATOS  

setwd("/cloud/project")
datos <- read.csv("Variables_Proyectoo.csv", header = TRUE, sep = ";" , dec = ".")
str(datos)
## 'data.frame':    10190 obs. of  14 variables:
##  $ Distrito_edit                      : chr  "1" "1" "1" "1" ...
##  $ Year_edit_Fecha_del_derrame        : int  2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 ...
##  $ Mes_edit_Fecha_del_derrame         : int  6 3 4 4 6 6 3 9 10 6 ...
##  $ Nombre_instalacion_derrame         : chr  "SABCO AUTUMN" "BRISCOE COCHINA EAST CPF-B" "BRISCOE CATARINA NORTH CPF-C" "BRISCOE CHIP EAST CPF-A" ...
##  $ Tipo_operacion                     : chr  "PRODUCTION" "OTHER" "PRODUCTION" "PRODUCTION" ...
##  $ Fuente                             : chr  "" "TANKER TRUCK" "LOAD LINE" "HEATER TREATER" ...
##  $ Edicion_Causa_Probable             : chr  "" "OVERTURNED TRUCK ON LEASE" "HUMAN ERROR" "HEATER TREATER GASKET FAILED" ...
##  $ Liberacion_petroleo_crudo_edicion  : num  0 0 0 0 0 ...
##  $ Edicion_recuperacion_petroleo_crudo: num  NA 0 0 0 0 0 0 0 0 NA ...
##  $ Codigo_area                        : int  1 1 1 1 1 1 1 1 1 3 ...
##  $ Derrame_sobre_agua_edicion         : chr  "NO" "NO" "NO" "NO" ...
##  $ status                             : chr  "TOLD THEM TO SAMPLE FOR CHLORIDES" "" "" "" ...
##  $ estado_general                     : chr  "Muestreo" "" "" "" ...
##  $ Requerimentos                      : chr  "Muestreo solicitado" "" "" "" ...
#VARIABLES DISCRETAS 1:

##DERRAME DE PETRÓLEO OCURRIDO POR AÑO

###Extraer la variable 
Year_edit_Fecha_del_derrame <- datos$Year_edit_Fecha_del_derrame 
TDF_Year_edit_Fecha_del_derrame <- table(Year_edit_Fecha_del_derrame)
###Tabla de Distribución de Frecuencias Simples y Acumuladas
tabla_Year_edit_Fecha_del_derrame <- as.data.frame(TDF_Year_edit_Fecha_del_derrame)
hi_Year_edit_Fecha_del_derrame <- (tabla_Year_edit_Fecha_del_derrame$Freq / sum(tabla_Year_edit_Fecha_del_derrame$Freq)) * 100
sum(hi_Year_edit_Fecha_del_derrame)  
## [1] 100
tabla_Year_edit_Fecha_del_derrame$hi <- round(hi_Year_edit_Fecha_del_derrame, 2)
Niasc_Year_edit_Fecha_del_derrame <- cumsum(tabla_Year_edit_Fecha_del_derrame$Freq)
Hiasc_Year_edit_Fecha_del_derrame <- cumsum(hi_Year_edit_Fecha_del_derrame)
Nidsc_Year_edit_Fecha_del_derrame <- rev(cumsum(rev(tabla_Year_edit_Fecha_del_derrame$Freq)))
Hidsc_Year_edit_Fecha_del_derrame <- rev(cumsum(rev(hi_Year_edit_Fecha_del_derrame)))
tabla_Year_edit_Fecha_del_derrame_Final <- data.frame(
  Year_edit_Fecha_del_derrame = tabla_Year_edit_Fecha_del_derrame$Year_edit_Fecha_del_derrame,
  Frecuencia = tabla_Year_edit_Fecha_del_derrame$Freq,
  Porcentaje = tabla_Year_edit_Fecha_del_derrame$hi,
  Niasc = Niasc_Year_edit_Fecha_del_derrame,
  Hiasc = round(Hiasc_Year_edit_Fecha_del_derrame, 2),
  Nidsc = Nidsc_Year_edit_Fecha_del_derrame,
  Hidsc = round(Hidsc_Year_edit_Fecha_del_derrame, 2)
)
####Ver tabla final 
print(tabla_Year_edit_Fecha_del_derrame_Final)
##    Year_edit_Fecha_del_derrame Frecuencia Porcentaje Niasc  Hiasc Nidsc  Hidsc
## 1                         2013       1096      10.76  1096  10.76 10190 100.00
## 2                         2014       1334      13.09  2430  23.85  9094  89.24
## 3                         2015       1443      14.16  3873  38.01  7760  76.15
## 4                         2016       1218      11.95  5091  49.96  6317  61.99
## 5                         2017       1151      11.30  6242  61.26  5099  50.04
## 6                         2018        989       9.71  7231  70.96  3948  38.74
## 7                         2019        901       8.84  8132  79.80  2959  29.04
## 8                         2020        732       7.18  8864  86.99  2058  20.20
## 9                         2021        704       6.91  9568  93.90  1326  13.01
## 10                        2022        622       6.10 10190 100.00   622   6.10
##Gráficas de barras 

###Gráfica de barras versión local de derrames de petróleo por Año
barplot(tabla_Year_edit_Fecha_del_derrame_Final$Frecuencia,
        names.arg = tabla_Year_edit_Fecha_del_derrame_Final$Year_edit_Fecha_del_derrame,
        main = "Frecuencia de Derrames de Petróleo por Año de Ocurrencia",
        cex.main = 0.9,
        xlab = "Año",
        ylab = "Cantidad de Derrames",
        col = "cornsilk")

###Gráfica de barras versión global de derrames de petróleo por Año
nombres_Year_edit_Fecha_del_derrame <- as.character(tabla_Year_edit_Fecha_del_derrame_Final$Year_edit_Fecha_del_derrame)
TDFYear_edit_Fecha_del_derrame <- tabla_Year_edit_Fecha_del_derrame_Final$Frecuencia
barplot(TDFYear_edit_Fecha_del_derrame,
        main = "Gráfica N°2: Frecuencia de Derrames de Petróleo por Año de Ocurrencia",
        xlab = "Año",
        ylab = "Cantidad",
        names.arg = nombres_Year_edit_Fecha_del_derrame,
        col = "cornsilk2",
        cex.main = 0.9,
        cex.lab = 1,
        cex.axis = 0.7,
        cex.names = 0.7,
        ylim = c(0, sum(TDFYear_edit_Fecha_del_derrame)))

###Gráfica de barras versión local porcentual de derrames de petróleo por Año
barplot(tabla_Year_edit_Fecha_del_derrame_Final$Porcentaje,
        main = "Gráfica N°3: Porcentaje de Frecuencia de Derrames de Petróleo por Año de Ocurrencia",
        xlab = "Año",
        ylab = "Porcentaje",
        col = "cyan",
        names.arg = tabla_Year_edit_Fecha_del_derrame_Final$Year_edit_Fecha_del_derrame,
        cex.main = 0.9,
        cex.lab = 1,
        cex.axis = 0.7,
        cex.names = 0.7,
        ylim = c(0, max(tabla_Year_edit_Fecha_del_derrame_Final$Porcentaje) * 1.1))

###Grafica de barras versión global porcentual de derrames de petróleo por Año
barplot(tabla_Year_edit_Fecha_del_derrame_Final$Porcentaje,
        main = "Gráfica N°4: Porcentaje de Frecuencia de Derrames de Petróleo por Año de Ocurrencia",
        xlab = "Año",
        ylab = "Porcentaje",
        col = "cyan3",
        cex.main = 0.9,
        names.arg = tabla_Year_edit_Fecha_del_derrame_Final$Year_edit_Fecha_del_derrame,
        ylim = c(0, 100))

##Diagrama de cajas 
###Diagrama de cajas de derrames de petróleo por Año
boxplot(Year_edit_Fecha_del_derrame,
        horizontal = TRUE,
        col = "azure2",
        xlab = "Año",
        cex.main = 0.9,
        main = "Gráfica N°5: Variabilidad de Frecuencia de Derrames de Petróleo por Año de Ocurrencia")

##Ojivas de Frecuencia Acumulada
###Ojivas de frecuencia Acumulada de derrames de petróleo por Año 
x_Year_edit_Fecha_del_derrame <- as.numeric(as.character(tabla_Year_edit_Fecha_del_derrame$Year_edit_Fecha_del_derrame))
y_ni_asc_Year_edit_Fecha_del_derrame <- Niasc_Year_edit_Fecha_del_derrame
y_ni_dsc_Year_edit_Fecha_del_derrame <- Nidsc_Year_edit_Fecha_del_derrame

plot(x_Year_edit_Fecha_del_derrame, y_ni_asc_Year_edit_Fecha_del_derrame,
     type = "b",
     main = "Gráfica N°6:Ojivas de Frecuencia Acumulada de Derrames de Petróleo por Año ",
     cex.main = 0.9,
     xlab = "Año",
     ylab = "Frecuencia acumulada",
     col = "black")
lines(x_Year_edit_Fecha_del_derrame, y_ni_dsc_Year_edit_Fecha_del_derrame, col = "blue", type = "b")
grid()
legend("topright", legend = c("Ascendente", "Descendente"), col = c("black", "blue"), lty = 1, cex = 0.8, )

# VARIABLES DISCRETAS 2

##DERRAME DE PETRÓLEO OCURRIDO POR MES

###Extraer la variable 
Mes_edit_Fecha_del_derrame <- datos$Mes_edit_Fecha_del_derrame 
TDF_Mes_edit_Fecha_del_derrame <- table(Mes_edit_Fecha_del_derrame)
###Tabla de Distribución de Frecuencias Simples y Acumuladas
tabla_Mes_edit_Fecha_del_derrame <- as.data.frame(TDF_Mes_edit_Fecha_del_derrame)
hi_Mes_edit_Fecha_del_derrame <- (tabla_Mes_edit_Fecha_del_derrame$Freq / sum(tabla_Mes_edit_Fecha_del_derrame$Freq)) * 100
sum(hi_Mes_edit_Fecha_del_derrame)  
## [1] 100
tabla_Mes_edit_Fecha_del_derrame$hi <- round(hi_Mes_edit_Fecha_del_derrame, 2)
Niasc_Mes_edit_Fecha_del_derrame <- cumsum(tabla_Mes_edit_Fecha_del_derrame$Freq)
Hiasc_Mes_edit_Fecha_del_derrame <- cumsum(hi_Mes_edit_Fecha_del_derrame)
Nidsc_Mes_edit_Fecha_del_derrame <- rev(cumsum(rev(tabla_Mes_edit_Fecha_del_derrame$Freq)))
Hidsc_Mes_edit_Fecha_del_derrame <- rev(cumsum(rev(hi_Mes_edit_Fecha_del_derrame)))
tabla_Mes_edit_Fecha_del_derrame_Final <- data.frame(
  Mes_edit_Fecha_del_derrame = tabla_Mes_edit_Fecha_del_derrame$Mes_edit_Fecha_del_derrame,
  Frecuencia = tabla_Mes_edit_Fecha_del_derrame$Freq,
  Porcentaje = tabla_Mes_edit_Fecha_del_derrame$hi,
  Niasc = Niasc_Mes_edit_Fecha_del_derrame,
  Hiasc = round(Hiasc_Mes_edit_Fecha_del_derrame, 2),
  Nidsc = Nidsc_Mes_edit_Fecha_del_derrame,
  Hidsc = round(Hidsc_Mes_edit_Fecha_del_derrame, 2)
)
####Ver tabla final 
print(tabla_Mes_edit_Fecha_del_derrame_Final)
##    Mes_edit_Fecha_del_derrame Frecuencia Porcentaje Niasc  Hiasc Nidsc  Hidsc
## 1                           1        956       9.38   956   9.38 10190 100.00
## 2                           2        834       8.18  1790  17.57  9234  90.62
## 3                           3        811       7.96  2601  25.53  8400  82.43
## 4                           4        772       7.58  3373  33.10  7589  74.47
## 5                           5        966       9.48  4339  42.58  6817  66.90
## 6                           6        931       9.14  5270  51.72  5851  57.42
## 7                           7        886       8.69  6156  60.41  4920  48.28
## 8                           8        936       9.19  7092  69.60  4034  39.59
## 9                           9        754       7.40  7846  77.00  3098  30.40
## 10                         10        760       7.46  8606  84.46  2344  23.00
## 11                         11        825       8.10  9431  92.55  1584  15.54
## 12                         12        759       7.45 10190 100.00   759   7.45
##Gráficas de barras  
### Gráfica de barras versión local de derrames de petróleo por Mes
barplot(tabla_Mes_edit_Fecha_del_derrame_Final$Frecuencia,
        names.arg = tabla_Mes_edit_Fecha_del_derrame_Final$Mes_edit_Fecha_del_derrame,
        main = "Gráfica N°1: Frecuencia de Derrames de Petróleo por Mes ",
        cex.main = 0.9,
        xlab = "Mes",
        ylab = "Cantidad",
        col = "cornsilk")

### Gráfica de barras versión global de derrames de petróleo por Mes
nombres_Mes_edit_Fecha_del_derrame <- as.character(tabla_Mes_edit_Fecha_del_derrame_Final$Mes_edit_Fecha_del_derrame)
TDFMes_edit_Fecha_del_derrame <- tabla_Mes_edit_Fecha_del_derrame_Final$Frecuencia

barplot(TDFMes_edit_Fecha_del_derrame,
        main = "Gráfica N°2: Frecuencia Total de Derrames de Petróleo por Mes",
        xlab = "Mes",
        ylab = "Cantidad",
        names.arg = nombres_Mes_edit_Fecha_del_derrame,
        col = "cornsilk2",
        cex.main = 0.9,
        cex.lab = 1,
        cex.axis = 0.7,
        cex.names = 0.7,
        ylim = c(0, sum(TDFMes_edit_Fecha_del_derrame)))

### Gráfica de barras versión local porcentual de derrames de petróleo por Mes
barplot(tabla_Mes_edit_Fecha_del_derrame_Final$Porcentaje,
        main = "Gráfica N°3:Porcentaje de Derrames de Petróleo por Mes",
        xlab = "Mes",
        ylab = "Porcentaje",
        col = "cyan",
        names.arg = tabla_Mes_edit_Fecha_del_derrame_Final$Mes_edit_Fecha_del_derrame,
        cex.main = 0.9,
        cex.lab = 1,
        cex.axis = 0.7,
        cex.names = 0.7,
        ylim = c(0, max(tabla_Mes_edit_Fecha_del_derrame_Final$Porcentaje) * 1.1))

### Gráfica de barras versión global porcentual de derrames de petróleo por Mes
barplot(tabla_Mes_edit_Fecha_del_derrame_Final$Porcentaje,
        main = "Gráfica N°4: Distribución Porcentual de Derrames de Petróleo por Mes",
        xlab = "Mes",
        ylab = "Porcentaje",
        col = "cyan3",
        cex.main = 0.9,
        names.arg = tabla_Mes_edit_Fecha_del_derrame_Final$Mes_edit_Fecha_del_derrame,
        ylim = c(0, 100))

##Diagrama de cajas 
### Diagrama de cajas de derrames de petróleo por Mes
boxplot(Mes_edit_Fecha_del_derrame,
        horizontal = TRUE,
        col = "azure2",
        xlab = "Mes",
        cex.main = 0.9,
        main = "Gráfica N°5: Variabilidad en los Derrames de Petróleo por Mes")

##Ojivas de frecuencia Acumulada

### Ojivas de frecuencia Acumulada de derrames de petróleo por Mes
x_Mes_edit_Fecha_del_derrame <- as.numeric(as.character(tabla_Mes_edit_Fecha_del_derrame$Mes_edit_Fecha_del_derrame))
y_ni_asc_Mes_edit_Fecha_del_derrame <- Niasc_Mes_edit_Fecha_del_derrame
y_ni_dsc_Mes_edit_Fecha_del_derrame <- Nidsc_Mes_edit_Fecha_del_derrame

plot(x_Mes_edit_Fecha_del_derrame, y_ni_asc_Mes_edit_Fecha_del_derrame,
     type = "b",
     main = "Gráfica N°6: Ojivas de Frecuencia Acumulada de Derrames de Petróleo por Mes",
     cex.main = 0.9,
     xlab = "Mes",
     ylab = "Frecuencia acumulada",
     col = "black")
lines(x_Mes_edit_Fecha_del_derrame, y_ni_dsc_Mes_edit_Fecha_del_derrame, col = "blue", type = "b")
grid()
legend("topright", legend = c("Ascendente", "Descendente"), col = c("black", "blue"), lty = 1, cex = 0.8)