DERRAME DE PETRÓLEO OCURRIDO POR AÑO

1 Carga de datos

setwd("/cloud/project")
datos <- read.csv("Variables_Proyectoo.csv", header = TRUE, sep = ";" , dec = ".")
str(datos)
## 'data.frame':    10190 obs. of  14 variables:
##  $ Distrito_edit                      : chr  "1" "1" "1" "1" ...
##  $ Year_edit_Fecha_del_derrame        : int  2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 ...
##  $ Mes_edit_Fecha_del_derrame         : int  6 3 4 4 6 6 3 9 10 6 ...
##  $ Nombre_instalacion_derrame         : chr  "SABCO AUTUMN" "BRISCOE COCHINA EAST CPF-B" "BRISCOE CATARINA NORTH CPF-C" "BRISCOE CHIP EAST CPF-A" ...
##  $ Tipo_operacion                     : chr  "PRODUCTION" "OTHER" "PRODUCTION" "PRODUCTION" ...
##  $ Fuente                             : chr  "" "TANKER TRUCK" "LOAD LINE" "HEATER TREATER" ...
##  $ Edicion_Causa_Probable             : chr  "" "OVERTURNED TRUCK ON LEASE" "HUMAN ERROR" "HEATER TREATER GASKET FAILED" ...
##  $ Liberacion_petroleo_crudo_edicion  : num  0 0 0 0 0 ...
##  $ Edicion_recuperacion_petroleo_crudo: num  NA 0 0 0 0 0 0 0 0 NA ...
##  $ Codigo_area                        : int  1 1 1 1 1 1 1 1 1 3 ...
##  $ Derrame_sobre_agua_edicion         : chr  "NO" "NO" "NO" "NO" ...
##  $ status                             : chr  "TOLD THEM TO SAMPLE FOR CHLORIDES" "" "" "" ...
##  $ estado_general                     : chr  "Muestreo" "" "" "" ...
##  $ Requerimentos                      : chr  "Muestreo solicitado" "" "" "" ...

2 Extraer la variable

Year_edit_Fecha_del_derrame <- datos$Year_edit_Fecha_del_derrame 
TDF_Year_edit_Fecha_del_derrame <- table(Year_edit_Fecha_del_derrame)

3 Tabla de Distribución de Frecuencias

tabla_Year_edit_Fecha_del_derrame <- as.data.frame(TDF_Year_edit_Fecha_del_derrame)
hi_Year_edit_Fecha_del_derrame <- (tabla_Year_edit_Fecha_del_derrame$Freq / sum(tabla_Year_edit_Fecha_del_derrame$Freq)) * 100
sum(hi_Year_edit_Fecha_del_derrame)  
## [1] 100
tabla_Year_edit_Fecha_del_derrame$hi <- round(hi_Year_edit_Fecha_del_derrame, 2)
Niasc_Year_edit_Fecha_del_derrame <- cumsum(tabla_Year_edit_Fecha_del_derrame$Freq)
Hiasc_Year_edit_Fecha_del_derrame <- cumsum(hi_Year_edit_Fecha_del_derrame)
Nidsc_Year_edit_Fecha_del_derrame <- rev(cumsum(rev(tabla_Year_edit_Fecha_del_derrame$Freq)))
Hidsc_Year_edit_Fecha_del_derrame <- rev(cumsum(rev(hi_Year_edit_Fecha_del_derrame)))
tabla_Year_edit_Fecha_del_derrame_Final <- data.frame(
  Year_edit_Fecha_del_derrame = tabla_Year_edit_Fecha_del_derrame$Year_edit_Fecha_del_derrame,
  Frecuencia = tabla_Year_edit_Fecha_del_derrame$Freq,
  Porcentaje = tabla_Year_edit_Fecha_del_derrame$hi,
  Niasc = Niasc_Year_edit_Fecha_del_derrame,
  Hiasc = round(Hiasc_Year_edit_Fecha_del_derrame, 2),
  Nidsc = Nidsc_Year_edit_Fecha_del_derrame,
  Hidsc = round(Hidsc_Year_edit_Fecha_del_derrame, 2)
)
#Ver tabla final 
print(tabla_Year_edit_Fecha_del_derrame_Final)
##    Year_edit_Fecha_del_derrame Frecuencia Porcentaje Niasc  Hiasc Nidsc  Hidsc
## 1                         2013       1096      10.76  1096  10.76 10190 100.00
## 2                         2014       1334      13.09  2430  23.85  9094  89.24
## 3                         2015       1443      14.16  3873  38.01  7760  76.15
## 4                         2016       1218      11.95  5091  49.96  6317  61.99
## 5                         2017       1151      11.30  6242  61.26  5099  50.04
## 6                         2018        989       9.71  7231  70.96  3948  38.74
## 7                         2019        901       8.84  8132  79.80  2959  29.04
## 8                         2020        732       7.18  8864  86.99  2058  20.20
## 9                         2021        704       6.91  9568  93.90  1326  13.01
## 10                        2022        622       6.10 10190 100.00   622   6.10

##Gráficas de distribución en barras Gráfica de barras versión local

barplot(tabla_Year_edit_Fecha_del_derrame_Final$Frecuencia,
        names.arg = tabla_Year_edit_Fecha_del_derrame_Final$Year_edit_Fecha_del_derrame,
        main = "Frecuencia de Derrames de Petróleo por Año de Ocurrencia",
        cex.main = 0.9,
        xlab = "Año",
        ylab = "Cantidad de Derrames",
        col = "cornsilk")

Gráfica de barras versión global

nombres_Year_edit_Fecha_del_derrame <- as.character(tabla_Year_edit_Fecha_del_derrame_Final$Year_edit_Fecha_del_derrame)
TDFYear_edit_Fecha_del_derrame <- tabla_Year_edit_Fecha_del_derrame_Final$Frecuencia
barplot(TDFYear_edit_Fecha_del_derrame,
        main = "Gráfica N°2: Frecuencia de Derrames de Petróleo por Año de Ocurrencia",
        xlab = "Año",
        ylab = "Cantidad",
        names.arg = nombres_Year_edit_Fecha_del_derrame,
        col = "cornsilk2",
        cex.main = 0.9,
        cex.lab = 1,
        cex.axis = 0.7,
        cex.names = 0.7,
        ylim = c(0, sum(TDFYear_edit_Fecha_del_derrame)))

Gráfica de barras versión local porcentual

barplot(tabla_Year_edit_Fecha_del_derrame_Final$Porcentaje,
        main = "Gráfica N°3: Porcentaje de Frecuencia de Derrames de Petróleo por Año de Ocurrencia",
        xlab = "Año",
        ylab = "Porcentaje",
        col = "cyan",
        names.arg = tabla_Year_edit_Fecha_del_derrame_Final$Year_edit_Fecha_del_derrame,
        cex.main = 0.9,
        cex.lab = 1,
        cex.axis = 0.7,
        cex.names = 0.7,
        ylim = c(0, max(tabla_Year_edit_Fecha_del_derrame_Final$Porcentaje) * 1.1))

Grafica de barras versión global porcentual

barplot(tabla_Year_edit_Fecha_del_derrame_Final$Porcentaje,
        main = "Gráfica N°4: Porcentaje de Frecuencia de Derrames de Petróleo por Año de Ocurrencia",
        xlab = "Año",
        ylab = "Porcentaje",
        col = "cyan3",
        cex.main = 0.9,
        names.arg = tabla_Year_edit_Fecha_del_derrame_Final$Year_edit_Fecha_del_derrame,
        ylim = c(0, 100))

4 Diagrama de Cajas

boxplot(Year_edit_Fecha_del_derrame,
        horizontal = TRUE,
        col = "azure2",
        xlab = "Año",
        cex.main = 0.9,
        main = "Gráfica N°5: Variabilidad de Frecuencia de Derrames de Petróleo por Año de Ocurrencia")

5 Ojivas de Frecuencia Acumulada

x_Year_edit_Fecha_del_derrame <- as.numeric(as.character(tabla_Year_edit_Fecha_del_derrame$Year_edit_Fecha_del_derrame))
y_ni_asc_Year_edit_Fecha_del_derrame <- Niasc_Year_edit_Fecha_del_derrame
y_ni_dsc_Year_edit_Fecha_del_derrame <- Nidsc_Year_edit_Fecha_del_derrame

plot(x_Year_edit_Fecha_del_derrame, y_ni_asc_Year_edit_Fecha_del_derrame,
     type = "b",
     main = "Gráfica N°6:Ojivas de Frecuencia Acumulada de Derrames de Petróleo por Año ",
     cex.main = 0.9,
     xlab = "Año",
     ylab = "Frecuencia acumulada",
     col = "black")
lines(x_Year_edit_Fecha_del_derrame, y_ni_dsc_Year_edit_Fecha_del_derrame, col = "blue", type = "b")
grid()
legend("topright", legend = c("Ascendente", "Descendente"), col = c("black", "blue"), lty = 1, cex = 0.8, )