##### UNIVERSIDAD CENTRAL DEL ECUADOR #####
#### AUTOR: Leonardo Ruiz ####
### CARRERA: INGENIERÍA EN PETROLEOS #####

#### VARIABLE Bomba_BH  ####
## DATOS ###
library(readxl)
Produccio_n_Campo_Sacha_csv <- read_excel("C:/Users/LEO/Documents/Producción Campo Sacha.csv.xlsx")
View(Produccio_n_Campo_Sacha_csv)
str(Produccio_n_Campo_Sacha_csv)
## tibble [8,344 × 31] (S3: tbl_df/tbl/data.frame)
##  $ mes                   : chr [1:8344] "Ene" "Ene" "Ene" "Ene" ...
##  $ día                   : num [1:8344] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Pozo                  : chr [1:8344] "SACHA-001A" "SACHA-019A" "SACHA-052B" "SACHA-083A" ...
##  $ Campo                 : chr [1:8344] "SACHA" "SACHA" "SACHA" "SACHA" ...
##  $ Reservorio            : chr [1:8344] "U" "U" "U INFERIOR" "HOLLIN INFERIOR" ...
##  $ Bpd                   : num [1:8344] NA 53 249 139 186 136 NA 456 161 164 ...
##  $ Bppd_BH               : num [1:8344] 159 NA NA NA NA NA 155 NA NA NA ...
##  $ Bfpd_BE               : num [1:8344] NA 534 346 1158 1163 ...
##  $ Bfpd_BH               : num [1:8344] 695 NA NA NA NA NA 441 NA NA NA ...
##  $ Bapd_BE               : num [1:8344] NA 481 97 1019 977 ...
##  $ Bapd_BH               : num [1:8344] 536 NA NA NA NA NA 286 NA NA NA ...
##  $ Bsw_BE                : num [1:8344] NA 90.1 28 88 84 ...
##  $ Bsw_BH                : num [1:8344] 77.1 NA NA NA NA ...
##  $ Api_BE                : num [1:8344] NA 26.7 27.8 27.7 24 20.5 NA 28.5 29.9 26.3 ...
##  $ Api_BH                : num [1:8344] 27.8 NA NA NA NA NA 23.2 NA NA NA ...
##  $ Gas_BE                : num [1:8344] NA 10.76 50.55 1.11 27.9 ...
##  $ Gas_BH                : num [1:8344] 32.3 NA NA NA NA ...
##  $ Salinidad_BE          : num [1:8344] NA 15920 30227 1600 13000 ...
##  $ Salinidad_BH          : num [1:8344] 10800 NA NA NA NA NA 3800 NA NA NA ...
##  $ Rgl_BE                : num [1:8344] NA 20.15 146.1 0.96 23.99 ...
##  $ Rgl_BH                : num [1:8344] 46.5 NA NA NA NA ...
##  $ Gor_BE                : num [1:8344] NA 203.02 203.01 7.99 150 ...
##  $ Gor_BH                : num [1:8344] 203 NA NA NA NA ...
##  $ Horas_BE              : num [1:8344] NA 4 5 4 4 10 NA 4 10 10 ...
##  $ Horas_BH              : num [1:8344] 4 NA NA NA NA NA 4 NA NA NA ...
##  $ Bomba_BE              : chr [1:8344] NA "SF-320|SF-320|SF-900|SFGH2500/520/180/9259" "RC 1000|RC 1000|RC 1000/300/120/9250" "P23/68/30/7000" ...
##  $ Bomba_BH              : chr [1:8344] "JET  12K/0//0" NA NA NA ...
##  $ Frecuencia Operaciones: num [1:8344] NA 65 62 46 59 52 NA 58.5 57 54 ...
##  $ Voltaje               : num [1:8344] NA 479 457 364 440 452 NA 475 455 439 ...
##  $ Amperaje              : num [1:8344] NA 29 35 14 59 30 NA 23 35 34 ...
##  $ Presión Intake        : num [1:8344] NA 484 406 0 345 162 NA 546 338 0 ...
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
##Extraer Variable Nominal
Bomba_BH <- Produccio_n_Campo_Sacha_csv$Bomba_BH
##EDAvariable nominal
TDF_Bomba_BH<- table(Bomba_BH)

tabla_Bomba_BH <- as.data.frame(TDF_Bomba_BH)
hi <- tabla_Bomba_BH$Freq/sum(tabla_Bomba_BH$Freq)
hi_porc <- hi*100
sum(hi_porc)
## [1] 100
tabla_Bomba_BH <- data.frame(tabla_Bomba_BH,hi_porc)

### Agrupación Bombas Hidráulicas (BH) – Jet Pump
tabla_Bomba_BH$grupo <- case_when(
  grepl("JET\\s*9",  tabla_Bomba_BH$Bomba_BH, ignore.case = TRUE) ~ "JET Serie 9",
  
  grepl("JET\\s*10", tabla_Bomba_BH$Bomba_BH, ignore.case = TRUE) ~ "JET Serie 10",
  
  grepl("JET\\s*11|E7", tabla_Bomba_BH$Bomba_BH, ignore.case = TRUE) ~ "JET Serie 11",
  
  grepl("JET\\s*12", tabla_Bomba_BH$Bomba_BH, ignore.case = TRUE) ~ "JET Serie 12",
  
  grepl("^/0//0$|^$", tabla_Bomba_BH$Bomba_BH) ~ "Sin información",
  
  TRUE ~ "Otros"
)

tabla_resumen <- tabla_Bomba_BH %>%
  group_by(grupo) %>%
  summarise(
    Frecuencia = sum(Freq),
    Porcentaje = sum(hi_porc)
  ) %>%
  arrange(desc(Frecuencia))

sum(tabla_resumen$Frecuencia)
## [1] 639
sum(tabla_resumen$Porcentaje)
## [1] 100
colnames(tabla_resumen) <- c("Bomba_BH","ni","hi (%)")
print(tabla_resumen)
## # A tibble: 6 × 3
##   Bomba_BH           ni `hi (%)`
##   <chr>           <int>    <dbl>
## 1 JET Serie 11      269    42.1 
## 2 JET Serie 12      139    21.8 
## 3 Sin información    84    13.1 
## 4 JET Serie 10       83    13.0 
## 5 JET Serie 9        53     8.29
## 6 Otros              11     1.72
#### Crear de fila de totales ####
totales <- c( Bomba_BH = "TOTAL",
              ni= sum(tabla_resumen$ni),
              hi= sum(hi*100))

tabla_bomba <- rbind(tabla_resumen,totales)
tabla_bomba
## # A tibble: 7 × 3
##   Bomba_BH        ni    `hi (%)`        
##   <chr>           <chr> <chr>           
## 1 JET Serie 11    269   42.0970266040689
## 2 JET Serie 12    139   21.7527386541471
## 3 Sin información 84    13.1455399061033
## 4 JET Serie 10    83    12.9890453834116
## 5 JET Serie 9     53    8.29420970266041
## 6 Otros           11    1.72143974960876
## 7 TOTAL           639   100
# Asignar a una variable más corta para facilitar el trabajo
database <- Produccio_n_Campo_Sacha_csv

#  Bomba_BH
# Frecuencias completas
frecuencias_bomba_bh <- table(database$Bomba_BH)

# Ordenar de mayor a menor
frecuencias_Bomba_BH_ordenadas <- sort(frecuencias_bomba_bh, decreasing = TRUE)

# Diagrama de barras local ni
barplot(frecuencias_Bomba_BH_ordenadas,
        main = "Gráfica Nº1 Distribución de las Bomba_BH Campo Sacha",
        xlab = "",
        ylab = "Cantidad",
        col = colorRampPalette(c("#B4C5A6"))(length(frecuencias_Bomba_BH_ordenadas)),
        border = "white",
        cex.names = 0.6,
        las = 2)

mtext("Bomba_BH", side = 1, line = 7)

# Diagrama de barras global ni
top_Bomba_BH <- head(frecuencias_Bomba_BH_ordenadas, 10)

barplot(top_Bomba_BH,
        main = "Gráfica Nº2 Distribución de las Bomba_BH Campo Sacha",
        xlab = "",
        ylab = "Cantidad", 
        col = colorRampPalette(c("#B4C5A6", "#B4C5A6", "#B4C5A6"))(length(top_Bomba_BH)),
        border = "white",
        cex.names = 0.7,
        las = 2,
        ylim = c(0,5234))
mtext("Bomba_BH", side = 1, line = 8)

# Diagrama de barras local hi

barplot(tabla_resumen$`hi (%)`,main="Gráfica N°3: Distribución del porcentaje de las Bomba_BH del Campo Sacha",
        xlab = "",
        ylab = "Porcentaje %",
        col = "#B4C5A6",
        names.arg=tabla_resumen$Bomba_BH,
        cex.names = 0.8,
        las = 2)
mtext("Bomba_BH", side = 1, line = 8)

# Diagrama de barrras global hi

barplot(tabla_resumen$`hi (%)`,main="Gráfica N°4: Distribución del porcentaje de las Bomba_BH del Campo Sacha ",
        xlab = "",
        ylab = "Porcentaje %",
        col = "#B4C5A6",
        ylim = c(0,100),
        names.arg=tabla_resumen$Bomba_BH,
        cex.names = 0.8,
        las = 2)
mtext("Bomba_BH", side = 1, line = 8)

# Diagrma circular

pie (tabla_resumen$`hi (%)`,main = "Gráfica N°5: Distribución porcentual de las Bomba_BH del Campo Sacha",
     radius = 1,
     labels = paste0(round(tabla_resumen$`hi (%)`,2),"%"),
     col = colores <- c(rev(heat.colors(7))),
     cex=0.8,
)
par(xpd = TRUE)  # Permite que la leyenda salga del área del gráfico

legend(x = 1.5, y = 1,
       legend = tabla_resumen$Bomba_BH,
       fill = colores <- c(rev(heat.colors(7))),
       cex = 0.5,
       title = "Bomba_BH del Campo Sacha")

tabla_indicadores <- data.frame("Variable" =c("Bomba_BH"),
                                "Rango" = " Campo Sacha",
                                "X" = " - ",
                                "Me" = " - ",
                                "Mo" = " JET Serie 11 ",
                                "V" = " - ",
                                "Sd" = " - ",
                                "Cv" = " - ",
                                "As" = " - ",
                                "K" = " - ",
                                "Valores Atipicos" = " - ")
library(knitr)
kable(tabla_indicadores, align = 'c', caption = "Conclusiones de la variable
      BOMBA_BH del campo Sacha")
Conclusiones de la variable BOMBA_BH del campo Sacha
Variable Rango X Me Mo V Sd Cv As K Valores.Atipicos
Bomba_BH Campo Sacha - - JET Serie 11 - - - - - -