setwd("/cloud/project/datos")
datos <- read.csv("Petroleo_Ontaro.csv", header=T, dec=".", sep=";")

#OPERADOR
c_tipo <- datos$WELL_TYPE
TDFc_tipo <- table(c_tipo)
TDFc_tipo
## c_tipo
##                                                            Brine Well 
##                                 31                                 34 
##        Brine Well Natural Gas Well                Brine Well Oil Well 
##                                  4                                  5 
##                Cavern Storage Well Compressed Air Energy Storage Well 
##                                124                                  2 
##                      Disposal Well                           Dry Hole 
##                                129                               4544 
##                           Gas Show                  Gas Well Oil Show 
##                               2728                                 56 
##          Historical Injection Well                Historical Oil Well 
##                                 49                               1210 
##                     Injection Well                           Licensed 
##                                235                                  2 
##                           Location           Natural Gas Storage Well 
##                                935                                333 
##                   Natural Gas Well                   Observation Well 
##                               9330                                176 
##                   Oil and Gas Show                   Oil and Gas Well 
##                                795                                253 
##                           Oil Show                           Oil Well 
##                                976                               2101 
##                  Oil Well Gas Show                              Other 
##                                 53                                 19 
##                   Private Gas Well               Solution Mining Well 
##                               1057                                204 
##                        Source Well                 Stratigraphic Test 
##                                 10                               1271
Tabla <- as.data.frame(TDFc_tipo)
hi <- Tabla$Freq/sum(Tabla$Freq)
hi
##  [1] 1.162529e-03 1.275032e-03 1.500038e-04 1.875047e-04 4.650116e-03
##  [6] 7.500188e-05 4.837621e-03 1.704043e-01 1.023026e-01 2.100053e-03
## [11] 1.837546e-03 4.537613e-02 8.812720e-03 7.500188e-05 3.506338e-02
## [16] 1.248781e-02 3.498837e-01 6.600165e-03 2.981325e-02 9.487737e-03
## [21] 3.660092e-02 7.878947e-02 1.987550e-03 7.125178e-04 3.963849e-02
## [26] 7.650191e-03 3.750094e-04 4.766369e-02
sum(hi)
## [1] 1
hi_porc <- hi*100
sum(hi_porc)
## [1] 100
Tabla_tipo <- data.frame(Tabla, hi_porc)
total <- data.frame(c_tipo="Total",
                    Freq=sum(Tabla_tipo$Freq),
                    hi_porc="100%")

Tabla_tipofinal <- rbind(Tabla_tipo, total)

colnames(Tabla_tipofinal)[colnames(Tabla_tipofinal)=="c_tipo"] <- "Tipo de Pozo"
names(Tabla_tipofinal)
## [1] "Tipo de Pozo" "Freq"         "hi_porc"
colnames(Tabla_tipofinal)[colnames(Tabla_tipofinal)=="Freq"] <- "ni"
names(Tabla_tipofinal)
## [1] "Tipo de Pozo" "ni"           "hi_porc"
colnames(Tabla_tipofinal)[colnames(Tabla_tipofinal)=="hi_porc"] <- "hi"
names(Tabla_tipofinal)
## [1] "Tipo de Pozo" "ni"           "hi"
Tabla_tipo <- Tabla_tipo[order(-Tabla_tipo$Freq), ]

Tabla_top10tipo <- head(Tabla_tipo, 10)

barplot(Tabla_top10tipo$hi_porc,
        main = "Gráfica No2.01: Distribucion de Tipo de Pozo",
        xlab = "Tipo de Pozo",
        ylab = "Probabilidad",
        col = "#EE6A50",
        cex.names = 0.5,
        cex.axis = 0.9,
        names.arg = Tabla_top10tipo$c_tipo,
        las = 2
)

barplot(Tabla_top10tipo$hi_porc,
        main = "Gráfica No2.02: Distribucion de Tipo de Pozo",
        xlab = "Tipo de Pozo",
        ylab = "Probabilidad",
        col = "#EE6A50",
        cex.names = 0.5,
        cex.axis = 0.9,
        names.arg = Tabla_top10tipo$c_tipo,
        las = 2,
        ylim = c(0, 100)
)

# Conclusion

conclusion <-"Se infiere que el tipo de pozo con mayor probabilidad en Ontario es el Natural Gas Well (≈35%), seguido por los Dry Hole y Gas Show, con menores frecuencias. Esto sugiere que, al seleccionar un pozo al azar, existe alta probabilidad de que sea de gas natural, reflejando la predominancia de este recurso en la región."