ANÁLISIS ESTADÍSTICO

1. CARGA DE LIBRERÍAS Y DATOS

                #=========================ENCABEZADO================================
                # TEMA: REGRESION POTENCIAL
                # AUTOR: GRUPO 3
                # FECHA: 03-2026
                #===================================================================
library(dplyr)
library(knitr)
library(gt)
setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, sep = ";", dec = ",")

2. TABLA PARES DE VALORES

A mayor profundidad del pozo, las máquinas atraviesan capas de la tierra con más presión y reservas acumuladas. Esto hace que el gas natural salga y fluya con mucha más fuerza, provocando que la producción total se dispare rápidamente a medida que bajamos verticalmente.

profundidad <- as.numeric(datos$Vertical.depth.of.well)
produccion  <- as.numeric(datos$Total.gas.production.by.2023)

# Generamos TPV ORIGINAL
TPV_sin_ordenar <- data.frame(profundidad = profundidad, produccion = produccion)
TPV_sin_ordenar <- na.omit(TPV_sin_ordenar)
TPV_sin_ordenar <- TPV_sin_ordenar[TPV_sin_ordenar$profundidad > 0 & TPV_sin_ordenar$produccion > 0, ]
row.names(TPV_sin_ordenar) <- NULL

Total de Dataset

## [1] 12561

Omitimos los Outliers

## [1] 5961
Tabla N°1. Pares de Valores de Profundidad y Produccion de gas de los pozos de gas Natural
Profundidad Producción Gas
1 4327 30234
2 5161 30945
3 2964 31559
4 4861 33595
5 4065 33772
6 4416 34112
7 3878 34169
8 3448 34659
9 3536 34717
10 4004 35808
11 4210 35846
12 3592 36025
13 4362 36357
14 4474 36396
15 4824 36771
16 3423 36837
17 3945 38013
18 3885 38345
19 4226 38681
20 3917 38820
Tabla 1 de 3
profundidad <- as.numeric(datos$Vertical.depth.of.well)
produccion  <- as.numeric(datos$Total.gas.production.by.2023)

TPV <- data.frame(profundidad = profundidad, produccion = produccion)
TPV <- na.omit(TPV)
TPV <- TPV[TPV$profundidad > 0 & TPV$produccion > 0, ]

# Ordenar
TPV <- TPV[order(TPV$profundidad), ]

row.names(TPV) <- NULL

# Tabla Pares de Valores
tabla_tpv_previa <- head(TPV, 20)
tabla_tpv_previa <- cbind(Nro = 1:nrow(tabla_tpv_previa), tabla_tpv_previa)
Tabla N°2. Pares de Valores de Profundidad y Produccion de gas de los pozos de gas Natural
Profundidad Producción Gas
1 2209 42633
2 2795 163134
3 2870 235741
4 2880 144451
5 2936 209400
6 2937 233491
7 2961 93692
8 2964 31559
9 2973 283745
10 3013 59718
11 3028 94925
12 3058 172604
13 3070 294799
14 3072 335786
15 3077 371899
16 3079 368133
17 3093 175216
18 3098 56950
19 3126 142034
20 3127 922701
Tabla 2 de 3

3. DIAGRAMA DE DISPERSION

Definición de variables

x <- TPV$profundidad    #Variable Independiente
y <- TPV$produccion    #Variable Dependiente

par(oma = c(1, 1, 1, 1))
plot(x, y,
     pch = 16,
     col = "blue",
     main = "Gráfica N°1: Diagrama de dispersión entre Profundidad \n y Producción de gas",
     xlab = "Profundidad",
     ylab = "Producción de gas")
box(which = "outer", col = "black")

4. CONJETURA DE MODELO

Debido a la similitud de la nube de puntos conjeturamos a un modelo Potencial

Transformación logarítmica para linealizar el modelo potencial

x1 <- log(x)
y1 <- log(y)

Cálculo de Parámetros

regresion_Potencial <- lm(y1 ~ x1)

beta0 <- coef(regresion_Potencial)[1]
beta1 <- coef(regresion_Potencial)[2]

Intercepto

a <- exp(beta0)
a
##  (Intercept) 
## 1.457247e-11

Pendiente

b <- beta1
b
##       x1 
## 4.520342
# Grafica 2
plot(x, y,
     pch = 16,
     col = "blue",
     main = "Gráfica Nº2: Comparación de la realidad con el
     modelo Potencial entre el Profundidad y Produccion de
     gas de los pozos de gas natural",
     xlab = "Profundidad",
     ylab = "Producción")
box(which = "outer", col = "black")
# Añadir curva del modelo
curve(a * x^b, from = min(x), to = max(x), add = TRUE, col = "red", lwd = 2)

eq_text_panel <- paste0(" Ecuación potencial \n Y = a * x^b \n Y = ", 
                        round(a, 12), " * x^", round(b, 2))

plot(1, type = "n", axes = FALSE, xlab = "", ylab = "") 
text(x = 1, y = 1,
     labels = eq_text_panel,
     cex = 2,      
     col = "blue", 
     font = 2)
box(which = "outer", col = "black")

5. TEST DE APROBACION Y RESTRICCIONES

Cálculo de Indicadores

Coeficiente de Pearson

r <- cor(x1, y1)
r*100
## [1] 74.0279
Tabla Nº3: Test de Aprobación del Modelo Potencial
Indicador Valor
Coeficiente de Pearson (r) 74.03 %
Tabla 3 de 3

Restricciones

plot.new()
plot.window(xlim = c(0, 100), ylim = c(0, 100))

text(50, 72, "RESTRICCIONES DEL MODELO", cex = 1.4, font = 2, col = "#D9534F")

parrafo_1 <- "El modelo solo es válido y seguro si se aplica dentro del rango"
parrafo_2 <- "geológico observado de la cuenca. Si intentamos predecir"
parrafo_3 <- "la producción de un pozo exageradamente superficial (ej. 500 de "
parrafo_4 <- "profundidad) o uno ultra profundo fuera del límite (ej. 20,000)"
parrafo_5 <- ", la ecuación perderá total confiabilidad debido al riesgo de "
parrafo_6 <- "extrapolación."

text(50, 60, parrafo_1, cex = 1.1, font = 3, col = "black")
text(50, 48, parrafo_2, cex = 1.1, font = 3, col = "black")
text(50, 36, parrafo_3, cex = 1.1, font = 3, col = "black")
text(50, 24, parrafo_4, cex = 1.1, font = 3, col = "black")
text(50, 12, parrafo_5, cex = 1.1, font = 3, col = "black")
text(50, 1, parrafo_6, cex = 1.1, font = 3, col = "black")

rect(-2, -4, 100, 95, border = "#D9534F", lwd = 3)

6. CALCULO DE PRONOSTICOS

x_pronostico <- 5000 
T_Esp <- a * (x_pronostico^b)
T_Esp
## (Intercept) 
##    765850.7

7. CONCLUSION

Entre la profundidad y la producción de gas de los pozos de gas natural existe una correlacion positiva alta, la cual está respaldada por un coeficiente de correlación de Pearson del 74%. Esta estructura se describe de manera óptima a través del modelo matemático f(x) = (1.2 x 10^-11) (x^4.54). Como ejemplo práctico de su capacidad de estimación dentro del rango controlado de la cuenca, al evaluar una profundidad de 5000 metros, el modelo predice una producción de 763, 442 unidades de gas.