#=========================ENCABEZADO================================
# TEMA: REGRESION POTENCIAL
# AUTOR: GRUPO 3
# FECHA: 03-2026
#===================================================================
library(dplyr)
library(knitr)
library(gt)
setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, sep = ";", dec = ",")
A mayor profundidad del pozo, las máquinas atraviesan capas de la tierra con más presión y reservas acumuladas. Esto hace que el gas natural salga y fluya con mucha más fuerza, provocando que la producción total se dispare rápidamente a medida que bajamos verticalmente.
profundidad <- as.numeric(datos$Vertical.depth.of.well)
produccion <- as.numeric(datos$Total.gas.production.by.2023)
# Generamos TPV ORIGINAL
TPV_sin_ordenar <- data.frame(profundidad = profundidad, produccion = produccion)
TPV_sin_ordenar <- na.omit(TPV_sin_ordenar)
TPV_sin_ordenar <- TPV_sin_ordenar[TPV_sin_ordenar$profundidad > 0 & TPV_sin_ordenar$produccion > 0, ]
row.names(TPV_sin_ordenar) <- NULL
Total de Dataset
## [1] 12561
Omitimos los Outliers
## [1] 5961
| Tabla N°1. Pares de Valores de Profundidad y Produccion de gas de los pozos de gas Natural | ||
| N° | Profundidad | Producción Gas |
|---|---|---|
| 1 | 4327 | 30234 |
| 2 | 5161 | 30945 |
| 3 | 2964 | 31559 |
| 4 | 4861 | 33595 |
| 5 | 4065 | 33772 |
| 6 | 4416 | 34112 |
| 7 | 3878 | 34169 |
| 8 | 3448 | 34659 |
| 9 | 3536 | 34717 |
| 10 | 4004 | 35808 |
| 11 | 4210 | 35846 |
| 12 | 3592 | 36025 |
| 13 | 4362 | 36357 |
| 14 | 4474 | 36396 |
| 15 | 4824 | 36771 |
| 16 | 3423 | 36837 |
| 17 | 3945 | 38013 |
| 18 | 3885 | 38345 |
| 19 | 4226 | 38681 |
| 20 | 3917 | 38820 |
| Tabla 1 de 3 | ||
profundidad <- as.numeric(datos$Vertical.depth.of.well)
produccion <- as.numeric(datos$Total.gas.production.by.2023)
TPV <- data.frame(profundidad = profundidad, produccion = produccion)
TPV <- na.omit(TPV)
TPV <- TPV[TPV$profundidad > 0 & TPV$produccion > 0, ]
# Ordenar
TPV <- TPV[order(TPV$profundidad), ]
row.names(TPV) <- NULL
# Tabla Pares de Valores
tabla_tpv_previa <- head(TPV, 20)
tabla_tpv_previa <- cbind(Nro = 1:nrow(tabla_tpv_previa), tabla_tpv_previa)
| Tabla N°2. Pares de Valores de Profundidad y Produccion de gas de los pozos de gas Natural | ||
| N° | Profundidad | Producción Gas |
|---|---|---|
| 1 | 2209 | 42633 |
| 2 | 2795 | 163134 |
| 3 | 2870 | 235741 |
| 4 | 2880 | 144451 |
| 5 | 2936 | 209400 |
| 6 | 2937 | 233491 |
| 7 | 2961 | 93692 |
| 8 | 2964 | 31559 |
| 9 | 2973 | 283745 |
| 10 | 3013 | 59718 |
| 11 | 3028 | 94925 |
| 12 | 3058 | 172604 |
| 13 | 3070 | 294799 |
| 14 | 3072 | 335786 |
| 15 | 3077 | 371899 |
| 16 | 3079 | 368133 |
| 17 | 3093 | 175216 |
| 18 | 3098 | 56950 |
| 19 | 3126 | 142034 |
| 20 | 3127 | 922701 |
| Tabla 2 de 3 | ||
Definición de variables
x <- TPV$profundidad #Variable Independiente
y <- TPV$produccion #Variable Dependiente
par(oma = c(1, 1, 1, 1))
plot(x, y,
pch = 16,
col = "blue",
main = "Gráfica N°1: Diagrama de dispersión entre Profundidad \n y Producción de gas",
xlab = "Profundidad",
ylab = "Producción de gas")
box(which = "outer", col = "black")
Debido a la similitud de la nube de puntos conjeturamos a un modelo Potencial
Transformación logarítmica para linealizar el modelo potencial
x1 <- log(x)
y1 <- log(y)
Cálculo de Parámetros
regresion_Potencial <- lm(y1 ~ x1)
beta0 <- coef(regresion_Potencial)[1]
beta1 <- coef(regresion_Potencial)[2]
Intercepto
a <- exp(beta0)
a
## (Intercept)
## 1.457247e-11
Pendiente
b <- beta1
b
## x1
## 4.520342
# Grafica 2
plot(x, y,
pch = 16,
col = "blue",
main = "Gráfica Nº2: Comparación de la realidad con el
modelo Potencial entre el Profundidad y Produccion de
gas de los pozos de gas natural",
xlab = "Profundidad",
ylab = "Producción")
box(which = "outer", col = "black")
# Añadir curva del modelo
curve(a * x^b, from = min(x), to = max(x), add = TRUE, col = "red", lwd = 2)
eq_text_panel <- paste0(" Ecuación potencial \n Y = a * x^b \n Y = ",
round(a, 12), " * x^", round(b, 2))
plot(1, type = "n", axes = FALSE, xlab = "", ylab = "")
text(x = 1, y = 1,
labels = eq_text_panel,
cex = 2,
col = "blue",
font = 2)
box(which = "outer", col = "black")
Cálculo de Indicadores
Coeficiente de Pearson
r <- cor(x1, y1)
r*100
## [1] 74.0279
| Tabla Nº3: Test de Aprobación del Modelo Potencial | |
| Indicador | Valor |
|---|---|
| Coeficiente de Pearson (r) | 74.03 % |
| Tabla 3 de 3 | |
Restricciones
plot.new()
plot.window(xlim = c(0, 100), ylim = c(0, 100))
text(50, 72, "RESTRICCIONES DEL MODELO", cex = 1.4, font = 2, col = "#D9534F")
parrafo_1 <- "El modelo solo es válido y seguro si se aplica dentro del rango"
parrafo_2 <- "geológico observado de la cuenca. Si intentamos predecir"
parrafo_3 <- "la producción de un pozo exageradamente superficial (ej. 500 de "
parrafo_4 <- "profundidad) o uno ultra profundo fuera del límite (ej. 20,000)"
parrafo_5 <- ", la ecuación perderá total confiabilidad debido al riesgo de "
parrafo_6 <- "extrapolación."
text(50, 60, parrafo_1, cex = 1.1, font = 3, col = "black")
text(50, 48, parrafo_2, cex = 1.1, font = 3, col = "black")
text(50, 36, parrafo_3, cex = 1.1, font = 3, col = "black")
text(50, 24, parrafo_4, cex = 1.1, font = 3, col = "black")
text(50, 12, parrafo_5, cex = 1.1, font = 3, col = "black")
text(50, 1, parrafo_6, cex = 1.1, font = 3, col = "black")
rect(-2, -4, 100, 95, border = "#D9534F", lwd = 3)
x_pronostico <- 5000
T_Esp <- a * (x_pronostico^b)
T_Esp
## (Intercept)
## 765850.7
Entre la profundidad y la producción de gas de los pozos de gas natural existe una correlacion positiva alta, la cual está respaldada por un coeficiente de correlación de Pearson del 74%. Esta estructura se describe de manera óptima a través del modelo matemático f(x) = (1.2 x 10^-11) (x^4.54). Como ejemplo práctico de su capacidad de estimación dentro del rango controlado de la cuenca, al evaluar una profundidad de 5000 metros, el modelo predice una producción de 763, 442 unidades de gas.