Este análisis se centra en un subconjunto específico de datos: Pozos de Gas Privado en el condado de Lincoln. Dado el comportamiento de los datos, se aplica un modelo de regresión logarítmica (y=a+b⋅ln(x)) para explicar la relación entre la elevación del terreno y la profundidad del pozo.
library(dplyr)
library(ggplot2)
datos <- read.csv(
"Petroleo_Ontaro.csv",
sep = ";",
header = TRUE,
stringsAsFactors = FALSE
)
datos_log <- datos %>%
filter(
COUNTY == "Lincoln",
WELL_TYPE == "Private Gas Well",
!is.na(GROUND_ELEVATION),
!is.na(TOTAL_DEPTH),
GROUND_ELEVATION > 0,
TOTAL_DEPTH > 0
)
summary(datos_log$GROUND_ELEVATION)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 86.87 180.44 184.30 185.46 190.78 209.45
cat("Variable independiente (x): GROUND_ELEVATION\n")
## Variable independiente (x): GROUND_ELEVATION
cat("Variable dependiente (y): TOTAL_DEPTH\n")
## Variable dependiente (y): TOTAL_DEPTH
cat("Conjetura:\n")
## Conjetura:
cat("Existe una relación logarítmica inversa entre la elevación del terreno y la profundidad del pozo.\n\n")
## Existe una relación logarítmica inversa entre la elevación del terreno y la profundidad del pozo.
cat("Modelo propuesto:\n")
## Modelo propuesto:
cat("TOTAL_DEPTH = a + b * ln(GROUND_ELEVATION)\n")
## TOTAL_DEPTH = a + b * ln(GROUND_ELEVATION)
modelo_log <- lm(TOTAL_DEPTH ~ log(GROUND_ELEVATION), data = datos_log)
a <- coef(modelo_log)[1]
b <- coef(modelo_log)[2]
a
## (Intercept)
## 3480.756
b
## log(GROUND_ELEVATION)
## -637.7856
summary(modelo_log)
##
## Call:
## lm(formula = TOTAL_DEPTH ~ log(GROUND_ELEVATION), data = datos_log)
##
## Residuals:
## Min 1Q Median 3Q Max
## -64.337 -11.221 -0.901 13.584 86.380
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3480.76 140.06 24.85 <2e-16 ***
## log(GROUND_ELEVATION) -637.79 26.83 -23.77 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 22.65 on 74 degrees of freedom
## Multiple R-squared: 0.8842, Adjusted R-squared: 0.8826
## F-statistic: 565 on 1 and 74 DF, p-value: < 2.2e-16
R_log <- cor(
datos_log$TOTAL_DEPTH,
predict(modelo_log)
)
R_log
## [1] 0.940314
puntos_prediccion <- data.frame(
GROUND_ELEVATION = seq(
min(datos_log$GROUND_ELEVATION),
max(datos_log$GROUND_ELEVATION),
length.out = 300
)
)
puntos_prediccion$TOTAL_DEPTH <- predict(
modelo_log,
newdata = puntos_prediccion
)
ggplot(datos_log, aes(x = GROUND_ELEVATION, y = TOTAL_DEPTH)) +
geom_point(color = "darkgreen", alpha = 0.6, size = 3) +
geom_line(
data = puntos_prediccion,
aes(x = GROUND_ELEVATION, y = TOTAL_DEPTH),
color = "blue",
size = 1.5
) +
labs(
title = "Regresión Logarítmica (Lincoln - Gas Privado)",
subtitle = paste("Coeficiente de correlación R =", round(R_log, 3)),
x = "Elevación del Terreno (m)",
y = "Profundidad del Pozo (m)"
) +
theme_minimal()
cat(
"Ecuación del modelo:\n",
"TOTAL_DEPTH =", round(a, 2), "+", round(b, 2),
"* ln(GROUND_ELEVATION)\n",
"Coeficiente de correlación R =", round(R_log, 4)
)
## Ecuación del modelo:
## TOTAL_DEPTH = 3480.76 + -637.79 * ln(GROUND_ELEVATION)
## Coeficiente de correlación R = 0.9403
En el análisis de regresión logarítmica se observa una relación logarítmica inversa entre la elevación del terreno (GROUND_ELEVATION) y la profundidad total del pozo (TOTAL_DEPTH) en los pozos de gas privado del condado de Lincoln. El modelo se describe mediante la ecuación Y = 3480.76 − 637.79 ln(X), con un coeficiente de correlación R = 0.9403, lo cual indica una fuerte asociación entre ambas variables. A partir del modelo, se estima que para una elevación de 200 m, la profundidad total estimada es aproximadamente 103.02 m.