1. Introducción

Este análisis se centra en un subconjunto específico de datos: Pozos de Gas Privado en el condado de Lincoln. Dado el comportamiento de los datos, se aplica un modelo de regresión logarítmica (y=a+b⋅ln(x)) para explicar la relación entre la elevación del terreno y la profundidad del pozo.

2. Carga de datos

library(dplyr)
library(ggplot2)

datos <- read.csv(
  "Petroleo_Ontaro.csv",
  sep = ";",
  header = TRUE,
  stringsAsFactors = FALSE
)

3. Depuración de datos

datos_log <- datos %>%
  filter(
    COUNTY == "Lincoln",
    WELL_TYPE == "Private Gas Well",
    !is.na(GROUND_ELEVATION),
    !is.na(TOTAL_DEPTH),
    GROUND_ELEVATION > 0,
    TOTAL_DEPTH > 0
  )

summary(datos_log$GROUND_ELEVATION)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   86.87  180.44  184.30  185.46  190.78  209.45

4. Definición de variables

cat("Variable independiente (x): GROUND_ELEVATION\n")
## Variable independiente (x): GROUND_ELEVATION
cat("Variable dependiente (y): TOTAL_DEPTH\n")
## Variable dependiente (y): TOTAL_DEPTH

5. Conjetura

cat("Conjetura:\n")
## Conjetura:
cat("Existe una relación logarítmica inversa entre la elevación del terreno y la profundidad del pozo.\n\n")
## Existe una relación logarítmica inversa entre la elevación del terreno y la profundidad del pozo.
cat("Modelo propuesto:\n")
## Modelo propuesto:
cat("TOTAL_DEPTH = a + b * ln(GROUND_ELEVATION)\n")
## TOTAL_DEPTH = a + b * ln(GROUND_ELEVATION)

6. Parámetros del modelo

modelo_log <- lm(TOTAL_DEPTH ~ log(GROUND_ELEVATION), data = datos_log)

a <- coef(modelo_log)[1]
b <- coef(modelo_log)[2]

a
## (Intercept) 
##    3480.756
b
## log(GROUND_ELEVATION) 
##             -637.7856

7. Test

summary(modelo_log)
## 
## Call:
## lm(formula = TOTAL_DEPTH ~ log(GROUND_ELEVATION), data = datos_log)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -64.337 -11.221  -0.901  13.584  86.380 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)            3480.76     140.06   24.85   <2e-16 ***
## log(GROUND_ELEVATION)  -637.79      26.83  -23.77   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 22.65 on 74 degrees of freedom
## Multiple R-squared:  0.8842, Adjusted R-squared:  0.8826 
## F-statistic:   565 on 1 and 74 DF,  p-value: < 2.2e-16
R_log <- cor(
  datos_log$TOTAL_DEPTH,
  predict(modelo_log)
)
R_log
## [1] 0.940314

8. Visualización del modelo

puntos_prediccion <- data.frame(
  GROUND_ELEVATION = seq(
    min(datos_log$GROUND_ELEVATION),
    max(datos_log$GROUND_ELEVATION),
    length.out = 300
  )
)

puntos_prediccion$TOTAL_DEPTH <- predict(
  modelo_log,
  newdata = puntos_prediccion
)

ggplot(datos_log, aes(x = GROUND_ELEVATION, y = TOTAL_DEPTH)) +
  geom_point(color = "darkgreen", alpha = 0.6, size = 3) +
  geom_line(
    data = puntos_prediccion,
    aes(x = GROUND_ELEVATION, y = TOTAL_DEPTH),
    color = "blue",
    size = 1.5
  ) +
  labs(
    title = "Regresión Logarítmica (Lincoln - Gas Privado)",
    subtitle = paste("Coeficiente de correlación R =", round(R_log, 3)),
    x = "Elevación del Terreno (m)",
    y = "Profundidad del Pozo (m)"
  ) +
  theme_minimal()

9. Estimación

cat(
  "Ecuación del modelo:\n",
  "TOTAL_DEPTH =", round(a, 2), "+", round(b, 2),
  "* ln(GROUND_ELEVATION)\n",
  "Coeficiente de correlación R =", round(R_log, 4)
)
## Ecuación del modelo:
##  TOTAL_DEPTH = 3480.76 + -637.79 * ln(GROUND_ELEVATION)
##  Coeficiente de correlación R = 0.9403

10. Conclusión

En el análisis de regresión logarítmica se observa una relación logarítmica inversa entre la elevación del terreno (GROUND_ELEVATION) y la profundidad total del pozo (TOTAL_DEPTH) en los pozos de gas privado del condado de Lincoln. El modelo se describe mediante la ecuación Y = 3480.76 − 637.79 ln(X), con un coeficiente de correlación R = 0.9403, lo cual indica una fuerte asociación entre ambas variables. A partir del modelo, se estima que para una elevación de 200 m, la profundidad total estimada es aproximadamente 103.02 m.