1 Configuración y Carga de Datos

archivo <- "tabela_de_pocos_janeiro_2018.xlsx"

tryCatch({
  datos <- read_excel(archivo)
}, error = function(e) {
  stop("Error")
})

2 Extracción y Depuración de Variables

El diseño de este modelo responde a una lógica física de “Suma de Distancias” para pozos terrestres. Se busca explicar la longitud total del pozo como la consecuencia obligatoria de dos factores geométricos:

  • Variable Dependiente (\(Y\)): Profundidad de Perforación (m). Se eligió como la variable de respuesta porque representa el esfuerzo total de ingeniería (metros perforados y tubería utilizada). Es el resultado final de la operación, el cual no se elige arbitrariamente, sino que es consecuencia de la ubicación del yacimiento y del equipo.

  • Variable Independiente 1 (\(X_1\)): Profundidad Vertical (m). Representa la necesidad geológica. Es la distancia vertical desde el nivel de referencia (Datum/Nivel del Mar) hasta el yacimiento objetivo. Es la variable principal porque dicta la profundidad neta a alcanzar bajo tierra.

  • Variable Independiente 2 (\(X_2\)): Cota Altimétrica (m). Representa el obstáculo topográfico. Al estar en tierra, el equipo suele estar sobre una elevación positiva (montaña o meseta). Esta variable cuantifica los metros “extra” que se deben perforar desde la superficie solo para llegar al nivel de referencia (Datum).

Lógica del Modelo: La longitud del pozo (\(Y\)) es, esencialmente, la suma de atravesar la elevación del terreno (\(X_2\)) más la profundidad para llegar al yacimiento (\(X_1\)).

# Limpieza y preparación
datos_model <- datos %>%
  select(PROFUNDIDADE_SONDADOR_M, PROFUNDIDADE_VERTICAL_M, COTA_ALTIMETRICA_M) %>%
  mutate(
    y = abs(as.numeric(str_replace(as.character(PROFUNDIDADE_SONDADOR_M), ",", "."))),
    x1 = abs(as.numeric(str_replace(as.character(PROFUNDIDADE_VERTICAL_M), ",", "."))),
    x2 = abs(as.numeric(str_replace(as.character(COTA_ALTIMETRICA_M), ",", ".")))
  ) %>%
  filter(!is.na(x1) & !is.na(x2) & !is.na(y)) %>%
  
  filter(x1 > 0 & x2 >= 0 & y > 0) 

# Asignación de variables
y <- datos_model$y
x1 <- datos_model$x1
x2 <- datos_model$x2

3 Análisis Gráfico (3D)

# Gráfico 3D 
s3d <- scatterplot3d(x1, x2, y,
                     main = "Gráfica N°1: Topografía Profundidad (3D)",
                     xlab = "Prof. Vertical (m) [X1]",
                     ylab = "Cota Altimétrica (m) [X2]",
                     zlab = "Prof. Perforación (m) [Y]",
                     pch = 16,
                     color = "#27AE60", 
                     angle = 45,      
                     type = "h") 

4 Modelo de Regresión Múltiple

Se plantea la ecuación del plano: \[Y = \beta_0 + \beta_1 \cdot X_1 + \beta_2 \cdot X_2\]

modelo <- lm(y ~ x1 + x2)

# Extracción de Coeficientes
coefs <- coef(modelo)
b0 <- coefs[1] 
b1 <- coefs[2] 
b2 <- coefs[3] 

5 Visualización del Plano Ajustado

s3d_plano <- scatterplot3d(x1, x2, y,
                     main = "Gráfica N°2: Plano de Regresión Ajustado",
                     xlab = "Prof. Vertical (m) [X1]",
                     ylab = "Cota Altimétrica (m) [X2]",
                     zlab = "Prof. Perforación (m) [Y]",
                     pch = 16,
                     color = adjustcolor("#2C3E50", alpha.f = 0.4), 
                     
                     angle = 130) 

# Plano matemático
s3d_plano$plane3d(modelo, col = "#27AE60", lty = "solid", lwd = 2)

6 Resultados y Ecuación

6.1 Bondad de Ajuste

cat(paste0("**Coeficiente de Correlación Múltiple (R):** ", round(r * 100, 4), "%<br>"))

Coeficiente de Correlación Múltiple (R): 92.796%

cat(paste0("**Coeficiente de Determinación (R²):** ", round(r2 * 100, 4), "%"))

Coeficiente de Determinación (R²): 86.1109%

6.2 Ecuación Matemática

cat(paste0("La ecuación resultante es: **", ecuacion_txt, "**"))

La ecuación resultante es: Y = 260.83 + 0.9767 * X1 - 0.0379 * X2

7 Tabla Resumen del Modelo

# Tabla
tabla <- data.frame(
  Parametro = c("Intercepto (b0)", "Coef. Vertical (b1)", "Coef. Cota (b2)"),
  Valor = c(sprintf("%.2f", b0), sprintf("%.4f", b1), sprintf("%.4f", b2)),
  Pearson = c(paste0(round(r*100,2), "%"), "", ""),
  R2 = c(paste0(round(r2*100,2), "%"), "", ""),
  Interpretacion = c("Valor Base", "Impacto Objetivo Geológico", "Impacto Topografía")
)

tabla %>%
  gt() %>%
  tab_header(
    title = md("**RESUMEN DEL MODELO MÚLTIPLE**"),
    subtitle = "Parámetros y Bondad de Ajuste"
  ) %>%
  tab_source_note(source_note = "Fuente: Grupo 3") %>%
  cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2C3E50"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#ECF0F1"), cell_text(weight = "bold", color = "#2C3E50")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2C3E50",
    table.border.bottom.color = "#2C3E50",
    data_row.padding = px(8)
  )
RESUMEN DEL MODELO MÚLTIPLE
Parámetros y Bondad de Ajuste
Parametro Valor Pearson R2 Interpretacion
Intercepto (b0) 260.83 92.8% 86.11% Valor Base
Coef. Vertical (b1) 0.9767 Impacto Objetivo Geológico
Coef. Cota (b2) -0.0379 Impacto Topografía
Fuente: Grupo 3

8 Conclusiones

texto_conclusion <- paste0(
  "Se ha desarrollado un modelo de regresión lineal múltiple para estimar la **Profundidad de Perforaciónr (Y)** ",
  "en función de la **Profundidad Vertical (X1)** y la **Cota Altimétrica (X2)**.<br><br>",
  "El modelo presenta un coeficiente de determinación ($R^2$) del **", round(r2*100, 2), "%**, ",
  "lo que confirma la fuerte relación física existente: la longitud total perforada equivale, casi exactamente, a la suma del objetivo geológico más la elevación topográfica del terreno.<br><br>",
  "Por ejemplo, si tenemos un objetivo a **", val_x1, " m** y una elevación de **", val_x2, " m**, ",
  "el modelo estima una profundidad total de **", round(estimacion, 2), " m**."
)

cat(texto_conclusion)

Se ha desarrollado un modelo de regresión lineal múltiple para estimar la Profundidad de Perforaciónr (Y) en función de la Profundidad Vertical (X1) y la Cota Altimétrica (X2).

El modelo presenta un coeficiente de determinación (\(R^2\)) del 86.11%, lo que confirma la fuerte relación física existente: la longitud total perforada equivale, casi exactamente, a la suma del objetivo geológico más la elevación topográfica del terreno.

Por ejemplo, si tenemos un objetivo a 1753 m y una elevación de 45 m, el modelo estima una profundidad total de 1971.36 m.