1 Configuración y Carga de Datos

##### UNIVERSIDAD CENTRAL DEL ECUADOR #####
#### AUTOR: LISS MURILLO ####
### CARRERA: INGENIERÍA EN PETRÓLEOS #####

#### REGRESIÓN POLINÓMICA ####
## Librerias 
library(dplyr)
library(ggplot2)
library(gt)
library(stringr)
library(readr)

## DATASET ##
# Se utiliza la misma ruta de archivo definida en PRODUCE_OILV333.Rmd
ruta_archivo <- "C:/Users/thann/OneDrive/Escritorio/ESTADISTICA.LOL/datos_vale.csv"

Datos <- read_delim(
  ruta_archivo,
  delim = ";",
  show_col_types = FALSE
)
## Estructura de los datos
str(Datos)
spc_tbl_ [104,173 × 95] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
 $ CODE                         : chr [1:104173] NA NA "28-JUL-2000 OPERATOR_NAME=COLT ENERGY INCO\"" NA ...
 $ DEPT_WATER_RESOURCES_CODE    : chr [1:104173] NA NA "Whitlow Energy, Inc." NA ...
 $ DEPT_MOTOR_VEHICLES_ABBREV   : chr [1:104173] NA NA NA NA ...
 $ NAME                         : chr [1:104173] NA NA "800" NA ...
 $ WIZARD_BASE_REFERENCE_YEAR   : chr [1:104173] NA NA "23100" NA ...
 $ WIZARD_PREDEVELOPMENT_YEAR   : chr [1:104173] NA NA NA NA ...
 $ UPDATE_DATE_1                : num [1:104173] NA NA 275319 NA NA ...
 $ UPDATE_INITIALS_1            : num [1:104173] NA NA 1970 NA NA NA NA NA NA NA ...
 $ ABBREVIATED_TO_4_CHARS       : num [1:104173] NA NA 2026 NA NA ...
 $ KCC_DISTRICT_NUMBER          : chr [1:104173] NA NA "DATA_SOURCE" NA ...
 $ OBJECTID                     : chr [1:104173] "42971829" "42971830" "1001106572" "42971831" ...
 $ KID                          : chr [1:104173] "1001106903" "1001106572" NA "1001106590" ...
 $ LEASE_NAME                   : chr [1:104173] "J. G. HAVENER" "EARLY" NA "ELDEN BURKE" ...
 $ FIELD_KID                    : chr [1:104173] "1000147101" "1000147596" NA "1000147696" ...
 $ OPERATOR_KID                 : chr [1:104173] "1044772773" "1041810049" "Town Oil Company Inc." "1027997289" ...
 $ LEASE_CODE_PI_BEENE          : chr [1:104173] "11322" "10661" NA "10687" ...
 $ LEASE_CODE_DOR               : chr [1:104173] "100743" "100416" NA "100434" ...
 $ PRODUCES_GAS                 : chr [1:104173] "No" "No" "NAD27" "No" ...
 $ PRODUCES_OIL                 : chr [1:104173] "Yes" "Yes" NA "Yes" ...
 $ STATE_CODE                   : chr [1:104173] "15" "15" NA "15" ...
 $ COUNTY_CODE                  : num [1:104173] 125 45 NA 49 49 49 49 207 31 31 ...
 $ LATITUDE                     : chr [1:104173] "37.132.046" "3.876.033" NA "37.482.822" ...
 $ LATITUDE_LEO_FOOTAGES        : logi [1:104173] NA NA NA NA NA NA ...
 $ LATITUDE_LEO_QUARTER_CALLS   : chr [1:104173] NA NA NA NA ...
 $ LATITUDE_DIRECTION           : chr [1:104173] NA NA "387.603.303" NA ...
 $ LONGITUDE                    : chr [1:104173] "-95.882.477" "-95.157.902" "-951.579.018" "-96.298.344" ...
 $ LONGITUDE_LEO_FOOTAGES       : chr [1:104173] NA NA "387.603.378" NA ...
 $ LONGITUDE_LEO_QUARTER_CALLS  : chr [1:104173] NA NA "-951.581.503" NA ...
 $ LONGITUDE_DIRECTION          : chr [1:104173] NA NA "312500.22" NA ...
 $ LONGITUDE_LATITUDE_SOURCE    : chr [1:104173] "CENTER_OF_SECTION" "CENTER_OF_SECTION" "4292184.41" "CENTER_OF_SECTION" ...
 $ PRINCIPAL_MERIDIAN           : num [1:104173] 6 6 15 6 6 6 6 6 6 6 ...
 $ TOWNSHIP                     : num [1:104173] 33 15 312483 29 31 ...
 $ TOWNSHIP_DIRECTION           : chr [1:104173] "S" "S" "4292393.14" "S" ...
 $ RANGE                        : num [1:104173] 14 20 15 10 10 10 13 16 14 16 ...
 $ RANGE_DIRECTION              : chr [1:104173] "E" "E" "EARLY" "E" ...
 $ SECTION                      : chr [1:104173] "33" "11" "BALDWIN" "34" ...
 $ SUBDIVISION_1_LARGEST        : chr [1:104173] NA NA "-105.929.576.967" NA ...
 $ SUBDIVISION_2                : chr [1:104173] NA NA "46.874.008.688" NA ...
 $ SUBDIVISION_3                : chr [1:104173] NA NA NA NA ...
 $ SUBDIVISION_4_SMALLEST       : chr [1:104173] NA NA NA NA ...
 $ SPOT                         : chr [1:104173] NA NA NA NA ...
 $ FEET_NORTH_FROM_REFERENCE    : num [1:104173] NA NA NA NA NA NA NA NA NA NA ...
 $ FEET_EAST_FROM_REFERENCE     : num [1:104173] NA NA NA NA NA NA NA NA NA NA ...
 $ REFERENCE_CORNER             : chr [1:104173] NA NA NA NA ...
 $ MEETS_AND_BOUNDS             : logi [1:104173] NA NA NA NA NA NA ...
 $ OLD_SPOT_OR_LOCATION         : chr [1:104173] NA NA NA NA ...
 $ UPDATE_INITIALS              : chr [1:104173] "DOR#4" "DOR" NA "DOR" ...
 $ UPDATE_DATE                  : chr [1:104173] "11/23/2013 3:11:58 PM" "5/31/2011 9:48:34 AM" NA "5/31/2011 9:48:35 AM" ...
 $ SKIP_IT                      : chr [1:104173] NA NA NA NA ...
 $ COMMENTS                     : chr [1:104173] NA NA NA NA ...
 $ CORRECTIONS                  : chr [1:104173] "28-JUL-2000 OPERATOR_NAME=HORTON OIL COMPA" "06-FEB-1999 LEASE_NAME=EARLY S." NA "28-JUL-2000 OPERATOR_NAME=DENTON OIL COMPA" ...
 $ OPERATOR_NAME                : chr [1:104173] "Horton, John" NA NA "Suerte Oil Company" ...
 $ PRODUCING_FORMATION          : chr [1:104173] NA NA NA NA ...
 $ DEPTH_OF_WELL                : num [1:104173] 700 NA NA 1400 NA ...
 $ FIELD_CODE_DOR               : num [1:104173] 63550 NA NA 25250 10800 ...
 $ DATA_SOURCE                  : chr [1:104173] NA NA NA NA ...
 $ CUMULATIVE_PRODUCTION        : num [1:104173] 47293 NA NA 82624 10518 ...
 $ CUMULATIVE_YEAR_STARTED      : num [1:104173] 1970 NA NA 1970 1971 ...
 $ CUMULATIVE_YEAR_ENDED        : num [1:104173] 2025 NA NA 2017 1983 ...
 $ FIELD_KID_SOURCE             : chr [1:104173] "DATA_SOURCE" NA NA "DATA_SOURCE" ...
 $ LEASE_KID                    : num [1:104173] 1001106903 NA NA 1001106590 1001106593 ...
 $ LEASE_KID_SOURCE             : logi [1:104173] NA NA NA NA NA NA ...
 $ PRODUCING_FORMATION_OLD      : chr [1:104173] NA NA NA NA ...
 $ QUARTER_CALLS_SOURCE         : chr [1:104173] NA NA NA NA ...
 $ OPERATOR_NAME_OLD            : chr [1:104173] "Horton Oil Company, Inc." NA NA "Suerte Oil Company" ...
 $ PRODUCING_FORMATION_STRAT_KID: num [1:104173] NA NA NA NA NA NA NA NA NA NA ...
 $ PRODUCING_FORMATION_SOURCE   : chr [1:104173] NA NA NA NA ...
 $ LONGITUDE_LATITUDE_DATUM     : chr [1:104173] "NAD27" NA NA "NAD27" ...
 $ GPS_LATITUDE                 : logi [1:104173] NA NA NA NA NA NA ...
 $ GPS_LONGITUDE                : logi [1:104173] NA NA NA NA NA NA ...
 $ GPS_DATUM                    : logi [1:104173] NA NA NA NA NA NA ...
 $ GPS_SOURCE                   : logi [1:104173] NA NA NA NA NA NA ...
 $ GPS_DATE                     : logi [1:104173] NA NA NA NA NA NA ...
 $ GPS_ACCURACY_COMMENTS        : logi [1:104173] NA NA NA NA NA NA ...
 $ NAD27_LATITUDE               : chr [1:104173] "371.320.458" NA NA "374.828.223" ...
 $ NAD27_LONGITUDE              : chr [1:104173] "-95.882.477" NA NA "-962.983.435" ...
 $ NAD83_LATITUDE               : chr [1:104173] "371.321.146" NA NA "374.828.544" ...
 $ NAD83_LONGITUDE              : chr [1:104173] "-958.827.371" NA NA "-96.298.619" ...
 $ NAD27_UTM_X                  : num [1:104173] 243937 NA NA 738884 741149 ...
 $ NAD27_UTM_Y                  : num [1:104173] 4113207 NA NA 4151660 4132923 ...
 $ NAD27_UTM_ZONE               : num [1:104173] 15 NA NA 14 14 14 15 15 15 15 ...
 $ NAD83_UTM_X                  : num [1:104173] 243920 NA NA 738853 741119 ...
 $ NAD83_UTM_Y                  : num [1:104173] 4113419 NA NA 4151867 4133131 ...
 $ NAD83_UTM_ZONE               : num [1:104173] 15 NA NA 14 14 14 15 15 15 15 ...
 $ LEASE_NAME_DOR               : chr [1:104173] "HAVENER,J.G." NA NA "ELDEN BURKE" ...
 $ FIELD_NAME                   : chr [1:104173] "WAYSIDE-HAVANA" NA NA "DUNKLEBERGER" ...
 $ x                            : chr [1:104173] "-106.736.183.151" NA NA "-107.199.141.514" ...
 $ y                            : chr [1:104173] "44.575.388.408" NA NA "45.066.267.765" ...
 $ ...89                        : logi [1:104173] NA NA NA NA NA NA ...
 $ ...90                        : logi [1:104173] NA NA NA NA NA NA ...
 $ ...91                        : logi [1:104173] NA NA NA NA NA NA ...
 $ ...92                        : logi [1:104173] NA NA NA NA NA NA ...
 $ ...93                        : logi [1:104173] NA NA NA NA NA NA ...
 $ ...94                        : logi [1:104173] NA NA NA NA NA NA ...
 $ ...95                        : logi [1:104173] NA NA NA NA NA NA ...
 - attr(*, "spec")=
  .. cols(
  ..   CODE = col_character(),
  ..   DEPT_WATER_RESOURCES_CODE = col_character(),
  ..   DEPT_MOTOR_VEHICLES_ABBREV = col_character(),
  ..   NAME = col_character(),
  ..   WIZARD_BASE_REFERENCE_YEAR = col_character(),
  ..   WIZARD_PREDEVELOPMENT_YEAR = col_character(),
  ..   UPDATE_DATE_1 = col_double(),
  ..   UPDATE_INITIALS_1 = col_double(),
  ..   ABBREVIATED_TO_4_CHARS = col_double(),
  ..   KCC_DISTRICT_NUMBER = col_character(),
  ..   OBJECTID = col_character(),
  ..   KID = col_character(),
  ..   LEASE_NAME = col_character(),
  ..   FIELD_KID = col_character(),
  ..   OPERATOR_KID = col_character(),
  ..   LEASE_CODE_PI_BEENE = col_character(),
  ..   LEASE_CODE_DOR = col_character(),
  ..   PRODUCES_GAS = col_character(),
  ..   PRODUCES_OIL = col_character(),
  ..   STATE_CODE = col_character(),
  ..   COUNTY_CODE = col_double(),
  ..   LATITUDE = col_character(),
  ..   LATITUDE_LEO_FOOTAGES = col_logical(),
  ..   LATITUDE_LEO_QUARTER_CALLS = col_character(),
  ..   LATITUDE_DIRECTION = col_character(),
  ..   LONGITUDE = col_character(),
  ..   LONGITUDE_LEO_FOOTAGES = col_character(),
  ..   LONGITUDE_LEO_QUARTER_CALLS = col_character(),
  ..   LONGITUDE_DIRECTION = col_character(),
  ..   LONGITUDE_LATITUDE_SOURCE = col_character(),
  ..   PRINCIPAL_MERIDIAN = col_double(),
  ..   TOWNSHIP = col_double(),
  ..   TOWNSHIP_DIRECTION = col_character(),
  ..   RANGE = col_double(),
  ..   RANGE_DIRECTION = col_character(),
  ..   SECTION = col_character(),
  ..   SUBDIVISION_1_LARGEST = col_character(),
  ..   SUBDIVISION_2 = col_character(),
  ..   SUBDIVISION_3 = col_character(),
  ..   SUBDIVISION_4_SMALLEST = col_character(),
  ..   SPOT = col_character(),
  ..   FEET_NORTH_FROM_REFERENCE = col_double(),
  ..   FEET_EAST_FROM_REFERENCE = col_double(),
  ..   REFERENCE_CORNER = col_character(),
  ..   MEETS_AND_BOUNDS = col_logical(),
  ..   OLD_SPOT_OR_LOCATION = col_character(),
  ..   UPDATE_INITIALS = col_character(),
  ..   UPDATE_DATE = col_character(),
  ..   SKIP_IT = col_character(),
  ..   COMMENTS = col_character(),
  ..   CORRECTIONS = col_character(),
  ..   OPERATOR_NAME = col_character(),
  ..   PRODUCING_FORMATION = col_character(),
  ..   DEPTH_OF_WELL = col_double(),
  ..   FIELD_CODE_DOR = col_double(),
  ..   DATA_SOURCE = col_character(),
  ..   CUMULATIVE_PRODUCTION = col_double(),
  ..   CUMULATIVE_YEAR_STARTED = col_double(),
  ..   CUMULATIVE_YEAR_ENDED = col_double(),
  ..   FIELD_KID_SOURCE = col_character(),
  ..   LEASE_KID = col_double(),
  ..   LEASE_KID_SOURCE = col_logical(),
  ..   PRODUCING_FORMATION_OLD = col_character(),
  ..   QUARTER_CALLS_SOURCE = col_character(),
  ..   OPERATOR_NAME_OLD = col_character(),
  ..   PRODUCING_FORMATION_STRAT_KID = col_double(),
  ..   PRODUCING_FORMATION_SOURCE = col_character(),
  ..   LONGITUDE_LATITUDE_DATUM = col_character(),
  ..   GPS_LATITUDE = col_logical(),
  ..   GPS_LONGITUDE = col_logical(),
  ..   GPS_DATUM = col_logical(),
  ..   GPS_SOURCE = col_logical(),
  ..   GPS_DATE = col_logical(),
  ..   GPS_ACCURACY_COMMENTS = col_logical(),
  ..   NAD27_LATITUDE = col_character(),
  ..   NAD27_LONGITUDE = col_character(),
  ..   NAD83_LATITUDE = col_character(),
  ..   NAD83_LONGITUDE = col_character(),
  ..   NAD27_UTM_X = col_double(),
  ..   NAD27_UTM_Y = col_double(),
  ..   NAD27_UTM_ZONE = col_double(),
  ..   NAD83_UTM_X = col_double(),
  ..   NAD83_UTM_Y = col_double(),
  ..   NAD83_UTM_ZONE = col_double(),
  ..   LEASE_NAME_DOR = col_character(),
  ..   FIELD_NAME = col_character(),
  ..   x = col_character(),
  ..   y = col_character(),
  ..   ...89 = col_logical(),
  ..   ...90 = col_logical(),
  ..   ...91 = col_logical(),
  ..   ...92 = col_logical(),
  ..   ...93 = col_logical(),
  ..   ...94 = col_logical(),
  ..   ...95 = col_logical()
  .. )
 - attr(*, "problems")=<pointer: 0x000001e907ff90a0> 

2 Extracción y Depuración de Variables

Se definieron los Años Activos como variable independiente (x), ya que representan el tiempo durante el cual un pozo ha estado en operación, constituyendo un factor clave en la acumulación de producción.

La Producción Acumulada actúa como variable dependiente (y), debido a que refleja la cantidad total de hidrocarburos extraídos a lo largo del tiempo de vida del pozo.

Esta relación busca modelar el comportamiento de la producción en función del tiempo. Desde el punto de vista operativo, a medida que aumentan los años activos, la producción acumulada tiende a incrementarse, aunque no necesariamente de forma lineal, debido a factores como declinación de producción, mantenimiento y condiciones del yacimiento.

Por ello, se justifica el uso de un modelo de regresión polinómica de grado 3 que permita capturar posibles curvaturas en la tendencia observada.

# La variable YEARS_ACTIVE no viene directamente en el dataset, por lo que se
# calcula a partir de CUMULATIVE_YEAR_STARTED y CUMULATIVE_YEAR_ENDED
# (Años Activos = Año de Término - Año de Inicio de producción acumulada).

# Selección de variables
datos_raw <- Datos %>%
  mutate(
    anio_inicio = as.numeric(str_replace_all(as.character(CUMULATIVE_YEAR_STARTED), ",", ".")),
    anio_fin    = as.numeric(str_replace_all(as.character(CUMULATIVE_YEAR_ENDED), ",", ".")),
    YEARS_ACTIVE = anio_fin - anio_inicio
  ) %>%
  select(YEARS_ACTIVE, CUMULATIVE_PRODUCTION) %>%
  mutate(
    x_raw = as.numeric(str_replace_all(as.character(YEARS_ACTIVE), ",", ".")),
    y_raw = as.numeric(str_replace_all(as.character(CUMULATIVE_PRODUCTION), ",", "."))
  ) %>%
  filter(!is.na(x_raw), !is.na(y_raw), x_raw > 0, y_raw > 0)

3 Análisis Gráfico Exploratorio

Previo a la ejecución del agrupamiento, se analiza la distribución inicial de los datos con el fin de fundamentar técnicamente el uso de la técnica de Binning.

datos_plot <- datos_raw %>% 
  filter(y_raw < quantile(y_raw, 0.99))  

par(mar = c(5, 5, 4, 2))

plot(datos_plot$x_raw, datos_plot$y_raw,
     main = "Gráfica N°1: Diagrama de Dispersión de la Producción Acumulada\n en función de los Años Activos",
     xlab = "Años Activos",
     ylab = "Producción Acumulada",
     pch = 19,
     col = rgb(46/255, 134/255, 193/255, 0.3),
     cex = 0.6, 
     cex.main = 0.9, 
     frame.plot = FALSE)

grid(nx = NULL, ny = NULL, col = "#D7DBDD", lty = "dotted")

box()

4 Aplicación de Binning

Ante la alta dispersión visualizada en la Gráfica N°1, se aplica un método de agrupamiento por rangos (binning) para reducir el ruido en los datos y permitir una mejor identificación de la tendencia subyacente.

# Agrupamiento por rangos de 5 años
datos_model <- datos_raw %>%
  mutate(x_bin = floor(x_raw / 5) * 5) %>% 
  group_by(x_bin) %>%
  summarise(
    y = mean(y_raw, na.rm = TRUE),
    conteo = n(),
    .groups = "drop"
  ) %>%
  rename(x = x_bin) %>%
  filter(conteo >= 3)

# Limpieza de outliers
lim_y <- quantile(datos_model$y, probs = c(0.05, 0.95), na.rm = TRUE)

datos_model <- datos_model %>%
  filter(
    y >= lim_y[1],
    y <= lim_y[2]
  )

# Variables finales para el modelo
x <- datos_model$x
y <- datos_model$y

5 Tabla Comparativa de Valores x e y

Se presenta la tabla con los valores numéricos finales de las variables aplicadas al modelo: x (Años Activos, agrupados por bins de 5 años) y y (Producción Acumulada promedio), una vez depurados los datos atípicos.

tabla_xy <- data.frame(
  Observación = seq_along(x),
  x = x,
  y = round(y, 2)
)

tabla_xy %>%
  gt() %>%
  tab_header(
    title    = md("**Tabla Comparativa: Variable x vs Variable y**"),
    subtitle = md("*x = Años Activos (binning) — y = Producción Acumulada promedio*")
  ) %>%
  cols_label(
    Observación = md("**N°**"),
    x           = md("**x (Años Activos)**"),
    y           = md("**y (Producción Acumulada)**")
  ) %>%
  fmt_number(columns = c(x, y), decimals = 2, sep_mark = ",") %>%
  tab_style(
    style = list(
      cell_fill(color = "#2C2C2C"),
      cell_text(color = "white", weight = "bold")
    ),
    locations = cells_column_labels()
  ) %>%
  tab_style(
    style = cell_fill(color = "#F5F5F5"),
    locations = cells_body(rows = seq(1, nrow(tabla_xy), by = 2))
  ) %>%
  tab_source_note(source_note = md("*Autor: Araujo Valeska*")) %>%
  tab_options(
    table.width                = pct(60),
    heading.title.font.size    = px(16),
    heading.subtitle.font.size = px(12),
    table.font.size            = px(13),
    data_row.padding           = px(6)
  )
Tabla Comparativa: Variable x vs Variable y
x = Años Activos (binning) — y = Producción Acumulada promedio
x (Años Activos) y (Producción Acumulada)
1 5.00 84,202.35
2 10.00 123,661.56
3 15.00 158,909.67
4 20.00 220,691.17
5 25.00 379,561.30
6 30.00 1,437,246.93
7 35.00 699,882.73
8 40.00 413,897.89
9 45.00 778,292.22
10 50.00 1,352,973.66
11 55.00 1,813,740.16
12 60.00 951,245.54
13 70.00 451,301.87
14 75.00 532,696.35
15 80.00 702,041.60
16 85.00 1,332,512.90
17 90.00 1,316,438.67
Autor: Araujo Valeska

6 Conjetura del Modelo de Regresión Polinómico

La ecuación de tercer grado para dicho modelo es: \[ y = \beta_0 + \beta_1 x + \beta_2 x^2 + \beta_3 x^3 \]

modelo_polinomico <- lm(y ~ x + I(x^2) + I(x^3))

7 Gráfica del Modelo Polinómico (Grado 3)

Se presenta el ajuste del modelo incluyendo la banda de incertidumbre estadística (Intervalo de Confianza del 95%).

par(mar = c(5, 5, 4, 2))

plot(x, y,
     main = "Gráfica N°2: Modelo Polinómico de la Producción Acumulada en función de los Años Activos",
     xlab = "Años Activos",
     ylab = "Producción Acumulada",
     col = "#3498DB",
     pch = 16,
     cex = 1.0,
     cex.main = 0.9,
     frame.plot = FALSE)

grid(nx = NULL, ny = NULL, col = "#D7DBDD", lty = "dotted")

x_seq <- seq(min(x), max(x), length.out = 500)

predicciones <- predict(modelo_polinomico,
                        newdata = data.frame(x = x_seq),
                        interval = "confidence",
                        level = 0.95)

polygon(c(x_seq, rev(x_seq)), 
        c(predicciones[, "lwr"], rev(predicciones[, "upr"])), 
        col = rgb(0.5, 0.5, 0.5, 0.2), border = NA)

lines(x_seq, predicciones[, "fit"], col = "#E74C3C", lwd = 3)

legend("topleft",
       legend = c("Datos promediados (binning)", 
                  "Modelo Polinómico (Grado 3)", 
                  "I.C. 95%"),
       col = c("#3498DB", "#E74C3C", "gray"),
       pch = c(16, NA, 15),
       lwd = c(NA, 3, NA),
       pt.cex = c(1, NA, 2),
       bty = "n")

8 Test de Bondad del Modelo

8.1 Coeficiente de correlación

El coeficiente de correlación es:  0.56

8.2 Coeficiente de determinación

El coeficiente de determinación (R²) es: 0.56

9 Ecuación del Modelo

La ecuación estimada del modelo es:

 y = -512894.9981 + 74947.1130803155x - 1285.3201019405x^2 + 7.2765322097x^3

10 Tabla Resumen del Modelo

tabla_resumen <- data.frame(
  Variable = c("Años Activos", "Producción Acumulada"),
  Tipo = c("Independiente (x)", "Dependiente (y)"),
  R = c("", round(r, 2)),
  R2 = c("", round(r2, 2)),
  Intercepto = c("", round(b0, 4)),
  Beta1 = c("", round(b1, 6)),
  Beta2 = c("", round(b2, 8)),
  Beta3 = c("", round(b3, 10)),
  Ecuación = c("", ecuacion)
)

tabla_resumen %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N°1 del Resumen del Modelo de Regresión Polinómica**")
  ) %>%
  tab_source_note(
    source_note = "Autor: Valeska Araujo"
  ) %>%
  cols_align(
    align = "center",
    everything()
  )
Tabla N°1 del Resumen del Modelo de Regresión Polinómica
Variable Tipo R R2 Intercepto Beta1 Beta2 Beta3 Ecuación
Años Activos Independiente (x)
Producción Acumulada Dependiente (y) 0.56 0.56 -512894.9981 74947.11308 -1285.32010194 7.2765322097 y = -512894.9981 + 74947.1130803155x - 1285.3201019405x^2 + 7.2765322097x^3
Autor: Valeska Araujo

11 Cálculo de Estimaciones

¿Cuál es la Producción Acumulada estimada para un rango de 20 Años Activos?

Para 20 años activos, la Producción Acumulada estimada es: 530131.5

12 Conclusiones

Entre los Años Activos y la Producción Acumulada existe una relación polinómica de tercer grado, con un coeficiente de correlación \(r = 0.88\), lo que indica una asociación positiva fuerte entre ambas variables.

El modelo presenta un coeficiente de determinación \(R^2 = 0.88\) , lo que significa que el 88% de la variabilidad de la Producción Acumulada es explicada por los Años Activos bajo el modelo polinómico estimado.

La ecuación ajustada es: \(y = -64654.6937 + 20231.5137x - 484.8109x^2 + 3.9889x^3\).

Se observa que los términos de segundo y tercer grado son relevantes, lo que indica un comportamiento no lineal en la relación analizada.

En consecuencia, el modelo polinómico de tercer grado representa adecuadamente la relación, evidenciando una tendencia creciente con variaciones en la tasa de producción a lo largo del tiempo.