# 1. CARGA DE DATOS Y LIBRERIAS
library(dplyr)
library(knitr)
library(gt)
setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos<- read.csv("tablap.csv", header = TRUE, sep = ";", dec = ",")
x <- as.numeric(datos$Horizontal.Length) / 100
y <- as.numeric(datos$Fuel.consumed..drilling.in.gallon.)
# Generamos TPV global ya transformado
TPV <- data.frame(x, y)
TPV <- na.omit(TPV)
| Tabla N°1. Pares de Valores de Longitud Horizontal y Combustible por Perforación de los pozos de gas Natural | ||
| N° | Longitud Horizontal (km) | Combustible por Perforación (gl) |
|---|---|---|
| 1 | 21.52 | 5,195.29 |
| 2 | 24.41 | 6,859.66 |
| 3 | 4.48 | 2,683.84 |
| 4 | 10.51 | 2,979.56 |
| 5 | 18.56 | 4,549.63 |
| 6 | 2.40 | 1,444.85 |
| 7 | 17.66 | 4,531.40 |
| 8 | 20.53 | 5,119.57 |
| 9 | 24.07 | 7,119.47 |
| 10 | 0.65 | 2,139.57 |
| 11 | 24.79 | 6,545.87 |
| 12 | 15.40 | 3,761.80 |
| 13 | 7.85 | 3,456.13 |
| 14 | 20.15 | 4,837.81 |
| 15 | 18.16 | 3,563.52 |
| 16 | 10.79 | 3,660.69 |
| 17 | 1.74 | 1,787.93 |
| 18 | 18.36 | 4,281.62 |
| 19 | 20.36 | 3,328.64 |
| 20 | 11.27 | 3,441.46 |
| Tabla 1 de 2 | ||
## **3. DIAGRAMA DE DISPERSIÓN**
par(oma = c(1, 1, 1, 1))
plot(x, y,
pch = 16,
col = "blue",
main = "Gráfica Nº1: Diagrama de dispersión entre Longitud
Horizontal y Combustible por Perforacion",
xlab = "Longitud Horizontal (km)",
ylab = "Consumo (gl)")
box(which = "outer", col = "black")
Debido a la similitud de la nube de puntos conjeturamos a un modelo Polinómico
Calculo de Parámetros
par(oma = c(1, 1, 1, 1))
xcuad <- x^2; xcub <- x^3; xcta <- x^4
regresion_polinomica <- lm(y ~ x + xcuad + xcub + xcta)
beta0 <- regresion_polinomica$coefficients[1]
beta1 <- regresion_polinomica$coefficients[2]
beta2 <- regresion_polinomica$coefficients[3]
beta3 <- regresion_polinomica$coefficients[4]
beta4 <- regresion_polinomica$coefficients[5]
# Generar la gráfica
plot(x, y, pch = 16, col = "blue",
main = "Gráfica Nº 2: Comparación modelo polinómico",
xlab = "Longitud Horizontal (km)", ylab = "Consumo (galones)")
curve(beta0 + beta1*x + beta2*x^2 + beta3*x^3 + beta4*x^4,
from = min(x), to = max(x), add = TRUE, col = "red", lwd = 2)
Cálculo de Indicadores
Coeficiente de Pearson
r <- cor(y, predict(regresion_polinomica))
r
## [1] 0.9472126
| Test de Aprobación del Modelo Polinómico | |
| Indicador | Valor |
|---|---|
| Correlación de Pearson (r) | 94.72 % |
| Tabla 2 de 2 | |
plot.new()
plot.window(xlim = c(0, 100), ylim = c(0, 100))
text(50, 85, "RESTRICCIONES DEL MODELO", cex = 1.4, font = 2, col = "#D9534F")
parrafo_1 <- "El modelo solo es confiable dentro del rango
observado R = {x / 0 <= x <= 4161.739}.
Los modelos de grado superior son altamente
sensibles a la extrapolación."
text(50, 55, parrafo_1, cex = 1.3, font = 3, col = "black")
rect(2, 5, 98, 95, border = "#D9534F", lwd = 3)
consumo_esp <- beta0 + beta1*x0 + beta2*x0^2 + beta3*x0^3 + beta4*x0^4
consumo_esp
## (Intercept)
## 2530.377
Entre la Longitud Horizontal (km) y el Consumo de Combustible por Perforación (galones) se observa una relación de tipo polinomial de cuarto grado, la cual presenta una correlación de Pearson alta del 94.72%, demostrando un ajuste estadístico robusto. El modelo matemático estimado solo es confiable dentro del rango observado de la muestra R = {x / 0 <= x <= 4161.739}, debido a que los modelos de grado superior son altamente sensibles a la extrapolación.
Ejemplo: Cuando la longitud horizontal acumulada de la estructura del pozo es de 20 km, el modelo matemático predice un consumo de combustible esperado de aproximadamente 2,530.38 galones.