ANÁLISIS ESTADÍSTICO

1. CARGA DE LIBRERÍAS Y DATOS

# 1. CARGA DE DATOS Y LIBRERIAS
library(dplyr)
library(knitr)
library(gt)

setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos<- read.csv("tablap.csv", header = TRUE, sep = ";", dec = ",")

2. TABLA PARES DE VALORES

x <- as.numeric(datos$Horizontal.Length) / 100
y <- as.numeric(datos$Fuel.consumed..drilling.in.gallon.)

# Generamos TPV global ya transformado
TPV <- data.frame(x, y)
TPV <- na.omit(TPV)
Tabla N°1. Pares de Valores de Longitud Horizontal y Combustible por Perforación de los pozos de gas Natural
Longitud Horizontal (km) Combustible por Perforación (gl)
1 21.52 5,195.29
2 24.41 6,859.66
3 4.48 2,683.84
4 10.51 2,979.56
5 18.56 4,549.63
6 2.40 1,444.85
7 17.66 4,531.40
8 20.53 5,119.57
9 24.07 7,119.47
10 0.65 2,139.57
11 24.79 6,545.87
12 15.40 3,761.80
13 7.85 3,456.13
14 20.15 4,837.81
15 18.16 3,563.52
16 10.79 3,660.69
17 1.74 1,787.93
18 18.36 4,281.62
19 20.36 3,328.64
20 11.27 3,441.46
Tabla 1 de 2

3. DIAGRAMA DE DISPERSIÓN

## **3. DIAGRAMA DE DISPERSIÓN**
par(oma = c(1, 1, 1, 1))
plot(x, y, 
     pch = 16, 
     col = "blue", 
     main = "Gráfica Nº1: Diagrama de dispersión entre Longitud 
     Horizontal y Combustible por Perforacion",
     xlab = "Longitud Horizontal (km)",
     ylab = "Consumo (gl)")
box(which = "outer", col = "black")

4. CONJETURA DEL MODELO

Debido a la similitud de la nube de puntos conjeturamos a un modelo Polinómico

Calculo de Parámetros

par(oma = c(1, 1, 1, 1))

xcuad <- x^2; xcub <- x^3; xcta <- x^4

regresion_polinomica <- lm(y ~ x + xcuad + xcub + xcta)
beta0 <- regresion_polinomica$coefficients[1]
beta1 <- regresion_polinomica$coefficients[2]
beta2 <- regresion_polinomica$coefficients[3]
beta3 <- regresion_polinomica$coefficients[4]
beta4 <- regresion_polinomica$coefficients[5]

# Generar la gráfica 
plot(x, y, pch = 16, col = "blue",
     main = "Gráfica Nº 2: Comparación modelo polinómico",
     xlab = "Longitud Horizontal (km)", ylab = "Consumo (galones)")

curve(beta0 + beta1*x + beta2*x^2 + beta3*x^3 + beta4*x^4, 
      from = min(x), to = max(x), add = TRUE, col = "red", lwd = 2)

5. TEST DE APROBACIÓN Y RESTRICCIONES

Cálculo de Indicadores

Coeficiente de Pearson

r <- cor(y, predict(regresion_polinomica))
r
## [1] 0.9472126
Test de Aprobación del Modelo Polinómico
Indicador Valor
Correlación de Pearson (r) 94.72 %
Tabla 2 de 2
plot.new()
plot.window(xlim = c(0, 100), ylim = c(0, 100))

text(50, 85, "RESTRICCIONES DEL MODELO", cex = 1.4, font = 2, col = "#D9534F")

parrafo_1 <- "El modelo solo es confiable dentro del rango 
observado R = {x / 0 <= x <= 4161.739}. 
Los modelos de grado superior son altamente 
sensibles a la extrapolación."


text(50, 55, parrafo_1, cex = 1.3, font = 3, col = "black")

rect(2, 5, 98, 95, border = "#D9534F", lwd = 3)

6. CÁLCULO DE PRONÓSTICOS

consumo_esp <- beta0 + beta1*x0 + beta2*x0^2 + beta3*x0^3 + beta4*x0^4
consumo_esp
## (Intercept) 
##    2530.377

7. CONCLUSIÓN

Entre la Longitud Horizontal (km) y el Consumo de Combustible por Perforación (galones) se observa una relación de tipo polinomial de cuarto grado, la cual presenta una correlación de Pearson alta del 94.72%, demostrando un ajuste estadístico robusto. El modelo matemático estimado solo es confiable dentro del rango observado de la muestra R = {x / 0 <= x <= 4161.739}, debido a que los modelos de grado superior son altamente sensibles a la extrapolación.

Ejemplo: Cuando la longitud horizontal acumulada de la estructura del pozo es de 20 km, el modelo matemático predice un consumo de combustible esperado de aproximadamente 2,530.38 galones.