setwd("/cloud/project/datos")
datos <- read.csv("Petroleo_Ontaro.csv", header=T, dec=".", sep=";")



## --- MODELO UNIFORME ---
## Variable: SPUD_DATE (Año de inicio de perforación)
## Periodo: 2001–2015

# Convertir fechas y extraer el año
fechas <- as.POSIXct(datos$SPUD_DATE, format = "%Y/%m/%d %H:%M:%S", tz = "UTC")
años <- as.numeric(format(fechas, "%Y"))

# Filtrar rango 2001–2015
años <- años[!is.na(años) & años >= 2001 & años <= 2015]

# Calcular frecuencias por año
frecuencia <- table(años)
tabla_años <- as.data.frame(frecuencia)
colnames(tabla_años) <- c("Año", "Frecuencia")

# Modelo uniforme
k <- nrow(tabla_años)
Fo <- tabla_años$Frecuencia
Fe <- rep(sum(Fo) / k, k)

# Tabla comparativa observados vs esperados
tabla_uniforme <- data.frame(
  Año = tabla_años$Año,
  Observado = Fo,
  Esperado = Fe
)
print(tabla_uniforme)
##     Año Observado Esperado
## 1  2001       114 54.06667
## 2  2002        91 54.06667
## 3  2003        90 54.06667
## 4  2004        80 54.06667
## 5  2005        78 54.06667
## 6  2006       108 54.06667
## 7  2007        68 54.06667
## 8  2008        57 54.06667
## 9  2009        28 54.06667
## 10 2010        19 54.06667
## 11 2011        26 54.06667
## 12 2012        16 54.06667
## 13 2013        20 54.06667
## 14 2014         7 54.06667
## 15 2015         9 54.06667
# Gráfico comparativo
barplot(rbind(Fo, Fe),
        beside = TRUE,
        names.arg = tabla_años$Año,
        col = c("lightblue", "orange"),
        main = "Modelo Uniforme (2001–2015) - Año de Inicio de Perforación",
        xlab = "Año", ylab = "Frecuencia",
        las = 2, cex.names = 0.8)
legend("topright",
       legend = c("Real", "Modelo"),
       fill = c("lightblue", "orange"),
       bty = "n", cex = 0.8)

# Correlación observadas vs esperadas
cor_uniforme <- cor(Fo, Fe)
## Warning in cor(Fo, Fe): the standard deviation is zero
cat("Correlación entre observadas y esperadas:", round(cor_uniforme, 4), "\n")
## Correlación entre observadas y esperadas: NA
# Prueba Chi-cuadrado
x2 <- sum((Fo - Fe)^2 / Fe)
gl <- k - 1
Vc <- qchisq(0.95, gl)

cat("Estadístico Chi-cuadrado =", round(x2, 4), "\n")
## Estadístico Chi-cuadrado = 372.8163
cat("Valor crítico (α=0.05) =", round(Vc, 4), "\n")
## Valor crítico (α=0.05) = 23.6848