library(readxl)

datos <- read_excel("C:/Users/LEO/Documents/Producción Campo Sacha.csv.xlsx")


datos$día <- as.numeric(datos$día)


datos$grupo_día <- cut(datos$día, 
                       breaks = c(0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 31), 
                       labels = c("1", "2", "3", "4", "5", "6", "7", "8", "9", "10"))

# 3. Crear la tabla de frecuencias usando la columna AGRUPADA
tabla_frecuencia <- as.data.frame(table(datos$grupo_día))

# Renombrar columnas
colnames(tabla_frecuencia) <- c("Rango_Días", "Frecuencia")

# Calcular frecuencias relativas y porcentajes
tabla_frecuencia$hi <- tabla_frecuencia$Frecuencia / sum(tabla_frecuencia$Frecuencia)
tabla_frecuencia$hi_porc <- tabla_frecuencia$hi * 100
sum(tabla_frecuencia$hi)
## [1] 1
"3 Gráficas"
## [1] "3 Gráficas"
# DIAGRAMA DE BARRAS LOCAL ni

barplot(tabla_frecuencia$Frecuencia, 
        main = "Gr\u00E1fica N\u00BA 86: Frecuencia de Días de la Producción del Campo Sacha",
        xlab = "Días", 
        ylab = "Porcentaje", 
        names.arg =tabla_frecuencia$Rango_Días,
        las = 2, 
        col = "red", 
        cex.names = 1)

"3.1 Conjetura del Modelo: Distribución Beta"
## [1] "3.1 Conjetura del Modelo: Distribución Beta"
# 1. Normalizamos los grupos (de 0 a 1) para que la Beta funcione
x_norm <- seq(0.1, 0.9, length.out = 10) 

# 2. Definimos parámetros para forma de "U" (alfa y beta menores a 1)
# Puedes ajustar estos números (0.5, 0.7...) para que la curva suba más o menos
alfa <- 0.62
beta_param <- 0.65

# 3. Calculamos la densidad teórica Beta
P_beta <- dbeta(x_norm, shape1 = alfa, shape2 = beta_param)

# 4. Escalamos P_beta para que sea comparable con tus porcentajes (hi)
P_beta_relativa <- P_beta / sum(P_beta)

# 5. Gráfica Comparativa
barplot(rbind(tabla_frecuencia$hi, P_beta_relativa), 
        main = "Comparación: Experimental vs Modelo Beta (Forma U)", 
        xlab = "Grupos de Días", 
        ylab = "Porcentaje", 
        col = c("red", "darkgreen"), 
        names.arg = tabla_frecuencia$Rango_Días, 
        beside = TRUE)

legend("top", legend = c("Experimental (Campo Sacha)", "Teórico (Beta)"),
       fill = c("red", "darkgreen"), bty = "n")

# Asignaciones después del gráfico
Fo <- tabla_frecuencia$hi
Fe <- P_beta_relativa

"3.2 Test de Pearson"
## [1] "3.2 Test de Pearson"
"Mide el grado de correlación entre la frecuencia observada y la frecuencia esperada"
## [1] "Mide el grado de correlación entre la frecuencia observada y la frecuencia esperada"
#Test:
#Coeficiente de Pearson 
cor(Fo,Fe) #Correlacion 
## [1] 0.9233362
plot(Fo,Fe, main="Gráfica Nº89: Correlación de frecuencias en el modelo Beta
                 de los Días de Producción del Campo Sacha",
     xlab="Observado (hi)", ylab="Esperado (P)")

abline(lm(Fe ~ Fo), col="red",lwd=2)

"3.3 Test de Chi-Cuadrado"
## [1] "3.3 Test de Chi-Cuadrado"
# Cálculo del estadístico
x2 <- sum(((Fo - Fe)^2) / Fe)

# Valor crítico corregido (95% de confianza, 9 grados de libertad)
vc <- qchisq(0.95, df = 9) 

# Resultados
print(paste("Chi-cuadrado calculado (x2):", x2))
## [1] "Chi-cuadrado calculado (x2): 0.00373395456416931"
print(paste("Valor crítico (vc):", vc))
## [1] "Valor crítico (vc): 16.9189776046204"
"4.9 Resumen de test de bondad"
## [1] "4.9 Resumen de test de bondad"
Correlacion <- cor(Fo, Fe) * 100
Variable <- c("Día")
tabla_resumen <- data.frame(Variable, 
                            round(Correlacion, 2), 
                            round(x2, 2), 
                            round(vc, 2))

colnames(tabla_resumen) <- c("Variable", "Test Pearson (%)", "Chi Cuadrado", "Umbral de aceptación")
library(knitr)
kable(tabla_resumen, format = "markdown", 
      caption = "Tabla Nº25. Resumen de test de bondad al modelo de probabilidad")
Tabla Nº25. Resumen de test de bondad al modelo de probabilidad
Variable Test Pearson (%) Chi Cuadrado Umbral de aceptación
Día 92.33 0 16.92