setwd("/cloud/project/datos")
datos <- read.csv("Petroleo_Ontaro.csv", header=T, dec=".", sep=";")



# VARIABLE PROFUNDIDAD
prof_vertical<-datos$TRUE_VERTICAL_DEPTH
prof_vertical<-na.omit(prof_vertical)

# GDF
min(prof_vertical)
## [1] 1.37
max(prof_vertical)
## [1] 1828.8
R_vertical<-max(prof_vertical)-min(prof_vertical)
k_vertical<-1+(3.3*log10(length(prof_vertical)))
k_vertical<-floor(k_vertical)
A_vertical<-R_vertical/k_vertical

HistoSturges_vertical<-hist(prof_vertical, main="Gráfica No.1:
                            Distribución de Profundidad vertical en el pozo",
                            breaks = seq(min(prof_vertical),max(prof_vertical),A_vertical),
                            xlab="Profundidad vertical (m)", 
                            ylab="Cantidad", 
                            col="red")

HistoSturges_vertical$counts
##  [1] 2843 7073 5192 3489 2084 1630  851  461  296  321   96   19    4    0    6
Histograma_vertical<-hist(prof_vertical, main="Gráfica No.2 :
                          Distribución de Profundidad vertical en el pozo",
                          xlab="Profundidad vertical (m)", 
                          ylab="Cantidad", 
                          col="red")

limites_vertical<-Histograma_vertical$breaks
liminf_vertical<-limites_vertical[1:15]
limsup_vertical<-limites_vertical[2:16]
MC_vertical<-(liminf_vertical+limsup_vertical)/2

# TABLA PROFUNDIDAD
ni_vertical<-c()

for(i in 1:k_vertical) {
  if(1==15)
    ni_vertical[i]<- length(subset(prof_vertical, prof_vertical>=liminf_vertical[i] & prof_vertical<=limsup_vertical[i]))
  else
    ni_vertical[i]<- length(subset(prof_vertical, prof_vertical>=liminf_vertical[i]& prof_vertical<limsup_vertical[i]))
  
}

hi_vertical<-(ni_vertical/length(prof_vertical))*100
Niasc_vertical<-cumsum(ni_vertical)
Hiasc_vertical<-cumsum(hi_vertical)
Nidsc_vertical<-rev(cumsum(rev(ni_vertical)))
Hidsc_vertical<-rev(cumsum(rev(hi_vertical)))
Tabla_vertical<-data.frame(liminf_vertical,
                           limsup_vertical,
                           MC_vertical,
                           ni_vertical,
                           round(hi_vertical,2),
                           Niasc_vertical,
                           round(Hiasc_vertical,2),
                           Nidsc_vertical,
                           round(Hidsc_vertical,2))
Tabla_vertical
##    liminf_vertical limsup_vertical MC_vertical ni_vertical
## 1                0             100          50        1089
## 2              100             200         150        6512
## 3              200             300         250        5642
## 4              300             400         350        2939
## 5              400             500         450        2558
## 6              500             600         550        1703
## 7              600             700         650        1528
## 8              700             800         750         899
## 9              800             900         850         563
## 10             900            1000         950         242
## 11            1000            1100        1050         248
## 12            1100            1200        1150         254
## 13            1200            1300        1250         145
## 14            1300            1400        1350          26
## 15            1400            1500        1450          11
##    round.hi_vertical..2. Niasc_vertical round.Hiasc_vertical..2. Nidsc_vertical
## 1                   4.47           1089                     4.47          24359
## 2                  26.73           7601                    31.20          23270
## 3                  23.16          13243                    54.35          16758
## 4                  12.06          16182                    66.41          11116
## 5                  10.50          18740                    76.91           8177
## 6                   6.99          20443                    83.90           5619
## 7                   6.27          21971                    90.17           3916
## 8                   3.69          22870                    93.86           2388
## 9                   2.31          23433                    96.17           1489
## 10                  0.99          23675                    97.17            926
## 11                  1.02          23923                    98.19            684
## 12                  1.04          24177                    99.23            436
## 13                  0.60          24322                    99.82            182
## 14                  0.11          24348                    99.93             37
## 15                  0.05          24359                    99.98             11
##    round.Hidsc_vertical..2.
## 1                     99.98
## 2                     95.51
## 3                     68.78
## 4                     45.62
## 5                     33.56
## 6                     23.06
## 7                     16.07
## 8                      9.80
## 9                      6.11
## 10                     3.80
## 11                     2.81
## 12                     1.79
## 13                     0.75
## 14                     0.15
## 15                     0.05
colnames(Tabla_vertical)<-c("Xi-1","Xi+1","Xi (MC)","ni","hi","Ni ↓","Hi ↓","Ni ↑","Hi ↑")

# OJIVAS CONTINUAS PROFUNDIDAD VERTICAL
plot(limsup_vertical, Niasc_vertical, col="blue", type="b",
     main="Gráfica No.3: Distribución de Profundidad Vertical en el Pozo",
     ylab = "Cantidad",
     xlab = "Profundidad Vertical (m)")
lines(liminf_vertical, Nidsc_vertical, col="red", type="b")

# OJIVAS CONTINUAS PORCENTAJE PROFUNDIDAD ALCANZADA
plot(limsup_vertical, Hiasc_vertical, col="blue", type="b",
     main="Gráfica No.4: Distribución de Profundidad Vertical en el Pozo",
     ylab = "Porcentaje",
     xlab = "Profundidad Vertical (m)")
lines(liminf_vertical, Hidsc_vertical, col="red", type="b")

# GDF CAJA Y BIGOTES
boxplot(prof_vertical,
        horizontal=T, 
        col="darkgreen",
        xlab= "Profundidad Vertical (m)",
        main="Gráfica No. 5: 
        Distribución de Profundidad Vertical en el Pozo")

# Conclusion

conclusion <- "El comportamiento de la verticalidad fluctúan entre [1.37, 1828.8] y los valores se encuentran entorno a 301.75, con una desviación estándar de 249.0132 siendo un conjunto de valores heterogéneos donde los valores se agrupan en la parte izquierda de la variable y tiene un sesgo positivo con existencia de valores atípicos a partir de 1000."