title: “ANÁLISIS DE POZOS DE HIDROCARBUROS EN EL ESTADO DE NUEVA YORK” author: “GRUPO 2” date: “2025-05-30” output: html_document

Carga los datos (Conjunto de datos)

library(PASWR)
## Loading required package: lattice
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readr)
setwd("/cloud/project")
read_csv("point_oil-gas-other-regulated-wells-beginning-1860.csv")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
##   dat <- vroom(...)
##   problems(dat)
## Rows: 42045 Columns: 52
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr  (38): Well Name, Company Name, Well Type, Map Symbol, Well Status, Stat...
## dbl  (12): API Well Number, County Code, API Hole Number, Sidetrack, Complet...
## lgl   (1): Financial Security
## dttm  (1): Date Last Modified
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## # A tibble: 42,045 × 52
##    `API Well Number` `County Code` `API Hole Number` Sidetrack Completion
##                <dbl>         <dbl>             <dbl>     <dbl>      <dbl>
##  1           3.10e13             1              1072         0          0
##  2           3.10e13             1              1073         0          0
##  3           3.10e13             1             21007         0          0
##  4           3.10e13             1             21008         0          0
##  5           3.10e13             1             21009         0          0
##  6           3.10e13             1             21010         0          0
##  7           3.10e13             1             21011         0          0
##  8           3.10e13             1             21014         0          0
##  9           3.10e13             1             21015         0          0
## 10           3.10e13             1             21016         0          0
## # ℹ 42,035 more rows
## # ℹ 47 more variables: `Well Name` <chr>, `Company Name` <chr>,
## #   `Operator Number` <dbl>, `Well Type` <chr>, `Map Symbol` <chr>,
## #   `Well Status` <chr>, `Status Date` <chr>, `Permit Application Date` <chr>,
## #   `Permit Issued Date` <chr>, `Date Spudded` <chr>,
## #   `Date of Total Depth` <chr>, `Date Well Completed` <chr>,
## #   `Date Well Plugged` <chr>, `Date Well Confidentiality Ends` <chr>, …
datos2<- read.csv("point_oil-gas-other-regulated-wells-beginning-1860.csv", header = T, sep = ",", dec = ".",na.strings = "-")

Extraer variable

Orientacion_Pozo<-datos2$Slant

EDA VARIABLE NOMINAL

TDF_Orientacion_Pozo<-table(Orientacion_Pozo)
TDF_Orientacion_Pozo
## Orientacion_Pozo
## Directional  Horizontal    Vertical 
##         248         485       41289

TABLA

Tabla_Orientacion_Pozo<-as.data.frame(TDF_Orientacion_Pozo)
Tabla_Orientacion_Pozo
##   Orientacion_Pozo  Freq
## 1      Directional   248
## 2       Horizontal   485
## 3         Vertical 41289

no es necesario la agrupación, vamos directo a las gráficas Gráfica No.1 GDF, Diagrama de barras local

graf1<-barplot(TDF_Orientacion_Pozo,main="Gráfica No.2.1: Distribución de frecuencia de la Orientación 
        de cada uno de los pozos de hidrocarburos en el estado de Nueva York",
               col="brown",xlab = "Orientación de pozo",ylab = "Cantidad")

graf1
##      [,1]
## [1,]  0.7
## [2,]  1.9
## [3,]  3.1

Gráfica No.2 DIAGRAMA DE BARRAS GLOBAL

graf2<-barplot(TDF_Orientacion_Pozo,main="Gráfica No.2.2: Distribución de frecuencia  de la Orientación 
        de cada uno de los pozos de hidrocarburos en el estado de Nueva York",
               col="brown",xlab = "Orientación de pozo",ylab = "Cantidad",ylim = c(0,length(Orientacion_Pozo)))

graf2
##      [,1]
## [1,]  0.7
## [2,]  1.9
## [3,]  3.1

Gráfica No.3 DIAGRAMA CIRCULAR

frecuencia <- Tabla_Orientacion_Pozo$Freq
porcentaje <- round(frecuencia / sum(frecuencia) * 100, 2)

etiquetas <- paste(Tabla_Orientacion_Pozo$Orientacion_Pozo, ": ", porcentaje, "%", sep = "")

pie(frecuencia,
    labels = NA,
    clockwise = TRUE,
    main = "Gráfica No.2.3: Distribución porcentual de la orientación\nde los pozos de hidrocarburos en el estado de Nueva York",
    col = rainbow(length(frecuencia)))
legend("bottomright",
       legend = etiquetas,
       fill = rainbow(length(frecuencia)),
       title = "Orientación",
       cex = 0.75,    
       pt.cex = 1.2)  

CONCLUSIONES La variable “Orientación” de los pozos hidrocarburíferos en el estado de Nueva York es de tipo nominal. El valor más frecuente es “Vertical”, presente en el 98.26% de los casos, lo que indica una fuerte preferencia por este tipo de perforación en la región.