title: “ANÁLISIS DE POZOS DE HIDROCARBUROS EN EL ESTADO DE NUEVA YORK” author: “GRUPO 2” date: “2025-05-30” output: html_document
Carga los datos (Conjunto de datos)
library(PASWR)
## Loading required package: lattice
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(readr)
setwd("/cloud/project")
read_csv("point_oil-gas-other-regulated-wells-beginning-1860.csv")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
## dat <- vroom(...)
## problems(dat)
## Rows: 42045 Columns: 52
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (38): Well Name, Company Name, Well Type, Map Symbol, Well Status, Stat...
## dbl (12): API Well Number, County Code, API Hole Number, Sidetrack, Complet...
## lgl (1): Financial Security
## dttm (1): Date Last Modified
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## # A tibble: 42,045 × 52
## `API Well Number` `County Code` `API Hole Number` Sidetrack Completion
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 3.10e13 1 1072 0 0
## 2 3.10e13 1 1073 0 0
## 3 3.10e13 1 21007 0 0
## 4 3.10e13 1 21008 0 0
## 5 3.10e13 1 21009 0 0
## 6 3.10e13 1 21010 0 0
## 7 3.10e13 1 21011 0 0
## 8 3.10e13 1 21014 0 0
## 9 3.10e13 1 21015 0 0
## 10 3.10e13 1 21016 0 0
## # ℹ 42,035 more rows
## # ℹ 47 more variables: `Well Name` <chr>, `Company Name` <chr>,
## # `Operator Number` <dbl>, `Well Type` <chr>, `Map Symbol` <chr>,
## # `Well Status` <chr>, `Status Date` <chr>, `Permit Application Date` <chr>,
## # `Permit Issued Date` <chr>, `Date Spudded` <chr>,
## # `Date of Total Depth` <chr>, `Date Well Completed` <chr>,
## # `Date Well Plugged` <chr>, `Date Well Confidentiality Ends` <chr>, …
datos2<- read.csv("point_oil-gas-other-regulated-wells-beginning-1860.csv", header = T, sep = ",", dec = ".",na.strings = "-")
Extraer variable
Orientacion_Pozo<-datos2$Slant
EDA VARIABLE NOMINAL
TDF_Orientacion_Pozo<-table(Orientacion_Pozo)
TDF_Orientacion_Pozo
## Orientacion_Pozo
## Directional Horizontal Vertical
## 248 485 41289
TABLA
Tabla_Orientacion_Pozo<-as.data.frame(TDF_Orientacion_Pozo)
Tabla_Orientacion_Pozo
## Orientacion_Pozo Freq
## 1 Directional 248
## 2 Horizontal 485
## 3 Vertical 41289
no es necesario la agrupación, vamos directo a las gráficas Gráfica No.1 GDF, Diagrama de barras local
graf1<-barplot(TDF_Orientacion_Pozo,main="Gráfica No.2.1: Distribución de frecuencia de la Orientación
de cada uno de los pozos de hidrocarburos en el estado de Nueva York",
col="brown",xlab = "Orientación de pozo",ylab = "Cantidad")
graf1
## [,1]
## [1,] 0.7
## [2,] 1.9
## [3,] 3.1
Gráfica No.2 DIAGRAMA DE BARRAS GLOBAL
graf2<-barplot(TDF_Orientacion_Pozo,main="Gráfica No.2.2: Distribución de frecuencia de la Orientación
de cada uno de los pozos de hidrocarburos en el estado de Nueva York",
col="brown",xlab = "Orientación de pozo",ylab = "Cantidad",ylim = c(0,length(Orientacion_Pozo)))
graf2
## [,1]
## [1,] 0.7
## [2,] 1.9
## [3,] 3.1
Gráfica No.3 DIAGRAMA CIRCULAR
frecuencia <- Tabla_Orientacion_Pozo$Freq
porcentaje <- round(frecuencia / sum(frecuencia) * 100, 2)
etiquetas <- paste(Tabla_Orientacion_Pozo$Orientacion_Pozo, ": ", porcentaje, "%", sep = "")
pie(frecuencia,
labels = NA,
clockwise = TRUE,
main = "Gráfica No.2.3: Distribución porcentual de la orientación\nde los pozos de hidrocarburos en el estado de Nueva York",
col = rainbow(length(frecuencia)))
legend("bottomright",
legend = etiquetas,
fill = rainbow(length(frecuencia)),
title = "Orientación",
cex = 0.75,
pt.cex = 1.2)
CONCLUSIONES La variable “Orientación” de los pozos hidrocarburíferos en el estado de Nueva York es de tipo nominal. El valor más frecuente es “Vertical”, presente en el 98.26% de los casos, lo que indica una fuerte preferencia por este tipo de perforación en la región.