setwd("~/UNI/ESTADISTICA")   # ajusta si es necesario
datos <- read.csv("Depositos_Sulfuro.csv",
                  header = TRUE,
                  sep = ";",
                  dec = ".")

# Extraer variables numéricas
oro <- as.numeric(datos$augrd)
plata <-as.numeric(datos$aggrd)

TPV <- data.frame( plata,oro)

#TABLA DE PARES DE VALORES
TPV <- na.omit(TPV)
TPV <- TPV[TPV$oro > 0 & TPV$plata > 0, ]

plot(TPV$plata,TPV$oro,
     pch = 16,
     col = "blue",
     main = "Grafica N° 1 :  Diagrama de dispersión entre el oro y plata
     de los depositos de sulfuros masivos volcanicos",
     xlab = "plata",
     ylab = "oro")

Q1_oro  <- quantile(TPV$oro, 0.25)
Q3_oro  <- quantile(TPV$oro, 0.75)
IQR_oro <- Q3_oro- Q1_oro

lim_inf_oro <- Q1_oro - 1.5 * IQR_oro
lim_sup_oro <- Q3_oro + 1.5 * IQR_oro


Q1_plata  <- quantile(TPV$plata, 0.25)
Q3_plata  <- quantile(TPV$plata, 0.75)
IQR_plata <- Q3_plata - Q1_plata

lim_inf_plata <- Q1_plata- 1.5 * IQR_plata
lim_sup_plata <- Q3_plata + 1.5 * IQR_plata


#TABLA SIN OUTLIERS

TPV_limpio <- TPV[
  TPV$oro  >= lim_inf_oro  & TPV$oro <= lim_sup_oro &
    TPV$plata >= lim_inf_plata & TPV$plata <= lim_sup_plata,
]

summary(TPV_limpio)
##      plata            oro        
##  Min.   :  1.0   Min.   :  1.00  
##  1st Qu.: 27.0   1st Qu.:  5.00  
##  Median : 63.5   Median : 17.00  
##  Mean   :123.7   Mean   : 31.32  
##  3rd Qu.:171.0   3rd Qu.: 48.00  
##  Max.   :638.0   Max.   :145.00
#Diagrama de Dispersión

plot(TPV_limpio$plata,TPV_limpio$oro,
     pch = 16,
     col = "blue",
     main = "Grafica N° :  Diagrama de dispersión entre el oro y el cobre
     de los depositos de sulfuros masivos volcanicos",
     xlab = "plata",
     ylab = "oro",
     ylim = c(0,1000),
     xlim = c(0,700))

x<-TPV_limpio$plata
y<-TPV_limpio$oro

regresion_l <- lm(y~x)
regresion_l
## 
## Call:
## lm(formula = y ~ x)
## 
## Coefficients:
## (Intercept)            x  
##    21.76539      0.07724
abline(regresion_l)

cor(x,y)*100
## [1] 31.07977
#Corresponder para una x una sola y

tabla_sup <- aggregate(oro~ plata,
                       data = TPV_limpio,
                       FUN = max)

tabla_media <- aggregate(oro~ plata,
                         data = TPV_limpio,
                         FUN = mean)

tabla_inf <- aggregate(oro~ plata,
                       data = TPV_limpio,
                       FUN = min)

#Diagramas de dispersión
plot(tabla_inf $plata,
     tabla_inf $oro,
     pch = 16,
     col = "blue",
     main = "Grafica N° : Diagrama de dispersión entre el oro y el cobre
     de los depositos de sulfuros masivos volcanicos",
     xlab = "plata",
     ylab = "oro",
     ylim = c(0,1000),
     xlim = c(0,500))

plot(tabla_media $plata,
     tabla_media $oro,
     pch = 16,
     col = "blue",
     main = "Grafica N° :  Diagrama de dispersión entre el oro y el cobre
     de los depositos de sulfuros masivos volcanicos",
     xlab = "oro",
     ylab = "plata",
     ylim = c(0,1000),
     xlim = c(0,500))

plot(tabla_sup $plata,
     tabla_sup $oro,
     pch = 16,
     col = "blue",
     main = "Grafica N° : Diagrama de dispersión entre el oro y el cobre
     de los depositos de sulfuros masivos volcanicoss",
     xlab = "plata ",
     ylab = "oro",
     ylim = c(0,1000),
     xlim = c(0,500))

#CONJETURAR MODELO

plot(tabla_inf $plata,
     tabla_inf $oro,
     pch = 16,
     col = "blue",
     main = "Grafica N° : Comparación de la realidad con el modelo lineal
     entre el contido de oro y plata de los depositos masivos de sulfuros 
     volcánicos",
     xlab = "plata",
     ylab = "oro",
     ylim = c(0,1000),
     xlim = c(0,500))



x<-tabla_inf$plata
y<-tabla_inf$oro

modelo_lineal <- lm(y ~ x)

modelo_lineal
## 
## Call:
## lm(formula = y ~ x)
## 
## Coefficients:
## (Intercept)            x  
##     7.93685      0.09782
abline(modelo_lineal)

r<-cor(x,y)
r*100
## [1] 47.61489