CARGA DE DATOS Y LIBRERÍAS

CARGA DE DATOS

#cargar datos
datos <- read.csv("C:\\Users\\joeja\\Desktop\\Proyecto Estadística\\datos_depurados.csv", 
                  header = TRUE, 
                  sep = ",", 
                  dec = ".")

CARGA DE LIBRERIAS

# cargar librerías
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(knitr)
library(gt)

TABLA DE PARES DE VALORES

#Extraer variables numéricas
tonelaje  <- as.numeric(datos$oreton)
cobre <- as.numeric(datos$cugrd)

#Taba de pares de valores
TPV <- data.frame(
  tonelaje  = as.numeric(tonelaje),
  cobre = as.numeric(cobre)
)

TPV <- na.omit(TPV) #OMITIR NA
TPV <- TPV[TPV$tonelaje > 0 & TPV$cobre > 0, ] #OMITIR VALORES NEGATIVOS Y CEROS

# OUTLIERS EN TONELAJE

Q1_tonelaje  <- quantile(TPV$tonelaje, 0.25)
Q3_tonelaje  <- quantile(TPV$tonelaje, 0.75)
IQR_tonelaje <- Q3_tonelaje - Q1_tonelaje

lim_inf_tonelaje <- Q1_tonelaje - 1.5 * IQR_tonelaje
lim_sup_tonelaje <- Q3_tonelaje + 1.5 * IQR_tonelaje

# OUTLIERS EN COBRE
Q1_cobre  <- quantile(TPV$cobre, 0.25)
Q3_cobre  <- quantile(TPV$cobre, 0.75)
IQR_cobre <- Q3_cobre - Q1_cobre

lim_inf_cobre <- Q1_cobre - 1.5 * IQR_cobre
lim_sup_cobre <- Q3_cobre + 1.5 * IQR_cobre

# FILTRO CONJUNTO (X e Y)
TPV_limpio <- TPV[
  TPV$tonelaje  >= lim_inf_tonelaje  & TPV$tonelaje  <= lim_sup_tonelaje &
    TPV$cobre >= lim_inf_cobre & TPV$cobre <= lim_sup_cobre,
]

dim(TPV_limpio)   # pares finales
## [1] 230   2
summary(TPV_limpio)
##     tonelaje          cobre       
##  Min.   : 33.72   Min.   :0.3060  
##  1st Qu.: 71.66   1st Qu.:0.8125  
##  Median : 84.58   Median :1.1465  
##  Mean   : 85.03   Mean   :1.3294  
##  3rd Qu.: 98.57   3rd Qu.:1.7512  
##  Max.   :129.44   Max.   :3.2090
#LIMITE MEDIO
tabla_media <- aggregate(tonelaje ~ cobre,
                         data = TPV_limpio,
                         FUN = mean)
tabla_media
##     cobre tonelaje
## 1   0.306  33.7190
## 2   0.368  62.1770
## 3   0.372  42.4480
## 4   0.388  47.6940
## 5   0.393  43.7935
## 6   0.401  45.8370
## 7   0.416  35.7670
## 8   0.438  50.1810
## 9   0.482  56.4870
## 10  0.485  45.6500
## 11  0.505  63.2080
## 12  0.509  62.7140
## 13  0.524  56.5930
## 14  0.530  55.2090
## 15  0.531  57.2920
## 16  0.539  59.4260
## 17  0.548  65.2880
## 18  0.560  68.2840
## 19  0.564  63.3990
## 20  0.570  66.4460
## 21  0.590  58.7390
## 22  0.597  59.5120
## 23  0.604  63.3690
## 24  0.613  69.9085
## 25  0.616  60.7250
## 26  0.619  69.3930
## 27  0.626  65.1620
## 28  0.632  64.2820
## 29  0.638  67.3660
## 30  0.642  63.3810
## 31  0.646  72.7920
## 32  0.671  57.5370
## 33  0.672  71.5580
## 34  0.684  67.3170
## 35  0.689  70.1200
## 36  0.700  60.9670
## 37  0.705  70.3050
## 38  0.706  55.6060
## 39  0.712  59.7110
## 40  0.713  67.1760
## 41  0.716  70.7610
## 42  0.728  58.8150
## 43  0.732  71.6500
## 44  0.754  66.7200
## 45  0.756  61.2730
## 46  0.761  70.2370
## 47  0.764  74.2240
## 48  0.778  71.0850
## 49  0.779  75.6315
## 50  0.782  67.9290
## 51  0.783  73.0230
## 52  0.800  71.6930
## 53  0.811  72.4660
## 54  0.812  68.7250
## 55  0.814  72.6610
## 56  0.824  76.2260
## 57  0.828  75.2080
## 58  0.829  75.1330
## 59  0.839  77.9750
## 60  0.844  71.5660
## 61  0.847  76.0630
## 62  0.854  82.8960
## 63  0.863  75.8025
## 64  0.866  81.9310
## 65  0.869  71.4950
## 66  0.873  75.8840
## 67  0.876  81.2900
## 68  0.884  73.9550
## 69  0.903  65.4440
## 70  0.906  82.2080
## 71  0.909  80.4340
## 72  0.916  86.7200
## 73  0.917  74.2265
## 74  0.922  70.6630
## 75  0.926  72.6510
## 76  0.942  80.0800
## 77  0.946  75.5930
## 78  0.949  74.1970
## 79  0.955  71.4030
## 80  0.958  85.2740
## 81  0.966  88.7000
## 82  0.969  77.0110
## 83  0.977  85.5570
## 84  0.984  82.6160
## 85  1.005  76.9770
## 86  1.009  72.4590
## 87  1.010  77.1870
## 88  1.014  86.4470
## 89  1.025  80.6310
## 90  1.033  82.1640
## 91  1.036  74.6910
## 92  1.040  89.3370
## 93  1.048  75.3560
## 94  1.049  97.5220
## 95  1.056  69.7560
## 96  1.060  81.4290
## 97  1.067  78.6540
## 98  1.068  75.8840
## 99  1.076  76.4800
## 100 1.090  80.2390
## 101 1.101  88.6950
## 102 1.105  84.0575
## 103 1.107  91.3610
## 104 1.109  84.7090
## 105 1.131  95.7660
## 106 1.134  83.9550
## 107 1.138  92.6170
## 108 1.155  88.4150
## 109 1.178  94.2320
## 110 1.195  81.2290
## 111 1.197  91.6650
## 112 1.207  86.9000
## 113 1.209  89.2360
## 114 1.214  86.0380
## 115 1.221  82.2940
## 116 1.235  90.0500
## 117 1.240  88.6450
## 118 1.245 100.5480
## 119 1.260 102.4900
## 120 1.277  87.2970
## 121 1.283  71.1140
## 122 1.290  86.1470
## 123 1.296  87.1165
## 124 1.326  99.3510
## 125 1.331  85.6910
## 126 1.343  86.0540
## 127 1.352  75.6250
## 128 1.364  79.8240
## 129 1.369  85.3460
## 130 1.373  89.1400
## 131 1.379  86.9540
## 132 1.385  90.1560
## 133 1.396  82.8690
## 134 1.419  78.2370
## 135 1.420  87.1660
## 136 1.427  82.0470
## 137 1.429  76.4680
## 138 1.449  92.8080
## 139 1.463  89.4940
## 140 1.474 106.4640
## 141 1.477  82.9990
## 142 1.488  91.5040
## 143 1.498 106.2020
## 144 1.514  79.5040
## 145 1.517  98.5950
## 146 1.541  89.7290
## 147 1.560  90.4770
## 148 1.570  86.8390
## 149 1.571 100.3510
## 150 1.574 111.5290
## 151 1.613  95.1470
## 152 1.616  89.6410
## 153 1.631  83.1970
## 154 1.638 106.7480
## 155 1.647 101.4080
## 156 1.673  95.7310
## 157 1.675  86.8510
## 158 1.676 100.5790
## 159 1.707  99.3570
## 160 1.728  98.1915
## 161 1.734  94.3750
## 162 1.746  92.3270
## 163 1.753 103.0090
## 164 1.756 115.1740
## 165 1.762 100.6610
## 166 1.782  95.5910
## 167 1.798  84.4610
## 168 1.801 108.5500
## 169 1.827  98.4930
## 170 1.840  91.6090
## 171 1.841  96.6820
## 172 1.879 100.7350
## 173 1.902 107.2200
## 174 1.923  96.2070
## 175 1.928 107.4570
## 176 1.938 103.5020
## 177 1.945 109.0940
## 178 1.948 116.3620
## 179 1.966 103.1270
## 180 1.995 106.7880
## 181 2.007 108.5780
## 182 2.009  99.6260
## 183 2.025  89.5310
## 184 2.051 108.0300
## 185 2.061 109.3470
## 186 2.065  91.6110
## 187 2.100 112.6990
## 188 2.102 108.5380
## 189 2.160 115.6870
## 190 2.171  98.1620
## 191 2.181 106.4570
## 192 2.196 120.8630
## 193 2.297 114.4770
## 194 2.350 127.5360
## 195 2.392  89.3820
## 196 2.397  94.5690
## 197 2.410 113.1545
## 198 2.434 122.7030
## 199 2.461 104.1140
## 200 2.497 119.2460
## 201 2.501 107.7850
## 202 2.513 109.2560
## 203 2.575 102.2180
## 204 2.598  95.7690
## 205 2.601 108.4730
## 206 2.602 101.0790
## 207 2.612 101.4730
## 208 2.696 124.9190
## 209 2.783 113.3420
## 210 2.819 126.8550
## 211 2.835  97.5220
## 212 2.876 119.8880
## 213 2.911 129.4430
## 214 2.986 123.0350
## 215 3.044 109.4010
## 216 3.097 123.6430
## 217 3.152 118.9880
## 218 3.209 120.2180

DIAGRAMA DE DISPERSION

y <- tabla_media$tonelaje
x <- tabla_media$cobre

plot(x, y,
     pch = 16,
     col = "blue",
     main = "Gráfica N°1: Diagrama de dispersión entre el Tonelaje y 
     la cantidad de cobre en los Depósitos de Masivos de Sulfuros 
     Volcánicos",
     xlab = "Cobre(%)",
     ylab = "Tonelaje (Ton)")

CONJETURA DEL MODELO

Debido a la similitud de la nube de puntos conjeturamos a un modelo logarítmico

#Extraer variables
y <- tabla_media$tonelaje #Variable dependiente
x <- tabla_media$cobre #variable independiente

x1 <- log(x)

#Cálculo de parámetros
regresion_logaritmico<- lm(y~x1)
regresion_logaritmico  
## 
## Call:
## lm(formula = y ~ x1)
## 
## Coefficients:
## (Intercept)           x1  
##       79.67        33.73
a <- regresion_logaritmico$coefficients[1]
b <- regresion_logaritmico$coefficients[2]

#AGREGAR LA CURVA
plot(x, y,
     pch = 16,
     col = "blue",
     main = "Gráfica N°2: Comparación de la realidad con el modelo logarítmico
     entre el tonelaje y el contenido de cobre de los Depósitos Masivos de Sulfuros
     Volcánicos",
     xlab = "Cobre (%)",
     ylab = "Tonelaje (Ton)")

curve(a + b*log(x),
      from = min(x),
      to   = max(x),
      add  = TRUE,
      col  = "red",
      lwd  = 2)

plot(1, type = "n", axes = FALSE, xlab = "", ylab = "")

eq <- paste0(
  "Ecuación logarítmica\n",
  "Y = a + b log(x)\n",
  "Y = ", round(a, 2), " + ", round(b, 2), " log(x)"
)

text(1, 1, labels = eq, cex = 1.7, col = "blue", font = 2)

TEST DE APROBACIONES Y RESTRICCIONES

#TEST DE PEARSON
r<-cor(x1,y)
r*100
## [1] 92.02879

APRUEBA EL TEST PEARSON

RESTRICCIONES

y = a + b*log(2)

Sí existe restricción, ya que el cobre en porcentaje debe tomar únicamente valores positivos para que el modelo logarítmico sea válido. Al reemplazar valores de cobre fuera del rango observado en los datos, el modelo puede predecir tonelajes irreales, por lo que su aplicación se limita estrictamente al dominio de la variable independiente analizada.

CÁLCULO DE PRONÓSTICOS

¿Cuál sería el tonelaje esperado de un depósito masivo de sulfuros volcánicos si el contenido de cobre es del 2 %?

#CÁLCULO
C_esp <- a + b*log(2)
C_esp
## (Intercept) 
##    103.0492
plot(1, type = "n", axes = FALSE, xlab = "", ylab = "") # Crear un gráfico vacío
text(x = 1, y = 1,
     labels = "¿Cuál sería el tonelaje esperado de 
     un depósito masivo de sulfuros volcánicos si 
     el contenido de cobre es del 2 %?
     \n R= 103.0492 toneladas",
     cex = 2,
     col = "blue",
     font = 6)

CONCLUSIÓN

Entre el contenido de cobre y el tonelaje de los depósitos masivos de sulfuros volcánicos existe una relación de tipo logarítmica, representada por el modelo f(x)=79.7+33.7ln(x), donde “x” corresponde al contenido de cobre (%) y “y” al tonelaje. Si bien el modelo describe adecuadamente la tendencia general de los datos, presenta restricciones ya que el modelo solo es válido para valores de (x>0)

Ejemplo: Cuando el contenido de cobre es del 2 %, el modelo logarítmico predice un tonelaje aproximado de 103.05 toneladas.