CARGA DE DATOS
#cargar datos
datos <- read.csv("C:\\Users\\joeja\\Desktop\\Proyecto Estadística\\datos_depurados.csv",
header = TRUE,
sep = ",",
dec = ".")
CARGA DE LIBRERIAS
# cargar librerías
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
library(gt)
#Extraer variables numéricas
tonelaje <- as.numeric(datos$oreton)
cobre <- as.numeric(datos$cugrd)
#Taba de pares de valores
TPV <- data.frame(
tonelaje = as.numeric(tonelaje),
cobre = as.numeric(cobre)
)
TPV <- na.omit(TPV) #OMITIR NA
TPV <- TPV[TPV$tonelaje > 0 & TPV$cobre > 0, ] #OMITIR VALORES NEGATIVOS Y CEROS
# OUTLIERS EN TONELAJE
Q1_tonelaje <- quantile(TPV$tonelaje, 0.25)
Q3_tonelaje <- quantile(TPV$tonelaje, 0.75)
IQR_tonelaje <- Q3_tonelaje - Q1_tonelaje
lim_inf_tonelaje <- Q1_tonelaje - 1.5 * IQR_tonelaje
lim_sup_tonelaje <- Q3_tonelaje + 1.5 * IQR_tonelaje
# OUTLIERS EN COBRE
Q1_cobre <- quantile(TPV$cobre, 0.25)
Q3_cobre <- quantile(TPV$cobre, 0.75)
IQR_cobre <- Q3_cobre - Q1_cobre
lim_inf_cobre <- Q1_cobre - 1.5 * IQR_cobre
lim_sup_cobre <- Q3_cobre + 1.5 * IQR_cobre
# FILTRO CONJUNTO (X e Y)
TPV_limpio <- TPV[
TPV$tonelaje >= lim_inf_tonelaje & TPV$tonelaje <= lim_sup_tonelaje &
TPV$cobre >= lim_inf_cobre & TPV$cobre <= lim_sup_cobre,
]
dim(TPV_limpio) # pares finales
## [1] 230 2
summary(TPV_limpio)
## tonelaje cobre
## Min. : 33.72 Min. :0.3060
## 1st Qu.: 71.66 1st Qu.:0.8125
## Median : 84.58 Median :1.1465
## Mean : 85.03 Mean :1.3294
## 3rd Qu.: 98.57 3rd Qu.:1.7512
## Max. :129.44 Max. :3.2090
#LIMITE MEDIO
tabla_media <- aggregate(tonelaje ~ cobre,
data = TPV_limpio,
FUN = mean)
tabla_media
## cobre tonelaje
## 1 0.306 33.7190
## 2 0.368 62.1770
## 3 0.372 42.4480
## 4 0.388 47.6940
## 5 0.393 43.7935
## 6 0.401 45.8370
## 7 0.416 35.7670
## 8 0.438 50.1810
## 9 0.482 56.4870
## 10 0.485 45.6500
## 11 0.505 63.2080
## 12 0.509 62.7140
## 13 0.524 56.5930
## 14 0.530 55.2090
## 15 0.531 57.2920
## 16 0.539 59.4260
## 17 0.548 65.2880
## 18 0.560 68.2840
## 19 0.564 63.3990
## 20 0.570 66.4460
## 21 0.590 58.7390
## 22 0.597 59.5120
## 23 0.604 63.3690
## 24 0.613 69.9085
## 25 0.616 60.7250
## 26 0.619 69.3930
## 27 0.626 65.1620
## 28 0.632 64.2820
## 29 0.638 67.3660
## 30 0.642 63.3810
## 31 0.646 72.7920
## 32 0.671 57.5370
## 33 0.672 71.5580
## 34 0.684 67.3170
## 35 0.689 70.1200
## 36 0.700 60.9670
## 37 0.705 70.3050
## 38 0.706 55.6060
## 39 0.712 59.7110
## 40 0.713 67.1760
## 41 0.716 70.7610
## 42 0.728 58.8150
## 43 0.732 71.6500
## 44 0.754 66.7200
## 45 0.756 61.2730
## 46 0.761 70.2370
## 47 0.764 74.2240
## 48 0.778 71.0850
## 49 0.779 75.6315
## 50 0.782 67.9290
## 51 0.783 73.0230
## 52 0.800 71.6930
## 53 0.811 72.4660
## 54 0.812 68.7250
## 55 0.814 72.6610
## 56 0.824 76.2260
## 57 0.828 75.2080
## 58 0.829 75.1330
## 59 0.839 77.9750
## 60 0.844 71.5660
## 61 0.847 76.0630
## 62 0.854 82.8960
## 63 0.863 75.8025
## 64 0.866 81.9310
## 65 0.869 71.4950
## 66 0.873 75.8840
## 67 0.876 81.2900
## 68 0.884 73.9550
## 69 0.903 65.4440
## 70 0.906 82.2080
## 71 0.909 80.4340
## 72 0.916 86.7200
## 73 0.917 74.2265
## 74 0.922 70.6630
## 75 0.926 72.6510
## 76 0.942 80.0800
## 77 0.946 75.5930
## 78 0.949 74.1970
## 79 0.955 71.4030
## 80 0.958 85.2740
## 81 0.966 88.7000
## 82 0.969 77.0110
## 83 0.977 85.5570
## 84 0.984 82.6160
## 85 1.005 76.9770
## 86 1.009 72.4590
## 87 1.010 77.1870
## 88 1.014 86.4470
## 89 1.025 80.6310
## 90 1.033 82.1640
## 91 1.036 74.6910
## 92 1.040 89.3370
## 93 1.048 75.3560
## 94 1.049 97.5220
## 95 1.056 69.7560
## 96 1.060 81.4290
## 97 1.067 78.6540
## 98 1.068 75.8840
## 99 1.076 76.4800
## 100 1.090 80.2390
## 101 1.101 88.6950
## 102 1.105 84.0575
## 103 1.107 91.3610
## 104 1.109 84.7090
## 105 1.131 95.7660
## 106 1.134 83.9550
## 107 1.138 92.6170
## 108 1.155 88.4150
## 109 1.178 94.2320
## 110 1.195 81.2290
## 111 1.197 91.6650
## 112 1.207 86.9000
## 113 1.209 89.2360
## 114 1.214 86.0380
## 115 1.221 82.2940
## 116 1.235 90.0500
## 117 1.240 88.6450
## 118 1.245 100.5480
## 119 1.260 102.4900
## 120 1.277 87.2970
## 121 1.283 71.1140
## 122 1.290 86.1470
## 123 1.296 87.1165
## 124 1.326 99.3510
## 125 1.331 85.6910
## 126 1.343 86.0540
## 127 1.352 75.6250
## 128 1.364 79.8240
## 129 1.369 85.3460
## 130 1.373 89.1400
## 131 1.379 86.9540
## 132 1.385 90.1560
## 133 1.396 82.8690
## 134 1.419 78.2370
## 135 1.420 87.1660
## 136 1.427 82.0470
## 137 1.429 76.4680
## 138 1.449 92.8080
## 139 1.463 89.4940
## 140 1.474 106.4640
## 141 1.477 82.9990
## 142 1.488 91.5040
## 143 1.498 106.2020
## 144 1.514 79.5040
## 145 1.517 98.5950
## 146 1.541 89.7290
## 147 1.560 90.4770
## 148 1.570 86.8390
## 149 1.571 100.3510
## 150 1.574 111.5290
## 151 1.613 95.1470
## 152 1.616 89.6410
## 153 1.631 83.1970
## 154 1.638 106.7480
## 155 1.647 101.4080
## 156 1.673 95.7310
## 157 1.675 86.8510
## 158 1.676 100.5790
## 159 1.707 99.3570
## 160 1.728 98.1915
## 161 1.734 94.3750
## 162 1.746 92.3270
## 163 1.753 103.0090
## 164 1.756 115.1740
## 165 1.762 100.6610
## 166 1.782 95.5910
## 167 1.798 84.4610
## 168 1.801 108.5500
## 169 1.827 98.4930
## 170 1.840 91.6090
## 171 1.841 96.6820
## 172 1.879 100.7350
## 173 1.902 107.2200
## 174 1.923 96.2070
## 175 1.928 107.4570
## 176 1.938 103.5020
## 177 1.945 109.0940
## 178 1.948 116.3620
## 179 1.966 103.1270
## 180 1.995 106.7880
## 181 2.007 108.5780
## 182 2.009 99.6260
## 183 2.025 89.5310
## 184 2.051 108.0300
## 185 2.061 109.3470
## 186 2.065 91.6110
## 187 2.100 112.6990
## 188 2.102 108.5380
## 189 2.160 115.6870
## 190 2.171 98.1620
## 191 2.181 106.4570
## 192 2.196 120.8630
## 193 2.297 114.4770
## 194 2.350 127.5360
## 195 2.392 89.3820
## 196 2.397 94.5690
## 197 2.410 113.1545
## 198 2.434 122.7030
## 199 2.461 104.1140
## 200 2.497 119.2460
## 201 2.501 107.7850
## 202 2.513 109.2560
## 203 2.575 102.2180
## 204 2.598 95.7690
## 205 2.601 108.4730
## 206 2.602 101.0790
## 207 2.612 101.4730
## 208 2.696 124.9190
## 209 2.783 113.3420
## 210 2.819 126.8550
## 211 2.835 97.5220
## 212 2.876 119.8880
## 213 2.911 129.4430
## 214 2.986 123.0350
## 215 3.044 109.4010
## 216 3.097 123.6430
## 217 3.152 118.9880
## 218 3.209 120.2180
y <- tabla_media$tonelaje
x <- tabla_media$cobre
plot(x, y,
pch = 16,
col = "blue",
main = "Gráfica N°1: Diagrama de dispersión entre el Tonelaje y
la cantidad de cobre en los Depósitos de Masivos de Sulfuros
Volcánicos",
xlab = "Cobre(%)",
ylab = "Tonelaje (Ton)")
Debido a la similitud de la nube de puntos conjeturamos a un modelo logarítmico
#Extraer variables
y <- tabla_media$tonelaje #Variable dependiente
x <- tabla_media$cobre #variable independiente
x1 <- log(x)
#Cálculo de parámetros
regresion_logaritmico<- lm(y~x1)
regresion_logaritmico
##
## Call:
## lm(formula = y ~ x1)
##
## Coefficients:
## (Intercept) x1
## 79.67 33.73
a <- regresion_logaritmico$coefficients[1]
b <- regresion_logaritmico$coefficients[2]
#AGREGAR LA CURVA
plot(x, y,
pch = 16,
col = "blue",
main = "Gráfica N°2: Comparación de la realidad con el modelo logarítmico
entre el tonelaje y el contenido de cobre de los Depósitos Masivos de Sulfuros
Volcánicos",
xlab = "Cobre (%)",
ylab = "Tonelaje (Ton)")
curve(a + b*log(x),
from = min(x),
to = max(x),
add = TRUE,
col = "red",
lwd = 2)
plot(1, type = "n", axes = FALSE, xlab = "", ylab = "")
eq <- paste0(
"Ecuación logarítmica\n",
"Y = a + b log(x)\n",
"Y = ", round(a, 2), " + ", round(b, 2), " log(x)"
)
text(1, 1, labels = eq, cex = 1.7, col = "blue", font = 2)
#TEST DE PEARSON
r<-cor(x1,y)
r*100
## [1] 92.02879
APRUEBA EL TEST PEARSON
RESTRICCIONES
y = a + b*log(2)
Sí existe restricción, ya que el cobre en porcentaje debe tomar únicamente valores positivos para que el modelo logarítmico sea válido. Al reemplazar valores de cobre fuera del rango observado en los datos, el modelo puede predecir tonelajes irreales, por lo que su aplicación se limita estrictamente al dominio de la variable independiente analizada.
¿Cuál sería el tonelaje esperado de un depósito masivo de sulfuros volcánicos si el contenido de cobre es del 2 %?
#CÁLCULO
C_esp <- a + b*log(2)
C_esp
## (Intercept)
## 103.0492
plot(1, type = "n", axes = FALSE, xlab = "", ylab = "") # Crear un gráfico vacío
text(x = 1, y = 1,
labels = "¿Cuál sería el tonelaje esperado de
un depósito masivo de sulfuros volcánicos si
el contenido de cobre es del 2 %?
\n R= 103.0492 toneladas",
cex = 2,
col = "blue",
font = 6)
Entre el contenido de cobre y el tonelaje de los depósitos masivos de sulfuros volcánicos existe una relación de tipo logarítmica, representada por el modelo f(x)=79.7+33.7ln(x), donde “x” corresponde al contenido de cobre (%) y “y” al tonelaje. Si bien el modelo describe adecuadamente la tendencia general de los datos, presenta restricciones ya que el modelo solo es válido para valores de (x>0)
Ejemplo: Cuando el contenido de cobre es del 2 %, el modelo logarítmico predice un tonelaje aproximado de 103.05 toneladas.