CARGA DE DATOS
#cargar datos
datos <- read.csv("C:\\Users\\joeja\\Desktop\\Proyecto Estadística\\datos_depurados.csv",
header = TRUE,
sep = ",",
dec = ".")
CARGA DE LIBRERIAS
# cargar librerías
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
library(gt)
#Extraer variables numéricas
tonelaje <- as.numeric(datos$oreton)
cobre <- as.numeric(datos$cugrd)
#Taba de pares de valores
TPV <- data.frame(
tonelaje = as.numeric(tonelaje),
cobre = as.numeric(cobre)
)
TPV <- na.omit(TPV) #OMITIR NA
TPV <- TPV[TPV$tonelaje > 0 & TPV$cobre > 0, ] #OMITIR VALORES NEGATIVOS Y CEROS
# OUTLIERS EN TONELAJE
Q1_tonelaje <- quantile(TPV$tonelaje, 0.25)
Q3_tonelaje <- quantile(TPV$tonelaje, 0.75)
IQR_tonelaje <- Q3_tonelaje - Q1_tonelaje
lim_inf_tonelaje <- Q1_tonelaje - 1.5 * IQR_tonelaje
lim_sup_tonelaje <- Q3_tonelaje + 1.5 * IQR_tonelaje
# OUTLIERS EN COBRE
Q1_cobre <- quantile(TPV$cobre, 0.25)
Q3_cobre <- quantile(TPV$cobre, 0.75)
IQR_cobre <- Q3_cobre - Q1_cobre
lim_inf_cobre <- Q1_cobre - 1.5 * IQR_cobre
lim_sup_cobre <- Q3_cobre + 1.5 * IQR_cobre
# FILTRO CONJUNTO (X e Y)
TPV_limpio <- TPV[
TPV$tonelaje >= lim_inf_tonelaje & TPV$tonelaje <= lim_sup_tonelaje &
TPV$cobre >= lim_inf_cobre & TPV$cobre <= lim_sup_cobre,
]
dim(TPV_limpio) # pares finales
## [1] 230 2
summary(TPV_limpio)
## tonelaje cobre
## Min. : 33.72 Min. :0.3060
## 1st Qu.: 71.66 1st Qu.:0.8125
## Median : 84.58 Median :1.1465
## Mean : 85.03 Mean :1.3294
## 3rd Qu.: 98.57 3rd Qu.:1.7512
## Max. :129.44 Max. :3.2090
#LIMITE MEDIO
tabla_media <- aggregate(tonelaje ~ cobre,
data = TPV_limpio,
FUN = mean)
tabla_media
## cobre tonelaje
## 1 0.306 33.7190
## 2 0.368 62.1770
## 3 0.372 42.4480
## 4 0.388 47.6940
## 5 0.393 43.7935
## 6 0.401 45.8370
## 7 0.416 35.7670
## 8 0.438 50.1810
## 9 0.482 56.4870
## 10 0.485 45.6500
## 11 0.505 63.2080
## 12 0.509 62.7140
## 13 0.524 56.5930
## 14 0.530 55.2090
## 15 0.531 57.2920
## 16 0.539 59.4260
## 17 0.548 65.2880
## 18 0.560 68.2840
## 19 0.564 63.3990
## 20 0.570 66.4460
## 21 0.590 58.7390
## 22 0.597 59.5120
## 23 0.604 63.3690
## 24 0.613 69.9085
## 25 0.616 60.7250
## 26 0.619 69.3930
## 27 0.626 65.1620
## 28 0.632 64.2820
## 29 0.638 67.3660
## 30 0.642 63.3810
## 31 0.646 72.7920
## 32 0.671 57.5370
## 33 0.672 71.5580
## 34 0.684 67.3170
## 35 0.689 70.1200
## 36 0.700 60.9670
## 37 0.705 70.3050
## 38 0.706 55.6060
## 39 0.712 59.7110
## 40 0.713 67.1760
## 41 0.716 70.7610
## 42 0.728 58.8150
## 43 0.732 71.6500
## 44 0.754 66.7200
## 45 0.756 61.2730
## 46 0.761 70.2370
## 47 0.764 74.2240
## 48 0.778 71.0850
## 49 0.779 75.6315
## 50 0.782 67.9290
## 51 0.783 73.0230
## 52 0.800 71.6930
## 53 0.811 72.4660
## 54 0.812 68.7250
## 55 0.814 72.6610
## 56 0.824 76.2260
## 57 0.828 75.2080
## 58 0.829 75.1330
## 59 0.839 77.9750
## 60 0.844 71.5660
## 61 0.847 76.0630
## 62 0.854 82.8960
## 63 0.863 75.8025
## 64 0.866 81.9310
## 65 0.869 71.4950
## 66 0.873 75.8840
## 67 0.876 81.2900
## 68 0.884 73.9550
## 69 0.903 65.4440
## 70 0.906 82.2080
## 71 0.909 80.4340
## 72 0.916 86.7200
## 73 0.917 74.2265
## 74 0.922 70.6630
## 75 0.926 72.6510
## 76 0.942 80.0800
## 77 0.946 75.5930
## 78 0.949 74.1970
## 79 0.955 71.4030
## 80 0.958 85.2740
## 81 0.966 88.7000
## 82 0.969 77.0110
## 83 0.977 85.5570
## 84 0.984 82.6160
## 85 1.005 76.9770
## 86 1.009 72.4590
## 87 1.010 77.1870
## 88 1.014 86.4470
## 89 1.025 80.6310
## 90 1.033 82.1640
## 91 1.036 74.6910
## 92 1.040 89.3370
## 93 1.048 75.3560
## 94 1.049 97.5220
## 95 1.056 69.7560
## 96 1.060 81.4290
## 97 1.067 78.6540
## 98 1.068 75.8840
## 99 1.076 76.4800
## 100 1.090 80.2390
## 101 1.101 88.6950
## 102 1.105 84.0575
## 103 1.107 91.3610
## 104 1.109 84.7090
## 105 1.131 95.7660
## 106 1.134 83.9550
## 107 1.138 92.6170
## 108 1.155 88.4150
## 109 1.178 94.2320
## 110 1.195 81.2290
## 111 1.197 91.6650
## 112 1.207 86.9000
## 113 1.209 89.2360
## 114 1.214 86.0380
## 115 1.221 82.2940
## 116 1.235 90.0500
## 117 1.240 88.6450
## 118 1.245 100.5480
## 119 1.260 102.4900
## 120 1.277 87.2970
## 121 1.283 71.1140
## 122 1.290 86.1470
## 123 1.296 87.1165
## 124 1.326 99.3510
## 125 1.331 85.6910
## 126 1.343 86.0540
## 127 1.352 75.6250
## 128 1.364 79.8240
## 129 1.369 85.3460
## 130 1.373 89.1400
## 131 1.379 86.9540
## 132 1.385 90.1560
## 133 1.396 82.8690
## 134 1.419 78.2370
## 135 1.420 87.1660
## 136 1.427 82.0470
## 137 1.429 76.4680
## 138 1.449 92.8080
## 139 1.463 89.4940
## 140 1.474 106.4640
## 141 1.477 82.9990
## 142 1.488 91.5040
## 143 1.498 106.2020
## 144 1.514 79.5040
## 145 1.517 98.5950
## 146 1.541 89.7290
## 147 1.560 90.4770
## 148 1.570 86.8390
## 149 1.571 100.3510
## 150 1.574 111.5290
## 151 1.613 95.1470
## 152 1.616 89.6410
## 153 1.631 83.1970
## 154 1.638 106.7480
## 155 1.647 101.4080
## 156 1.673 95.7310
## 157 1.675 86.8510
## 158 1.676 100.5790
## 159 1.707 99.3570
## 160 1.728 98.1915
## 161 1.734 94.3750
## 162 1.746 92.3270
## 163 1.753 103.0090
## 164 1.756 115.1740
## 165 1.762 100.6610
## 166 1.782 95.5910
## 167 1.798 84.4610
## 168 1.801 108.5500
## 169 1.827 98.4930
## 170 1.840 91.6090
## 171 1.841 96.6820
## 172 1.879 100.7350
## 173 1.902 107.2200
## 174 1.923 96.2070
## 175 1.928 107.4570
## 176 1.938 103.5020
## 177 1.945 109.0940
## 178 1.948 116.3620
## 179 1.966 103.1270
## 180 1.995 106.7880
## 181 2.007 108.5780
## 182 2.009 99.6260
## 183 2.025 89.5310
## 184 2.051 108.0300
## 185 2.061 109.3470
## 186 2.065 91.6110
## 187 2.100 112.6990
## 188 2.102 108.5380
## 189 2.160 115.6870
## 190 2.171 98.1620
## 191 2.181 106.4570
## 192 2.196 120.8630
## 193 2.297 114.4770
## 194 2.350 127.5360
## 195 2.392 89.3820
## 196 2.397 94.5690
## 197 2.410 113.1545
## 198 2.434 122.7030
## 199 2.461 104.1140
## 200 2.497 119.2460
## 201 2.501 107.7850
## 202 2.513 109.2560
## 203 2.575 102.2180
## 204 2.598 95.7690
## 205 2.601 108.4730
## 206 2.602 101.0790
## 207 2.612 101.4730
## 208 2.696 124.9190
## 209 2.783 113.3420
## 210 2.819 126.8550
## 211 2.835 97.5220
## 212 2.876 119.8880
## 213 2.911 129.4430
## 214 2.986 123.0350
## 215 3.044 109.4010
## 216 3.097 123.6430
## 217 3.152 118.9880
## 218 3.209 120.2180
y <- tabla_media$tonelaje
x <- tabla_media$cobre
plot(x, y,
pch = 16,
col = "blue",
main = "Gráfica N°1: Diagrama de dispersión entre el Tonelaje y
la cantidad de cobre en los Depósitos de Masivos de Sulfuros
Volcánicos",
xlab = "Cobre(%)",
ylab = "Tonelaje (Ton)")
Debido a la similitud de la nube de puntos conjeturamos a un modelo logarítmico
#Extraer variables
y <- tabla_media$tonelaje #Variable dependiente
x <- tabla_media$cobre #variable independiente
x1 <- log(x)
#Cálculo de parámetros
regresion_logaritmico<- lm(y~x1)
regresion_logaritmico
##
## Call:
## lm(formula = y ~ x1)
##
## Coefficients:
## (Intercept) x1
## 79.67 33.73
a <- regresion_logaritmico$coefficients[1]
b <- regresion_logaritmico$coefficients[2]
#AGREGAR LA CURVA
plot(x, y,
pch = 16,
col = "blue",
main = "Gráfica N°2: Comparación de la realidad con el modelo logarítmico
entre el tonelaje y el contenido de cobre de los Depósitos Masivos de Sulfuros
Volcánicos",
xlab = "Cobre (%)",
ylab = "Tonelaje (Ton)")
curve(a + b*log(x),
from = min(x),
to = max(x),
add = TRUE,
col = "red",
lwd = 2)
plot(1, type = "n", axes = FALSE, xlab = "", ylab = "")
eq <- paste0(
"Ecuación logarítmica\n",
"Y = a + b log(x)\n",
"Y = ", round(a, 2), " + ", round(b, 2), " log(x)"
)
text(1, 1, labels = eq, cex = 1.7, col = "blue", font = 2)
#TEST DE PEARSON
r<-cor(x1,y)
r*100
## [1] 92.02879
APRUEBA EL TEST PEARSON
RESTRICCIONES
La ecuación funciona para los valores fuera de lo observado. Sin embargo, para valores inferiores a x≈0.094, el modelo genera predicciones negativas, las cuales carecen de interpretación física.
¿Cuál sería el tonelaje esperado de un depósito masivo de sulfuros volcánicos si el contenido de cobre es del 2 %?
#CÁLCULO
C_esp <- a + b*log(2)
C_esp
## (Intercept)
## 103.0492
plot(1, type = "n", axes = FALSE, xlab = "", ylab = "") # Crear un gráfico vacío
text(x = 1, y = 1,
labels = "¿Cuál sería el tonelaje esperado de
un depósito masivo de sulfuros volcánicos si
el contenido de cobre es del 2 %?
\n R= 103.0492 toneladas",
cex = 2,
col = "blue",
font = 6)
Entre el contenido de cobre y el tonelaje de los depósitos masivos de sulfuros volcánicos existe una relación de tipo logarítmica, representada por el modelo f(x)=79.7+33.7ln(x), donde “x” corresponde al contenido de cobre (%) y “y” al tonelaje. Si bien el modelo describe adecuadamente la tendencia general de los datos.
Ejemplo: Cuando el contenido de cobre es del 2 %, el modelo logarítmico predice un tonelaje aproximado de 103.05 toneladas.