Carga de Datos y Librerías

1. CARGA DE LIBRERIAS

# cargar librerías
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(gt)
library(knitr)
library(e1071)
## 
## Adjuntando el paquete: 'e1071'
## The following object is masked from 'package:ggplot2':
## 
##     element

1.2. CARGA DE DATOS

#cargar datos
datos <- read.csv("C:\\Users\\joeja\\Desktop\\Proyecto Estadística\\Depositos_sulfuro.csv", 
                  header = TRUE, 
                  sep = ";", 
                  dec = ".")
#Limpiamos la Variable

zinc <- as.numeric(datos$zngrd) 
zinc <- na.omit(zinc)
zinc <- subset(zinc, zinc >= 0)

Tabla de distribucion de frecuencia por Sturges

2. TABLAS DE DISTRIBUCIÓN DE FRECUENCIA POR STURGES

# Calculamos el numero de datos
n <- length(zinc)

# Numero de clases con Sturges
k <- floor(1 + 3.3 * log10(n))

# Min, Max 
minimo <- min(zinc)
maximo <- max(zinc)

#Rango
R <- maximo - minimo

# Amplitud
A <- R/k

# Límites inferior (Li) y superior (Ls)
Li <- round(seq(from = minimo, to = maximo-A, by = A), 2)
Ls <- round(seq(from = minimo+A, to = maximo, by = A), 2)

# Marca de clase
MC <- round((Li + Ls)/2, 2)

# Frecuencia Absoluta (ni)
ni <- numeric(length(Li))
for (i in 1:length(Li)) {
  ni[i] <- sum(zinc >= Li[i] & zinc < Ls[i])
}
ni[length(Li)] <- sum(zinc >= Li[length(Li)] & zinc <= maximo)

# Frecuencia Relativa (hi)
hi <- (ni / sum(ni)) * 100

# Frecuencias Acumuladas
Niasc <- cumsum(ni)
Nidsc <- rev(cumsum(rev(ni)))
Hiasc <- round(cumsum(hi), 2)
Hidsc <- round(rev(cumsum(rev(hi))), 2)

# TABLA FINAL
TDFzinc <- round(data.frame(
  Li, Ls, MC, ni, hi , Niasc, Nidsc, Hiasc, Hidsc
),2)

TDFzinc
##        Li     Ls     MC  ni    hi Niasc Nidsc  Hiasc  Hidsc
## 1     0.0  186.6   93.3 677 78.00   677   868  78.00 100.00
## 2   186.6  373.2  279.9  88 10.14   765   191  88.13  22.00
## 3   373.2  559.8  466.5  58  6.68   823   103  94.82  11.87
## 4   559.8  746.4  653.1  17  1.96   840    45  96.77   5.18
## 5   746.4  933.0  839.7  12  1.38   852    28  98.16   3.23
## 6   933.0 1119.6 1026.3   9  1.04   861    16  99.19   1.84
## 7  1119.6 1306.2 1212.9   1  0.12   862     7  99.31   0.81
## 8  1306.2 1492.8 1399.5   1  0.12   863     6  99.42   0.69
## 9  1492.8 1679.4 1586.1   3  0.35   866     5  99.77   0.58
## 10 1679.4 1866.0 1772.7   2  0.23   868     2 100.00   0.23

Fila total de las sumas de ni y hi

# FILA TOTAL
fila_total <- data.frame(
  Li = "TOTAL",
  Ls = "",
  MC = "",
  ni = sum(TDFzinc$ni),
  hi = round(sum(TDFzinc$hi),),
  Niasc = "",
  Nidsc = "",
  Hiasc = "",
  Hidsc = ""
)

#TABLA FINAL 
TDFzinc_p <- rbind(TDFzinc, fila_total)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA POR STURGES FINAL

2.1. Tabla Nº1-Distribución de Porcentaje en Peso de Zinc en el mineral de los Depósitos masivos de sulfuros volcanicos

#Crear Tabla
tablazinc <- TDFzinc_p %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nº:1*"),
    subtitle = md("Distribución de Porcentaje en Peso de Zinc en el mineral de los Depósitos masivos de sulfuros volcanicos")
  ) %>%
  tab_source_note(
    source_note = md("Autor: GRUPO 2")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )

tablazinc
Tabla Nº:1
Distribución de Porcentaje en Peso de Zinc en el mineral de los Depósitos masivos de sulfuros volcanicos
Li Ls MC ni hi Niasc Nidsc Hiasc Hidsc
0 186.6 93.3 677 78.00 677 868 78 100
186.6 373.2 279.9 88 10.14 765 191 88.13 22
373.2 559.8 466.5 58 6.68 823 103 94.82 11.87
559.8 746.4 653.1 17 1.96 840 45 96.77 5.18
746.4 933 839.7 12 1.38 852 28 98.16 3.23
933 1119.6 1026.3 9 1.04 861 16 99.19 1.84
1119.6 1306.2 1212.9 1 0.12 862 7 99.31 0.81
1306.2 1492.8 1399.5 1 0.12 863 6 99.42 0.69
1492.8 1679.4 1586.1 3 0.35 866 5 99.77 0.58
1679.4 1866 1772.7 2 0.23 868 2 100 0.23
TOTAL 868 100.00
Autor: GRUPO 2

#DEBIDO A QUE LA TABLA SE PRESENTA CON NUMEROS MUY DIFICILES SE DECIDIO SIMPLIFICAR LA TABLA

Tabla de distribución de frecuencias simplificada

4. Histograma de distribución de frecuencias

histograma_zinc<-hist(zinc,
                     main = "Gráfica Nº1: Distribución de frecuencia absoluta local 
                     de Porcentaje en Peso de Zinc en el mineral de los depositos 
                     masivos de sulfuros volcanicos ",
                     xlab = "Porcentaje en Peso de Zinc en el mineral (% p/p)",
                     ylab = "Cantidad",
                     col = "gray")

TABLA DE DISTRIBUCION DE FRECUENCIA SIMPLIFICADA

#LIMITE INFERIOR SIMPLIFICADA
lis<- histograma_zinc$breaks[1:10]
lis
##  [1]    0  200  400  600  800 1000 1200 1400 1600 1800
#LIMITE SUPERIOR SIMPLIFICADA
lss<-histograma_zinc$breaks[2:11]
lss
##  [1]  200  400  600  800 1000 1200 1400 1600 1800 2000
#MARCA DE CLASE
MC_f<-histograma_zinc$mids
MC_f
##  [1]  100  300  500  700  900 1100 1300 1500 1700 1900
# Frecuencia absoluta(ni)
ni_f <-histograma_zinc $counts
ni_f
##  [1] 683  89  55  15  13   7   0   3   2   1
# Frecuencia relativa (hi)
hi_f <- (ni_f/sum(ni_f))*100
hi_f
##  [1] 78.6866359 10.2534562  6.3364055  1.7281106  1.4976959  0.8064516
##  [7]  0.0000000  0.3456221  0.2304147  0.1152074
# Frecuencias Acumuladas
Niasc_f <- cumsum(ni_f)
Nidsc_f <- rev(cumsum(rev(ni_f)))
Hiasc_f <- round(cumsum(hi_f), 2)
Hidsc_f <- round(rev(cumsum(rev(hi_f))), 2)

# TABLA FINAL
TDFzinc_f <- round(data.frame(
  lis, lss, MC_f, ni_f, hi_f, Niasc_f, Nidsc_f, Hiasc_f, Hidsc_f
),2)

TDFzinc_f
##     lis  lss MC_f ni_f  hi_f Niasc_f Nidsc_f Hiasc_f Hidsc_f
## 1     0  200  100  683 78.69     683     868   78.69  100.00
## 2   200  400  300   89 10.25     772     185   88.94   21.31
## 3   400  600  500   55  6.34     827      96   95.28   11.06
## 4   600  800  700   15  1.73     842      41   97.00    4.72
## 5   800 1000  900   13  1.50     855      26   98.50    3.00
## 6  1000 1200 1100    7  0.81     862      13   99.31    1.50
## 7  1200 1400 1300    0  0.00     862       6   99.31    0.69
## 8  1400 1600 1500    3  0.35     865       6   99.65    0.69
## 9  1600 1800 1700    2  0.23     867       3   99.88    0.35
## 10 1800 2000 1900    1  0.12     868       1  100.00    0.12

Fila total de las sumas de ni y hi

# FILA TOTAL
fila_total_f <- data.frame(
  lis = "TOTAL",
  lss = "",
  MC_f = "",
  ni_f = sum(TDFzinc_f$ni_f),
  hi_f = round(sum(TDFzinc_f$hi_f),),
  Niasc_f = "",
  Nidsc_f = "",
  Hiasc_f = "",
  Hidsc_f = ""
)

TDFzinc_t <- rbind(TDFzinc_f, fila_total_f)

TABLA DE DISTRIBUCION DE FRECUENCIA SIMPLIFICADA FINAL

tabla_zinc_f <- TDFzinc_t %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nº:2*"),
    subtitle = md("Distribución Porcentaje en Peso de Zinc en el mineral de los Depósitos Masivos de Sulfuros volcánicos")
  ) %>%
  tab_source_note(
    source_note = md("Autor: GRUPO 2")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )

tabla_zinc_f
Tabla Nº:2
Distribución Porcentaje en Peso de Zinc en el mineral de los Depósitos Masivos de Sulfuros volcánicos
lis lss MC_f ni_f hi_f Niasc_f Nidsc_f Hiasc_f Hidsc_f
0 200 100 683 78.69 683 868 78.69 100
200 400 300 89 10.25 772 185 88.94 21.31
400 600 500 55 6.34 827 96 95.28 11.06
600 800 700 15 1.73 842 41 97 4.72
800 1000 900 13 1.50 855 26 98.5 3
1000 1200 1100 7 0.81 862 13 99.31 1.5
1200 1400 1300 0 0.00 862 6 99.31 0.69
1400 1600 1500 3 0.35 865 6 99.65 0.69
1600 1800 1700 2 0.23 867 3 99.88 0.35
1800 2000 1900 1 0.12 868 1 100 0.12
TOTAL 868 100.00
Autor: GRUPO 2

Gráficas de distribucón de frecuencia

Colores de barras

# colores de las barras
colores <- gray.colors(length(ni), start = 0.3, end = 0.9)

Histograma de frecuencia absoluta local y global

#Histograma de frecuencia absoluta local
hist(
  zinc,
  main = "Gráfica Nº2: Distribución local de Porcentaje en Peso de Zinc 
  en el mineral de los Depositos Masivos 
  de Sulfuros Volcánicos",
  xlab = "Porcentaje en Peso de Zinc en el mineral (%p/p)",
  ylab = "Cantidad",
  col = colores
)

#Histograma de frecuencia absoluta global
hist(
  zinc,
  main = "Gráfica Nº3: Distribución global de Porcentaje en Peso de Zinc 
  en el mineral de los Depositos Masivos 
  de Sulfuros Volcánicos",
  xlab = "Porcentaje en Peso de Zinc en el mineral (%p/p)",
  ylab = "Cantidad ",
  col = colores,
  ylim = c(0, 868)
)

4. Histograma de frecuencia relativa local y global

# Intervalos de 200 en 200
breaks_200 <- seq(
  from = floor(min(zinc)/200)*200,
  to   = ceiling(max(zinc)/200)*200,
  by   = 200
)

# Etiquetas de intervalos
intervalos <- paste(
  breaks_200[-length(breaks_200)],
  breaks_200[-1],
  sep = "-"
)

barplot(
  hi_f,
  names.arg = intervalos,
  col = colores,
  ylim = c(0, 80),
  space = 0,
  cex.names = 0.6,
  ylab = "Porcentaje (%)",
  xlab = "Porcentaje en Peso de Zinc en el mineral (% p/p)",
  main = "Gráfica Nº4: Distribución relativa Local de Porcentaje en Peso de Zinc 
  en el mineral de los Depósitos Masivos de Sulfuros Volcánicos",
  las = 2
)

#Histograma de frecuencia relativa (global)
barplot(
  hi_f,
  names.arg = intervalos,
  col = colores,
  ylim = c(0, 100),
  cex.names = 0.6,
  space = 0,
  ylab = "Porcentaje (%)",
  xlab = "Porcentaje en Peso de Zinc en el mineral (% p/p)",
  main = "Gráfica Nº5: Distribución relativa global de Porcentaje en Peso de Zinc 
  en el mineral de los Depósitos Masivos de Sulfuros Volcánicos",
  las = 2
)

4.1. Diagrama de caja

#Diagrama de caja
boxplot(
  zinc,
  horizontal = TRUE,
  main = "Gráfica Nº6: Distribución de frecuencia de Porcentaje en Peso de Zinc 
  en el mineral de los Depósitos Masivos de Sulfuros Volcánicos",
  xlab = "Porcentaje en Peso de Zinc en el mineral (%p/p)",
  col = colores
)

Niasc_f <- as.numeric(TDFzinc_f$Niasc_f)
Nidsc_f <- as.numeric(TDFzinc_f$Nidsc_f)

4.2. Ojivas combinadas

Ojivas combinadas Ni y hi

#Ojivas combinadas Ni
plot(lss, Nidsc_f, type="o",
     main="Gráfica Nº7: Distribución de frecuencia acumulada 
     absoluta de Porcentaje en Peso de Zinc 
  en el mineral de los Depósitos Masivos de Sulfuros Volcánicos"
     , ylab="Cantidad", col="blue", xlab="Porcentaje en Peso de Zinc en el mineral (%p/p)")

lines(lis, Niasc_f, col="black", type="b")

#Ojivas combinadas Hi
plot(lss, Hidsc_f, type="o",
     main="Gráfica Nº8: Distribución de frecuencia acumulada 
     relativa de Porcentaje en Peso de Zinc 
  en el mineral de los Depósitos Masivos de Sulfuros Volcánicos"
     , ylab="Porcentaje", col="blue", xlab="Porcentaje en Peso de Zinc en el mineral (%p/p)")

lines(lis, Hiasc_f, col="black",type="b")

Indicadores estadísticos y outliers

5. Indicadores

Ver cuartiles

#cuartiles
summary(zinc) 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0     0.0    23.0   131.3   149.8  1866.0

Posicion

#MEDIA ARITMETICA
x<-mean(zinc)
x
## [1] 131.2834
#MEDIANA ARITMETICA

ri<-min(zinc)
rs<-max(zinc)
Me<-median(zinc)
Me
## [1] 23

Dispersion

#DESVIACIÓN ESTÁNDAR
sd<-sd(zinc)
sd
## [1] 238.6834
#COEFICIENTE DE VARIACIÓN
CV <- ((sd / x) * 100)
CV
## [1] 181.8077

Forma

#COEFICIENTE DE ASIMETRÍA
As<-skewness(zinc)
As
## [1] 3.1571
#COEFICIENTE DE CURTOSIS
K<-kurtosis(zinc)
K
## [1] 13.05455

5.1. Tabla de Indicadores Estadísticos

#COEFICIENTE DE ASIMETRÍA
Variable<-c("Porcentaje en Peso de Zinc en el mineral (%p/p)")
TablaIndicadores<-data.frame(Variable,ri,rs,round(x,2),Me,round(sd,2), round(CV,2), round(As,2),round(K,2))
colnames(TablaIndicadores)<-c("Variable","minimo","máximo","x","Me","sd","Cv (%)","As","K")

kable(TablaIndicadores, format = "markdown", caption = "Tabla N°3. Indicadores estadíticos de la variable Porcentaje en Peso de Zinc en el mineral de los Depósitos Masivos de Sulfuros Volcánico")
Tabla N°3. Indicadores estadíticos de la variable Porcentaje en Peso de Zinc en el mineral de los Depósitos Masivos de Sulfuros Volcánico
Variable minimo máximo x Me sd Cv (%) As K
Porcentaje en Peso de Zinc en el mineral (%p/p) 0 1866 131.28 23 238.68 181.81 3.16 13.05

5.2. Tabla Outliers

#COEFICIENTE DE ASIMETRÍA
outliers<-boxplot.stats(zinc)$out 
# Contar los valores atípicos 
num_outliers <- length(outliers) 
num_outliers
## [1] 103
minoutliers<-min(outliers)
minoutliers
## [1] 383
maxoutliers<-max(outliers)
maxoutliers
## [1] 1866
TablaOutliers<-data.frame(num_outliers,minoutliers,maxoutliers)
colnames(TablaOutliers)<-c("Outliers","Mínimo","Máximo")
kable(TablaOutliers, format = "markdown", caption = "Tabla N°4: Outliers de la variable Porcentaje en Peso de Zinc 
  en el mineral de los Depósitos Masivos de Sulfuros Volcánico).")
Tabla N°4: Outliers de la variable Porcentaje en Peso de Zinc en el mineral de los Depósitos Masivos de Sulfuros Volcánico).
Outliers Mínimo Máximo
103 383 1866

Conclusión

6. Conclusiones

La variable porcentaje en peso de zinc presenta valores entre 0 y 1866, con una media de 131.28 y una mediana de 23, lo que evidencia una fuerte concentración de observaciones en valores bajos. La alta desviación estándar (238.68) y un coeficiente de variación del 181.8 % indican una elevada heterogeneidad en la distribución. La asimetría positiva pronunciada (3.16) y la curtosis elevada (13.05) confirman una distribución marcadamente asimétrica y leptocúrtica, con presencia significativa de valores atípicos (103 outliers). En consecuencia, la mayoría de los depósitos masivos de sulfuros volcánicos presentan bajos contenidos de zinc, siendo pocos los casos con concentraciones excepcionalmente altas.