# cargar librerías
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(gt)
library(knitr)
library(e1071)
##
## Adjuntando el paquete: 'e1071'
## The following object is masked from 'package:ggplot2':
##
## element
#cargar datos
datos <- read.csv("C:\\Users\\joeja\\Desktop\\Proyecto Estadística\\Depositos_sulfuro.csv",
header = TRUE,
sep = ";",
dec = ".")
#Limpiamos la Variable
zinc <- as.numeric(datos$zngrd)
zinc <- na.omit(zinc)
zinc <- subset(zinc, zinc >= 0)
# Calculamos el numero de datos
n <- length(zinc)
# Numero de clases con Sturges
k <- floor(1 + 3.3 * log10(n))
# Min, Max
minimo <- min(zinc)
maximo <- max(zinc)
#Rango
R <- maximo - minimo
# Amplitud
A <- R/k
# Límites inferior (Li) y superior (Ls)
Li <- round(seq(from = minimo, to = maximo-A, by = A), 2)
Ls <- round(seq(from = minimo+A, to = maximo, by = A), 2)
# Marca de clase
MC <- round((Li + Ls)/2, 2)
# Frecuencia Absoluta (ni)
ni <- numeric(length(Li))
for (i in 1:length(Li)) {
ni[i] <- sum(zinc >= Li[i] & zinc < Ls[i])
}
ni[length(Li)] <- sum(zinc >= Li[length(Li)] & zinc <= maximo)
# Frecuencia Relativa (hi)
hi <- (ni / sum(ni)) * 100
# Frecuencias Acumuladas
Niasc <- cumsum(ni)
Nidsc <- rev(cumsum(rev(ni)))
Hiasc <- round(cumsum(hi), 2)
Hidsc <- round(rev(cumsum(rev(hi))), 2)
# TABLA FINAL
TDFzinc <- round(data.frame(
Li, Ls, MC, ni, hi , Niasc, Nidsc, Hiasc, Hidsc
),2)
TDFzinc
## Li Ls MC ni hi Niasc Nidsc Hiasc Hidsc
## 1 0.0 186.6 93.3 677 78.00 677 868 78.00 100.00
## 2 186.6 373.2 279.9 88 10.14 765 191 88.13 22.00
## 3 373.2 559.8 466.5 58 6.68 823 103 94.82 11.87
## 4 559.8 746.4 653.1 17 1.96 840 45 96.77 5.18
## 5 746.4 933.0 839.7 12 1.38 852 28 98.16 3.23
## 6 933.0 1119.6 1026.3 9 1.04 861 16 99.19 1.84
## 7 1119.6 1306.2 1212.9 1 0.12 862 7 99.31 0.81
## 8 1306.2 1492.8 1399.5 1 0.12 863 6 99.42 0.69
## 9 1492.8 1679.4 1586.1 3 0.35 866 5 99.77 0.58
## 10 1679.4 1866.0 1772.7 2 0.23 868 2 100.00 0.23
Fila total de las sumas de ni y hi
# FILA TOTAL
fila_total <- data.frame(
Li = "TOTAL",
Ls = "",
MC = "",
ni = sum(TDFzinc$ni),
hi = round(sum(TDFzinc$hi),),
Niasc = "",
Nidsc = "",
Hiasc = "",
Hidsc = ""
)
#TABLA FINAL
TDFzinc_p <- rbind(TDFzinc, fila_total)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA POR STURGES FINAL
#Crear Tabla
tablazinc <- TDFzinc_p %>%
gt() %>%
tab_header(
title = md("*Tabla Nº:1*"),
subtitle = md("Distribución de Porcentaje en Peso de Zinc en el mineral de los Depósitos masivos de sulfuros volcanicos")
) %>%
tab_source_note(
source_note = md("Autor: GRUPO 2")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
tablazinc
| Tabla Nº:1 | ||||||||
| Distribución de Porcentaje en Peso de Zinc en el mineral de los Depósitos masivos de sulfuros volcanicos | ||||||||
| Li | Ls | MC | ni | hi | Niasc | Nidsc | Hiasc | Hidsc |
|---|---|---|---|---|---|---|---|---|
| 0 | 186.6 | 93.3 | 677 | 78.00 | 677 | 868 | 78 | 100 |
| 186.6 | 373.2 | 279.9 | 88 | 10.14 | 765 | 191 | 88.13 | 22 |
| 373.2 | 559.8 | 466.5 | 58 | 6.68 | 823 | 103 | 94.82 | 11.87 |
| 559.8 | 746.4 | 653.1 | 17 | 1.96 | 840 | 45 | 96.77 | 5.18 |
| 746.4 | 933 | 839.7 | 12 | 1.38 | 852 | 28 | 98.16 | 3.23 |
| 933 | 1119.6 | 1026.3 | 9 | 1.04 | 861 | 16 | 99.19 | 1.84 |
| 1119.6 | 1306.2 | 1212.9 | 1 | 0.12 | 862 | 7 | 99.31 | 0.81 |
| 1306.2 | 1492.8 | 1399.5 | 1 | 0.12 | 863 | 6 | 99.42 | 0.69 |
| 1492.8 | 1679.4 | 1586.1 | 3 | 0.35 | 866 | 5 | 99.77 | 0.58 |
| 1679.4 | 1866 | 1772.7 | 2 | 0.23 | 868 | 2 | 100 | 0.23 |
| TOTAL | 868 | 100.00 | ||||||
| Autor: GRUPO 2 | ||||||||
#DEBIDO A QUE LA TABLA SE PRESENTA CON NUMEROS MUY DIFICILES SE DECIDIO SIMPLIFICAR LA TABLA
histograma_zinc<-hist(zinc,
main = "Gráfica Nº1: Distribución de frecuencia absoluta local
de Porcentaje en Peso de Zinc en el mineral de los depositos
masivos de sulfuros volcanicos ",
xlab = "Porcentaje en Peso de Zinc en el mineral (% p/p)",
ylab = "Cantidad",
col = "gray")
TABLA DE DISTRIBUCION DE FRECUENCIA SIMPLIFICADA
#LIMITE INFERIOR SIMPLIFICADA
lis<- histograma_zinc$breaks[1:10]
lis
## [1] 0 200 400 600 800 1000 1200 1400 1600 1800
#LIMITE SUPERIOR SIMPLIFICADA
lss<-histograma_zinc$breaks[2:11]
lss
## [1] 200 400 600 800 1000 1200 1400 1600 1800 2000
#MARCA DE CLASE
MC_f<-histograma_zinc$mids
MC_f
## [1] 100 300 500 700 900 1100 1300 1500 1700 1900
# Frecuencia absoluta(ni)
ni_f <-histograma_zinc $counts
ni_f
## [1] 683 89 55 15 13 7 0 3 2 1
# Frecuencia relativa (hi)
hi_f <- (ni_f/sum(ni_f))*100
hi_f
## [1] 78.6866359 10.2534562 6.3364055 1.7281106 1.4976959 0.8064516
## [7] 0.0000000 0.3456221 0.2304147 0.1152074
# Frecuencias Acumuladas
Niasc_f <- cumsum(ni_f)
Nidsc_f <- rev(cumsum(rev(ni_f)))
Hiasc_f <- round(cumsum(hi_f), 2)
Hidsc_f <- round(rev(cumsum(rev(hi_f))), 2)
# TABLA FINAL
TDFzinc_f <- round(data.frame(
lis, lss, MC_f, ni_f, hi_f, Niasc_f, Nidsc_f, Hiasc_f, Hidsc_f
),2)
TDFzinc_f
## lis lss MC_f ni_f hi_f Niasc_f Nidsc_f Hiasc_f Hidsc_f
## 1 0 200 100 683 78.69 683 868 78.69 100.00
## 2 200 400 300 89 10.25 772 185 88.94 21.31
## 3 400 600 500 55 6.34 827 96 95.28 11.06
## 4 600 800 700 15 1.73 842 41 97.00 4.72
## 5 800 1000 900 13 1.50 855 26 98.50 3.00
## 6 1000 1200 1100 7 0.81 862 13 99.31 1.50
## 7 1200 1400 1300 0 0.00 862 6 99.31 0.69
## 8 1400 1600 1500 3 0.35 865 6 99.65 0.69
## 9 1600 1800 1700 2 0.23 867 3 99.88 0.35
## 10 1800 2000 1900 1 0.12 868 1 100.00 0.12
Fila total de las sumas de ni y hi
# FILA TOTAL
fila_total_f <- data.frame(
lis = "TOTAL",
lss = "",
MC_f = "",
ni_f = sum(TDFzinc_f$ni_f),
hi_f = round(sum(TDFzinc_f$hi_f),),
Niasc_f = "",
Nidsc_f = "",
Hiasc_f = "",
Hidsc_f = ""
)
TDFzinc_t <- rbind(TDFzinc_f, fila_total_f)
TABLA DE DISTRIBUCION DE FRECUENCIA SIMPLIFICADA FINAL
tabla_zinc_f <- TDFzinc_t %>%
gt() %>%
tab_header(
title = md("*Tabla Nº:2*"),
subtitle = md("Distribución Porcentaje en Peso de Zinc en el mineral de los Depósitos Masivos de Sulfuros volcánicos")
) %>%
tab_source_note(
source_note = md("Autor: GRUPO 2")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
tabla_zinc_f
| Tabla Nº:2 | ||||||||
| Distribución Porcentaje en Peso de Zinc en el mineral de los Depósitos Masivos de Sulfuros volcánicos | ||||||||
| lis | lss | MC_f | ni_f | hi_f | Niasc_f | Nidsc_f | Hiasc_f | Hidsc_f |
|---|---|---|---|---|---|---|---|---|
| 0 | 200 | 100 | 683 | 78.69 | 683 | 868 | 78.69 | 100 |
| 200 | 400 | 300 | 89 | 10.25 | 772 | 185 | 88.94 | 21.31 |
| 400 | 600 | 500 | 55 | 6.34 | 827 | 96 | 95.28 | 11.06 |
| 600 | 800 | 700 | 15 | 1.73 | 842 | 41 | 97 | 4.72 |
| 800 | 1000 | 900 | 13 | 1.50 | 855 | 26 | 98.5 | 3 |
| 1000 | 1200 | 1100 | 7 | 0.81 | 862 | 13 | 99.31 | 1.5 |
| 1200 | 1400 | 1300 | 0 | 0.00 | 862 | 6 | 99.31 | 0.69 |
| 1400 | 1600 | 1500 | 3 | 0.35 | 865 | 6 | 99.65 | 0.69 |
| 1600 | 1800 | 1700 | 2 | 0.23 | 867 | 3 | 99.88 | 0.35 |
| 1800 | 2000 | 1900 | 1 | 0.12 | 868 | 1 | 100 | 0.12 |
| TOTAL | 868 | 100.00 | ||||||
| Autor: GRUPO 2 | ||||||||
Colores de barras
# colores de las barras
colores <- gray.colors(length(ni), start = 0.3, end = 0.9)
Histograma de frecuencia absoluta local y global
#Histograma de frecuencia absoluta local
hist(
zinc,
main = "Gráfica Nº2: Distribución local de Porcentaje en Peso de Zinc
en el mineral de los Depositos Masivos
de Sulfuros Volcánicos",
xlab = "Porcentaje en Peso de Zinc en el mineral (%p/p)",
ylab = "Cantidad",
col = colores
)
#Histograma de frecuencia absoluta global
hist(
zinc,
main = "Gráfica Nº3: Distribución global de Porcentaje en Peso de Zinc
en el mineral de los Depositos Masivos
de Sulfuros Volcánicos",
xlab = "Porcentaje en Peso de Zinc en el mineral (%p/p)",
ylab = "Cantidad ",
col = colores,
ylim = c(0, 868)
)
# Intervalos de 200 en 200
breaks_200 <- seq(
from = floor(min(zinc)/200)*200,
to = ceiling(max(zinc)/200)*200,
by = 200
)
# Etiquetas de intervalos
intervalos <- paste(
breaks_200[-length(breaks_200)],
breaks_200[-1],
sep = "-"
)
barplot(
hi_f,
names.arg = intervalos,
col = colores,
ylim = c(0, 80),
space = 0,
cex.names = 0.6,
ylab = "Porcentaje (%)",
xlab = "Porcentaje en Peso de Zinc en el mineral (% p/p)",
main = "Gráfica Nº4: Distribución relativa Local de Porcentaje en Peso de Zinc
en el mineral de los Depósitos Masivos de Sulfuros Volcánicos",
las = 2
)
#Histograma de frecuencia relativa (global)
barplot(
hi_f,
names.arg = intervalos,
col = colores,
ylim = c(0, 100),
cex.names = 0.6,
space = 0,
ylab = "Porcentaje (%)",
xlab = "Porcentaje en Peso de Zinc en el mineral (% p/p)",
main = "Gráfica Nº5: Distribución relativa global de Porcentaje en Peso de Zinc
en el mineral de los Depósitos Masivos de Sulfuros Volcánicos",
las = 2
)
#Diagrama de caja
boxplot(
zinc,
horizontal = TRUE,
main = "Gráfica Nº6: Distribución de frecuencia de Porcentaje en Peso de Zinc
en el mineral de los Depósitos Masivos de Sulfuros Volcánicos",
xlab = "Porcentaje en Peso de Zinc en el mineral (%p/p)",
col = colores
)
Niasc_f <- as.numeric(TDFzinc_f$Niasc_f)
Nidsc_f <- as.numeric(TDFzinc_f$Nidsc_f)
Ojivas combinadas Ni y hi
#Ojivas combinadas Ni
plot(lss, Nidsc_f, type="o",
main="Gráfica Nº7: Distribución de frecuencia acumulada
absoluta de Porcentaje en Peso de Zinc
en el mineral de los Depósitos Masivos de Sulfuros Volcánicos"
, ylab="Cantidad", col="blue", xlab="Porcentaje en Peso de Zinc en el mineral (%p/p)")
lines(lis, Niasc_f, col="black", type="b")
#Ojivas combinadas Hi
plot(lss, Hidsc_f, type="o",
main="Gráfica Nº8: Distribución de frecuencia acumulada
relativa de Porcentaje en Peso de Zinc
en el mineral de los Depósitos Masivos de Sulfuros Volcánicos"
, ylab="Porcentaje", col="blue", xlab="Porcentaje en Peso de Zinc en el mineral (%p/p)")
lines(lis, Hiasc_f, col="black",type="b")
Ver cuartiles
#cuartiles
summary(zinc)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0 0.0 23.0 131.3 149.8 1866.0
Posicion
#MEDIA ARITMETICA
x<-mean(zinc)
x
## [1] 131.2834
#MEDIANA ARITMETICA
ri<-min(zinc)
rs<-max(zinc)
Me<-median(zinc)
Me
## [1] 23
Dispersion
#DESVIACIÓN ESTÁNDAR
sd<-sd(zinc)
sd
## [1] 238.6834
#COEFICIENTE DE VARIACIÓN
CV <- ((sd / x) * 100)
CV
## [1] 181.8077
Forma
#COEFICIENTE DE ASIMETRÍA
As<-skewness(zinc)
As
## [1] 3.1571
#COEFICIENTE DE CURTOSIS
K<-kurtosis(zinc)
K
## [1] 13.05455
#COEFICIENTE DE ASIMETRÍA
Variable<-c("Porcentaje en Peso de Zinc en el mineral (%p/p)")
TablaIndicadores<-data.frame(Variable,ri,rs,round(x,2),Me,round(sd,2), round(CV,2), round(As,2),round(K,2))
colnames(TablaIndicadores)<-c("Variable","minimo","máximo","x","Me","sd","Cv (%)","As","K")
kable(TablaIndicadores, format = "markdown", caption = "Tabla N°3. Indicadores estadíticos de la variable Porcentaje en Peso de Zinc en el mineral de los Depósitos Masivos de Sulfuros Volcánico")
| Variable | minimo | máximo | x | Me | sd | Cv (%) | As | K |
|---|---|---|---|---|---|---|---|---|
| Porcentaje en Peso de Zinc en el mineral (%p/p) | 0 | 1866 | 131.28 | 23 | 238.68 | 181.81 | 3.16 | 13.05 |
#COEFICIENTE DE ASIMETRÍA
outliers<-boxplot.stats(zinc)$out
# Contar los valores atípicos
num_outliers <- length(outliers)
num_outliers
## [1] 103
minoutliers<-min(outliers)
minoutliers
## [1] 383
maxoutliers<-max(outliers)
maxoutliers
## [1] 1866
TablaOutliers<-data.frame(num_outliers,minoutliers,maxoutliers)
colnames(TablaOutliers)<-c("Outliers","Mínimo","Máximo")
kable(TablaOutliers, format = "markdown", caption = "Tabla N°4: Outliers de la variable Porcentaje en Peso de Zinc
en el mineral de los Depósitos Masivos de Sulfuros Volcánico).")
| Outliers | Mínimo | Máximo |
|---|---|---|
| 103 | 383 | 1866 |
La variable porcentaje en peso de zinc presenta valores entre 0 y 1866, con una media de 131.28 y una mediana de 23, lo que evidencia una fuerte concentración de observaciones en valores bajos. La alta desviación estándar (238.68) y un coeficiente de variación del 181.8 % indican una elevada heterogeneidad en la distribución. La asimetría positiva pronunciada (3.16) y la curtosis elevada (13.05) confirman una distribución marcadamente asimétrica y leptocúrtica, con presencia significativa de valores atípicos (103 outliers). En consecuencia, la mayoría de los depósitos masivos de sulfuros volcánicos presentan bajos contenidos de zinc, siendo pocos los casos con concentraciones excepcionalmente altas.