ANÁLISIS ESTADÍSTICO

CARGA DE DATOS Y LIBRERÍAS

CARGA DE DATOS

#Carga de datos

setwd("~/UNI/ESTADISTICA")
datos <- read.csv("Depositos_Sulfuro.csv", header = TRUE, sep = ";", dec = ".")

CARGA DE LIBRERIAS

#Carga de librerias
library(countrycode)
library(gt)
library(dplyr)
library(knitr)

TABLA DE DISTRIBUCIÓN DE FRECUENCIA

TABLA DE DISTRIBUCION DE FRECUENCIA POR PAIS

# Extraer variable
pais <- datos$country 

# Frecuencia absoluta 
ni <- table(pais) 

# Frecuencia relativa en %
hi <- round(prop.table(ni) * 100,2) 

# Tabla principal 
tabla_final_pais <- data.frame(
  pais = names(ni), 
  ni = as.numeric(ni), 
  hi = as.numeric(hi)
) 

Fila total de las sumas de ni y hi

# Fila TOTAL 
fila_total <- data.frame(
  pais = "TOTAL",
  ni = sum(tabla_final_pais$ni),
  hi = round(sum(tabla_final_pais$hi),)
) 

# Unir
tabla_final_p <- rbind(tabla_final_pais, fila_total)
tabla_final_p
##                  pais   ni     hi
## 1           Argentina    2   0.18
## 2             Armenia    4   0.37
## 3           Australia   56   5.14
## 4             Bolivia    1   0.09
## 5              Brazil    3   0.28
## 6              Canada  317  29.08
## 7               Chile    2   0.18
## 8               China   37   3.39
## 9            Colombia    6   0.55
## 10               Cuba   13   1.19
## 11             Cyprus   18   1.65
## 12 Dominican Republic    3   0.28
## 13            Ecuador    2   0.18
## 14              Egypt    1   0.09
## 15            Eritrea    3   0.28
## 16               Fiji    3   0.28
## 17            Finland   12   1.10
## 18             France    4   0.37
## 19            Georgia    4   0.37
## 20      Great Britain    1   0.09
## 21          Guatemala    1   0.09
## 22             Guyana    2   0.18
## 23              India    2   0.18
## 24          Indonesia    4   0.37
## 25               Iran    2   0.18
## 26            Ireland    1   0.09
## 27              Japan   82   7.52
## 28         Kazakhstan   46   4.22
## 29             Mexico   16   1.47
## 30           Mongolia    1   0.09
## 31            Morocco    3   0.28
## 32             Norway   49   4.50
## 33               Oman    3   0.28
## 34           Pakistan    1   0.09
## 35               Peru    5   0.46
## 36        Philippines   19   1.74
## 37           Portugal   14   1.28
## 38             Russia   90   8.26
## 39       Saudi Arabia   21   1.93
## 40              Spain   61   5.60
## 41             Sweden   40   3.67
## 42             Turkey   26   2.39
## 43   Union of Myanmar    1   0.09
## 44      United States  100   9.17
## 45         Uzbekistan    5   0.46
## 46          Venezuela    3   0.28
## 47              TOTAL 1090 100.00

TABLA DE DISTRIBUCION DE FRECUENCIA POR PAIS

tabla_pais_gt <- tabla_final_p %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N° 1**"),
    subtitle = md("Distribución de frecuencia simples por era geologica en  <br>
                 depósitos Masivos de Sulfuro Volcánicos")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 2")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black",
    row.striping.include_table_body = TRUE
  )

tabla_pais_gt
Tabla N° 1
Distribución de frecuencia simples por era geologica en
depósitos Masivos de Sulfuro Volcánicos
pais ni hi
Argentina 2 0.18
Armenia 4 0.37
Australia 56 5.14
Bolivia 1 0.09
Brazil 3 0.28
Canada 317 29.08
Chile 2 0.18
China 37 3.39
Colombia 6 0.55
Cuba 13 1.19
Cyprus 18 1.65
Dominican Republic 3 0.28
Ecuador 2 0.18
Egypt 1 0.09
Eritrea 3 0.28
Fiji 3 0.28
Finland 12 1.10
France 4 0.37
Georgia 4 0.37
Great Britain 1 0.09
Guatemala 1 0.09
Guyana 2 0.18
India 2 0.18
Indonesia 4 0.37
Iran 2 0.18
Ireland 1 0.09
Japan 82 7.52
Kazakhstan 46 4.22
Mexico 16 1.47
Mongolia 1 0.09
Morocco 3 0.28
Norway 49 4.50
Oman 3 0.28
Pakistan 1 0.09
Peru 5 0.46
Philippines 19 1.74
Portugal 14 1.28
Russia 90 8.26
Saudi Arabia 21 1.93
Spain 61 5.60
Sweden 40 3.67
Turkey 26 2.39
Union of Myanmar 1 0.09
United States 100 9.17
Uzbekistan 5 0.46
Venezuela 3 0.28
TOTAL 1090 100.00
Autor: Grupo 2

TABLA DE DISTRIBUCIÓN DE FRECUENCIA AGRUPADA

Debido a que la tabla presenta numerosos registros de paises, se decidió agruparlos por continentes

TABLA DE DISTRIBUCION DE FRECUENCIA AGRUPADA

# Extraer variable
continente <- countrycode(
  pais,
  origin = "country.name",
  destination = "continent"
)
# Frecuencia absoluta
ni_cont <- table(continente)

# Frecuencia relativa (%)
hi_cont <- round(prop.table(ni_cont) * 100, 2)

# Tabla final
tabla_continente <- data.frame(
  Continente = names(ni_cont),
  ni = as.numeric(ni_cont),
  hi = as.numeric(hi_cont)
)

Fila total de las sumas de ni y hi

#FILA TOTAL Y UNIR TABLAS

fila_total <- data.frame(
  Continente = "TOTAL",
  ni = sum(tabla_continente$ni),
  hi = round(sum(tabla_continente$hi),)
)

tabla_continente_f <- rbind(tabla_continente, fila_total)
tabla_continente_f
##   Continente   ni     hi
## 1     Africa    7   0.64
## 2   Americas  476  43.67
## 3       Asia  276  25.32
## 4     Europe  272  24.95
## 5    Oceania   59   5.41
## 6      TOTAL 1090 100.00

TABLA DE DISTRIBUCION DE FRECUENCIA AGRUPADA FINAL

tabla_continente_gt <- tabla_continente_f %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N° 2**"),
    subtitle = md("Distribución de frecuencia simple por continente <br>
                  Depósitos Masivos de Sulfuro Volcánicos")
  ) %>%
  cols_label(
    Continente = "Continente",
    ni = "ni",
    hi = "hi)"
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 2")
  )

tabla_continente_gt
Tabla N° 2
Distribución de frecuencia simple por continente
Depósitos Masivos de Sulfuro Volcánicos
Continente ni hi)
Africa 7 0.64
Americas 476 43.67
Asia 276 25.32
Europe 272 24.95
Oceania 59 5.41
TOTAL 1090 100.00
Autor: Grupo 2

GRÁFICAS DE DISTRIBUCIÓN DE FRECUENCIA

Diagrama de barras de frecuencia absoluta local

barplot(
  tabla_continente$ni,
  main = "Gráfica Nº1: Distribución de frecuencia absoluta 
  local del continente de los depositos masivos de sulfuros
  volcanicos",
  xlab = "Continente",
  ylab = "Cantidad (ni)",
  col = "blue",
  names.arg = tabla_continente$Continente,
  ylim = c(0, max(tabla_continente$ni))
)

Diagrama de barras de frecuencia absoluta global

barplot(
  tabla_continente$ni,
  main = "Gráfica Nº2: Distribución de frecuencia absoluta global 
  del continente de los depositos masivos de sulfuros volcanicos",
  xlab = "Continente",
  ylab = "Cantidad (ni)",
  col = "blue",
  names.arg = tabla_continente$Continente,
  ylim = c(0,1090)
)

Diagrama de barras de frecuencia relativa local

hi_local <- as.numeric(tabla_continente_f$hi[1:(nrow(tabla_continente_f)-1)])
barplot(
  hi_local,
  main = "Gráfica Nº3: Distribución de frecuencia relativa local 
  del continente de los depositos masivos de sulfuros volcanicos",
  cex.main = 0.8,
  xlab = "Era geologica",
  ylab = "Porcentaje (%)",
  col = "gray",
  names.arg = tabla_continente_f$Continente[1:(nrow(tabla_continente_f)-1)]
)

Diagrama de barras de frecuencia relativa global

hi_global <- as.numeric(tabla_continente_f$hi[1:(nrow(tabla_continente_f)-1)])
barplot(
  hi_global,
  main = "Gráfica Nº4: Distribución de frecuencia relativa global 
  del continente de los depositos masivos de sulfuros volcanicos",
  cex.main = 0.8,
  xlab = "Era geologica",
  ylab = "Porcentaje (%)",
  col = "gray",
  names.arg = tabla_continente_f$Continente[1:(nrow(tabla_continente_f)-1)],
  ylim = c(0, 100)
)

DIAGRAMA CIRCULAR

hi_continente <- as.numeric(tabla_continente_f$hi[1:(nrow(tabla_continente_f)-1)])
conti <- tabla_continente_f$Continente[1:(nrow(tabla_continente_f)-1)]

Colores <- colorRampPalette(c("lightskyblue", "darkblue"))(length(hi_continente))
etiquetas <- paste0(hi_continente, "%")

par(mfrow = c(1,2))
par(mar = c(2,2,4,2))

pie(
  hi_continente,
  radius = 0.8,
  col = Colores,
  labels = etiquetas,
  main = "Gráfica Nº5: Distribución de frecuencias 
  relativas del continente de los depositos masivos
  de sulfuros volcanicos",
  cex.main = 0.8
)

plot.new()
legend(
  "center",
  title = "Continente",
  legend = conti,
  fill = Colores,
  cex = 0.7,
  bg = "white",
  box.lwd = 0.7
)

INDICADORES ESTADISTICOS

Indicadores Estadisticos

POSICION

MODA

# Asegurar que ERA sea vector
continente_limpia <- as.character(continente)
continente_limpia <- continente_limpia [!is.na(continente_limpia )]

# Tabla de frecuencias
tabla_contin <- table(continente_limpia)

# Moda
moda_cont <- names(tabla_contin)[which.max(as.numeric(tabla_contin))]

moda_cont
## [1] "Americas"

TABLA DE INDICADORES ESTADISTICOS

Variable<-c("continente")
TablaIndicadores<-data.frame(Variable,moda_cont)
colnames(TablaIndicadores)<-c("Variable","Moda")

kable(TablaIndicadores, format = "markdown", caption = "Tabla N°3. Indicadores estadíticos de la variable continente de los depositos masivos de sulfuros volcanicos")
Tabla N°3. Indicadores estadíticos de la variable continente de los depositos masivos de sulfuros volcanicos
Variable Moda
continente Americas

CONCLUSIÓN

CONCLUSÍON

La distribución de frecuencia por continente evidencia una mayor concentración de depósitos en América, lo cual resulta favorable para la actividad minera, ya que incrementa el potencial de exploración y desarrollo de yacimientos en la región.