ANÁLISIS ESTADÍSTICO

CARGA DE DATOS Y LIBRERÍAS

CARGA DE DATOS

#Carga de datos

setwd("~/UNI/ESTADISTICA")
datos <- read.csv("Depositos_Sulfuro.csv", header = TRUE, sep = ";", dec = ".")

CARGA DE LIBRERIAS

#Carga de librerias
library(countrycode)
library(gt)
library(dplyr)
library(knitr)

TABLA DE DISTRIBUCIÓN DE CANTIDAD

TABLA DE DISTRIBUCION DE CANTIDAD POR PAIS

# Extraer variable
pais <- datos$country 

# Frecuencia absoluta 
ni <- table(pais) 

# Frecuencia relativa en %
hi <- round(prop.table(ni) * 100,2) 

# Tabla principal 
tabla_final_pais <- data.frame(
  pais = names(ni), 
  ni = as.numeric(ni), 
  hi = as.numeric(hi)
) 

Fila total de las sumas de ni y hi

# Fila TOTAL 
fila_total <- data.frame(
  pais = "TOTAL",
  ni = sum(tabla_final_pais$ni),
  hi = round(sum(tabla_final_pais$hi),)
) 

# Unir
tabla_final_p <- rbind(tabla_final_pais, fila_total)
tabla_final_p
##                  pais   ni     hi
## 1           Argentina    2   0.18
## 2             Armenia    4   0.37
## 3           Australia   56   5.14
## 4             Bolivia    1   0.09
## 5              Brazil    3   0.28
## 6              Canada  317  29.08
## 7               Chile    2   0.18
## 8               China   37   3.39
## 9            Colombia    6   0.55
## 10               Cuba   13   1.19
## 11             Cyprus   18   1.65
## 12 Dominican Republic    3   0.28
## 13            Ecuador    2   0.18
## 14              Egypt    1   0.09
## 15            Eritrea    3   0.28
## 16               Fiji    3   0.28
## 17            Finland   12   1.10
## 18             France    4   0.37
## 19            Georgia    4   0.37
## 20      Great Britain    1   0.09
## 21          Guatemala    1   0.09
## 22             Guyana    2   0.18
## 23              India    2   0.18
## 24          Indonesia    4   0.37
## 25               Iran    2   0.18
## 26            Ireland    1   0.09
## 27              Japan   82   7.52
## 28         Kazakhstan   46   4.22
## 29             Mexico   16   1.47
## 30           Mongolia    1   0.09
## 31            Morocco    3   0.28
## 32             Norway   49   4.50
## 33               Oman    3   0.28
## 34           Pakistan    1   0.09
## 35               Peru    5   0.46
## 36        Philippines   19   1.74
## 37           Portugal   14   1.28
## 38             Russia   90   8.26
## 39       Saudi Arabia   21   1.93
## 40              Spain   61   5.60
## 41             Sweden   40   3.67
## 42             Turkey   26   2.39
## 43   Union of Myanmar    1   0.09
## 44      United States  100   9.17
## 45         Uzbekistan    5   0.46
## 46          Venezuela    3   0.28
## 47              TOTAL 1090 100.00

TABLA DE DISTRIBUCION DE CANTIDAD POR PAIS

tabla_pais_gt <- tabla_final_p %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N° 1**"),
    subtitle = md("Distribución de cantidad por continente en  <br>
                 depósitos Masivos de Sulfuro Volcánicos")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 2")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black",
    row.striping.include_table_body = TRUE
  )

tabla_pais_gt
Tabla N° 1
Distribución de cantidad por continente en
depósitos Masivos de Sulfuro Volcánicos
pais ni hi
Argentina 2 0.18
Armenia 4 0.37
Australia 56 5.14
Bolivia 1 0.09
Brazil 3 0.28
Canada 317 29.08
Chile 2 0.18
China 37 3.39
Colombia 6 0.55
Cuba 13 1.19
Cyprus 18 1.65
Dominican Republic 3 0.28
Ecuador 2 0.18
Egypt 1 0.09
Eritrea 3 0.28
Fiji 3 0.28
Finland 12 1.10
France 4 0.37
Georgia 4 0.37
Great Britain 1 0.09
Guatemala 1 0.09
Guyana 2 0.18
India 2 0.18
Indonesia 4 0.37
Iran 2 0.18
Ireland 1 0.09
Japan 82 7.52
Kazakhstan 46 4.22
Mexico 16 1.47
Mongolia 1 0.09
Morocco 3 0.28
Norway 49 4.50
Oman 3 0.28
Pakistan 1 0.09
Peru 5 0.46
Philippines 19 1.74
Portugal 14 1.28
Russia 90 8.26
Saudi Arabia 21 1.93
Spain 61 5.60
Sweden 40 3.67
Turkey 26 2.39
Union of Myanmar 1 0.09
United States 100 9.17
Uzbekistan 5 0.46
Venezuela 3 0.28
TOTAL 1090 100.00
Autor: Grupo 2

TABLA DE DISTRIBUCIÓN DE CANTIDAD AGRUPADA

Debido a que la tabla presenta numerosos registros de paises, se decidió agruparlos por continentes

TABLA DE DISTRIBUCION DE CANTIDAD AGRUPADA

# Extraer variable
continente <- countrycode(
  pais,
  origin = "country.name",
  destination = "continent"
)
# Frecuencia absoluta
ni_cont <- table(continente)

# Frecuencia relativa (%)
hi_cont <- round(prop.table(ni_cont) * 100, 2)

# Tabla final
tabla_continente <- data.frame(
  Continente = names(ni_cont),
  ni = as.numeric(ni_cont),
  hi = as.numeric(hi_cont)
)

Fila total de las sumas de ni y hi

#FILA TOTAL Y UNIR TABLAS

fila_total <- data.frame(
  Continente = "TOTAL",
  ni = sum(tabla_continente$ni),
  hi = round(sum(tabla_continente$hi),)
)

tabla_continente_f <- rbind(tabla_continente, fila_total)
tabla_continente_f
##   Continente   ni     hi
## 1     Africa    7   0.64
## 2   Americas  476  43.67
## 3       Asia  276  25.32
## 4     Europe  272  24.95
## 5    Oceania   59   5.41
## 6      TOTAL 1090 100.00

TABLA DE DISTRIBUCION DE CANTIDAD AGRUPADA FINAL

tabla_continente_gt <- tabla_continente_f %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N° 2**"),
    subtitle = md("Distribución de cantidad por continente de los <br>
                  Depósitos Masivos de Sulfuro Volcánicos")
  ) %>%
  cols_label(
    Continente = "Continente",
    ni = "ni",
    hi = "hi)"
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 2")
  )

tabla_continente_gt
Tabla N° 2
Distribución de cantidad por continente de los
Depósitos Masivos de Sulfuro Volcánicos
Continente ni hi)
Africa 7 0.64
Americas 476 43.67
Asia 276 25.32
Europe 272 24.95
Oceania 59 5.41
TOTAL 1090 100.00
Autor: Grupo 2

GRÁFICAS DE DISTRIBUCIÓN DE CANTIDAD

Diagrama de barras de cantidad

barplot(
  tabla_continente$ni,
  main = "Gráfica Nº1: Distribución de cantidad del continente 
  de los depositos masivos de sulfuros volcanicos",
  xlab = "Continente",
  ylab = "Cantidad ",
  col = "blue",
  names.arg = tabla_continente$Continente,
  ylim = c(0, max(tabla_continente$ni))
)

Diagrama de barras de cantidad

barplot(
  tabla_continente$ni,
  main = "Gráfica Nº2: Distribución de cantidad del continente 
  de los depositos masivos de sulfuros volcanicos",
  xlab = "Continente",
  ylab = "Cantidad ",
  col = "blue",
  names.arg = tabla_continente$Continente,
  ylim = c(0,1090)
)

Diagrama de barras de cantidad en porcentaje

hi_local <- as.numeric(tabla_continente_f$hi[1:(nrow(tabla_continente_f)-1)])
barplot(
  hi_local,
  main = "Gráfica Nº3: Distribución de cantidad en porcentaje del 
  continente de los depositos masivos de sulfuros volcanicos",
  cex.main = 0.8,
  xlab = "Continente",
  ylab = "Porcentaje (%)",
  col = "gray",
  names.arg = tabla_continente_f$Continente[1:(nrow(tabla_continente_f)-1)]
)

Diagrama de barras de cantidad en porcentaje

hi_global <- as.numeric(tabla_continente_f$hi[1:(nrow(tabla_continente_f)-1)])
barplot(
  hi_global,
  main = "Gráfica Nº4: Distribución de cantidad en porcentaje del
  continente de los depositos masivos de sulfuros volcanicos",
  cex.main = 0.8,
  xlab = "Continente",
  ylab = "Porcentaje (%)",
  col = "gray",
  names.arg = tabla_continente_f$Continente[1:(nrow(tabla_continente_f)-1)],
  ylim = c(0, 100)
)

DIAGRAMA CIRCULAR

hi_continente <- as.numeric(tabla_continente_f$hi[1:(nrow(tabla_continente_f)-1)])
conti <- tabla_continente_f$Continente[1:(nrow(tabla_continente_f)-1)]

Colores <- colorRampPalette(c("lightskyblue", "darkblue"))(length(hi_continente))
etiquetas <- paste0(hi_continente, "%")

par(mfrow = c(1,2))
par(mar = c(2,2,4,2))

pie(
  hi_continente,
  radius = 0.8,
  col = Colores,
  labels = etiquetas,
  main = "Gráfica Nº5: Distribución de cantidad en porcentaje 
  del continente de los depositos masivos de sulfuros 
  volcanicos",
  cex.main = 0.8
)

plot.new()
legend(
  "center",
  title = "Continente",
  legend = conti,
  fill = Colores,
  cex = 0.7,
  bg = "white",
  box.lwd = 0.7
)

INDICADORES ESTADISTICOS

Indicadores Estadisticos

POSICION

MODA

# Asegurar que ERA sea vector
continente_limpia <- as.character(continente)
continente_limpia <- continente_limpia [!is.na(continente_limpia )]

# Tabla de frecuencias
tabla_contin <- table(continente_limpia)

# Moda
moda_cont <- names(tabla_contin)[which.max(as.numeric(tabla_contin))]

moda_cont
## [1] "Americas"

TABLA DE INDICADORES ESTADISTICOS

Variable<-c("continente")
TablaIndicadores<-data.frame(Variable,moda_cont)
colnames(TablaIndicadores)<-c("Variable","Moda")

kable(TablaIndicadores, format = "markdown", caption = "Tabla N°3. Indicadores estadíticos de la variable continente de los depositos masivos de sulfuros volcanicos")
Tabla N°3. Indicadores estadíticos de la variable continente de los depositos masivos de sulfuros volcanicos
Variable Moda
continente Americas

CONCLUSIÓN

CONCLUSÍON

La Variable continente tiene como valor mas frecuente America. Lo cual resulta favorable para la actividad minera, ya que incrementa el potencial de exploración y desarrollo de yacimientos en la región