CARGA DE DATOS
#Carga de datos
setwd("~/UNI/ESTADISTICA")
datos <- read.csv("Depositos_Sulfuro.csv", header = TRUE, sep = ";", dec = ".")
CARGA DE LIBRERIAS
#Carga de librerias
library(countrycode)
library(gt)
library(dplyr)
library(knitr)
TABLA DE DISTRIBUCION DE FRECUENCIA POR PAIS
# Extraer variable
pais <- datos$country
# Frecuencia absoluta
ni <- table(pais)
# Frecuencia relativa en %
hi <- round(prop.table(ni) * 100,2)
# Tabla principal
tabla_final_pais <- data.frame(
pais = names(ni),
ni = as.numeric(ni),
hi = as.numeric(hi)
)
Fila total de las sumas de ni y hi
# Fila TOTAL
fila_total <- data.frame(
pais = "TOTAL",
ni = sum(tabla_final_pais$ni),
hi = round(sum(tabla_final_pais$hi),)
)
# Unir
tabla_final_p <- rbind(tabla_final_pais, fila_total)
tabla_final_p
## pais ni hi
## 1 Argentina 2 0.18
## 2 Armenia 4 0.37
## 3 Australia 56 5.14
## 4 Bolivia 1 0.09
## 5 Brazil 3 0.28
## 6 Canada 317 29.08
## 7 Chile 2 0.18
## 8 China 37 3.39
## 9 Colombia 6 0.55
## 10 Cuba 13 1.19
## 11 Cyprus 18 1.65
## 12 Dominican Republic 3 0.28
## 13 Ecuador 2 0.18
## 14 Egypt 1 0.09
## 15 Eritrea 3 0.28
## 16 Fiji 3 0.28
## 17 Finland 12 1.10
## 18 France 4 0.37
## 19 Georgia 4 0.37
## 20 Great Britain 1 0.09
## 21 Guatemala 1 0.09
## 22 Guyana 2 0.18
## 23 India 2 0.18
## 24 Indonesia 4 0.37
## 25 Iran 2 0.18
## 26 Ireland 1 0.09
## 27 Japan 82 7.52
## 28 Kazakhstan 46 4.22
## 29 Mexico 16 1.47
## 30 Mongolia 1 0.09
## 31 Morocco 3 0.28
## 32 Norway 49 4.50
## 33 Oman 3 0.28
## 34 Pakistan 1 0.09
## 35 Peru 5 0.46
## 36 Philippines 19 1.74
## 37 Portugal 14 1.28
## 38 Russia 90 8.26
## 39 Saudi Arabia 21 1.93
## 40 Spain 61 5.60
## 41 Sweden 40 3.67
## 42 Turkey 26 2.39
## 43 Union of Myanmar 1 0.09
## 44 United States 100 9.17
## 45 Uzbekistan 5 0.46
## 46 Venezuela 3 0.28
## 47 TOTAL 1090 100.00
TABLA DE DISTRIBUCION DE FRECUENCIA POR PAIS
tabla_pais_gt <- tabla_final_p %>%
gt() %>%
tab_header(
title = md("**Tabla N° 1**"),
subtitle = md("Distribución de frecuencia simples por era geologica en <br>
depósitos Masivos de Sulfuro Volcánicos")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 2")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black",
row.striping.include_table_body = TRUE
)
tabla_pais_gt
| Tabla N° 1 | ||
| Distribución de frecuencia simples por era geologica en depósitos Masivos de Sulfuro Volcánicos |
||
| pais | ni | hi |
|---|---|---|
| Argentina | 2 | 0.18 |
| Armenia | 4 | 0.37 |
| Australia | 56 | 5.14 |
| Bolivia | 1 | 0.09 |
| Brazil | 3 | 0.28 |
| Canada | 317 | 29.08 |
| Chile | 2 | 0.18 |
| China | 37 | 3.39 |
| Colombia | 6 | 0.55 |
| Cuba | 13 | 1.19 |
| Cyprus | 18 | 1.65 |
| Dominican Republic | 3 | 0.28 |
| Ecuador | 2 | 0.18 |
| Egypt | 1 | 0.09 |
| Eritrea | 3 | 0.28 |
| Fiji | 3 | 0.28 |
| Finland | 12 | 1.10 |
| France | 4 | 0.37 |
| Georgia | 4 | 0.37 |
| Great Britain | 1 | 0.09 |
| Guatemala | 1 | 0.09 |
| Guyana | 2 | 0.18 |
| India | 2 | 0.18 |
| Indonesia | 4 | 0.37 |
| Iran | 2 | 0.18 |
| Ireland | 1 | 0.09 |
| Japan | 82 | 7.52 |
| Kazakhstan | 46 | 4.22 |
| Mexico | 16 | 1.47 |
| Mongolia | 1 | 0.09 |
| Morocco | 3 | 0.28 |
| Norway | 49 | 4.50 |
| Oman | 3 | 0.28 |
| Pakistan | 1 | 0.09 |
| Peru | 5 | 0.46 |
| Philippines | 19 | 1.74 |
| Portugal | 14 | 1.28 |
| Russia | 90 | 8.26 |
| Saudi Arabia | 21 | 1.93 |
| Spain | 61 | 5.60 |
| Sweden | 40 | 3.67 |
| Turkey | 26 | 2.39 |
| Union of Myanmar | 1 | 0.09 |
| United States | 100 | 9.17 |
| Uzbekistan | 5 | 0.46 |
| Venezuela | 3 | 0.28 |
| TOTAL | 1090 | 100.00 |
| Autor: Grupo 2 | ||
Debido a que la tabla presenta numerosos registros de paises, se decidió agruparlos por continentes
TABLA DE DISTRIBUCION DE FRECUENCIA AGRUPADA
# Extraer variable
continente <- countrycode(
pais,
origin = "country.name",
destination = "continent"
)
# Frecuencia absoluta
ni_cont <- table(continente)
# Frecuencia relativa (%)
hi_cont <- round(prop.table(ni_cont) * 100, 2)
# Tabla final
tabla_continente <- data.frame(
Continente = names(ni_cont),
ni = as.numeric(ni_cont),
hi = as.numeric(hi_cont)
)
Fila total de las sumas de ni y hi
#FILA TOTAL Y UNIR TABLAS
fila_total <- data.frame(
Continente = "TOTAL",
ni = sum(tabla_continente$ni),
hi = round(sum(tabla_continente$hi),)
)
tabla_continente_f <- rbind(tabla_continente, fila_total)
tabla_continente_f
## Continente ni hi
## 1 Africa 7 0.64
## 2 Americas 476 43.67
## 3 Asia 276 25.32
## 4 Europe 272 24.95
## 5 Oceania 59 5.41
## 6 TOTAL 1090 100.00
TABLA DE DISTRIBUCION DE FRECUENCIA AGRUPADA FINAL
tabla_continente_gt <- tabla_continente_f %>%
gt() %>%
tab_header(
title = md("**Tabla N° 2**"),
subtitle = md("Distribución de frecuencia simple por continente <br>
Depósitos Masivos de Sulfuro Volcánicos")
) %>%
cols_label(
Continente = "Continente",
ni = "ni",
hi = "hi)"
) %>%
tab_source_note(
source_note = md("Autor: Grupo 2")
)
tabla_continente_gt
| Tabla N° 2 | ||
| Distribución de frecuencia simple por continente Depósitos Masivos de Sulfuro Volcánicos |
||
| Continente | ni | hi) |
|---|---|---|
| Africa | 7 | 0.64 |
| Americas | 476 | 43.67 |
| Asia | 276 | 25.32 |
| Europe | 272 | 24.95 |
| Oceania | 59 | 5.41 |
| TOTAL | 1090 | 100.00 |
| Autor: Grupo 2 | ||
Diagrama de barras de frecuencia absoluta local
barplot(
tabla_continente$ni,
main = "Gráfica Nº1: Distribución de frecuencia absoluta
local del continente de los depositos masivos de sulfuros
volcanicos",
xlab = "Continente",
ylab = "Cantidad (ni)",
col = "blue",
names.arg = tabla_continente$Continente,
ylim = c(0, max(tabla_continente$ni))
)
Diagrama de barras de frecuencia absoluta global
barplot(
tabla_continente$ni,
main = "Gráfica Nº2: Distribución de frecuencia absoluta global
del continente de los depositos masivos de sulfuros volcanicos",
xlab = "Continente",
ylab = "Cantidad (ni)",
col = "blue",
names.arg = tabla_continente$Continente,
ylim = c(0,1090)
)
Diagrama de barras de frecuencia relativa local
hi_local <- as.numeric(tabla_continente_f$hi[1:(nrow(tabla_continente_f)-1)])
barplot(
hi_local,
main = "Gráfica Nº3: Distribución de frecuencia relativa local
del continente de los depositos masivos de sulfuros volcanicos",
cex.main = 0.8,
xlab = "Era geologica",
ylab = "Porcentaje (%)",
col = "gray",
names.arg = tabla_continente_f$Continente[1:(nrow(tabla_continente_f)-1)]
)
Diagrama de barras de frecuencia relativa global
hi_global <- as.numeric(tabla_continente_f$hi[1:(nrow(tabla_continente_f)-1)])
barplot(
hi_global,
main = "Gráfica Nº4: Distribución de frecuencia relativa global
del continente de los depositos masivos de sulfuros volcanicos",
cex.main = 0.8,
xlab = "Era geologica",
ylab = "Porcentaje (%)",
col = "gray",
names.arg = tabla_continente_f$Continente[1:(nrow(tabla_continente_f)-1)],
ylim = c(0, 100)
)
DIAGRAMA CIRCULAR
hi_continente <- as.numeric(tabla_continente_f$hi[1:(nrow(tabla_continente_f)-1)])
conti <- tabla_continente_f$Continente[1:(nrow(tabla_continente_f)-1)]
Colores <- colorRampPalette(c("lightskyblue", "darkblue"))(length(hi_continente))
etiquetas <- paste0(hi_continente, "%")
par(mfrow = c(1,2))
par(mar = c(2,2,4,2))
pie(
hi_continente,
radius = 0.8,
col = Colores,
labels = etiquetas,
main = "Gráfica Nº5: Distribución de frecuencias
relativas del continente de los depositos masivos
de sulfuros volcanicos",
cex.main = 0.8
)
plot.new()
legend(
"center",
title = "Continente",
legend = conti,
fill = Colores,
cex = 0.7,
bg = "white",
box.lwd = 0.7
)
Indicadores Estadisticos
POSICION
MODA
# Asegurar que ERA sea vector
continente_limpia <- as.character(continente)
continente_limpia <- continente_limpia [!is.na(continente_limpia )]
# Tabla de frecuencias
tabla_contin <- table(continente_limpia)
# Moda
moda_cont <- names(tabla_contin)[which.max(as.numeric(tabla_contin))]
moda_cont
## [1] "Americas"
TABLA DE INDICADORES ESTADISTICOS
Variable<-c("continente")
TablaIndicadores<-data.frame(Variable,moda_cont)
colnames(TablaIndicadores)<-c("Variable","Moda")
kable(TablaIndicadores, format = "markdown", caption = "Tabla N°3. Indicadores estadíticos de la variable continente de los depositos masivos de sulfuros volcanicos")
| Variable | Moda |
|---|---|
| continente | Americas |
CONCLUSÍON
La distribución de frecuencia por continente evidencia una mayor concentración de depósitos en América, lo cual resulta favorable para la actividad minera, ya que incrementa el potencial de exploración y desarrollo de yacimientos en la región.