Esta base de datos contiene información sobre minas y depósitos
minerales en todo el mundo. Incluye coordenadas geográficas (latitud y
longitud), ubicación política (país, estado, condado), tipo de
mineralización y depósito, minerales presentes, tamaño de producción,
estado de desarrollo y otros aspectos - Número de registros:
304,632
- Número de columnas: 22
- Algunas columnas tienen valores nulos, lo que indica datos
faltantes.
Tipos de Variables: variables Cuantitativas (Numéricas): - latitude
(Latitud) → float64 - longitude (Longitud) →
float64
Variables Cualitativas (Categoricas o de Texto): - site_name (Nombre del sitio) - region (Región) - country (País) - state (Estado) - county (Condado) - com_type (Tipo de mineralización: M, P, etc.) - commod1, commod2, commod3 (Minerales presentes en el sitio) - oper_type (Tipo de operación minera) - dep_type (Tipo de depósito) - prod_size (Tamaño de producción, categorizado como N, S, etc.) - dev_stat (Estado de desarrollo del sitio) - ore (Tipos de minerales extraídos) - gangue (Minerales de ganga, que no son de interés comercial) - work_type (Tipo de trabajo minero, como “Underground”) - names (Otros nombres asociados al sitio) - ore_ctrl (Control del mineral, como “Vein Follows Contact”) - hrock_type (Tipo de roca huésped) - arock_type (Tipo de roca asociada)
Posibles análisis con esta base de datos Distribución geográfica de
los minerales
Comparación de tipos de depósitos en diferentes regiones
Análisis de frecuencia de minerales en diferentes zonas
Evaluación del estado de desarrollo de los sitios mineros
# Cargar librerías necesarias
library(readr) # Para leer archivos CSV
library(dplyr) # Para manipulación de datos
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2) # Para generar gráficos
# Leer base de datos
informe <- read_csv("Mineral ores round the world.csv")
## Rows: 304632 Columns: 22
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (20): site_name, region, country, state, county, com_type, commod1, comm...
## dbl (2): latitude, longitude
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Filtrar datos de Estados Unidos
informe_usa <- informe %>% filter(country == "United States")
# Contar la frecuencia de los minerales estratégicos (commod1)
minerales_estrategicos <- informe_usa %>%
filter(!is.na(commod1)) %>%
count(commod1, sort = TRUE) %>%
top_n(10, n) # Seleccionar los 10 más frecuentes
# Gráfico de barras de los minerales estratégicos
ggplot(minerales_estrategicos, aes(x = reorder(commod1, n), y = n)) +
geom_bar(stat = "identity", fill = "steelblue") +
labs(title = "Minerales Estratégicos en Estados Unidos",
x = "Mineral Estratégico",
y = "Número de Registros") +
coord_flip() + # Rotar el gráfico para mejor visualización
theme_minimal()