# Cargar las librerías necesarias
library(readxl)
library(dplyr)
library(ggplot2)

# Leer el archivo Excel
file_path <- "TABLA 2 DE ACEROS_040545.xlsx"
data <- read_excel(file_path, sheet = "Hoja1")

# Limpiar los datos de país
data <- data %>%
  mutate(PAIS = gsub("\\n", " ", PAIS))
# Distribución de la producción por país
production_by_country <- data %>%
  group_by(PAIS) %>%
  summarise(Total_Produccion = sum(BASE, na.rm = TRUE)) %>%
  arrange(desc(Total_Produccion))
print(production_by_country)
## # A tibble: 16 × 2
##    PAIS            Total_Produccion
##    <chr>                      <dbl>
##  1 "Reino\r Unido"            150. 
##  2 "China"                     66.2
##  3 "EE.UU."                    59.6
##  4 "Japón"                     59.6
##  5 "Rusia"                     51.2
##  6 "India"                     34.8
##  7 "Corea"                     32.3
##  8 "Brasil"                    27.4
##  9 "Japon"                     25.8
## 10 "Italia"                    25  
## 11 "Alemania"                  18.2
## 12 "Taiwán"                    12.7
## 13 "Ucrania"                   10.1
## 14 "España"                     8.2
## 15 "México"                     7.8
## 16 "Irán"                       5.6
# Gráfico de barras de la producción por país
ggplot(production_by_country, aes(x = reorder(PAIS, Total_Produccion), y = Total_Produccion)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = round(Total_Produccion, 1)), vjust = -0.3) +
  labs(title = "Distribución de la Producción de Acero por País",
       x = "País", y = "Producción (BASE)") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

# Consolidar la capacidad de producción por empresa
consolidated_data <- data %>%
  group_by(EMPRESA) %>%
  summarise(CAPACIDAD = sum(`CAPACIDAD (%)`, na.rm = TRUE)) %>%
  arrange(desc(CAPACIDAD))

# Identificar las principales empresas por capacidad de producción
top_companies <- consolidated_data %>%
  head(10)

# Gráfico de barras de las principales empresas por capacidad de producción
ggplot(top_companies, aes(x = reorder(EMPRESA, CAPACIDAD), y = CAPACIDAD)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = round(CAPACIDAD, 2)), hjust = -0.3) +
  coord_flip() +
  scale_y_continuous(limits = c(0, 0.35)) +
  labs(title = "Top 10 Empresas por Capacidad de Producción",
       x = "Empresa", y = "Capacidad de Producción (%)") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

# Agrupar por tipo de acero y calcular la producción total para cada tipo
production_by_type <- data %>%
  group_by(`TIPO DE ACERO`) %>%
  summarise(Total_Produccion = sum(BASE, na.rm = TRUE)) %>%
  arrange(desc(Total_Produccion))

# Ver los resultados
print(production_by_type)
## # A tibble: 2 × 2
##   `TIPO DE ACERO` Total_Produccion
##   <chr>                      <dbl>
## 1 ACEROS PLANOS               390.
## 2 ACEROS LARGOS               205.
# Gráfico de barras de la producción por tipo de acero
ggplot(production_by_type, aes(x = reorder(`TIPO DE ACERO`, Total_Produccion), y = Total_Produccion)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = round(Total_Produccion, 1)), vjust = -0.3) +
  labs(title = "Producción Total por Tipo de Acero",
       x = "Tipo de Acero", y = "Producción Total (BASE)") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

# Agrupar por empresa y calcular la capacidad de producción total para cada empresa
capacity_by_company <- data %>%
  group_by(EMPRESA) %>%
  summarise(Total_Capacidad = sum(`CAPACIDAD (%)`, na.rm = TRUE)) %>%
  arrange(desc(Total_Capacidad))

# Ver los resultados
print(capacity_by_company)
## # A tibble: 34 × 2
##    EMPRESA           Total_Capacidad
##    <chr>                       <dbl>
##  1 Arcelor Mittal               0.25
##  2 JFE Steel Group              0.07
##  3 Nippon Steel                 0.07
##  4 US Steel Group               0.05
##  5 Posco Group                  0.04
##  6 Shanghai Baosteel            0.04
##  7 Gerdau Group                 0.03
##  8 Nucor Group                  0.03
##  9 Riva Group                   0.03
## 10 Tata Corus Group             0.03
## # ℹ 24 more rows
# Gráfico de barras de la capacidad de producción por empresa
ggplot(capacity_by_company, aes(x = reorder(EMPRESA, Total_Capacidad), y = Total_Capacidad)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = round(Total_Capacidad, 2)), hjust = -0.3) +
  coord_flip() +
  scale_y_continuous(limits = c(0, 0.35)) +
  labs(title = "Capacidad Total de Producción por Empresa",
       x = "Empresa", y = "Capacidad de Producción (%)") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))