Las librerías que se utilizaron en el siguiente taller fueron las siguientes:
library(data.table)
library(dplyr)
library(knitr)Se realiza la carga de la base datos: La base de datos contiene un directorio de empresas y su clasificación CIUU de actividad económica.
dirEmpresas <- read.csv2("C:/Users/salad507/Downloads/Df_dirEmpresas/DF_dirEmpresas.csv", sep = ",")
dirEmpresasConsulte la base de datos de empresas. ¿Cuál es el tercer Dpto con mayor número de sociedades que “extraen carbón de hulla”?
empresas_carbon_hulla <- dirEmpresas %>%
group_by(nombre_dpto) %>%
filter(nombre_clase == "Extracción de hulla (carbón de piedra)") %>%
summarise(num_empresas = n()) %>% arrange(desc(num_empresas))
kable(empresas_carbon_hulla)| nombre_dpto | num_empresas |
|---|---|
| BOYACA | 414 |
| CUNDINAMARCA | 380 |
| NORTE DE SANTANDER | 324 |
| BOGOTA | 274 |
| ANTIOQUIA | 88 |
| VALLE | 46 |
| ATLANTICO | 42 |
| SANTANDER | 17 |
| CAUCA | 9 |
| CESAR | 6 |
| CORDOBA | 5 |
| CASANARE | 3 |
| RISARALDA | 3 |
| BOLIVAR | 2 |
| CAQUETA | 2 |
| CALDAS | 1 |
| GUAJIRA | 1 |
| HUILA | 1 |
| NARIÑO | 1 |
Se puede evidenciar que el tercer departamento con mayor número de sociedades es NORTE DE SANTANDER con 324
Consulte la base de datos de empresas ¿Cuántas empresas hay registradas en Bogotá cuya actividad sea “edición de música”?
empresas_bogota_edicion_musica <- dirEmpresas %>%
filter(nombre_dpto == "BOGOTA") %>%
filter(nombre_clase == "Actividades de grabación de sonido y edición de música") %>%
nrow()
empresas_bogota_edicion_musica## [1] 372
Existen 372 empresas registradas en Bogotá cuya actividad sea “edición de música”
Consulte la base de datos de empresas y cargue la base de datos df_info_mpio.Rds. Calcule la correlación entre el valor agregado per-cápita y el tamaño del municipio.
info_municipio <- readRDS("C:/Users/salad507/Downloads/df_info_mpio.Rds")info_municipio <- info_municipio %>% mutate(valor_agregado_percapita = valor_agregado_2016 / poblacion_2019)
round(cor(info_municipio$valor_agregado_percapita, info_municipio$poblacion_2019),2)## [1] 0.04
La correlacion entre el valor agregado per-cápita y el tamaño del municipio es de aprox 0.04
Consulte la base de datos de empresas. Calcule la correlación entre el valor agregado 2016 y el tamaño según población, por departamento.
correlacion_resultado <- info_municipio %>%
group_by(nom_dpto) %>%
summarise(valor_agregado_2016 = sum(valor_agregado_2016),
poblacion_total = sum(poblacion_2019))
round(cor(correlacion_resultado$valor_agregado_2016, correlacion_resultado$poblacion_total),2)## [1] 0.95
La correlación general es de 0.95
Consulte la base de datos de empresas. Calcule la correlación entre la cantidad de empresas de la sección “industrias manufactureras” y el valor agregado 2016, por municipio.
info_municipio$cod_mpio <- as.numeric(info_municipio$cod_mpio)
datos_completos <- inner_join(x = dirEmpresas, y = info_municipio, by = ("cod_mpio"))
datos_completosindustrias_manufactureras <- datos_completos %>% filter(nombre_seccion == "INDUSTRIAS MANUFACTURERAS") %>% group_by(nombre_mpio) %>% summarise(cantidad_empresas = n(), valor_agregado_2016 = sum(valor_agregado_2016))
round(cor(industrias_manufactureras$cantidad_empresas, industrias_manufactureras$valor_agregado_2016),2)## [1] 0.96
la correlación entre la cantidad de empresas de la sección “industrias manufactureras” y el valor agregado 2016 es de aprox 0.96