#Actividad final Análisis y Visualización de datos con Rstudio
#Análisis territorial y socioeconómico con datos del DENUE usando R
# Cargar librerías
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.3.3
## Warning: package 'tibble' was built under R version 4.3.3
## Warning: package 'tidyr' was built under R version 4.3.3
## Warning: package 'readr' was built under R version 4.3.3
## Warning: package 'purrr' was built under R version 4.3.3
## Warning: package 'dplyr' was built under R version 4.3.3
## Warning: package 'lubridate' was built under R version 4.3.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.1 ✔ stringr 1.6.0
## ✔ ggplot2 4.0.2 ✔ tibble 3.2.1
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.0.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
# Importar la base de datos (asegúrate de tener el CSV en el mismo directorio)
denue_tam <- read_csv("denue_28.csv", locale = locale(encoding = "latin1"))
## Rows: 148560 Columns: 42
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (33): clee, nom_estab, raz_social, nombre_act, per_ocu, tipo_vial, nom_v...
## dbl (9): id, codigo_act, numero_ext, numero_int, cod_postal, cve_ent, telef...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# === Parte 3. Limpieza y filtrado ===
# Aunque todo el dataset es de Tamaulipas (entidad 28), aplicamos el filtro como pide la rúbrica.
denue_tam_filtrado <- denue_tam %>%
filter(entidad == "TAMAULIPAS" | entidad == "Tamaulipas")
# === Parte 4. Generación de indicadores ===
# Indicador 1: Número de establecimientos por municipio
estab_por_municipio <- denue_tam_filtrado %>%
group_by(municipio) %>%
summarise(total_establecimientos = n()) %>%
arrange(desc(total_establecimientos))
# Indicador 2: Distribución por tamaño de empresa (personal ocupado)
estab_por_tamano <- denue_tam_filtrado %>%
group_by(per_ocu) %>%
summarise(total_establecimientos = n()) %>%
arrange(desc(total_establecimientos))
# === Parte 5. Visualización de datos con ggplot2 ===
# Gráfica 1: Establecimientos por municipio (Mostrando el Top 15 para mejor lectura)
estab_por_municipio %>%
top_n(15, total_establecimientos) %>%
ggplot(aes(x = reorder(municipio, total_establecimientos), y = total_establecimientos)) +
geom_col(fill = "steelblue") +
coord_flip() +
labs(title = "Top 15 Municipios con más Establecimientos en Tamaulipas",
x = "Municipio",
y = "Número de Establecimientos") +
theme_minimal()
# Gráfica 2: Distribución por tamaño de empresa
estab_por_tamano %>%
ggplot(aes(x = reorder(per_ocu, total_establecimientos), y = total_establecimientos)) +
geom_col(fill = "darkorange") +
coord_flip() +
labs(title = "Distribución de Establecimientos por Tamaño (Personal Ocupado)",
x = "Rango de Personal Ocupado",
y = "Número de Establecimientos") +
theme_minimal()
¿Cuántos registros contiene el dataset?
Contiene exactamente 148,560 registros (unidades económicas).
¿Qué variables describen la actividad económica?
Principalmente las variables codigo_act (código SCIAN) y nombre_act (descripción de la actividad económica). Además, per_ocu (personal ocupado) describe el tamaño o escala de esa actividad económica.
¿Qué variables representan ubicación geográfica?
cve_ent y entidad (estado), cve_mun y municipio, cve_loc y localidad, ageb, manzana, cod_postal, así como las coordenadas geográficas exactas latitud y longitud.
¿Qué municipio concentra más actividad económica?
Reynosa, con 26,156 establecimientos registrados, seguido de Matamoros (24,969), Tampico (15,655) y Victoria (15,576).
¿Qué tipo de empresa predomina en la región?
Las microempresas, en su gran mayoría correspondientes al rango de “0 a 5 personas” ocupadas (con 128,839 unidades económicas, representando la inmensa mayoría del estado).
El análisis del Directorio Estadístico Nacional de Unidades Económicas (DENUE) para Tamaulipas revela una marcada concentración de la actividad económica en la región fronteriza norte. Reynosa y Matamoros son los municipios con la mayor cantidad de establecimientos en el estado, lo cual responde a su dinámica posición como cruces fronterizos y polos industriales y logísticos. Por otro lado, municipios de la zona centro y sur como Victoria y Tampico, también muestran una fuerte presencia, indicando nodos comerciales de importancia regional.
En cuanto a la estructura empresarial, existe un claro predominio de las microempresas. La inmensa mayoría del tejido empresarial está conformado por establecimientos de “0 a 5 personas”. Las implicaciones socioeconómicas de esto sugieren una economía altamente dependiente de pequeños comercios y servicios orientados al consumo local, lo que frecuentemente se asocia al autoempleo. Si bien las grandes empresas manufactureras o maquiladoras en la frontera pueden concentrar el mayor volumen de empleados o flujo de capital, el número bruto de unidades económicas pertenece al microempresario.
Esto nos permite identificar importantes oportunidades de desarrollo económico. Las políticas públicas y el sector privado podrían enfocarse en programas de digitalización, facilitación de créditos blandos y profesionalización empresarial para apuntalar a estas microempresas, con el objetivo de encadenarlas a las grandes industrias maquiladoras del norte, promoviendo un crecimiento más equitativo y menos vulnerable para la entidad.