Visão Geral

A transformação digital tem alterado a forma como governos organizam seus processos internos, contratam serviços, armazenam informações e entregam soluções à população.

Neste projeto, a análise se concentra nas despesas relacionadas à Tecnologia da Informação do Governo de Pernambuco entre 2020 e 2024, utilizando dados públicos disponibilizados pelo Tribunal de Contas do Estado de Pernambuco.

<span class="number">28.342</span>
<span class="label">registros relacionados à Tecnologia da Informação identificados</span>
<span class="number">R$ 2,19 bi</span>
<span class="label">valor pago em despesas de TI no ano de 2024</span>
<span class="number">+200%</span>
<span class="label">crescimento aproximado do valor pago entre 2020 e 2024</span>

Pergunta norteadora: Como evoluíram os gastos relacionados à Tecnologia da Informação no Governo de Pernambuco entre 2020 e 2024?

Introdução

A Tecnologia da Informação passou a desempenhar papel estratégico na administração pública. Sistemas informatizados, redes, infraestrutura digital, datacenters, licenças de software, telecomunicações, plataformas tecnológicas e mecanismos de segurança da informação são fundamentais para manter serviços públicos modernos, eficientes e seguros.

Nesse contexto, analisar despesas públicas relacionadas à TI permite observar como o governo direciona recursos para modernização administrativa e transformação digital.

Este projeto investiga a evolução dos gastos relacionados à Tecnologia da Informação no Governo de Pernambuco entre os anos de 2020 e 2024.

Objetivos

Objetivo geral

Analisar a evolução das despesas relacionadas à Tecnologia da Informação do Governo de Pernambuco entre 2020 e 2024.

Objetivos específicos

  • Importar arquivos XML de despesas estaduais;
  • Identificar a estrutura dos dados originais;
  • Selecionar variáveis financeiras e descritivas relevantes;
  • Filtrar registros associados à Tecnologia da Informação;
  • Consolidar os dados entre 2020 e 2024;
  • Gerar tabelas e gráficos para análise exploratória;
  • Interpretar os principais padrões encontrados.

Pacotes utilizados

library(xml2)
library(dplyr)

Os pacotes utilizados foram:

  • xml2: leitura e manipulação dos arquivos XML;
  • dplyr: organização, filtragem, consolidação e sumarização dos dados.

Fonte e descrição dos dados

Os dados utilizados neste projeto foram obtidos a partir dos arquivos XML de despesas estaduais disponibilizados pelo Tribunal de Contas do Estado de Pernambuco, por meio do sistema Tome Conta.

Foram analisados os arquivos referentes aos anos de 2020, 2021, 2022, 2023 e 2024. O recorte temporal foi escolhido por causa do grande volume dos arquivos originais, que possuem centenas de milhares de registros por ano.

Por que esse recorte é importante?
O período de 2020 a 2024 representa uma janela recente e relevante para observar a evolução dos investimentos em tecnologia no setor público, especialmente em um contexto de digitalização acelerada dos serviços.

Os dados possuem informações sobre empenhos, fornecedores, valores financeiros, unidade gestora, função, subfunção, natureza da despesa, histórico da despesa e ano de referência.

Entre as variáveis identificadas, destacam-se:

  • ano_referencia;
  • historico;
  • valor_empenhado;
  • valor_liquidado;
  • valor_pago;
  • nome_fornecedor;
  • funcao;
  • subfuncao;
  • categoria;
  • natureza.

Durante a inspeção inicial, foi identificada uma estrutura com aproximadamente 41 variáveis. Para o ano de 2020, foram encontrados 217.297 registros.

Preparação dos dados

Nesta etapa, os arquivos XML foram importados, as variáveis de interesse foram extraídas e os registros relacionados à Tecnologia da Informação foram selecionados por meio de palavras-chave presentes no campo historico.

O campo historico é essencial porque descreve a finalidade da despesa. Assim, ele permite identificar registros associados a temas como software, datacenter, licenças, sistemas, rede, telecomunicações, infraestrutura, segurança da informação, backup e videomonitoramento.

Localização dos arquivos

pasta <- "C:/Users/luizf/Downloads/TCE-PE/Backup/TomeConta/Despesas"

arquivos <- list.files(
  pasta,
  pattern = "\\.xml$",
  full.names = TRUE
)

arquivos <- arquivos[grepl("2020|2021|2022|2023|2024", arquivos)]

length(arquivos)
## [1] 5

Foram selecionados apenas os arquivos correspondentes ao período de 2020 a 2024.

Função de extração e filtragem

extrair_ti <- function(arq){

  xml <- read_html(arq)

  historico <- xml_text(xml_find_all(xml, ".//historico"))
  valor_pago <- xml_text(xml_find_all(xml, ".//valor_pago"))
  valor_empenhado <- xml_text(xml_find_all(xml, ".//valor_empenhado"))
  valor_liquidado <- xml_text(xml_find_all(xml, ".//valor_liquidado"))
  ano <- xml_text(xml_find_all(xml, ".//ano_referencia"))

  dados <- data.frame(
    ano,
    historico,
    valor_empenhado,
    valor_liquidado,
    valor_pago,
    stringsAsFactors = FALSE
  )

  dados_ti <- dados[
    grepl(
      "datacenter|software|sistema|licen[cç]a|monitoramento|rede|telecom|radio|troncalizado|seguran[cç]a|infraestrutura|tecnolog|backup|videomonitoramento",
      dados$historico,
      ignore.case = TRUE
    ),
  ]

  return(dados_ti)
}

A função acima realiza quatro etapas principais:

  1. Importa o arquivo XML;
  2. Extrai os campos de interesse;
  3. Organiza os dados em formato tabular;
  4. Filtra os registros relacionados à Tecnologia da Informação.

Observação metodológica:
A filtragem foi feita com base em palavras-chave no campo historico. Esse método permite identificar despesas relacionadas à tecnologia, mas depende da qualidade do texto registrado na base original.

Importação dos dados

ti2020 <- extrair_ti(arquivos[1])
ti2021 <- extrair_ti(arquivos[2])
ti2022 <- extrair_ti(arquivos[3])
ti2023 <- extrair_ti(arquivos[4])
ti2024 <- extrair_ti(arquivos[5])

Quantidade de registros por ano

registros <- data.frame(
  ano = c(2020, 2021, 2022, 2023, 2024),
  quantidade = c(
    nrow(ti2020),
    nrow(ti2021),
    nrow(ti2022),
    nrow(ti2023),
    nrow(ti2024)
  )
)

registros
##    ano quantidade
## 1 2020       4043
## 2 2021       4997
## 3 2022       6043
## 4 2023       5974
## 5 2024       7285

A tabela acima apresenta a quantidade de registros relacionados à Tecnologia da Informação identificados em cada ano.

Consolidação e limpeza

dados_ti <- rbind(
  ti2020,
  ti2021,
  ti2022,
  ti2023,
  ti2024
)

nrow(dados_ti)
## [1] 28342

Após a consolidação dos cinco anos, foi obtido um conjunto de dados com os registros relacionados à Tecnologia da Informação.

Conversão dos valores financeiros

dados_ti$valor_empenhado <- as.numeric(gsub(",", ".", dados_ti$valor_empenhado))
dados_ti$valor_liquidado <- as.numeric(gsub(",", ".", dados_ti$valor_liquidado))
dados_ti$valor_pago <- as.numeric(gsub(",", ".", dados_ti$valor_pago))
dados_ti$ano <- as.numeric(dados_ti$ano)

Os valores financeiros foram convertidos para formato numérico, permitindo somas, comparações e construção de gráficos.

Visualização inicial dos dados tratados

head(dados_ti, 10)
##      ano
## 6   2020
## 40  2020
## 48  2020
## 74  2020
## 104 2020
## 146 2020
## 167 2020
## 190 2020
## 312 2020
## 381 2020
##                                                                                                                                                                                                                                                      historico
## 6                                                                               PROJ.14799, CONTRATO 154/17 - REF AO SUPORTE NECESSÁRIO PARA LICENÇAS DE SEGURANÇA DO DATACENTER, COM ATUALIZAÇÃO TECNOLÓGICA E MONITORAMENTO. SEI: 00002305-08.2019.8.17.8017
## 40                                                                                                                                         Liberação de Repasse do CT 296.163-17 - Implantação de Sistema de Abastecimento de Água do Ibura - Morros do Ibura.
## 48                                                    VALOR QUE SE EMPENHA, PARA CUMPRIMENTO DO CONTRATO 34/19, CONFRORME, ARP/SEMOC/PCR, AUTORIZADO PELO OFICIO 878/2019 - SEMOC,PARA LOCAÇÃO ESTIMATIVA DE 35 RADIOS TRANSMISSORES/MES, SISTEMA TRONCOLIZADO
## 74                           EMPENHO ESTIMATIVO PARTA FAZER FACE AOS SERVIÇO  ADC PAM PRINCIPAL, PONTOS DE VOZ FIXO E SERVIÇO EXTRA-REDE NESTA FOP, DECORRENTE DO ADENDO Nº 001.2019.FOP.001  - PELA DISPENSA DE LICITAÇÃO 0169.2019 /0029.SAD - PECONECTADO I
## 104                                   Valor que se empenha para fazer face a serviço de trafego extra rede PE CONECTADO(FIXO) - TE - Lote II, ref. Processo Licitatório nº 0226.2018.CEL.PE.0146.SAD - Contrato Mater nº 002/SAD/SEADM/2019 - PE CONECTADO II.
## 146                 CONTRATAÇÃO DE EMPRESA ESPECIALIZADA, MEDIANTE ADESÃO À ATA DE REGISTRO DE PREÇOS, PARA DESENVOLVIMENTO DE FUNCIONALIDADES DE SOFTWARE COM MÉTRICA DE ACOMPANHAMENTO E DIMENSIONAMENTO EM PONTOS DE FUNÇÃO. SEI 1500000191.000142/2019-90.
## 167                                                      Contrato de fornecimento de até 3.600 garrafões de 20 litros  de  água mineral em sistema de comodato, nos termos do PE nº 0009-PGE-PE, PROCESSO Nº 0022.2019.CPL - SEI nº 3700000910.000111/2019-27.
## 190 empenho para fazer face aos serviço de Trafego extra-Rede, decorrente do ADENDO AO T. ADESÃO Nº 002.2019.FOP.001 Proc. Lict. nº 0226.2018.CEL.PE.0146.SAD-CONTRATO MATER Nº 002/SAD/SEADM/2019-PECONECTADO II - PROG. LIBERADA PARA EMPENBHAR PARA 4 MESES
## 312                                     Locação de recursos de tecnologia da informação para provimento de infraestrutura digital (50 notebooks), no período de 01/01 a 25/03/2020, conforme autorizado no Processo SEI nº C402492-6/2019. Contrato 0065/2019.
## 381                                                                                                                Liberação de Repasse do TC 350.863-33/2011 - Ampliação do Sistema de Esgotamento Sanitário de Olinda/PE. conf. CT/COMPESA /DGC Nº 108/2019.
##     valor_empenhado valor_liquidado valor_pago
## 6          33761.63        33761.63   33761.63
## 40        829885.95       829885.95  829885.95
## 48         61200.00        61200.00   61200.00
## 74          2111.57         2111.57    2111.57
## 104           35.58           35.58      35.58
## 146            0.00            0.00       0.00
## 167         4027.05         4027.05    4027.05
## 190           13.17           13.17      13.17
## 312         9916.67         9916.67    9916.67
## 381       548389.45       548389.45  548389.45

A amostra acima apresenta registros já filtrados e organizados, contendo ano, histórico e valores financeiros.

Análise Exploratória dos Dados

A análise exploratória busca transformar os registros tratados em informação útil. Nesta etapa, são observados os valores pagos, a quantidade de registros e a relação entre valores empenhados, liquidados e pagos.

Resumo anual dos investimentos

resumo_ano <- aggregate(
  cbind(
    valor_empenhado,
    valor_liquidado,
    valor_pago
  ) ~ ano,
  data = dados_ti,
  sum
)

resumo_ano
##    ano valor_empenhado valor_liquidado valor_pago
## 1 2020       699288557       699288557  692820725
## 2 2021      1010602253       970189231  997420353
## 3 2022      1898893728      1898857553 1887488391
## 4 2023      2010582143      2010582143 2001474681
## 5 2024      2212740683      2212740683 2193720585

A tabela acima apresenta os valores totais empenhados, liquidados e pagos para despesas relacionadas à Tecnologia da Informação em cada ano analisado.

1. A evolução: os investimentos cresceram ano após ano

plot(
  resumo_ano$ano,
  resumo_ano$valor_pago,
  type = "b",
  pch = 19,
  col = "#0F4C81",
  lwd = 3,
  main = "Evolução dos Investimentos em Tecnologia",
  xlab = "Ano",
  ylab = "Valor Pago (R$)"
)

Insight principal:
O valor pago em despesas relacionadas à Tecnologia da Informação cresceu de aproximadamente R$ 693 milhões em 2020 para mais de R$ 2,19 bilhões em 2024.

O gráfico evidencia uma tendência clara de crescimento dos investimentos em Tecnologia da Informação durante o período analisado.

Esse comportamento sugere aumento da relevância estratégica da tecnologia para a administração pública estadual, refletindo investimentos em infraestrutura digital, sistemas corporativos, segurança da informação, telecomunicações e modernização dos serviços públicos.

2. A expansão: mais registros ligados à tecnologia

barplot(
  registros$quantidade,
  names.arg = registros$ano,
  col = "#0F4C81",
  border = "#0B1F3A",
  main = "Quantidade de Registros Relacionados à TI",
  xlab = "Ano",
  ylab = "Quantidade"
)

Leitura do gráfico:
A quantidade de registros relacionados à tecnologia passou de 4.043 em 2020 para 7.285 em 2024.

Além do crescimento financeiro, também foi identificado aumento na quantidade de registros relacionados à Tecnologia da Informação.

Esse resultado sugere que não apenas os valores investidos cresceram, mas também a quantidade de contratos, serviços, licenças, sistemas e projetos tecnológicos registrados pelo Governo de Pernambuco.

3. A execução: o que foi planejado também foi pago?

matriz <- as.matrix(
  resumo_ano[, c(
    "valor_empenhado",
    "valor_liquidado",
    "valor_pago"
  )]
)

barplot(
  t(matriz),
  beside = TRUE,
  names.arg = resumo_ano$ano,
  legend.text = c(
    "Empenhado",
    "Liquidado",
    "Pago"
  ),
  col = c(
    "#0B1F3A",
    "#0F4C81",
    "#38BDF8"
  ),
  main = "Comparação dos Gastos em Tecnologia",
  ylab = "Valor (R$)"
)

Interpretação:
Os valores empenhados, liquidados e pagos apresentam comportamento semelhante ao longo dos anos, indicando consistência na execução das despesas tecnológicas.

O que os dados contam?

Os resultados encontrados revelam uma trajetória consistente de crescimento dos investimentos relacionados à Tecnologia da Informação no Governo de Pernambuco entre 2020 e 2024.

Ao analisar simultaneamente os valores financeiros e a quantidade de registros, percebe-se que o crescimento não ocorreu apenas por meio de contratos isolados de grande valor. Houve também aumento na quantidade de iniciativas, serviços, sistemas e soluções tecnológicas contratadas ao longo dos anos.

Esse comportamento sugere um processo contínuo de modernização tecnológica da administração pública estadual.

Principais Resultados

Os principais achados da análise podem ser resumidos nos seguintes pontos:

Crescimento dos investimentos

O valor pago em despesas relacionadas à Tecnologia da Informação apresentou crescimento expressivo ao longo do período analisado.

Em 2020, o valor pago foi de aproximadamente R$ 693 milhões.

Em 2024, esse valor ultrapassou R$ 2,19 bilhões.

Crescimento da quantidade de registros

A quantidade de registros classificados como relacionados à Tecnologia da Informação também aumentou.

Foram identificados:

  • 4.043 registros em 2020;
  • 4.997 registros em 2021;
  • 6.043 registros em 2022;
  • 5.974 registros em 2023;
  • 7.285 registros em 2024.

Esse crescimento indica expansão da participação da tecnologia nas despesas estaduais.

Consistência na execução orçamentária

Os valores empenhados, liquidados e pagos apresentaram comportamento semelhante ao longo do período analisado.

Isso sugere que uma parcela significativa dos recursos destinados à tecnologia foi efetivamente executada, reduzindo diferenças entre planejamento e realização financeira.

Discussão

A transformação digital tornou-se um dos principais desafios enfrentados pelas organizações públicas modernas.

A crescente demanda por serviços digitais exige investimentos em:

  • Infraestrutura tecnológica;
  • Sistemas corporativos;
  • Redes de comunicação;
  • Telecomunicações;
  • Segurança da informação;
  • Plataformas digitais;
  • Soluções de armazenamento e processamento de dados.

Durante a análise dos históricos das despesas foram encontrados diversos exemplos de investimentos diretamente relacionados à tecnologia, incluindo:

  • Licenciamento de software;
  • Sistemas de gestão;
  • Datacenters;
  • Infraestrutura hiperconvergente;
  • Soluções de backup;
  • Sistemas de videomonitoramento;
  • Serviços de telecomunicações;
  • Redes digitais;
  • Plataformas tecnológicas.

Esses resultados reforçam a importância crescente da Tecnologia da Informação para a operação e modernização da administração pública.

Além disso, o aumento contínuo dos investimentos sugere que a tecnologia deixou de ser apenas uma área de apoio operacional para assumir papel estratégico na gestão pública.

Conclusão da discussão:
Os dados indicam que a Tecnologia da Informação vem recebendo investimentos crescentes e contínuos, tornando-se um componente cada vez mais importante para a modernização da administração pública estadual.

Limitações do Estudo

Embora os resultados sejam consistentes, algumas limitações devem ser consideradas.

A identificação dos registros relacionados à Tecnologia da Informação foi realizada por meio de palavras-chave presentes no campo historico.

Essa estratégia possui vantagens por permitir análise automatizada de grandes volumes de dados, porém apresenta algumas limitações:

  • Dependência da qualidade dos históricos cadastrados;
  • Possibilidade de inclusão de registros não relacionados à tecnologia;
  • Possibilidade de exclusão de despesas tecnológicas descritas de forma diferente;
  • Dependência da interpretação textual dos registros.

Além disso, a análise concentrou-se apenas nos arquivos de 2020 a 2024 devido ao elevado volume dos dados históricos.

Apesar dessas limitações, o método utilizado permitiu identificar mais de 28 mil registros relacionados à Tecnologia da Informação, produzindo resultados consistentes para análise exploratória.

Trabalhos Futuros

Diversas extensões podem ser realizadas a partir deste estudo.

Entre elas:

  • Aplicação de técnicas de mineração de texto para classificação automática das despesas;
  • Utilização de processamento de linguagem natural (PLN);
  • Identificação dos principais fornecedores de tecnologia;
  • Análise por órgão público;
  • Análise por categoria de despesa;
  • Construção de dashboards interativos;
  • Ampliação da análise para anos anteriores a 2020.

Essas abordagens podem fornecer uma compreensão ainda mais detalhada dos investimentos públicos em tecnologia.

Conclusão

A presente análise teve como objetivo investigar a evolução das despesas relacionadas à Tecnologia da Informação no Governo de Pernambuco entre os anos de 2020 e 2024.

A partir da importação, tratamento e análise dos dados disponibilizados pelo Tribunal de Contas do Estado de Pernambuco, foi possível identificar uma trajetória consistente de crescimento dos investimentos tecnológicos.

Os resultados demonstraram:

  • Crescimento superior a 200% nos valores pagos;
  • Aumento da quantidade de registros relacionados à tecnologia;
  • Expansão de investimentos em sistemas, infraestrutura digital, telecomunicações e segurança da informação;
  • Consistência entre planejamento e execução financeira.

Os dados analisados indicam que a Tecnologia da Informação passou a ocupar papel cada vez mais relevante na administração pública estadual.

Os investimentos identificados refletem esforços de modernização, digitalização de processos, ampliação da infraestrutura tecnológica e melhoria da prestação de serviços públicos.

Dessa forma, conclui-se que a Tecnologia da Informação representa atualmente um dos pilares fundamentais para a transformação digital do setor público, contribuindo para maior eficiência administrativa, transparência e qualidade dos serviços oferecidos à população.

<span class="number">R$ 693 mi</span>
<span class="label">Valor pago em TI em 2020</span>
<span class="number">R$ 2,19 bi</span>
<span class="label">Valor pago em TI em 2024</span>
<span class="number">+200%</span>
<span class="label">Crescimento aproximado no período</span>

Referências

Tribunal de Contas do Estado de Pernambuco (TCE-PE). Tome Conta. Base de dados de despesas estaduais. Pernambuco.

R Core Team. R: A Language and Environment for Statistical Computing. Vienna: R Foundation for Statistical Computing.

WICKHAM, Hadley et al. Welcome to the tidyverse. Journal of Open Source Software, v. 4, n. 43, p. 1686.

XIE, Yihui; ALLAIRE, J. J.; GROLEMUND, Garrett. R Markdown: The Definitive Guide. Chapman and Hall/CRC.