1. Introdução e Objetivos

1.1 Contexto

Este projeto analisa dados de permissões de construção (Building Permits) da cidade de São Francisco, Califórnia, cobrindo um período de 5 anos (janeiro de 2013 a fevereiro de 2018) com aproximadamente 200.000 registros.

Uma permissão de construção é um documento oficial de aprovação emitido por uma agência governamental que permite ao proprietário ou contratante prosseguir com um projeto de construção ou reforma em sua propriedade. Cada cidade ou condado possui seu próprio departamento relacionado a edificações, que desempenha múltiplas funções como emissão de permissões, inspeção de edifícios para garantir medidas de segurança, e modificação de regulamentos para acomodar as necessidades da população em crescimento.

O dataset foi obtido no Kaggle (Building Permit Applications Data) e contém 43 colunas com informações detalhadas sobre cada permissão emitida, incluindo tipo de permissão, localização, custos estimados, datas de solicitação e aprovação, status, e informações do solicitante.

1.2 Base de Dados

O dataset consiste em um único arquivo contendo 43 colunas e aproximadamente 200.000 registros de permissões de construção. As principais categorias de informações incluem:

Informações Temporais: - Datas de solicitação, emissão, aprovação e conclusão - Tempo de processamento das permissões

Informações de Localização: - Endereço completo - Número do bloco e lote - Coordenadas geográficas (latitude e longitude) - Distrito supervisor - Bairro

Informações do Projeto: - Tipo de permissão - Situação da permissão - Descrição do trabalho proposto - Número de unidades existentes e propostas - Custo estimado do projeto

Informações Administrativas: - Número da permissão - Número da solicitação - Informações do solicitante - Departamento responsável

Dados Estruturais: - Tipo de construção - Uso existente e proposto da propriedade

1.3 Objetivos

Este projeto visa realizar uma análise exploratória dos dados de permissões de construção de San Francisco para extrair insights sobre o processo de aprovação, padrões de desenvolvimento urbano e eficiência administrativa. Os objetivos específicos são:

Análise Temporal:

  • Analisar o tempo de processamento para diferentes tipos de permissões
  • Identificar tendências anuais no volume de solicitações e aprovações

Análise de Tipos de Permissões:

  • Caracterizar os diferentes tipos de permissões e suas frequências
  • Analisar a distribuição de status das permissões

Análise Geográfica:

  • Explorar a distribuição espacial das permissões pela cidade
  • Identificar áreas com maior atividade de construção

Análise de Custos:

  • Examinar a distribuição de custos estimados dos projetos
  • Relacionar custos com tipos de permissões

2. Pacotes Requeridos

# Pacotes

3. Preparação dos Dados

3.1 Descrição das Colunas

O dataset de Building Permits contém 43 colunas. Abaixo estão descritas todas as colunas do dataset:

Identificação e Tipo da Permissão
  • Permit Number: Número atribuído durante o protocolo da permissão
  • Permit Type: Tipo da permissão representado numericamente
  • Permit Type Definition: Descrição do tipo de permissão, por exemplo, nova construção, alterações
  • Record ID: Identificador do registro (não útil para análise)
Informações Temporais
  • Permit Creation Date: Data em que a permissão foi criada, posterior ou igual à data de protocolo
  • Filed Date: Data de protocolo da permissão
  • Issued Date: Data de emissão da permissão
  • Completed Date: Data em que o projeto foi concluído, aplicável se Current Status = “completed”
  • First Construction Document Date: Data em que a construção foi documentada
  • Permit Expiration Date: Data de expiração relacionada à permissão emitida
  • Current Status Date: Data em que o status atual foi registrado
Status e Acompanhamento
  • Current Status: Status atual da solicitação de permissão
  • Structural Notification: Notificação para atender alguma necessidade legal, dada ou não
Localização do Imóvel
  • Block: Relacionado ao endereço
  • Lot: Relacionado ao endereço
  • Street Number: Relacionado ao endereço
  • Street Number Suffix: Relacionado ao endereço
  • Street Name: Relacionado ao endereço
  • Street Name Suffix: Relacionado ao endereço
  • Unit: Unidade de um edifício
  • Unit suffix: Sufixo, se houver, para a unidade
  • Zipcode: CEP do endereço do edifício
  • Supervisor District: Distrito supervisor ao qual a localização do edifício pertence
  • Neighborhoods - Analysis Boundaries: Bairro ao qual a localização do edifício pertence
  • Location: Localização em par de latitude e longitude
Descrição do Projeto
  • Description: Detalhes sobre o propósito da permissão. Exemplo: recobertura, renovação de banheiro
Características do Edifício - Existentes
  • Number of Existing Stories: Número de andares existentes no edifício. Não aplicável para certos tipos de permissão
  • Existing Use: Uso existente do edifício
  • Existing Units: Número existente de unidades
  • Existing Construction Type: Tipo de construção existente, como categorias representadas numericamente
  • Existing Construction Type Description: Descrição do tipo acima, por exemplo, madeira ou outros tipos de construção
Características do Edifício - Propostas
  • Number of Proposed Stories: Número de andares propostos para a construção/alteração
  • Proposed Use: Uso proposto do edifício
  • Proposed Units: Número proposto de unidades
  • Proposed Construction Type: Tipo de construção proposta, como categorias representadas numericamente
  • Proposed Construction Type Description: Descrição do tipo acima
Custos do Projeto
  • Estimated Cost: Estimativa inicial do custo do projeto
  • Revised Cost: Estimativa revisada do custo do projeto
Regulamentações e Conformidade
  • Voluntary Soft-Story Retrofit: Andar flexível para atender regulamentos de terremoto
  • Fire Only Permit: Permissão relacionada à prevenção de risco de incêndio
  • TIDF Compliance: Conformidade com TIDF ou não, este é um novo requisito legal
  • Site Permit: Permissão para o local
Documentação
  • Plansets: Representação do plano indicando a intenção geral de design da fundação

3.2 Carregamento e Importação dos Dados

Nesta etapa, realizaremos a importação do dataset de Building Permits para o ambiente R. O processo inclui:

  1. Definição do caminho: Especificar o diretório onde o arquivo CSV está armazenado
  2. Importação: Utilizar a função read.csv() com parâmetros adequados
  3. Conversão de tipos de dados:
    • Converter colunas de data de string para objetos Date/POSIXct
    • Converter custos para valores numéricos
    • Processar coordenadas geográficas
  4. Tratamento de valores ausentes: Identificar e tratar NAs de forma apropriada
  5. Remoção de colunas inutilizadas: Excluir colunas que não serão relevantes para a análise (como Record ID e outras redundantes)
  6. Criação de variáveis derivadas:
    • Calcular tempo de processamento (Issued Date - Filed Date)
    • Criar categorias para análises agregadas
  7. Filtragem e limpeza: Remover registros inconsistentes ou duplicados

Detalhe:

  • Valores ausentes são comuns em colunas opcionais como Completed Date, Unit, Revised Cost
  • Coordenadas geográficas estão em formato de string e necessitam parsing
  • Custos podem conter valores zero ou NA para projetos sem estimativa

4. Análise Exploratória

5. Conclusão