Introdução
Este é o Relatório final da segunda unidade da matéria de Introdução a Ciência de Dados, ministrada pelo Professor Dr. Ricardo Olinda(UEPB). E tem como objetivos efetuar uma análise descritiva dos fatos apresentados, com seriedade e transparência. Visando principalmente a análise na econômia dos municípios do Estado de Santa Catarina. Analisando diretamente alguns fatores, tais eles como: PIB por município, Receita por Município, Dispesas por Município, menores e maiores valores de Receita, menores e maiores valores de Despesas e menores e maiores valores de PIB por minucípio. Apresentando estas devidas análises em formato gráfico, usufruíndo de todas as funcionalidades que o RStudio proporciona.
As análises efetuadas neste presente relatório foram fruto da utilização de bibliotecas, funcionalidades e comandos aplicados no SoftWare RStudio, utilizados por intermédio da linguagem de programação R, e gerados em forma de relatório HTML por meio do R Markdown. O R é um ambiente computacional e uma linguagem de programação especializada na manipulação, análise e visualização gráfica de dados. E na atualidade é considerado um dos melhores ambientes computacionais para essa finalidade. E utilizado juntamente do RStudio é uma ferramenta com um enorme potencial e poder de análise, leitura, manipulação e exibição de enormes ou pequenas massas de dados.
Já o RStudio é um ambiente de desenvolvimento de códigos que utiliza da linguagem R. Ele funciona como uma espécie de interface gráfica, e para utilizá-lo é necessário já possuir o R instalado em seu computador. E sua principal vantagem é permitir que o usuário ou analista tenha a capacidade de manipular, seja de quais maneiras for, grandes massas de dados de maneira muito mais organizada e intuitiva.
É conhecido que o Estado de Santa Catarina é um dos estados mais
ricos do Brasil. Em 2020 Santa Catarina ocupava a 5 posição entre os
estados do Brasil com maior PIB per capita. Estando em 1 lugar - São
Paulo, 2 lugar - Rio de Janeiro, 3 lugar - Minas Gerais, 4 lugar - Rio
Grande do Sul e 5 lugar - Santa Catarina(IBGE - 2020).
Porém aqui neste relatório venho deixar ainda mais claro alguns dos
fatores que tornam o Estado de Santa Catarina ser conhecido por seu alto
índice de desenvolvimento. Fazendo isso através de gráficos, tabelas, e
informações cruzadas no R.
Materiais
O banco de dados referente aos Municípios de Santa Catarina, utilizado neste relatório, foi adquirido no site do oficial do IBGE. Com o seguinte endereço: link
A imagem da bandeira do Estado de Santa Catarina foi adquirida no seguinte endereço: link
Métodos
O relatório baseia-se em utilizar da análise descritiva e exploratória dos fatores econômicos, de Santa Catarina, como principal objeto tomador de decisão. Combinando assim variáveis-chave e extraindo o resultado desse cruzamento de dados.
Para a manipulação dos dados e efetuação das funções foi utilizado a linguagem de programação R, por intermédio do Software RStudio. Sendo esta a principal ferramenta utilizada para a elaboração deste relatório.
Para manipulação do extenso banco de dados foi utilizado o software Google Planilhas. Sendo esta a principal ferramenta utilizada para manipulação e mineração dos dados.
Foram utilizadas as seguintes representações gráficas: Graficos de Dispersão e Tabelas Ordenadas.
Definição e uso de Gráficos de Dispersão:
Dispersão é um conceito estatístico que se refere à variabilidade dos dados em torno de uma medida central, como a média. Em outras palavras, a dispersão indica o quão “espalhados” ou variados são os valores de uma amostra ou população. É uma medida importante, pois permite avaliar a consistência dos dados e identificar possíveis padrões ou outliers.
Definição e uso de tabelas:
As tabelas exibem dados em linhas e colunas. As tabelas facilitam a
comparação de pares de valores relacionados ou a exibição de informações
qualitativas (por exemplo, vendas trimestrais ao longo de vários
anos).
Existem vários motivos pelos quais você pode selecionar uma tabela em
vez de um gráfico, como a maneira certa de visualizar seus dados.
- Foram também utilizados funções contidas nas seguintes bibliotecas:
readxl,ggplot2,rmarkdown,tidyverseedplyr.
Uso do readxl:
O pacote readxl facilita a obtenção de dados do Excel para R. Comparado a muitos dos pacotes existentes (por exemplo, gdata, xlsx, xlsReadWrite), o readxl não possui dependências externas, por isso é fácil de instalar e usar em todos os sistemas operacionais. Ele foi projetado para trabalhar com dados tabulares.
Uso do ggplot2:
gplot2 é um sistema para criação declarativa de gráficos, baseado na Gramática dos Gráficos. Você fornece os dados, diz ao ggplot2 como mapear variáveis para grafica visual, quais primitivas gráficas usar e ele cuida dos detalhes.
Uso do rmarkdown:
O pacote rmarkdown ajuda a criar documentos de análise dinâmica que combinam código, saída renderizada (como figuras) e prosa. Você traz seus dados, código e ideias, e o R Markdown transforma seu conteúdo em um documento sofisticado.
Uso do tidyverse:
O tidyverseé um conjunto de pacotes do R desenvolvido por Hadley Wickham que buscam suprir todas as ferramentas necessárias para um fluxo de trabalho completo em ciências de dados.
Uso do dplyr:
O dplyr é um pacote da linguagem R desenvolvido especificamente para manipulação de dados, muito utilizado em tarefas de pré-processamento para machine learning. Ele faz parte da coleção de pacotes Tidyverse, que tem como principal desenvolvedor Hadley Wickam, cientista chefe do RStudio e professor de estatística na Universidade de Auckland, Stanford University, e Rice University.
Resultados
Neste módulo irei apresentar os resultados obtidos por meio das
funcionalidades do R, como a exibição de tabelas, gráficos de
pontos e informações teóricas acerca do assunto dado. Serão análisados
neste tópico as seguintes variáveis: Múnicipio, Índice de
Desenvolvimento Humano Municipal(IDHM), Receitas Realizadas, Despesas
empenhadas, e o Produto Interno Bruto(PIB) dos municípios do Estado de
Santa Catarina.
Primeiro serão apresentados dados sobre cada variável, visando
principalmente os 10 principais de cada categoria, e logo após isso será
feita a efetuação do cruzamento de dados de forma clara e limpa.
Podemos observar que entre os 10 municípios, a capital Catarinense Florianópolis aparece em primeiro lugar com nesta lista com um valor de 0,847 de seu IDHM(2010). E dentre as 10 maiores, muito próximo da capital Catarinense, o segundo colocado é o Município de Balneário Camboriú, com um valor de Índice de Desenvolvimento Humano Municípal de 0,845(2010). E entre as 10 maiores Índices de Desenvolvimento Humano Municípal podemos observar que o pior colocado nesta lista é o município de São Miguel do Oeste, com o valor de seu Índice de Desenvolvimento Humano em 0,801(2010).
Podemos observar que entre os 10 municípios, a capital Catarinense Florianópolis aparece em segundo lugar com nesta lista com um valor de 1756259,97 de receitas anuais acumuladas(numa excala de x1000). E dentre as 10 maiores receita em 2017, o primeiro colocado é o Município de Joinville com um valor de receitas acumuladas de 2280394,18(numa escala de x1000). E entre as 10 maiores receitas de Santa Catarina no ano de 2017 podemos observar que o pior colocado nesta lista é o município de Lages, com um valor de receitas acumuladas de 575551,54(numa escala de x1000).
Podemos observar que entre os 10 municípios, a capital Catarinense Florianópolis aparece em segundo lugar com 1706736,75 de despesas empenhadas acumuladas(numa excala de x1000). E dentre as 10 maiores despesas de 2017, o primeiro colocado é o Município de Joinville com um valor acumulado de despesas empenhadas de 1907863,93(numa escala de x1000). E entre os 10 municípios com maiores despesas empenhadas, podemos observar que o pior colocado dessa lista é o município de Lages, com um valor de despesas empenhadas de 512302,60(numa escala de x1000).
Podemos observar que entre os 10 municípios, a capital Catarinense Florianópolis não aparece entre os 10 maiores PIB de Santa Catarina, porém tem um PIB de 41885,53(2020). E dentre os 10 maiores PIB, o primeiro colocado é o Município de Piratuba com um Produto Interno Bruto no valor de 198923,18(2020). E entre os 10 municípios com maior Produto Interno Bruto, podemos observar que o pior colocado dessa lista é o município de Mondaí, com um Produto Interno Bruto de 73494,72(2020).
As 10 menores Receitas - Santa Catarina
MUN: MUNICÍPIOS; RE: RECEITAS REALIZADAS R$ (×1000) [2017]
Podemos observar aqui a tabela com os 10 municípios com a pior colocação quando cruzamos os dados de Receitas Realizadas. É possível observar que o município que ocupa a primeira posição desta tabela é o município de São Miguel da Boa Vista, que tem um valor de receitas de 12912.24(numa escala de x1000). E quando equiparado com os dados obtidos nos gráficos a cima, há uma enorme diferença do município melhor colocado nesta categoria, Joinville. Que como visto a cima tem um valor de receitas aculumadas de 2280394,18(numa escala de x1000).
As 10 menores Despesas - Santa Catarina
MUN: MUNICÍPIOS; DES: DESPESAS EMPENHADAS R$ (×1000) [2017]
Podemos observar aqui com os 10 municípios com a pior colocação quando cruzamos os dados de Despesas Empenhadas. É possível observar que o município que ocupa a primeira posição desta tabela é o município de São Miguel da Boa Vista, que tem um valor de despesasa empenhadas de 10033.11(numa escala de x1000). E quando equiparado com os dados obtidos nos gráficos a cima, há uma enorme diferença do município melhor colocado nesta categoria, Joinville. Que como visto a cima tem um valor de despesas empenhadas de 1907863,93(numa escala de x1000).
Os 10 menores PIBs - Santa Catarina
MUN: MUNICÍPIOS; PIB: PRODUTO INTERNO BRUTO [2010]
Podemos observar aqui com os 10 municípios com a pior colocação quando cruzamos os dados de Produto Interno Bruto. É possível observar que o município que ocupa a primeira posição desta tabela é o município de Pescaria Brava, que tem um valor de Produto Interno Bruto de 10600.01(2020). E quando equiparado com os dados obtidos nos gráficos a cima, há uma enorme diferença do município melhor colocado nesta categoria, Piratuba. Que como visto a cima tem um valor de Produto Interno Bruto no valor de 198923,18(2020).
Conclusões
A partir das análises efetuadas neste relatório foram possíveis tirar conclusões objeticas acerca dos objetos levantados a pesquisa neste presente documento.
É conhecido que o Estado de Santa Catarina é um dos estados mais ricos do Brasil. Em 2020 Santa Catarina ocupava a 5 posição entre os estados do Brasil com maior PIB per capita. Estando em 1 lugar - São Paulo, 2 lugar - Rio de Janeiro, 3 lugar - Minas Gerais, 4 lugar - Rio Grande do Sul e 5 lugar - Santa Catarina.
Como visto neste relatório. O Estado de Santa Catarina tem muitos municípios a cima da média nacional em termos de riquezas internas. A exmplo de Joinville, que como visto nos resultados mostrados na unidade anterior, tem o maior índice de Receita e PIB per capita do Estado. E quando equiparadas a outros estados brasileiros, a exemplo da Paraíba, que tem um PIB de 70.292(numa escala de x1000000), enquanto o Estado de Santa Catarina acumula um PIB de 349.275(numa escala de x1000000), ambos dados coletados pelo IBGE em 2020.
Referencias
Sobre o R e RStudio - https://www.est.ufmg.br/~cristianocs/Pacotes2021/Intro.html#11
Dados sobre o PIB - https://www.ibge.gov.br/explica/pib.php
Sobre os métodos gráficos - https://infogram.com/blog/choose-the-right-chart/#:~:text=Gr%C3%A1ficos%20de%20linhas%2C%20barras%20e,tiver%20muitos%20dados%20para%20visualizar.
Sobre readxl - https://readxl.tidyverse.org/
Sobre o ggplot2 - https://ggplot2.tidyverse.org/
Sobre o rmarkdown - https://rmarkdown.rstudio.com/docs/
Sobre o tidyverse - https://rpubs.com/RicardoJ/minicurso_tidyverse
Sobre o dplyr - https://didatica.tech/o-pacote-dplyr-linguagem-r/
Sobre os métodos gráficos - https://www.fm2s.com.br/public/blog/grafico-de-dispersao
Anexo
Caminhos utilizados na elaboração deste relatório estão no seguinte link: https://rpubs.com/ThiagoArnaud/Caminhos