Aqui você deve fazer uma pequena introdução apresentando seu objeto de estudo, sua pergunta de pesquisa, e como voce pretende analisar o problema que você está interessado com os dados que você coletou da internet.
Atualmente a preocupação com a qualidade do meio ambiente ocorre a nível mundial, e está sendo discutido frequentemente (JOSÉ et al., 2005). Nesse contexto, a procura pela produção de mudas de espécies florestais nativas está aumentando nos últimos tempos, em decorrência da necessidade de recompor áreas que vem sendo drasticamente degradadas (RODRIGUES et al., 2002; SILVA; CARVALHO, 2008). Estas espécies permitem reconstruir as interações ambientais que foram destruídas dentro de uma comunidade e a restauração do local através da reprodução sexuada das espécies (DANTAS, 2018; NEVES et al., 2018).
Segundo a fundação SOS Mata atlântica e INPE (2001), no estado do Rio de Janeiro existe um registro de cerca de 17% de remanescentes do bioma mata atlântica, localizados nas regiões sul.
As espécies nativas da Mata Atlântica, que foram sugeridas para produção de mudas destinadas à projetos de restauração ecológica no estado do Rio de Janeiro, é composta por lenhosas arbustivas e/ ou arbóreas e palmeiras, referente à reunião de dados gerados a partir de trabalhos de pesquisa e extensão do Jardim Botânico do Rio de Janeiro e ainda da experiência da produção de mudas realizada no viveiro particular da empresa de engenharia florestal Biovert Florestal e Agrícola Ltda., localizado no município de Silva Jardim, RJ, Brasil.
Para as áreas de ocorrência (fitofisionomias), os habitats utilizados na classificação das espécies são os que pertencem ao Estado, sendo eles: Floresta Ombrófila (FO), Floresta Estacional (FE), Restinga (RE) (Vegetação com influência marinha) e Manguezal (MZ) (Vegetação com influência fluviomarinha) segundo o IBGE (2012). A vegetação aluvial chamada de Mata ciliar foi considerava como uma variação das fitofisionomias avaliadas. A metodologia utilizada foi conferida com a vegetação de ocorrência das espécies pela Lista de Espécies da Flora do Brasil (Lista de Espécies da Flora do Brasil, 2015).
# Nesse R Markdown que agora é chamado de Quarto, você pode rodar os códigos e digitar suas analises textuais no mesmo ambiente. Para isso atente-se ao fato de que os códigos so podem ser rodados dentro dessa estrutura chamada "chunk", que eh:
# ```{r}
# ```
library(tidyverse) # coloque todos os pacotes que você vai utilizar
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ ggplot2 3.4.0 ✔ purrr 0.3.5
## ✔ tibble 3.1.8 ✔ dplyr 1.0.10
## ✔ tidyr 1.2.1 ✔ stringr 1.4.1
## ✔ readr 2.1.3 ✔ forcats 0.5.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
A origem dos dados foram obtidas através do site ” DOF - Transportes de Produtos Florestais” - no link: “https://dadosabertos.ibama.gov.br/dataset/dof-transportes-de-produtos-florestais/resource/f89e36de-38a6-41b0-8c46-556cbbb28895”.
library(readr)
X2007 <- read_delim("https://dadosabertos.ibama.gov.br/dados/DOF/AC/transporte/2007.csv",
delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 38474 Columns: 51
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (29): Nome/Razão Social do Remetente, CPF/CNPJ do Remetente, UF de Orige...
## dbl (5): CTF do Remetente, CTF do Destinatário, Ano, Nº da Oferta, Código d...
## num (4): Latitude de Origem, Longitude de Origem, Latitude do Destino, Long...
## lgl (13): Órgão Emissor da Autex, Nº da DI, Órgão Emissor da DI, Data de Val...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
base_tema <- X2007 %>% janitor::clean_names() # funçao para limpar e simplificar os nomes das variáveis
base_tema <- base_tema %>% as_tibble() # convertendo arquivo em tibble
base_tema %>% glimpse()
## Rows: 38,474
## Columns: 51
## $ nome_razao_social_do_remetente <chr> "LAMINADOS TRIUNFO LTDA", "LAMINADOS TR…
## $ cpf_cnpj_do_remetente <chr> "05.618.631/0001-92", "05.618.631/0001-…
## $ uf_de_origem <chr> "AC", "AC", "AC", "AC", "AC", "AC", "AC…
## $ municipio_de_origem <chr> "SENA MADUREIRA", "SENA MADUREIRA", "SE…
## $ ctf_do_remetente <dbl> 302980, 302980, 302980, 302980, 302980,…
## $ tipo_de_origem <chr> "AUTEX-Exploração em Planos de Manejo",…
## $ nome_do_patio_de_origem <chr> "FAZENDA CEREJEIRA", "FAZENDA CEREJEIRA…
## $ no_de_serie_da_autex <chr> "00002200702840", "00002200702840", "00…
## $ no_da_autorizacao_original <chr> "12012200700009", "12012200700009", "12…
## $ tipo_de_autex <chr> "AUTEX-Exploração em Planos de Manejo",…
## $ orgao_emissor_da_autex <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ data_de_validade_da_autex <chr> "06/07/2008", "06/07/2008", "06/07/2008…
## $ no_da_di <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ orgao_emissor_da_di <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ data_de_validade_da_di <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ nome_porto_de_entrada_no_pais <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ pais_de_origem <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ no_da_autesp <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ orgao_emissor_da_autesp <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ data_de_validade_da_autesp <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ latitude_de_origem <dbl> -9771429, -9771429, -9771429, -9771429,…
## $ longitude_de_origem <dbl> -69382233, -69382233, -69382233, -69382…
## $ uf_de_destino <chr> "AC", "AC", "AC", "AC", "AC", "AC", "AC…
## $ municipio_de_destino <chr> "RIO BRANCO", "RIO BRANCO", "RIO BRANCO…
## $ nome_razao_social_destinatario <chr> "LAMINADOS TRIUNFO LTDA", "LAMINADOS TR…
## $ cpf_cnpj_do_destinatario <chr> "05.618.631/0001-92", "05.618.631/0001-…
## $ ctf_do_destinatario <dbl> 302980, 302980, 302980, 302980, 302980,…
## $ nome_patio_de_destino <chr> "LAMINADOS TRIUNFO LTDA", "LAMINADOS TR…
## $ latitude_do_destino <dbl> -10012778, -10012778, -10012778, -10012…
## $ longitude_do_destino <dbl> -67767222, -67767222, -67767222, -67767…
## $ nome_porto_de_saida_do_pais <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ municipio_do_porto <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ uf_do_porto <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ pais_de_destino <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ data_de_emissao <chr> "05/11/2007", "05/11/2007", "05/11/2007…
## $ ano <dbl> 2007, 2007, 2007, 2007, 2007, 2007, 200…
## $ validade_inicial <chr> "05/11/2007", "05/11/2007", "05/11/2007…
## $ validade_final <chr> "09/11/2007", "09/11/2007", "09/11/2007…
## $ ultima_transacao <chr> "Recebido", "Recebido", "Recebido", "Re…
## $ data_da_ultima_transacao <chr> "07/11/2007", "07/11/2007", "07/11/2007…
## $ no_da_oferta <dbl> 4095714, 4095714, 4095714, 4095714, 409…
## $ no_de_serie_do_dof <chr> "00613367", "00613367", "00613367", "00…
## $ codigo_de_controle_do_dof <dbl> 5.129233e+15, 5.129233e+15, 5.129233e+1…
## $ rota_do_transporte <chr> "SENA MADUREIRA/AC-RIO BRANCO/AC", "SEN…
## $ produto <chr> "Tora", "Tora", "Tora", "Tora", "Tora",…
## $ nome_cientifico <chr> "Scheffleramorototoni", "Hirtellainsign…
## $ nome_popular <chr> "Morototó", "Macuco", "Ipê", "Cedro", "…
## $ unidade <chr> "M3", "M3", "M3", "M3", "M3", "M3", "M3…
## $ volume <chr> "2,391", "3,492", "1,555", "1,551", "3,…
## $ valor_r <chr> "47,82", "69,85", "31,1", "31,02", "61,…
## $ ultima_atualizacao_relatorio <chr> "17/09/2019 09:39", "17/09/2019 09:39",…
ncol(base_tema)
## [1] 51
nrow(base_tema)
## [1] 38474
n.fam <- length(unique(base_tema$nome_cientifico))
n.fam
## [1] 319
n.area <- length(unique(base_tema$nome_do_patio_de_origem))
n.area
## [1] 677
class ("base_tema")
## [1] "character"
table(is.na(base_tema))
##
## FALSE TRUE
## 1365268 596906
sum(is.na(base_tema))
## [1] 596906
No dia a dia de quem trabalha com dados, infelizmente, é muito comum se deparar com dados formatados de um jeito bastante complicado de se manipular.Fazer uma limpeza ou manipulação de dados é de fundamental importancia visto que, com uma melhor organização o trabalho fica mais legivel, sendo melhor interpretado.
Entendendo que nosso banco de dados possui poucas variaveis, e de facil entendimento, optamos em não fazer uma faxina no nosso dados.
Em virtude dos dados não ser um vetor número e sim um vetor de caratér, não foi possível a realização ou transformações de equações. Então, diante disso, foi verificado que haviam 118 dados faltantes em relação aos dados que escolhemos, no que se diz respeito ao nome popular e área de ocorrência das espécies, pois tais espécies possuem nomes científicos e família no estado do Rio de Janeiro.
Diante disso, concluimos que houve 118 dados faltantes em relação a planilha. Vale ressaltar que, o banco de dados possui 352 linhas e 3 colunas.
DANTAS, Saulo de Jesus; TORRES, Maria Fernanda Oliveira; FERREIRA, Robério Anastácio; MIRANDA, Leila Costa Pereira; GRAÇA, Genilza Almeida da. Viabilidade e vigor de sementes armazenadas de Sapindus saponaria Linnaeus. Revista Craibeiras de Agroecologia, Rio Largo, v. 3, n. 1, 2018.
JOSÉ, Anderson Cleiton; DAVIDE, Antônio Cláudio; OLIVEIRA, Sandro Longuinho de. PRODUÇÃO DE MUDAS DE AROEIRA (Schinus terebinthifolius Raddi) PARA RECUPERAÇÃO DE ÁREAS DEGRADADAS PELA MINERAÇÃO DE BAUXITA. Cerne, Lavras, v. 11, n. 2, p. 187-196, abr./jun.2005.
NEVES, Maria Inajal R. S. das; ARAÚJO NETO, João C. de; FERREIRA, Vilma M.; SILVA, Clissia B. da; MELO JÚNIOR, João L. A.; MELO, Luan D. F. A.; FARIAS, Aristeia S.; GALVÃO, Elaine R.; SILVA, Vinicius S. G. da. Morphometric Characterization and Seed Dormancy Overcoming of Sapindus saponaria L. Journal Of Agricultural Science, v. 10, n. 7, p. 329-341, 2018.
RODRIGUES, Cristina Aparecida Gonçalves et al. Arborização Urbana e Produção de Mudas de Essências Florestais Nativas em Corumbá, MS. Embrapa Pantanal, Corumbá - MS, p. 9-26, 2002.