A carcinicultura é um ramo específico da aquicultura voltado para a criação de camarão em cativeiro, tanto na forma de cultivo marinho ou de água doce. Uma atividade em expansão no Brasil, sendo uma das formas de negócio mais lucrativas que existem, uma vez que o consumo do camarão cresce cada dia mais.
Por causa do seu valor nutritivo, consumo em larga escala e um ótimo excelente, a demanda diante do mercado cresceu. E, pela condição climática favorável e precocidade no desenvolvimento em viveiros que permitem a criação em alta densidade, o produtor brasileiro viu na carcinicultura um investimento viável e com rentabilidade a curto prazo.
Dado a importância da carcinocultura para o Brasil, o objetivo desse projeto é estudar um banco de dados fornecido por uma fazenda de camarão e entender as relações e padrões existentes nas variáveis que governam esse fenômeno, visando minimizar a produção e o desempenho zootécnico desse animal.
Os dados correspondem a 51 cultivo de camarão marinho da espécie (Litopenaeus vannamei) produzido em uma fazenda no nordeste do Brasil, no período entre 2017 a 2018. As variáveis correspondem ao índice produtivo de cada tanque assim como o desempenho zootécnico dos camarões cultivados ao longo de cada ciclo.
Todas essas informações estão divididas em dois bancos de dados denominados por:
## 'data.frame': 205 obs. of 19 variables:
## $ cultivo : int 1 2 3 4 5 6 7 8 9 10 ...
## $ viveiro : Factor w/ 40 levels "V.'00","V.01",..: 16 7 8 5 6 14 15 13 3 10 ...
## $ area : num 12 5 9.4 7.7 8.1 8.3 12.9 11 7.4 9.3 ...
## $ povoData: Date, format: "2017-11-16" "2017-11-10" ...
## $ despData: Date, format: "2018-01-03" "2018-01-10" ...
## $ dias : int 48 61 61 88 63 75 57 71 65 70 ...
## $ semana : int 7 9 9 13 9 11 8 10 9 10 ...
## $ qnt_ini : int 600000 300000 604000 500000 405000 550000 580000 500000 407000 420000 ...
## $ dens : num 5 6 6.4 6.5 5 6.6 4.5 4.5 5.5 4.5 ...
## $ lab : Factor w/ 1 level "Secom": 1 1 1 1 1 1 1 1 1 1 ...
## $ qnt_fin : int 2169 1485 2940 2445 2715 2070 1890 2040 1730 2356 ...
## $ grama : num 7.5 7.5 7.5 7.5 9 8 8.5 7 8.5 7.5 ...
## $ gan_sema: num 1.09 0.86 0.86 0.6 1 0.75 1.04 0.69 0.92 0.75 ...
## $ prod : int 181 297 313 318 335 249 147 185 234 253 ...
## $ sobr : num 0.48 0.66 0.65 0.65 0.74 0.47 0.38 0.58 0.5 0.75 ...
## $ rac : num 0 826 1621 1787 1060 ...
## $ FCA : num 0 0.56 0.55 0.73 0.39 0.69 0.4 0.66 0.63 0.52 ...
## $ fase : Factor w/ 2 levels "I","II": 1 1 1 1 1 1 1 1 1 1 ...
## $ semestre: Factor w/ 2 levels "1","2": 1 1 1 1 1 1 1 1 1 1 ...
## 'data.frame': 7890 obs. of 13 variables:
## $ data : Date, format: "2016-01-08" "2016-01-08" ...
## $ viveiro : Factor w/ 55 levels "'00","1","10",..: 1 2 13 24 35 38 39 40 41 42 ...
## $ ha : num 3.3 12 7.4 9 7.7 8.1 5 9.4 11 9.3 ...
## $ estato_adm: Factor w/ 8 levels "BIOFLOCOS","DESCANSO",..: 5 5 5 5 5 5 5 6 5 5 ...
## $ dens : num 13.6 13.3 14.9 11.1 13 ...
## $ pl_pov : num 450 1600 1100 1000 1000 1000 450 0 600 1000 ...
## $ peso_ant : num 3 6.5 4 0.8 0.2 0.2 0.2 NA 3 1.5 ...
## $ peso_atual: num 4 7 5.3 1.5 0.2 0.2 0.2 0 3 2.5 ...
## $ cresc : num 1 0.5 1.3 0.7 0 0 0 0 0 1 ...
## $ povoado : Date, format: "2015-11-27" "2015-11-10" ...
## $ dias : int 42 59 46 20 13 4 3 0 38 30 ...
## $ sem : num 6 8.43 6.57 2.86 1.86 0.57 0.43 NA 5.43 4.29 ...
## $ global : num 0.67 0.83 0.81 0.53 NA NA NA NA 0.55 0.58 ...
Os dados fornecidos foram em formato Excel, portanto inicialmente eles foram transformados em arquivo CSV devido a flexibilidade de integrar-se facilmente com vários sistemas, pela simplicidade de importação e exportação desses arquivos e principalmente pelo fato de ser um documento de texto extremamente leve para um banco de dados significativamente grande.
As variáveis no formato Data foram transformados em um tipo especial de objeto, como classe Date utilizando o package libridate. Outras variáveis foram transformadas como fatores com o intuito de representar dados categóricos, sendo algumas ordenadas e outras não ordenadas. Fatores são uma classe importante para análise estatística e Data Science.
A densidade de estocagem é uma variável muito importante para a produção. Busca-se sempre uma maior densidade inicial visando maiores produções no final do cultivo. Entretanto, nem sempre isso é possível pois ela influencia diretamente na sobrevivência e no crescimento dos animais. Quanto maior a densidade maio será a competição por recursos no viveiro e maior a probabilidade de disseminação de doenças deixando os animais mais susceptíveis e desiquilibrando o meio ambiente. Portanto a busca da densidade ótima de estocagem é um objeto de pesquisa dentro de uma fazenda de camarão.
Explorando os dados, abaixo segue uma distribuição das densidades iniciais manejada pela fazenda no período estudado, Ganho de peso final obtido por cada cultivo e as taxas de sobrevivência respectivamente.
Assim, a variável contínua “densidade de estocagem inicial” foi transformada em fatores categóricos separados por grupos:
Grupo 1: Densidade de estocagem menores que 6 indivíduos/\(m^2\) (\(1^{\underline{o}}\) quantil); \[Dens (GP_1) < 6 \ \ ind/m^2\]
Grupo 2: Densidade de estocagem maior ou igual que 6 indivíduos/\(m^2\) (\(1^{\underline{o}}\) quantil) e menor que 7,4 indivíduos/\(m^2\) (\(2^{\underline{o}}\) quantil); \[6 \ \ ind/m^2 \leq Dens (GP_2) < 7,4 \ \ ind/m^2\]
Grupo 3: Densidade de estocagem maior ou igual que 7,4 indivíduos/\(m^2\) (\(2^{\underline{o}}\) quantil) e menor que 9,0 indivíduos/\(m^2\) (\(3^{\underline{o}}\) quantil); \[7,4 \ \ ind/m^2 \leq Dens (GP_3) < 9,0 \ \ ind/m^2\]
Grupo 4: Densidade de estocagem maior ou igual que 9 indivíduos/\(m^2\) (\(3^{\underline{o}}\) quantil); \[9 \ \ ind/m^2 \leq Dens (GP_1)\]
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.000 6.000 7.400 7.709 9.000 16.000
Com relação ao bando de dados “Biometrias”, de acordo com a taxa de crescimento os cultivos foram categorizados (classificados) como:
Além da variável “densidades” também foram classificadas os cultivos com diferentes taxas de crescimento. Portanto a variável “ganho de peso” foi categorizado de acordo com os \(1^{\underline{o}}, 2^{\underline{o}}\) e \(3^{\underline{o}}\) quantis:
## dens_grupo gan_sema.Min. gan_sema.1st Qu. gan_sema.Median gan_sema.Mean
## 1 gp1 0.5900000 0.8450000 1.0250000 1.0178947
## 2 gp2 0.5500000 0.8600000 0.9450000 0.9625000
## 3 gp3 0.6400000 0.8800000 1.0000000 1.0231579
## 4 gp4 0.6000000 0.8400000 0.9500000 0.9736207
## gan_sema.3rd Qu. gan_sema.Max.
## 1 1.1275000 1.5200000
## 2 1.0600000 1.8400000
## 3 1.1700000 1.5000000
## 4 1.0700000 1.5900000
Crescimento Bom; \[Ruim < 0,89 \ g/semanal\]
Crescimento Regular; \[0,89 \ g/semanal \leq Regular < 1,11 \ g/semanal\]
Crescimento Ruim. \[1,11 \ g/semanal \leq Bom\]
Uma vez tratados, tranformados e processados todos os dados, agora iremos modelar o crescimento do camarão ao longo do tempo de cultivo para cada ciclo, utilizando um modelo não linear sigmoedal conhecido como modelo Logistico (como segue abaixo). Porém utilizaremos uma motodologia Bayesiana interpretado pelo seguinte modelo hierárquico:
\[w_i \sim N(\mu_i, \sigma^2_i)\] \[\mu_i = \frac{\alpha_i}{1 + e^{\kappa_i(\beta_i-t)}}\] Sendo que, \[\alpha_i \sim Normal(90, 10)\] \[\kappa_i \sim Beta(3, 2)\] \[\beta_i \sim Normal(12, 4)\] Considerando \(w\) o peso referente as biometrias, \(t\) o tempo (semanas) cronológico as biometrias, o indexador \(i\) i-ésimo cultivo, \(\sigma^2\) variância do peso, \(\mu_i\) o peso esperado a cada biometria do i-ésimo cultivo, \(\alpha_i, \ \kappa_i \ e \ \beta_i\) são os parâmetros do modelo considerados pela teoria Bayesiana de parâmetros não fixos.
É super importante antes de fazer qualquer inferência das posterioris marginais de cada parâmetro na inferência bayesiana, se certificar da convergência da cadeia de Markov. Portanto as imagens abaixo representam um feedback sobre a simulação MCMC e indica se houve alguma divergência em cada iteração.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Abaixo segue algumas estimativas dos parâmetros após a simulação e perfeita convergência das posterioris marginais.
E por fim os gráficos dos modelos de crescimento do camarão (Litopenaues vannamei) cultivado em tanques escavados da fazenda do nordeste Brasileiro utilizando modelos não paramétrico (smoothing model) e o modelo bayesiano com seu intervalo de credibilidade.
Normalmente, o peso final na fazenda estudada fica em torno da média de 9 gramas. Isso se dá pelo fato de que o mercado da empresa se limita a camarão dessa gramatura. Essa demanda é exigência do mercado, assim, o produtor se adapta ao mercado alvo. Como os dados da fazenda são limitados às observações abaixo do ponto de inflexão, os modelos Bayesianos são os mais indicados para modelar esse fenômeno dado as limitações das informações obtida pelos dados. Através das informações a priori e da função de verossimilhança é possível estender e generalizar os modelos predizendo momentos específicos de interesse para o produtor.
## Warning: `as_data_frame()` is deprecated, use `as_tibble()` (but mind the new semantics).
## This warning is displayed once per session.
## [1] 11
## [1] "alpha[11]"
## Warning: Removed 1279 rows containing missing values (geom_point).