Notação utilizada neste trabalho: \(1.86*10^{2}=1.86e2=186\). Usamos os seguintes pacotes na linguagem R:

library(knitr); library(rmarkdown); library(tidyverse); library(e1071)
library(lubridate); library(magrittr); library(gridExtra); library(broom)
library(data360r); library(car); library(lmtest); library(ggpubr)
library(MASS);library(forecast);library(tseries) # ARIMA
library(kableExtra)
knitr::opts_chunk$set(echo = FALSE, warning=FALSE, message=FALSE, fig.pos = 'h', width = 120)

Resumo

Fizemos uma avaliação geral da agricultura paulista e notamos que apresentava os maiores valores de produtividade da soja no Brasil e resolvemos nos aprofundar no tema.

Estabelecemos um modelo para a cotação internacional da soja que envolve os três principais jogadores do mercado mundial da soja - China, EUA e Brasil - usando marcadores de oferta e demanda bastante objetivos: as produções anuais do Brasil e EUA, além do produto interno bruto total da China:

O desenvolvimento sugerido é usar dados meteorológicos avaliando efeitos sobre a produção da soja e seu custo.

Introdução

Objetivos

Vamos estabelecer o quadro geral de produção agrícola do estado de São Paulo e destacar a soja já que tem a maior produtividade no cenário brasileiro. A seguir estabeleceremos os eixos princicais do mercado mundial da soja:

  • China: o principal consumidor

  • O Brasil e os Estados Unidos da América (EUA): os principais produtores

  • A Bolsa de Chicago: onde se estabelece a cotação da soja e menos de uma dezena de compradores compram efetivamente o grão ( A Cargill é o maior comprador e diz: “Como um dos maiores comerciantes de grãos e oleaginosas do planeta, a Cargill conecta produtores e usuários do setor ao redor do mundo.” ), além disso possui o mercado de futuros mais consolidado.

O mercado de futuro da soja é - segundo a Investopedia - influenciado por:

  • A demanda por biodiesel

  • A cotação e força do dolar norte-americano (US dollar)

  • Risco reais ou previstos para os cultivares

  • Demanda do mercado emergente

  • O crescimento econômico mundial

A teoria subjetiva do valor propõe que o valor de um produto não é determinado por suas características ou seu valor de produção, mas pelo desejo daqueles que querem consumi-lo. A partir dessa consideração assumimos para a elaboração de um dos dos nossos modelos que as variações do preço vem apenas da variação da oferta e demanda do produto, assim o preço do produto é diretamente proporcional à demanda e inversamente proporcional à oferta:

  • Seja \(P=K_{1}.D\) e também \(P=\frac{K_2}{O}\) onde o preço \(P\), a demanda \(D\) e a oferta \(O\) e \(\left\{ K_{i} \right\}^{n}_{i=1}\) o conjunto de constantes

  • Considere uma série histórica de preços \(\left\{ P_{j} \right\}^{n}_{j=1}\) onde podemos admitir que:

\(\frac{P_{1}.O_{1}}{D_{1}}=\frac{P_{2}.O_{2}}{D_{2}}=...=\frac{P_{n}.O_{n}}{D_{n}}=K_{k}\)

ou de modo mais restrito para um par de preços consecutivos:

\(P_{j}=P_{j-1}\frac{O_{j-1}}{D_{j-1}}\frac{D_{j}}{O_{j}}\)

Nossa pretensão inicial era avaliar os fatores meteorológicos que afetariam a produção e a produtividade e estabelecer um conjunto de modelos que preveriam a cotação da soja no mundo. Porém restringimos nossos objetivos diante da escassez de dados disponíveis de observações meteorológicas a construir um conjunto de modelos para a cotação da soja em grão envolvendo a demanda e produção.

Produção Agrícola Paulista

O Estado de São Paulo possui mais de 190 mil quilômetros quadrados plantados, entre culturas, pastagens e florestas destinadas ao aproveitamento econômico. No setor agrícola, as principais características são variedade e qualidade. Líder em agronegócios, o Estado é responsável por um terço do PIB agroindustrial do Brasil. Os agronegócios de São Paulo representam 22% do ICMS arrecadado. Maior produtor mundial de suco de laranja e com a maior produção nacional de frutas (um terço do total), São Paulo também produz 80% da laranja para a indústria. Além da maior produtividade nacional de soja, o estado também é o segundo maior produtor mundial de cana-de-açúcar, aqui também se cultiva 25% dos legumes nacionais. Ainda há destaque para a produção de café, sendo considerado o quarto maior produtor mundial e o terceiro nacional, com 3,5 milhões de sacas de 60 quilos.

Apresentamos a seguir as áreas plantadas, as produções e as produtividades dos principais produtos agrícolas do estado de São Paulo de acordo com o Instituto de Economia Agrícola - dados extraídos de boletins em http:/lwww.iea.sp.gov.br - para safras 2014/2015 e 2015/2016 dando uma visão geral do passado próximo nas próximas três tabelas:

Produto Área2014_15 Área2015_16 VarÁrea_%
Café_beneficiado 212.30 211.66 -0.3
Cana_forragem 84.04 87.08 3.6
Cana_indústria 6170.63 6043.41 -2.1
Laranja 471.58 457.53 -3.0
Soja_total(primeira_safra) 758.05 827.35 9.1
Soja(primeira_safra) 717.95 785.16 9.4
Soja_irrigada(primeira_safra) 40.10 42.19 5.2

Tabela 1 Previsões e Estimativas das Safras Agrícolas do Estado de São Paulo de café, cana, laranja e soja. Area (1000 ha, var %) comparada entre o ano agrícola 2015/16 e o 2014/2015.

Produto Produção2014_15 Produção2015_16 VarProdução_%
Café_beneficiado 245.19 342.61 39.7
Cana_forragem 5027.48 5287.62 5.2
Cana_indústria 436252.89 439481.57 0.7
Laranja 12050.88 11406.11 -5.4
Soja_total(primeira_safra) 2229.45 2717.09 21.9
Soja(primeira_safra) 2070.22 2552.76 23.3
Soja_irrigada(primeira_safra) 159.23 164.33 3.2

Tabela 2 Previsões e Estimativas das Safras Agrícolas do Estado de São Paulo de café, cana, laranja e soja. Produção (1000 t, var %) comparada entre o ano agrícola 2015/16 e o 2014/2015.

Produto Produtividade2014_15 Produtividade2015_16 VarProdutividade_%
Café_beneficiado 1.220 1.703 39.6
Cana_forragem 59.819 60.721 1.5
Cana_indústria 77.823 79.324 1.9
Laranja 27.227 26.650 -2.1
Soja_total(primeira_safra) 2.941 3.284 11.7
Soja(primeira_safra) 2.884 3.251 12.7
Soja_irrigada(primeira_safra) 3.971 3.895 -1.9

Tabela 3 Previsões e Estimativas das Safras Agrícolas do Estado de São Paulo de café, cana, laranja e soja. Produtividade (ton/ha, var %) comparada entre o ano agrícola 2015/16 e o 2014/2015.

Destacamos que a produtividade da soja paulista, em especial a irrigada, é uma das maiores no Brasil e nos atraiu para seu estudo.

Soja

A soja Glycine max é uma leguminosa cujo grão possui grande utilidade e variedade em sua aplicação: desde ração animal, insumos farmacêuticos, alimento rico em proteinas, óleos, flavonoides e fitoesteroídes, pode ser usada na recuperação do solo e até na produção de biodiesel. É vendida em grãos, farelo e óleo primariamente; sendo típica de clima temperado e cultivada desde a Antiguidade na China onde foi domesticada, contudo tem sido adaptada a diferentes tipos de clima nos últimos anos tem sido possível obter excelentes resultados inclusive em regiões de clima não temperado, como o centro-oeste brasileiro graças a chamada tropicalização implementada pela EMBRAPA.

A cultura da soja é anual com safra das águas, safrinha e irrigada. Sua produtividade depende da presença de chuvas, uma vez que a produção de soja é incompatível com a presença de secas. Os solos de drenagem livre, arenoso ou médio são os melhores. Os solos moderadamente férteis são particularmente adequados. O pH do solo deve ser maior ou igual a 6 e o manejo do solo no cerrado com calcário expandiu as fronteiras de seu cultivo.

A produtividade média brasileira na safra 2016/2017 foi de 3 362 kg por hectare. E neste mesmo ano foram exportados 25.4 bilhões de dólares em farelo, óleo e grãos de soja. Apresentamos na figura abaixo a produtividade em toneladas por hectare e produção em milhares de toneladas no Brasil, EUA e China:

Figura 1: Produção em milhares de toneladas e produtividade em toneladas por hectare do Brasil, China e Estados Unidos da América desde a década de 60. Dados da FAO - Food and Agriculture Organization of the United Nations. Assinalamos que a produção e produtividade do Brasil e dos EUA aumentam gradativamente e tem se aproximado nos últimos anos.

Sua utilização é majoritariamente para a indústria alimentícia, incluindo rações animais, mas também serve para a produção de biodiesel e outros produtos industriais como fármacos, cosméticos e plásticos.

Os principais produtores mundiais são: EUA, Brasil, Argentina e China; países como o Paraguai tem expandido sua presença no cenário mundial.

Apresentamos as distribuições de produção nos EUA, Brasil e estado de São Paulo, comecemos pelos EUA:

Figura 2 As regiões produtoras de soja nos EUA de acordo com NOAA/USDA acompanhadas do calendário de plantio e colheita.

Figura 2 As regiões produtoras de soja nos EUA de acordo com NOAA/USDA acompanhadas do calendário de plantio e colheita.

As regiões produtoras de soja no Brasil expandem-se em novas fronteiras agrícolas como o Norte do Mato Grosso, o Sul do Pará e o MATOPIBA que se estende desde o Sul do Maranhão e Piauí, toma parte do Tocantins e atinge a região Oeste da Bahia, que a despeito de produtividade boa, ainda possuem alto custo de produção:

Figura 3 As regiões produtoras de soja no Brasil em 2007/2008 onde novas fronteiras são incluídas a cada ano, seja o Norte do Mato Grosso e Sul do Pará, como o MATOPIBA; os custos de produção naquelas fronteiras são bastante altos no momento. Figura da Agro Bayer Brasil

Figura 3 As regiões produtoras de soja no Brasil em 2007/2008 onde novas fronteiras são incluídas a cada ano, seja o Norte do Mato Grosso e Sul do Pará, como o MATOPIBA; os custos de produção naquelas fronteiras são bastante altos no momento. Figura da Agro Bayer Brasil

Analisando detidamente o estado de São Paulo, maior foco deste estudo, destacamos que a região com maior produção em 2007/2008 foi a de Itapeva. A área plantada de soja varia conforme o preço de outros produtos como a cana de açúcar e amendoim, este em franca expansão. A estrutura fundiária de SP encontra-se mais ou menos consolidada não permitindo grandes aumentos de área plantada como em outras regiões do Brasil, no entanto a proximidade de centros exportadores e boa logística permitem um menor custo de produção, além da maior produtividade conquistada por nossos agricultores:

Figura 4 As regiões produtoras de soja no estado de São Paulo em 2007/2008 conforme o Centro de Informações Agropecuárias CIAGRO.

Figura 4 As regiões produtoras de soja no estado de São Paulo em 2007/2008 conforme o Centro de Informações Agropecuárias CIAGRO.

Comparação de produção, produtividade e área plantada de soja entre o Brasil e o estado de São Paulo via CONAB, desde 1977 até a expectativa para a safra 2017/2018, assinalamos a maior produtividade de SP quando conparada à do Brasil:

Figura 5 Comparação de produção, produtividade e área plantada de soja entre o Brasil e o estado de São Paulo desde 1977 até a expectativa para a safra 2017/2018. À esquerda contrapõem-se dados absolutos em azul para o Brasil e em vermelho para SP, já à direita os dados relativos de SP diante dos correspondentes do Brasil em %. A expansão de novas fronteiras agrícolas brasileiras torna a área e a produção relativas de SP menores ao longo do tempo, mas a produtividade paulista foi maior que a média brasileira em geral, ainda mais na sua fração irrigada conforme tabela 3.

Na tabela abaixo apresentamos os mínimos percentuais da produtividade paulista em relação a brasileira:

1995 1998 2000 2001 2007 2009 2010 2011 2014
% 94.1 88.1 87 94.5 94.6 93.5 94.7 89.5 78.7

Tabela 4 A produtividade paulista foi menor que a brasileira apenas nos anos assinalados acima; sua variação pode ter sido causada por fatores econômicos, tecnológicos e meteorológicos. Dados do CONAB de 1977 a expectativa para 2018.

Ver notícias: seca 2014/2015 1999/2000: a produtividade em geral e a paulista em particular pode ser sensível a fatores climáticos (menos a soja irrigada, enquanto a crise hídrica não afetar a irrigação), vejam os seguintes exemplos:

A fenologia da soja é divida em duas fases: a vegetativa e a reprodutiva. Cada uma delas é sensível a fatores climáticos, doenças e pragas específicas, assim o manejo vai além das porteiras. Indo da produção de colheitadeiras e outras máquinas pesadas; envolve a produção, instalção e manutenção de silos e esteiras, bem como da automatização de portos e atinge o desenvolvimento e produção de sementes e defensivos agrícolas. Num exemplo de impacto econômico temos a fusão da Bayer com a Monsanto que foi estimada em 66 bilhões de US dollars. A figura abaixo ilustra a fenologia da planta bem como sugere quais defensivos podem ser usados em cada fase, essas empresas tem um cuidado primoroso com seus sites:

Figura 6 Fenologia da soja e defensivos agrícolas segundo Agro Bayer Brasil.

Figura 6 Fenologia da soja e defensivos agrícolas segundo Agro Bayer Brasil.

Fase Vegetativa:

Figura 7 fase vegetativa, da FAO

Figura 7 fase vegetativa, da FAO

Fase Reprodutiva:

Figura 8 fase reprodutiva, da FAO

Figura 8 fase reprodutiva, da FAO

Plantio e Colheita: a soja é uma cultura anual e tem seu período de semeadura feito entre o meio de outubro e o meio de dezembro no Brasil. Já sua colheita é feita após o desenvolvimento da soja, quando o grão está com aproximadamente 13% de umidade; se estiver muito seco esfarela levando a perdas maiores na colheitadeira automática, caso contrario quando muito úmido o grão pode mofar perdendo seu valor. O tempo da colheita é geralmente de 100 a 160 dias após o plantio da soja. Existe uma alternância entre nós e os EUA na fase em que semeamos, os EUA colhem e vice-versa, vejam nosso calendário:

Figura 5 O calendário de plantio - vermelho - e colheita - verde - da soja no Brasil em porcentagem, existem variedades precoces que permitem uma safrinha. Os períodos plantio são ligeiramente diferentes conforme a região e o início das chuvas, bem como o de colheita, mais eficaz num máximo de seca. Dados do CONAB.

Figura 5 O calendário de plantio - vermelho - e colheita - verde - da soja no Brasil em porcentagem, existem variedades precoces que permitem uma safrinha. Os períodos plantio são ligeiramente diferentes conforme a região e o início das chuvas, bem como o de colheita, mais eficaz num máximo de seca. Dados do CONAB.

Condições climáticas adequadas ao cultivo:

  • A soja é originalmente observada em climas temperados, porém se adapta também a outros tipos de clima, como o tropical e subtropical.

  • A temperatura ideal para o plantio da soja é a temperatura entre 20°C e 30°C. A temperatura ideal seria em torno de 30°C.

  • A temperatura do solo, não pode ser menor que 20°C, pois comprometeria a emergência e germinação da soja. A temperatura ideal do solo seria de aproximadamente 25°C.

  • A quantidade de água necessária, para obtenção de um rendimento máximo, varia entre 450 a 800 mm/ciclo, dependendo das condições climáticas, do manejo da cultura e da duração do seu ciclo. Durante a germinação a quantidade de água no solo deve ser entre 50% e 85%, porém conforme a planta se desenvolve há a necessidade de uma maior quantidade de água, com um máximo na floração.

Condições climáticas prejudiciais e fatores de risco durante o desenvolvimento:

  • Em geral, para a soja uma maior taxa de sombreamento à radiação solar causará menor crescimento e desenvolvimento para a planta.

  • Temperaturas menores que 10°C resultam em crescimento muito pequeno ou nulo para a soja, porém temperaturas maiores de 40°C também são prejudiciais, provocando danos à floração e menor capacidade de retenção de vagens.

  • Todos os fatores prejudiciais citados, são agravados com a presença de déficit hídrico, sendo o excesso de água mais prejudicial do que o déficit.

  • Apesar de chuvas serem necessárias, o excesso de chuva e dias nublados podem prejudicar a fotossíntese, o arejamento do solo, o desenvolvimento das raízes e a fixação de nitrogênio, interferir em outros processos e causar várias anomalias no desenvolvimento da soja, reduzindo o rendimento de grãos.

  • O excesso de água no solo durante a germinação, é uma condição favorável ao desenvolvimento de pragas e doenças que poderão prejudicar o desenvolvimento da planta.

  • Solos com pH menor que 6, são considerados prejudiciais à soja, sendo necessário o manejo com calcário.

Necessidade de irrigação: será para suprir um déficit hídrico, uma vez que caso chova o suficiente não será necessário irrigar. Isso vai depender do balanço hídrico da região e como a quantidade de água necessária em cada estádio de desenvolvimento pode variar, a quantidade irrigada deve ser estudada pelo agricultor a determinar quando e quanto irrigar.

Pragas e Doenças: a adaptação da soja a novas regiões climáticas tornou-a susceptível de muitas pragas e doenças, além do mais a grande mobilidade humana tem levado ao aparecimento de agentes daninhos exóticos a cada região. Deste modo o desenvolvimento de novas variedades mais resistentes se torna um processo contínuo. Habitualmente dividimos os agentes biológicos prejudiciais a cultura em três grupos:

  1. Pragas ( artrópodes, moluscos e vermes como os nematoídes )

  2. Doenças ( fungos, vírus e bactérias )

  3. Ervas daninhas

Porém tudo pode ser mais complexo, daí uma praga pode ser vetor de um vírus como no caso da soja louca II. Além do mais a soja compete com hervas locais, assim a variedade transgênica resistente ao glifosfato pode ter sua produtividade aumentada com a aplicação deste herbicida.

Entre as principais pragas que afetam significativamente a produção de soja, existem 15 mais relevantes:

Grupo Espécies Mais Comuns
Artrópodes Ácaros-fitófagos, Lagarta-do-cartucho, Mosca-branca, Coró-da-soja, Lagarta-elasmo, Percevejo-castanho, Coró-da-soja-do-cerrado, Lagarta-falsa-medideira, Percevejos-fitófagos, Coró-pequeno-da-soja, Lagartas broqueadoras de vagens e grãos, Piolho-de-cobra, Lagarta-da-soja e Tamanduá-da-soja
Moluscos Lesmas e Caracóis
Vermes Nematóides

Os ácaros fitófagos podem ser naturalmente controlados, nos períodos de maior umidade ou precipitação aparecem agentes biológicos naturais de controle. Algumas das pragas necessitam praguicidas que podem ser prejudiciais a planta também, assim só são aplicados caso haja uma quantidade significante de praga.

O manejo adequado do solo e aplicação correta de defensivos agrícolas realizam papel fundamental na prevenção de pragas e doenças. No caso das lagartas-da-soja usamos o inseticida somente se forem encontradas em média 20 lagartas grandes por metro de fileira. Já para o coró-da-soja devemos detecta-lo antes mesmo do plantio e é necessário o preparo do solo com implementos adequados.

Quando ocorrer um ataque significativo do tamanduá-da-soja deve-se analisar o solo no talhões onde aconteceu o ataque e se de fato foi intenso devemos realizar a rotação de cultura usando milho a seguir ou quaisquer cultura que não seja hospedeira da praga. Podem também ser controlados através da aplicação de inseticidas e após o tratamento correto a área poderá ser plantada novamente com soja na próxima safra.

As doenças em geral tem menor impacto econômico relativamente às pragas podem ser causadas por:

Grupo Espécie(Moléstia)
Bactérias Pseudomonas tabaci(Fogo selvagem), Pseudomonas glycinea(Crestamento bacteriano) e Xanthomonas phaseoli(Pústula bacteriana)
Vírus soja louca II, vira-cabeça e mosaico comum da soja
Fungos Colletotrichum dematiun(Antracnose), Cercospora sojina(Cercosporiose), Cercospora kikuchü(Mancha Púrpura), Peronospora manshurica(Míldio), Rhizoctonia solani(Rizoctoniose) e Septoria glycines(Septoriose)

Para se proteger das doenças, é feito o cruzamento de variedades com resistência, rotação de culturas e a escolha de sementes sadias para evitar o aparecimento das doenças citadas anteriormente.

Os Grandes Jogadores: China, EUA e Brasil

Comparamos tais países através do produto interno bruto - tanto seu valor total quanto o valor per capita - para estimar grosseiramente a capacidade de demanda de cada um. Cumpre lembrar que a China possui 1.35 bilhões de habitantes. Vamos aos dados do Banco Mundial http://www.worldbank.org para GDP e GDP per capita desde a década de sessenta até hoje, cumpre observar que tão importante como seus valores é sua taxa de crescimentto ou de retração:

Figura 6: GDP ou produto interno bruto total e per capita do Brasil, China e Estados Unidos da América desde a década de 60. Dados do Banco Mundial.

A produção anual de riquezas reflete-se no GDP e este pode resultar numa maior demanda/consumo; acontece que o valor per capita de China e Brasil são muito baixos ao se comparar com os dos EUA. No entanto a China tem a maior população mundial e seu GDP total tem crescido sistematicamente, assim faremos deles um indicador de demanda para a soja que pode ser importante na formação do preço da commodity. Se cada chinês consumir uma colher de café de açúcar a mais, talvez venha a faltar o produto … será?

A Cotação da Soja: Nossa Variável Dependente

A cotação da soja na Bolsa de Chicago com dados de Macrotrends www.macrotrends.net de 1969 a 2017 que converteremos de US dollars/bushel para US dollars/ton é a nossa variável dependente:

Figura 7 As crises econômicas assinaladas em cinza e a cotação diária da soja em dólares norte-americanos por bushel de grãos. Figura da Macrotrends.

Figura 7 As crises econômicas assinaladas em cinza e a cotação diária da soja em dólares norte-americanos por bushel de grãos. Figura da Macrotrends.

Avaliamos sua distribuição não-gaussiana através do histograma e do gráfico Q-Q:

Figura 8 distribuição da cotação da soja:

  • à Esquerda: O histograma acima da cotação sugere que a distribuição é trimodal e não é gaussiana; O histograma abaixo do logaritmo da cotação também parece trimodal, porém é mais gaussiana

  • à Direita: O gráfico Q-Q acima para cotação afasta-se do perfil gaussiano, enquanto o abaixo para o logaritmo natural da cotação é mais próximo do gaussiano, fizemos o teste de normalidade e rejeitamos \(H_o\) ou seja, não é normal também; assim será necessária a linearização, mas as regressões podem não se ajustar tão bem.

O resumo destes dados:

date value ln
Min. :1969-06-02 Min. : 85.7 Min. :4.451
1st Qu.:1981-07-09 1st Qu.:197.9 1st Qu.:5.288
Median :1993-08-11 Median :228.7 Median :5.433
Mean :1993-08-15 Mean :260.0 Mean :5.487
3rd Qu.:2005-09-22 3rd Qu.:302.0 3rd Qu.:5.711
Max. :2017-11-10 Max. :657.7 Max. :6.489

Tabela 5 resume os dados com as principais estatísticas: os quartis, a mediana e a média. As variáveis são:

  • date apresenta a data no formato YYYY-MM-DD ou Ano-Mês-Dia

  • value mostra a cotação em US dollar/ton

  • ln corresponde ao logaritmo natural da cotação.

Desenvolvimento

Temos a cotação diária como variável dependente; bem como as medidas anuais de: GDP total e per capita da China como medidas de demanda, produção dos EUA e Brasil como medidas de oferta perfazendo o conjuto de variáveis independentes. Assim pretendemos envolver os principais jogadores do mercado soja, todavia não incluímos os intermediários que vão desde o grupo Cargill até os especuladores do mercado de futuros da soja.

A análise exploratória dessas variáveis constitui-se de:

  1. histograma de cada uma

  2. matriz de correlação entre elas

  3. gráficos de dispersão entre todos os pares possíveis.

Tal processso está resumido na figura abaixo:

Figura 9 A relação entre a cotação da soja e as demais variáveis não é linear de acordo com os gráficos de dispersão no triângulo inferior. Todas as variáveis são contínuas e se desviam para esquerda - as ditribuições dos GDP da China bruto e per capita ainda mais. As maiores correlações são entre GDP bruto e per capita obviamente com valor um; a seguir a cotação e seu logaritmo natural com 0.96; a produção brasileira e os GDPs igual 0.91, bem como das produções entre si no mesmo valor ou seja, existe a multicolinearidade. Outro achado importante é a correlação entre a variável dependente, o preço, com as outras:

Antes de avaliar a multicolinearidade e a heteroscedasticidade para os modelos não-lineares usaremos o modelo ARIMA para poder saber se existe um processo estácionário, alguma tendência ou alguma influência sazonal na cotação.

ARIMA (Autoregressive Integrated Moving Average)

As médias móveis em série temporal no modelo ARIMA para a cotação pode ser estabelecidas conforme:

  • Seja um conjunto de uma sequência temporal iésima de certa variável \(X_{i}\): \(\left\{ X_{i}\right\} _{i=1}^{n}\)

  • onde podemos supor existir uma relação entre elas: \(X_{i+\Delta}=L_{\Delta}.X_{i}\) onde a função lag ou intervalo \(L_{\Delta}\) propõe que certo suconjunto das variáveis obedecem essa lei

  • decorre que \(\log(L_{\Delta})=\log(\frac{X_{i+\Delta}}{X_{i}})=\log(X_{i+\Delta})-\log(X_{i})\)

  • encontramos subconjuntos de variáveis cada um obedecendo certo lag

Quando existe um processo estacionário a previsão pode ser mais acurada; se existir alguma sazonalidade devemos investigar a influência de algum processo cíclico como o meteorológico, ademais os dados parecem apresentar certa tendência de alta ao longo dos anos conforme se percebe figura 7.

A formação dos preços pode ser um processo bem complexo de se entender, embora ocorra cotidianamente. Tal processo pode revelar uma certa inércia para o estabelecimento dos preços ( “o que pagaremos hoje depende do que pagamos ontem” ) que vai além da oferta e da demanda, digamos, o quanto queremos pagar, algum mecanismo social que está fora do alcance deste estudo. Nossa hipótese de que a oferta é dimensionada pela produção de soja do Brasil e dos EUA, enquanto a demanda é medida indiretamente pelo produto interno bruto do maior consumidor a China, havia o temor que a hipótese poderia sucumbir na relação sinal-ruído.

Asseguramos que aplicamos os testes:

  • para autocorrelação e confirmamos sua existência

  • para autocorrelação parcial que decai rapidamente como esperado

  • de Dickey-Fuller onde rejeitamos \(H_o\) e afirmamos que existe componente estacionário, o que permite boas previsões (errro médio 0.0034% e a soma de todos os erros chegou a 39.46%)

  • de Ljung-Box onde aceitamos \(H_o\) confirmando que os resíduos são aleatórios

A decomposição permitiu revelar um componente sazonal com máximos de 6.936 US dollars/ton e mínimos de -6.034 US dollars/ton a cada ano, apresenta componente aleatório e outro de tendência, confiram as próximas figuras:

Figura 10 Série temporal de 1969 a 2014 da cotação diária de soja em US dollars/ton decomposta em porções aditivas nos paineis de cima para baixo:

  1. Observações (total)

  2. Tendência (trend): ainda que não seja linear ela é de alta ao longo dos anos

  3. Sazonal (seasonal): com extremos -6 US dollars/ton e +6 US dollars/ton e período igual a \(370\pm 49\) dias e variando de 173 a 392 dias; no calendário a colheita no Brasil vai de fevereiro a maio, enquanto nos EUA vai de setembro a novembro; se máximo coincidir com o período da safra colhida disponível, melhor para o produtor

  4. Aleatório (random): impõe variação entre -100 a +150 US dollars/ton

Figura 11 Componente sazonal da cotação diária da soja: destacamos aleatoriamente o período entre jun/2007 e jun/2011. Em US dollars/ton, note que a fase de alta coincide com a de entrega da colheita brasileira nesse período, porém o período para cotações máximas é variável: a média \(370\pm 49\) dias e varia de 173 a 392 dias. Com isso nem sempre existe uma coincidência tão favorável para o Brasil, nem o período é apenas determinado por ciclos anuais do clima.

O desenvolvimento de um modelo não-linear para a cotação da soja em função do GDP da China (os resultados foram similares seja usando o total como o per capita), da produção do Brasil e dos EUA poderia permitir avaliar alguma influência climática na produção e por consequência na cotação. Já relatamos nossa dificuldade para obter os dados climáticos.

Ao avaliar o preço através do modelo ARIMA ficou claro que existe influência sazonal, a qual poderia se tratar tanto de alguma questão econômica, quanto do manejo de uma cultura anual ou da existência do ciclo climático.

Vimos três caminhos possíveis para a construção dos modelos e escolhemos os dois primeiros por familiaridade:

  1. Tentar linearizar as relações por transformações das variáveis

  2. Ajustar funções não-lineares aos dados

  3. Ajustar polimômios ou splines aos dados.

Modelo 1

O modelo 1 advindo da linearização por meio de lm(log(value) ~ (GDP_bruto) + log(prodBRA) + log(prodEUA) , data=fim) foi melhor que lm(log(value) ~ log(GDP_bruto) + log(prodBRA) + log(prodEUA) , data=fim) e resultou em:

\(cotação = \exp( A + B.GDP_{bruto} + \ln(Produção_{BRA})^{C} + \ln(Produção_{EUA})^{D})\)

Ou de outro modo:

\(cotação = \exp( A + B.GDP_{bruto}).(Produção_{BRA})^{C}.(Produção_{EUA})^{D}\)

\(A=10.3(2)\) , \(B=7.5(1).10^{-14}\), \(C=0.302(5)\) e \(D=-0.56(2)\) são os coeficientes do ajuste acompanhados das respectivas incertezas entre parênteses.

Entre colchetes as unidades das variáveis: \(cotação[US dollar/ton]\), \(GDP_{bruto}[US dollar]\), \(Produção_{BRA}\) e \(Produção_{EUA}\) em \([10^{3}ton]\). Com \(p-values\) entre 0.0 e 0.001 e \(R^{2}=adjustedR^{2}=0.633\) para \(IC=95\%\).

A correlação entre os valores observados e os previstos é de 83.82%.

Teste para colinearidade: \(VIF_{GDP_{bruto}}=1.92\), \(VIF_{Produção_{BRA}}=6.20\) e \(VIF_{Produção_{EUA}}=6.51\) e é sugestivo de existir quando \(VIF_{x}\geq 5.0\).

Teste de Breusch-Pagan studentizado para heteroscedasticidade: como \(p-value=2.2*10^{-16}<0.05\) houve o fenômeno; de outro modo na figura 10 a porção aleatória da decomposição da série histórica da cotação também -e sugestiva do fenômeno.

Modelo 2

Criamos uma função não-linear recursiva chamada Cota e fizemos o ajuste:

  • Índice Cota: \(Cota_{i} = = 193.8487 + cotação[i-1].[\frac{1.0809190.10^{-5}.GDP_{bruto}[i]}{Produção_{BRA}[i]+Produção_{EUA}[i]}]\)

  • Modelo: \(Cotação = -12(1) + 1.091(5). Cota\)

  • Com \(p-values\) entre 0.0 e 0.001 para todos os coeficientes e \(R^{2}=adjustedR^{2}=0.7746\) para \(IC=95\%\).

A correlação entre os valores observados e os previstos é de 88.01%. Não há colinearidade neste ajuste, entretanto existe a heteroscedasticidade com teste de Breusch-Pagan studentizado, pois o \(p-value=2.2*10^{-16}<0.05\) e rejeitamos \(H_o\) o que já era esperado em harmonia com a fração randômica do ARIMA.

Modelo 3

Criamos uma função não-linear recursiva chamada Razão e fizemos o ajuste:

  • Índice Razão: \(Razão_{i} = Cotação_{i-1}.\frac{Prod_{i-1}}{GDP_{i-1}}\frac{GDP_{i}}{Prod_{i}}\) onde \(Prod_{i}\) é a iésima soma da produção anual do Brasil e dos EUA e \(GDP_{i}\) é o produto interno bruto anual da China

  • Modelo: \(Cotação = 0.5(1) + 0.9978(5). Razão\)

  • Com \(p-values\) entre 0.0 e 0.001 para todos os coeficientes e \(R^{2}=adjustedR^{2}=0.997\) para \(IC=95\%\).

A correlação entre os valores observados e os previstos é de 99.85%. Não há colinearidade neste ajuste, entretanto existe a heteroscedasticidade com teste de Breusch-Pagan studentizado, pois o \(p-value=2.2*10^{-16}<0.05\) e rejeitamos \(H_o\) o que já era esperado em harmonia com a fração randômica do ARIMA.

Figura 12 A cotação diária da soja em dólares norte-americanos por tonelada de grãos onde observações em azul são comparados aos modelos:

  • modelo 1 provindo de linearização em preto com estimativa de erro médio de 2.6 % e manteve o aspecto “em escada” por toda série

  • modelo 2 de modelo não-linear em laranja com estimativa de erro médio de 6.14 %, apresentou aspecto “em escada” apenas no início da série

  • modelo3 de modelo não-linear em vermelho com estimativa de erro médio de 0.04 %

Acima toda série histórica e abaixo um foco no período entre jan/14 e jan/2015.

Conclusões

Conseguimos estabelecer um modelo para a cotação internacional da soja que envolve os três principais jogadores do mercado mundial da soja: China, EUA e Brasil.

Sua concepção envolveu buscar marcadores de oferta e demanda dos jogadores, assim:

Chegamos a imaginar que as frequências diferentes - diária e anual - representariam grande obstáculo no desempenho dos modelos o que não se confirmou felizmente. Quando trabalhamos com médias anuais das cotações provocávamos a perda de informações sazonais anuais e mesmo a fração estacionária que poderia permitir uma previsão de melhor qualidade era muito prejudicada.

Usamos o método ARIMA (Autoregressive Integrated Moving Average) para discriminar três partes principais de uma série temporal: a aleatória, a tendência e a sazonal. Foi possível verificar a existência de um processo estacionário através do teste de de Dickey-Fuller e tornar a previsibilidade melhor.

Outro aspecto importante foi confirmar que existia um processo sazonal com período de \(370\pm 49\) dias para altas e baixas cotações, caberia num trabalho posterior analisar os harmônicos e confirmar o componente anual.

Um componente anual seria um bom marcador que poderia refletir a influência climatológica na produção, no entanto a produção de soja nos dois hemisférios poderia amortecer a sazonalidade.

O modelo melhor adaptado à serie é o de número três que usou uma função não-linear recursiva chamada Razão:

A correlação entre os valores observados e os previstos é de 99.85%. Não há colinearidade neste ajuste, mas há a heteroscedasticidade medida através do teste de Breusch-Pagan studentizado, o que já era esperado através da análise visual da fração aleatória advinda do ARIMA.

Uma limitação deste modelo é que não dividimos os dados em séries de teste e treinamento e existe o receio de existir o overfitting. Outra dificuldade foi encontrar observações meteorológicas e incluí-las no modelo.

Foi instrutivo nos deter sobre a produção agrícola do estado de São Paulo em geral e perceber que altos índices de produtividade e variedade aliados a uma logística boa e à proximidade dos centro de pesquisa permitem reforçar o valor do nosso agricultor.

Referências bibliográficas

  1. Notas de aulas da disciplina de Agrometeorologia-IAG-USP do professor Edmilson Dias de Freitas

  2. Agro Bayer Brasil https://www.agro.bayer.com.br/culturas/soja, setembro/novembro de 2017

  3. Cargill https://www.cargill.com.br/pt_BR/in%C3%ADcio, setembro/novembro de 2017

  4. CATI http://www.cati.sp.gov.br/projetolupa/mapaculturas.php, setembro/novembro de 2017

  5. CIAGRI http://ciagri.iea.sp.gov.br/nia1/subjetiva.aspx?cod_sis=1&idioma=1, setembro/novembro de 2017

  6. CIIAGRO: O Centro Integrado de Informações agrometeorológicas http://www.ciiagro.sp.gov.br/

  7. CONAB: Companhia Nacional de Abastecimento http://www.conab.gov.br/, setembro/novembro de 2017

  8. EMBRAPA SOJA https://www.embrapa.br/soja, setembro/novembro de 2017

  9. FAO: The Food and Agriculture Organization of the United Nations: http://www.fao.org/faostat/en/#data/QC , http://www.fao.org/docrep/t0532e/t0532e02.htm e http://www.fao.org/giews/food-prices/tool/public/#/home, setembro/novembro de 2017

  10. IEA: Instituto de Economia Agrícola http:/lwww.iea.sp.gov.br, setembro/novembro de 2017

  11. Investopedia: Wholly owned by IAC (NASDAQ: IAC), it is the largest financial education website in the world https://www.investopedia.com/university/commodities/commodities19.asp#ixzz4zNSjluZg, setembro/novembro de 2017

  12. Macrotrends - The Premier Research Platform for Long Term Investors com dados da cotação da soja, URL: http://www.macrotrends.net/, setembro/novembro de 2017

  13. Michel Grogan no site http://www.michaeljgrogan.com/arima-and-price-forecasting/ e http://www.michaeljgrogan.com/decomposition-additive-time-series/ dá sugestões bastante úteis na busca de correlações seriais e na decomposição da série temporal, setembro/novembro de 2017

  14. Monsanto http://www.monsoy.com.br/, setembro/novembro de 2017

  15. OECD: The Organisation for Economic Co-operation and Development https://data.oecd.org/, setembro/novembro de 2017

  16. Our World in Data - University of Oxford https://ourworldindata.org/food-prices/, setembro/novembro de 2017

  17. Teoria do valor subjetivo https://www.mises.org/sites/default/files/Principles%20of%20Economics_5.pdf, setembro/novembro de 2017

  18. The Wordld Bank http://www.worldbank.org/, setembro/novembro de 2017