Notação utilizada neste trabalho: \(1.86*10^{2}=1.86e2=186\). Usamos os seguintes pacotes na linguagem R:
library(knitr); library(rmarkdown); library(tidyverse); library(e1071)
library(lubridate); library(magrittr); library(gridExtra); library(broom)
library(data360r); library(car); library(lmtest); library(ggpubr)
library(MASS);library(forecast);library(tseries) # ARIMA
library(kableExtra)
knitr::opts_chunk$set(echo = FALSE, warning=FALSE, message=FALSE, fig.pos = 'h', width = 120)
Fizemos uma avaliação geral da agricultura paulista e notamos que apresentava os maiores valores de produtividade da soja no Brasil e resolvemos nos aprofundar no tema.
Estabelecemos um modelo para a cotação internacional da soja que envolve os três principais jogadores do mercado mundial da soja - China, EUA e Brasil - usando marcadores de oferta e demanda bastante objetivos: as produções anuais do Brasil e EUA, além do produto interno bruto total da China:
Índice Razão: \(Razão_{i} = Cotação_{i-1}.\frac{Prod_{i-1}}{GDP_{i-1}}\frac{GDP_{i}}{Prod_{i}}\) onde \(Prod_{i}\) é a iésima soma da produção anual do Brasil e dos EUA e \(GDP_{i}\) é o produto interno bruto anual da China
Modelo: \(Cotação = 0.5(1) + 0.9978(5). Razão\)
Com \(p-values\) entre 0.0 e 0.001 para todos os coeficientes e \(R^{2}=adjustedR^{2}=0.997\) para \(IC=95\%\).
O desenvolvimento sugerido é usar dados meteorológicos avaliando efeitos sobre a produção da soja e seu custo.
Vamos estabelecer o quadro geral de produção agrícola do estado de São Paulo e destacar a soja já que tem a maior produtividade no cenário brasileiro. A seguir estabeleceremos os eixos princicais do mercado mundial da soja:
China: o principal consumidor
O Brasil e os Estados Unidos da América (EUA): os principais produtores
A Bolsa de Chicago: onde se estabelece a cotação da soja e menos de uma dezena de compradores compram efetivamente o grão ( A Cargill é o maior comprador e diz: “Como um dos maiores comerciantes de grãos e oleaginosas do planeta, a Cargill conecta produtores e usuários do setor ao redor do mundo.” ), além disso possui o mercado de futuros mais consolidado.
O mercado de futuro da soja é - segundo a Investopedia - influenciado por:
A demanda por biodiesel
A cotação e força do dolar norte-americano (US dollar)
Risco reais ou previstos para os cultivares
Demanda do mercado emergente
O crescimento econômico mundial
A teoria subjetiva do valor propõe que o valor de um produto não é determinado por suas características ou seu valor de produção, mas pelo desejo daqueles que querem consumi-lo. A partir dessa consideração assumimos para a elaboração de um dos dos nossos modelos que as variações do preço vem apenas da variação da oferta e demanda do produto, assim o preço do produto é diretamente proporcional à demanda e inversamente proporcional à oferta:
Seja \(P=K_{1}.D\) e também \(P=\frac{K_2}{O}\) onde o preço \(P\), a demanda \(D\) e a oferta \(O\) e \(\left\{ K_{i} \right\}^{n}_{i=1}\) o conjunto de constantes
Considere uma série histórica de preços \(\left\{ P_{j} \right\}^{n}_{j=1}\) onde podemos admitir que:
\(\frac{P_{1}.O_{1}}{D_{1}}=\frac{P_{2}.O_{2}}{D_{2}}=...=\frac{P_{n}.O_{n}}{D_{n}}=K_{k}\)
ou de modo mais restrito para um par de preços consecutivos:
\(P_{j}=P_{j-1}\frac{O_{j-1}}{D_{j-1}}\frac{D_{j}}{O_{j}}\)
Nossa pretensão inicial era avaliar os fatores meteorológicos que afetariam a produção e a produtividade e estabelecer um conjunto de modelos que preveriam a cotação da soja no mundo. Porém restringimos nossos objetivos diante da escassez de dados disponíveis de observações meteorológicas a construir um conjunto de modelos para a cotação da soja em grão envolvendo a demanda e produção.
O Estado de São Paulo possui mais de 190 mil quilômetros quadrados plantados, entre culturas, pastagens e florestas destinadas ao aproveitamento econômico. No setor agrícola, as principais características são variedade e qualidade. Líder em agronegócios, o Estado é responsável por um terço do PIB agroindustrial do Brasil. Os agronegócios de São Paulo representam 22% do ICMS arrecadado. Maior produtor mundial de suco de laranja e com a maior produção nacional de frutas (um terço do total), São Paulo também produz 80% da laranja para a indústria. Além da maior produtividade nacional de soja, o estado também é o segundo maior produtor mundial de cana-de-açúcar, aqui também se cultiva 25% dos legumes nacionais. Ainda há destaque para a produção de café, sendo considerado o quarto maior produtor mundial e o terceiro nacional, com 3,5 milhões de sacas de 60 quilos.
Apresentamos a seguir as áreas plantadas, as produções e as produtividades dos principais produtos agrícolas do estado de São Paulo de acordo com o Instituto de Economia Agrícola - dados extraídos de boletins em http:/lwww.iea.sp.gov.br - para safras 2014/2015 e 2015/2016 dando uma visão geral do passado próximo nas próximas três tabelas:
Produto | Área2014_15 | Área2015_16 | VarÁrea_% |
---|---|---|---|
Café_beneficiado | 212.30 | 211.66 | -0.3 |
Cana_forragem | 84.04 | 87.08 | 3.6 |
Cana_indústria | 6170.63 | 6043.41 | -2.1 |
Laranja | 471.58 | 457.53 | -3.0 |
Soja_total(primeira_safra) | 758.05 | 827.35 | 9.1 |
Soja(primeira_safra) | 717.95 | 785.16 | 9.4 |
Soja_irrigada(primeira_safra) | 40.10 | 42.19 | 5.2 |
Tabela 1 Previsões e Estimativas das Safras Agrícolas do Estado de São Paulo de café, cana, laranja e soja. Area (1000 ha, var %) comparada entre o ano agrícola 2015/16 e o 2014/2015.
Produto | Produção2014_15 | Produção2015_16 | VarProdução_% |
---|---|---|---|
Café_beneficiado | 245.19 | 342.61 | 39.7 |
Cana_forragem | 5027.48 | 5287.62 | 5.2 |
Cana_indústria | 436252.89 | 439481.57 | 0.7 |
Laranja | 12050.88 | 11406.11 | -5.4 |
Soja_total(primeira_safra) | 2229.45 | 2717.09 | 21.9 |
Soja(primeira_safra) | 2070.22 | 2552.76 | 23.3 |
Soja_irrigada(primeira_safra) | 159.23 | 164.33 | 3.2 |
Tabela 2 Previsões e Estimativas das Safras Agrícolas do Estado de São Paulo de café, cana, laranja e soja. Produção (1000 t, var %) comparada entre o ano agrícola 2015/16 e o 2014/2015.
Produto | Produtividade2014_15 | Produtividade2015_16 | VarProdutividade_% |
---|---|---|---|
Café_beneficiado | 1.220 | 1.703 | 39.6 |
Cana_forragem | 59.819 | 60.721 | 1.5 |
Cana_indústria | 77.823 | 79.324 | 1.9 |
Laranja | 27.227 | 26.650 | -2.1 |
Soja_total(primeira_safra) | 2.941 | 3.284 | 11.7 |
Soja(primeira_safra) | 2.884 | 3.251 | 12.7 |
Soja_irrigada(primeira_safra) | 3.971 | 3.895 | -1.9 |
Tabela 3 Previsões e Estimativas das Safras Agrícolas do Estado de São Paulo de café, cana, laranja e soja. Produtividade (ton/ha, var %) comparada entre o ano agrícola 2015/16 e o 2014/2015.
Destacamos que a produtividade da soja paulista, em especial a irrigada, é uma das maiores no Brasil e nos atraiu para seu estudo.
A soja Glycine max é uma leguminosa cujo grão possui grande utilidade e variedade em sua aplicação: desde ração animal, insumos farmacêuticos, alimento rico em proteinas, óleos, flavonoides e fitoesteroídes, pode ser usada na recuperação do solo e até na produção de biodiesel. É vendida em grãos, farelo e óleo primariamente; sendo típica de clima temperado e cultivada desde a Antiguidade na China onde foi domesticada, contudo tem sido adaptada a diferentes tipos de clima nos últimos anos tem sido possível obter excelentes resultados inclusive em regiões de clima não temperado, como o centro-oeste brasileiro graças a chamada tropicalização implementada pela EMBRAPA.
A cultura da soja é anual com safra das águas, safrinha e irrigada. Sua produtividade depende da presença de chuvas, uma vez que a produção de soja é incompatível com a presença de secas. Os solos de drenagem livre, arenoso ou médio são os melhores. Os solos moderadamente férteis são particularmente adequados. O pH do solo deve ser maior ou igual a 6 e o manejo do solo no cerrado com calcário expandiu as fronteiras de seu cultivo.
A produtividade média brasileira na safra 2016/2017 foi de 3 362 kg por hectare. E neste mesmo ano foram exportados 25.4 bilhões de dólares em farelo, óleo e grãos de soja. Apresentamos na figura abaixo a produtividade em toneladas por hectare e produção em milhares de toneladas no Brasil, EUA e China:
Figura 1: Produção em milhares de toneladas e produtividade em toneladas por hectare do Brasil, China e Estados Unidos da América desde a década de 60. Dados da FAO - Food and Agriculture Organization of the United Nations. Assinalamos que a produção e produtividade do Brasil e dos EUA aumentam gradativamente e tem se aproximado nos últimos anos.
Sua utilização é majoritariamente para a indústria alimentícia, incluindo rações animais, mas também serve para a produção de biodiesel e outros produtos industriais como fármacos, cosméticos e plásticos.
Os principais produtores mundiais são: EUA, Brasil, Argentina e China; países como o Paraguai tem expandido sua presença no cenário mundial.
Apresentamos as distribuições de produção nos EUA, Brasil e estado de São Paulo, comecemos pelos EUA:
Figura 2 As regiões produtoras de soja nos EUA de acordo com NOAA/USDA acompanhadas do calendário de plantio e colheita.
As regiões produtoras de soja no Brasil expandem-se em novas fronteiras agrícolas como o Norte do Mato Grosso, o Sul do Pará e o MATOPIBA que se estende desde o Sul do Maranhão e Piauí, toma parte do Tocantins e atinge a região Oeste da Bahia, que a despeito de produtividade boa, ainda possuem alto custo de produção:
Figura 3 As regiões produtoras de soja no Brasil em 2007/2008 onde novas fronteiras são incluídas a cada ano, seja o Norte do Mato Grosso e Sul do Pará, como o MATOPIBA; os custos de produção naquelas fronteiras são bastante altos no momento. Figura da Agro Bayer Brasil
Analisando detidamente o estado de São Paulo, maior foco deste estudo, destacamos que a região com maior produção em 2007/2008 foi a de Itapeva. A área plantada de soja varia conforme o preço de outros produtos como a cana de açúcar e amendoim, este em franca expansão. A estrutura fundiária de SP encontra-se mais ou menos consolidada não permitindo grandes aumentos de área plantada como em outras regiões do Brasil, no entanto a proximidade de centros exportadores e boa logística permitem um menor custo de produção, além da maior produtividade conquistada por nossos agricultores:
Figura 4 As regiões produtoras de soja no estado de São Paulo em 2007/2008 conforme o Centro de Informações Agropecuárias CIAGRO.
Comparação de produção, produtividade e área plantada de soja entre o Brasil e o estado de São Paulo via CONAB, desde 1977 até a expectativa para a safra 2017/2018, assinalamos a maior produtividade de SP quando conparada à do Brasil:
Figura 5 Comparação de produção, produtividade e área plantada de soja entre o Brasil e o estado de São Paulo desde 1977 até a expectativa para a safra 2017/2018. À esquerda contrapõem-se dados absolutos em azul para o Brasil e em vermelho para SP, já à direita os dados relativos de SP diante dos correspondentes do Brasil em %. A expansão de novas fronteiras agrícolas brasileiras torna a área e a produção relativas de SP menores ao longo do tempo, mas a produtividade paulista foi maior que a média brasileira em geral, ainda mais na sua fração irrigada conforme tabela 3.
Na tabela abaixo apresentamos os mínimos percentuais da produtividade paulista em relação a brasileira:
1995 | 1998 | 2000 | 2001 | 2007 | 2009 | 2010 | 2011 | 2014 | |
---|---|---|---|---|---|---|---|---|---|
% | 94.1 | 88.1 | 87 | 94.5 | 94.6 | 93.5 | 94.7 | 89.5 | 78.7 |
Tabela 4 A produtividade paulista foi menor que a brasileira apenas nos anos assinalados acima; sua variação pode ter sido causada por fatores econômicos, tecnológicos e meteorológicos. Dados do CONAB de 1977 a expectativa para 2018.
Ver notícias: seca 2014/2015 1999/2000: a produtividade em geral e a paulista em particular pode ser sensível a fatores climáticos (menos a soja irrigada, enquanto a crise hídrica não afetar a irrigação), vejam os seguintes exemplos:
“Soja: Safra 2014/15 deve registrar quebra de até 5 milhões de t com clima seco” em https://www.noticiasagricolas.com.br/noticias/soja/151538-soja-safra-201415-deve-registrar-quebra-de-ate-5-milhoes-de-t-com-clima-seco.html#.Wg9mn9-LSnw
“Soja: Em Itapeva (SP), perdas nas lavouras podem ficar acima de 50% em decorrência do clima adverso” em https://www.noticiasagricolas.com.br/videos/entrevistas/151515-na-regiao-de-itapeva-sp-lavouras-de-soja-devem-registrar-perdas-entre-20-ate-50-devido-a-irregularidade.html#.Wg9oTN-LSnx
A fenologia da soja é divida em duas fases: a vegetativa e a reprodutiva. Cada uma delas é sensível a fatores climáticos, doenças e pragas específicas, assim o manejo vai além das porteiras. Indo da produção de colheitadeiras e outras máquinas pesadas; envolve a produção, instalção e manutenção de silos e esteiras, bem como da automatização de portos e atinge o desenvolvimento e produção de sementes e defensivos agrícolas. Num exemplo de impacto econômico temos a fusão da Bayer com a Monsanto que foi estimada em 66 bilhões de US dollars. A figura abaixo ilustra a fenologia da planta bem como sugere quais defensivos podem ser usados em cada fase, essas empresas tem um cuidado primoroso com seus sites:
Figura 6 Fenologia da soja e defensivos agrícolas segundo Agro Bayer Brasil.
Fase Vegetativa:
Figura 7 fase vegetativa, da FAO
Fase Reprodutiva:
Figura 8 fase reprodutiva, da FAO
Plantio e Colheita: a soja é uma cultura anual e tem seu período de semeadura feito entre o meio de outubro e o meio de dezembro no Brasil. Já sua colheita é feita após o desenvolvimento da soja, quando o grão está com aproximadamente 13% de umidade; se estiver muito seco esfarela levando a perdas maiores na colheitadeira automática, caso contrario quando muito úmido o grão pode mofar perdendo seu valor. O tempo da colheita é geralmente de 100 a 160 dias após o plantio da soja. Existe uma alternância entre nós e os EUA na fase em que semeamos, os EUA colhem e vice-versa, vejam nosso calendário:
Figura 5 O calendário de plantio - vermelho - e colheita - verde - da soja no Brasil em porcentagem, existem variedades precoces que permitem uma safrinha. Os períodos plantio são ligeiramente diferentes conforme a região e o início das chuvas, bem como o de colheita, mais eficaz num máximo de seca. Dados do CONAB.
Condições climáticas adequadas ao cultivo:
A soja é originalmente observada em climas temperados, porém se adapta também a outros tipos de clima, como o tropical e subtropical.
A temperatura ideal para o plantio da soja é a temperatura entre 20°C e 30°C. A temperatura ideal seria em torno de 30°C.
A temperatura do solo, não pode ser menor que 20°C, pois comprometeria a emergência e germinação da soja. A temperatura ideal do solo seria de aproximadamente 25°C.
A quantidade de água necessária, para obtenção de um rendimento máximo, varia entre 450 a 800 mm/ciclo, dependendo das condições climáticas, do manejo da cultura e da duração do seu ciclo. Durante a germinação a quantidade de água no solo deve ser entre 50% e 85%, porém conforme a planta se desenvolve há a necessidade de uma maior quantidade de água, com um máximo na floração.
Condições climáticas prejudiciais e fatores de risco durante o desenvolvimento:
Em geral, para a soja uma maior taxa de sombreamento à radiação solar causará menor crescimento e desenvolvimento para a planta.
Temperaturas menores que 10°C resultam em crescimento muito pequeno ou nulo para a soja, porém temperaturas maiores de 40°C também são prejudiciais, provocando danos à floração e menor capacidade de retenção de vagens.
Todos os fatores prejudiciais citados, são agravados com a presença de déficit hídrico, sendo o excesso de água mais prejudicial do que o déficit.
Apesar de chuvas serem necessárias, o excesso de chuva e dias nublados podem prejudicar a fotossíntese, o arejamento do solo, o desenvolvimento das raízes e a fixação de nitrogênio, interferir em outros processos e causar várias anomalias no desenvolvimento da soja, reduzindo o rendimento de grãos.
O excesso de água no solo durante a germinação, é uma condição favorável ao desenvolvimento de pragas e doenças que poderão prejudicar o desenvolvimento da planta.
Solos com pH menor que 6, são considerados prejudiciais à soja, sendo necessário o manejo com calcário.
Necessidade de irrigação: será para suprir um déficit hídrico, uma vez que caso chova o suficiente não será necessário irrigar. Isso vai depender do balanço hídrico da região e como a quantidade de água necessária em cada estádio de desenvolvimento pode variar, a quantidade irrigada deve ser estudada pelo agricultor a determinar quando e quanto irrigar.
Pragas e Doenças: a adaptação da soja a novas regiões climáticas tornou-a susceptível de muitas pragas e doenças, além do mais a grande mobilidade humana tem levado ao aparecimento de agentes daninhos exóticos a cada região. Deste modo o desenvolvimento de novas variedades mais resistentes se torna um processo contínuo. Habitualmente dividimos os agentes biológicos prejudiciais a cultura em três grupos:
Pragas ( artrópodes, moluscos e vermes como os nematoídes )
Doenças ( fungos, vírus e bactérias )
Ervas daninhas
Porém tudo pode ser mais complexo, daí uma praga pode ser vetor de um vírus como no caso da soja louca II. Além do mais a soja compete com hervas locais, assim a variedade transgênica resistente ao glifosfato pode ter sua produtividade aumentada com a aplicação deste herbicida.
Entre as principais pragas que afetam significativamente a produção de soja, existem 15 mais relevantes:
Grupo | Espécies Mais Comuns |
---|---|
Artrópodes | Ácaros-fitófagos, Lagarta-do-cartucho, Mosca-branca, Coró-da-soja, Lagarta-elasmo, Percevejo-castanho, Coró-da-soja-do-cerrado, Lagarta-falsa-medideira, Percevejos-fitófagos, Coró-pequeno-da-soja, Lagartas broqueadoras de vagens e grãos, Piolho-de-cobra, Lagarta-da-soja e Tamanduá-da-soja |
Moluscos | Lesmas e Caracóis |
Vermes | Nematóides |
Os ácaros fitófagos podem ser naturalmente controlados, nos períodos de maior umidade ou precipitação aparecem agentes biológicos naturais de controle. Algumas das pragas necessitam praguicidas que podem ser prejudiciais a planta também, assim só são aplicados caso haja uma quantidade significante de praga.
O manejo adequado do solo e aplicação correta de defensivos agrícolas realizam papel fundamental na prevenção de pragas e doenças. No caso das lagartas-da-soja usamos o inseticida somente se forem encontradas em média 20 lagartas grandes por metro de fileira. Já para o coró-da-soja devemos detecta-lo antes mesmo do plantio e é necessário o preparo do solo com implementos adequados.
Quando ocorrer um ataque significativo do tamanduá-da-soja deve-se analisar o solo no talhões onde aconteceu o ataque e se de fato foi intenso devemos realizar a rotação de cultura usando milho a seguir ou quaisquer cultura que não seja hospedeira da praga. Podem também ser controlados através da aplicação de inseticidas e após o tratamento correto a área poderá ser plantada novamente com soja na próxima safra.
As doenças em geral tem menor impacto econômico relativamente às pragas podem ser causadas por:
Grupo | Espécie(Moléstia) |
---|---|
Bactérias | Pseudomonas tabaci(Fogo selvagem), Pseudomonas glycinea(Crestamento bacteriano) e Xanthomonas phaseoli(Pústula bacteriana) |
Vírus | soja louca II, vira-cabeça e mosaico comum da soja |
Fungos | Colletotrichum dematiun(Antracnose), Cercospora sojina(Cercosporiose), Cercospora kikuchü(Mancha Púrpura), Peronospora manshurica(Míldio), Rhizoctonia solani(Rizoctoniose) e Septoria glycines(Septoriose) |
Para se proteger das doenças, é feito o cruzamento de variedades com resistência, rotação de culturas e a escolha de sementes sadias para evitar o aparecimento das doenças citadas anteriormente.
Comparamos tais países através do produto interno bruto - tanto seu valor total quanto o valor per capita - para estimar grosseiramente a capacidade de demanda de cada um. Cumpre lembrar que a China possui 1.35 bilhões de habitantes. Vamos aos dados do Banco Mundial http://www.worldbank.org para GDP e GDP per capita desde a década de sessenta até hoje, cumpre observar que tão importante como seus valores é sua taxa de crescimentto ou de retração:
Figura 6: GDP ou produto interno bruto total e per capita do Brasil, China e Estados Unidos da América desde a década de 60. Dados do Banco Mundial.
A produção anual de riquezas reflete-se no GDP e este pode resultar numa maior demanda/consumo; acontece que o valor per capita de China e Brasil são muito baixos ao se comparar com os dos EUA. No entanto a China tem a maior população mundial e seu GDP total tem crescido sistematicamente, assim faremos deles um indicador de demanda para a soja que pode ser importante na formação do preço da commodity. Se cada chinês consumir uma colher de café de açúcar a mais, talvez venha a faltar o produto … será?
A cotação da soja na Bolsa de Chicago com dados de Macrotrends www.macrotrends.net de 1969 a 2017 que converteremos de US dollars/bushel para US dollars/ton é a nossa variável dependente:
Figura 7 As crises econômicas assinaladas em cinza
e a cotação diária da soja em dólares norte-americanos por bushel de grãos. Figura da Macrotrends.
Avaliamos sua distribuição não-gaussiana através do histograma e do gráfico Q-Q:
Figura 8 distribuição da cotação da soja:
à Esquerda: O histograma acima da cotação sugere que a distribuição é trimodal e não é gaussiana; O histograma abaixo do logaritmo da cotação também parece trimodal, porém é mais gaussiana
à Direita: O gráfico Q-Q acima para cotação afasta-se do perfil gaussiano, enquanto o abaixo para o logaritmo natural da cotação é mais próximo do gaussiano, fizemos o teste de normalidade e rejeitamos \(H_o\) ou seja, não é normal também; assim será necessária a linearização, mas as regressões podem não se ajustar tão bem.
O resumo destes dados:
date | value | ln | |
---|---|---|---|
Min. :1969-06-02 | Min. : 85.7 | Min. :4.451 | |
1st Qu.:1981-07-09 | 1st Qu.:197.9 | 1st Qu.:5.288 | |
Median :1993-08-11 | Median :228.7 | Median :5.433 | |
Mean :1993-08-15 | Mean :260.0 | Mean :5.487 | |
3rd Qu.:2005-09-22 | 3rd Qu.:302.0 | 3rd Qu.:5.711 | |
Max. :2017-11-10 | Max. :657.7 | Max. :6.489 |
Tabela 5 resume os dados com as principais estatísticas: os quartis, a mediana e a média. As variáveis são:
date
apresenta a data no formato YYYY-MM-DD ou Ano-Mês-Dia
value
mostra a cotação em US dollar/ton
ln
corresponde ao logaritmo natural da cotação.
Temos a cotação diária como variável dependente; bem como as medidas anuais de: GDP total e per capita da China como medidas de demanda, produção dos EUA e Brasil como medidas de oferta perfazendo o conjuto de variáveis independentes. Assim pretendemos envolver os principais jogadores do mercado soja, todavia não incluímos os intermediários que vão desde o grupo Cargill até os especuladores do mercado de futuros da soja.
A análise exploratória dessas variáveis constitui-se de:
histograma de cada uma
matriz de correlação entre elas
gráficos de dispersão entre todos os pares possíveis.
Tal processso está resumido na figura abaixo:
Figura 9 A relação entre a cotação da soja e as demais variáveis não é linear de acordo com os gráficos de dispersão no triângulo inferior. Todas as variáveis são contínuas e se desviam para esquerda - as ditribuições dos GDP da China bruto e per capita ainda mais. As maiores correlações são entre GDP bruto e per capita obviamente com valor um; a seguir a cotação e seu logaritmo natural com 0.96; a produção brasileira e os GDPs igual 0.91, bem como das produções entre si no mesmo valor ou seja, existe a multicolinearidade. Outro achado importante é a correlação entre a variável dependente, o preço, com as outras:
0.82 com GDP total e per capita
0.72 para produção brasileira
0.59 para a produção dos EUA.
Antes de avaliar a multicolinearidade e a heteroscedasticidade para os modelos não-lineares usaremos o modelo ARIMA para poder saber se existe um processo estácionário, alguma tendência ou alguma influência sazonal na cotação.
As médias móveis em série temporal no modelo ARIMA para a cotação pode ser estabelecidas conforme:
Seja um conjunto de uma sequência temporal iésima de certa variável \(X_{i}\): \(\left\{ X_{i}\right\} _{i=1}^{n}\)
onde podemos supor existir uma relação entre elas: \(X_{i+\Delta}=L_{\Delta}.X_{i}\) onde a função lag ou intervalo \(L_{\Delta}\) propõe que certo suconjunto das variáveis obedecem essa lei
decorre que \(\log(L_{\Delta})=\log(\frac{X_{i+\Delta}}{X_{i}})=\log(X_{i+\Delta})-\log(X_{i})\)
encontramos subconjuntos de variáveis cada um obedecendo certo lag
Quando existe um processo estacionário a previsão pode ser mais acurada; se existir alguma sazonalidade devemos investigar a influência de algum processo cíclico como o meteorológico, ademais os dados parecem apresentar certa tendência de alta ao longo dos anos conforme se percebe figura 7.
A formação dos preços pode ser um processo bem complexo de se entender, embora ocorra cotidianamente. Tal processo pode revelar uma certa inércia para o estabelecimento dos preços ( “o que pagaremos hoje depende do que pagamos ontem” ) que vai além da oferta e da demanda, digamos, o quanto queremos pagar, algum mecanismo social que está fora do alcance deste estudo. Nossa hipótese de que a oferta é dimensionada pela produção de soja do Brasil e dos EUA, enquanto a demanda é medida indiretamente pelo produto interno bruto do maior consumidor a China, havia o temor que a hipótese poderia sucumbir na relação sinal-ruído.
Asseguramos que aplicamos os testes:
para autocorrelação e confirmamos sua existência
para autocorrelação parcial que decai rapidamente como esperado
de Dickey-Fuller onde rejeitamos \(H_o\) e afirmamos que existe componente estacionário, o que permite boas previsões (errro médio 0.0034% e a soma de todos os erros chegou a 39.46%)
de Ljung-Box onde aceitamos \(H_o\) confirmando que os resíduos são aleatórios
A decomposição permitiu revelar um componente sazonal com máximos de 6.936 US dollars/ton e mínimos de -6.034 US dollars/ton a cada ano, apresenta componente aleatório e outro de tendência, confiram as próximas figuras:
Figura 10 Série temporal de 1969 a 2014 da cotação diária de soja em US dollars/ton decomposta em porções aditivas nos paineis de cima para baixo:
Observações (total)
Tendência (trend): ainda que não seja linear ela é de alta ao longo dos anos
Sazonal (seasonal): com extremos -6 US dollars/ton e +6 US dollars/ton e período igual a \(370\pm 49\) dias e variando de 173 a 392 dias; no calendário a colheita no Brasil vai de fevereiro a maio, enquanto nos EUA vai de setembro a novembro; se máximo coincidir com o período da safra colhida disponível, melhor para o produtor
Aleatório (random): impõe variação entre -100 a +150 US dollars/ton
Figura 11 Componente sazonal da cotação diária da soja: destacamos aleatoriamente o período entre jun/2007 e jun/2011. Em US dollars/ton, note que a fase de alta coincide com a de entrega da colheita brasileira nesse período, porém o período para cotações máximas é variável: a média \(370\pm 49\) dias e varia de 173 a 392 dias. Com isso nem sempre existe uma coincidência tão favorável para o Brasil, nem o período é apenas determinado por ciclos anuais do clima.
O desenvolvimento de um modelo não-linear para a cotação da soja em função do GDP da China (os resultados foram similares seja usando o total como o per capita), da produção do Brasil e dos EUA poderia permitir avaliar alguma influência climática na produção e por consequência na cotação. Já relatamos nossa dificuldade para obter os dados climáticos.
Ao avaliar o preço através do modelo ARIMA ficou claro que existe influência sazonal, a qual poderia se tratar tanto de alguma questão econômica, quanto do manejo de uma cultura anual ou da existência do ciclo climático.
Vimos três caminhos possíveis para a construção dos modelos e escolhemos os dois primeiros por familiaridade:
Tentar linearizar as relações por transformações das variáveis
Ajustar funções não-lineares aos dados
Ajustar polimômios ou splines aos dados.
O modelo 1 advindo da linearização por meio de lm(log(value) ~ (GDP_bruto) + log(prodBRA) + log(prodEUA) , data=fim)
foi melhor que lm(log(value) ~ log(GDP_bruto) + log(prodBRA) + log(prodEUA) , data=fim)
e resultou em:
\(cotação = \exp( A + B.GDP_{bruto} + \ln(Produção_{BRA})^{C} + \ln(Produção_{EUA})^{D})\)
Ou de outro modo:
\(cotação = \exp( A + B.GDP_{bruto}).(Produção_{BRA})^{C}.(Produção_{EUA})^{D}\)
\(A=10.3(2)\) , \(B=7.5(1).10^{-14}\), \(C=0.302(5)\) e \(D=-0.56(2)\) são os coeficientes do ajuste acompanhados das respectivas incertezas entre parênteses.
Entre colchetes as unidades das variáveis: \(cotação[US dollar/ton]\), \(GDP_{bruto}[US dollar]\), \(Produção_{BRA}\) e \(Produção_{EUA}\) em \([10^{3}ton]\). Com \(p-values\) entre 0.0 e 0.001 e \(R^{2}=adjustedR^{2}=0.633\) para \(IC=95\%\).
A correlação entre os valores observados e os previstos é de 83.82%.
Teste para colinearidade: \(VIF_{GDP_{bruto}}=1.92\), \(VIF_{Produção_{BRA}}=6.20\) e \(VIF_{Produção_{EUA}}=6.51\) e é sugestivo de existir quando \(VIF_{x}\geq 5.0\).
Teste de Breusch-Pagan studentizado para heteroscedasticidade: como \(p-value=2.2*10^{-16}<0.05\) houve o fenômeno; de outro modo na figura 10 a porção aleatória da decomposição da série histórica da cotação também -e sugestiva do fenômeno.
Criamos uma função não-linear recursiva chamada Cota e fizemos o ajuste:
Índice Cota: \(Cota_{i} = = 193.8487 + cotação[i-1].[\frac{1.0809190.10^{-5}.GDP_{bruto}[i]}{Produção_{BRA}[i]+Produção_{EUA}[i]}]\)
Modelo: \(Cotação = -12(1) + 1.091(5). Cota\)
Com \(p-values\) entre 0.0 e 0.001 para todos os coeficientes e \(R^{2}=adjustedR^{2}=0.7746\) para \(IC=95\%\).
A correlação entre os valores observados e os previstos é de 88.01%. Não há colinearidade neste ajuste, entretanto existe a heteroscedasticidade com teste de Breusch-Pagan studentizado, pois o \(p-value=2.2*10^{-16}<0.05\) e rejeitamos \(H_o\) o que já era esperado em harmonia com a fração randômica do ARIMA.
Criamos uma função não-linear recursiva chamada Razão e fizemos o ajuste:
Índice Razão: \(Razão_{i} = Cotação_{i-1}.\frac{Prod_{i-1}}{GDP_{i-1}}\frac{GDP_{i}}{Prod_{i}}\) onde \(Prod_{i}\) é a iésima soma da produção anual do Brasil e dos EUA e \(GDP_{i}\) é o produto interno bruto anual da China
Modelo: \(Cotação = 0.5(1) + 0.9978(5). Razão\)
Com \(p-values\) entre 0.0 e 0.001 para todos os coeficientes e \(R^{2}=adjustedR^{2}=0.997\) para \(IC=95\%\).
A correlação entre os valores observados e os previstos é de 99.85%. Não há colinearidade neste ajuste, entretanto existe a heteroscedasticidade com teste de Breusch-Pagan studentizado, pois o \(p-value=2.2*10^{-16}<0.05\) e rejeitamos \(H_o\) o que já era esperado em harmonia com a fração randômica do ARIMA.
Figura 12 A cotação diária da soja em dólares norte-americanos por tonelada de grãos onde observações em azul são comparados aos modelos:
modelo 1 provindo de linearização em preto com estimativa de erro médio de 2.6 % e manteve o aspecto “em escada” por toda série
modelo 2 de modelo não-linear em laranja com estimativa de erro médio de 6.14 %, apresentou aspecto “em escada” apenas no início da série
modelo3 de modelo não-linear em vermelho com estimativa de erro médio de 0.04 %
Acima toda série histórica e abaixo um foco no período entre jan/14 e jan/2015.
Conseguimos estabelecer um modelo para a cotação internacional da soja que envolve os três principais jogadores do mercado mundial da soja: China, EUA e Brasil.
Sua concepção envolveu buscar marcadores de oferta e demanda dos jogadores, assim:
Marcadores de demanda: o produto interno anual da China, tanto o total quanto o per capita proveram modelos de qualidade semelhante e desse modo escolhemos o total
Marcadores de oferta: a produção anual da commodity do Brasil e dos EUA
A variável de interesse ou dependente: a cotação diária da soja na Bolsa de Chicago.
Chegamos a imaginar que as frequências diferentes - diária e anual - representariam grande obstáculo no desempenho dos modelos o que não se confirmou felizmente. Quando trabalhamos com médias anuais das cotações provocávamos a perda de informações sazonais anuais e mesmo a fração estacionária que poderia permitir uma previsão de melhor qualidade era muito prejudicada.
Usamos o método ARIMA (Autoregressive Integrated Moving Average) para discriminar três partes principais de uma série temporal: a aleatória, a tendência e a sazonal. Foi possível verificar a existência de um processo estacionário através do teste de de Dickey-Fuller e tornar a previsibilidade melhor.
Outro aspecto importante foi confirmar que existia um processo sazonal com período de \(370\pm 49\) dias para altas e baixas cotações, caberia num trabalho posterior analisar os harmônicos e confirmar o componente anual.
Um componente anual seria um bom marcador que poderia refletir a influência climatológica na produção, no entanto a produção de soja nos dois hemisférios poderia amortecer a sazonalidade.
O modelo melhor adaptado à serie é o de número três que usou uma função não-linear recursiva chamada Razão:
Índice Razão: \(Razão_{i} = Cotação_{i-1}.\frac{Prod_{i-1}}{GDP_{i-1}}\frac{GDP_{i}}{Prod_{i}}\) onde \(Prod_{i}\) é a iésima soma da produção anual do Brasil e dos EUA e \(GDP_{i}\) é o produto interno bruto anual da China
Modelo: \(Cotação = 0.5(1) + 0.9978(5). Razão\)
Com \(p-values\) entre 0.0 e 0.001 para todos os coeficientes e \(R^{2}=adjustedR^{2}=0.997\) para \(IC=95\%\).
A correlação entre os valores observados e os previstos é de 99.85%. Não há colinearidade neste ajuste, mas há a heteroscedasticidade medida através do teste de Breusch-Pagan studentizado, o que já era esperado através da análise visual da fração aleatória advinda do ARIMA.
Uma limitação deste modelo é que não dividimos os dados em séries de teste e treinamento e existe o receio de existir o overfitting. Outra dificuldade foi encontrar observações meteorológicas e incluí-las no modelo.
Foi instrutivo nos deter sobre a produção agrícola do estado de São Paulo em geral e perceber que altos índices de produtividade e variedade aliados a uma logística boa e à proximidade dos centro de pesquisa permitem reforçar o valor do nosso agricultor.
Notas de aulas da disciplina de Agrometeorologia-IAG-USP do professor Edmilson Dias de Freitas
Agro Bayer Brasil https://www.agro.bayer.com.br/culturas/soja, setembro/novembro de 2017
Cargill https://www.cargill.com.br/pt_BR/in%C3%ADcio, setembro/novembro de 2017
CATI http://www.cati.sp.gov.br/projetolupa/mapaculturas.php, setembro/novembro de 2017
CIAGRI http://ciagri.iea.sp.gov.br/nia1/subjetiva.aspx?cod_sis=1&idioma=1, setembro/novembro de 2017
CIIAGRO: O Centro Integrado de Informações agrometeorológicas http://www.ciiagro.sp.gov.br/
CONAB: Companhia Nacional de Abastecimento http://www.conab.gov.br/, setembro/novembro de 2017
EMBRAPA SOJA https://www.embrapa.br/soja, setembro/novembro de 2017
FAO: The Food and Agriculture Organization of the United Nations: http://www.fao.org/faostat/en/#data/QC , http://www.fao.org/docrep/t0532e/t0532e02.htm e http://www.fao.org/giews/food-prices/tool/public/#/home, setembro/novembro de 2017
IEA: Instituto de Economia Agrícola http:/lwww.iea.sp.gov.br, setembro/novembro de 2017
Investopedia: Wholly owned by IAC (NASDAQ: IAC), it is the largest financial education website in the world https://www.investopedia.com/university/commodities/commodities19.asp#ixzz4zNSjluZg, setembro/novembro de 2017
Macrotrends - The Premier Research Platform for Long Term Investors com dados da cotação da soja, URL: http://www.macrotrends.net/, setembro/novembro de 2017
Michel Grogan no site http://www.michaeljgrogan.com/arima-and-price-forecasting/ e http://www.michaeljgrogan.com/decomposition-additive-time-series/ dá sugestões bastante úteis na busca de correlações seriais e na decomposição da série temporal, setembro/novembro de 2017
Monsanto http://www.monsoy.com.br/, setembro/novembro de 2017
OECD: The Organisation for Economic Co-operation and Development https://data.oecd.org/, setembro/novembro de 2017
Our World in Data - University of Oxford https://ourworldindata.org/food-prices/, setembro/novembro de 2017
Teoria do valor subjetivo https://www.mises.org/sites/default/files/Principles%20of%20Economics_5.pdf, setembro/novembro de 2017
The Wordld Bank http://www.worldbank.org/, setembro/novembro de 2017