class: center, middle, inverse, title-slide # Detecção de pontos de mudança na curva de novos casos de covid-19 ### Magno T F Severino ### KSS - Santander ### 17/11/2021 --- <style> .remark-slide-content > h1 { font-size: 40px; } .center2 { margin: 0; position: absolute; top: 50%; left: 50%; -ms-transform: translate(-50%, -50%); transform: translate(-50%, -50%); } .leftmargin { margin: 0; padding.left: 0px; } code { white-space : pre-wrap !important; word-break: break-word; } </style> # Casos diários reportados no Brasil (2020) <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/casos_br-1.png" width="864" style="display: block; margin: auto;" /> <!-- pode nao ser a realidade, somente testa casos graves, atraso de notificacao, etc... --> <!-- fim de semana com menos reportados. relacao testes/infectados: 57% dos testes feitos sao positivos --> <!-- obtemos os dados e analisamos com a técnica que estamos desenvolvendo.. existem um tanto de coisas que nao estamos levando em consideracao por isso conclusoes devem ser feitas com uma equipe multidisciplinar --> <!-- grafico: dados diários brasil e dados suavizados --> --- # Média móvel de casos semanais reportados no Brasil (2020) <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/br_suave-1.png" width="864" style="display: block; margin: auto;" /> --- # Média móvel de casos semanais reportados no Brasil (2020) <!-- como a evolucao da doença é exponencial, ao passar pra escala log para ver uma evolucao linear --> <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/br_suave_log-1.png" width="864" style="display: block; margin: auto;" /> <!-- idea: vamos ajustar um modelo linear por partes tentando identificar onde tem pontos de mudança na evolucao da doenca, pois nao tem a mesma taxa de evolucao, muda na medida que ações de mitigacao sao tomadas --> --- # Média móvel de casos semanais reportados no Brasil (2020) <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/unnamed-chunk-1-1.png" width="864" style="display: block; margin: auto;" /> --- # Média móvel de casos semanais reportados no Brasil (2020) <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/unnamed-chunk-2-1.png" width="864" style="display: block; margin: auto;" /> --- # Regressão usando splines <img src="data:image/png;base64,#figures/spline_linear.png" width="500px" style="display: block; margin: auto;" /> --- # Definição Problema de regressão não paramétrica da forma `\begin{equation} y_i = f(x_i) + \epsilon_i , \qquad i=1,...,n, \end{equation}` * `\(x_i\in \mathbb{R}\)`; * `\(f\)` é uma função suave desconhecida em `\([a,b]\)`; * `\(f(x_i) = \mathbb{E}(y_i|x_i)\)`; * `\(\epsilon_i\)` são iid com `\(\mathbb{E}(\epsilon_i) = 0\)`. --- # Definição Para estimar `\(f\)`, defina uma partição de `\([a,b]\)` em intervalos `\([a,t_1),[t_1,t_2),...,[t_K,b]\)` e um modelo de regressão spline de ordem `\(m=p+1\)`, `\begin{equation} f(x) = \beta_{0} + \sum_{j=1}^{p} \beta_{j}x^{j} + \sum_{k=1}^{K} \beta_{p+k}(x-t_{k})_{+}^{p}, \end{equation}` * `\(p, K \in \mathbb{Z}^{+}\)`, * `\(\boldsymbol{\beta} = [\beta_0,...,\beta_{p+K}]'\)`, * `\((u)_{+}^{p} = u^{p}\mathbb{1}(u \geq 0)\)`, * `\(t_1 <...<t_{K}\)`. <!-- f(i), i o dia + erro --> <!-- spline linear: modelo linear adicionando xi_k, pontos onde vemos mudança de comportamento --> <!-- ajuste com um criterio de minimos quadrados com um termo de penalidade no numero de knots para ajustar automaticamnete o nro de knots e as posicoes --> <!-- minimizamos em k e nos pontos --> --- # Método <!-- The estimation of the parameters should consider its performance regarding a loss function, such as in our case, the the residual sum of squares and also some degree of smoothness for `\(f\)`. --> <!-- We propose to control the smoothness with a roughness penalty defined in terms of the --> <!-- number of intervals established by the knots, i.e, the `\(K\)` knots define `\(K+1\)` intervals --> <!-- on the domain of `\(f\)`. Thus, we define the penalized sum of squares `\(PSS_{\lambda}\)` as --> Soma de quadrados de resíduos penalizada `\begin{equation} PSS_{\lambda}(\boldsymbol{\theta};\boldsymbol{y}) = \sum_{i=1}^{n}[y_i - f(x_i)]^2 + \lambda (K+1), \end{equation}` * `\(\boldsymbol{y} = [y_1,...,y_n]'\)`, * `\(f\)` é a função spline, * `\(\lambda>0\)` é a constante de penalização. O estimador `\(\boldsymbol{\hat{\theta}}\)` é obtido por `\begin{equation} \boldsymbol{\hat{\theta}} = \arg \min_{\boldsymbol{\theta}} PSS_{\lambda}(\boldsymbol{\theta};\boldsymbol{y}). \end{equation}` * `\(\boldsymbol{\theta} = [\boldsymbol{\beta}, K, t_1,...,t_K]'\)`. --- # [www.ime.usp.br/~gpeca](http://www.ime.usp.br/~gpeca) <img src="data:image/png;base64,#figures/gpeca.png" width="100%" style="display: block; margin: auto;" /> ## Inicio da pandemia em São Paulo/SP <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/unnamed-chunk-3-1.png" width="864" style="display: block; margin: auto;" /> --- # Inicio da pandemia em São Paulo/SP <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/mg_lin-1.png" width="864" style="display: block; margin: auto;" /> --- # Taxa de duplicação em São Paulo/SP <table class="table table-striped table-hover" style="width: auto !important; margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:center;"> Período </th> <th style="text-align:center;"> Taxa de mortalidade acumulada </th> <th style="text-align:center;"> Taxa de duplicação </th> </tr> </thead> <tbody> <tr> <td style="text-align:center;"> 15/03 - 30/03 </td> <td style="text-align:center;"> 8,8% </td> <td style="text-align:center;"> 3,6 dias </td> </tr> <tr> <td style="text-align:center;"> 31/03 - 23/04 </td> <td style="text-align:center;"> 8,2% </td> <td style="text-align:center;"> 66,8 dias </td> </tr> <tr> <td style="text-align:center;"> 24/04 - 29/04 </td> <td style="text-align:center;"> 8,7% </td> <td style="text-align:center;"> 6,3 dias </td> </tr> <tr> <td style="text-align:center;"> 30/04 - 20/05 </td> <td style="text-align:center;"> 8% </td> <td style="text-align:center;"> 38,2 dias </td> </tr> </tbody> </table> --- # Suiça <!-- quando a evolucao da epidemia passa do pico, usar splines lineares ja nao é muito razoavel pois o crescimento deixa de ser linear --> <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/unnamed-chunk-4-1.png" width="864" style="display: block; margin: auto;" /> --- # Suíça <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/swiss_suave-1.png" width="864" style="display: block; margin: auto;" /> --- # Suíça <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/swiss_lin-1.png" width="864" style="display: block; margin: auto;" /> --- # Splines cúbicos <img src="data:image/png;base64,#figures/spline_cub.png" width="500px" style="display: block; margin: auto;" /> --- # Suiça <img src="data:image/png;base64,#apresentacao_santander_files/figure-html/unnamed-chunk-5-1.png" width="864" style="display: block; margin: auto;" /> --- class: middle background-size: 125px background-position: 95% 3% # Como aplicar esse método em outuros contextos? --- # Referências * Sousa, Alex Rodrigo dos S., Magno TF Severino, and Florencia G. Leonardi. "<i>Model selection criteria for regression models with splines and the automatic localization of knots.</i>" arXiv preprint arXiv:2006.02649 (2020); * Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. The elements of statistical learning: data mining, inference, and prediction. Springer Science & Business Media, 2009; * [opendata.ecdc.europa.eu/covid19/](opendata.ecdc.europa.eu/covid19/); * [Brasil.io](opendata.ecdc.europa.eu/covid19/); * [www.worldometers.info/coronavirus/](https://www.worldometers.info/coronavirus/). --- class: title-slide-final, middle background-size: 125px background-position: 95% 3% # Obrigado! <a href="mailto:magno@ime.usp.br">.RUred[<i class="fa fa-envelope fa-fw"></i>] .black[magno@ime.usp.br] ###### Agradecimento à CAPES, ao CNPq e à FAPESP por financiamento parcial deste trabalho.