Motivations
Trong báo cáo có tên ĐÁNH GIÁ TÁC ĐỘNG CỦA COVID-19 ĐẾN NỀN KINH TẾ VÀ CÁC KHUYẾN NGHỊ CHÍNH SÁCH tại trang 10 có sử dụng mô hình SIR (tên đầy đủ là Susceptibles-Infectious-Recovered (SIR) epidemic model) đưa ra con số dự báo tương ứng với ba kịch bản khác nhau và ảnh hưởng tương ứng đối với nền kinh tế. Mô hình này có một tham số quan trọng là hệ số đặc trưng cho mức độ lây lan của dịch bệnh Ro. Mức độ quan trọng như vậy nên nó có hẳn cả một note để giải thích chi tiết ở đây và các kịch bản khác nhau (về số người sẽ bị nhiễm trong tương lai) thường được ước lượng và tính toán dựa trên các kịch bản khác nhau của hệ số Ro này (trong các tài liệu khác nhau, hệ số này có thể được kí hiệu khác nhau nhưng về ý nghĩa thì vẫn không có gì thay đổi) chứ không phải là các kịch bản từ khoảng thời gian t1 đến t2 nào đó.
Tuy vậy các tác giả lại không đề cập hay mô tả gì về việc hệ số này được ước lượng / tính toán như thế nào, hay là hệ số này được đưa vào SIR bằng phương pháp chuyên gia - tức là tham vấn các chuyên gia làm trong lĩnh vực Dịch Tễ Học về giá trị Ro nên được sử dụng cho SIR?
About SIR
SIR là một mô hình toán được biểu diễn bằng một hệ phương trình vi phân sử dụng để mô hình hóa mức độ lây lan của một dịch bệnh. Theo cách tiếp cận của mô hình này thì tốc độ lây lan của dịch bệnh được đo lường bằng ba thước đo là:
- Số người vẫn chưa bị nhiếm (Susceptible) và không được miễn dịch (và do đó có nguy cơ bị nhiễm bệnh).
- Số người bị nhiếm (Infected) và họ có khả năng lây nhiễm (Infectious).
- Số người hồi phục (Recovered). Một số tài liệu thì còn gọi là số người bị gạt bỏ (Removed) ra khỏi population có tiềm năng gây nhiễm bệnh vì vật chủ bị chết và do vậy không còn khả năng lây lan bệnh.
Về cơ bản mô hình này có một giả thuyết (trong số nhiều giả thuyết) rằng tốc độ lây lan của bệnh phụ thuộc vào một hệ số gọi là hệ số lây nhiễm Ro (trong khi cố định các yếu tố khác). Nếu hệ số này mà lớn thì số người bị nhiễm sẽ mau chóng đạt một cái đỉnh nào đó rồi giảm nhanh chóng (vì vật chủ bị nhiễm bệnh đã chết cả nên tốc độ lây lan sẽ giảm) và do vậy cách kịch bản khác nhau của dịch bệnh thì sẽ được phân tích và đánh giá dựa vào các kịch bản khác nhau của Ro. Đương nhiên hiểu biết về hệ số Ro này là lĩnh vực chuyên môn sâu của những người làm trong lĩnh vực Dịch Tễ Học.
SIR Modeling in R
Giả sử chúng ta muốn đánh giá mức độ lây lan của một loại bệnh dịch nào đó bằng mô hình SIR trong 90 ngày tới với các điều kiện ban đầu (Initial Conditions) như sau:
- Tại thời điểm ban đầu to có 10 người bị nhiễm bệnh và những người này có khả năng lây truyền bệnh cho các cá thể khác (vì không được cách li chẳng hạn).
- Tổng dân số trong cộng đồng là 100 (chú ý rằng tại mọi thời điểm thì S + I + R = Total Population = 100).
R có khá nhiều thư viện có thể sử dụng để thực hiện SIR (trong đó có thư viện EpiModel). Tuy nhiên trong post này chúng ta sẽ thực hiện SIR hơi tay chân một tí để hiểu việc triển khai từ mô hình toán đến R codes cho mô hình SIR của James Holland Jones với một số hiệu chỉnh:
# Load some packages:
library(tidyverse)
library(lubridate)
library(deSolve)
# Clear workspace:
rm(list = ls())
# Set some fixed paramters for SIR modeling:
times <- seq(0, 90, 1)
y0 <- c(90, 10, 0)
# Function calculates S, I and R:
sir <- function(t, y, p) {
yd1 <- -p["ho"]*y[1]*y[2]
yd2 <- p["ho"]*y[1]*y[2] - p["nu"]*y[2]
yd3 <- p["nu"]*y[2]
list(c(yd1, yd2, yd3), c(N = sum(y)))
}
# When ho = 0.001 (scenario 1):
pars1 <- c("ho" = 0.001, "nu" = 0.05)
sir.out1 <- lsoda(y0, times, sir, pars1)
data.frame(sir.out1) -> sir.out_df1
names(sir.out_df1) <- c("Time", "Susceptible", "Infected", "Recovered", "N")
sir.out_df1 %>%
mutate(Time = Time + date(now())) -> sir.out_df1
# When ho = 0.005 (scenario 2):
pars2 <- c("ho" = 0.005, "nu" = 0.05)
sir.out2 <- lsoda(y0, times, sir, pars2)
data.frame(sir.out2) -> sir.out_df2
names(sir.out_df2) <- c("Time", "Susceptible", "Infected", "Recovered", "N")
sir.out_df2 %>%
mutate(Time = Time + date(now())) -> sir.out_df2
# Plot:
library(hrbrthemes)
point1 <- sir.out_df1 %>% slice(which.max(Infected))
point2 <- sir.out_df2 %>% slice(which.max(Infected))
sir.out_df2 %>%
select(-N) %>%
gather(Type, Value, -Time) %>%
ggplot((aes(Time, Value, color = Type))) +
geom_line(size = 1) +
theme_modern_rc() +
labs(title = "Figure 1: Infected Cases predicted, SIR Approach", x = NULL, y = "Number of Cases") +
theme(axis.title.y = element_text(color = "white", size = 12)) +
scale_color_manual(values = c("cyan", "orange", "purple"), name = "") +
theme(legend.position = c(0.7, 0.5))

So sánh, ví dụ, mức độ lây lan của bệnh dịch căn cứ theo thước đo số người bị nhiếm tương ứng với hai kịch bản khác nhau của mức độ lây nhiễm trong khi cố định các tham số khác:
ggplot() +
geom_line(data = sir.out_df1, aes(Time, Infected, color = "Scenario 1"), size = 1) +
geom_point(data = point1, aes(Time, Infected, color = "Scenario 1"), size = 3) +
geom_line(data = sir.out_df2, aes(Time, Infected, color = "Scenario 2"), size = 1) +
geom_point(data = point2, aes(Time, Infected, color = "Scenario 2"), size = 3) +
theme_modern_rc() +
scale_y_continuous(limits = c(0, 70), breaks = seq(0, 70, 10)) +
scale_color_manual(values = c("cyan", "orange"), name = "") +
labs(title = "Figure 2: Infected Cases by Scenario, SIR Approach", x = NULL, y = "Infected Cases") +
theme(axis.title.y = element_text(color = "white", size = 12)) +
theme(legend.position = c(0.7, 0.5))

Figure 2 chỉ ra rằng với kịch bản 2 (có hệ số lây nhiễm 0.005) thì sẽ nhanh chóng đạt đến số người bị nhiễm bệnh cực đại (điểm màu vàng) sau đó giảm nhanh chóng. Nếu hệ số lây nhiễm giảm đi 5 lần thì số người nhiễm đạt cực đại thấp hơn chừng 3.4 lần (điểm màu xanh) nhưng sau đó thì số người nhiễm sẽ giảm chậm hơn so với kịch bản 1 (căn cứ vào độ dốc). Cái này cũng dễ hiểu vì nếu một dịch bệnh mà lây lan nhanh thì ngay sau khi đạt đỉnh, số người nhiễm sẽ giảm không phanh, thậm chí có thể tụt ngay về zero. Vì vật chủ nhiễm bệnh đã chết hết cả (Removed) hoặc đạt trạng thái được miễn dịch (Immunity): một bệnh dịch cụ thể thì nếu một người bị nhiễm nhưng sống sót thì sẽ không bao giờ mắc lại bệnh đó nữa.
---
title: 'SIR approach for understanding Coronavirus pandemic'
author: 'Author: Nguyen Chi Dung'
subtitle: "R for Fun"
output:
  html_document: 
    code_download: true
    # code_folding: hide
    highlight: zenburn
    # number_sections: yes
    theme: "flatly"
    toc: TRUE
    toc_float: TRUE
---

```{r setup,include=FALSE}
knitr::opts_chunk$set(echo = TRUE, warning = FALSE, message = FALSE, fig.width = 10, fig.height = 6)
```


# Motivations

Trong báo cáo có tên [ĐÁNH GIÁ TÁC ĐỘNG CỦA COVID-19 ĐẾN NỀN KINH TẾ VÀ CÁC KHUYẾN NGHỊ CHÍNH SÁCH](https://drive.google.com/file/d/1EhaOesx8ot-g8sZS24m7FIJ5ivHdPbuq/view?fbclid=IwAR04fyqiVWUgZKJCF291BxplwNtfqR3R7nwAz3Uvog9PDIpKujF3zvMPA74) tại trang 10 có sử dụng mô hình SIR (tên đầy đủ là Susceptibles-Infectious-Recovered (SIR) epidemic model) đưa ra con số dự báo tương ứng với ba kịch bản khác nhau và ảnh hưởng tương ứng đối với nền kinh tế. Mô hình  này có một tham số quan trọng là hệ số đặc trưng cho mức độ lây lan của dịch bệnh Ro. Mức độ quan trọng như vậy nên nó có hẳn cả một note để giải thích chi tiết [ở đây](https://web.stanford.edu/~jhj1/teachingdocs/Jones-on-R0.pdf) và các kịch bản khác nhau (về số người sẽ bị nhiễm trong tương lai) thường được ước lượng và tính toán dựa trên các kịch bản khác nhau của hệ số Ro này (trong các tài liệu khác nhau, hệ số này có thể được kí hiệu khác nhau nhưng về ý nghĩa thì vẫn không có gì thay đổi) chứ không phải là các kịch bản từ khoảng thời gian t1 đến t2 nào đó. 


Tuy vậy các tác giả lại không đề cập hay mô tả gì về việc hệ số này được ước lượng / tính toán như thế nào, hay là hệ số này được đưa vào SIR bằng phương pháp chuyên gia - tức là tham vấn các chuyên gia làm trong lĩnh vực Dịch Tễ Học về giá trị Ro nên được sử dụng cho SIR? 

# About SIR

SIR là một mô hình toán được biểu diễn bằng một hệ phương trình vi phân sử dụng để mô hình hóa mức độ lây lan của một dịch bệnh. Theo cách tiếp cận của mô hình này thì tốc độ lây lan của dịch bệnh được đo lường bằng ba thước đo là: 

- Số người vẫn chưa bị nhiếm (Susceptible) và không được miễn dịch (và do đó có nguy cơ bị nhiễm bệnh). 
- Số người bị nhiếm (Infected) và họ có khả năng lây nhiễm (Infectious). 
- Số người hồi phục (Recovered). Một số tài liệu thì còn gọi là số người bị gạt bỏ (Removed) ra khỏi population có tiềm năng gây nhiễm bệnh vì vật chủ bị chết và do vậy không còn khả năng lây lan bệnh.   

Về cơ bản mô hình này có một giả thuyết (trong số nhiều giả thuyết) rằng tốc độ lây lan của bệnh phụ thuộc vào một hệ số gọi là hệ số lây nhiễm Ro (trong khi cố định các yếu tố khác). Nếu hệ số này mà lớn thì số người bị nhiễm sẽ mau chóng đạt một cái đỉnh nào đó rồi giảm nhanh chóng (vì vật chủ bị nhiễm bệnh đã chết cả nên tốc độ lây lan sẽ giảm) và do vậy cách kịch bản khác nhau của dịch bệnh thì sẽ được phân tích và đánh giá dựa vào các kịch bản khác nhau của Ro. Đương nhiên hiểu biết về hệ số Ro này là lĩnh vực chuyên môn sâu của những người làm trong lĩnh vực Dịch Tễ Học. 

# SIR Modeling in R

 Giả sử chúng ta muốn đánh giá mức độ lây lan của một loại bệnh dịch nào đó bằng mô hình SIR trong 90 ngày tới với các điều kiện ban đầu (Initial Conditions) như sau: 

- Tại thời điểm ban đầu to có 10 người bị nhiễm bệnh và những người này có khả năng lây truyền bệnh cho các cá thể khác (vì không được cách li chẳng hạn). 
- Tổng dân số trong cộng đồng là 100 (chú ý rằng tại mọi thời điểm thì S + I + R = Total Population = 100). 

R có khá nhiều thư viện có thể sử dụng để thực hiện SIR (trong đó có thư viện [EpiModel](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5931789/)). Tuy nhiên trong post này chúng ta sẽ thực hiện SIR hơi tay chân một tí để hiểu việc triển khai từ mô hình toán đến R codes cho mô hình SIR của [James Holland Jones](https://web.stanford.edu/~jhj1/teachingdocs/Jones-Epidemics050308.pdf) với một số hiệu chỉnh: 



```{r}
# Load some packages: 
library(tidyverse)
library(lubridate)
library(deSolve)

# Clear workspace: 
rm(list = ls())

# Set some fixed paramters for SIR modeling: 
times <- seq(0, 90, 1)
y0 <- c(90, 10, 0)

# Function calculates S, I and R: 

sir <- function(t, y, p) {
  yd1 <- -p["ho"]*y[1]*y[2]
  yd2 <- p["ho"]*y[1]*y[2] - p["nu"]*y[2]
  yd3 <- p["nu"]*y[2]
  list(c(yd1, yd2, yd3), c(N = sum(y)))
}

# When ho = 0.001 (scenario 1):  

pars1 <- c("ho" = 0.001, "nu" = 0.05)

sir.out1 <- lsoda(y0, times, sir, pars1)
data.frame(sir.out1) -> sir.out_df1
names(sir.out_df1) <- c("Time", "Susceptible", "Infected", "Recovered", "N")

sir.out_df1 %>% 
  mutate(Time = Time + date(now())) -> sir.out_df1

# When ho = 0.005 (scenario 2):  

pars2 <- c("ho" = 0.005, "nu" = 0.05)

sir.out2 <- lsoda(y0, times, sir, pars2)
data.frame(sir.out2) -> sir.out_df2
names(sir.out_df2) <- c("Time", "Susceptible", "Infected", "Recovered", "N")

sir.out_df2 %>% 
  mutate(Time = Time + date(now())) -> sir.out_df2

# Plot: 
library(hrbrthemes)

point1 <- sir.out_df1 %>% slice(which.max(Infected))
point2 <- sir.out_df2 %>% slice(which.max(Infected))

sir.out_df2 %>% 
  select(-N) %>% 
  gather(Type, Value, -Time) %>% 
  ggplot((aes(Time, Value, color = Type))) + 
  geom_line(size = 1) + 
  theme_modern_rc() + 
  labs(title = "Figure 1: Infected Cases predicted, SIR Approach", x = NULL, y = "Number of Cases") + 
  theme(axis.title.y = element_text(color = "white", size = 12)) + 
  scale_color_manual(values = c("cyan", "orange", "purple"), name = "") + 
  theme(legend.position = c(0.7, 0.5))
```


So sánh, ví dụ, mức độ lây lan của bệnh dịch căn cứ theo thước đo số người bị nhiếm tương ứng với hai kịch bản khác nhau của mức độ lây nhiễm trong khi cố định các tham số khác: 

```{r}
ggplot() + 
  geom_line(data = sir.out_df1, aes(Time, Infected, color = "Scenario 1"), size = 1) + 
  geom_point(data = point1, aes(Time, Infected, color = "Scenario 1"), size = 3) + 
  geom_line(data = sir.out_df2, aes(Time, Infected, color = "Scenario 2"), size = 1) + 
  geom_point(data = point2, aes(Time, Infected, color = "Scenario 2"), size = 3) + 
  theme_modern_rc() + 
  scale_y_continuous(limits = c(0, 70), breaks = seq(0, 70, 10)) + 
  scale_color_manual(values = c("cyan", "orange"), name = "") + 
  labs(title = "Figure 2: Infected Cases by Scenario, SIR Approach", x = NULL, y = "Infected Cases") + 
  theme(axis.title.y = element_text(color = "white", size = 12)) + 
  theme(legend.position = c(0.7, 0.5))

```

Figure 2 chỉ ra rằng với kịch bản 2 (có hệ số lây nhiễm 0.005) thì sẽ nhanh chóng đạt đến số người bị nhiễm bệnh cực đại (điểm màu vàng) sau đó giảm nhanh chóng. Nếu hệ số lây nhiễm giảm đi 5 lần thì số người nhiễm đạt cực đại thấp hơn chừng 3.4 lần (điểm màu xanh) nhưng sau đó thì số người nhiễm sẽ giảm chậm hơn so với kịch bản 1 (căn cứ vào độ dốc). Cái này cũng dễ hiểu vì nếu một dịch bệnh mà lây lan nhanh thì ngay sau khi đạt đỉnh, số người nhiễm sẽ giảm không phanh, thậm chí có thể tụt ngay về zero. Vì vật chủ nhiễm bệnh đã chết hết cả (Removed) hoặc đạt trạng thái được miễn dịch (Immunity): một bệnh dịch cụ thể thì nếu một người bị nhiễm nhưng sống sót thì sẽ không bao giờ mắc lại bệnh đó nữa. 

# Reference

1. https://www.who.int/bulletin/online_first/20-255158.pdf
2. http://sherrytowers.com/2012/12/11/simple-epidemic-modelling-with-an-sir-model/#eqn


