Моделирование траектории случайного процесса
Упражнение может иметь реальное применение в физике элементарных частиц.
# Random walk with absorption
simulate_walk <- function(lower = -10, upper = 10, n_max = 200, p = 1e-3) {
# на каждом шаге есть позиция, начинаем из центра интервала
current_position <- (lower + upper) / 2
for (i in 1:n_max) {
#сначала определяем вероятность поглощения частицы
is_absorbed <- rbinom(1, 1, p)
#если произошло - симуляция заканчивается
if (is_absorbed) return(list(status = "Absorbed",
position = current_position,
steps = i))
#если поглощение не произошло - совершаем 1 случайный шаг
current_position <- current_position + rnorm(1)
if (current_position < lower) return(list(status = "Left breach",
position = current_position,
steps = i))
if (current_position > upper) return(list(status = "Right breach",
position = current_position,
steps = i))
}
#возвращаем такое сообщение при достижении максимального количества шагов
return(list(status = "Max steps reached",
position = current_position,#позиция, на которой завершилась симуляция
steps = n_max)) #количество шагов, на которой завершилась симуляция
}
Есть одномерная область от -10 до 10, в которой может находится элементарная частица. Частица может прыгать либо вправо, либо влево и на каждом шаге есть вероятность того, что она поглотится (p = 1e-3). Общее количество переходов ограничиваем 200 шагами (n_max = 200).
Почему использовали цикл for, хотя для R - это один из медленных способов, к которому нужно относится с осторожностью. Дело в том, что на каждом из шагов симуляция может быть прервана и закончится - каждое определение перехода это какая-то сложная вычислительная заадача. Если генерировать такую ситуацию через векторизацию, то мы генерируем сразу 200 переходов (потенциальный максимум), тогда как цикл может прерваться уже на первой итерации в случае поглощения частицы. Т.е. в такой ситуации цикл for позволяет сэкономить те переходы, которые выпадают за границы симуляции
Теперь можно с помощью функции replicate повторить n-ое число таких симуляций
# Simulate results
result <- replicate(1000, simulate_walk(), simplify = FALSE)
result <- data.frame(
status = sapply(result, function(x) x$status),
position = sapply(result, function(x) x$position),
steps = sapply(result, function(x) x$steps)
)
Приводим результат в том виде, который нам удобен. В данной конкретной ситуации превращаем его в дата-фрейм
Можно посмотреть, что примерно получилось
str(result)
'data.frame': 1000 obs. of 3 variables:
$ status : chr "Left breach" "Absorbed" "Left breach" "Left breach" ...
$ position: num -10.17 -6.95 -10.65 -11.12 10.04 ...
$ steps : num 56 27 84 167 20 87 100 79 26 121 ...
Теперь, когда у нас есть какая-то разумная статистика, то можно ее определеить, например, с помощью функции tapply
tapply(result$position, result$status, length)
Absorbed Left breach Max steps reached Right breach
99 389 120 392
tapply(result$steps, result$status, mean)
Absorbed Left breach Max steps reached Right breach
77.54545 79.48329 200.00000 82.80612
Больший интерес представляют задачи с блужданием по плоскости, то есть в размерности 2.
Возьмите написанную мной функцию и измените её так, чтобы блуждание начиналось в центре координат (0, 0), а все переходы по координатам x и y были бы независимы и имели стандартное нормальное распределение. Если вас пугают эти слова, то это то же самое, что делал я, только отдельно по x и по y.
- Процесс обрывается в момент выхода за границу круга с центром в (0, 0) и радиусом 6
- Вероятность поглощения на каждом шаге равна 0.01
- Максимальное количество шагов — 100
- Расстояние, разумеется, евклидово: расстояние от точки (x, y) до (0, 0) есть
- Один шаг процесса подразумевает изменение обеих координат одновременно!
В ответе укажите вероятность вылета частицы в процентах, с точностью до целых процентов, в виде XX (например, 14, без указания значка процентов). Вероятность должна получиться больше 50%.
simulate_walk <- function(n_max = 100, p = 1e-2) {
x<-0
y<-0
current_position <- 0
for (i in 1:n_max) {
is_absorbed <- rbinom(1, 1, p)
if (is_absorbed) return(list(status = "Absorbed",
position = current_position,
steps = i))
x<-x+rnorm(1)
y<-y+rnorm(1)
current_position <- sqrt(x**2 + y**2)
if (current_position > 6) return(list(status = "breach",
position = current_position,
steps = i))
}
return(list(status = "Max steps reached",
position = current_position,
steps = n_max))
}
# Simulate results
result <- replicate(100000, simulate_walk(), simplify = FALSE)
result <- data.frame(
status = sapply(result, function(x) x$status),
position = sapply(result, function(x) x$position),
steps = sapply(result, function(x) x$steps)
)
# Inspect results
tapply(result$position, result$status, length)
Absorbed breach
18934 80997
Max steps reached
69
a
[1] 81.05293
Общий глоссарий для этого урока:
S3, S4, reference classes
Generic function
Copy-on-modify semantics
?replicate
?mapply
?outer
?Vectorize
?do.call
