Вычисления в облаке

Некоторые статистические алгоритмы, например, mcmc, требуют значительного времени. Время своего ноутбука тратить жалко, можно использовать время других компьютеров.

Amazon

Амазон — самый крупный продавец компьютерных мощностей. Многие известные проекты используют ресурсы на амазоне. Например, dropbox на самом деле перепродаёт подороже место на жестких дисках амазона. Тот же rpubs задествует мощности амазона.

Хорошее видео на 12 минут, как, имея кредитную карточку и 100 рублей на ней, запустить R-studio на амазоновском компьютере и получить доступ к нему через web-интерфейс.

Чтобы соединится по ssh с амазоновским инстансом:

chmod 600 your_key.pem
ssh -i your_key.pem ubuntu@your-ec2-ip-address

После соединения, добавляем пользователя:

sudo adduser new_user_name

Сменить пароль существующего пользователя, если ставилась какая-то внешняя AMI

sudo passwd new_user_name

Обновиться и установить R

sudo apt-get update
sudo apt-get install r-base

Скачать и установить R-studio

sudo apt-get install gdebi-core
sudo apt-get install libapparmor1
wget http://download2.rstudio.org/rstudio-server-0.97.551-amd64.deb
sudo gdebi rstudio-server-0.97.551-amd64.deb

Проверка

sudo rstudio-server verify-installation

Готовые AMI образы с Rstudio.

Sagemath

Sagemath — это наиболее полная коллекция всего открытого бесплатного программного обеспечение, имеющего отношения к математике и анализу данных. Можно поставить на свой компьютер. А можно воспользоваться бесплатным вариантом sagemath в облаке.

Последовательность действий:

install.packages("ggplot2")
x <- rnorm(10^7)
save(x, "10_millions.Rdata")


qplot(x[1:1000])
ggsave("1000_normal.png")

Если график строится без ggplot2, то сохраняется он так:

png(filename = "plot_1000.png")
plot(x)
dev.off()

Еще на sagemath есть также возможность работать он-лайн в sage notebook, в которых можно использовать и R.

Opencpu

Проект opencpu позволяет создать своё облачко :) чтобы на нём болтало ножками написанное на R приложение. Среди примеров приложений есть автоматом обновляющийся Rmd, которым можно воспользоваться по-быстрому, чтобы показать Rmd на семинаре ;)