2018 г

Данные на сегодня

Поехали

data.table

dplyr vs. data.table

dplyr

data.table

Решейпинг данных

"Широкий" формат

Студент До курса по R После курса по R
Маша 70 63
Рома 80 74
Антонина 86 71

"Длинный" формат

Студент Время измерения Вес (кг)
Маша До курса по R 70
Рома До курса по R 80
Антонина До курса по R 86
Маша После курса по R 63
Рома После курса по R 74
Антонина После курса по R 71

rbind(), cbind(), merge()

Descriptive Statistics

Описательная статистика

Описательная статистика

Skewness

Kurtosis

Statistical inference

Sampling distribution

Statistical inference steps

  1. Null hypothesis (\(H_0\)) and alternative hypothesis (\(H_1\))

  2. Statistic calculation (\(t\), \(F\) or whatever)

  3. \(p\)-value calculation

  4. Camparison with \(\alpha\)

1. Null Hypothesis

2. Statistic calculation

\[t = \frac{\overline{x} - \mu}{\frac{sd}{\sqrt{N}}}\]

3. p-value calculation

4. Camparison with alpha

4. Camparison with alpha

ggplot2

Grammar of Graphics

Хэдли Викхэм

Это было не так-то просто

Основы ggplot2

  • Все - слои!
  • Эстетики ("aestetics") - aes()

“Aesthetics, in the original Greek sense, offers principles for relating sensory attributes (color, shape, sound, etc.) to abstractions.”

  • Геометрии (geoms)
  • Статистики

plotly

plotly

  • Динамические визуализации
  • Используется d3.js

Другие html-widgets

Напоследок

Не делайте украшательств ради украшательств

Избегайте слишком большого количества информации и цветов

Data-Ink ratio