19 сентября 2017 г

Почему именно R?

Почему именно R?

  • Создан статистиками для статистики

  • Появился в 1993 году, но является альтернативной реализацией коммерческого языка S (1976 год)

  • Высокоуровневый, специально предназачен для обработки данных

  • Популярен в науке (и особенно в социальных науках)

  • Очень активно развивается

  • Разработанная среда для создания визуализаций (в т.ч. динамических), статистических вычислений, создания pdf и интерактивных html-документов, динамических презентаций и даже научных статей

Почему именно R?

Почему именно R?

Почему именно R?

Почему именно R?

Почему именно R?

План занятий

Семинар 1: R как калькулятор, среда RStudio, переменные, функции, типы данных

Семинар 1: R как калькулятор, среда RStudio, переменные, функции, типы данных

Семинар 2: Импорт данных, работа с датафреймами, работа с текстом

Семинар 3: Решейпинг данных, описательная статистика

  • data.table vs dplyr
  • основы data.table
  • описательная статистика

Семинар 3: Решейпинг данных, описательная статистика

Семинар 4: Визуализация в ggplot2 и plotly

Семинар 5-8: Статистика вывода

  • Тестирование значимости нулевой гипотезы (NHST)
  • Статистические тесты в R своими руками и встроенными функциями
  • t.test, ANOVA, корреляции, линейные регрессии…
  • (Возможно) более продвинутые методы (если успеем)

ПОЕХАЛИ!!!!111