R и основы мат.статистики

ДПО Компьютерная лингвистика

Ivan Pozdniakov

February 10, 2025

Кто я

Иван Поздняков

  • преподаю R и статистику 9 лет

  • психфак МГУ (кафедра психофизиологии) и магистратура по Cognitive Neuroscience в Вышке

  • ex-Старший преподаватель Вышки

  • Еще занимаюсь Digital Humanities

  • R-энтузиаст

  • Сейчас живу в Германии

Почему R?

Для кого этот курс

  • Для тех, кто без опыта программирования: R с нуля

  • Для тех, кто владеет другими языками программирования: R-way

  • Для тех, кто уже знает R: продвинутые фишки R

И все это в едином потоке безумия!

Как это будет

План курса

  1. Введение в R
  2. Вектор, индексирование
  3. Логические векторы, NA, матрицы, списки, датафреймы
  4. Работа с пакетами, импорт и экспорт данных
  5. Импорт и экспорт данных (продолжение), условные конструкции, создание функций
  6. семейство apply(), data.table vs tidyverse
  7. tidyverse
  8. tidyverse, Описательная статистика
  1. ТЕСТ. Описательная статистика, визуализация в base R
  2. {ggplot2}
  3. Quarto
  4. Статистика вывода: введение
  5. Статистика вывода: выборочное распределение средних, CLT, NHST
  6. Статистика вывода: статистические тесты и модели
  7. Работа с текстом

Итоговая оценка

  • 0.25 – тест в середине курса,

  • 0.75 – самостоятельный анализ с отрисовкой графика и проведением статистических тестов.

Как мы будем работать

Я буду рассказывать и писать код. Вы будете писать его вместе со мной. 

Иногда я буду задавать вопросы и делать ошибки (иногда специально, иногда – нет).

Периодически вы будете решать самостоятельные задачи. На это будет выделено отдельное время в занятии, иногда довольно большое. Мы не пойдем дальше, пока все не решат хотя бы несколько заданий!

Обычно первые задания – легкие, последние задания – сложные. Это сделано так, чтобы тем, кому все кажется слишком легким, не было скучно. Если вы не успели решить все задания, то ничего страшного, но я рекомендую дорешать задания дома.

Если же вы сделали все задания, то можете помогать остальным в чате: объяснение другим – это отличный способ понять тему еще лучше!

Мы учимся программированию!

А программирование – это сложно.

Если вам сложно, то так и должно быть, все нормально. Если что-то не получается, то это нормально.

  • Это не похоже на изучение обычных предметов или даже на изучение математики. Это похоже на освоение навыков

  • Практика – обязательна! Без нее ничего не получится

  • Не пытайтесь сделать по аналогии или найти какой-то готовый алгоритм: вы должны сами его придумать!

Но оно того стоит!

  • Linear Warriors, Quadratic Wizards

Но оно того стоит!

  • Linear Warriors, Quadratic Wizards

Melee classes gain power at a linear rate as they level up.
Magic users gain power quadratically as they level up.” (tvtropes.org)

Но оно того стоит!

  • Linear Warriors, Quadratic Wizards

Excel users gain power at a linear rate as they level up.
R users gain power quadratically as they level up.” (me)

ПОЕХАЛИ