ДПВ "Аналитический пакет R"

Практика №2: Графические системы R

Светлана Андреевна Суязова (Аксюк)
s.aksuk@kiber-guu.ru

План практики

  • Графическая система base
  • Система lattice
  • Грамматика графиков в ggplot2
  • Заполнение пропусков в данных

Графическая система base

  • не требует установки дополнительных пакетов
  • график строится “по кирпичикам” с помощью функций высокого и низкого уровня

Функции высокого уровня: plot(), boxplot(), curve() – строят полотно графика и данные.

Функции низкого уровня: abline(), points(), lines(), axis(), text() и др. – добавляют на текущее полотно точки/линии/надписи/оси и др.

Функции настройки параметров графика: par(), layout() – меняют расположение графиков на полотне, внутренние, внешние поля графика.

Графическая система lattice

  • пакет lattice
  • функции оптимизированы для представления кросс-секционных данных с большим количеством признаков (multivariate data)
  • упрощена разбивка данных по факторам (цвет, фасетки)
  • принцип: одна функция – один график: после построения на график ничего нельзя добавить
  • настройка отображения элементов графика затруднена

Графическая система ggplot

  • пакет ggplot2
  • реализует грамматику графиков Леланда Уилкинсона
  • график-предложение составляется из функции-подлежащего (ggplot()), функции сказуемого (geom_lines(), geom_points(), geom_boxplot() и др.) и функций-дополнений для настройки отдельных элементов графика
  • график строится послойно и содержит графические настройки по умолчанию

Графические системы R

  • base – чтобы быстро посмотреть на данные или построить график нестандартного типа или с нестандартными элементами
  • lattice – для лаконичного вызова нескольких графиков с разбиением по факторам
  • ggplot – чтобы построить график со встроенным оформлением и с дополнительными возможностями (сглаживание, доверительные интервалы) или картограмму

Функции различных графических систем друг с другом не сочетаются

Замена пропущенных значений количественной переменной

Продолжаем работать с данными по импорту масла в РФ из базы данных международной торговли.

Сравним несколько принципов замены пропусков:

  • на медиану
  • на среднее
  • на модельное значение (необходима связь с другой количественной переменной)