ДПВ "Аналитический пакет R"

Практика №1: Загрузка данных из различных источников

Светлана Андреевна Суязова (Аксюк)
s.aksuk@kiber-guu.ru

Рубежный контроль: зачёт

Темы практик

- Загрузка данных из различных источников

  • Очистка и трансформация данных
  • Графические системы R
  • Создание приложений в пакете shiny
  • Работа с картами

Практика №1: загрузка данных

  • .csv
  • xml
  • html
  • скраппинг веб-сайтов с пакетом rvest
  • API на примере базы UN COMTRADE

Принципы работы с данными

  1. Не задавайте явно рабочую директорию
  2. Сохраняйте данные в отдельную директорию внутри рабочей
  3. Сохраняйте время и дату загрузки
  4. Снабжайте данные описанием (справочником)

Цель: обеспечить воспроизводимость кода

С чем будем работать сегодня

  1. Пакеты R:

    • XML
    • RCurl
    • rjson
    • rvest
  2. github.com (для размещения результатов упражнения №1)