Практика работы с данными: импорт и экспорт

Этап I

Первая задача – корректно импортировать данные и сохранить полученный датафрейм в переменную. Проверьте, что все колонки прочитались отдельно и их тип соответствует содержанию.

Этап II

Исследуйте данные используя те функции, которые мы уже изучили.

Если пока что нет идей, что именно можно сделать, то вот несколько идей:

  • Посмотрите первые 6 строк датафрейма

  • Возьмите количественную колонку (если такая есть), и:

    • посчитайте среднее (mean()),

    • подумайте, в каком диапазоне вы ожидаете значения в этой колонке? какие максимальные и минимальные значения в колонке вы ожидаете? Проверьте, есть ли значения за пределами выбранного вами диапазона, если есть – сколько их?

    • посчитайте максимальное значение (max()) и минимальное значение (min()).

  • Возьмите строковую колонку (если такая есть), и:

    • Выберите какое-нибудь значение в строковой колонке и проверьте, сколько этих значений в колонке и какова их доля в колонке.

    • Есть ли в колонке NA и сколько их (если есть)

  • Создайте новый датафрейм, выбрав несколько строчек из исходного по какому-либо условию.

  • Экспортируйте полученный датафрейм в .csv файл с помощью функции write.csv()

Этап III

Придумайте себе задачи самостоятельно! Придумайте гипотезы о том, как могут быть устроены ваши данные, что в них может быть не так и попробуйте их проверить с помощью написания кода.