Практика работы с данными: импорт и экспорт
Этап I
Первая задача – корректно импортировать данные и сохранить полученный датафрейм в переменную. Проверьте, что все колонки прочитались отдельно и их тип соответствует содержанию.
Этап II
Исследуйте данные используя те функции, которые мы уже изучили.
Если пока что нет идей, что именно можно сделать, то вот несколько идей:
Посмотрите первые 6 строк датафрейма
Возьмите количественную колонку (если такая есть), и:
посчитайте среднее (
mean()),подумайте, в каком диапазоне вы ожидаете значения в этой колонке? какие максимальные и минимальные значения в колонке вы ожидаете? Проверьте, есть ли значения за пределами выбранного вами диапазона, если есть – сколько их?
посчитайте максимальное значение (
max()) и минимальное значение (min()).
Возьмите строковую колонку (если такая есть), и:
Выберите какое-нибудь значение в строковой колонке и проверьте, сколько этих значений в колонке и какова их доля в колонке.
Есть ли в колонке NA и сколько их (если есть)
Создайте новый датафрейм, выбрав несколько строчек из исходного по какому-либо условию.
Экспортируйте полученный датафрейм в
.csvфайл с помощью функцииwrite.csv()
Этап III
Придумайте себе задачи самостоятельно! Придумайте гипотезы о том, как могут быть устроены ваши данные, что в них может быть не так и попробуйте их проверить с помощью написания кода.