Принципы визуализации данных

  1. Тип визуализации должен соответствовать цели, для которой она создается.

    Цель: хотим проиллюстрировать изменения температуры тела бобров (да, бобров!) с течением времени.

    Хорошая визуализация:

    Плохая визуализация:

Почему плохая? Потому что всё, что можно извлечь в данном случае из ящика с усами, это то, что температура с течением времени менялась, иногда сильно отклоняясь от медианного значения в большую или меньшую сторону.

  1. Визуализация должна помогать восприятию информации, а не мешать.

    Плохо:

    [Депрессивные бобры по подсказке Наташи взяты отсюда].

    Плохо:

[Активные бобры взяты из мультфильма “Осторожно, щука!”]

  1. Визуализация должна быть понятной (особенно это касается не самых распространенных типов графиков).

    Даже с заголовком “Пропущенные значения” этот график напоминает непосвященным людям абстрактное полотно в цветах подгорающего дедлайна:

    Поэтому лучше добавить описание графика в текст работы или добавить комментарий непосредственно к самому графику (например, \caption*{}в LaTeX):

    Пропущенные значения в базе данных обозначены красным цветом, наименьшие значения обозначены белым цветом, набольшие – черным.

    Конечно, необязательно для каждого графика составлять подробное описание, но легенда в случае необходимости у графика должна быть всегда:

  2. Визуализация должна отражать то, что мы хотим подчеркнуть. У графиков должен быть подобран правильный масштаб, шкалы осей и прочее.

    Хотим показать: рост ВВП на душу населения странах Африки за несколько лет.

    Не очень получается:

    Получше:

  3. Визуализация должна быть разборчивой. Не нужно делать график с бледными желтыми точками на белом фоне или пытаться уместить на график информацию по всем странам в базе.

    Не надо:

    И так тоже: