Несколько советов по выбору диаграммы
Антон Федоров
В этой статье мы поговорим о том, какого вида диаграммы стоит использовать в том или ином случае, но прежде всего ответим на важный вопрос:
Зачем вообще нужны диаграммы? Почему нельзя обойтись, например, просто таблицами?
Для ответа на этот вопрос обратимся к одному из самых авторитетных источников информации, а именно, к Википедии:
Диаграмма — графическое представление данных линейными отрезками или геометрическими фигурами, позволяющее быстро оценить соотношение нескольких величин.
Вот и ответ: диаграммы нужны, чтобы быстро оценить соотношение нескольких величин.
И действительно, если вы попытаетесь ответить на вопрос «Курсы каких валют имели наиболее близкую друг к другу динамику по отношению к рублю на протяжении 2017 года?», глядя на таблицу ниже, вам понадобится от 10 до 60 секунд:
А глядя на эту диаграмму, вы ответите за пару секунд:
Однако, если вам показать такую диаграмму, то для ответа на вопрос вам придется подумать, возможно, даже больше, чем над таблицей:
Таким образом, правильно подобранная диаграмма в том или ином случае может значительно ускорить и упростить процесс анализа и восприятия информации, а неправильно выбранная, наоборот, может усложнить и замедлить этот процесс.
В настоящее время существует множество различных типов диаграмм (например, в Excel 15 только основных типов, которые делятся еще на подтипы), но наиболее популярных и часто используемых всего несколько (гистограмма, график или линейная, круговая). Однако, даже в них очень часто умудряются запутаться и выбрать неверный вариант.
Рассмотрим некоторые ошибки и примеры использования самых популярных типов диаграмм.
Одна из наиболее часто встречающихся проблем – это вот такие 3D диаграммы:
В чем же здесь проблема – спросите вы? 3D – это красиво. Но дело в том, что так как сами данные не трехмерные, то и объемное изображение в данном случае не несет никакого смысла, а наоборот мешает восприятию и даже искажает его. На этой 3D диаграмме, при первом взгляде, создается впечатление, что «Плюнет» и «Поцелует» имеют большее значение, чем, скажем, «К сердцу прижмет» и «Не любит». Однако, на самом деле, они равны.
Также восприятие усложняет легенда (это относится к любым диаграммам, не только к круговым). Нужно потратить время, чтобы соотнести значения в легенде с цветами на диаграмме, поэтому, если у вас есть возможность, то лучше подписать ряды прямо на диаграмме.
Вот в таком виде анализировать гораздо проще:
Таким образом, делаем первые выводы:
- Если вам не нужно визуализировать трехмерные данные – не используйте трехмерные диаграммы.
- Если есть возможность подписать названия рядов на самой диаграмме – сделайте это и уберите легенду.
Многие знают, что круговая диаграмма плохо подходит для анализа большого количества рядов (много секторов заводят в тупик), а если поразмыслить дальше, то, вообще говоря, круговая диаграмма также плохо подходит для анализа близких по значению показателей, даже если их немного. Например, если вы думали, что на диаграммах выше все сектора равны, то вы ошибались. На самом деле сектор «Любит» чуть больше остальных. Можно, конечно, вывести в подписи значения и анализировать по ним, но это мало чем будет отличаться от анализа таблицы:
Поэтому для визуального сравнения близких по значению показателей лучше использовать гистограмму:
Здесь сразу вино, что «Любит» чаще остальных.
Также не забывайте на подобных диаграммах сортировать значения, например, по убыванию значений, чтобы ускорить и упростить процесс анализа.
Итак, еще пара выводов:
- Если вам нужно провести визуальный сравнительный анализ близких по значению величин, то лучше подойдет гистограмма, чем круговая диаграмма.
- Если какая-либо сортировка рядов на диаграмме упростит анализ – отсортируйте их.
Обычно круговая диаграмма хорошо показывает структуру чего-либо, однако, если требуется отследить структуру в динамике или сравнить структуру нескольких объектов, то сделать это с помощью круговых диаграмм будет затруднительно.
Например, попробуйте сравнить распределение использования социальных сетей в зависимости от размера населенных пунктов:
Приходится бегать глазами от одного сектора к другому и пытаться соотнести их величину, или же, опять-таки смотреть на цифры с процентами, что не очень-то ускоряет и упрощает процесс.
В данном случае лучше использовать подобные диаграммы:
Здесь взгляду проще сравнивать высоту столбцов.
Это лишь несколько примеров, которые позволяют понять, что в каждом отдельном случае нужно хорошо подумать над тем, какую диаграмму использовать. Чтобы облегчить раздумья, многие современные программные продукты для анализа данных используют передовые технологии для упрощения процессов построения диаграмм. В частности, применяют интеллектуальные технологии для автоматического определения наилучшего типа диаграммы по данным и дают рекомендации пользователям.
Например, я часто использую для анализа данных российскую платформу класса бизнес-аналитики «Форсайт. Аналитическую платформу». В последней версии этой платформы также появилась опция рекомендуемых типов диаграмм, что значительно упрощает работу и позволяет не допустить грубых ошибок.
Вот пара вариантов того, как работают интеллектуальные системы подбора диаграмм, на примере «Форсайт. Аналитической платформы».
При выборе в таблице нескольких рядов в динамике, система в первую очередь предлагает график, который позволяет наиболее удачно визуализировать изменения:
При выборе одного периода по нескольким рядам, система предлагает уже круговую диаграмму:
Таким образом, современные технологии могут подсказать вам, как наиболее корректно визуализировать данные. Однако окончательный выбор за вами. Главное, чтобы выбранная вами диаграмма ускоряла и упрощала восприятие информации, а не наоборот.
В любом случае, правильного выбора в реальности не существует — есть только сделанный выбор и его последствия. Желаю вам, чтобы, сделанный вами выбор диаграммы всегда имел только благоприятные последствия!