Немного о продвинутых визуализаторах: плоское дерево
Сегодня BI-инструменты становятся все проще, а визуализаторы все сложнее. О том, как правильно использовать продвинутую визуализацию, и в каких случаях от неё лучше отказаться, читайте в нашей новой серии статей по визуализации.
Инструменты для визуального анализа данных (или Visual Discovery) пользуются огромным успехом. Помимо прочего, конечные пользователи получили возможность использовать не только простые, но и «сложные», продвинутые виды визуализации, такие как пузырьковая диаграмма или плоское дерево. Продвинутые визуализаторы привлекают пользователя своим непривычным и необычным видом, они притягивают к себе взгляд. Но использовать подобные компоненты просто ради красивой картинки не имеет никакого смысла, если теряется аналитическая составляющая.
Как и для любых видов графиков и диаграмм, у продвинутых визуализаторов есть свои специфические свойства: в одних задачах они значительно облегчат вам жизнь, в других – только осложнят.
В этой серии статей мы рассмотрим основные виды продвинутых визуализаторов, особенности их использования, примеры и часто допускаемые ошибки.
Начнем с Плоского Дерева (оно же TreeMap).
Описание
На плоском дереве данные с иерархической структурой представляются в виде вложенных друг в друга прямоугольников. Для анализа доступны два показателя: первый определяется размером прямоугольников, а второй — цветом. Таким образом, мы можем одновременно анализировать, например, объем продаж по всем точкам розничной сети и их увеличение/уменьшение по сравнению с предыдущим периодом.
Когда можно и нужно использовать
Плоское дерево очень полезно, если необходимо:
- визуализировать очень большое количество элементов одновременно;
- получить общее представление о ситуации;
- получить представление о том, как соотносятся между собой два показателя, есть ли какая-то закономерность.
Для визуализации с помощью размера выбираются количественные показатели, методом агрегации для которых является сумма (объем продаж, прибыли, количество клиентов, ВВП и т.д.). Для визуализации с помощью цвета используют показатели, характеризующие уровень эффективности и результативности или изменение показателя (доля прибыли, прирост продаж, доля некачественной продукции).
Когда использовать не стоит
Если число элементов невелико, то нет смысла строить плоское дерево. Воспользуйтесь обычной гистограммой с двумя показателями. Если показатели несопоставимы, то второй показатель можно вынести на дополнительную ось.
Гистограмма позволит точно сопоставить и сравнить значения по обоим показателям. Тогда как по цвету элемента на плоском дереве мы можем оценить только его принадлежность к той или иной группе значений.
И, наконец, примеры
Классический пример использования плоского дерева – это анализ стоимости ценных бумаг. Ценные бумаги (маленькие прямоугольники) сгруппированы по секторам экономики (крупные прямоугольники с серым заголовком). Размер прямоугольников определяет стоимость ценных бумаг. Цвет отображает изменение стоимости бумаги по отношению к предыдущему периоду: если цвет ближе к красному спектру, то цена падает, к зеленому – растет.
Если бы мы использовали, скажем, гистограмму, то число элементов было бы настолько велико, что ничего нельзя было бы понять.
Используя же плоское дерево, мы можем увидеть, например:
- что в текущем периоде обвалились акции, например, добывающего сектора, тогда как нефтегазовый сектор на подъеме;
- что падает/растет стоимость мелких/крупных компаний в том или ином секторе;
- самые крупные компании в каждом секторе.
Разумеется, хорошие примеры найдутся не в каждом отчете и даже не в каждой прикладной задаче. Однако их немало:
- анализ популярности веб-контента: число просмотров фильмов (по жанрам) и изменение числа просмотров;
- анализ продаж крупной розничной сети: сумма продаж по магазину (по региону) и доля прибыли;
- анализ номенклатуры продукции: число продаж в месяц (по группе продукции) и ценовая группа;
- и так далее.
Стоит сказать, что, как и любой визуализатор, плоское дерево выполняет конкретную аналитическую задачу. Не стоит пытаться проанализировать все имеющиеся данные с помощью одного визуализатора, это невозможно. Пробуйте, выбирайте, переходите от одного способа визуализации к другому (благо, современные инструменты – Prognoz Platform в их числе — позволяют делать это в несколько кликов мышкой). Как использовать другие визуализаторы, рассмотрим в следующей статье.
В заключение напомню, что применить на практике все рассмотренные типы продвинутой визуализации вы можете с помощью Prognoz Platform. Если вы не являетесь пользователем Prognoz Platform, можете воспользоваться демо-версией платформы, где возможности визуализации представлены в полном объеме.