Немного о визуализаторах: пузырьковое дерево
Существует не так много способов изображения иерархий и иерархических связей. Обычные визуализаторы (будь то карты или гистограммы) рассматривают все элементы как одноуровневые. Совсем иначе обстоят дела с пузырьковым деревом.
В статье расскажем о пузырьковом дереве (или Bubble Tree). Это весьма специфичный тип визуализации с довольно узкой областью применения, однако он может быть действительно полезным.
Описание
Пузырьковое дерево – это способ отображения иерархических данных в виде набора взаимосвязанных пузырьков. Каждый уровень иерархии представлен в виде «орбиты» с «пузырьками-потомками» вокруг элемента-родителя. При этом, если иерархия многоуровневая и у элемента на «орбите» есть потомки (подчиненные элементы), то можно в него «провалиться»: в этом случае в центре окажется уже детализируемый элемент, а на «орбите» окажутся его потомки.
Размер и цвет пузырьков отображают значение элемента по двум выбираемым пользователем показателям-метрикам.
Когда и как использовать
Основное преимущество пузырькового дерева – это возможность отображения взаимосвязи «родитель-потомок», и только во вторую очередь — возможность сравнения элементов-потомков сразу по двум выбранным показателям. Поэтому использование пузырьковой диаграммы будет действительно полезным, если:
- необходимо одновременное отображение родителя и потомков в иерархии;
- необходимо проанализировать, каковы пропорции распределения выбранного показателя (отвечающего за размер) между родителем и потомками;
- для анализа актуален быстрый переход между элементами разных уровней иерархии.
Важной особенностью визуализатора является то, что для отображаемого показателя может вообще не быть агрегации или методом агрегации может быть не суммирование. Другие визуализаторы не позволяют нам увидеть, как формируется, например, средний показатель по иерархии элементов. В этом смысле пузырьковое дерево уникально. Например, мы можем посмотреть, как формируется показатель средней успеваемости по школе (причем сразу на уровне школы, параллели и класса) или средний показатель эффективности по коллективу работников. Для цветовой дифференциации лучше использовать показатели, так или иначе демонстрирующие улучшение/ухудшение или эффективность/неэффективность. В противном случае, если показатели верхних уровней иерархии являются суммой нижних уровней, то использование цветовой шкалы не будет иметь никакой аналитической ценности. Не трудно догадаться, что чем «ниже» мы будем опускаться вглубь иерархии, тем меньше будет значение показателя, а значит, отображаемые элементы всегда будут краснее или зеленее.
Когда использовать не стоит
Если связь «родитель-потомок» не является критической для анализа, то пузырьковое дерево лучше заменить, скажем, на гистограмму или круговую диаграмму (набор круговых диаграмм). Гистограмма в данном случае также позволит одновременно отобразить две метрики, сохранится возможность перехода между различными уровнями иерархии. Но вместе с тем мы получим дополнительное преимущество — более точное сравнение и сопоставление значений анализируемых показателей. Если значения показателей близки, то гораздо проще сравнить длину стоящих рядом столбиков, чем площадь «пузырьков».
Наличие большого числа элементов также осложняет анализ с помощью пузырькового дерева: они просто не воспринимаются. Если исключение элементов из анализа невозможно, то нужно жертвовать связью «родитель-потомок» и переходить к визуализации с помощью плоского дерева (о котором мы уже писали ранее). Плоское дерево по-прежнему позволит отображать значения по двум выбранным показателям цвета и размера, но за счет эффективного использования пространства облегчит анализ большого количества элементов.
Несколько примеров
Довольно показательным примером использования пузырькового дерева будет анализ работы отдела продаж, состоящего из нескольких групп, в которых руководители также занимаются привлечением клиентов. Пусть за размер «пузырьков» отвечает объем продаж на каждого агента, а за цвет — прирост клиентской базы. Важно, что в данном случае нет агрегации показателей по иерархии.
Пузырьковое дерево позволяет понять, как распределяются продажи в каждой группе: кто привлекает больше всего клиентов, кто получает большие объемы за счет постоянных крупных клиентов, но при этом не расширяет клиентскую базу, какой объем работы по поиску клиентов проделывают руководители групп и т.д.
Пузырьковое дерево будет актуально во всех примерах анализа географии продаж, когда страны сгруппированы, особенно если они сгруппированы произвольным образом, и когда число стран невелико.
В заключение напоминаем, что применить на практике все рассмотренные типы продвинутой визуализации вы можете с помощью Prognoz Platform. 🙂