Немного о визуализаторах: пузырьковая диаграмма
«Так-так, посмотрим. Кто приносит компании больше всего денег? А кто больше всего тратит? А кто тратит больше, чем зарабатывает? И теперь снова кто приносит…» Знакомая ситуация? Тогда читайте о том, как можно использовать пузырьковую диаграмму для анализа данных.
Мы продолжаем серию статей об особенностях использования визуализаторов. И сегодня на очереди Пузырьковая диаграмма (также известная как Bubble Chart).
Описание
На пузырьковой диаграмме точки данных представлены в виде «пузырей». Отличительной чертой визуализатора является возможность одновременного отображения четырех метрик: две отвечают за положение по осям X и Y, одна за размер и ещё одна за цвет. Вообще говоря, последние две метрики можно и не добавлять, но тогда весь смысл использования пузырьковой диаграммы теряется.
Когда и как использовать
Пузырьковая диаграмма незаменима, когда:
- число анализируемых показателей больше двух;
- количество элементов достаточно велико и не позволяет использовать таблицу или гистограмму;
- необходимо выявить наличие отклонений и закономерностей в распределении элементов и соотношении анализируемых показателей.
При выборе отображаемых показателей также есть несколько полезных правил. Для определения размера и положения «пузырей» нужно использовать количественные показатели с абсолютными значениями (объем продаж, прибыли, количество клиентов, ВВП и т.д.). Для отображения с помощью цвета лучше использовать показатели, характеризующие уровень эффективности и результативности или изменение показателя (доля прибыли, прирост продаж, доля некачественной продукции). Это не обязательное условие, но его соблюдение значительно облегчает восприятие. Например, мы сразу, даже на подсознательном уровне, сможем отличить элементы с позитивной динамикой (пусть они будут зелеными) от элементов с негативной динамикой (красные).
Стоит отметить, что если необходимо визуализировать показатели, описывающие структуру, такие как объем производства различных групп товара или составляющие ВВП, то лучше не использовать пузырьковую диаграмму. Если целью анализа является анализ структуры одного показателя, а не соотношения различных показателей, то гораздо эффективнее будет использование гистограммы с накоплением или набора круговых диаграмм.
Альтернативы
Вообще говоря, визуализировать четыре метрики одновременно можно только с использованием пузырьковой диаграммы. В противном случае придется либо жертвовать количеством метрик (точечная диаграмма, плоское дерево), либо использовать табличное представление с настройками сортировки и условного форматирования. Пример ниже показывает, что использование точечной диаграммы вместо пузырьковой исключает из анализа дополнительные атрибуты.
Каких-либо серьезных ограничений в использовании пузырьковых диаграмм нет. Единственной проблемой аналитика может стать наличие слишком большого количества элементов. В этом случае можно использовать комбинацию различных визуализаторов, между которыми настроена синхронизация отметки.
Несколько примеров
Пузырьковое дерево идеально подходит для ситуаций, когда необходимо выявить «слабое звено»: самую слабую группу продаж, наименее успешный магазин в сети, неприоритетную группу клиентов и т.д. В примере ниже анализировались данные о продаже в крупной розничной сети. На оси вынесем следующие показатели:
- по осям: объем продаж и объем прибыли;
- размер: доля прибыли;
- цвет: доля возвращенных товаров (данный показатель является критичным показателем эффективности в рамках конкретной задачи).
Построив пузырьковую диаграмму (даже при наличии большого количества элементов), мы сразу видим, что в части магазинов уровень прибыльности ниже при достаточно высоком объеме продаж. Выделить эти магазины можно было и с помощью точечной диаграммы. Но при помощи пузырьковой диаграммы мы можем также определить, что доля возвратов в этих магазинах огромная: то есть магазин несет существенные накладные расходы, при этом принося очень мало денег. А это уже повод задуматься о необходимых мерах по изменению ситуации. Далее мы видим, что среди магазинов с высокими показателями часть также выбивается по показателю доли возвратов. Эти магазины легко можно отфильтровать и продолжить анализ в рамках других визуализаций.
Подобных примеров можно подобрать множество. Например, пузырьковую диаграмму можно использовать для анализа маркетинговых данных, разместив по осям показатели объема продаж участников рынка в натуральных и денежных единицах, число клиентов представить в виде размера «пузырей», а изменение числа клиентов обозначить цветом. Таким образом, конкретная фирма может легко выявить своих ближайших конкурентов, а также понять, выигрывает/проигрывает ли она за счет только лишь ценового фактора или смогла привлечь больше клиентов.
Хочется добавить, что создание пузырьковой диаграммы – это своего рода творческий процесс, особенно если в распоряжении аналитика большой набор показателей. Иногда самые, казалось бы, очевидные сочетания, не дают практически ничего. В других случаях наоборот, неожиданные идеи могут привести к удивительным и полезным выводам.
И в заключение напоминаем, что применить на практике все рассмотренные типы продвинутой визуализации вы можете с помощью Prognoz Platform. Если вы не являетесь пользователем Prognoz Platform, то можете воспользоваться облачной и демо-версией, где возможности визуализации представлены в полном объеме.