Поговорим о столбике с точки зрения визуального атома.
Столбик передаёт те же два параметра, что и круг, за счёт своего цвета и площади. Но если для круга площадь растёт равномерно в двух измерениях, то при работе со столбиком мы можем выбирать, как именно использовать площадь: сохранив ширину постоянной и меняя только высоту, или задействуя оба параметра.
Самый привычный формат кодирования столбиками — это бар‑чарт, где как правило используются столбики постоянной ширины.
Вот только столбики на большинстве таких диаграмм не являются визуальными атомами, а могут быть декомпозированны на составляющие. В данном случае, каждый столбик показывает количество трансферов того или иного типа среди игроков разного возраста. Частица данных — трансфер, визуальный атом — точка/черточка из прошлой заметки.
Ромео Лавия — один из шестидесяти шести 19‑летних игроков, пришедших в команды высшей лиги из других лиг в прошлом сезоне.
Другой пример, когда столбиковая диаграмма выстроена из столбиков разной высоты, которые при сложении дают суммарную высоту. Я использую такой приём, например, для анализа динамики трат, где отдельные транзакции — столбики разной высоты — складываются в общую картину по месяцам, сезонам и годам:
Даже когда визуальные атомы сливаются в единый столбик без явного разделения на игроков или транзакции, важно понимать, что является частицей данных и визуальным атомом, по какому свойству эти атомы сгруппированы в столбики, и какое свойство передано их высотой. Об этом мы ещё будем говорить подробнее на следующем шаге алгоритма.
А сейчас давайте обратимся к прямоугольникам разной ширины и высоты.
Самый незамысловатый формат с прямоугольниками называется тримэп, в нём параметр (в данном случае количество трансферов игроков разной национальности) передан площадью прямоугольников разной высоты и ширины, но ширина и высота сами по себе ничего не значат и подбираются автоматически в соответствии с выбранным алгоритмом.
См. совет
Гораздо интереснее примеры, в которых ширина и высота имеют самостоятельный смысл, при этом их произведение равно третьему осмысленному параметру. Один из таких примеров мы уже разбирали — это диаграмма распределения бегунов Московского марафона по возрастным группам:
См. совет
Напомню, что на этой диаграмме мы видим не только общее количество участников внутри каждой возрастной группы (площадь), но и количество лет внутри возрастной группы (высота), и активность бегунов возрастной группы, а точнее среднее количество участников на один год возрастной группы. Это и есть ширина равная площади, делённой на высоту. И именно благодаря совмещению всех этих параметров мы можем заметить, что активность женщин начинает спадать раньше (после 34), а мужчины одинаково активны в возрастных группах 23…34 и 35…39, и только после 40 их активность снижается.
Покажу ещё один похожий пример — диаграмму анализа аудитории для рекламной платформы «Репаблер»:
Здесь вертикальная шкала разделена на отрезки в соответствии с размером аудитории, площадью показан доход с каждого сегмента, тогда ширина естественным образом визуализирует средний чек сегмента. Несмотря на то, что основной доход генерируют мужчины 35…40 лет, женщины этого возраста и двух следующих возрастных когорт гораздо интереснее с точки зрения среднего чека. То же самое можно сказать об аудиторях, заинтересованных в путешествиях и в продаже автомобилей.
И последний формат, о котором хочется поговорить — квадратная диаграмма. Это идеальный вариант для визуализации результатов опросов и исследований, объясню его на выдуманном примере.
Представим, что группу из десяти тысяч респондентов разного достатка опросили на предмет их кондитерских предпочтений. Пусть каждый человек в группе — это точка, и все эти точки мы расположим в виде квадрата 100 × 100:
Разделим квадрат по вертикали на слои по доходу: можно буквально представить, как все человечки с низким доходом встанут снизу, с высоким — сверху, а посередине окажутся середнячки.
А теперь внутри каждого слоя разделим респондентов по отношению к сушкам и добавим цветовое кодирование:
При таком подходе площадь каждого прямоугольника, например, любителей сушек с высоким доходом, одновременно показывает долю внутри слоя и долю относительно всех респондентов.
Перейдём от точек к более компактной версии диаграммы без потери смысла. Такую диаграмму можно нарисовать для любого количества респондентов, главное, соблюсти пропорции в группах:
Однажды разобравшись, как читать диаграмму, мы сможем одним взглядом окинуть все особенности потребления разных кондитерских изделий:
Самая любимая сладость — печенье, шоколад чаще едят более обеспеченные люди, а зефир для всех групп является скорее эпизодическим десертом.
P. S. Это был совет о визуализации данных. Хотите узнать всё о таблицах, графиках, диаграммах, картах, схемах и дашбордах? Присылайте вопросы.