Школа
Визуализация

Виды визуальных атомов. Часть 2

Таня Мисютина
5 мар 2025
👁 1061  
Визуализация

Виды визуальных атомов. Часть 2

Таня Мисютина
5 мар 2025
👁 1061  
Таня Мисютина
Создатель и руководитель Лаборатории данных, автор курса «Визуализация данных»
Полезно
Непонятно
Войдите в Бюросферу, чтобы голосовать

Поговорим о столбике с точки зрения визуального атома.

Столбик передаёт те же два параметра, что и круг, за счёт своего цвета и площади. Но если для круга площадь растёт равномерно в двух измерениях, то при работе со столбиком мы можем выбирать, как именно использовать площадь: сохранив ширину постоянной и меняя только высоту, или задействуя оба параметра.

Самый привычный формат кодирования столбиками — это бар‑чарт, где как правило используются столбики постоянной ширины.

Распределение футбольных трансферов игроков разного возраста. Лаборатория данных

Вот только столбики на большинстве таких диаграмм не являются визуальными атомами, а могут быть декомпозированны на составляющие. В данном случае, каждый столбик показывает количество трансферов того или иного типа среди игроков разного возраста. Частица данных — трансфер, визуальный атом — точка/черточка из прошлой заметки.

Ромео Лавия — один из шестидесяти шести 19‑летних игроков, пришедших в команды высшей лиги из других лиг в прошлом сезоне.

Другой пример, когда столбиковая диаграмма выстроена из столбиков разной высоты, которые при сложении дают суммарную высоту. Я использую такой приём, например, для анализа динамики трат, где отдельные транзакции — столбики разной высоты — складываются в общую картину по месяцам, сезонам и годам:

Фрагмент визуализации личных трат. Вебинар Тани Мисютиной и Ромы Бунина

Даже когда визуальные атомы сливаются в единый столбик без явного разделения на игроков или транзакции, важно понимать, что является частицей данных и визуальным атомом, по какому свойству эти атомы сгруппированы в столбики, и какое свойство передано их высотой. Об этом мы ещё будем говорить подробнее на следующем шаге алгоритма.

А сейчас давайте обратимся к прямоугольникам разной ширины и высоты.

Самый незамысловатый формат с прямоугольниками называется тримэп, в нём параметр (в данном случае количество трансферов игроков разной национальности) передан площадью прямоугольников разной высоты и ширины, но ширина и высота сами по себе ничего не значат и подбираются автоматически в соответствии с выбранным алгоритмом.

Футбольные трансферы игроков разной национальности. Лаборатория данных

Гораздо интереснее примеры, в которых ширина и высота имеют самостоятельный смысл, при этом их произведение равно третьему осмысленному параметру. Один из таких примеров мы уже разбирали — это диаграмма распределения бегунов Московского марафона по возрастным группам:

Распределение по полу и возрасту участников Московского марафона. Лаборатория данных

Напомню, что на этой диаграмме мы видим не только общее количество участников внутри каждой возрастной группы (площадь), но и количество лет внутри возрастной группы (высота), и активность бегунов возрастной группы, а точнее среднее количество участников на один год возрастной группы. Это и есть ширина равная площади, делённой на высоту. И именно благодаря совмещению всех этих параметров мы можем заметить, что активность женщин начинает спадать раньше (после 34), а мужчины одинаково активны в возрастных группах 23…34 и 35…39, и только после 40 их активность снижается.

Покажу ещё один похожий пример — диаграмму анализа аудитории для рекламной платформы «Репаблер»:

Здесь вертикальная шкала разделена на отрезки в соответствии с размером аудитории, площадью показан доход с каждого сегмента, тогда ширина естественным образом визуализирует средний чек сегмента. Несмотря на то, что основной доход генерируют мужчины 35…40 лет, женщины этого возраста и двух следующих возрастных когорт гораздо интереснее с точки зрения среднего чека. То же самое можно сказать об аудиторях, заинтересованных в путешествиях и в продаже автомобилей.

И последний формат, о котором хочется поговорить — квадратная диаграмма. Это идеальный вариант для визуализации результатов опросов и исследований, объясню его на выдуманном примере.

Представим, что группу из десяти тысяч респондентов разного достатка опросили на предмет их кондитерских предпочтений. Пусть каждый человек в группе — это точка, и все эти точки мы расположим в виде квадрата 100 × 100:

Разделим квадрат по вертикали на слои по доходу: можно буквально представить, как все человечки с низким доходом встанут снизу, с высоким — сверху, а посередине окажутся середнячки.

А теперь внутри каждого слоя разделим респондентов по отношению к сушкам и добавим цветовое кодирование:

При таком подходе площадь каждого прямоугольника, например, любителей сушек с высоким доходом, одновременно показывает долю внутри слоя и долю относительно всех респондентов.

Перейдём от точек к более компактной версии диаграммы без потери смысла. Такую диаграмму можно нарисовать для любого количества респондентов, главное, соблюсти пропорции в группах:

Однажды разобравшись, как читать диаграмму, мы сможем одним взглядом окинуть все особенности потребления разных кондитерских изделий:

Самая любимая сладость — печенье, шоколад чаще едят более обеспеченные люди, а зефир для всех групп является скорее эпизодическим десертом.

P. S. Это был совет о визуализации данных. Хотите узнать всё о таблицах, графиках, диаграммах, картах, схемах и дашбордах? Присылайте вопросы.

Визуализация данныхАлгоритм ΔλФормат: квадратная диаграммаФормат: тримапФормат: столбиковая диаграмма
Полезно
Непонятно
Войдите в Бюросферу, чтобы голосовать
Отправить
Поделиться
Поделиться
Запинить
Твитнуть

Комментариев пока нет

Цель рубрики — обсуждение вопросов дизайна, веб-разработки, переговоров, редактуры и управления.
Комментарии модерируются. Мы публикуем комментарии, которые добавляют к уже сказанному новые мысли и хорошие примеры.

Рекомендуем другие советы