На прошлом шаге мы перенесли данные на экран и каждому экземпляру частицы данных поставили в соответствие графический примитив (точку, фигуру, изображение или линию), визуальные свойства которого задаются свойствами частицы данных. Таким образом мы материализовали наши данные на экране, превратили их в «осязаемые» объекты, которые можно двигать и группировать, а кроме того проявили одно или несколько свойств, не задействуя оси.
Теперь пришло время для самого увлекательного процесса — конструирования из этой визуальной массы разных диаграмм и графиков. Подход алгоритма Δλ отличается от обычной схемы, когда для визуализации выбирают формат из библиотеки форматов. Мы будем конструировать графики и диаграммы исходя из понимания, какие свойства для частицы данных самые важные, и проявляя эти свойства на осях и через визуальный атом.
Вернёмся к датасету о сотрудниках небольшой компании. Мы начали с ним работать, когда разбирали понятие визуального атома.
Для начала разберём, какие есть способы упорядочить наши объекты (в данном случае, сотрудников) согласно их свойствам вдоль одной оси. Таких способа всего три.
Первый способ — сложить стопкой
В этом случае мы просто ставим частицы бок о бок, пока они не закончатся. Какой параметр в этом случае проявится вдоль оси? Разумеется, количество частиц. При этом частицы можно поставить в произвольном порядке, а можно расположить по убыванию или возрастанию одного из параметров. Ниже показаны частицы, упорядоченные по размеру зарплаты.
Если использовать другую сортировку, например, по возрасту, получится другая картина. Попробуйте сделать выводы о том, как зарплата сотрудников компании зависит от возраста:
Конечно, это ещё не полноценная визуализация, но кое‑какие особенности оплаты труда в компании нам уже видны, не так ли?
Способ «сложить стопкой» хорош для базовых визуализаций и обычно используется в сочетании со вторым способом.
Второй способ — разложить по отсекам
В этом случае частицы оказываются привязанными к отрезкам оси, которым поставлены в соответствие значения выбранного параметра. Внутри отрезка порядок частиц не имеет значения, они не привязаны к конкретным координатам. Задано только соответствие между частицей с конкретным значение параметра и отрезком, которому он соответствует или в который попадает.
Самое важное преимущество этого способа в том, что он прекрасно подходит не только для количественных, но и для качественных параметров. Скажем, мы можем упорядочить наши частицы по должности в компании.
При этом отрезки могут быть равной ширины или учитывать свойства данных. Например, можно задать возрастные группы не десятилетиями, а оттолкнувшись от внутренних регламентов компании, которые поощряют молодых (до 25 лет) и возрастных (после 50) сотрудников дополнительными выплатами.
В этом примере видно, что плотность сотрудников на один год в основной группе гораздо выше чем в «спонсируемых».
Третий способ — привязать к координате
Это, наверное, самый понятный способ: мы ставим в соответствие значения параметра координате на оси. Таким образом, у каждой частицы будет своё единственно подходящее ей место.
При этом если частиц много, они начинают накладываться друг на друга. Управляя прозрачностью, мы можем увидеть не отдельные частицы, а облако плотности со сгущениями и пробелами:
И всё. Комбинируя эти три способа на горизонтали и вертикали, можно получить любой из стандартных форматов представления данных, а также какой‑нибудь нестандартный или вообще несуществующий, — но идеально подходящий для наших данных.
Связь между экранными измерениями (горизонталью и вертикалью) и параметрами данных с учётом способа упорядочивания на каждой из осей, я называю каркасом визуализации. В следующих советах обсудим конструирование каркасов на основе описанных способов.
P. S. Это был совет о визуализации данных. Хотите узнать всё о таблицах, графиках, диаграммах, картах, схемах и дашбордах? Присылайте вопросы.