Алгоритм Δλ (читается как «дельта‑лямбда») — это мой авторский пошаговый рецепт создания классных визуализаций. В первых проектах Лаборатории данных ни о какой методологии речи не шло, я придумывала их бессистемно, «по наитию». Так появились визуализация Московского марафона, календарь температурных рекордов, мир танков, ошибки на тренажёре ПДД и другие работы.
Параллельно я вела учебные курсы, и именно для них начала анализировать свою работу и формулировать путь к предсказуемо достойному результату. В перечисленных выше проектах датасеты сильно отличались между собой, да и визуализации получились очень разными, но во всех этих задачах я видела сходство. Я также собирала и изучала визуализации других авторов, которые меня восхищали и завораживали, пыталась понять, что есть в классных работах и чего не хватает посредственным. Вот один из моих любимых примеров того времени: карта пищевых привычек, созданная на основе данных приложения Eatery. От этой визуализации у меня осталось всего три скриншота, зато вдохновение, которое она подарила, до сих пор со мной. Только представьте, двигая курсор по карте, пользователь вместе с ним перемещал границу светового дня!
Я заметила, что в тех примерах, которые мне нравятся, большая картина как бы составлена из отдельных кусочков — одинаковых со своей сути графических объектов, которые по разному располагались на плоскости и отличались между собой цветом, размером и другими графическими свойствами. При этом графические свойства этих объектов соответствовали важным параметрам данных. Такую картину можно было воспринимать целиком, отыскивая закономерности и аномалии, или оставить на экране только часть объектов (например, отфильтровав их по какому‑то свойству) и увидеть новую картину с другими закономерностями. Ещё на классных визуализациях использовалась метафоры из реальной жизни и большая роль отводилась интерактивности. Так начал вырисовываться мой метод.
И вот к какой последовательности шагов я пришла.
Шаг 1. Описать реальность данных
Под реальностью данных я понимаю совокупность процессов, которые порождают данные. Это важный шаг, который позволяет увидеть за столбцами и строками «природу» данных, их суть. Мы представляем реальные процессы, которые подскажут логичные и наглядные метафоры для визуализации. Мы описываем картину, внутри которой живут все срезы, зафиксированные в таблицах и базах данных, и эти срезы становятся понятными частями целого.
Описать реальность данных невозможно, не прояснив всех нюансов и деталей, не разобравшись в смысле атрибутов, не погрузившись в предметную область. Поэтому на этом шаге мы заметим и закроем все «белые пятна» в нашем понимании данных. А ещё в реальности данных могут проявиться аспекты, которых нет в исходном датасете, но которые могут быть полезны для анализа. Если получится обогатить датасет дополнительными свойствами, итоговая визуализация получится более многомерной и интересной для изучения.
Шаг 2. Выделить частицу данных
Частица данных — это единица смысла задачи, «общий знаменатель» для всех сущностей. Это будущий строительный кирпичик нашей визуализации, из которого мы соберём цельную картину и любую её часть. После того как мы нашли частицу данных, все вопросы о реальности данных сводятся к операциям на множестве частиц.
Шаг 3. Перенести частицу данных на экран за счёт визуального атома
Частица данных — это сущность, абстрактный объект без формы и места в пространстве. Чтобы иметь возможность конструировать визуализации из частиц, нужно перенести их на экран. Для этого мы используем графические примитивы (точки, столбики, кружочки, сиволы, иконки, линии и т. п.), а свойства частицы данных мы передаём графическими свойствами этих примитивов.
Шаг 4. Упорядочить частицы данных на экране за счёт каркаса
Мы также проявляем важные свойства частицы данных, привязывая их к экранным измерениям (горизонтали и вертикали), формируя таким образом каркас. Различные комбинации каркасов и визуальных атомов формируют все привычные форматы визуализаций, а также дают свободу создать какой‑то новый формат, который идеально подойдёт именно вашим данным.
Шаг 5. Объединить визуализации на дашборде.
Повторяя шаги 3 и 4, мы конструируем необходимый и достаточный для решения задачи набор визуализаций. После этого остаётся только объединить их на дашборде. При этом благодаря алгоритму визуализации оказываются как бы слепленными из одного теста. Поэтому интерактивные связи между ними существуют естественным образом, остаётся только настроить их в конкретном инструменте.
Я придумала алгоритм Δλ, чтобы создавать уникальные визуализации для особенных данных. Но оказалось, что он отлично подходит и для проектирования аналитических дашбордов для бизнеса: от продаж и логистики до HR‑задач и контроля качества.
Это нормально, если пока ничего не понятно. В следующих советах я разберу каждый шаг алгоритма подробнее.