Правдивость визуализации заключается в том, что мы не врём на диаграммах и графиках, не искажаем реальность и не приукрашиваем её. Возможно, я бы не выделяла этот само собой разумеющийся принцип, но после выступлений мне до сих пор задают вопросы вроде «Как отрицательный тренд показать на дашборде в положительном ключе?» Ответ, разумеется: «Никак.»

Я хочу поговорить о философской и практической стороне дела. С философской точки зрения, я не могу представить ситуации, когда специалист уважающий себя и данные, с которыми работает, может пойти на сознательный обман. Всё это время в советах мы обсуждали, как полнее, нагляднее, осмысленнее и многограннее раскрыть данные. Это непростая задача, иногда — настоящий вызов, показать общий план и важные нюансы. Манипуляции с данными, наоборот, нацелены на то, чтобы исказить или скрыть эту полную картину, вычленить из неё «удобные» и «позитивные» срезы, умышленно оставив остальное за кадром. Для меня подобные манипуляции — это не один из навыков работы с данными, это профессиональный тупик. Работа специалиста по визуализации в том, чтобы помочь заказчику увидеть сложную реальность, упакованную в данные, — её закономерности, её противоречия, её суть, её правду. Если заказчик сам не хочет знать правду о своих данных, не тратьте на него время. Вы ничему не научитесь в таком проекте, только испортите репутацию.

Что касается практической стороны, давайте обсудим, что вообще считается искажением данных, и как не соврать случайно.

Мне нравится формулировка из книги Эдварда Тафти Visual Display of Quantitative Information. Он рекомендует: «Показывайте числа объектами, физические размеры которых прямо пропорциональны передаваемым значениям.» Обратите внимание, что речь тут идёт о размерах. Для столбика на бар‑чарте воспринимаемым размером будет высота (если, конечно, все столбики одинаковой ширины), а для кружочка — площадь.

Мой любимый пример нарушения этого принципа — показанная в книге иллюстрация из газеты «Правда» (хи‑хи :‑)

Здесь кружочки даже близко не прямо пропорциональны показанным значениям, в лучшем случае можно говорить о качественном соответствии «больше число, больше кружок». На горизонтальной шкале тоже безобразие — временной промежуток в 30 лет между 1940 и 1970 годами передан отрезком меньшей длины, чем годовой промежуток между 1981 и 1982 годом.

В той же книге Тафти посвящает искажениям целую главу Graphical Integrity, стр. 53⁠—77. Не думаю, что смогу сказать лучше. Читайте Тафти, если ещё не.

К счастью, в современных инструментах визуализации многие принципы сработают по умолчанию. Скажем, в Табло невозможно воспроизвести график из «Правды» даже если очень постараться. Инструмент автоматически отобразит равномерные оси и построит кружки, пропорциональные исходным значениям.

Картина роста производства, кстати, впечатляющая. Но не в актуальных для автора 1981 и 1982 годах.

И всё же есть в Табло опасная настройка, которая может испортить аккуратность изображения. Мы можем увеличить размер кружков через панель «Marks», тогда масштаб сохранится. Тут всё ок с точки зрения правдивости:

Но если воспользоваться панелью «Edit sizes» и выбрать режим «By range», наша честная прямая пропорциональность будет нарушена, стоит нам подвинуть левый край ползунка. И мы приблизимся к не правдивому графику из «Правды»:

Манипулировать изображением всеми доступными средствами — не сработает. Вы должны хорошо понимать, что за операцию совершаете, и ни в коем случае не нарушать прямо пропорциональное соответствие количественных значений и размеров на визуализации.

Ещё в Табло можно прибегнуть к классике искажений — выдернуть данные из контекста и обрезать ось, продемонстрировав таким образом взрывной рост там, где его нет:

Моё дело здесь предостеречь: не обрубайте столбиковую диаграмму, столбики всегда растут от нуля. А сама эта манипуляция настолько явная и наивная, что её раскусит большинство зрителей. И автор потеряет самое ценное — внимание и доверие аудитории.

Визуализация данныхПринципы визуализацииПравдивость
Отправить
Поделиться
Запинить

Рекомендуем другие советы