Возможности Табло

Давайте посмотрим на Табло.

Табло — очень интересный инструмент тем, что в нём часто делают довольно хорошо. Как‑то так сложилось, что в Табло‑комьюнити мощно вплетены дизайнеры и дата‑журналисты. Это ребята, которые любят, чтобы всё было довольно аккуратно, красиво и интересно. Мне кажется, таких ребят просто мало в комьюнити Power BI, и поэтому кажется, что в Power BI ничего хорошего не сделаешь. Хотя, на мой взгляд, если есть руки и задачи, то можно делать и там, и там классно.

Я пока просто полистаю работы. Идея в том, что Табло позволяет делать довольно гибкую вёрстку, позволяет использовать дополнительные элементы, не только сами визуализации, но ещё и картинки, и встраивать другие системы. В общем, можно довольно красиво и интересно обрамлять свои работы и делать, например, какие‑то такие штуки:

Это каждый пас внутри одного чемпионата. То есть 882 тысячи пасов отобразить на одном экране не может ни одна другая BI‑система, кроме Табло.

Можно делать санкеи:

Z is for Zoology. Адам Грин

Можно делать такие штуки — смол малтиплс, с переливами:

Primary Energy Consumption. Брайан Мур

В общем, Табло позволяет делать очень гибко из коробки. Можно делать такие карты с домами и так далее:

В общем, полистайте, посмотрите. Примеров много хороших, но единственное, что примеров много и плохих.

Я вам скинул три ссылки. Первая ссылка — это моя подборка за 2020 год:

Здесь есть некая печать моего качества, поэтому, скорее всего, сюда действительно можно посмотреть.

Следующее, где можно смотреть, — это галерея работ на самом Табло Паблике — «Viz of the Day» и так далее.

Здесь уже надо быть очень осторожными. Сюда, к сожалению, очень часто попадают украшенные работы, но сделанные плохо с точки зрения анализа, визуализации данных и так далее.

Вот такая работа — это скорее какой‑то дата‑арт, и всякие диаграммки типа загнутых бар‑чартов — это не лучшее решение, так делать не стоит:

Successful Women in Music. Мартон Балла

Сюда очень часто пролезает что‑то, на что, на самом деле, обращать внимание не стоит, поэтому будьте с этой подборкой аккуратны. Не всё, что здесь «хорошо», сделано хорошо. Но есть какие‑то конкретные ребята — есть я, собственно, мой паблик, вы можете посмотреть, что я делаю. Я не скромный, но я стараюсь держать какой‑то уровень качества, который мне кажется прикольным:

Есть Саша Варламов, это наш соотечественник, он очень заморочен с точки зрения технического использования Табло, и он из Табло делает вот такие всякие безумные вещи:

Он руководит BI в компании Playrix и делает в свободное время такие штуки. Это глубина разных водоемов.

Поэтому есть, что посмотреть, но в самой галерее Табло Паблик надо быть аккуратным. Мой любимый пример. Суперстор — это такой классический датасет, на котором обычно показывают разные дашборды. Если вы вобьёте «superstore», вы найдете где‑то такие довольно неплохие примеры, а где‑то найдете очень‑очень плохие примеры.

И тут надо фильтровать, что сделано хорошо, а что сделано не очень. Вот такой цветастый пример:

Profit Analysis — Sample Superstore. Прадип Кумар Г

Проблема в том, что на каком‑нибудь Бехансе вы найдете это как раз в подборке «cool dashboards», «best design trends» и т. д. Вот это скорее плохой дашборд, чем хороший, как визуализация в целом. Здесь есть какие‑то хорошие решения, есть явно много плохих типа треугольничков в квадратиках, шестиугольничков лишних и так далее.

В общем, будьте аккуратны в галерее. Но что классно, здесь можно смотреть очень много разных работ. При этом большинство из них можно скачать и посмотреть, как они устроены. Например, те работы, которые я вам показывал как подборки лучших работ, они скачиваемые — вы их просто можете скачать с Табло Паблика и посмотреть, как это было сделано. Это очень полезно с точки зрения, своего технического обучения, развития и так далее.

NBA Shots. Зак Гейс

Вот, пожалуйста, броски НБА. Все точки здесь видны, это просто один график в Табло:

Если разобраться, как это работает, то это можно сделать.

В Табло есть анимация, можно анимировать всякие вещи, то есть в нормальном режиме это дело перестраивается, каждая точечка перелетает из своего кусочка, и получаются такие вещи:

Распределение земли по назначению в США. Александр Варламов

Чисто технически Табло всё отрисовывает на канвасе. В этом есть свои плюсы, свои минусы. В целом отрисовка не супербыстрая, она местами лагает относительно СВГ, но при этом позволяет отрисовать очень большое количество элементов. То есть на СВГ такое количество элементов, как на этом примере, было бы отрисовать почти что невозможно.

Можно делать какие‑то очень необычные виды графиков, например, такие слоёные виды графиков, которые мне, например, очень нравятся. То есть, когда один и тот же график разрезают на равные кусочки, потом складывают таким образом. Сделано для того, чтобы мы могли визуально сравнивать, в данном случае, разные штаты с сильно разными уровнями преступности:

Crime Waves in the States. Shine Pulikathara

Это разные виды преступности и то, насколько много в этом штате такого происходит. Если бы у нас была одинаковая ось, мы бы все сделали одинаковый масштаб оси на всех графиках, то у нас бы эти графики, которых много, были бы сильно большими, а те графики, которых мало, были бы сильно маленькими, мы там просто видели бы прямую. А такой слайсинг этих штук позволяет их нарезать и положить рядышком.

Получается с одной стороны тепловая диаграмма, с другой стороны мы можем видеть всю динамику. Необычный, довольно сложный тип графиков, понятно, что для бизнесовых применений вы вряд ли его будете использовать, но Табло так может, и это довольно прикольный, на самом деле, шаг. А здесь просто можно в этой книжке пойти и посмотреть, как это работает.

Все населённые пункты России. Рома Бунин

Тоже одна из моих последних работ — это, опять же, показать, что Табло может отрисовывать, например, здесь отрисовано 132 тысячи точек на каждой карте. Ни одна другая BI‑система это не отрисует. Причём это именно физически — их можно увеличить и посмотреть, какие где находятся типы поселений.

Опять же, проявляется интересная реальность данных. Мы видим, например, что чем южнее мы идём по нашей стране, тем у нас больше сёл. А где‑то есть даже хутора, станицы и так далее. А если мы идём на север, у нас деревни. Это связано, соответственно, с историческим контекстом, как что возникало и так далее.

И последний пример из серии «Табло может по‑разному». Просто из‑за того, что Таня вам показывала пример с визуализацией, где кто в какой год был популярен. Это то же самое, только в статическом виде:

«Горячая сотня Биллборда» за 35 лет. Рома Бунин

Чаще всего такие графики — это какие‑то бар‑чарты. Топ‑100 артистов — что сразу делается? Сразу бар‑чартик, в котором просто не видно никакой дополнительной информации. А здесь каждая линия — это, соответственно, место в какую‑то неделю каждой песни, которая есть в этот момент. Таня вам показывала, как они перестраиваются, а здесь они в каком‑то моменте.

Каждую неделю у нас есть первое место. Если начать отслеживать только те композиции, которые достигали первого места, то можно увидеть очень интересный паттерн. Если мы будем спускаться вниз, то в 80‑е небольшое количество композиций доходило до первого места, и при этом оставалось. Мало композиций, которые долго удерживаются либо в топе, либо в принципе в чарте.

Здесь фиолетовым подсвечены только те композиции, которые больше 26 недель были в чарте и достигли топа. И видно, что здесь это горбики довольно интересной структуры.

А чем сильнее мы приближаемся к цифровому веку, когда шеринг информации становится очень быстрым, тем больше происходит ситуаций, когда композиция быстро взлетает наверх и потом также быстро падает.

То есть появляется очень много композиции, которые быстро поднимаются, но и задерживаются тоже. Если посмотреть это в разрезе декад, это ещё более заметно.

Этот паттерн становится сильно заметен в 2000‑е, 2010‑е.

И это как раз про реальность данных. Если бы мы смотрели на какие‑то бар‑чарты по неделькам или по годам, мы бы этого не увидели. Когда мы смотрим, как эти песни меняли своё место, как они проходили, у нас проявляются те паттерны, которых мы не увидим в более агрегированном состоянии.

Поэтому, если ваша задача — давать инсайты, какие‑то необычности находить, то чем меньше вы изображаете гранулярность, тем, скорее всего, эти вещи будут проявляться больше.

Версии Табло

13:07

Табло бывает разных видов.

13:07

Табло Десктоп. Это та версия, которую чаще всего подразумевают, когда говорят про Табло. Это вот такие приложения, которые позволяют вам на десктопе создавать, собственно, визуализации. Это платное приложение, оно стоит 70 долларов на одного креатора в месяц и оплачивается раз в год. Довольно приличная сумма, поэтому чаще всего десктопной версией пользуются крупные компании.

Эта штука, в отличие от бесплатной версии умеет подключаться к огромному количеству данных. То есть Табло имеет большое количество коннекторов и может подключаться к любому утюгу — к чему угодно, где есть какой‑то коннектор с данными, вы чаще всего можете оттуда их забрать. И даже есть такие вещи, как Other Database Connection и WebData Connector — это штуки, которые позволяют забирать данные из каких‑нибудь АПИ Ютуба, в общем, чего угодно, где есть любая апишка. Это довольно удобно.

Табло Паблик. Бесплатная версия, которую вы себе скачали и поставили. Она классная тем, что чисто по функционалу она абсолютно такая же, как Табло Десктоп. Но отличается тем, что не умеет подключаться к промышленным базам данных.

Если посмотреть на этот экран, здесь список подключений гораздо более скромный. Вы можете подключиться только к файликам, либо, самое близкое к какой‑то базе данных — это Гугль‑таблицы. При этом можно это дело обновлять, то есть Табло умеет ходить в Гугль‑таблицы, раз в день забирать оттуда данные и показывать их новые, что довольно удобно.

Уверен, есть компании, которые этим пользуются и таким образом просто закрывают свои потребности в BI‑системе.

В новых версиях Табло Паблик появилась возможность сохранять файлы локально

То есть первое ограничение Табло Паблик — меньшее количество подключений. Второе ограничение — что вы не можете локально сохранить файл. Если в Табло Десктоп у вас есть возможность нажать File → Save as и просто себе на компьютере сохранить этот файл, то здесь такой функции нет. Можно только сохранить в Табло Паблик (File → Save to Tableau Public)

В новых версиях Табло Паблик появилась возможность сохранять файлы локально

То есть этот файл постоянно улетает в Табло Паблик. При этом, если у кого‑то есть на него ссылка, он будет доступен. То есть как только вы сюда что‑то залили, если у кого‑то есть ссылка на эту историю, то всё, значит, что человек может сюда прийти и как минимум посмотреть, что у вас там за данные. Поэтому какие‑то секретные данные, личные данные сюда лучше не заливать.

При этом здесь есть настройки, которые позволяют это менять, необязательно всем всё разрешать.

Первая история: в настройках визуализации можно отключить галочку Allow Access, которая позволяет скачивать данные и скачивать книгу. То есть люди смогут только посмотреть, они не смогут скачать ваш файлик.

Вторая история: можно отключить галочку Show Viz on Profile. Если она включена, то это всем видно, если отключена, то это не видно никому, но те, у кого есть ссылка, всё равно это смогут посмотреть.

Табло Сервер. Это уже чисто промышленное решение, когда ваша компания большая, и вам хочется делиться отчётами с кем‑то внутри, то у Табло есть отдельный сервер, который выглядит таким образом:

Это просто портал, куда люди могут сохранять свои книги.

С точки зрения работы это выглядит абсолютно так же, как Табло Паблик. Мы с вами будем сохранять книги на Табло Паблик, а можно, если у вас Табло Десктоп, сохранять их на Табло Сервер.

Оно может быть автономным, именно физический сервер. Может быть онлайн и хоститься на стороне Табло, то есть быть облачным решением.

Вот так это выглядит. Когда вы на него попадаете, есть такая стартовая страничка, дальше идёт просто система папок. У вас папки по разным проектам, где хранятся разные отчёты. Соответственно, когда вы заходите в какой‑то конкретный отчёт, в нём внутри разные листы, и вы попадаете примерно в такой же интерфейс, как в Табло Паблике, где просто можно открыть отчёт и его посмотреть.

Табло по сравнению с остальным BI‑системами работает более‑менее так же шустро, хотя мне кажется иногда медленнее. Но по сравнению с какими‑то вещами, которые сделаны на чистом коде, оно будет точно проигрывать в скорости.

Табло Мобайл. Это, на самом деле, просто браузер в телефоне, который подключается к тому же самому Табло Серверу. То есть чисто оболочка для того, чтобы к нему чуть более удобно подключаться. Там чуть‑чуть меняется интерфейс управления — выпадашки становятся более удобными для больших пальцев и так далее, но никаким образом другим он не отличается.

Табло Преп Билдер. Последний инструмент, о котором хочется рассказать, это Табло Преп Билдер (Tableau Prep Builder). Это как раз к вопросу Регины насчёт подготовки данных. В само Табло каких‑то особых инструментов подготовки и обработки данных не встроено.

Табло умеет делать джойны и всякие такие вещи, мы с вами будем дальше это смотреть. Простые манипуляции с данными на стороне Табло можно делать. Что‑то сложное приходится делать в отдельном продукте, и они его делают именно автономным продуктом. Называется это Табло Преп. Для тех, кто работает с аналитикой: это визуальный ETL‑инструмент. Для тех, кто не работает: это просто отдельное приложение, которое позволяет по‑разному комбинировать данные, собирать их в какую‑то одну табличку, например, делать какие‑то сложные обработки и так далее.

Вот так оно выглядит, я им пользовался, чтобы нам подготовить данные, с которыми мы с вами будем работать.

Довольно удобная история, она тоже не требует написания кода, но сюда можно вставлять уже скрипты. То есть, если вам захочется сюда код написать, вы его можете отдельно сюда вставить, оно кушает Питон, оно кушает R, по‑моему, и вы можете обрабатывать данные уже каким‑то более сложными путями, чем это делается просто в визуальном редакторе. Но мне кажется, 90% задач можно закрыть именно с визуальным редактором. То есть такая тоже возможность есть, она просто вынесена в отдельный инструмент, поэтому живёт отдельно. Не знаю, хорошее это решение или плохое, просто другое.