Мы разобрали ещё один шаг алгоритма Δλ и важное понятие — частицы данных. По традиции, подведём итоги.

Что такое частица данных?

Частица данных — это сущность с таким набором свойств, из которых складываются все верхнеуровневые параметры данных. По сути своей частица данных является единицей смысла нашей задачи, а также будущим строительным кирпичиком визуализации. Частица данных может быть ключевым объектом, действующим лицом или важным событием в реальности данных. Но она не может быть свойством, даже если это свойство сформулировано существительным. Покупка — частица данных, сумма покупки — свойство частицы данных.

Почувствовать разницу между сущностями и их свойствами очень важно. Эта разница сыграет важную роль на следующих шагах алгоритма.

Зачем нужна частица данных?

Частица данных превращает цельную и красочную, но «монолитную» реальность данных в управляемую совокупность похожих друг на друга объектов. Как физики объясняют свойства вселенной через свойства и взаимодействия небольшого набора элементарных частиц, так и нам предстоит сформулировать ответы на все вопросы о наших данных в виде операций и вычислений на множестве частиц данных. Преимущество этого подхода в том, что разные аспекты задачи перестают быть «вещью в себе» и становятся понятными частями целого.

Вспомним талоны из предыдущего совета. Можно думать о посещаемости отделений и времени ожидания в очереди как о двух глобальных высокоуровневых метриках. Но в терминах талонов это просто две разные операции над наборами частиц: посещаемость равна количеству талонов в наборе, а время ожидания в очереди можно вычислить как среднее или медиану времени ожидания среди всех талонов набора. А значит, эти показатели могут быть рассчитаны не только для отделений и часовых интервалов (как было в исходном датасете), но и для разных услуг, для разных сотрудников и любых других срезов.

Как найти частицу данных?

Самый верный способ найти частицу данных — это нарисовать структурную схему, на которой показаны все сущности и связи между ними. Частица данных будет на этой схеме «общим знаменателем», точкой, через которую все другие сущности связаны между собой.

Как описать частицу данных?

Лучше всего для частицы данных выбрать лаконичное слово, которое однозначно описывает искомую сущность. Чем точнее и чётче вы подберёте формулировку, тем проще в дальнейшем будет думать о задаче и решать её.

P. S. Это был совет о визуализации данных. Хотите узнать всё о таблицах, графиках, диаграммах, картах, схемах и дашбордах? Присылайте вопросы.

Визуализация данныхАлгоритм ΔλЧастица данных
Отправить
Поделиться
Запинить

Рекомендуем другие советы