x
 
Михаил Мееров
22 августа 2013

Таня, что такое «большие данные»?



Буквальный перевод английского термина «big data» кажется мне неудачным. Вместо него я использую словосочетание «сложные данные», которое проясняет суть дела.

Сложные данные сложно хранить, обрабатывать и использовать, их невозможно окинуть невооружённым взглядом, осмыслить, сделать выводы. Чтобы извлечь из данных знания, их анализируют с помощью алгоритмов (кластеризация, семантический анализ, машинное обучение, мэп-редьюс) и визуализируют. У американцев даже появился термин Data Science, объединяющий работу с базами данных, облачные вычисления, статистику, перечисленные алгоритмы и визуализацию. Представление об этих инструментах даёт одноимённый курсеровский курс.

При работе со сложными данными визуализация решает самые разные задачи.

1. Демонстрация полной картины. Землетрясения с 1898 года, показанные на одной карте, очерчивают границы тектонических плит и подсвечивают регионы разной сейсмической активности.

2. Сравнение и оценка. Карта швейцарских железных дорог, сделанная Ильёй Бояндиным, визуализирует загруженность и скорость поездов. Она позволяет сравнить пассажиропотоки на разных маршрутах и отслеживать изменения в течение дня.

3. Выявление закономерностей и аномалий. На интерактивной диаграмме «We are what we eat» показано более 500 тысяч приёмов пищи, съеденных в разных уголках мира в течение 5 месяцев и оценённых с точки зрения пользы для здоровья. Видно, что в Штатах в первой половине дня все едят здоровую пищу, а ближе к ночи налегают на вредную.

4. Предсказания. График Морица Стефанера (по мотивам выступлений Ганса Рослинга) демонстрирует соотношение количества детей в семье и продолжительности жизни в разных странах и намекает, как события будут развиваться в будущем. Сам Рослинг на основе таких же червеобразных графиков в 2009 году делал прогнозы на 2014.

5. Объединение микро- и макроуровней. Диаграмма «Деньги» в серии комиксов XKCD наглядно сравнивает цену дюжины яблок, свадебный бюджет принца Уильяма, стоимость всей недвижимости на Манхеттене и внешний долг США.

6. Превращение данных в историю. Знаменитая карта Шарля Минара — захватывающее повествование, целиком составленное из чисел и графиков.

Качественная визуализация помогает анализировать данные и делать выводы. Это главное оружие Лаборатории данных в борьбе со сложностью и неопределённостью.


Поделиться
Отправить

Цель рубрики — обсуждение вопросов дизайна всех видов, текста в дизайне и взаимоотношений дизайнеров с клиентами.

Мы публикуем комментарии, которые добавляют к уже сказанному новые мысли и хорошие примеры. Мы ожидаем, что такие комментарии составят около 20% от общего числа.

Решение о публикации принимается один раз; мы не имеем возможности комментировать или пересматривать свое решение, хотя оно может быть ошибочно. Уже опубликованные комментарии могут быть удалены через некоторое время, если без них обсуждение не становится менее ценным или интересным.

Вот такой веб 2.0.

Как совмещать родительство с работой 1 Дата-классный пример: эмодзи Чернова 2 Дата‑классный пример: причины задержек в Нью-йоркском метро Частица данных. Резюме




Недавно всплыло

Как сделать, чтобы публикация выделялась в ленте: композиция, исправление дефектов, цвет 1 Невозможно собрать портфолио 1 О тексте как базовом элементе 6 1