Вернёмся к диаграмме футбольных трансферов, которую я взялась переделать с учётом принципов визуализации данных.
Всё началось вот с этой инфографики:
Для более интересного анализа я собрала более полный датасет, по всем переходам в топ‑лиги и из в топ‑лиг, а не только между топ‑лигами. И показала эти данные в виде флоу‑чарта и графика разброса:
Эта визуализация была информативной и многомерной, но нарушала важный принцип — понятности. И сколько я не крутила эти графики, не получалось добиться того, чтобы её не приходилось «расшифровывать». В конце концов я пришла к тому, что флоу‑чарт при всей «естественности» этой метафоры, либо слишком прост и недостаточно интересен — когда мы смотрим только на верхний уровень:
Либо становится сложным и запутанным — когда мы включаем переходы между лигами:
Подобрать наглядные обозначения для графика разброса так, чтобы чётко отделить трансферы из региональных лиг в топ‑лиги и из топ‑лиг в регионы тоже не получалось. Формально все измерения (тип перехода, регион) были проявлены, но график превращался в нечитаемую абракадабру:
А ведь за кадром оставались ещё такие интересные характеристики, как тип трансфера (постоянный и арендный), возраст и национальность игрока.
Запутанность на визуализации — это всегда проблема неудачного представления. Поэтому я решила поискать другое решение. И оно нашлось.
Вместо того, чтобы показывать вообще все трансферы из датасета, я разделила их на три большие группы: пришли в клубы топ‑лиг, ушли из клубов топ‑лиг, перешли между клубами топ‑лиг. Интересно сравнивать эти группы между собой и футболистов внутри групп. Но сравнивать между собой трансфер из южно‑американского клуба в команду топ‑лиги и из команды топ‑лиги в азиатский клуб особого смысла нет. Из таких же соображений я отделила арендные трансферы от постоянных.
Такой подход не только распутал «клубок» флоу‑чарта, который превратился в две обычные столбиковые диаграммы, но и позволил добавить возраст и национальность игрока. Отдельный кайф в том, что у каждого трансфера есть своё лицо:
Поделюсь самыми интересными наблюдениями, которые у меня получилось сделать с помощью этой визуализации.
Если сравнить приходы в клубы топ‑лиг и уходы из клубов топ‑лиг (постоянные трансферы), самая значительная разница наблюдается в количестве бесплатных трансферов. На вход в топ‑лиги они составляют 51%, на выход — 74%. При этом значительной разницы между приходами и уходами в размере компенсации (fee) для платных трансферов не наблюдается.
Ещё одно важное отличие — разрез по регионам. В топ‑лигу попадают игроки в основном из европейских клубов (≈90%), из клубов Северной Америки приходят реже, чем из Южной, и совсем не приходят из клубов Азии и Африки. Уходят в европейские клубы всего 67%, в Северную Америку чаще, чем в Южную, в Азию аж 8,5%, и по графику видно, что именно эти трансферы самых дорогих игроков и с самыми крупными компенсациями. Главные лиги‑поставщики для топ‑лиг — британский Championship, итальянская молодёжная Primavera, немецкая 2.Bundesliga. Значительное количество игроков пришли не из клубов. Уходят чаще всего в никуда, а также в итальянскую Seria B, британский Championship и лигу Saudi Pro.
Распределение игроков по возрасту также значительно отличается по форме. Для приходящих пик приходится на 19 и 20 лет, при среднем 22.6 года. Для уходящих пика как такого нет, есть плато на 22...24 года и ещё одно пониже — на 25...33 года, при среднем 26.4 года. Что касается арендных трансферов, они достаточно редки среди приходов в топ‑лиги — всего 11%. Зато из 1117 исходящих из топ‑лиг трансферов, 45% составляют арендные, и возрастное распределение в них значительно отличается от постоянных уходов. В нём такой же выраженный пик на 20 годах и среднее составляет 22.9 года.
Обратимся теперь к переходам между клубами топ‑лиг.
Во‑первых, обратите внимание, как точки на графике занимаю правый верхний угол — здесь речь о больших деньгах. Средняя компенсация на 10 миллионов евро больше, чем для приходов и уходов, как и средняя стоимость игроков. Трансферные переходы составляют одну треть от всех. Постоянные переходы на треть бесплатные, тогда как трансферные бесплатны на две трети.
Возрастное распределение не похоже ни на приходы, ни на уходы, оно равномерно нарастает к яркому пику в 25 годах и потом быстро спадает. Ещё в таких переходах доля игроков не европейских национальностей (Африка, Южная и Северная Америка) заметно больше, чем в приходах и уходах.
Я недостаточно хорошо разбираюсь в теме, чтобы делать на основе этой визуализации осмысленные выводы. Но такие яркие и заметные различия скорее всего говорят об интересных закономерностях. Буду рада услышать в комментариях мысли и наблюдения уважаемых советчиков.