Школа
Интерфейс

График сравнения машинных переводчиков

Можно ли упростить этот график сравнения машинных переводчиков? А то я голову сломал.

Одна из главных проблем, которую я вижу — каждый раз нужно поглядывать наверх, чтобы понять столбец или график. Я пытался объединить всё в один график, но не получилось.

JS
28 сен 2021
👁 7548   🗩7
Интерфейс

График сравнения машинных переводчиков

Можно ли упростить этот график сравнения машинных переводчиков? А то я голову сломал.

Одна из главных проблем, которую я вижу — каждый раз нужно поглядывать наверх, чтобы понять столбец или график. Я пытался объединить всё в один график, но не получилось.

JS
28 сен 2021
👁 7548   🗩7
Илья Бирман
Арт‑директор и соавтор курса «Пользовательский интерфейс и представление информации»
Полезно
 28
28
Непонятно
  
Войдите в Бюросферу, чтобы голосовать

Вы верно назвали одну из проблем — необходимость сверяться с легендой, прыгая туда‑сюда глазами. Подробнее о борьбе с легендой я рассказываю в соответствующей лекции. А ещё у вас разный масштаб графиков в соседних строках и главная смысловая подпись стоит вертикально.

Но на мой взгляд, главная ошибка тут — в выборе формата: нет смысла показывать эту информацию на графике, ведь здесь нет никаких зависимостей, связей, тенденций. Вам здесь даже нечего отложить по оси абсцисс, просто стоят переводчики в случайном порядке. Ну и нужно как‑то объяснить, откуда эти данные взялись и почему им можно доверять: назвать авторов, источники, методы.

Для адекватной передачи и нормального восприятия этой информации подойдёт вводный текст и таблица с результатами:

Группа аспирантов‑лингвистов Брянского государственного университета в рамках летнего аналитического фестиваля провела оценку качества машинного перевода разными системами. Исследовали перевод с английского на немецкий, испанский, французский, и обратный перевод на английский с этих языков.

Для исследования была собрана группа экспертов‑переводчиков. В группу вошли... потому что... У такого подбора экспертов есть недостаток:... В качестве текста для тестирования был использован... Такой выбор текста позволяет оценить..., но не позволяет понять... Эксперты сравнивали переводы, сделанные разными системами, и выбирали наилучший на их субъективный взгляд.

Результаты такого исследования позволяют сравнить переводчики в случаях... но если у вас... результаты могут быть другими.

Сколько экспертов назвали какой перевод наиболее удачным

ПереводчикEn→GeGe→EnEn→FrFr→EnEn→SpSp→En
Дипл70%38%63%32%64%47%
Гугль13%21%19%22%029%
Микрософт07%23%13%24%17%17%
Фейсбук08%12%06%23%11%07%
Полезно
 28
28
Непонятно
  
Войдите в Бюросферу, чтобы голосовать
Отправить
Поделиться
Поделиться
Запинить
Твитнуть

Комментарии

Из графиков я быстро считал следующее:

  1. Дипл оставил всех позади при переводе с английского на другие языки и что лучше не использовать конкурентов.

  2. При переводе на английский Дипл справляется хуже и потому конкуренты ближе. Возникает вопрос: в данных проблема? Может быть, переводы с английского и на английский делали носители языка и потому такие результаты?

  3. Роботы лучше переводят с французского на английский, чем с испанского и немецкого.

А вот из таблицы всех этих выводов не сделать. Поэтому я несогласен с тем, что графики нужно выкинуть и заменить на таблицу. Возможно, можно привести и то, и то. Графики можно сверстать аккуратнее.

Графики всё же быстрее дают считать главный посыл: синий столбик — самый молодец. Потом взгляд бежит к легенде, и ты понимаешь, что это Дипл. И уже потом, если хочется поизучать детали, ты начинаешь ездить глазами туда‑сюда.

В таблице же нет чёткого первого впечатления, приходится всё равно пробежаться по всем столбцам.

Алексей Кузнецов

Можно закрасить ячейки в зависимости от значения.

А я тут сразу обратила внимание на то, что эксперты не оценивают качество перевода, а должны выбрать один лучший переводчик на их взгляд, при этом один эксперт выбирает один переводчик. То есть все столбики каждого графика можно сложить и получить 100%. Тогда всю историю можно показать намного компактнее, и это отчасти решит проблему с легендой.

При быстрой перевёрстке оказалось, что не все столбики в сумме дают 100%. О чём это говорит? Эксперты по немецкому не смогли высказаться о переводе на испанский? Или лингвистам Брянского государственного университета надоело оценивать качество машинного перевода и они пошли пить пиво в Круглый сквер? Просто за счёт такого представления мы узнаём о данных что‑то, чего не видели раньше.

  1. Название оси ординат поместить горизонтально наверху.

  2. При этом над первыми тремя графиками написать «Chosen as the best translation FROM English». Над вторыми «Chosen as the best translation TO English». А названия осей абсцисс сделать, соответственно, «To German» и т. д.

  3. В названиях переводчиков оставить только по первому слову (DeepL, Google, Facebook), а во вступлении пояснить, что сравнивались DeepL Translator и т. д.

  4. Столбцы сделать больше по ширине и немного раздвинуть.

  5. За счёт 4 на первом графике в наборе из первых трёх графиков поместить названия столбцов над ними. Аналогично сделать с первым графиком во вторых трёх графиках. На остальных графиках это дублировать не нужно, достаточно только на первом слева.

Если нужен графический вид, то подойдёт график «Радар». По каждому переводчику по осям заполните качество перевода. Наложение чётко покажет, кто в чём сильнее. Такой график визуально покажет сильные стороны по нескольким парметрам. Таблица — это больше для обработки данных.

Сергей Хабаров

Если наша задача — показать, что DeepL — лучший переводчик, — то вот такая диаграмма тоже может сработать:

Цель рубрики — обсуждение вопросов дизайна, веб-разработки, переговоров, редактуры и управления.
Комментарии модерируются. Мы публикуем комментарии, которые добавляют к уже сказанному новые мысли и хорошие примеры.

Рекомендуем другие советы