Рейтинг на сайте 81963  Место 559
Трибуна Статус
Евгений Капитульский
Евгений Капитульский поделился ссылкой - редактирование статуса
сейчас будет пост внутренней кухни #Sports.ru.
точнее, даже не Sports.ru, а Scores&Video.
точнее, даже не Scores&Video, а лично меня. сдаётся мне, тут моё мнение может с кем-то из сотрудников несколько не совпасть, но вопрос здесь в высшей степени философский, так что не страшно. :)

итак, некий Мигель Риос советует интересный лайфхак в гугл-документах: он показывает, как одним махом перевести слово sunset на все языки, которые знает гугл-переводчик. twitter.com/miguelrios/status/676502909022945280 (смотрите гифку)
он по праву считает эту информацию интересной, у него за 1700 ретвитов. в числе ретвитнувших - два моих друга-программиста, которые не видят тут подвоха.

тем не менее, подвох тут есть. и скажу вам по секрету: я очень надеюсь, что осознание мною этого подвоха уже сказывается на Scores&Video и рано или поздно даст нашим локализациям преимущество.

подвох заключается в том, что гарантий правильности переводов, полученных Мигелем Риосом, строго говоря, нет. это я лингвист, ничего не боюсь и вижу по гифке, что как минимум большая часть переводов верна (хотя даже перевод на русский выглядит не оптимальным - на гифке написано "заход солнца", а не "закат"). но не имея должной подготовки, этого знать нельзя. так что я уверен, что среди всех лайкнувших и ретвитнувших есть многие, кто просто верит этим переводам на слово.

между тем, не всё так однозначно. сейчас я вам это продемонстрирую.
возьмём название страны "Иран" и будем переводить это слово с английского.
translate.google.lv/ : "Я побежал"
translate.google.lv/ : "Я побежал"
translate.google.lv/ : "Я побежал"
translate.google.lv/ : перевод верен.
translate.google.lv/ : перевод верен.
translate.google.lv/ : перевод верен, но чтобы это понять, надо быть гиком (т.е. мной), и уверен, сейчас вы тоже верите мне на слово.
translate.google.lv/ : а вот тут, ну-ка, кто-нибудь ответит, что написано по-сингальски - "Иран" или "я побежал"?

таким образом, скрипт Мигеля Риоса не помогает нам перевести слово "Иран", и уверен, не только его.
многие локализаторы не понимают этого. даже с Ираном (точнее, с "я побежалом") нашёлся пример: www.distuned.com/Country/iran/

вывод: автоматика - это хорошо. но после применения скрипта информация всё равно должна кем-то редактироваться. очевидно, для этого нужен специальный человек.
но при табличной работе есть ещё одно правило: сделать с нуля проще, чем проверить написанное. однако делать с нуля явно дольше. поэтому правильный алгоритм работы с табличной информацией (в нашем случае это локализация миллиона сущностей) должна происходить в таком порядке:

1) делается автоперевод;
2) штатный сотрудник ("гик" или знаток конкретного языка) бегло проверяет автоперевод, после чего сразу выкатывает его - это будет черновой вариант перевода;
3) тот же штатный сотрудник в течение долгого времени делает работу с нуля и в какой-то момент заканчивает её;
4) делается автосверка двух документов - вычитанного автоперевода и результата работы с нуля; сотрудник, работавший с обоими версиями, фиксирует расхождения при сверке этих документов и для каждого такого случае выбирает правильный вариант, вводя его в окончательную версию;
5) окончательная версия выкатывается поверх предыдущей версии данных (напомню, что всё это время у нас провисел автоперевод из п.2);
6) итог - качественная информация, в которой нет ни ошибок из-за человеческого фактора, ни ошибок из-за автоматизации.

примерно так в последнее время стала происходить локализация Scores&Video, причём самая весёлая часть ещё впереди.

если вдруг когда-нибудь будете заниматься созданием версий чего-либо на разных языках - не делайте так, как 90% населения планеты Земля, а делайте так, как я написал. если у вас нет денег на штатного гика, значит, это будете вы, но это тоже даст результат, намного лучший, чем мог бы быть без этого.
Miguel Rios on Twitter

Miguel Rios on Twitter

twitter.com

“Random hack: translate in bulk using Google Sheets. https://t.co/FZjw7xvCJL”