сейчас будет пост внутренней кухни #Sports.ru. точнее, даже не Sports.ru, а Scores&Video. точнее, даже не Scores&Video, а лично меня. сдаётся мне, тут моё мнение может с кем-то из сотрудников несколько не совпасть, но вопрос здесь в высшей степени философский, так что не страшно. :)
итак, некий Мигель Риос советует интересный лайфхак в гугл-документах: он показывает, как одним махом перевести слово sunset на все языки, которые знает гугл-переводчик. twitter.com/miguelrios/status/676502909022945280 (смотрите гифку) он по праву считает эту информацию интересной, у него за 1700 ретвитов. в числе ретвитнувших - два моих друга-программиста, которые не видят тут подвоха.
тем не менее, подвох тут есть. и скажу вам по секрету: я очень надеюсь, что осознание мною этого подвоха уже сказывается на Scores&Video и рано или поздно даст нашим локализациям преимущество.
подвох заключается в том, что гарантий правильности переводов, полученных Мигелем Риосом, строго говоря, нет. это я лингвист, ничего не боюсь и вижу по гифке, что как минимум большая часть переводов верна (хотя даже перевод на русский выглядит не оптимальным - на гифке написано "заход солнца", а не "закат"). но не имея должной подготовки, этого знать нельзя. так что я уверен, что среди всех лайкнувших и ретвитнувших есть многие, кто просто верит этим переводам на слово.
между тем, не всё так однозначно. сейчас я вам это продемонстрирую. возьмём название страны "Иран" и будем переводить это слово с английского. translate.google.lv/ : "Я побежал" translate.google.lv/ : "Я побежал" translate.google.lv/ : "Я побежал" translate.google.lv/ : перевод верен. translate.google.lv/ : перевод верен. translate.google.lv/ : перевод верен, но чтобы это понять, надо быть гиком (т.е. мной), и уверен, сейчас вы тоже верите мне на слово. translate.google.lv/ : а вот тут, ну-ка, кто-нибудь ответит, что написано по-сингальски - "Иран" или "я побежал"?
таким образом, скрипт Мигеля Риоса не помогает нам перевести слово "Иран", и уверен, не только его. многие локализаторы не понимают этого. даже с Ираном (точнее, с "я побежалом") нашёлся пример: www.distuned.com/Country/iran/
вывод: автоматика - это хорошо. но после применения скрипта информация всё равно должна кем-то редактироваться. очевидно, для этого нужен специальный человек. но при табличной работе есть ещё одно правило: сделать с нуля проще, чем проверить написанное. однако делать с нуля явно дольше. поэтому правильный алгоритм работы с табличной информацией (в нашем случае это локализация миллиона сущностей) должна происходить в таком порядке:
1) делается автоперевод; 2) штатный сотрудник ("гик" или знаток конкретного языка) бегло проверяет автоперевод, после чего сразу выкатывает его - это будет черновой вариант перевода; 3) тот же штатный сотрудник в течение долгого времени делает работу с нуля и в какой-то момент заканчивает её; 4) делается автосверка двух документов - вычитанного автоперевода и результата работы с нуля; сотрудник, работавший с обоими версиями, фиксирует расхождения при сверке этих документов и для каждого такого случае выбирает правильный вариант, вводя его в окончательную версию; 5) окончательная версия выкатывается поверх предыдущей версии данных (напомню, что всё это время у нас провисел автоперевод из п.2); 6) итог - качественная информация, в которой нет ни ошибок из-за человеческого фактора, ни ошибок из-за автоматизации.
примерно так в последнее время стала происходить локализация Scores&Video, причём самая весёлая часть ещё впереди.
если вдруг когда-нибудь будете заниматься созданием версий чего-либо на разных языках - не делайте так, как 90% населения планеты Земля, а делайте так, как я написал. если у вас нет денег на штатного гика, значит, это будете вы, но это тоже даст результат, намного лучший, чем мог бы быть без этого.
Добавляйте к статусу теги спортсменов, клубов и турниров. Добавить тег Введите # (или №) и несколько первых букв, выберите нужный тег в выпадающем списке.
точнее, даже не Sports.ru, а Scores&Video.
точнее, даже не Scores&Video, а лично меня. сдаётся мне, тут моё мнение может с кем-то из сотрудников несколько не совпасть, но вопрос здесь в высшей степени философский, так что не страшно. :)
итак, некий Мигель Риос советует интересный лайфхак в гугл-документах: он показывает, как одним махом перевести слово sunset на все языки, которые знает гугл-переводчик. twitter.com/miguelrios/status/676502909022945280 (смотрите гифку)
он по праву считает эту информацию интересной, у него за 1700 ретвитов. в числе ретвитнувших - два моих друга-программиста, которые не видят тут подвоха.
тем не менее, подвох тут есть. и скажу вам по секрету: я очень надеюсь, что осознание мною этого подвоха уже сказывается на Scores&Video и рано или поздно даст нашим локализациям преимущество.
подвох заключается в том, что гарантий правильности переводов, полученных Мигелем Риосом, строго говоря, нет. это я лингвист, ничего не боюсь и вижу по гифке, что как минимум большая часть переводов верна (хотя даже перевод на русский выглядит не оптимальным - на гифке написано "заход солнца", а не "закат"). но не имея должной подготовки, этого знать нельзя. так что я уверен, что среди всех лайкнувших и ретвитнувших есть многие, кто просто верит этим переводам на слово.
между тем, не всё так однозначно. сейчас я вам это продемонстрирую.
возьмём название страны "Иран" и будем переводить это слово с английского.
translate.google.lv/ : "Я побежал"
translate.google.lv/ : "Я побежал"
translate.google.lv/ : "Я побежал"
translate.google.lv/ : перевод верен.
translate.google.lv/ : перевод верен.
translate.google.lv/ : перевод верен, но чтобы это понять, надо быть гиком (т.е. мной), и уверен, сейчас вы тоже верите мне на слово.
translate.google.lv/ : а вот тут, ну-ка, кто-нибудь ответит, что написано по-сингальски - "Иран" или "я побежал"?
таким образом, скрипт Мигеля Риоса не помогает нам перевести слово "Иран", и уверен, не только его.
многие локализаторы не понимают этого. даже с Ираном (точнее, с "я побежалом") нашёлся пример: www.distuned.com/Country/iran/
вывод: автоматика - это хорошо. но после применения скрипта информация всё равно должна кем-то редактироваться. очевидно, для этого нужен специальный человек.
но при табличной работе есть ещё одно правило: сделать с нуля проще, чем проверить написанное. однако делать с нуля явно дольше. поэтому правильный алгоритм работы с табличной информацией (в нашем случае это локализация миллиона сущностей) должна происходить в таком порядке:
1) делается автоперевод;
2) штатный сотрудник ("гик" или знаток конкретного языка) бегло проверяет автоперевод, после чего сразу выкатывает его - это будет черновой вариант перевода;
3) тот же штатный сотрудник в течение долгого времени делает работу с нуля и в какой-то момент заканчивает её;
4) делается автосверка двух документов - вычитанного автоперевода и результата работы с нуля; сотрудник, работавший с обоими версиями, фиксирует расхождения при сверке этих документов и для каждого такого случае выбирает правильный вариант, вводя его в окончательную версию;
5) окончательная версия выкатывается поверх предыдущей версии данных (напомню, что всё это время у нас провисел автоперевод из п.2);
6) итог - качественная информация, в которой нет ни ошибок из-за человеческого фактора, ни ошибок из-за автоматизации.
примерно так в последнее время стала происходить локализация Scores&Video, причём самая весёлая часть ещё впереди.
если вдруг когда-нибудь будете заниматься созданием версий чего-либо на разных языках - не делайте так, как 90% населения планеты Земля, а делайте так, как я написал. если у вас нет денег на штатного гика, значит, это будете вы, но это тоже даст результат, намного лучший, чем мог бы быть без этого.
Miguel Rios on Twitter
twitter.com“Random hack: translate in bulk using Google Sheets. https://t.co/FZjw7xvCJL”