Инновационные технологии в локализации

image image
В рамках подготовки к конференции по локализации Loc Kit мы продолжаем общаться со спикерами. В этот раз мы задали несколько вопросов представителям компании ABBYY Language Services Надежде Батюковой, руководителю отдела многоязычной локализации, и Антону Воронову, директору по инновациям.

— Расскажите о своей работе. В чем она заключается? 

Надежда Батюкова: Мы выполняем локализацию ПО, сайтов, компьютерных игр, маркетинговых материалов на разные языки, составляем многоязычные глоссарии и проводим лингвистическое тестирование. Менеджеры отдела взаимодействуют с заказчиками, подбирают исполнителей на проекты, управляют многостадийным процессом локализации и обеспечивают контроль качества.

— Как технологически построен процесс локализации: с какими технологиями и ПО вы работаете?

Надежда: Локализация — интересная и комплексная задача. Мы используем различные программные продукты собственной разработки для оптимизации работы. Управлять терминологией и централизованно хранить все лингвистические ресурсы по проектам нам помогает Lingvo.Pro. Многие наши клиенты также используют это решение для организации терминологической работы внутри своих компаний.

Поскольку мы работаем с разными форматами файлов, у нас постоянно возникает потребность в конвертации материалов под CAT-инструменты. Раньше для этих целей наши инженеры создавали специальные утилиты для каждого проекта. Они помогали извлечь тексты для перевода и подсчета статистики, сохранить код и теги, а также автоматизировать сборку файла в исходный формат — то есть избавляли менеджеров от необходимости вставлять перевод на множество языков вручную, строчка за строчкой. Также мы использовали разработки для автоматических проверок единообразия терминологии и оформления переводов (отсутствие лишних пробелов, несоответствие знаков препинания и регистра букв в исходном и конечном текстах и пр.). Сейчас основу автоматизации составляет SmartCAT, который постепенно заменяет множество отдельных утилит.

Антон Воронов: Локализация — многостадийный процесс, и здесь особенно важна связь между всеми этапами. Сейчас основную часть переводческих процессов в компании берет на себя SmartCAT. Он обрастает дополнительными коннекторами, учится работать с разным ПО и пр. Коннекторы, в свою очередь, позволяют интегрировать процесс локализации с хранилищами кода. Как мы знаем, когда разработчики создают софт, они пишут код и складывают его в репозиторий — например, GitHub или SVN. Благодаря коннекторам, как только программа попадает в определенное хранилище и готова к локализации, можно приступать к переводу. Не нужно ничего отправлять по почте: мы забираем исходные файлы в репозитории, переводим и помещаем готовый текст в то же хранилище. И разработчики могут сразу собрать локализованную версию программы.

— С какими языками вы чаще всего работаете?

Надежда: В нашем активе более 80 языковых пар. Мы работаем с переводчиками по всему миру, и зачастую локализация производится без участия русского языка (т. е. с одного иностранного языка на другой). Локализация с английского на основные европейские языки — так называемые FIGS (French, Italian, German, Spanish) — это базовый набор, который востребован практически у всех наших клиентов. В среднем на один проект приходится восемь-десять языковых пар: языки FIGS, польский, чешский, турецкий и популярные азиатские языки — японский, китайский и корейский. И это не предел: к примеру, для компании Hamsetrsoft мы регулярно выполняем локализацию ПО и материалов для сайта на 40 языков, а абсолютным рекордсменом по количеству языков является проект для другого нашего клиента: в рамках этого проекта мы сделали локализацию на 100 различных языков мира.

 — Какие интересные примеры и особенности локализации на отдельные языки вам встречались?

Надежда: Обычно курьезы случаются, когда в исходном и локализованном текстах имеются различия в направлении письма (справа налево, а не слева направо), в правилах постановки знаков препинания или в коннотациях слов (в т. ч. у названий программных продуктов), с которыми не знаком клиент. Например, как-то мы уговаривали заказчика не удалять непривычные знаки пунктуации из файла на испанском, где по правилам языка вопросительный и восклицательный знаки дублируются в перевернутом виде в начале предложения.

Также в процессе локализации иногда приходится исключать из текста определенные реалии, чтобы адаптировать его для целевой аудитории. Например, при работе над одним каталогом в варианте, предназначенном для мусульманских стран, по согласованию с заказчиком удалили все, что было связано с алкоголем и нижним бельем. В другом случае при адаптации американской викторины для российского рынка переписали ряд тем. В частности, бейсбол, не столь популярный у нас, заменили на фигурное катание.

 — Как построен процесс контроля качества локализации?

Надежда: Перед началом проекта мы составляем многоязычный глоссарий: извлекаем терминологию из текстов, переводим на требуемые языки и утверждаем ее у заказчика. Если у клиента есть свой глоссарий, то берем его за основу. Поддерживать актуальность терминологии нам помогает Lingvo.Pro, тем более что заказчик тоже подключается к работе напрямую в интерфейсе решения.

У нас трехступенчатый процесс работы: после переводчика текст смотрит редактор, затем корректор. Все исполнители — это носители языков, на которые осуществляется локализация, проживающие в соответствующих странах. Под каждый язык у нас есть свои команды профессионалов: отдельная команда строго под каждую тематику. По опыту могу сказать: не бывает такого, что один человек одинаково хорошо работает с разными языками и тематиками — к примеру, владеет турецким, японским и сербским языками в технической, юридической и медицинской тематиках.

Также в компании есть отдел контроля качества, в задачу которого входит обучение исполнителей, регулярный мониторинг качества выполненных заказов, проведение экспертиз по любому языку мира.

Ну и наконец, после всех стадий работы над текстом мы проводим финальные автоматизированные проверки с помощью собственных инструментов: смотрим, все ли корректно, не проскользнула ли лишняя запятая, соотносятся ли термины с глоссарием.

Антон: Поскольку контроль качества — очень кропотливая и скрупулезная, но необходимая работа, очень важно максимально автоматизировать этот процесс. Поэтому в SmartCAT мы стараемся уделить этому направлению особое внимание: автоматические проверки сейчас очень востребованы. Также мы работаем над тем, чтобы пользователи могли просмотреть информацию в контексте и протестировать, как перевод будет выглядеть в интерфейсе — для этого мы разрабатываем специальные визуализаторы для различных типов контента.

— Вы упоминали лингвистическое тестирование. Что это за услуга и имеет ли она отношение к контролю качества?

Надежда: Лингвистическое тестирование — это финальный этап локализации и важная составляющая процесса контроля качества. Локализованный файл встраивается в реальную оболочку, и эксперт оценивает его в контексте, просматривая экран за экраном согласно утвержденному плану. Во время тестирования специалист фиксирует все недочеты в специальной форме (баг-репорте) и предлагает варианты исправления, которые согласовываются с заказчиком и затем вносятся в рабочие файлы. Лингвистическое тестирование тарифицируется по часам. Тарифы отличаются по языкам и зависят от себестоимости работы исполнителей.

К сожалению, в ряде случаев проекты по локализации имеют срочность «вчера», поэтому клиенты настаивают на пропуске этапа тестирования. Но, как показывает практика, он экономит много времени, которое впоследствии тратится, к примеру, на дополнительные правки и согласования, когда на этапе финальной сборки выясняется, что текст не проходит по длине и пр.

 — Каким вы видите процесс локализации через 5 лет? 

Антон: На сегодняшний день в отрасли намечается несколько важных тенденций — думаю, через пять лет они станут более привычными для процесса локализации.

В первую очередь, это интеграция: многостадийный процесс локализации будет построен на единых решениях, сократится роль ручного труда, успешность проектов перестанет зависеть от коммуникации между исполнителями, а контент будет передаваться напрямую через коннекторы.

Возрастет роль профессионального машинного перевода: сейчас многие заказчики опасаются MT с постредактированием, так как думают, что эта технология не может дать качественный результат. Тем не менее, будущее за профессиональным машинным переводом — с доступом к лингвистическим ресурсам памяти переводов и глоссариям, с настройкой «движков», постредактированием и другими стадиями обработки.

Увеличится и количество языков локализации. Раньше, чтобы тебя понимало 90 % аудитории в сети, достаточно было 5-10 языков. Сейчас для этого понадобится уже 18-20 языков: все больше стран выходит в Интернет, развиваются мобильные технологии, идет процесс дальнейшей глобализации.

Определенно усилится роль коллективной работы над проектами локализации.

— А что, по-вашему, станет с менеджером проектов через 5 лет в таком мире автоматизации?

Надежда: Хороший менеджер проектов через 5 лет уже должен быть руководителем отдела, как минимум J

Есть автомобили с коробкой-автомат, но это не означает, что они могут ехать без водителя. Аналогично с локализацией: у нас есть SmartCAT, в котором менеджеру проекта удобнее контролировать процесс. Уверена, что внедрение новых технологий не приведет к массовому сокращению персонала в отделах локализации. Скорее работа станет более эффективной и появится больше времени на развитие процесса.

Антон: Думаю, менеджеры проектов локализации будут еще глубже вовлечены в процесс и станут компетентнее в технологическом плане. В целом, они и сейчас понимают технологические аспекты лучше менеджеров других переводческих отделов, поскольку обладают не только лингвистическими, но и инженерными компетенциями. Знания в области профессионального переводческого ПО приведут к конкуренции другого уровня на рынке труда. Поэтому, если работаешь в технологичной компании — это одно, а если по старинке делаешь все «на коленке» — это совсем другое.

 — Как вы относитесь к использованию краудсорсинга?

Антон: Мы относимся к краудсорсингу положительно. В той же локализации при соответствующей организации можно привлечь к переводу тех людей, которые являются активными пользователями продукта, его фанатами, и знают про него чуть ли не больше разработчиков. При этом они действительно хотят принести пользу продукту — это мотивация другого уровня. Один из очевидных плюсов — такие переводчики уже погружены в контекст и хорошо знакомы с предметом.

В профессиональном сценарии мы активно используем коллективную работу и реализуем это направление в наших продуктах, закладывая тем самым возможности для краудсорсинга. Например, SmartCAT лежит в основе «Переведем Coursera» — проекта, где волонтеры переводят лекции образовательного ресурса Coursera. Результаты не могут не впечатлить: эти люди перевели первый миллион слов всего за 3 месяца. Но в то же время мы понимаем, что краудсорсинг ставит много серьезных вопросов: это и мотивация большого количества исполнителей, и оценка компетентности, и управление сообществом, и развитие технологий. Недавно мы подробно рассказывали об этом в специальной колонке на Slon.ru.

— Почему вы решили разрабатывать собственные технологии для автоматизации перевода, и каких результатов добились на текущий момент?

Антон: Разнообразные специализированные технологические решения для автоматизации процесса перевода приносят пользу на различных этапах процесса. Но настоящий прорыв начинается, когда непрерывно автоматизирован весь процесс локализации от написания и извлечения контента до работы переводчика. При этом имеющиеся решения зачастую тяжеловесны, сложны в освоении и адаптации, а также не всегда справляются со стремительно эволюционирующими процессами и задачами. Нашу компанию всегда отличала высокая степень автоматизации всех процессов, поэтому был сделан непростой выбор в пользу разработки единого решения для автоматизации всех аспектов бизнеса. В результате сегодня мы не только используем эти технологии внутри компании, но и предлагаем рынку в виде наших продуктов: ABBYYSmartCAT, Lingvo.Pro, Perevedem.ru и других. Обо всех выводах говорить еще рано, но первые результаты, которые мы получили, говорят о правильности выбранного пути.

Автор:

Источник

Оставить комментарий