Битва Машин | Восстание переводчиков @bitvamachine Channel on Telegram

Битва Машин | Восстание переводчиков

@bitvamachine


Трудности машинного перевода, подводные камни в работе, стандарт ISO 18587, лайфхаки от экспертов отрасли, технологии в области перевода, собственные разработки нашей компании — список тем, рассматриваемых на нашем канале, практически бесконечен.

Битва Машин | Восстание переводчиков (Russian)

Добро пожаловать на канал 'Битва Машин | Восстание переводчиков'! Если вас интересует мир машинного перевода, технологии и стандарты в этой области, то вы попали по адресу. Наш канал занимается рассмотрением трудностей машинного перевода, подводных камней в работе, обсуждением стандарта ISO 18587, а также дает лайфхаки от экспертов отрасли. Мы делимся с вами последними технологиями в области перевода, описываем собственные разработки нашей компании и предлагаем уникальный контент, который поможет вам быть в курсе последних тенденций. Присоединяйтесь к нам, чтобы узнать больше и стать частью сообщества профессионалов в области машинного перевода!

Битва Машин | Восстание переводчиков

10 Jan, 10:13


«Вот поэтому я и не люблю кошек... — Ты просто не умеешь их готовить настраивать!» 😂

Эффективная работа в любой программе зависит от того, насколько комфортен ее интерфейс и насколько точно он настроен под вас.
Как вы правильно поняли, мы начинаем серию публикаций, посвященных настройкам Trados'a. И сегодня рассмотрим некоторые базовые настройки из меню Файл — Параметры:

👍Адаптация шрифта
👍Орфография
👍Автораспространение
👍Редактирование
👍Сочетание клавиш

Подробнее об этих настройках читайте здесь!
А какими настройками пользуетесь вы?
❤️ Делитесь в комментариях!

#mt_learn

Битва машин || Восстание переводчиков

Битва Машин | Восстание переводчиков

28 Dec, 14:59


🎉 Дорогие подписчики! 🎉

Поздравляем вас с наступающим Новым годом!🎄
Пусть год Змеи принесет вам мудрость, спокойствие и гармонию.🎉
Желаем вам крепкого здоровья, благополучия, вдохновения и радостных моментов в каждом дне.

Пусть все ваши мечты сбываются, а удача сопутствует во всех начинаниях!
🎄🎁🎆🎄

Спасибо, что остаетесь с нами!

Ну и немного предновогодней «змеиной» 🐍мудрости от ИИ:

🐍В год Змеи будь мудрым, как змея, и гибким, как ее тело.
🐍В год Змеи не бойся перемен, как змея не боится линьки.
🐍В год Змеи пусть удача ползет к тебе, как змея к своей добыче.

А вот здесь вы можете выбрать персональное пожелание на 2025 год. 🪩 Специально для наших подписчиков мы подготовили 10 волшебных шаров с пожеланиями!

Команда ТГ-канала «Битва машин | Восстание переводчиков»

Битва Машин | Восстание переводчиков

27 Dec, 11:59


А вот и ответ на нашу загадку ☀️
Конечно же, в преддверии 2025 года мы подготовили загадку про змею 🐍
Вот словосочетания, которые мы спрятали в тексте и которые объединены в английском языке словом snake:

🐍Дамский угодник — parlor-snake
🐍Соглашение об ограничении взаимных курсовых колебаний — currency snake
🐍Обсуждение вопросов по работе в неофициальной обстановке — snake out
🐍Невероятная история — snake story
🐍Взгляд, способный превратить в камень — snake gaze

Подсказка была и в названии поста ☺️ Зарядку для хвоста делал удав в мультике «38 попугаев»😁

Битва Машин | Восстание переводчиков

26 Dec, 08:24


Зарядка для хвоста ума 💪

В преддверии Нового года 🎄предлагаем вам отвлечься от серьезных вопросов и попробовать отгадать нашу загадку :)

Мы подготовили для вас историю, в которой спрятали словосочетания, объединенные в английском языке одним словом.

Итак...


В офисе царила атмосфера рабочей суеты, но в воздухе уже витало предновогоднее настроение. Началось обсуждение вопросов по работе в неофициальной обстановке, но, как это часто бывает, сотрудники быстро переключились на более интересные темы. Где-то в финансовых отделах тем временем шла напряженная работа по ограничению взаимных курсовых колебаний, но до нашего офиса эти заботы, казалось, не доходили.

Внезапно один из наших коллег, известный как дамский угодник, начал рассказывать невероятную историю, настолько захватывающую, что все отложили свои дела и слушали его, затаив дыхание. В этот момент, словно гром среди ясного неба, в офис вошел шеф. Его взгляд, способный превратить в камень, прошелся по всем присутствующим, и веселье как рукой сняло. Тишина повисла в воздухе, а все взгляды были прикованы к шефу.

К всеобщему удивлению шеф не стал ругать нас. Напротив, он улыбнулся и сказал: «Коллеги, сегодня никаких разносов! Поздравляю всех с наступающим Новым годом!»


‼️А теперь внимание! Какие сочетания, объединенные одним словом в английском языке, мы спрятали в тексте и каким словом они объединены?
Не забывайте, что загадка новогодняя 🎅🎄.

UPD: в качестве подсказки выделили одно словосочетание. Попробуйте найти другие словосочетания в тексте, связанные с ним одним словом в английском языке.

Битва Машин | Восстание переводчиков

25 Dec, 08:33


🌲Не за горами всеми любимый праздник — Новый год. Мы будем поздравлять друзей, родных, близких, коллег, партнеров...
🎆Предлагаем вспомнить некоторые правила, связанные с написанием названия этого чудесного праздника. Итак...

🌲Название праздника пишется с прописной буквы: Новый год. Поздравляем с Новым годом! Поздравляем с наступающим Новым годом!

🌲Если вы хотите добавить числительное, то тогда слово новый пишем со строчной, а перед числительным ставим запятую, так как это уточнение: Поздравляем с новым, 2025 годом!

🌲Ну а если вы хотите конкретизировать название года по китайскому календарю, то обозначение животного нужно писать с прописной: год Змеи 🐍. Такова фиксация в академическом «Русском орфографическом словаре» под ред. В. В. Лопатина и О. Е. Ивановой.

Наступающий год будет годом Зеленой Деревянной Змеи. 🐍

Битва Машин | Восстание переводчиков

20 Dec, 08:14


Машинный перевод — практически решенный вопрос
Но постижение смыслов, а не просто слов и фраз — это интеллектуальная задача, требующая особого подхода

Продолжая разговор об использовании МП и ИИ в переводческой отрасли, не можем не познакомить вас со статьей, опубликованной в The Economist.

🔖Машинный перевод достиг невероятных успехов, и многие эксперты считают, что задача перевода текста с одного языка на другой практически решена. Однако, как показывает статья, перевод смыслов, а не просто слов и предложений, остается сложной задачей.

Ключевые тезисы:

Революция в машинном переводе: современные нейросети, лежащие в основе больших языковых моделей (LLM), обеспечивают качество перевода, сравнимое с работой профессиональных переводчиков.
Человеческий фактор: несмотря на успехи ИИ, на человеческий труд по-прежнему составляет основу отрасли перевода. Однако, по прогнозам, в ближайшие годы роль человека в этом процессе будет сведена к минимуму.
Время редактирования: показатель Time to Edit (TTE), измеряющий время, необходимое человеку для проверки машинного перевода, постоянно снижается. Это свидетельствует о повышении качества машинного перевода.
Проблемы с контекстом и смыслом: машинный перевод отлично справляется с переводом отдельных предложений, но испытывает трудности с пониманием контекста, долгосрочной памяти, фактических источников и переводами, требующими точности, например, заголовков.
«Галлюцинации» ИИ: машинный перевод может «галлюцинировать», добавляя информацию, которой нет в исходном тексте, или забывать переводы для повторяющихся фраз.
Сложности с идиомами и культурными отсылками: машинный перевод сталкивается с трудностями при переводе идиом и культурных отсылок, требующих понимания контекста и культурных особенностей.
Проблема «низкоресурсных» языков: для языков с небольшим количеством обучающих данных качество машинного перевода остается низким.
Ценность изучения языков: несмотря на успехи машинного перевода, изучение языков остается важным для понимания других культур и людей.

📎Вывод:

Машинный перевод достиг значительных успехов и стал незаменимым инструментом для преодоления языковых барьеров. Однако для идеального перевода, требующего понимания контекста, культурных нюансов и цели перевода, по-прежнему необходим человеческий интеллект.

Битва Машин | Восстание переводчиков

17 Dec, 08:01


#МПК15
Продолжаем рассказывать о МПК-15
Компания ILS затронула важную и актуальную тему:

«AI в переводческой отрасли: беда или победа?» 🤖🤔


Ниже основные тезисы
В последние годы искусственный интеллект (ИИ) стремительно ворвался во все сферы нашей жизни, и переводческая отрасль не стала исключением.

📉 Рынок в турбулентности:

• Рынок лингвистических услуг переживает не лучшие времена. Прогнозы показывают снижение объемов, а падение доходов заставляет руководителей переводческих компаний (LSP) искать новые пути выживания.
• При этом ИИ в языковой сфере является одним из главных факторов, негативно влияющих на спрос на традиционные услуги. Многие боятся, что ИИ оставит их без работы.

🤔 Мнение профессионалов:

• Среди руководителей LSP растет неуверенность, но все же преобладает понимание, что нужно адаптироваться.
• Большинство компаний, чьи доходы падают, внедряют новые инструменты и решения, связанные с ИИ.

💡 Куда движется рынок?

• Переводчики сталкиваются с новой реальностью: машинный перевод (МП) набирает обороты. Причем МП уже активно используется для перевода 99% онлайн-контента, в то время как на долю ручного перевода приходится всего 1%.
• Рынок все больше ориентируется на динамический контент, мультимедиа и услуги больших языковых моделей (LLM).
Генерация контента становится важным направлением, где ИИ играет ключевую роль.
Управление данными и их очистка для обучения LLM — еще одна перспективная область.

⚔️ Борьба за выживание и новые возможности:

✔️ LSP ищут новые возможности, такие как:
• Партнерство и альянсы
• Разработка новых инструментов и решений
• Развитие сотрудничества с существующими клиентами
• Инвестиции в маркетинг и брендинг
• Переобучение персонала
✔️ При этом, очевидно, что традиционная модель перевода уходит в прошлое.

🏆 Кейсы успешного применения ИИ (более подробно здесь):

Проект MAIA показал сокращение расходов на локализацию на 75% в области медицины, а также увеличение скорости выполнения задач.
Кейс DHL демонстрирует, как ИИ помог создать качественный аудиоконтент для обучения в кратчайшие сроки и с минимальными затратами.

Эти примеры наглядно показывают, что ИИ — это не угроза, а инструмент для повышения эффективности и качества работы.

🔑 Ключевые выводы:

Возврата к «нормальному» не будет. Переводческая индустрия меняется навсегда, и нам придется принять эти изменения.
Адаптация — ключ к успеху. Нужно учиться использовать ИИ в своей работе, а не бороться с ним.
ИИ открывает новые возможности. Вместо того, чтобы просто переводить, переводчики могут стать консультантами по локализации, экспертами по данным, редакторами машинного перевода, и т. д.

Так беда или победа?

Ответ зависит от нас самих. Если мы будем сопротивляться переменам, бояться ИИ и цепляться за старые методы работы, то, скорее всего, нас ждет беда. Но если мы примем новые технологии, научимся работать с ними и будем постоянно развиваться, то ИИ станет для нас мощным союзником и приведет нас к победе.

Битва Машин | Восстание переводчиков

12 Dec, 14:09


#МПК15
«Катминт» от «Амберит» 🚀

В ходе МПК-15 компания «Амберит» представила «Катминт» — передовой облачный инструмент!

Что такое «Катминт»?

Это комплексная система лингвистических сервисов, созданная для управления всеми этапами переводческого процесса, включая:

перевод,
• редактуру
,
машинный перевод,
постредактуру,
моноязычное редактирование,
перевод, редактирование и вычитку с помощью ИИ,
multiflow-проекты.

Ключевые особенности «Катминт»:

Простой и интуитивно понятный интерфейс: работайте в любом браузере без лишних сложностей.
Интеграция с популярными движками машинного перевода: Google, DeepL, Yandex, ChatGPT и другие.
Автоматизированное управление лингвистическими ресурсами: экономьте время и силы на рутинных задачах.
Встроенные модели ИИ: ChatGPT-4o, ChatGPT-4, Claude, LLAMA-3 для перевода, редактирования и вычитки.
Поддержка ТМ и глоссариев: обеспечьте единство и качество переводов.
Гибкая настройка рабочих процессов: легко управляйте этапами проекта и контролируйте сроки.
Поддержка множества форматов файлов: DOCX, XLSX, PPTX, PDF, JSON, PO, SDLXLIFF, XLF, XLIFF, IDML, ODT и другие.
Встроенный полнофункциональный редактор: работайте без обращения к сторонним CAT-системам.

ИИ в «Катминт»: ваш секретный помощник

Система «Катминт» активно использует возможности искусственного интеллекта для повышения эффективности и качества перевода:

Новые типы проектов AI-reviewed Editing и AI-reviewed Proofreading: редактируйте и вычитывайте документы с помощью GenAI, используя встроенные языковые модели.
Встроенные функции редактора для работы с сегментами: переводите, редактируйте, вычитывайте и работайте с правками, используя возможности ИИ.
Уникальный редактор для одновременной работы с несколькими сегментами: обеспечивает единообразие перевода, учитывая контекст и позволяя настраивать параметры ИИ.

Что нового добавлено в 2024 году?

• Богатый функционал работы с ИИ (перевод, редактирование, вычитка, AI-review+proofreading).
• Поддержка множества новых форматов файлов (IDML, PDF, JSON, PO, XLIFF и другие).
• Несколько новых типов проектов.
• Поддержка глоссариев в форматах TBX и XLSX.
• Улучшенная номенклатура языков (380+ поддерживаемых языков).
• Личный кабинет вендора-агентства.
• И более 300 других обновлений!

Планируемые обновления:

• Мощный ТМ Server.
• Новые форматы файлов.
• И многое другое!

Хотите попробовать?

Компания «Амберит» предлагает пробный доступ. Свяжитесь с представителями компании по email [email protected] или на сайте https://amberites.ru/

Битва Машин | Восстание переводчиков

11 Dec, 10:37


#МПК15
Как мы и обещали, представляем краткий обзор того, что обсуждалось на прошедшем, ставшем уже 15-м заседании Московского переводческого клуба.
Юлия Епифанцева представила экосистему Promt.

🔥Решения PROMT для отрасли переводов

PROMT — российский разработчик лингвистического ПО с 30-летним опытом — предлагает комплекс решений для автоматизации перевода в корпоративном секторе. Никаких рисков, связанных с использованием зарубежных сервисов! Экосистема PROMT обеспечивает безопасность, высокое качество перевода и интеграцию в ваши рабочие процессы.

Что предлагает PROMT?

PROMT Neural Translation Server: мощное клиент-серверное решение для машинного перевода документов и деловой переписки в локальной сети. Поддерживает более 50 языков и множество форматов файлов (docx, xlsx, pptx, pdf и др.), сохраняя форматирование. Возможность настройки через глоссарии и API для интеграции в корпоративные системы. Высокая скорость перевода (до 150 слов/с с использованием видеокарты).

PROMT Translation Factory: многопользовательская CAT-система, устанавливаемая на локальный сервер. Обеспечивает управление переводческими проектами, базами памяти перевода (ТМ), терминологией (TB), а также контроль качества перевода.

PROMT Neural Training Addon: дополнительный модуль для обучения собственных специализированных моделей перевода на ваших данных. Гарантирует конфиденциальность и неограниченное количество тренировок.

🔖Преимущества решений PROMT:

📌 Безопасность данных: все решения работают в локальной сети, исключая утечку конфиденциальной информации.
📌 Высокое качество перевода: нейронный машинный перевод с возможностью настройки под специфику вашей компании.
📌 Интеграция: API и SDK для бесшовной интеграции в существующие системы и приложения.
📌 Масштабируемость: горизонтальное и вертикальное масштабирование для обработки больших объемов данных.
📌 Совместимость с российскими ОС: сертифицированная совместимость с Astra Linux, Alt Linux и РЕД ОС.
📌 Поддержка и сопровождение: российский разработчик обеспечивает стабильную работу и техническую поддержку.

Кому подойдут решения PROMT?

Решения PROMT идеально подходят для компаний, которым важны безопасность данных, высокое качество перевода и эффективная интеграция в бизнес-процессы. Они будут полезны для отделов переводов, служб поддержки, а также для компаний, работающих с конфиденциальной информацией.

Подробнее здесь: https://www.promt.ru/ecosystem/

Битва Машин | Восстание переводчиков

06 Dec, 08:10


🔒Теги в Trados'e
По просьбе одного из подписчиков рассказываем, что такое теги в Trados'е и почему важно соблюдать их расстановку

Trados по своей сути — это текстовый редактор. В Word'е, например, мы можем видеть шрифт разного цвета, гиперссылки и пр. В Trados'е же мы видим только однородный текст (за некоторыми исключениями). Чтобы показать границы выделения текста, в Trados используются так называемые теги. Это не единственная область применения тегов, но, пожалуй, наиболее популярная.

Подробнее об этом читайте здесь.
А в посте «Сила тега» мы рассказывали о том, как можно быстро вставить пропущенные теги.

К чему может привести удаление тегов?
⚠️«Слетит» верстка документа: теряется все, что было выделено цветом, полужирным начертанием или курсивом и т. д.
⚠️«Слетят» ссылки (внутри документа и на внешние источники).
⚠️Документ будет невозможно конвертировать в исходный формат.

⚠️Контроль тегов — обязательный этап работы над переводом. Проверить теги можно непосредственно в Trados'е (клавиша F8) или, например, с помощью программы Xbench.

Отвечая на заданный в комментариях вопрос, отметим: самая главная помощь переводчика верстальщику заключается в корректной расстановке тегов 🙂

Битва Машин | Восстание переводчиков

04 Dec, 06:14


🔖Краткая ГОСТология. Постскриптум

Один из читателей так обозначил тематику этого цикла: ужосперевод ГОСТов. Это не совсем верно, хотя часть публикаций действительно посвящена проблемам с ГОСТами. Однако, как мы и отмечали, мины могут быть заложены еще на этапе написания иностранного (международного) стандарта. Впору говорить про ужостекст стандартов.

Как раз сейчас пришлось работать над серией стандартов очень авторитетной международной организации. В числе документации были и технические отчеты, сопровождающие публикацию стандартов. В таких отчетах объясняется, откуда берутся те или иные требования стандарта, как их реализовывать на практике и что обеспечивает их реализация. Дается, так сказать, бэкграунд.
И что же мы находим в исходном тексте?
👎 Совершенно отсутствует единство терминологии. Одно и то же может называться двумя, тремя и более способами, подчас в соседних предложениях.
👎 Неочевидные аббревиатуры вводятся без всякого пояснения, тогда как общеизвестные расшифровываются. Милый мой, хороший, догадайся сам...
👎 Используются чудовищно громоздкие предложения, дикие эллиптические конструкции (всегда поражало, как на столь лапидарном языке, как английский, можно писать такое). Порой смысл почти ускользает, т. к. предложения просто построены неграмотно!
👎 Встречаются ошибки в номерах рисунков и таблиц при ссылке на них, в названиях документов в библиографии и т. д.
Но больше всего в этих сугубо технических документах меня порадовала магнолия. Точнее внутренняя магнолия (inner magnolia). Что бы это было такое? Именно так, причем неоднократно, называется китайский регион Внутренняя Монголия.
🤬В общем, со стандартами приходится всегда быть настороже.

Битва Машин | Восстание переводчиков

03 Dec, 10:57


🚨Качество машинного перевода: есть ли изменения за год?

Новые данные и мнения экспертов дают повод задуматься. На конференции AMTA 2024 обсуждались перспективы традиционных моделей машинного перевода и больших языковых моделей (LLM), таких как ChatGPT. 💪

Если кратко:
➡️ Технологии ИИ развиваются, но не все впечатлены результатами:

❗️Только 20,4% отметили значительное улучшение в качестве перевода, а еще 18,5% заметили улучшение, но, по их мнению, оно оказалось незначительным.

🆒 Компании инвестируют в ИИ, но затраты растут:

Онлайн-платформа Reddit увеличила свои расходы на 17% из-за роста затрат на персонал и машинный перевод 😨.
Даже при автоматизации процесс требует больше ресурсов, в том числе человеческих.

🙂 Есть и позитивные тренды:

Эксперты подчеркивают важность умения работать с данными и управлять языковыми моделями.
Прогресс здесь напрямую зависит от грамотного использования технологий.

🤫 Совет специалистам:
Развивайте навыки работы с нейросетями и научитесь правильно формулировать запросы (prompting). Это ваш билет к успешной карьере в мире ИИ!

Что еще удивило, так это использование ИИ для перевода художественной литературы. Еще недавно в отрасли бытовало мнение, что использовать машинный перевод и ИИ для перевода такого рода текстов неэффективно...

А каково ваше мнение относительно влияния МП и ИИ на качество и затраты? Делитесь в комментариях 💬

Битва Машин | Восстание переводчиков

29 Nov, 18:03


📣Распознавание речи

Протестировав возможности системы распознавания речи Whisper от OpenAI и оценив ее потенциал для аудиовизуального перевода, 🔥наши инженеры интегрировали эту технологию в единую цифровую платформу Neotech Digital Office. О том, что у них получилось, смотрите в нашем видео!

О системе Whisper
Whisper — это модель машинного обучения для распознавания речи и транскрипции, созданная OpenAI. Впервые выпущена как программное обеспечение с открытым исходным кодом в сентябре 2022 года.

Особенности модели:
Многоязычная поддержка: Whisper распознает речь на десятках языков, открывая доступ к контенту для глобальной аудитории.
Высокая точность: даже в условиях шума и акцентов Whisper демонстрирует высокую точность распознавания.
Простота использования: Whisper легко интегрируется в различные приложения и инструменты, упрощая процесс перевода.
Открытый исходный код: позволяет разработчикам создавать собственные приложения.
В отличие от сервисов Speech-to-Text от Google, Microsoft и др. вся обработка осуществляется внутри контура компании. 🔥Соответственно, Whisper можно использовать для обработки конфиденциальной информации❗️

О Neotech Digital Office

Neotech Digital Office — цифровая платформа, созданная инженерами компании «Неотэк» и объединившая в себе цифровые технологии для обработки аудио, видео, звука, текста и т. д., а также для работы с ТМ, перевода личных документов и пр. Простой и понятный интерфейс программы позволяет работать с ней без дополнительного обучения даже тем, кто не обладает навыками программирования.

🔥
We make sense

Битва Машин | Восстание переводчиков

24 Nov, 07:48


Епифанцева Юлия Александровна
Директор по развитию компании PROMT, разработчика в области AI и лингвистических IT технологий. Закончила филологический факультет Санкт-Петербургского государственного университета (отделение немецкой филологии). Опыт в разработке и продвижении технологий машинного перевода более 20 лет. Постоянный спикер конференций Translation Forum Russia, VK LocTalks, мероприятий Ассоциации преподавателей перевода. Автор публикаций на Tadviser.ru, vc.ru.

Битва Машин | Восстание переводчиков

24 Nov, 07:47


Про новые решения от Promt на МПК15 расскажет:

Битва Машин | Восстание переводчиков

24 Nov, 05:03


В этом году на юбилейном заседании МПК-15 компания «Амберит» представит новости о развитии облачной TMS и CAT-системы «Катминт», краткий обзор ее текущего функционала, уже доступного для всех пользователей, а также поделится планами развития системы на ближайшее время.

Впервые система «Катминт» была представлена на заседании МПК в 2023 году и за прошедший год получила множество положительных отзывов от профессионального переводческого сообщества и первых пользователей, среди которых были не только лингвистические компании, но и представители других отраслей, стремящиеся интегрировать автоматизированный перевод документов в свои производственные процессы.

В этом году представители компании расскажут о большой работе, проведённой над системой, о новых опциях и сценариях ее применения. Всего за прошедший год было внесено более 300 улучшений, расширяющих возможности системы: от небольших усовершенствований интерфейса по пожеланиям пользователей до фундаментальных обновлений функционала, включающих передовые возможности использования генеративного искусственного интеллекта для перевода, редактирования и проверки правописания прямо в системе.

До встречи на МПК-15!

https://catmint.words.ru/

Битва Машин | Восстание переводчиков

24 Nov, 05:02


Переводческая компания Литерра, входящая в состав АПК, рада поделиться новостями о ходе разработки CAT-инструмента firstCAT, которым команда Литерры занимается более года. Система почти готова, прошла первые тестовые демонстрации и будет представлена на МПК 15.

Функционал firstCAT представляет собой классическую серверную CAT-систему, разрабатываемую с учетом пожеланий пользователей, собранных как в ходе работы с известным зарубежным CAT-инструментом, реселлером которого Литерра была до 2022 года, так и в ходе митапов, проведенных с потенциальными заказчиками.

Летом команда firstCAT была существенно расширена — мы наняли новых технических специалистов, которые помогли доработать стабильность и безопасность системы, а также ускорить работу отдельных модулей. Так, мы доработали систему контроля качества, улучшив точность и автоматизацию проверки на ошибки. Алгоритм firstCAT учитывает больше количество языковых нюансов, сокращая необходимость ручной проверки. Оптимизация алгоритмов обработки баз памяти позволила firstCAT обеспечить высокую скорость поиска и улучшить релевантность подсказок. Это особенно заметно при работе с большими объемами данных и сложными проектами. Также перед первыми тестовыми демонстрациями были внесены улучшения в интерфейс для более удобного редактирования терминологии и настройки под конкретные проекты.

Рабочая версия firstCAT будет представлена на 15-м, юбилейном, заседании Московского переводческого клуба (МПК), который пройдет в отеле «МонАрх» 6 декабря. Зарегистрироваться на конференцию можно по ссылке.

Битва Машин | Восстание переводчиков

24 Nov, 05:00


Всем привет! Скоро юбилейный МПК15. Будет интересно! Приходите.

Битва Машин | Восстание переводчиков

14 Nov, 14:42


🚩Краткая ГОСТология. Некоторые примеры перевода

Ранее, рассматривая перевод терминологии, мы взяли в качестве примера термин instructed person и установили, что существует не менее 6 вариантов его перевода. Самый «шедевральный» из них — электрически обученный человек (ГОСТ IEC 60050-651-2014). Причем это был не просто межгосударственный стандарт! Это перевод части 651 «Работа под напряжением» Международного электротехнического словаря (МЭС, IEV). Он подготовлен ОАО «Всероссийский НИИ сертификации» на основе собственного перевода стандарта IEC 60050-651:1999. 💡То есть это перевод словаря, который должен быть особенно выверенным! Что же мы находим в нем? В таблице специально приведем еще несколько перлов из ГОСТ IEC 60050-651-2014. Для сравнения дадим и нормальный перевод терминов. Также приведем определения терминов из этого ГОСТа, они весьма характерные.
Видно, что перевод выполнен непрофессионально, ведь неправильно переведен даже термин средства индивидуальной защиты.

✏️Подытожим: простым обращением к тому или иному ГОСТу решить вопросы с переводом терминологии вряд ли получится! Нужно ✔️сопоставлять данные, ✔️знать предмет и ✔️тщательно искать информацию.
⚠️Некоторые стандарты, к сожалению, «помогут» создать совершенно неудачный перевод и даже продемонстрировать полное непонимание темы.
И напротив, ссылкой на качественные стандарты можно подкрепить свой выбор и 🥇заслужить высокую репутацию.

🤫Технический перевод — непростое дело. Потому и ценятся профессионалы.

Битва Машин | Восстание переводчиков

01 Nov, 12:20


Зачем нужны эти бюро?
Личное мнение (может не совпадать с мнением редакции)

В отрасли среди фрилансеров давно сформировался образ бюро переводов как некоего монстра, который только и может что наживаться на переводчиках, при этом сам не добавляет никакой ценности. Читала об этом еще на просторах запрещенной соцсети в группе переводчиков, создателя которой очень беспокоила маржа переводческих компаний. Основной посыл примерно такой: бюро выставляет заказчикам космические цены, при этом к переводу привлекает переводчиков по низким ставкам, а вся суть работы этих бюро сводится к простой посреднической функции: получить текст от заказчика, отправить переводчику, получить перевод от переводчика и вернуть заказчику...

Выскажу свое мнение, сформировавшееся за 23 года работы в компании (сегодня как раз годовщина): если речь идет о разовом заказе небольшого объема, обратиться к частнику будет дешевле. Остается только его выбрать, а для этого — убедиться в квалификации.
👀Не будем лукавить: риск нарваться на непрофессионала как среди переводчиков, так и среди бюро примерно одинаков, поэтому обращаться к частникам в такой ситуации выгодно хотя бы по цене.

Другое дело, если у вас постоянный проект, на котором нужно вести глоссарии, ТМ, требуется верстка (особенно сложная, в том числе под печать), нужно в короткие сроки переводить и верстать огромное количество страниц… Здесь два выбора: ✔️либо самому искать всех исполнителей (переводчика, верстальщика, корректора), ✔️либо заказать комплексную услугу у одного поставщика. В этом случае, конечно, частники уже не конкуренты бюро. Но они могут приобщиться к этому «пирогу», сотрудничая с бюро.

Почему же переводчики так уверены, что бюро не добавляет никакой ценности? Вероятно, потому, что они видят не всю кухню, а лишь одну ее сторону. И даже не представляют, сколько предварительной работы приходится проделать, чтобы подготовить пакет на перевод. Вот лишь некоторые примеры запросов нашим инженерам от менеджеров проектов:
✉️ Пришли очень тяжелые презентации, пожалуйста, сделайте так, чтобы Традос мог их обработать…
✉️ Заказчик прислал файлы с xml-разметкой, нужно выбрать значения на перевод…
✉️ От заказчика поступил запрос на перевод сайта. Нужно выгрузить текст для подсчета и перевода…
✉️ Необходимо перевести на всех нескрытых листах колонку С и вставить перевод в колонку F…
✉️Пришли 1500 файлов .properties под Linux. Нужно извлечь под Традос только требуемые части, перевести и сохранить перевод в оригинальном формате с сохранением исходной кодировки и типа разрыва строк.
Вопрос: сможет ли переводчик решить сам эти проблемы, если будет сотрудничать с заказчиком напрямую? Единицы смогут, но ведь тоже будут делать это небесплатно)
Помню, как в одной из переводческих групп в запрещенной соцсети прочитала трогательную историю о том, как заказчик прислал на перевод файлы indd, приложив к ним pdf. Исполнитель перевел пдфы в ворде, но теперь у него возник вопрос: как же вставить перевод в эти самые indd?🤓
Индизайн, Фрейм, Автокад, Компас… — есть ли у переводчика все эти программы и может ли он в них работать?
К чему это я? А к тому, что комплексный подход — именно та ценность, которую получает заказчик, обращаясь в бюро, ведь чаще всего собственно перевод документа — всего лишь часть услуги, которую он хочет получить. А для предоставления комплексной услуги в штате компании должны работать не только переводчики, редакторы и корректоры, но и верстальщики, и даже инженеры. Последние особенно востребованы в условиях автоматизации процессов, развития ИИ и технологий машинного перевода. Все эти люди проделывают невидимую для переводчика работу, результатом которой становится подготовленный, например, в Традосе пакет...
Настолько ли уж заоблачной получается маржа в итоге, что не дает переводчикам спать спокойно?)))
И к вопросу о достойных ставках… Каждый сам для себя определяет, какая ставка его достойна или недостойна. Если вы считаете, что ставка низкая, не сотрудничайте с теми, кто вам мало платит… А если решили сотрудничать, то делайте работу хорошо…
У меня все. Всем добра! ☀️

Битва Машин | Восстание переводчиков

15 Oct, 15:23


Уважаемые коллеги!

Приглашаем вас принять участие в замечательном мероприятии — новогодней (а также юбилейной) встрече МПК-15, которая состоится 6 декабря 2024 года в Москве в отеле «МонАрх». Тема мероприятия — «AI — риски и возможности для переводческой отрасли». В этот раз участников мероприятия снова примет пятизвездочный бизнес-отель «МонАрх», удобно расположенный недалеко от центра Москвы, в районе станций метро «Динамо» и «Беговая».

Применение искусственного интеллекта в различных областях человеческой деятельности — это то, что сейчас у всех на устах. Отрасль перевода и локализации не является исключением: сегодня она по праву считается высокотехнологичной, поэтому для нас данная тема очень актуальна. Мы будем рады, если вы посетите наше мероприятие и поделитесь своим мнением по этой и другим обсуждаемым темам, среди которых — кадровый вопрос, изменение налогового законодательства и стандарт АПК по машинному переводу.

Наша встреча начнется в 9:00. Программа обещает быть традиционно насыщенной: вас ждут интересные дискуссии, вручение премии МПК-2024 и праздничный предновогодний вечер.

С предварительной программой вы можете ознакомиться здесь - https://atcru.org/upload/medialibrary/programms/MPK15Programme.pdf.

Стоимость участия — 16 000 рублей. Традиционно в нее входит все: детально проработанная деловая программа, отличные возможности для нетворкинга, комфорт пятизвездочного отеля, кофе-брейки, достойный обед, праздничный ужин с развлекательной программой. Подать заявку на участие можно по этой ссылке - http://atcru.org/events/mpk-15/.

До встречи на МПК-15!

Битва Машин | Восстание переводчиков

15 Oct, 08:27


🔝 Краткая ГОСТОлогия. Техрегламенты

ℹ️Обычное требование к техническим документам, включая переводные, выглядит так:
в документах следует применять научно-технические термины, обозначения и определения, установленные соответствующими стандартами, а при их отсутствии — общепринятые в научно-технической литературе (из ГОСТ Р 2.105-2019 «ЕСКД. Общие требования к текстовым документам»). 💯Итак, когда техническому переводчику встречается термин, переводчик ищет соответствующие стандарты. Что это за документы, откуда они берутся, какие бывают и как ими пользоваться?Попробуем разобраться.

Во времена СССР в стране был фактически один хозяйствующий субъект — государство. ✏️Поэтому стандарты были государственными (отсюда аббревиатура ГОСТ) и обязательными. С распадом СССР все поменялось кардинально, но название решили не менять, и многих оно до сих пор путает. 💡Сейчас ситуация в СНГ обстоит примерно так же, как и в остальном мире. Так что дальнейшее описание для России с известными вариациями подходит и для других стран.

🌐В России сферу стандартизации регулируют прежде всего два Федеральных закона: № 184-ФЗ «О техническом регулировании» и № 162-ФЗ «О стандартизации в Российской Федерации».
📎Согласно первому из них, обязательные требования к объектам технического регулирования могут устанавливать только технические регламенты (ст. 2 и 7). Чаще всего это Технические регламенты Таможенного союза (ТР ТС), но есть и техрегламенты Российской Федерации, которые вводятся в действие Федеральными законами. Заметим, что в США аналогичную роль выполняют федеральные нормативные акты (CFR), а в ЕС — директивы и регламенты (Directives и Regulations).
Любые другие документы применяются на добровольной основе, а их требования нужны, чтобы обеспечить/подтвердить соблюдение обязательных требований техрегламентов. Обязательными для конкретного лица они становятся с того момента, когда это лицо заявляет, что реализует обязательные требования (скажем, технического регламента) путем применения данного стандарта или аналогичного документа.
Можно ли найти перевод термина с помощью техрегламентов и аналогичных иностранных документов? Да, можно, но сделать это не очень просто. Для этого надо найти соответствующие друг другу документы на русском и иностранном языке. А значит, надо знать, где искать. Более того, даже очень близкие по тематике документы далеко не всегда «пересекаются» в плане терминологии.

✔️Приведем пример. Допустим, в документации на партию игрушек мы встретили термин aquatic toy.
В Директиве 2009/48/ЕС о безопасности игрушек встречаем такое определение (статья 3, п. 19): ‘aquatic toy’ means a toy intended for use in shallow water which is capable of carrying or supporting a child on the water.
Сравним с определением из ТР ТС 008/2011 «О безопасности игрушек» (статья 2, абзац 7): игрушка для игры на воде — игрушка..., несущая нагрузку массы тела ребенка при плавании и (или) предназначенная для игр на мелководье.
Как видим, определения почти идентичны. А значит, корректным переводом будет такой: aquatic toy = игрушка для игры на воде. Причем напомним — это термин из обязательного к применению документа.
🧑‍💻С техрегламентами и их терминологией вроде бы все ясно. Но что же наши любимые ГОСТы? Об этом далее...

Битва Машин | Восстание переводчиков

11 Oct, 08:50


🔔 Анонс

🆕Краткая ГОСТология:

🔗 Техрегламенты
🔗 Типы стандартов
🔗 Откуда берутся стандарты
🔗Переводные стандарты
🔗 Некоторые примеры перевода
🔗 Постскриптум

Практически все переводчики специальных текстов пользуются стандартами, в частности ГОСТами🤫. Но далеко не все четко представляют себе, что это такое.🆒 Многие уверены: достаточно найти перевод какого-то термина в любом ГОСТе — и дело сделано, можно применять этот перевод. Ведь он есть в стандарте, а стандарт на то и стандарт, что обязателен для всех.

🤓Так ли это? Где на самом деле устанавливаются обязательные требования? Кто, как и зачем пишет ГОСТы? Правда ли, что ГОСТ — это обязательный для всех государственный стандарт? Бывают ли в ГОСТах ошибки? Все ли ГОСТы одинаково полезны и на что стоит обращать внимание переводчику при работе с ГОСТами? На эти темы мы и поговорим в нашем цикле публикаций «Краткая ГОСТология».

Битва Машин | Восстание переводчиков

04 Oct, 08:04


ИИ против редакторов

🆘Переживаете о том, что вас как переводчика может заменить машинный перевод? Забудьте об этом! На горизонте появился новый конкурент — искусственный интеллект 💪.
В июне мы опубликовали пост о том, исчезнет ли профессия переводчика. И вот относительно недавно сразу несколько сайтов разместили по сути одну и ту же новость, но с разными заголовками: «Редакторы и копирайтеры не выдерживают конкуренции с нейросетями» и «Такой текст нам не нужен. Спрос на копирайтеров и редакторов снизился из-за нейросетей».

Эксперты единодушно отмечают:

Нейросети оказывают существенное влияние на рынок труда, особенно в сфере написания текстов, где наблюдается снижение заказов на фриланс-биржах.

😱Спрос на копирайтеров и редакторов на hh.ru с января по август 2024 года упал на 23 % и 44 % соответственно по сравнению с аналогичным периодом 2023 года.

🤑Средние зарплаты также снизились: на 21 % у копирайтеров (до 58 тыс. руб.) и на 13 % у редакторов (до 65,1 тыс. руб.).

👍Но есть и хорошие новости:

Количество вакансий с упоминанием GPT увеличилось более чем вдвое. Зарплаты таких специалистов выровнялись со средними по профессии.🥳

🤩Появляется новая профессия — промпт-инженер, специалист по составлению запросов для нейросетей.

💯Эксперты считают, что копирайтерам и редакторам необходимо освоить работу с нейросетями, чтобы оставаться востребованными.

А как вы считаете, сможет ли ИИ вытеснить человека в сфере работы с текстом? Делитесь вашим мнением в комментариях!💬

Битва Машин | Восстание переводчиков

01 Oct, 09:14


🆒«Клавишники» против «мышастиков»: кто быстрее?

При переводе, редактировании, программировании и аналогичных операциях «горячие» клавиши (или «клавиши быстрого доступа», как они называются в ГОСТ Р 52872-2019) заметно ускоряют нашу работу, позволяя избегать лишних движений.

🐭Мышь следует использовать только в крайних случаях. Конечно, при работе в AutoCAD или Adobe Photoshop многие действия наверняка удобнее выполнять с помощью мыши (или стилуса), хотя и в этих приложениях есть свои удобные сочетания. А вот работать с текстом в таких приложениях, как MS Office, Trados, MemoQ или Phrase (бывший Memsource), с помощью keyboard shortcuts очевидно быстрее (а значит – производительнее).

Казалось бы, пустячная экономия: всего пара мгновений. Но сколько раз мы повторяем эти действия за день? А за месяц? А за год?

Работая в Trados Studio, быстро привыкаешь к «ходовым» сочетаниям клавиш. Например,⌨️ Ctrl+Enter добавляет сегмент в память переводов, а курсор перемещает к следующему неподтвержденному сегменту. 🎹Ctrl+Ins копирует исходный сегмент в перевод, что особенно удобно, если он содержит длинные числа или путаницу тегов. Несмотря на наличие автосохранения, следует почаще сохранять результаты своей работы нажатием 💻Ctrl+S (это действие должно быть просто автоматическим).

Функция поиска соответствий (Concordance) помогает быстро найти подходящие варианты в памяти переводов — достаточно лишь выделить в тексте интересующий нас фрагмент и нажать 💻 F3. Сочетание Ctrl+F2 🖥позволяет оперативно (хотя и с некоторыми сложностями) добавлять новые термины в подключенную термбазу прямо во время перевода.

Быстро экспортировать перевод в исходный формат помогает 👍 Shift+F12. Это важно делать не только в конце работы, но и в самом ее начале: лучше убедиться, что при экспорте файла не будет проблем — это особенно актуально при выполнении срочных заказов.
Есть и ряд других, не менее полезных сочетаний.
Список 🔥«горячих» клавиш Trados, а также подсказка, как назначить/изменить собственные keyboard shortcuts, находится здесь.
🔥А здесь можно найти аналогичный список для Phrase. Правда, он относится в основном к десктопной версии приложения, а функционал WEB-версии в этом отношении существенно беднее.
🔥Для поклонников MemoQ помощь по «горячим» клавишам здесь.

🔥Ну а для тех, кто пока не работает со средствами CAT, а предпочитает старый добрый Microsoft Word, вот список «горячих» клавиш этого популярного приложения с сайта Austin Peay State University.

Делитесь💬, какими удобными сочетаниями клавиш пользуетесь вы!

Битва Машин | Восстание переводчиков

27 Sep, 09:45


После нашей затянувшейся прокрастинации мы снова в строю и предлагаем вам поразмышлять о том, насколько ИИ лучше «традиционного» машинного перевода.

😊В последнее время много говорят об искусственном интеллекте. Есть мнение, что он очень хорош в переводе и превосходит здесь «традиционные» системы машинного перевода вроде Google и DeepL. Так ли это?

Попробуем проверить на простой надписи с пакета чертежей с планировками помещений.

1. Do not scale from this drawing.
2. All dimensions are in millimeters. All dimensions to be verified & approved by the Engineer.
3 This drawing should be read in conjunction with other relevant Architectural, Structural, Mechanical and Electrical Drawings and all relevant sections.
4. All levels are finished floor levels, unless indicated otherwise and confirmed on site.

🧑‍💻 Мы дали ее на перевод нескольким системам ИИ:

✔️GPT-4 Turbo и GPT-3.5-Turbo от OpenAI,
✔️Gemini 1.5 Pro и Gemini 1.0 Pro от Google,
✔️Claude 3 Haiku от Anthropic,
✔️дополнительно обученному чат-боту на базе Gemini 1.5 Flash,
✔️YandexGPT-Lite от Яндекса,
✔️GigaChat Pro от Сбера.

Для сравнения также взяли машинный перевод Google и человеческий перевод.
Хотя надпись и проста на первый взгляд, но в ней есть подводные камни. Разберем по пунктам.

1️⃣. Вот как прокомментировал первую фразу чат-бот: «Do not scale from this drawing» — стандартная фраза на чертежах, которая предупреждает о том, что размеры на чертеже могут быть не точными, и их нельзя использовать для изготовления деталей или проведения строительных работ. Однако это лишь следствие. Российский инженер скорее указал бы причину: чертеж выполнен не в масштабе. Кстати, такую фразу на англоязычных чертежах часто сокращают всего тремя буквами — NTS (not to scale = не в масштабе).

2️⃣. Во втором пункте обращает на себя внимание слово Engineer. Оно указывает не просто на какого-то инженера, а на компанию-проектировщика, на что намекает заглавная буква.

3️⃣. В третьем пункте интересен перечень чертежей (схем). Скажем, Mechanical Drawings здесь — это схемы инженерных коммуникаций (сетей), а не механические схемы. Причем стоит отметить, что в русской технической документации в инженерные системы и сети включаются и электрические, а в англоязычной электрические сети обосабливаются. Так что Mechanical and Electrical Drawings по-русски можно назвать просто схемами инженерных сетей.

4️⃣. В четвертом пункте упоминаемые levels — это конечно же не уровни, а высотные отметки или отметки уровня. И хоть сказано, что они буквально являются уровнями чистого пола (перевод Google), ясно, что они даны относительно этого уровня.

Поймет ли указанные тонкости ИИ? Будет ли он лучше обычного машинного перевода? Для ответа можете посмотреть сравнение переводов. Здесь приведем лишь резюме:
✖️ИИ страдает почти таким же буквализмом, как и традиционный МП.
✖️Качество перевода ИИ и МП отличается незначительно.
Иногда результат ИИ несколько лучше. Так, для 4-го пункта GigaChat выдал: Все отметки уровня относятся к уровню чистового пола.
✖️Иногда наоборот, ИИ хуже. Для того же пункта GPT-3.5-Turbo предлагает перевод Все уровни являются уровнями пола, а Claude 3 Haiku и того хуже: Все уровни являются готовыми полами.
Тем не менее ИИ способен дать дельный комментарий, если хорошо попросить. Правда, не всегда комментарий будет верным, и его всегда надо проверять.

❗️Итог: пока ИИ не дает решающего преимущества при переводе и существенно отстает от человека.

А вы используете ИИ в работе? Делитесь вашими результатами в комментариях💬

Битва Машин | Восстание переводчиков

02 Aug, 08:03


В продолжение темы Тасдика Мемуру...

В юридическом тексте встретился город s-Gravenhage. Переводчик транслитерировал его как Гравенхаге 😏
Хотя на самом деле это всем известная Гаага :)

🧑‍💻 Немного истории:

Название «Гаага» происходит от голландского Den Haag, что переводится как «Изгородь» или «Огороженный участок». Это название возникло из-за того, что в прошлом голландские графы огородили часть леса для своей охотничьей резиденции.

В XV веке появилось новое название - «Гравенхаге» (Gravenhage), что означает «Графская ограда». Однако это название не прижилось и сейчас считается устаревшим.

Проверку топонимов при переводе никто не отменял👌

🤓P.S. Дополнительно напомним, что с 1 января 2020 года Нидерланды официально отказались от названия «Голландия».

Битва Машин | Восстание переводчиков

05 Jul, 07:44


🧑‍💻 Пятничный quiz!
Устали от серьезных постов?🥵 Вот вам лингвистическая загадка! 🙂

Бочка, башня, бизнес, труд, заговор, засада... Гром, разрушение и убийство... А еще цветение, очарование, букет... По сути это одно и то же, но по-английски может называться по-разному.

Что же это?🤓

Лингвисты, ваш выход :)
Если нужна подсказка, ставьте 🤔
Ответы пишите в комментариях 💬

Подписаться на канал «Битва машин || Восстание переводчиков»

Битва Машин | Восстание переводчиков

04 Jul, 18:12


Миф 8️⃣. Машинный перевод снижает издержки

Быстро, качественно, дешево: мечта каждого заказчика — получить сразу все составляющие треугольника Хопкинса. И здесь большие надежды возлагают на машинный перевод. ❗️На сайте одной переводческой компании утверждается, что МТ позволяет на 30% сократить издержки при локализации ПО, однако уточняется, что для достижения такого результата требуется правильная настройка системы машинного перевода. О том, почему сегодня сложно обучать движки на тех текстах, которые наводнили современный рынок переводов, мы писали ранее.

Игорь Ашманов, известный российский специалист в области искусственного интеллекта, называет современные нейросети «гладким бредогенератором». 💯И мы нередко убеждаемся в этом на практике.

📌Типичная ситуация:
Клиент выбрал поставщика по цене, отдал ему в перевод руководства по эксплуатации (или любую другую документацию), получил на первый взгляд гладкий и удобочитаемый перевод, однако при более детальном анализе понял, что ему сдали тот самый «гладкий бред». 🆒Наивная вера клиента в то, что поставщик за копейки найдет профессионалов, которые подготовят ему качественный «человеческий» перевод, приводит к финансовым💵 и временным издержкам.

📌Другой случай:

Клиент по понятным причинам хочет снизить издержки📉 и просит предложить более экономный способ выполнения перевода. Как правило, в таких случаях мы предлагаем МП + PEMT. В какой-то момент клиент просит сделать ему еще дешевле💸 — просто «машинку» без какого-либо постредактирования. Хорошо, делаем.
Клиент получает результат, читает текст «по диагонали», говорит, что его все устраивает, и просит делать ему «дешевую машинку» и далее. И через некоторое время начинается самое интересное. 👀
💥Перевод, попав в руки специалистов, в значительной своей части оказывается бредом. Да, предложения выстроены, согласованы, для не особо сведущего человека даже наполнены каким-то смыслом, но для специалиста – непригодный для использования продукт. Работа на базе переведенной машинкой документации останавливается. У клиента начинаются бесконечные встречи-обсуждения, что с этим делать и как решать проблему.🔜 Тратится огромное количество человеко-часов. А далее, как правило, затраты денег и времени (опять простои!) на постредактирование машинного перевода, а иногда и на перевод «с нуля». И в итоге – куча потраченного времени, никакого снижения издержек, а наоборот – лишние необоснованные затраты, которых можно было бы легко избежать...

Как говорится, 🔣if you think that competence is expensive, then try incompetence - it will cost you much more🔣, или скупой платит дважды.

Подписаться на канал «Битва машин || Восстание переводчиков»

Битва Машин | Восстание переводчиков

24 Jun, 09:20


Один из подписчиков как-то отметил: 🔣Машина сможет полностью заменить человека, когда исходные тексты станут идеальными (написаны носителями, которые разбираются в том, о чем пишут, без ошибок любого рода, с правильной и единообразной терминологией, с четко выраженными мыслями, без воды...)

К сожалению, таких текстов сейчас совсем мало
🔣

О том, с какими текстами приходится работать сейчас, читайте мнение нашего редактора в заметке «Китайская грамота и ПиСихуд». Здесь вы узнаете, что такое Safty-CAN, heating catnode и marine protection device, а также разгадаете загадку писихуда)))

А о требованиях к подготовке текстов, которые планируется переводить машинкой, мы писали ранее.

Битва Машин | Восстание переводчиков

21 Jun, 07:38


Возвращаемся к разоблачению мифов.

Миф 7️⃣. Для постредактирования машинного перевода можно привлекать просто лингвистов

🫠Многие настолько уверовали в силу машинного перевода, что стали утверждать, будто для его постредактирования можно привлекать просто лингвистов.

Проведем эксперимент 🔍. Вот вам несколько фраз на английском и их перевод, выполненный машинкой. Попробуйте устранить ошибки. Ответы пишите в комментариях 💬:

📌All of our logging systems are OEM supported and factory calibrated within a rigorous lSO quality management framework, no other supplier can match that.

Все наши системы регистрации поддерживаются OEM-производителями и калибруются на заводе в рамках строгой системы управления качеством ISO, ни один другой поставщик не может сравниться с этим.

📌The circuit protector provides reliable, low-cost power switching, circuit protection and circuit control. The handle opens and closes a circuit, under normal load conditions, similar to an ON-OFF switch.

Протектор цепи обеспечивает надежное, недорогое переключение питания, защиту цепи и управление цепью. Ручка открывает и замыкает цепь при нормальных условиях нагрузки, подобно переключателю ON-OFF.

📌Automatic DC/AC switch & DC floating

Автоматический переключатель постоянного/переменного тока и плавающий постоянный ток

А есть еще тексты, написанные на чинглише…

Очевидно, что знаний даже дипломированного лингвиста может быть недостаточно для того, чтобы исправить подобные ошибки машинного перевода. Причем опасность его состоит еще и в том, что текст после машинки может настолько гладко читаться, что выданный машинкой бред проходит на ура.

💡Машинный перевод не просто не снизил требования к квалификации переводчика (как хотелось бы некоторым), а наоборот, повысил их: тот, кто работает с результатом машинной выдачи, должен прекрасно разбираться в тематике.

Битва Машин | Восстание переводчиков

11 Jun, 08:46


Продолжаем разговор об искусственном интеллекте

Работая над сложным переводом, хочется иногда иметь под рукой кнопку «Создать шедевр» 🤩 Для кого-то такой кнопкой стал искусственный интеллект, который, словно по мановению волшебной палочки, создает то, о чем его просишь.

Нужен контент-план? Пожалуйста. Хочешь быстро получить какую-то информацию, на сбор которой уйдет куча времени? Не вопрос! Требуется оценить качество перевода? И тут ИИ придет на выручку! Но насколько достоверны выдаваемые им результаты?

Иногда помощь ИИ можно сравнить с тем, как Старик Хоттабыч из одноименной повести-сказки Лазаря Лагина помогал Вольке. Помните испытание по географии? Или матч команд «Зубило» и «Шайба»?)

Как бы ни был хорош ИИ, ему не дано (во всяком случае пока) понять нюансы человеческого языка. Именно об этом — о неспособности ИИ понимать мнение автора — размышляет Сергей Гладков в своей статье A Thought Once Spoken Is a Lie. (The Fundamental Reasons for Uncertainty and Low Inter-Rater Reliability on a Sentence Level).

А что вы думаете по этому поводу? 💬Пишите в комментариях!

Битва Машин | Восстание переводчиков

10 Jun, 08:53


😵‍💫Машинка переводит c исходного языка на целевой? Да, но через промежуточный язык, и это важно.

💥Когда вы «скармливаете» какой-то текст движку, то ожидаете, что перевод будет выполнен с исходного языка на целевой. Важно учитывать, что на самом деле перевод практически всегда идет через промежуточный язык. И это английский. Сопоставимых текстов для машинного перевода в парах с английским языком гораздо больше, чем, например, в парах русский – немецкий или китайский – русский. Поэтому и применяется промежуточный английский.

Казалось бы, какая разница? К сожалению, разница есть, и порой серьезная. Ведь в английском, как и во всех языках, слова многозначны. И полученный перевод может быть искажен из-за того, что между ним и вашим исходным текстом произошла подмена смысла.

Продемонстрируем это на нескольких практических примерах перевода с китайского на русский, с которыми пришлось иметь дело.

✔️Китайскую фразу 对腔体进行真空处理 движки передают так: пропылесосить камеру, пропылесосьте полость и т. п. Хотя на самом деле она значит выполняется вакуумирование камеры (речь идет об измерительной камере датчика). Все дело в том, что на промежуточной стадии (в английском языке) возникло слово vacuum, которое означает как пылесосить, так и вакуумировать. Движки выбирают наиболее распространенное значение, которое в нашей ситуации оказалось неверным.

✔️В массиве текстов по электромобилям термин 充电站 передавался тремя способами: зарядная станция, станция взимания платы и станция предъявления обвинения. Причина опять в английском, где слово charge имеет все три значения: заряжать, взимать плату и предъявлять обвинение. Хотя правильным в данном контексте было, конечно, только первое.

✔️В угловом штампе документа термин 初审 один из движков передал так: первый случай. Хотя это было обозначение первой редакции документа. Искажение опять из-за английского, где возникает ненужный юридический контекст (preliminary hearing = первое/предварительное слушание [дела]).

✔️Надпись на схеме 过程材质 движок переводит как материал для обработки, хотя был указан материал, контактирующий со средой. Искажение из-за английского process во фразе process material. Более корректным был бы перевод на английский wetted material, но движок выбирает process material, а далее переводит process на русский не как технологический/принадлежащий к технологической среде, а как обработка/подлежащий обработке.

✔️Заголовок 功能与系统设计 был переведен так: Функциональность и дизайн системы. Хотя означал Функционал и конструкция изделий. Искажение из-за многозначности английского design, тогда как в русском слово дизайн означает лишь проектирование художественных форм, внешнего вида изделий промышленности, фасадов зданий, интерьеров помещений и т. п. или художественное оформление, что совсем не то же самое, что конструкция.

⚡️Вывод из вышесказанного такой: если в машинном переводе в языковой паре, не включающей английский, вы встретили странный или подозрительный перевод, подумайте, какое значение могло быть привнесено на промежуточном этапе, когда исходный текст был переведен на английский язык или с английского языка на целевой. Это поможет разобраться со странностью переводного текста и выявить правильный смысл.

☀️Это было разоблачение мифа 6️⃣

Битва Машин | Восстание переводчиков

05 Jun, 13:03


😨Переводчики под угрозой исчезновения?

В предыдущем посте мы отметили, что ни один движок не переведет правильно текст, содержащий смысловую ошибку.

В качестве эксперимента дали задание ИИ найти смысловую ошибку во фразе Keep the vehicle moving at a constant speed (The car starts when the speed is greater than 40km/h).

🫡Вот ответ ИИ:

1. "Keep the vehicle moving at a constant speed" - означает "поддерживайте постоянную скорость транспортного средства".
2. "(The car starts when the speed is greater than 40km/h)" - означает "машина заводится, когда скорость превышает 40 км/ч".
Противоречие в том, что невозможно *поддерживать* скорость в 40 км/ч, если машина *заводится* только после достижения этой скорости.
Скорее всего, второе предложение должно описывать не момент *запуска двигателя*, а условие *активации* какой-то функции, которая работает только на скорости выше 40 км/ч.


Согласитесь, неплохо. Неужели ИИ и машинный перевод заменят переводчика?

Николай Долгополов в статье «Профессия переводчика может остаться в прошлом» приходит к неутешительному выводу: «...с годами профессия переводчика превратится в штучную. Компьютер подомнет ее под себя. Как и многие другие, кажущиеся нам сейчас незаменимыми».

Иную точку зрения высказал руководитель лаборатории машинного интеллекта «Яндекса» Александр Крайнов на Конгрессе молодых ученых. По его мнению, роль переводчика постепенно видоизменится: вместо непосредственно перевода он будет учить ИИ максимально точно переводить те или иные фразы.

🗣️Искусственный интеллект суперхорош в узких задачах. Он внимательный, он никогда не устает, всегда последователен в своих решениях. Но он тупой и будет таким еще очень долго🗣️, — считает Крайнов.

Безусловно, учитывая все те ошибки, которые сегодня допускают движки машинного перевода, переводчики еще долго будут востребованы, а выполненные ими переводы будут служить образцами для обучения ИИ.

Наступит ли тот день, когда машина полностью заменит человека и в переводческой отрасли? 💬Делитесь вашим мнением в комментариях!

Битва Машин | Восстание переводчиков

04 Jun, 09:21


Наши публикации, посвященные мифам о машинном переводе, перевалили за экватор. Сегодня мы разоблачаем очередной миф.
Миф 5️⃣. При машинном переводе сохраняется смысл

ℹ️Примерно год назад в интернете появилась новость: 🔣EU gives more power to AI translation machines - The European Commission has launched a pilot project to translate some press releases without any human oversight🔣. Новый проект позволит читателям получить практически мгновенный доступ к пресс-релизам комиссии, написанным на каждом из 24 официальных языков ЕС, в том числе венгерском.

👨‍💻Наш опыт работы с этим языком показывает, что не все движки успешно справляются с ним даже при переводе простых фраз:

Büntetlen előéletű
Nem áll közügyektől eltiltás hatálya alatt
Nem áll foglalkozástól vagy tevékenységtől eltiltás hatálya alatt

📱Вариант Google
У него есть судимость
Он не подпадает под запрет на участие в общественных делах.
Он не подлежит запрету на занятие или деятельность.

🔠Вариант DeepL
Отсутствие судимости
Не подвергался дисквалификации за занятие государственной должности
Не подвергался дисквалификации за какую-либо профессию или деятельность

Нет единства относительно судимости и у других движков 👀

Так, ModernMT переводит фразу Büntetlen előéletű как Нет судимости, а Microsoft Translator считает, что это лицо, впервые совершившее правонарушение.

Интересно, что конкретно в этом случае правильный перевод 📱 Google выдает, если все написать прописными буквами...

🥺Однако смысл перевирают не только движки, но и авторы исходных текстов. Keep the vehicle moving at a constant speed (The car starts when the speed is greater than 40km/h) — ни один движок не передаст вам точно смысл того, что здесь написано, так как изначально текст содержит ошибку: автомобиль не может начинать движение со скорости 40 км/ч.

🤫Исключить подобные ошибки можно лишь при проверке перевода: зреть в корень пока может только человек.

Битва Машин | Восстание переводчиков

31 May, 14:41


Продолжаем разоблачать мифы о машинном переводе.

Миф
4️⃣. Машинный перевод не содержит ошибок правописания

🔣Орфографические ошибки в письме — как клоп на белой блузке🔣. Фаина Раневская

😱Несмотря на активное развитие технологий, машинный перевод по-прежнему допускает орфографические и грамматические ошибки. Причина этого в материалах, на которых учатся движки. Датасеты составляют люди, а они, к сожалению, не всегда пишут без ошибок.

Чтобы убедиться в этом, достаточно заглянуть в Национальный корпус русского языка. Введем в строку поиска «в течении» и получим немалое количество примеров неправильного употребления этого предлога.

😱Но иногда движки не просто ошибаются в правописании, а идут дальше и занимаются настоящим словотворчеством 😄
Примеры ошибок и придуманных движками слов — в первом комментарии.

И хотя орфографические ошибки в машинном переводе — одна из самых легко устраняемых проблем, у проверки орфографии тоже есть свои нюансы: важно правильно задать язык, настроить работу с гиперссылками, отключить (если включен) пропуск слов, написанных прописными… Например, чтобы при проверке орфографии в Trados’е отслеживались слова, в которых должна быть буква ё, необходимо в самом Trados’е в качестве средства для проверки орфографии выбрать MS Office, а в MS Office в настройках правописания поставить флажок Русский: требовать точного использования ё.

💬Уверены, вы тоже сталкивались с подобными ошибками. Делитесь в комментариях!

1,406

subscribers

157

photos

9

videos