

Google представила новый открытый набор ИИ-моделей для перевода
Новое семейство моделей под названием Google TranslateGemma поддерживает 55 языков, включая украинский, и предлагается в трех вариантах: 4B — оптимизирована для смартфонов, 12B — для ноутбуков, 27B — для облачных серверов.
В основе моделей лежит Gemma 3, к которой применили контролируемую точную настройку (SFT) на разнообразных данных: сочетание человеческих переводов и синтетических переводов от Gemini. По словам Google, такой подход обеспечил широкий охват языков, включая редкие и с низким ресурсным обеспечением. Дополнительно модели были доработаны с использованием обучения с подкреплением (RL), что повысило точность переводов.
Качество работы оценивалось с помощью метрики MetricX, фиксирующей ошибки перевода. Меньшие значения означают меньше ошибок: так, модель TranslateGemma на 12 млрд параметров показала 3,60 балла, опередив 27-миллиардную базовую модель с 4,04 балла (примерно на 26% меньше ошибок).
Кроме того, новые модели обучены на 55 основных языковых парах, включая испанский, французский, китайский, хинди и другие, а также почти на 500 дополнительных парах. Примечательно, что ИИ способен не только переводить текст, но и работать с изображениями: распознавать текст на сканах, скриншотах, фотографиях и выполнять перевод прямо с этих источников.
blog.google
Читать на ilenta.com