Об этом же в других СМИ

gagadget.com / 2 года назад

Mobvoi представила новую версию TicWatch Pro 5 Enduro

hitechexpert.top / 2 года назад

Google представит новую серию Pixel 9 раньше

Больше по теме

14.06.2024 - 06:05 / habr.com

Яндекс представил новую версию машинного перевода, обученную с помощью YandexGPT

Мы впервые применили большую языковую модель YandexGPT для подготовки эталонных примеров текстов, на которых затем обучили нейросеть в Яндекс Переводчике. Это позволило сервису точнее понимать контекст, распознавать фразеологизмы и ориентироваться в профессиональной лексике.

Переводчик стал качественнее справляться с длинными и сложными текстами. Благодаря дообучению он лучше определяет взаимосвязи внутри предложений и между ними. Кроме того, выросло качество перевода статей узконаправленной тематики. Например, сервис теперь поймёт по контексту, что речь идёт о языке программирования или фондовом индексе, и оставит их названия без перевода.

Яндекс использует технологию машинного перевода на основе нейросетей с 2018 года: есть даже статья на Хабре в нашем блоге. Нейросеть в Переводчике обучается на парах текстов — оригиналах и их переводе на другой язык. Так она учится видеть взаимосвязи между ними и подражать им. Причём это очень быстрая, легковесная нейросеть: это позволяет ей справляться с большим количеством пользовательских запросов в реальном времени.

Большая языковая модель YandexGPT требует больше ресурсов, работает медленнее, но зато способна генерировать сложные, лексически и стилистически разнообразные тексты, в том числе со специфической терминологией. Поэтому мы применили её для создания эталонных примеров, чтобы расширить датасет и повысить его качество. Так более лёгкая нейросеть в Переводчике, обученная на новом датасете, не потеряла в скорости, но стала умнее.

Для генерации эталонных обучающих примеров мы разработали специализированную модель семейства YandexGPT, адаптировав её под задачи перевода. Сначала модель на этапе предобучения (pretraining) проанализировала множество текстов на английском и русском

технологии Яндекс

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Тайвань представил новый 105-мм истребитель танков под названием D2 gagadget.com / 2 года назад

«Сбер» выпустил новую версию мобильного приложения для iOS под названием «Умный Онлайн» habr.com / 2 года назад

«Роса» выпустила новую версию платформы оркестрации ОС и ПО с возможностью миграции с Windows на российские системы habr.com / 2 года назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

26.07 / 18:13

связь здоровье алкоголь общество самит Когда стоит отказаться от алкоголя: назван лучший возраст

С возрастом спиртное сильнее влияет на мозг и координацию, поэтому в определенный момент от него рекомендуют отказаться полностью.

26.07 / 18:12

технологии Apple семья доллар курс Ugreen выпустила тонкий Bluetooth-трекер для кошелька: он работает с Apple Find My и Google Find Hub

Стоимость Ugreen FineTrack Slim Duo 2 в США составляет 29,99 доллара, что по актуальному курсу соответствует примерно 1250 грн. В странах еврозоны устройство предлагается по цене от 29,99 евро (около 1460 грн). Продажи стартовали через Amazon и других официальных партнеров производителя.

26.07 / 17:24

общество самит доллар курс Дом и интерьер Спустя почти 30 лет ожидания домен .web официально стал частью интернета: когда его смогут зарегистрировать пользователи

Официальное объявление Verisign подтверждает, что многолетняя история судебных разбирательств и корпоративных споров завершилась. По данным Gizmodo и отраслевого издания Domain Incite, именно юридические конфликты почти на десять лет затормозили запуск одной из самых обсуждаемых доменных зон.

26.07 / 17:12

происшествия музыка общество самит человек Наушники медленно убивают слух: какие ошибки могут стать необратимыми

Главную угрозу для слуха представляет не само использование наушников, а привычки, которые постепенно повреждают внутреннее ухо.

26.07 / 17:12

медицина общество человек врачи мозг Что такое биологические часы и как они незаметно управляют организмом

Нарушение привычного режима способно сбить внутренние ритмы и повлиять сразу на несколько важных процессов в организме.

26.07 / 17:00

происшествия Apple конференция журналист Bloomberg: скандал вокруг очков Meta повлиял на планы Apple — компания озабочена конфиденциальностью и даже может отказаться от камер в своем девайсе

Марк Гурман неоднократно делился информацией, что Apple работает над легкими смарт-очками, которые заменят в ее линейке громоздкую, невероятно дорогую и непопулярную AR-гарнитуру Apple Vision Pro. Он упоминал, что в ходе внутреннего тестирования в разработке остались только две модели очков: с дисплеем и без него, причем первый вариант должен дебютировать уже в следующем году. Теперь же журналист Bloomberg опубликовал свежую информацию, которая проливает свет на один из факторов, неожиданно затруднивший выпуск девайса.

26.07 / 16:32

связь Apple деньги мозг работодатель “Будущее в твоем разуме” — Apple показала тизер экранизации культового киберпанк-романа “Нейромант”

Киноподразделение Apple представило первый тизер сериала “Нейромант” (Neuromancer), основанного на культовом романе Уильяма Гибсона (William Gibson), который заложил основы киберпанка и сделал жанр популярным в массовой культуре.

26.07 / 15:55

происшествия общество курьез Полиция Похоронен заживо: как пьяный водитель обманул полицию Китая

Житель Китая решил инсценировать собственную кончину, чтобы избежать тюремного срока. Мужчина ранее уже задерживался за вождение в нетрезвом виде.

26.07 / 15:45

происшествия курс Anthropic выпустили плагин Claude Security для многоагентного поиска уязвимостей

Anthropic сделали Claude Security доступным в виде официального плагина для Claude Code. Он запускает многоагентное сканирование кодовой базы непосредственно в локальной сессии и доступен пользователям платных тарифов.

26.07 / 15:13

технологии закон история самит расследование Секретный идентификатор Windows помог вычислить хакера: что известно о скрытом механизме Microsoft

После того как материалы дела «Соединенные Штаты против Питера Стоукса» были частично рассекречены федеральным судом США, корпорация впервые официально подтвердила наличие такого механизма. До этого упоминания о GDID встречались лишь в крайне ограниченной технической документации Microsoft, не объяснявшей принцип его работы.

Лента новостей

На главную страницу