Об этом же в других СМИ

habr.com / 2 года назад

VK запустит аналог платформы Google Classroom для работы репетиторов

habr.com / 2 года назад

«Ведомости»: «Элемент» в 2025 году начнёт выпуск компонентов для базовых станций

habr.com / 2 года назад

Telegram запустил TON Dating — сервис для знакомств, разработанный на блокчейне TON

habr.com / 2 года назад

«Росэлектроника» разработала устройство «три в одном» для криптозащиты сетей спецсвязи

habr.com / 2 года назад

Для иностранцев в России хотят ввести ограничения на покупку SIM-карт

Больше по теме

07.06.2024 - 04:41 / habr.com

«Яндекс» разрабатывает единую нейросеть для речи и текста

«Яндекс» работает над ещё не анонсированной нейросетевой моделью SpeechGPT и нанимает в соответствующую команду инженера в области машинного обучения, говорится в разделе вакансий компании. На это обратил внимание «Ъ». Речь идёт о мультимодальной модели (то есть способной обрабатывать разные виды вводных данных), которая «умеет воспринимать текст и звук, отвечать текстом и звуком, решать разные задачи на стыке текста и звука».

В «Яндексе» пояснили, что работают над мультимодальностью в ассистенте «Алиса» и других сервисах. На вопрос о модели SpeechGPT в компании не ответили.

Некоторые нейросетевые сервисы «Яндекса» уже позволяют принимать вводные данные разных видов. С ассистентом «Алиса» можно общаться как голосом, так и текстом; в декабре 2023 года компания сделала отдельный подраздел сайта с текстовым чатом. В последних числах мая «Яндекс» схожим образом расширил функциональность сервиса Yandex SpeechSense: изначально созданный для анализа работы кол‑центров сервис получил возможность обрабатывать и текстовые сообщения. Возможность обрабатывать одновременно текст и картинки есть в сервисе «Нейро».

Но между мультимодальным пользовательским опытом и мультимодальностью самой модели есть разница, объясняет сооснователь Just AI Кирилл Петров. В первом случае зачастую происходит перевод данных из одного вида в другой: «Например, в случае с голосовым ассистентом речь сначала одной моделью преобразовывается в текст, этот текст анализируется другой моделью, а третья модель преобразовывает текст ответа в речь. На каждом шаге происходит упрощение, а ещё вся обработка занимает больше времени». Мультимодальные же модели вроде GPT-4o от OpenAI позволяют учитывать весь контент, причём без задержек.

Мультимодальные модели с поддержкой

продукты технологии самит google Психология и отношения Кирилл Петров LizzieSimpson

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

VK запустила сервис для тестирования и анализа новых функций в приложениях и сайтах habr.com / 2 года назад

ТАСС: «Яндекс» создаст отдельный бренд для беспилотных автомобилей habr.com / 2 года назад

Три транзистора для силовой электроники от «Микрона» включили в реестр Минпромторга РФ habr.com / 2 года назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 14:50

promo ByDex — современный сервис для работы с USDT, QR-платежей и виртуальных карт

Цифровые активы становятся все более востребованным

22.07 / 14:47

Samsung технологии Складные смартфоны Встречайте: Galaxy Z Fold 8 Ultra — бескомпромиссный складной флагман Samsung с улучшенным экраном и мощным охлаждением

В дополнение к базовому складному смартфону 2026 года Galaxy Z Fold 8, который получил новый форм-фактор, Samsung представила и флагманскую Ultra-модель. Она заинтересует тех пользователей, которые хотят получить прирост производительности и автономности и при этом не планируют привыкать к переработанному соотношению сторон.

22.07 / 14:39

бизнес продукты самит google gemini Google представила сразу три новые ИИ-модели Gemini: акцент сделан на программирование, анализ данных и кибербезопасность

Анонс стал частью стратегии Google по активному развитию собственной ИИ-экосистемы на фоне усиливающейся конкуренции с OpenAI, Anthropic, Microsoft и xAI. Новые модели призваны предложить разработчикам более высокую производительность, снизить стоимость вычислений и расширить возможности автоматизации.

22.07 / 14:23

экономика общество прогноз инвестор google CEO JPMorgan увидел недооцененные риски для рынков и сделал новый прогноз относительно эпохи ИИ

Генеральный директор JPMorgan Chase Джейми Даймон заявил, что инвесторы недооценивают геополитические и фискальные риски для мировой экономики, пишет CNBC. По его мнению, нынешние оценки акций и долгосрочных казначейских облигаций США не учитывают в полной мере потенциальные потрясения, что может иметь значение как для традиционных, так и для криптовалютных рынков, которые все чаще реагируют на макроэкономические факторы. Среди ключевых угроз он назвал войны в Украине и на Ближнем Востоке, напряженность между США и Китаем, а также рост военных расходов на фоне рекордных бюджетных дефицитов. США объединили ИИ-гигантов OpenAI, Anthropic и Google против Китая 08.04.2026 Читать США пригрозили санкциями китайским ИИ-компаниям 22.07.2026 Читать По словам банкира, даже если часть этих рисков уже учтена в

22.07 / 14:15

Samsung технологии звезда Широкоформатная база: Samsung представила Galaxy Z Fold 8 — переосмысленный складной смартфон в новом форм-факторе

Состоялась презентация Galaxy Unpacked, на которой Samsung представила свои флагманские новинки. Главной звездой ивента несомненно стал Galaxy Z Fold 8 — складной смартфон, который является базовой моделью 2026 года и получил совершенно новый форм-фактор: теперь это широкоформатный гаджет, который станет конкурентом Pura X Max и еще непредставленному iPhone Ultra.

22.07 / 14:07

люди животные общество самит профессор Почему собаки имитируют половой акт – причины странного поведения

Согласно выводам исследователей, в подавляющем большинстве случаев (около 65%) собачьи садки происходят без очевидной причины.

22.07 / 14:07

связь ученые животные общество книги Собаки ревнуют хозяев: эксперимент разрушил давний научный миф

Привычная реакция собак на внимание хозяина может скрывать чувство, которое долго считали исключительно человеческим.

22.07 / 14:07

люди здоровье общество вода Здоровье и красота Как холодная вода влияет на пищеварение и организм – врач

Чтобы избежать спазмов, вздутия и головной боли в жаркие дни, врач советует отказаться от ледяных напитков.

22.07 / 14:05

история общество Luna OpenAI зашифровала внутренние инструкции Codex

OpenAI обновила работу ИИ-агента Codex. Теперь внутренние инструкции, которые он передаёт субагентам, отображаются в истории сессии в зашифрованном виде.

22.07 / 13:56

связь технологии происшествия СМИ общество «Бюро 1440»: состоялся второй пакетный запуск космических аппаратов низкоорбитальной группировки «Рассвет»

Российская аэрокосмическая компания «Бюро 1440» (занимается разработкой низкоорбитальной спутниковой группировки и планирует предоставление услуг широкополосной передачи данных с глобальным покрытием, входит в «ИКС Холдинг») провела второй пакетный запуск низкоорбитальной спутниковой группировки для услуг связи нового поколения.

Лента новостей

На главную страницу