Об этом же в других СМИ

habr.com / 1 год назад

Alibaba представляет Qwen3, семейство «гибридных» моделей рассуждений AI

habr.com / 1 год назад

Moonshot AI представляет Kimi-VL: мощную модель ИИ для обработки текста, изображений и видео

habr.com / 1 год назад

Языковые модели ИИ тестируют на способность рассуждать в игре «Phoenix Wright: Ace Attorney»

habr.com / 1 год назад

Новые модели Baidu Ernie конкурируют с Deepseek и OpenAI по сверхнизким ценам

habr.com / 1 год назад

Adobe выпускает новые модели создания изображений Firefly и обновлённое веб-приложение Firefly

Больше по теме

11.04.2025 - 06:21 / habr.com

Гибридные модели ИИ от Deep Cogito: баланс между скоростью и рассуждением

Новая компания Deep Cogito появилась из ниоткуда с семейством общедоступных моделей ИИ, которые можно переключать между «рассуждающим» и «нерассуждающим» режимами.

Модели рассуждения, подобные o1 от OpenAI, показали большие перспективы в таких областях, как математика и физика, благодаря их способности эффективно проверять факты, шаг за шагом решая сложные задачи.

Однако за такое рассуждение приходится расплачиваться более высокими вычислительными затратами и задержкой. Вот почему лаборатории, такие как Anthropic, разрабатывают «гибридные» архитектуры моделей, которые сочетают компоненты для рассуждений со стандартными, нерассуждающими элементами. Гибридные модели могут быстро отвечать на простые вопросы, затрачивая дополнительное время на рассмотрение более сложных запросов.

Все модели Deep Cogito, называемые Cogito 1, являются гибридными моделями. Компания Cogito утверждает, что они превосходят лучшие открытые модели того же размера, в том числе модели Meta* и китайского стартапа DeepSeek.

«Каждая модель может отвечать напрямую […] или проводить самоанализ перед ответом (как модели-рассуждения)», — пояснила компания в своём блоге. «Все модели были разработаны небольшой командой примерно за 75 дней».

Модели Cogito 1 имеют от 3 до 70 миллиардов параметров, и Cogito заявляет, что в ближайшие недели и месяцы к ним присоединятся модели с 671 миллиардом параметров. Количество параметров примерно соответствует навыкам модели в решении задач, и чем их больше, тем лучше.

Cogito 1 не разрабатывался с нуля. Deep Cogito создан на основе открытых моделей Meta Llama и Alibaba Qwen. Компания заявляет, что применила новые подходы к обучению, чтобы повысить производительность базовых моделей и обеспечить возможность переключения между

продукты технологии LinkedIn общество самит стартап google mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Модель ИИ VACE от Alibaba стремится стать универсальным инструментом для работы с видео habr.com / 1 год назад

Проблемы с использованием моделей Anthropic через AWS Bedrock habr.com / 1 год назад

Новые языковые модели от OpenAI оставляют скрытые водяные знаки в сгенерированном тексте habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

05.07 / 10:21

технологии самит Hisense представила бюджетные мониторы N3G Pro с IPS-экраном и частотой 180 Гц

Серия включает две модели — с диагональю 23,8 и 27 дюймов. Продажи стартуют 9 июля. На этапе запуска стоимость составит 449 юаней (около 65 долларов) за 23,8-дюймовую версию и 549 юаней (примерно 80 долларов) за модель с экраном 27 дюймов.

05.07 / 10:09

связь люди ученые здоровье человек Неочевидную пользу зеленого чая назвали ученые

Ученые пришли к выводу, что зеленый чай может играть более важную роль для здоровья, чем считалось ранее.

05.07 / 10:09

туризм общество климат курорт жара Туристы массово бегут из Европы во время жары в новое место

Европейские туристы, уставшие от аномальной волны жары дома, предпочитают отдыхать в необычных местах.

05.07 / 10:04

Amazon биологи кибератаки правительство Claude Fable 5 разблокировали — модель вновь доступна в API и подписках по промо-периоду

Claude Fable 5 вернулась к пользователям 1 июля после 19 дней блокировки. Модель снова работает в API по стандартным тарифам, а в подписках Anthropic запустила промо-акцию: до 7 июля Fable 5 доступна на всех платных планах. Тратить на нее можно до 50% недельного лимита, после чего придется переключиться на другую модель или докупать usage credits — условия описаны в справке.

05.07 / 09:52

технологии здоровье общество велоспорт мода и стиль Rogbid представила легкий безэкранный фитнес-браслет Loop Air с функциями ЭКГ и GPS

Китайский бренд Rogbid выпустил фитнес-браслет Loop Air. Устройство создано без традиционного дисплея и ориентировано на пользователей, которые хотят отслеживать показатели здоровья, не отвлекаясь на экран умных часов.

05.07 / 09:42

смартфон зарядка мобильный телефон аккумулятор гаджет Это приложение разряжает даже выключенный телефон: мало кто об этом знает

Функция определения геолокации, так называемый GPS-трекер, – на самом деле одна из самых полезных в современном смартфоне. Она необходима для полноценного использования карт и множества сервисов – от служб доставки и такси до фитнес-приложений и сервисов погоды. Но у GPS есть и серьезный минус – он сильно разряжает аккумулятор, даже когда телефон находится в режиме покоя.

05.07 / 09:39

Apple кибератаки Apple исправила несколько десятков уязвимостей в своих ОС, часть из которых нашли с помощью Claude и Codex

Apple выпустила большое обновление безопасности для своих операционных систем, браузера Safari и движка WebKit, закрыв сразу несколько десятков уязвимостей. Часть из них исследователи нашли с помощью нейросетевых инструментов от Anthropic и OpenAI.

05.07 / 09:39

история CAD Fable 5 уже может заменить фрилансеров на 16% реальных заказов — рост в 6 раз за 8 месяцев

Center for AI Safety (CAIS) и Scale Labs обновили результаты Remote Labor Index (RLI) — бенчмарка, который проверяет ИИ-агентов не на синтетических тестах, а на настоящих фриланс-заказах: 3D и CAD, архитектура, дизайн, видео и анимация, аудио, аналитика данных, веб-приложения. Живой эксперт сравнивает работу агента с эталонной работой оплаченного профессионала, и решает, справился ли ИИ. Новая модель Claude Fable 5 показала лучший результат за всю историю теста по ключевой метрике automation rate (доля проектов, принятых как минимум наравне с человеческой работой) — 16,1%. Это почти вдвое больше, чем у Opus 4.8 (8,3%), и еще больше, чем у GPT-5.5 (6,3%).

05.07 / 09:39

люди политика ЕГЭ самит школы Минпросвещения: выпускники, набравшие 200 баллов по любым двум предметам ЕГЭ, получат мобильные номера с комбинацией 555

Школьники из РФ, набравшие 200 баллов по любым двум предметам ЕГЭ, смогут получить специальные мобильные номера с комбинацией из трёх пятёрок, сообщается на официальном сайте Минпросвещения РФ.

05.07 / 09:30

продукты самит человек кухня Ошибки с кухонным мусорным ведром, которые допускает почти каждый

Специалисты объяснили, какие привычки незаметно усиливают неприятный запах и как этого избежать без лишних затрат.

Лента новостей

На главную страницу