Об этом же в других СМИ

habr.com / 1 год назад

Volvo интегрирует в свои автомобили языковую модель Gemini от Google

habr.com / 1 год назад

«Яндекс»: китайская языковая модель DeepSeek может усилить конкуренцию в сфере ИИ

habr.com / 1 год назад

Microsoft открыла исходный код консольного текстового редактора Edit

habr.com / 1 год назад

Нейросетевой ассистент от JetBrains стал доступен в виде плагина для VS Code

habr.com / 1 год назад

Microsoft открыла исходный код подсистемы Windows для Linux (WSL) под лицензией MIT

Больше по теме

06.05.2025 - 11:15 / habr.com

Microsoft выпустила Phi-4 — семейство компактных рассуждающих языковых моделей с открытым исходным кодом

Microsoft представила семейство компактных рассуждающих языковых моделей Phi-4. Продвинутая версия в некоторых бенчмарках превосходит DeepSeek-R1, GPT o1 и Claude-3.7-Sonnet. Код моделей и веса доступны на Hugging Face.

В релиз вошли три языковые модели, которые разработали на основе базовой версии Phi-4:

Phi-4-reasoning — рассуждающая языковая модель с контекстным окном в 32 тыс. токенов и 14 млрд параметров. Её обучили на датасете из «высококачественных» веб-данных и сгенерированных в GPT o3 промптах.

Phi-4-reasoning-plus — дообученная версия Phi-4-reasoning с сопоставимым количеством параметров и размером контекстного окна. Модель генерирует более точные ответы.

Phi-4-mini-reasoning — небольшая рассуждающая модель, обученная на синтетических математических данных, которые сгенерировали с помощью Deepseek-R1. Размер модели всего 3,8 млрд параметров, что позволяет запускать её даже на мобильных устройствах. Например, Phi-4-mini-reasoning может стать персональным чат-ботом для изучения математики.

В качестве аппаратной платформы для файн-тюнинга версий reasoning и reasoning-plus использовали кластер из 32 видеоускорителей Nvidia H100 с 80 ГБ. Модель mini-reasoning обучали на 128 ускорителях. Сам процесс обучения занял около двух дней для каждой нейросети.

Microsoft протестировала семейство моделей Phi-4 в различных бенчмарках, включая математические. В тестах AIME 24 и 25 Phi-4-reasoning-plus с 14 млрд параметров оказывается производительнее DeepSeek-R1 с 617 млрд параметров и MoE-архитектурой. Также модель сопоставима с o3-mini, но сильно уступает Gemini-2.5-Pro.

В бенчмарках ArenaHard, HumanEvalPlus, MMLUPro, Kitab, Toxigen Discriminative и PhiBench 2.21 модели reasoning и reasoning-plus превосходят GTP-4o, но практически

Nvidia самит крипто daniilshat Microsoft

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Meta* откладывает запуск мощной языковой модели ИИ Behemoth habr.com / 1 год назад

Canonical в течение года пожертвует $120 тысяч разработчикам открытого исходного кода habr.com / 1 год назад

Релиз видеоредактора с открытым исходным кодом Shotcut 25.05 habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 07:53

экономика закон отпуск самит инвалидность Сотрудники Meta обвинили компанию в увольнениях ИИ-ассистентами

Группа из 26 нынешних и бывших сотрудников Meta подала иск в федеральный суд Северного округа Калифорнии, обвинив компанию в использовании систем искусственного интеллекта для отбора сотрудников во время массовых сокращений в мае 2026 года. Истцы утверждают, что алгоритмы непропорционально часто выбирали для увольнения сотрудников, которые находились в медицинском, семейном или декретном отпуске либо имели инвалидность. В Meta отвергли обвинения, заявив, что кадровые решения принимали люди, а не искус

15.07 / 07:53

санкции Центробанк политика финансирование google Tether заморозила связанные с Ираном $131 млн

Компания Tether заморозила 131 млн USDT на четырех адресах в сети TRON. Позднее оказалось, что эти кошельки попали в санкционный список Управления по контролю за иностранными активами (OFAC) США. В числе первых о заморозке сообщил аналитик Specter. По его словам, активы на кошельки поступили с площадок DTC Pay и Bitso. Речь идет о следующих адресах: TXGHxdYbGy574z5hBu4LNzq9NzjZQ9bhUf — $12,3 млн; TJdgB1k6ot3f2

15.07 / 07:51

продукты питания история общество роды еда Почему неандертальцы проиграли кухне: новые выводы ученых

Накопление определяющих признаков современного человека происходило скачкообразно. Длительные периоды покоя внезапно прерывались вспышками мутаций.

15.07 / 07:51

животные общество природа курьез животный мир Опасное селфи – бизон атаковал пенсионера в Йеллоустоуне (ВИДЕО)

Бизоны остаются самыми опасными животными для посетителей известного парка Йеллоустон. Ежегодно они калечат десятки невнимательных любителей туризма.

15.07 / 07:51

общество семья мужчина женщина Психология и отношения Как проверить, готов ли ваш партнер к появлению ребенка – психологи

Различия во взглядах на отдых — это тест на зрелость. Перед рождением ребенка важно договориться, ведь эгоизм одного ставит под удар всю семью.

15.07 / 07:41

технологии Amazon бюджет самит Игровой монитор Lenovo Legion 27-10 за 129,90 €: доступные 240 Гц для игры без задержек

Экран, который обновляет изображение 240 раз в секунду, оставаясь при этом в пределах 130 €, не является нормой в этом сегменте. Однако это именно тот случай с Lenovo Legion 27-10, цена которого только что снизилась до 129,90 €, что привлекает внимание тех, кто хочет перейти на следующий уровень, не пересматривая весь бюджет на настройку.

15.07 / 07:38

экономика Amazon Nvidia AMD AM4 живее всех живых: AMD тихо выпустила 8-ядерный Ryzen 7 4700LE на базе Zen 2

Сокет AM4, представленный еще в 2016 году, продолжает бить все рекорды долговечности. AMD в очередной раз решила задействовать свои кремниевые запасы прошлых лет и без лишнего шума добавила в каталог новый процессор — Ryzen™ 7 4700LE.

15.07 / 07:38

происшествия самит GPT-5.6 Sol в режиме Ultra случайно стёрла все файлы пользователя на Mac, а потом сама призналась в ошибке

ИИ-инвестор и предприниматель Мэтт Шумер рассказал, что нейросеть OpenAI GPT-5.6 Sol в режиме Ultra с полным доступом к системе случайно стёрла все файлы на его рабочем Mac, а потом ИИ признался в ошибке.

15.07 / 07:27

продукты технологии Apple закон стартап Apple подаёт в суд на OpenAI за кражу коммерческой тайны

Apple подала иск в федеральный суд Северной Калифорнии против OpenAI, обвинив компанию в систематической краже коммерческой тайны для ускорения разработки собственного потребительского «железа». В иске утверждается, что OpenAI в течение длительного времени целенаправленно переманивала сотрудников Apple, чтобы получить доступ к конфиденциальным данным о ещё не анонсированных продуктах, компонентах и чертежах.

15.07 / 07:20

смартфоны аксессуары Транспорт Робот-оператор Beni умеет бегать, прыгать и снимать видео

Компания Mondo Robotics, основанная бывшими инженерами DJI, представила Beni — компактного робота с камерой, который способен самостоятельно следовать за человеком или домашним питомцем, снимая видео в высоком качестве.

Лента новостей

На главную страницу