Об этом же в других СМИ

habr.com / 6 дней назад

Галлюцинации недели: Grok 4.5, Muse Spark и GPT-5.6-Sol, который съел все недельные лимиты

habr.com / 1 неделю назад

Claude Code и Codex научили самостоятельно искать уязвимости в чужих системах

habr.com / 1 неделю назад

Галлюцинации недели: Claude Sonnet 5, Nano Banana 2 Lite и возвращение блудного Fable

habr.com / 2 недели назад

Alibaba запрещает сотрудникам использовать Claude Code

habr.com / 2 недели назад

Claude вылечит: Anthropic будет делать лекарства, которые невыгодны обычной фарме

Больше по теме

02.07.2026 - 07:55 / habr.com

Галлюцинации недели: Claude Tag, дистилляция от Alibaba и GPT-5.6, который научился жульничать

Пока все спорили про большие модели, OpenAI спустилась этажом ниже и собрала инференс-чип Jalapeño вместе с Broadcom, а самый большой аудит судей-LLM напомнил, что мерить всё это мы толком не умеем.

OpenAI показала превью GPT-5.6 в трёх вариантах: Sol как флагман, Terra среднего уровня и Luna для дешёвых массовых задач. Цены такие: $5/$30, $2.5/$15 и $1/$6 за миллион токенов на вход и выход, то есть Sol стоит ровно как GPT-5.5. Доступ в превью получили примерно 20 организаций через API и Codex, и сделано это, по словам самой OpenAI, по просьбе правительства США. Компания показала модели властям до анонса и стартовала с узкого круга "доверенных партнёров", чьи имена переданы государству. В том же анонсе OpenAI прямым текстом написала, что не считает такой режим доступа нормальным на постоянной основе, потому что он держит лучшие инструменты подальше от тех, кому они нужны.

А заодно Sol поставила рекорд, которым не хвастаются. METR, независимая лаборатория оценки моделей, намерила у неё самый высокий процент жульничества среди всех публичных моделей, что они проверяли: модель вскрывала баги тестового окружения и доставала спрятанные ответы. Из-за этого цифры просто рассыпались. Если считать попытки сжульничать провалом, "горизонт" автономной работы выходит около 11.3 часа; если засчитать их как успех, он улетает за 270 часов. METR честно говорит, что ни одно из этих чисел не считает надёжным.

Пока один отдел Anthropic договаривается с Вашингтоном про доступ к Mythos, другой пишет в Конгресс доносы. В письме сенаторам Тиму Скотту и Элизабет Уоррен от 10 июня компания обвинила Alibaba в "крупнейшей известной distillation-атаке": с 22 апреля по 5 июня операторы, связанные с лабораторией Qwen, провели 28.8 миллиона обменов с Clau

закон общество самит конгресс крипто Broadcom Элизабет Уоррен США Вашингтон

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Alibaba запретила Claude Code на работе. Забавно, что в Китае он и так недоступен habr.com / 2 недели назад

GLM-5.2 получила свой аналог Claude Code. Кстати, модели Claude туда тоже подходят habr.com / 2 недели назад

СМИ: Alibaba запретила сотрудникам использовать Claude Code incrypted.com / 2 недели назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 15:07

история NASA буря интересное Ядерный реактор вместо солнечных панелей: NASA отправит SR-1 Freedom на Марс

Американское космическое агентство NASA решило, что для серьезного освоения Марса солнечных панелей и слабых радиоизотопных генераторов уже недостаточно. Как стало известно из планов ведомства, озвученных для издания Politico, в 2028 году к Красной планете должен отправиться аппарат Space Reactor-1 Freedom (SR-1). Это не просто очередной спутник, а первый в истории межпланетный корабль, который будет работать на основе ядерного распада. Проект оценивают в $2.1 млрд, и это только начало «атомных» амбиций США в далеком космосе.

22.07 / 15:06

бизнес Block google Джек Дорси представил платформу для группового чата Buzz

Сооснователь Twitter (теперь X) и компании Block Джек Дорси представил платформу для группового чата, призванную заменить Slack и GitHub. Проект называется Buzz и доступен с открытым исходным кодом. По словам Дорси, Buzz предназначена для команд и ИИ-агентов. Он позволяет обмениваться сообщениями, ставить задачи, вести разработку и планирование в рамках одного пространства. Фактически это аналог Slack, но с дополнительными функция

22.07 / 14:50

promo ByDex — современный сервис для работы с USDT, QR-платежей и виртуальных карт

Цифровые активы становятся все более востребованным

22.07 / 14:47

Samsung технологии Складные смартфоны Встречайте: Galaxy Z Fold 8 Ultra — бескомпромиссный складной флагман Samsung с улучшенным экраном и мощным охлаждением

В дополнение к базовому складному смартфону 2026 года Galaxy Z Fold 8, который получил новый форм-фактор, Samsung представила и флагманскую Ultra-модель. Она заинтересует тех пользователей, которые хотят получить прирост производительности и автономности и при этом не планируют привыкать к переработанному соотношению сторон.

22.07 / 14:39

бизнес продукты самит google gemini Google представила сразу три новые ИИ-модели Gemini: акцент сделан на программирование, анализ данных и кибербезопасность

Анонс стал частью стратегии Google по активному развитию собственной ИИ-экосистемы на фоне усиливающейся конкуренции с OpenAI, Anthropic, Microsoft и xAI. Новые модели призваны предложить разработчикам более высокую производительность, снизить стоимость вычислений и расширить возможности автоматизации.

22.07 / 14:23

экономика общество прогноз инвестор google CEO JPMorgan увидел недооцененные риски для рынков и сделал новый прогноз относительно эпохи ИИ

Генеральный директор JPMorgan Chase Джейми Даймон заявил, что инвесторы недооценивают геополитические и фискальные риски для мировой экономики, пишет CNBC. По его мнению, нынешние оценки акций и долгосрочных казначейских облигаций США не учитывают в полной мере потенциальные потрясения, что может иметь значение как для традиционных, так и для криптовалютных рынков, которые все чаще реагируют на макроэкономические факторы. Среди ключевых угроз он назвал войны в Украине и на Ближнем Востоке, напряженность между США и Китаем, а также рост военных расходов на фоне рекордных бюджетных дефицитов. США объединили ИИ-гигантов OpenAI, Anthropic и Google против Китая 08.04.2026 Читать США пригрозили санкциями китайским ИИ-компаниям 22.07.2026 Читать По словам банкира, даже если часть этих рисков уже учтена в

22.07 / 14:15

Samsung технологии звезда Широкоформатная база: Samsung представила Galaxy Z Fold 8 — переосмысленный складной смартфон в новом форм-факторе

Состоялась презентация Galaxy Unpacked, на которой Samsung представила свои флагманские новинки. Главной звездой ивента несомненно стал Galaxy Z Fold 8 — складной смартфон, который является базовой моделью 2026 года и получил совершенно новый форм-фактор: теперь это широкоформатный гаджет, который станет конкурентом Pura X Max и еще непредставленному iPhone Ultra.

22.07 / 14:07

люди животные общество самит профессор Почему собаки имитируют половой акт – причины странного поведения

Согласно выводам исследователей, в подавляющем большинстве случаев (около 65%) собачьи садки происходят без очевидной причины.

22.07 / 14:07

связь ученые животные общество книги Собаки ревнуют хозяев: эксперимент разрушил давний научный миф

Привычная реакция собак на внимание хозяина может скрывать чувство, которое долго считали исключительно человеческим.

22.07 / 14:07

люди здоровье общество вода Здоровье и красота Как холодная вода влияет на пищеварение и организм – врач

Чтобы избежать спазмов, вздутия и головной боли в жаркие дни, врач советует отказаться от ледяных напитков.

Лента новостей

На главную страницу