Об этом же в других СМИ

habr.com / 1 месяц назад

ИИ-агент из Купертино: новая Siri от Apple работает на Google Gemini и знает о пользователе почти все

habr.com / 1 месяц назад

Вышел SWE-Marathon: бенчмарк, где агенты часами пишут код — и почти никто не доходит до финиша

habr.com / 1 месяц назад

Открыл репозиторий в Claude Code — и ключи украдены: атака вырубила 73 репозитория Microsoft

gagadget.com / 1 месяц назад

Google обновила AI Plus: пользователям Gemini снизили стоимость подписки и предоставили 400 ГБ облачного хранилища

habr.com / 1 месяц назад

Microsoft анонсировала настольную рабочую станцию для разработчиков ИИ

Больше по теме

22.05.2026 - 10:08 / habr.com

ИИ собрал рабочую ОС за 12 часов: представлена Gemini 3.5 Flash

На конференции I/O 2026 Google представил новое семейство моделей Gemini 3.5. Первой вышла младшая версия — 3.5 Flash, и компания сразу назвала ее своей сильнейшей моделью для агентов и кодинга. Но посмотрим на бенчмарки.

Где 3.5 Flash действительно вне конкуренции — это агентские задачи и работа с инструментами. На MCP Atlas (многошаговые сценарии через внешние инструменты) она набирает 83,6%, обходя и Claude Opus 4.7, и GPT-5.5. На Finance Agent v2 — 57,9% против примерно 51% у обоих конкурентов и 43% у своего же 3.1 Pro. Сильна она и в мультимодальности: 83,6% на MMMU-Pro и 84,2% на CharXiv — лучшие результаты в таблице. По кодингу Flash обгоняет 3.1 Pro (76,2% против 70,3% на Terminal-Bench 2.1), но здесь ее уже опережает GPT-5.5 с 78,2%.

А вот в глубоком рассуждении и длинном контексте картина обратная. На академическом тесте Humanity's Last Exam новая Flash набирает 40,2% — меньше, чем прошлый флагман 3.1 Pro (44,4%) и Claude Opus 4.7 (46,9%). На головоломках ARC-AGI-2 — 72,1% против 77,1% у 3.1 Pro. На GDPval-AA, где модели сравнивают по Elo-рейтингу как шахматистов на экономически ценной работе, у Flash 1656 — ниже, чем у Claude Sonnet 4.6 (1676), Opus 4.7 (1753) и GPT-5.5 (1769). Логика простая: это скоростной агентский "рабочий конь", а не чемпион по сложным размышлениям.

Зато по скорости разрыв огромный. По замерам независимого сервиса Artificial Analysis, 3.5 Flash выдает 289 токенов в секунду — больше чем вчетверо быстрее Claude Opus 4.7 (67 токенов/с) и GPT-5.5 (71), и вдвое быстрее самого Gemini 3.1 Pro (135). При этом по общему индексу интеллекта Artificial Analysis модель держится вровень с 3.1 Pro и Claude Opus 4.7. Все это, по словам Google, за долю стоимости конкурентов.

Самую наглядную демонстрацию

конференция общество самит google крипто gemini runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Google переносит Gemini на Android (Go Edition): новый помощник для бюджетных смартфонов ilenta.com / 1 месяц назад

Google выпустила Gemini Go для дешевых Android-смартфонов с 2 ГБ оперативной памяти gagadget.com / 1 месяц назад

К2 НейроТех собрал готовый к поставке ПАК-AI на основе платформы Yandex AI Studio habr.com / 1 месяц назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

21.07 / 19:14

продукты Apple общество Apple попросила бывших сотрудников из OpenAI сохранять потенциально важные документы и сообщения

Apple направила юридические уведомления с требованием сохранить документы и переписку десяткам своих бывших сотрудников, перешедших в OpenAI. Эти меры принимаются в рамках продолжающегося судебного разбирательства, касающегося незаконного использования коммерческой тайны.

21.07 / 19:14

Вышел открытый браузерный эмулятор телефонов Nokia 3310/3410/3350/3330/5110/5210/7110

Представлен открытый проект браузерного эмулятора для телефонов Nokia моделей 3310/3410/3350/3330/5110/5210/7110. Исходный код решения написан на C и JavaScript и опубликован (проект Nokia DCT3 Emulator) на GitHub под лицензией GNU General Public License v2.0.

21.07 / 19:09

Samsung технологии промышленность общество предприятия Samsung запускает масштабный проект в робототехнике: компанию ждет переход к «умным» заводам и гуманоидным роботам

Samsung Electronics официально объявила о создании нового подразделения Robotics eXperience (RX) Business Promotion Office, которое займется развитием робототехники и искусственного интеллекта. Возглавит направление генеральный директор мобильного подразделения компании Тэ Мун Ро (TM Roh), что подчеркивает стратегическую важность проекта для южнокорейского гиганта.

21.07 / 18:57

технологии Представлен открытый проект FSearch — утилита для быстрого поиска файлов

Разработчик Кристиан Боксдорфер представил открытый проект под названием FSearch (аналог проекта Everything для Windows). Это решение представляет собой небольшую утилиту для быстрого поиска файлов. Исходный код FSearch написан на C и опубликован на GitHub под лицензией GNU General Public License v2.0.

21.07 / 18:47

происшествия семья смерть больница актер Сердце актера остановилось на семь минут – он признался, что "увидел"

Мужчина находился в состоянии комы целый месяц после инцидента. Он подробно рассказал о том, что происходило с ним в "потустороннем мире".

21.07 / 18:14

происшествия криминал история общество убийство Почему нас так притягивают истории о преступлениях – объяснение

Криминальные сюжеты работают для мозга как сложные головоломки. Люди пытаются найти логику в хаосе и понять мотивы поступков злоумышленников.

21.07 / 17:36

Samsung технологии Qualcomm мода и стиль google Ставка на Gemini, стильные оправы и девять часов без зарядки — инсайдер раскрыл подробности AR-очков Samsung Eyewear

Завтра состоится презентация Galaxy Unpacked, на которой Samsung представит не только флагманские складные смартфоны и две модели смарт-часов, но и, как сообщил инсайдер Роланд Квандт (Roland Quandt), планирует впервые официально раскрыть подробности о своих первых смарт-очках. В статье они обозначены как Samsung Eyewear.

21.07 / 17:36

продукты связь общество starlink авиакомпания PeakDo LinkPower 3: энергия для Starlink Mini и «интернет вещей» в пауэрбанке

Спутниковый терминал Starlink Mini стал настоящим спасением для тех, кто хочет оставаться на связи посреди леса или в горах, однако Илон Маск (Elon Musk) решил не добавлять в него встроенный аккумулятор. Этот пробел на рынке успешно заполняет компания PeakDo, которая выпустила уже третье поколение своего специализированного аккумулятора — LinkPower 3. Устройство стало не просто более емким, но и получило неожиданное обновление, заставляющее вспомнить о концепции «умного дома» даже в полевых условиях.

21.07 / 17:36

футбол звезда капитал инвестор симуляторы Килиан Мбаппе стал лицом EA Sports FC 27 — новый футбольный симулятор представят уже 23 июля

На волне огромного интереса к футболу, сразу после окончания Чемпионата мира компания Electronic Arts приступила к активной маркетинговой компании нового симулятора EA Sports FC 27.

21.07 / 17:34

общество самит отношения психология Эксперт Когда нужно завершить хорошие отношения – мнение психологов

Самые тяжелые расставания происходят без скандалов и измен. Иногда партнеры просто утрачивают прежние чувства, оставаясь чужими людьми.

Лента новостей

На главную страницу