Об этом же в других СМИ

habr.com / 1 год назад

Meta* нанимает ключевого исследователя OpenAI для работы над моделями рассуждений ИИ

habr.com / 1 год назад

Google улучшает функцию Ask Photos: поиск по фотографиям станет быстрее

habr.com / 1 год назад

OpenAI начинает использовать тензорные процессоры Google для своих ИИ-продуктов

habr.com / 1 год назад

Исследователи обучают ИИ генерировать длинные тексты, используя только метод обучения с подкреплением

habr.com / 1 год назад

Google передает протокол Agent2Agent в Linux Foundation для создания открытого стандарта ИИ-агентов

Больше по теме

15.06.2025 - 08:30 / habr.com

Модель Google Gemini 2.5 Pro превосходит модель OpenAI o3 в обработке сложных и длинных текстов

В настоящее время Google Gemini 2.5 Pro лидирует в тесте Fiction.Live на обработку сложных и длинных текстов. Тест измеряет, насколько хорошо языковые модели могут понимать и точно воспроизводить сложные истории и контексты — задачи, которые выходят далеко за рамки простых функций поиска, таких как те, что оцениваются в популярном тесте «Иголка в стоге сена».

По данным Fiction.Live, модель o3 от OpenAI обеспечивает такую же производительность, как и Gemini 2.5 Pro, до контекстного окна в 128 000 токенов (около 96 000 слов). Но при 192 000 токенов (примерно 144 000 слов) производительность o3 резко падает. Июньский предварительный просмотр Gemini 2.5 Pro (preview-06-05) остается стабильным при этой длине.

Тем не менее, протестированные размеры контекста намного меньше миллиона токенов, которые Google рекламирует как максимальный размер контекста для Gemini 2.5 Pro. По мере увеличения размера контекста точность Gemini, скорее всего, будет снижаться. Для сравнения, модель o3 от OpenAI в настоящее время имеет максимальный размер контекста в 200 000 токенов.

Meta*, например, предлагает контекстное окно размером до десяти миллионов токенов для Llama 4 Maverick. На практике модель с трудом справляется со сложными задачами с длинным контекстом, игнорируя слишком много информации, которая могла бы быть полезной.

Более крупные контекстные окна, даже если модели используют их более эффективно, не всегда автоматически дают лучшие результаты. Как недавно отметил Николай Савинов из Google DeepMind, языковые модели сталкиваются с базовой проблемой «вложил — вынул» при работе с большим количеством токенов.

По словам Савинова, уделяя больше внимания одному токену, вы неизбежно уделяете меньше внимания другим, что приводит к проблемам с

продукты технологии история общество google крипто gemini mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Google представляет новую модель Gemini, которая может работать на локальных роботах habr.com / 1 год назад

YouTube встраивает модель Veo 3 для создания видеороликов прямо в Shorts habr.com / 1 год назад

OpenAI обнаружила скрытые функции в моделях ИИ, которые приводят к несогласованным ответам habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 18:07

здоровье семья женщина Здоровье и красота Эксперт Табу в косметологии – семь процедур, которые стоит отложить до осени

Чтобы сохранить здоровье кожи и избежать нежелательной пигментации, эксперты настоятельно рекомендуют отложить процедуры на осенне-зимний период.

14.07 / 18:07

здоровье общество интересное астрология Дом и интерьер Гороскоп на середину июля 2026 года для всех знаков Зодиака

Середина июля 2026 года станет периодом, когда многим захочется перейти от размышлений к более конкретным решениям.

14.07 / 17:58

происшествия самит Github скрыл форк zapret разработчика Flowseal

10 июля 2026 года репозиторий zapret-discord-youtube и аккаунт разработчика Flowseal на GitHub стали недоступны — страницы отдают ошибку 404. Вместе с основным проектом пропал доступ и ко всем остальным репозиториям, привязанным к этому аккаунту (в том числе tg-ws-proxy - прокси для Telegram).

14.07 / 17:57

Huawei самит AirPods мода и стиль Huawei представила FreeClip 2 S — элегантные наушники открытого типа с измененным зарядным кейсом и отличным звучанием

В дополнение к фотофлагманам Pura 90s Pro и Pura 90s Pro Max Huawei выпустила на глобальный рынок FreeClip 2S — продолжение своей знаковой линейки беспроводных наушников открытого типа. Новинка базируется на выпущенной в Китае в 2025 году модели FreeClip 2, но предлагает обновленный дизайн и измененный зарядный футляр.

14.07 / 17:37

продукты технологии люди общество расследование InfoWatch Activity Monitor получил расширенные возможности контроля

В рамках цикла обновлений линейки продуктов по защите данных ГК InfoWatch выпустила обновление Activity Monitor 3.5 — это система мониторинга действий сотрудников, которая работает в связке с DLP-системой InfoWatch Traffic Monitor.

14.07 / 17:37

технологии Xiaomi общество семья самит Xiaomi анонсировала гибридный внедорожник Sky Nomad N90 с запасом хода до 1500 км

Xiaomi анонсировала гибридный внедорожник N90, который будут выпускать под новым брендом Sky Nomad. Автомобиль получит три ряда сидений и запас хода в смешанном цикле до 1500 км. Дата релиза и цена пока неизвестны.

14.07 / 17:34

технологии Nvidia steam capcom Epic Games Узнайте, потянет ли ваш PC Onimusha: Way of the Sword — Capcom выпустила в Steam и EGS бенчмарк и раскрыла системные требования игры

Capcom завершает финальные приготовления к релизу экшена Onimusha: Way of the Sword, который станет первой за 20 лет совершенно новой игрой некогда популярной франшизы. Японский разработчик традиционно уделяет внимание отличной оптимизации своих игр, чему помогает невероятно технологичный движок RE Engine. Но чтобы все желающие могли убедиться, что смогут пройти новую Onimusha, компания поделилась двумя важными новостями.

14.07 / 17:34

технологии Huawei общество Стильные фотофлагманы Huawei Pura 90s Pro и Pura 90s Pro Max вышли на глобальный рынок — 200 Мп камеры, комфортные экраны и градиентные расцветки

На масштабном ивенте в Куала-Лумпуре Huawei объявила о выходе на международный рынок свои новые флагманские смартфоны Pura 90s Pro и Pura 90s Pro Max, которые сохранили узнаваемый дизайн серии, получили обновленные системы камер, новейшую оболочку EMUI 16 и базируются на фирменном чипе Kirin 9030S.

14.07 / 17:32

погода технологии смартфон гаджет Смартфон может незаметно терять заряд из-за одной настройки

Продлить работу смартфона без подзарядки помогут несколько простых изменений в настройках устройства.

14.07 / 17:32

люди здоровье общество мозг сон Четыре привычки перед сном, незаметно разрушающие сердце и сосуды

Ведущие кардиологи предупреждают: хаотичный режим, поздний ужин, гаджеты в постели и душная спальня запускают стрессовую реакцию организма и скачки давления.

Лента новостей

На главную страницу