Об этом же в других СМИ

hitechexpert.top / 1 год назад

Samsung возвращает себе лидерство на мировом рынке смартфонов

gagadget.com / 1 год назад

IDC: Китайский рынок смартфонов упал, но Huawei вернула себе лидерство

habr.com / 1 год назад

OpenAI откладывает выпуск модели с открытым исходным кодом на неопределённый срок из соображений безопасности

habr.com / 1 год назад

Google представляет MedGemma — набор моделей ИИ с открытым исходным кодом для медицинских приложений

tech.onliner.by / 1 год назад

Ученые: люди уже говорят как ChatGPT

Больше по теме

02.07.2025 - 04:36 / habr.com

OmniGen 2 сочетает в себе генерацию изображений и текста, как GPT-4o, но имеет открытый исходный код

Исследователи из Пекинской академии искусственного интеллекта выпустили OmniGen 2 — систему с открытым исходным кодом для преобразования текста в изображение, редактирования изображений и создания контекстных изображений.

В отличие от оригинальной модели OmniGen, выпущенной в ноябре 2024 года, OmniGen 2 использует два отдельных пути декодирования: один для текста, другой для изображений, каждый со своими параметрами и отдельным токенизатором изображений. По словам команды разработчиков, такая настройка позволяет модели опираться на существующие мультимодальные языковые модели, не жертвуя при этом их основными навыками генерации текста.

В основе лежит мультимодальная большая языковая модель (MLLM) на базе трансформера Qwen2.5-VL-3B. Для создания изображений OmniGen 2 использует собственный диффузионный трансформер с примерно четырьмя миллиардами параметров. Модель переключается с написания текста на создание изображений, когда встречает специальный токен «<|img|>».

Для обучения использовалось около 140 миллионов изображений из наборов данных с открытым исходным кодом, а также из собственных коллекций. Исследователи также разработали новые методы, использующие видео для извлечения похожих кадров — например, лица с улыбкой и без неё — и создания соответствующих инструкций по редактированию с помощью языковой модели.

Для создания контекстных изображений OmniGen 2 отслеживает людей или объекты на нескольких кадрах видео, помогая модели понять, как один и тот же объект выглядит в разных ситуациях.

Команда представила новое встраивание позиции «Omni-RoPE», которое разделяет информацию о позиции тремя способами: последовательность и идентификатор модальности для различения изображений, а также двумерные координаты для каждого

люди общество крипто токен mefdayy Пекин

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Какие три продукта ни в коем случае нельзя сочетать с творогом cursorinfo.co.il / 1 год назад

Хидэо Кодзима раскритиковал ИИ из-за опасений в «предопределенном образе жизни» habr.com / 1 год назад

Легкий способ, как женщинам избавиться от комплексов и стать уверенными в себе cursorinfo.co.il / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 10:34

самит инвестор крипто XRP Binance Аналитики увидели новый сигнал для движения цены XRP на фоне активности китов

Переводы XRP от крупных держателей на биржу Binance за последний месяц сократились до самого низкого уровня за два месяца, тогда как активность на спотовом рынке резко упала. В то же время аналитики CryptoQuant фиксируют постепенный рост открытого интереса (OI) на рынке деривативов, а Santiment сообщает о накоплении XRP крупными кошельками. По мнению экспертов, рынок переходит в фазу «равновесия ликвидности», которая может предшествовать более сильному движению цены актива. Киты реже переводят XRP на Binance По данным CryptoQuant, показатель XRP Whale Inflow to Binance – 30D (SUM) снизился примерно до 947,4 млн XRP, что стало минимумом за по

22.07 / 10:32

погода технологии конференция общество самит 29 стран подписали соглашение о создании Всемирной организации по сотрудничеству в сфере ИИ

В Шанхае представители 29 государств подписали соглашение об учреждении World AI Cooperation Organization (WAICO) — новой межправительственной организации, которая должна стать площадкой для международного сотрудничества и координации подходов к развитию и регулированию искусственного интеллекта. Инициатива была предложена Китаем и официально оформлена накануне открытия ежегодной конференции World Artificial Intelligence Conference (WAIC 2026).

22.07 / 10:17

продукты продукты питания Здоровье и красота полезные продукты Что полезнее для уровня сахара в крови – сравниваем голубику и бананы

Сравнение пользы этих популярных фруктов помогает понять, как каждый из них по-своему влияет на наш организм.

22.07 / 10:12

Олимпиада спорт золото семья Российские школьники получили 4 золотых и 2 серебряных медали на 67-й Международной математической олимпиаде IMO 2026

Российские школьники получили 4 золотых и 2 серебряных медали на 67-й Международной математической олимпиаде IMO 2026. Мероприятие проходило в Шанхае.

22.07 / 10:12

Олимпиада золото общество школы Российские школьники получили золотые медали на 58-й Международной химической олимпиаде IChO 2026

Российские школьники получили четыре золотые медали на 58-й Международной химической олимпиаде IChO 2026, которая проходила в Ташкенте в середине июля 2026 года. Один из членов сборной России стал абсолютным победителем мероприятия. Пока что официальные результаты олимпиады находятся в процессе подготовки.

22.07 / 10:12

происшествия общество политика расследование аномалия Автономная система ИИ-агентов атаковала Hugging Face: защититься помогла LLM

Hugging Face раскрыли подробности недавнего инцидента безопасности. По заявлению компании, это первый случай, когда атака на ее инфраструктуру была целиком проведена автономной системой ИИ-агентов — от первоначального проникновения до последующего развития атаки.

22.07 / 09:53

медицина технологии люди смартфон общество Морщины в 20 лет: эта привычка вредит вашей шее

Долгое использование смартфонов с опущенной головой вызывает ранние морщины на шее, боли и проблемы с осанкой даже у молодых людей.

22.07 / 09:40

Samsung технологии СМИ Nvidia общество Samsung усиливает сотрудничество с NVIDIA: компания станет одним из ключевых поставщиков памяти для ИИ-систем нового поколения

Информация пока основана на публикациях отраслевых СМИ и инсайдерских данных. При этом сотрудничество между Samsung и NVIDIA уже давно подтверждено официально: корейский производитель поставляет американской компании DRAM, память HBM для ускорителей искусственного интеллекта, а также предоставляет услуги контрактного производства чипов.

22.07 / 09:35

работа общество фильм доллар Ferrari и дикий хаос: откровения экс-сотрудницы "Волка с Уолл-стрит"

Бывшая сотрудница финансовой империи Джордана Белфорта впервые раскрыла правду о работе. Атмосфера в офисе напоминала опасную секту.

22.07 / 09:33

продукты Samsung технологии люди дети Владельцы телевизоров LG теперь обязаны предупреждать гостей и родных о том, что их разговоры могут быть записаны

Владельцы умных телевизоров LG несут ответственность за получение всех необходимых согласий от любых третьих лиц, чьи голоса могут быть записаны устройством, следует из условий обслуживания южнокорейского производителя. Вероятно, компания может использовать разговоры членов семьи и гостей обладателей ТВ для обучения моделей искусственного интеллекта.

Лента новостей

На главную страницу