Об этом же в других СМИ

habr.com / 1 год назад

OpenAI планирует выпустить новую открытую языковую модель AI в ближайшие месяцы

habr.com / 1 год назад

Функция генерации изображений ChatGPT получает обновление

habr.com / 1 год назад

Microsoft добавляет в Copilot инструменты глубокого исследования на базе искусственного интеллекта

habr.com / 1 год назад

Google представляет новое поколение моделей рассуждений Gemini 2.5

habr.com / 1 год назад

Character AI добавляет инструменты родительского надзора для повышения безопасности подростков

Больше по теме

17.03.2025 - 04:23 / habr.com

Google добавляет собственную генерацию изображений в языковые модели Gemini

Мультимодальное обучение Gemini обеспечивает прямую генерацию изображений, потенциально предлагая более точные результаты по сравнению с традиционными моделями изображений.Google включила собственные возможности генерации изображений в своей языковой модели Gemini 2.0 Flash для разработчиков.

Согласно сообщению в блоге компании, разработчики теперь могут тестировать эту функцию через Google AI Studio и API Gemini во всех поддерживаемых регионах. Процесс интеграции требует минимального кода, а Google предоставляет экспериментальную версию Gemini 2.0 Flash (gemini-2.0-flash-exp) для тестирования.

Генерация изображений Gemini отличается своей мультимодальной основой. Большая мультимодальная модель (LML) объединяет понимание текста, улучшенное рассуждение и мультимодальную обработку входных данных для генерации более точных изображений, чем традиционные модели генерации изображений.

Google утверждает, что модель может создавать последовательные визуальные повествования, объединяя текст и изображения, сохраняя согласованность персонажей и настроек на нескольких изображениях. Она также позволяет редактировать изображения в режиме разговора с помощью нескольких шагов диалога, что делает ее особенно полезной для итеративных улучшений, сохраняя контекст на протяжении всего разговора.

Встроенные в модель знания мира помогают создавать реалистичные и точные изображения, хотя Google отмечает, что эти знания, хотя и обширные, не абсолютны. Система также отлично справляется с включением текста в изображения, внутренние тесты показывают превосходную интеграцию текста по сравнению с ведущими моделями конкурентов.

OpenAI уже продемонстрировала возможности в этой области с помощью своей модели GPT-4o еще в мае 2024 года. Как и Gemini, GPT-4o

общество google gemini dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Grok 3 добавляет более глубокий поиск и возможности редактирования изображений с помощью AI habr.com / 1 год назад

xAI запускает API для генерации изображений habr.com / 1 год назад

Google добавляет в Gemini новую функцию, а также аудиообзор habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 11:09

технологии смартфон самит планшеты гаджет Сколько на самом деле служит аккумулятор смартфона - ответ экспертов

Специалисты рассказали, сколько циклов выдерживает современный аккумулятор и что ускоряет его износ.

16.07 / 11:09

продукты люди общество Здоровье и красота питание Какие продукты запрещено употреблять с чаем - список

Врачи рассказали, какие продукты категорически не сочетаются с чашкой горячего чая и даже могут быть опасны.

16.07 / 10:59

продукты закон самит интересное Соцсеть X сделала алгоритм более дружелюбным

Компания X внесла небольшое изменение в свой алгоритм, чтобы повысить видимость публикаций от пользователей, с которыми установлена взаимная подписка. Об этом сообщил руководитель направления продуктов Никита Бир.

16.07 / 10:59

общество самит google крипто Luna Галлюцинации недели: Grok 4.5, Muse Spark и GPT-5.6-Sol, который съел все недельные лимиты

Fable 5 третий раз подряд двигает дедлайн по подписке, теперь аж до 19 июля, под давлением чужих релизов. А новую голосовую GPT-Live презентует не Сэм Альтман со сцены, а бабушки: в релизном ролике они сами зачитывают анонс полнодуплексной модели, перебивают её на полуслове и торгуются с ней по-французски.

16.07 / 10:59

реклама технологии общество Microsoft обещает исправить поиск в Windows 11 с помощью масштабного обновления

Microsoft представила масштабное обновление функции поиска в Windows 11, призванное улучшить пользовательский опыт: результаты стали точнее, снизилась зависимость от веб-поиска, а также исчезли назойливая реклама и промо-материалы.

16.07 / 10:59

google Firefox ускорит цикл выпуска основных обновлений с четырёх недель до двух

Разработчики Firefox изучают вариант перехода на двухнедельный цикл выпуска обновлений браузера. Для начала этот цикл внедрят для десктопной и Android-версий.

16.07 / 10:58

технологии экономика СМИ планшеты мода и стиль Официально: OnePlus уходит из США и Европы, но обновления ее гаджеты продолжат получать

Китайский бренд OnePlus подтвердил слухи о своем уходе с западных рынков, которые ходили последние месяцы. Старший PR-менеджер Oppo (материнская компания) в Европе Джеймс Патерсон (James Paterson) сообщил в комментарии для The Verge, что из магазинов США и Европы исчезнут смартфоны и планшеты OnePlus. Уже купленные гаджеты сохранят гарантию и продолжат получать заявленные обновления, но их будет выпускать Oppo. Кроме того, ближайшие обновления переведут смартфоны с OxygenOS на прошивку ColorOS.

16.07 / 10:58

Samsung технологии Apple самит Belkin выпустила пауэрбанк-ночник: чтобы заряжать смартфон и не споткнуться о кота ночью

Когда кажется, что рынок пауэрбанков уже ничем не удивит, появляется компания Belkin и добавляет к обычной батарее датчик движения и ночник. Новое устройство BoostCharge Pro Power Bank 10K, представленное пока что только на китайском рынке, пытается закрыть сразу две потребности: зарядить ваш смартфон и спасти ваши мизинцы от столкновения с мебелью в ночной темноте.

16.07 / 10:51

закон президент резолюция сенат google Сенат США единогласно одобрил резолюцию о запрете помилования SBF

Сенат США единогласно одобрил резолюцию S. Res. 772. Она предусматривает полный запрет на помилование или другое смягчение срока Сэма Бэнкмана-Фрида (SBF), бывшего CEO биржи FTX. Ее подали сенаторы Рубен Гальего и Синтия Ламмис в середине июня 2026 года. Судя по официальному сайту, ее одобрили при безоговорочной поддержке всего Сената 15 июля. Документ S. Res. 772 предусматривает полный запрет на любое помилование Сэма Бэнкмана-Фрида представ

16.07 / 10:40

общество семья обыск криптовалюта google В США раскрыли сеть наркоторговли через даркнет с отмыванием криптовалютных доходов

Большое жюри Южного округа Флориды предъявило обвинения двум жителям Калифорнии, которых подозревают в организации масштабной сети торговли наркотиками через даркнет и отмывании полученных в криптовалюте доходов. По версии следствия, фигуранты сбывали фентанил и метамфетамин покупателям по всей территории США, в том числе в штате Флорида. Продажа наркотиков через даркнет и криптовалютные расчеты Согласно материалам дела, 44-летний Николас Агилар и 37-летняя Джессика Марколина якобы управляли аккаунтом продавца HotGirlzClub на нескольких маркетплейсах даркнета. Следователи утверждают, что как минимум с 2020 года они организовали продажу контролируемых веществ, а полученные

Лента новостей

На главную страницу