Искусственный интеллект Whisk от Google использует изображения в качестве подсказок
Google есть еще один инструмент ИИ, который можно добавить в кучу. Whisk — это генератор изображений от Google Labs, который позволяет использовать существующее изображение в качестве подсказки. Однако он только перехватывает «сущность» вашего исходного изображения, а не воссоздание его с новыми деталями. Таким образом, он больше подходит для мозгового штурма и быстрых визуализаций, чем для редактирования исходного изображения.
Компания описывает Whisk как «новый тип творческого инструмента». Экран ввода начинается с простого интерфейса, где вы можете выбрать стиль и тему. Этот простой вводный интерфейс позволяет вам выбрать только один из трех предопределенных стилей: наклейка, эмалевая булавка и плюшевый узор. Я подозреваю, что Google решила, что эти три стиля позволяют делать грубые наброски, для которых экспериментальный инструмент в его нынешнем виде подходит лучше всего.
Как вы можете видеть на изображении выше, он создал четкое изображение плюшевого мишки Уилфорда Бримли. (Правила Google запрещают изображения знаменитостей, но Уилфорд проскользнул через ворота с Quaker Oats на буксире, не вызвав подозрения у охраны.)
Whisk также включает в себя более продвинутый редактор (найти его можно, нажав «Начать с нуля» на главном экране). В этом режиме вы можете использовать текст или исходное изображение в трех категориях: тема, сцена и стиль. Также есть строка ввода для добавления большего количества текста для завершающих штрихов. Однако в своем текущем виде расширенные элементы управления не дали результатов, которые соответствовали бы моим потребностям.
Например, взгляните на мою попытку создать покойного мистера Бримли в лайтбоксе с изображением плюшевого моржа, которого я нашел в Интернете:
Венчик выплевывает нечто
Читать на hitechexpert.top


