Google разработал новый ИИ-инструмент, генерирующий изображения

Инструмент искусственного интеллекта под названием Whisk позволяет пользователям загружать фотографии и получать объединенное изображение, без использования промтов.

МАУНТИН-ВЬЮ (ИА Реалист). Техногигант Google объявил о запуске нового творческого инструмента Whisk, который значительно отличается от традиционных графических редакторов.

Согласно информации, размещенной на блоге компании, Whisk позволяет пользователям загружать фотографии и получать в результате объединенное изображение, созданное искусственным интеллектом, даже без использования промтов (текстовых команд).

Пользователи могут просто загружать изображения предметов, обстановки или стиля, а Whisk объединит все в одно изображение.

Компания также пояснила, что Whisk задуман как забавная функция ИИ, а не как инструмент для профессиональной работы.

Крупные технологические компании, такие как Google и OpenAI, спешат выпустить потребительские продукты, которые могут продемонстрировать возможности использования новой привлекательной технологии, хотя скептики предупреждают, что отсутствие барьеров вокруг развития ИИ представляет опасность для человечества.

С тех пор как OpenAI изначально запустил свой инструмент для создания текста в изображение Dall-E в 2021 году, концепция созданных ИИ произведений искусства заполонила социальные сети и стала фокусом потребительских продуктов. Whisk от Google — это генератор изображений в изображения, основанный на популярной концепции генераторов текста в изображения.

Люди, использующие Whisk, могут «перемешивать» конечное изображение, редактируя свои входные данные и смешивая категории, чтобы создавать разные изображения, такие как плюшевая игрушка, эмалевая булавка или наклейка. Пользователи могут добавлять текст, если хотят указать определенные детали, но это не обязательно для создания изображения.

«Whisk разработан, чтобы позволить пользователям смешивать тему, сцену и стиль новыми и креативными способами, предлагая быстрое визуальное исследование вместо точного редактирования с точностью до пикселя», — отметил в своем заявлении директор по управлению продуктами в Google Labs Томас Илич.

Whisk от Google создан на основе генеративного искусственного интеллекта, разработанного DeepMind — лабораторией искусственного интеллекта, которую Google приобрела в 2014 году.

Whisk работает, используя базовое решение Google на базе искусственного интеллекта Gemini, представленное в декабре 2023 года, и объединяя его с Imagen 3 — новейшим генератором текста в изображения, выпущенным DeepMind в декабре.

Когда пользователи загружают свои изображения, Gemini генерирует подпись, которая передается в Imagen 3. Процесс фиксирует «сущность» объекта, а не его точную копию, что позволяет ремикшировать конечное изображение.

Например, сгенерированное изображение может иметь другой рост, прическу или тон кожи, чем запрашиваемые изображения, говорится в сообщении Google в блоге .

Недавно компания OpenAI также выпустила генератор текста в видео под названием Sora, что наглядно демонстрирует конкуренцию на рынке потребительских товаров.

Recent Posts

Правительство направило более ₽60,5 млрд на поддержку льготных кредитов для аграриев

МОСКВА (ИА Реалист). Правительство России дополнительно выделило более ₽60,5 млрд на поддержку программы льготного кредитования…

12 часов ago

Экспорт зеленого чая из Японии достиг максимума за 70 лет

ТОКИО (ИА Реалист). Экспорт зеленого чая из Японии за первые десять месяцев текущего года достиг…

13 часов ago

Глава YouTube признался, что ограничивает своим детям доступ к соцсетям

ВАШИНГТОН (ИА Реалист). Генеральный директор YouTube Нил Мохан сообщил, что ограничивает использование соцсетей и онлайн-платформ…

15 часов ago

Лукашенко помиловал 123 иностранных граждан по договоренностям с Трампом

МИНСК (ИА Реалист). Президент Беларуси Александр Лукашенко в рамках достигнутых договоренностей с президентом США Дональдом…

22 часа ago

Microsoft выходит из тени OpenAI и запускает собственную линию «суперинтеллекта»

ВАШИНГТОН (ИА Реалист). Корпорация Microsoft получила право самостоятельно развивать продвинутые системы искусственного интеллекта после изменения…

1 день ago

В Пакистане экс-главу разведки приговорили к 14 годам тюрьмы

ИСЛАМАБАД (ИА Реалист). Военный суд Пакистана приговорил бывшего руководителя Межведомственной разведки (ISI) генерал-лейтенанта Фаиза Хамида…

1 день ago