OpenAI выпустили Operator – ИИ-агента для автономного управления компьютером
Да, это тот самый агент, о котором так много писали в СМИ, и которого так долго ждали все любители ИИ. Это система на основе GPT-4o, которая может самостоятельно управлять компьютером, выполнять сложные задачи и взаимодействовать с браузером. Например, с помощью Operator можно заказать доставку, спланировать путешествие, забронировать столик и так далее.
Конечно, это все еще не уровень человека, но уже очень значимое достижение. Агент уже доступен пользователям по подписке Pro (200$/месяц), позже обещают раскатить на плюс-юзеров.
В разработке агентов Operator – новое слово. Ранее подобные системы уже выпускали Anthropic и Google, однако судя по всему, Operator значительно их превосходит.
К слову, как раз вчера также вышла первая опенсорсная версия такого агента, ее представили ученые из ByteDance (aka TikTok).
Отступление: здесь мы не будем подробно рассказывать о том, как работают такие системы под капотом, но если вам это интересно, можете как раз почитать наш разбор агента UI-TARS от ByteDance.
А если хотите каждый день читать что-нибудь интересное про ML, то приглашаем вас в наш тг-канал Data Secrets. Там мы (а мы – это команда действующих ML-инженеров) каждый день наблюдаем за повесткой, публикуем разборы свежих статей и релизов и делимся прикладными материалами. А еще наше большое сообщество всегда радо новым специалистам и энтузиастам :)
Ранее, кстати, The Information писали о том, что OpenAI так долго тянули с релизом, потому что очень долго занимались безопасностью своего агента. В частности, основной проблемой являлись так называемые prompt injection атаки. Это когда вредоносные сайты крадут ваши данные через агента. При этом вы, как пользователь, ни о чем не подозреваете, потому что у вас нет контроля за тем,
Читать на habr.com