Само броени дни след като главният изпълнителен директор на OpenAI, Сам Алтман, заяви, че 2025 г. ще бъде белязана от „първите AI агенти“, компанията предприема голяма стъпка в тази посока, представяйки „Operator“ – AI агент, който може автономно да изпълнява задачи в интернет.
Технологията първоначално ще бъде достъпна за американските потребители с ChatGPT Pro абонамент (на цена от 200 долара на месец), като те могат да получат достъп до системата на адрес operator.chatgpt.com.
От OpenAI твърдят, че агентът може да изпълнява широк спектър от действия и задачи – от онлайн пазаруване и резервации до планиране на пътувания. „Operator“ е базиран на нов модел, наречен „Computer-Using Agent“ (CUA), който съчетава визуалните възможности на GPT-4o с подобрени способности за разсъждение. Агентът „вижда“ (чрез екранни снимки) и работи директно с потребителския интерфейс на уебсайтовете – натиска бутони, попълва формуляри и навигира в менюта.
Когато потребителите активират „Operator“ се отваря прозорец със специален браузър, който агентът използва за изпълнение на задачите, като същевременно предоставя обяснения за всяко свое действие. При затруднения или грешки агентът може да се самокоригира, а когато се нуждае от помощ, връща контрола на потребителя.
За да гарантира максимална сигурност за потребители, OpenAI въвежда различни нива на защита – агентът изисква потвърждение от потребителя преди финализиране на поръчки или плащания, а за чувствителни операции като банкови транзакции е необходим пряк човешки контрол.
По думите на Сам Алтман „технологията скоро ще бъде достъпна и в други страни, но за съжаление, в Европа това ще отнеме повече време.“ Компанията също така планира да разшири достъпа и за потребители с Plus, Team и Enterprise абонаменти.
„Operator“ бележи важен момент в развитието на AI агентите – технология, която според мнозина ще промени фундаментално начина по който хората използват интернет и компютрите си, а изкуственият интелект ще се трансформира от инструмент за предоставяне на информация в средство за автономно изпълнение на задачи.
OpenAI обаче далеч не е първата компания, която демонстрира подобна технология. През октомври Anthropic представи „Computer Use“ – функция, позволяваща на „Claude 3.5 Sonnet“ да управлява компютри, а два месеца по-късно DeepMind обяви „Project Mariner“ – прототип, който използва мултимодално разбиране и разсъждение за автоматизиране на задачи в браузъра.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: