科技| OpenAI推出代理Operator “自动波”预订旅行填表购物
[星岛综合报道] OpenAI 推出了其首批 AI 代理之一——Operator,这是一个能够使用自己的浏览器来进行旅行预订、填写表格、订购杂货,甚至创建迷因(memes)的系统。
目前,Operator 已开放给美国的 ChatGPT Pro 用户使用,访问网址为 operator.chatgpt.com(该计划每月费用为200美元,提供最新 AI 模型的访问权限)。它的设计目的是能够自动执行任务,包括浏览网页、打字、点击和滚动页面等操作。
OpenAI CEO Sam Altman 表示,这次发布是“早期研究预览”,目前仍然有局限性,并将根据用户反馈在未来几个月内改进。OpenAI 还计划在 Operator 之后推出更多 AI 代理,并最终向 ChatGPT Plus、Team 和 Enterprise 用户开放,使其在全球范围内可用。
Operator 由一种名为 “Computer-Using Agent(CUA)” 的新模型提供支持,该模型基于GPT-40。它能够通过“萤幕截图”来“查看”,并透过模拟鼠标和键盘操作来与网页互动,这使其能够在无需 API 集成的情况下执行网页操作。
用户可以通过指定的合作伙伴网站或传统的搜索引擎(如 Google)来向 Operator 发送请求。如果 AI 代理遇到困难或出错,它可以利用推理能力来自我纠正。尽管如此,它仍处于早期阶段,与人类的网页操作能力相比仍有差距。
OpenAI 的目标是“将 AI 从被动工具转变为数字生态系统的主动参与者”,通过自动化操作来简化用户的任务,并创造创新的客户体验,以提高转化率。
目前,Operator 的生态系统已经吸引了一些来自 旅游与出行领域的“早期合作伙伴”,例如:Booking.com、Hipcamp、Tripadvisor、Uber、Priceline,这些合作伙伴将帮助 Operator 进行预订,并确保它能够满足现实世界的需求,同时遵守既定的行业规范。
此外,其他合作伙伴还包括:送餐、杂货购物、餐厅预订,以及eBay等电子商务与票务。
要开始使用 Operator,用户只需描述想要执行的任务,然后 Operator 便可自动处理。不过,用户仍可随时接管浏览器的控制权,而且 Operator 也会在遇到需要登录、付款或验证码(CAPTCHA)等情况时,自动请求用户接手。
此外,用户可以个性化设定 Operator 的工作流程,为特定网站添加自定义交互,例如自动执行重复性任务。与使用多个浏览器标签页类似,Operator 可以同时处理多项任务。
OpenAI 强调,用户的安全是首要考量,并实施了三层保护措施,以防止滥用,并确保用户始终掌控 AI 代理的行为。
展望未来,OpenAI 计划开放 Operator 背后的 CUA 模型 API,让开发者可以使用它来构建自己的 AI 代理。此外,Operator 也将逐步支持更长、更复杂的工作流程,并扩展到更多的 ChatGPT 订阅计划用户。
图片:OpenAI
T10
>>>星岛网WhatsApp爆料热线(416)6775679,爆料一经录用,薄酬致意。
>>>立即浏览【移民百答】栏目:新移民抵埗攻略,老华侨也未必知道的事,移民、工作、居住、食玩买、交通、报税、银行、福利、生育、教育。
