Sam Altman和四位OpenAI 的研究员在直播中正式发布了ChatGPT Agent——一款通用型AIAgent。
ChatGPT Agent的革命性在于其独特的技术路径:它可以主动从工具箱中选择代理技能,使用自己的计算机完成任务,用户可以实时观察AI在虚拟环境中的工作过程。
OpenAI表示“从今天起,Pro、Plus和Team用户可以通过编辑器中的工具下拉菜单,在任意对话中的任意时刻选择‘代理模式’,直接激活ChatGPT的新代理功能。”
划重点:
- ChatGPT Agent:是能够执行复杂、多工具任务的统一AI Agent。
- 它集成了对文本浏览器、GUI 浏览器、终端和图像生成工具的访问。
- 支持与用户进行交互式、多轮对话,允许打断和澄清。
- 安全防护升级:加强对网页“恶意提示”攻击的防御;设置高风险任务自动拒绝;生物/化学风险也按最高级别安全堆栈处理。
- 它在多个现实世界和基准任务中取得了最先进的结果。

ChatGPT Agent概览
- 虚拟计算机环境:ChatGPT Agent在一个为其特设的虚拟计算机上执行所有任务。这个环境是沙盒化的,确保了操作的安全性。它能够在该环境中保存任务的上下文,即使用户中途打断或改变指令,也能从断点继续,而不会丢失进度。
- 智能工具箱:为了完成复杂工作流,Agent 配备了四种工具,并能根据任务需求自动选择最合适的工具:
- 可视化浏览器 (Visual Browser):用于与图形用户界面进行交互,例如点击按钮、填写表单和浏览为人类设计的网站。
- 文本浏览器 (Text-based Browser):用于需要高效推理和处理大量文本的网络查询。
- 终端 (Terminal):允许 Agent 运行代码、下载和处理文件。
- API 访问:可以直接调用 API 来获取信息,例如通过连接器访问 Google Drive、Gmail 和 GitHub 等应用的数据。
相关导航
暂无评论...