
ChatGPT 帮我们搞定了一切!从写邮件、研究主题,甚至帮我们准备面试;但这就够了吗?远远不够。毕竟,你得把邮件复印发给对方,或者在报告中展示研究成果,这都需要耗费大量的时间和精力。但现在不再如此了!对话和行动之间的界限已经打破。OpenAI 最新发布的“ChatGPT Agent”将 ChatGPT 从一个实用的聊天机器人变成了一个更具雄心壮志的平台:一个可以代替你执行任务的数字助理。AI 不再只是提供解决方案的概述,而是会将解决方案付诸实践。
但这并非一个万能的工具,它仍然有很长的路要走,但它为未来提供了一个充满希望的框架。本文将介绍它的功能、使用方法、实际操作、局限性以及它对未来的展望。
什么是ChatGPT Agent?

Source: ChatGPT
ChatGPT 代理于 2025 年 7 月 17 日发布,进一步提升了 ChatGPT 的 AI 性能。它不再仅仅是谈论任务,现在还可以浏览网站、处理数据、创建演示文稿,并从头到尾处理复杂的工作流程。
代理模式本身就令人惊叹,有时甚至有些荒谬,而且距离黄金时段还很远。
尽管这类代理已经存在一段时间了,但 ChatGPT 代理带来了性能和易用性方面的承诺。基于 ChatGPT,该代理可以全天候工作,并“真正为您执行一些任务”。但与 ChatGPT 不同的是,我们的任务不会立即完成。这是因为代理可以利用深入研究来执行任务,从而提高质量,但同时也会延长工作时间。
ChatGPT代理能做什么?
您可能会想,这个代理能带来什么?想象一下:你早上的工作日程包括浏览电子邮件、查看新闻,以及寻找一些新工作。目前,你必须手动逐一完成所有这些活动。
ChatGPT 代理可以在虚拟环境中自行执行操作,为你提供帮助。它可以处理诸如“分析我的日历并根据最新消息向我简要介绍即将召开的客户会议”或“计划和购买四人份日式早餐的食材”之类的请求。它可以智能地浏览网站,筛选结果,在需要时提示你安全登录,运行代码,进行分析,并提供精美的输出,例如可编辑的幻灯片和电子表格。
这项技术的特别之处在于它如何弥合研究与执行之间的差距。以前,聊天机器人被比作“没有大脑的嘴巴”,这意味着它们可以传达文本,但无法对其进行任何处理。因此,我们最终必须根据输出结果进行判断和采取行动。但现在,有了 ChatGPT 代理,这个问题迎刃而解。
ChatGPT代理:定价和发售日期
ChatGPT 代理将首先面向付费订阅用户推出,首先是 Pro 用户,接下来几天将面向 Plus 和 Team 用户推出。企业版和教育版用户将在接下来的几周内获得访问权限。Pro 用户每月消息使用上限为 400 条,其他付费套餐用户每月消息使用上限为 40 条,可通过积分选项获得更多使用量。
ChatGPT代理:如何访问?
您需要拥有 ChatGPT Pro 或 Plus 订阅才能访问代理。订阅后,请按照以下说明操作:
- 在对话的任意时刻,通过编辑器中的工具下拉菜单选择“agent mode”,即可激活 ChatGPT 的全新代理功能。

- 描述您想要完成的任务,例如进行深入研究、创建幻灯片或提交费用。
- 当 ChatGPT 执行您的任务时,屏幕上的旁白会准确显示其正在执行的操作。
- 您可以随时中断并控制浏览器,以确保任务与您的目标保持一致。
* 最初,该模型仅限 ChatGPT Pro 用户使用,但现在 ChatGPT Plus 用户也可以使用。该模型正在推出高级版本,通常与付费或高级套餐捆绑销售。但其可用性主要取决于 OpenAI 的策略。
实践体验:真实世界测试
ChatGPT 代理凭借其自主工作能力,可以帮助我们端到端地完成任务。因此,我们针对我们日常需要帮助的三个常见任务测试了它的功能:
- 研究与分析
- 计划与采购
- 思考与呈现
让我们看看它是如何执行这些任务的。
任务 1:研究与分析
提示词:“Create a comprehensive spreadsheet and analysis of the Indian Union Finance Budgets from 2020 to 2025, focusing on sector-wise allocations and trends.
Step-by-Step Instructions:
1: Data Collection & Spreadsheet Creation
- Locate and compile the official Union Finance Budget documents for India from 2020 to 2025.
- Extract the annual sector-wise budget allocations for each year (e.g., Agriculture, Health, Education, Defence, Infrastructure, etc.).
- Present the data in a structured spreadsheet with columns for Year, Sector, and Allocation (in ₹ Crore/Billion).
2: Agriculture Budget Analysis
- Analyze how the budget allocation for Agriculture has changed year-over-year during 2020–2025.
- Include summary statistics and highlight any notable trends, increases, or decreases.
- Create clear and insightful visualizations (such as line charts or bar graphs) to illustrate the changes in the Agriculture budget over this period.
3: Sectoral Growth Comparison
- Calculate the absolute and percentage change in budget allocation for each sector from 2020 to 2025.
- Rank all major sectors from the highest to the lowest based on their total rise in budget allocation (both absolute and percentage terms).
- Visualize this comparison with appropriate charts (e.g., sorted bar chart).
Output Requirements:
- A well-organized spreadsheet (Excel/Google Sheets) with clean, clearly labeled data.
- At least two visualizations:
- Agriculture budget trend (2020–2025).
- Sectors ranked by growth in allocation.
- A brief summary of key insights (2-3 paragraphs) highlighting major changes and trends.”
输出:
点评:
ChatGPT 代理运行得非常好。它查看了每年的预算报告,找出了分配给每个部门的预算,并且连续 6 年都如此。然后,它创建了一个包含所有这些信息的电子表格(我可以直接使用……太棒了)。之后,它创建了一个汇总所有信息的表格供我参考。它还按照提示绘制了一张图表来显示分配给农业的预算。最后,它提供了一个条形图来显示预算分配趋势(按部门划分),从预算占比最高的部门开始。这相当于一周的研究和分析工作只用了 18 分钟就完成了!
最棒的还不是这个!而是代理从最可靠的信息来源——政府网站——获取了这些信息!
任务 2:规划与选购
提示词:“I am planning my father’s birthday party, and I need you to help me organize and execute all the arrangements step by step. The event is on 14th August and will be a brunch party for about 60 guests near Chhatarpur, Delhi. Please act as my event planning assistant and handle the following tasks with detailed options, pricing, links, and next steps:
1. Venue Booking
Goal: Find and book a comfortable, well-rated venue for 60 people in or near Chhatarpur, Delhi.
Preferences:
- Indoor or semi-outdoor space with good ambiance for a brunch event.
- Availability on 14th August (10 AM – 3 PM).
Output: Provide at least 3 venue options with links, pricing, amenities, photos (if possible), and reasons why each is suitable.
2. Party Decorator
Goal: Find a professional decorator for brunch-themed birthday decor.
Preferences:
- Simple but elegant decor (balloons, floral elements, photo corner).
- Ability to customize based on theme and budget.
Output: Provide 3 decorators with portfolio links, their estimated cost for the setup, and key highlights.
3. Catering
Goal: Book a brunch caterer for 60 people.
Preferences:
- Mix of North Indian & Continental options (veg + non-veg).
- High-quality service & customizable menu.
Output: Provide 3 catering options with links, sample menus, per-person cost, and reviews.
4. Invitations
Goal: Design a digital invitation card for the event.
Preferences:
- Elegant, festive, and easy to share on WhatsApp.
- Include: Name (Father’s name), Date, Time, Venue, RSVP details.
Output: Share at least 2–3 design concepts with downloadable links (JPEG/PNG/PDF format).
5. Gift Purchase
Goal: Find and shortlist watches as a gift for my father.
Budget: ₹20,000.
Preferences:
- Preferably branded (e.g., Titan, Fossil, Seiko, Citizen).
- Classy, formal style.
Output: Provide 3–5 shortlisted watches with purchase links, pricing, and delivery timelines.
Important: Do not place the order without asking me for final confirmation.
6. Timeline & Execution Plan
Goal: Create a step-by-step timeline to finalize everything.
Output: A table with Task | Deadline | Dependencies | Status so I can track progress easily.
Once all options are shortlisted, guide me through the booking and purchasing process (venue, caterer, decorator, watch) and prepare a checklist to ensure nothing is missed. Also, keep budget optimization in mind while making recommendations.”
输出:
点评:
我在两个任务中注意到的一点是,它们都严格遵循提示。代理会恭敬地执行每条指令,这意味着它甚至会遵循你命令的顺序。这让你能够掌控最终结果。它为我提供了各种选项,包括场地、装饰师和餐饮服务商,并给出了每个选项的估算价格。例如,它提供了几个选项,每个选项都包含与我的活动相关的特定信息。它提供的礼品选项都在预算之内,并且都带有链接!最后,它还提供了一个表格来帮助我管理任务的时间表!这将使跟踪我的进度变得非常简单。

最棒的是,这位客服人员对细节了如指掌,比如日期和活动类型。它的所有建议都很贴切。
任务 3:制作一份关于生成式人工智能职业和薪资趋势的PPT
提示词: “Create a visually appealing and informative PowerPoint presentation (10-15 slides) on ‘Career and Salary Growth in Generative AI.” The presentation should be data-driven, well-structured, and suitable for professionals looking to enter or advance in this field. Outline:
1. Title Slide Title: “Career and Salary Growth in Generative AI” Subtitle: Opportunities, Trends, and Future Prospects Your Name/Company (if applicable) Date
2. Introduction to Generative AI: Brief definition of Generative A,I Key technologies (LLMs, GANs, Diffusion Models, etc.) Real-world applications (ChatGPT, Midjourney, Copilot, etc.)
3. Why Generative AI is a High-Growth Field Market size and industry adoption trends Demand surge in tech, healthcare, finance, and creative industries Investments and funding in AI startups
4. Key Career Roles in Generative AI Job titles & descriptions: AI Research Scientist Machine Learning Engineer (Generative AI focus) NLP Engineer, AI Product Manager Prompt Engineer Data Scientist (Generative Models) Skills required for each role
5. Salary Trends in Generative AI (2024-2025) Average salaries by role (global/US/India/Europe benchmarks) Factors affecting salary (experience, location, company size) Comparison with traditional AI/ML roles
6. Top Companies Hiring in Generative AI Tech Giants (Google, OpenAI, Microsoft, Meta, NVIDIA) Startups (Anthropic, Stability AI, Hugging Face) Industry-specific adopters (Healthcare, Finance, Gaming)
7. Skills Needed to Succeed in Generative AI Technical skills (Python, PyTorch, TensorFlow, LLM frameworks) Soft skills (creativity, problem-solving, collaboration) Certifications & courses to boost employability
8. Future Trends & Opportunities Emerging niches (AI ethics, multimodal models, AI law) Freelance vs. full-time opportunities Remote work trends in AI jobs
9. Challenges & How to Overcome Them Rapidly evolving tech landscape Competition in the job market Staying updated with advancements
10. How to Start/Break into Generative AI Learning roadmap (free & paid resources) Building a portfolio (GitHub, Kaggle, personal projects) Networking & mentorship tips
11. Conclusion & Key Takeaways Summary of growth potential Final motivational note for aspirants
Design & Delivery Guidelines: Use a modern, professional template (dark/light theme with AI-relevant visuals). Include charts/graphs for salary data and market trends. Add icons, infographics, and minimal text per slide. Ensure readability with bullet points, not paragraphs.”
输出:
点评:
目前的演示内容和设计都非常基础。表格难以阅读,整体体验不佳。像 Manus、Genspark 或 Gamma 这样的工具可能会带来更好的效果。

由于有一个将 Canva 链接到 ChatGPT 代理的选项,我尝试连接它以增强演示效果。

但是,我发现 Canva API 连接器目前是只读的,它允许搜索和检索现有设计,但不支持以编程方式创建新的演示文稿或上传文件。

ChatGPT Agent的酷炫之处在哪里?
ChatGPT Agent 拥有一系列独特功能,虽然看似不起眼,但却能极大地提升您的工作体验。其中一些功能包括:
- 您可以在其中安排任务。

- 你可以给它分配任务,合上笔记本电脑,然后去做任何你想做的事情。
- 当你的任务完成时,它会通过推送通知或电子邮件通知你。
- 它可以处理你自己的 Google 文档和文件(如果你允许的话)。
- 它可以在工作过程中被打断、停止,甚至提示,并且会整合你更新的要求。
- 在购买或执行任何涉及你个人信息的任务之前,它都会征求你的许可。
它是一个你可以对你颐指气使的助手,它不会抱怨!
ChatGPT代理:它是如何工作的?
ChatGPT 代理在底层通过一个统一的系统运行,该系统融合了两项关键技术:来自 Operator 的网络交互能力和深度研究技能(类似于深度研究能力)。
ChatGPT 代理是 Operator 和深度研究的自然演进。此前,两者各自独立运行,专注于不同的任务,而现在它们已集成在一起,可以有目的地执行自动化操作。这也解决了用户必须手动指定需要使用哪些工具来回答问题的问题。
通过在 ChatGPT 中整合这些互补的优势并引入额外的工具,该模型展现出了全新的功能。其中最大的优势是它能够暂停运行,并在稍后使用更新的输入重新开始运行。此前,过早停止响应会影响响应质量。而且,几乎不可能在不丢失进度的情况下继续运行。
该代理配备了多种工具:
- 可视化浏览器,用于通过图形界面与网站交互
- 基于文本的浏览器,用于对大量内容进行高效推理
- 终端访问,用于代码执行和文件操作
- 与各种服务的直接 API 连接
- 与 Gmail 和 GitHub 等应用的 ChatGPT 连接器集成
该工具包允许代理为每个任务选择最佳方法。
基准测试
当然,仅仅亲身实践不足以测试代理的全部能力。但为了更好地测试,我们准备了基准测试。这些基准测试以可视化的形式,更全面地展现了模型的优势和劣势。
1. 人类的最后考试 (HLE)
这项广泛的基准测试旨在测试人工智能在多个学科专家级问题上的表现。ChatGPT 代理创下了新的最高准确率,在复杂任务中表现出色。

2. DSBench
专注于现实世界的数据科学任务,包括数据分析和建模。ChatGPT 代理的表现显著优于人类和之前的模型。

3. SpreadsheetBench
在经济重要任务方面,ChatGPT 代理表现领先。

当前局限性
虽然功能强大,但该代理仍有一些不足之处。目前处于测试阶段的幻灯片创建功能,其输出结果在格式和优化方面显得有些粗糙。该公司承认,幻灯片查看器中显示的内容与最终导出的 PowerPoint 文件之间可能存在差异。
该代理目前还无法使用现有幻灯片作为模板,但电子表格支持此功能。
另一个缺点是它会严格遵循您提到的所有内容。这很好,前提是用户明确提出了要求——但事实可能并非如此。它无法独立思考并制定最佳的执行任务路径策略,这表明它缺乏对任务的内在理解。
该工具在幻灯片制作方面存在缺陷:结构僵化、缺乏策略性布局,以及需要彻底重新设计才能使用的输出结果。
行动时代的安全
使用代理时,请注意以下几点:
- 避免与代理共享敏感信息。
- 仔细检查代理生成的内容。
- 仅在手头的任务已完成时才使用代理。由于严格的使用限制,请勿临时修改代理。
未来会怎样?
经过实际操作后,我意识到 ChatGPT 代理擅长执行经过专门训练的任务或其他同类任务。但对于那些未被考虑在内、挑战完全不同的任务,它却举步维艰。但它提供了一个良好的“操作员+研究”框架,可以在此基础上解决复杂问题。随着 OpenAI 根据用户反馈不断更新该工具,它未来将不断改进。这种对模型的放任自流方法无疑为已经饱和的大型语言模型领域提供了一种不同的方法。


评论留言