ChatGPT代理全面評測:功能亮點、價格套餐與實際體驗

ChatGPT代理全面評測:功能亮點、價格套餐與實際體驗

文章目录

  • 什麼是ChatGPT Agent?
  • ChatGPT代理能做什麼?
  • ChatGPT代理:定價和發售日期
  • ChatGPT代理:如何訪問?
  • 實踐體驗:真實世界測試
  • 任務 1:研究與分析
  • 任務 2:規劃與選購
  • 任務 3:製作一份關於生成式人工智慧職業和薪資趨勢的PPT
  • ChatGPT Agent的酷炫之處在哪裡?
  • ChatGPT代理:它是如何工作的?
  • 基準測試
  • 1. 人類的最後考試 (HLE)
  • 2. DSBench
  • 3. SpreadsheetBench
  • 當前侷限性
  • 行動時代的安全
  • 未來會怎樣?

ChatGPT代理全面評測

ChatGPT 幫我們搞定了一切!從寫郵件、研究主題,甚至幫我們準備面試;但這就夠了嗎?遠遠不夠。畢竟,你得把郵件影印發給對方,或者在報告中展示研究成果,這都需要耗費大量的時間和精力。但現在不再如此了!對話和行動之間的界限已經打破。OpenAI 最新發布的“ChatGPT Agent”將 ChatGPT 從一個實用的聊天機器人變成了一個更具雄心壯志的平臺:一個可以代替你執行任務的數字助理。AI 不再只是提供解決方案的概述,而是會將解決方案付諸實踐。

但這並非一個萬能的工具,它仍然有很長的路要走,但它為未來提供了一個充滿希望的框架。本文將介紹它的功能、使用方法、實際操作、侷限性以及它對未來的展望。

什麼是ChatGPT Agent?

ChatGPT Agent

Source: ChatGPT

ChatGPT 代理於 2025 年 7 月 17 日釋出,進一步提升了 ChatGPT 的 AI 效能。它不再僅僅是談論任務,現在還可以瀏覽網站、處理資料、建立簡報,並從頭到尾處理複雜的工作流程。

代理模式本身就令人驚歎,有時甚至有些荒謬,而且距離黃金時段還很遠。

儘管這類代理已經存在一段時間了,但 ChatGPT 代理帶來了效能和易用性方面的承諾。基於 ChatGPT,該代理可以全天候工作,並“真正為您執行一些任務”。但與 ChatGPT 不同的是,我們的任務不會立即完成。這是因為代理可以利用深入研究來執行任務,從而提高質量,但同時也會延長工作時間。

ChatGPT代理能做什麼?

您可能會想,這個代理能帶來什麼?想象一下:你早上的工作日程包括瀏覽電子郵件、檢視新聞,以及尋找一些新工作。目前,你必須手動逐一完成所有這些活動。

ChatGPT 代理可以在虛擬環境中自行執行操作,為你提供幫助。它可以處理諸如“分析我的日曆並根據最新訊息向我簡要介紹即將召開的客戶會議”或“計劃和購買四人份日式早餐的食材”之類的請求。它可以智慧地瀏覽網站,篩選結果,在需要時提示你安全登入,執行程式碼,進行分析,並提供精美的輸出,例如可編輯的幻燈片和電子表格。

這項技術的特別之處在於它如何彌合研究與執行之間的差距。以前,聊天機器人被比作“沒有大腦的嘴巴”,這意味著它們可以傳達文字,但無法對其進行任何處理。因此,我們最終必須根據輸出結果進行判斷和採取行動。但現在,有了 ChatGPT 代理,這個問題迎刃而解。

ChatGPT代理:定價和發售日期

ChatGPT 代理將首先面向付費訂閱使用者推出,首先是 Pro 使用者,接下來幾天將面向 Plus 和 Team 使用者推出。企業版和教育版使用者將在接下來的幾周內獲得訪問許可權。Pro 使用者每月訊息使用上限為 400 條,其他付費套餐使用者每月訊息使用上限為 40 條,可透過積分選項獲得更多使用量。

ChatGPT代理:如何訪問?

您需要擁有 ChatGPT Pro 或 Plus 訂閱才能訪問代理。訂閱後,請按照以下說明操作:

  1. 在對話的任意時刻,透過編輯器中的工具下拉選單選擇“agent mode”,即可啟用 ChatGPT 的全新代理功能。

ChatGPT代理:如何訪問?

  1. 描述您想要完成的任務,例如進行深入研究、建立幻燈片或提交費用。
  2. 當 ChatGPT 執行您的任務時,螢幕上的旁白會準確顯示其正在執行的操作。
  3. 您可以隨時中斷並控制瀏覽器,以確保任務與您的目標保持一致。

* 最初,該模型僅限 ChatGPT Pro 使用者使用,但現在 ChatGPT Plus 使用者也可以使用。該模型正在推出高階版本,通常與付費或高階套餐捆綁銷售。但其可用性主要取決於 OpenAI 的策略。

實踐體驗:真實世界測試

ChatGPT 代理憑藉其自主工作能力,可以幫助我們端到端地完成任務。因此,我們針對我們日常需要幫助的三個常見任務測試了它的功能:

  1. 研究與分析
  2. 計劃與採購
  3. 思考與呈現

讓我們看看它是如何執行這些任務的。

任務 1:研究與分析

提示詞:“Create a comprehensive spreadsheet and analysis of the Indian Union Finance Budgets from 2020 to 2025, focusing on sector-wise allocations and trends.

Step-by-Step Instructions:

1: Data Collection & Spreadsheet Creation

  • Locate and compile the official Union Finance Budget documents for India from 2020 to 2025.
  • Extract the annual sector-wise budget allocations for each year (e.g., Agriculture, Health, Education, Defence, Infrastructure, etc.).
  • Present the data in a structured spreadsheet with columns for Year, Sector, and Allocation (in ₹ Crore/Billion).

2: Agriculture Budget Analysis

  • Analyze how the budget allocation for Agriculture has changed year-over-year during 2020–2025.
  • Include summary statistics and highlight any notable trends, increases, or decreases.
  • Create clear and insightful visualizations (such as line charts or bar graphs) to illustrate the changes in the Agriculture budget over this period.

3: Sectoral Growth Comparison

  • Calculate the absolute and percentage change in budget allocation for each sector from 2020 to 2025.
  • Rank all major sectors from the highest to the lowest based on their total rise in budget allocation (both absolute and percentage terms).
  • Visualize this comparison with appropriate charts (e.g., sorted bar chart).

Output Requirements:

  • A well-organized spreadsheet (Excel/Google Sheets) with clean, clearly labeled data.
  • At least two visualizations:
  • Agriculture budget trend (2020–2025).
  • Sectors ranked by growth in allocation.
  • A brief summary of key insights (2-3 paragraphs) highlighting major changes and trends.”

輸出:

點評:

ChatGPT 代理執行得非常好。它檢視了每年的預算報告,找出了分配給每個部門的預算,並且連續 6 年都如此。然後,它建立了一個包含所有這些資訊的電子表格(我可以直接使用……太棒了)。之後,它建立了一個彙總所有資訊的表格供我參考。它還按照提示繪製了一張圖表來顯示分配給農業的預算。最後,它提供了一個條形圖來顯示預算分配趨勢(按部門劃分),從預算佔比最高的部門開始。這相當於一週的研究和分析工作只用了 18 分鐘就完成了!

最棒的還不是這個!而是代理從最可靠的資訊來源——政府網站——獲取了這些資訊!

任務 2:規劃與選購

提示詞:I am planning my father’s birthday party, and I need you to help me organize and execute all the arrangements step by step. The event is on 14th August and will be a brunch party for about 60 guests near Chhatarpur, Delhi. Please act as my event planning assistant and handle the following tasks with detailed options, pricing, links, and next steps:

1. Venue Booking

Goal: Find and book a comfortable, well-rated venue for 60 people in or near Chhatarpur, Delhi.

Preferences:

  • Indoor or semi-outdoor space with good ambiance for a brunch event.
  • Availability on 14th August (10 AM – 3 PM).

Output: Provide at least 3 venue options with links, pricing, amenities, photos (if possible), and reasons why each is suitable.

2. Party Decorator

Goal: Find a professional decorator for brunch-themed birthday decor.

Preferences:

  • Simple but elegant decor (balloons, floral elements, photo corner).
  • Ability to customize based on theme and budget.

Output: Provide 3 decorators with portfolio links, their estimated cost for the setup, and key highlights.

3. Catering

Goal: Book a brunch caterer for 60 people.

Preferences:

  • Mix of North Indian & Continental options (veg + non-veg).
  • High-quality service & customizable menu.

Output: Provide 3 catering options with links, sample menus, per-person cost, and reviews.

4. Invitations

Goal: Design a digital invitation card for the event.

Preferences:

  • Elegant, festive, and easy to share on WhatsApp.
  • Include: Name (Father’s name), Date, Time, Venue, RSVP details.

Output: Share at least 2–3 design concepts with downloadable links (JPEG/PNG/PDF format).

5. Gift Purchase

Goal: Find and shortlist watches as a gift for my father.

Budget: ₹20,000.

Preferences:

  • Preferably branded (e.g., Titan, Fossil, Seiko, Citizen).
  • Classy, formal style.

Output: Provide 3–5 shortlisted watches with purchase links, pricing, and delivery timelines.

Important: Do not place the order without asking me for final confirmation.

6. Timeline & Execution Plan

Goal: Create a step-by-step timeline to finalize everything.

Output: A table with Task | Deadline | Dependencies | Status so I can track progress easily.

Once all options are shortlisted, guide me through the booking and purchasing process (venue, caterer, decorator, watch) and prepare a checklist to ensure nothing is missed. Also, keep budget optimization in mind while making recommendations.”

輸出:

點評:

我在兩個任務中注意到的一點是,它們都嚴格遵循提示。代理會恭敬地執行每條指令,這意味著它甚至會遵循你命令的順序。這讓你能夠掌控最終結果。它為我提供了各種選項,包括場地、裝飾師和餐飲服務商,並給出了每個選項的估算價格。例如,它提供了幾個選項,每個選項都包含與我的活動相關的特定資訊。它提供的禮品選項都在預算之內,並且都帶有連結!最後,它還提供了一個表格來幫助我管理任務的時間表!這將使跟蹤我的進度變得非常簡單。

生日早午餐邀請卡

最棒的是,這位客服人員對細節瞭如指掌,比如日期和活動型別。它的所有建議都很貼切。

任務 3:製作一份關於生成式人工智慧職業和薪資趨勢的PPT

提示詞: Create a visually appealing and informative PowerPoint presentation (10-15 slides) on ‘Career and Salary Growth in Generative AI.” The presentation should be data-driven, well-structured, and suitable for professionals looking to enter or advance in this field. Outline:

1. Title Slide Title: “Career and Salary Growth in Generative AI” Subtitle: Opportunities, Trends, and Future Prospects Your Name/Company (if applicable) Date

2. Introduction to Generative AI: Brief definition of Generative A,I Key technologies (LLMs, GANs, Diffusion Models, etc.) Real-world applications (ChatGPT, Midjourney, Copilot, etc.)

3. Why Generative AI is a High-Growth Field Market size and industry adoption trends Demand surge in tech, healthcare, finance, and creative industries Investments and funding in AI startups

4. Key Career Roles in Generative AI Job titles & descriptions: AI Research Scientist Machine Learning Engineer (Generative AI focus) NLP Engineer, AI Product Manager Prompt Engineer Data Scientist (Generative Models) Skills required for each role

5. Salary Trends in Generative AI (2024-2025) Average salaries by role (global/US/India/Europe benchmarks) Factors affecting salary (experience, location, company size) Comparison with traditional AI/ML roles

6. Top Companies Hiring in Generative AI Tech Giants (Google, OpenAI, Microsoft, Meta, NVIDIA) Startups (Anthropic, Stability AI, Hugging Face) Industry-specific adopters (Healthcare, Finance, Gaming)

7. Skills Needed to Succeed in Generative AI Technical skills (Python, PyTorch, TensorFlow, LLM frameworks) Soft skills (creativity, problem-solving, collaboration) Certifications & courses to boost employability

8. Future Trends & Opportunities Emerging niches (AI ethics, multimodal models, AI law) Freelance vs. full-time opportunities Remote work trends in AI jobs

9. Challenges & How to Overcome Them Rapidly evolving tech landscape Competition in the job market Staying updated with advancements

10. How to Start/Break into Generative AI Learning roadmap (free & paid resources) Building a portfolio (GitHub, Kaggle, personal projects) Networking & mentorship tips

11. Conclusion & Key Takeaways Summary of growth potential Final motivational note for aspirants

Design & Delivery Guidelines: Use a modern, professional template (dark/light theme with AI-relevant visuals). Include charts/graphs for salary data and market trends. Add icons, infographics, and minimal text per slide. Ensure readability with bullet points, not paragraphs.”

輸出:

點評:

目前的演示內容和設計都非常基礎。表格難以閱讀,整體體驗不佳。像 Manus、Genspark 或 Gamma 這樣的工具可能會帶來更好的效果。

生成式人工智慧職業和薪資趨勢的PPT

由於有一個將 Canva 連結到 ChatGPT 代理的選項,我嘗試連線它以增強演示效果。

將 Canva 連結到 ChatGPT 代理

但是,我發現 Canva API 聯結器目前是隻讀的,它允許搜尋和檢索現有設計,但不支援以程式設計方式建立新的簡報或上傳檔案。

Canva API 聯結器

ChatGPT Agent的酷炫之處在哪裡?

ChatGPT Agent 擁有一系列獨特功能,雖然看似不起眼,但卻能極大地提升您的工作體驗。其中一些功能包括:

  1. 您可以在其中安排任務。

安排任務

  1. 你可以給它分配任務,合上筆記型電腦,然後去做任何你想做的事情。
  2. 當你的任務完成時,它會透過推送通知或電子郵件通知你。
  3. 它可以處理你自己的 Google 文件和檔案(如果你允許的話)。
  4. 它可以在工作過程中被打斷、停止,甚至提示,並且會整合你更新的要求。
  5. 在購買或執行任何涉及你個人資訊的任務之前,它都會徵求你的許可。

它是一個你可以對你頤指氣使的助手,它不會抱怨!

ChatGPT代理:它是如何工作的?

ChatGPT 代理在底層透過一個統一的系統執行,該系統融合了兩項關鍵技術:來自 Operator 的網路互動能力和深度研究技能(類似於深度研究能力)。

ChatGPT 代理是 Operator 和深度研究的自然演進。此前,兩者各自獨立執行,專注於不同的任務,而現在它們已整合在一起,可以有目的地執行自動化操作。這也解決了使用者必須手動指定需要使用哪些工具來回答問題的問題。

透過在 ChatGPT 中整合這些互補的優勢並引入額外的工具,該模型展現出了全新的功能。其中最大的優勢是它能夠暫停執行,並在稍後使用更新的輸入重新開始執行。此前,過早停止響應會影響響應質量。而且,幾乎不可能在不丟失進度的情況下繼續執行。

該代理配備了多種工具:

  • 視覺化瀏覽器,用於透過圖形介面與網站互動
  • 基於文字的瀏覽器,用於對大量內容進行高效推理
  • 終端訪問,用於程式碼執行和檔案操作
  • 與各種服務的直接 API 連線
  • 與 Gmail 和 GitHub 等應用的 ChatGPT 聯結器整合

該工具包允許代理為每個任務選擇最佳方法。

基準測試

當然,僅僅親身實踐不足以測試代理的全部能力。但為了更好地測試,我們準備了基準測試。這些基準測試以視覺化的形式,更全面地展現了模型的優勢和劣勢。

1. 人類的最後考試 (HLE)

這項廣泛的基準測試旨在測試人工智慧在多個學科專家級問題上的表現。ChatGPT 代理創下了新的最高準確率,在複雜任務中表現出色。

人類的最後考試 (HLE)

2. DSBench

專注於現實世界的資料科學任務,包括資料分析和建模。ChatGPT 代理的表現顯著優於人類和之前的模型。

DSBench DSBench

3. SpreadsheetBench

在經濟重要任務方面,ChatGPT 代理表現領先。

SpreadsheetBench

當前侷限性

雖然功能強大,但該代理仍有一些不足之處。目前處於測試階段的幻燈片建立功能,其輸出結果在格式和最佳化方面顯得有些粗糙。該公司承認,幻燈片檢視器中顯示的內容與最終匯出的 PowerPoint 檔案之間可能存在差異。

該代理目前還無法使用現有幻燈片作為模板,但電子表格支援此功能。

另一個缺點是它會嚴格遵循您提到的所有內容。這很好,前提是使用者明確提出了要求——但事實可能並非如此。它無法獨立思考並制定最佳的執行任務路徑策略,這表明它缺乏對任務的內在理解。

該工具在幻燈片製作方面存在缺陷:結構僵化、缺乏策略性佈局,以及需要徹底重新設計才能使用的輸出結果。

行動時代的安全

使用代理時,請注意以下幾點:

  1. 避免與代理共享敏感資訊。
  2. 仔細檢查代理生成的內容。
  3. 僅在手頭的任務已完成時才使用代理。由於嚴格的使用限制,請勿臨時修改代理。

未來會怎樣?

經過實際操作後,我意識到 ChatGPT 代理擅長執行經過專門訓練的任務或其他同類任務。但對於那些未被考慮在內、挑戰完全不同的任務,它卻舉步維艱。但它提供了一個良好的“操作員+研究”框架,可以在此基礎上解決複雜問題。隨著 OpenAI 根據使用者反饋不斷更新該工具,它未來將不斷改進。這種對模型的放任自流方法無疑為已經飽和的大型語言模型領域提供了一種不同的方法。

評論留言