
掌握 Claude Sonnet 4.5 和 Opus 4.1 的最新提示工程技術。學習如何使用 XML 標籤構建結構化提示、利用擴充套件思維解決複雜問題,以及如何透過“上下文優先”策略提升 30% 的響應質量。含完整遷移教程。
- 瞭解哪些提示技巧能為 Claude Sonnet 4.5 和 Opus 4.1 帶來可衡量的效能提升。
- 從 Claude 3.5 到 Claude 4.x 的行為轉變導致現有提示失效(我們將向您展示具體是哪些提示)。
- 閱讀前後對比示例,瞭解具體指標的實際效果差異。
- 瞭解五種經過測試資料和企業部署驗證的成熟技巧。
- 最後,我們將向您展示如何將提示從 Claude 3.5 遷移到 Claude 4.x 系統。
Claude Sonnet 4.5 於 2025 年 9 月釋出時,導致許多現有提示失效。這並非因為該版本存在漏洞,而是因為 Anthropic 重構了 Claude 執行指令的方式。
早期版本會推斷您的意圖,並對模糊的請求進行擴充套件。而 Claude 4.x 則會嚴格按照您的指示執行操作,不多不少。

為了理解這些新方法,我們根據 Anthropic 的文件、社羣實驗和實際部署情況,評估了 25 種常用的提示工程技術,以找出哪些提示與 Claude 4.x 版本配合得更好。以下是五種技術:
Claude 4.5中哪些變化導致現有提示失效?
Claude 4.5 模型優先考慮精確的指令,而非“好心”的猜測。
之前的版本會幫你填充空白。如果你要求“儀表盤”,它會預設你想要圖表、篩選器和資料表。
Claude 4.5 會嚴格按照你的要求執行。如果你要求一個儀表盤,它可能只會顯示一個帶有標題的空白框架,因為你沒有要求其他功能。
Anthropic 明確指出:“需要‘額外功能’的客戶可能需要更明確地提出這些功能的要求。”
所以,我們需要停止把模型當作魔法棒,而應該把它當作一個思維嚴謹的員工來對待。
5個經證實能顯著提升Claude表現的技巧
根據我們的研究,這五種技巧在 Claude 完成我們佈置的任務時,都能持續顯著地提升它的表現。
1. 結構化且帶標籤的提示
Claude Sonnet 4.5 的系統提示在各處都使用了結構化提示。Simon Willison 深入研究了系統提示,發現其中包含一些被 <behavior_instructions>、<artifacts_info> 和 <knowledge_cutoff> 等標籤包裹的部分。
實際上,您可以編輯“樣式”來檢視 Anthropic 的結構化提示是如何運作的。

我們可以推斷,Claude 接受過結構化提示的訓練,並且知道如何解析它們。XML、JSON 或其他帶標籤的提示格式都能很好地工作。
之前:Analyze this code for security vulnerabilities and performance issues. Focus on authentication flows and database queries. Provide specific recommendations with code examples.(譯文:分析此程式碼是否存在安全漏洞和效能問題。重點關注身份驗證流程和資料庫查詢。提供具體的建議並附上程式碼示例。)

之後(結構化提示):
<task>Analyze the provided code for security and performance issues</task><focus_areas>– Authentication flows– Database query optimization</focus_areas>
<code>[your code here]</code>
<output_requirements>– Identify specific vulnerabilities with severity ratings– Provide corrected code examples– Prioritize recommendations by business impact</output_requirements>

對比這些輸出,你會發現結構化提示會提供更多上下文資訊,幫助你理解並修復程式碼中的安全問題。它會解釋問題所在,說明修復方案的作用,並提供相應的程式碼修復。
其他適用格式:
JSON:
{
"task": "Review authentication code",
"focus_areas": ["Password hashing", "Session security", "SQL injection"],
"context": "Healthcare app, HIPAA required",
"output_format": "Risk, impact, fix, severity per vulnerability"
}
Clear Headers:
TASK: Review authentication code for vulnerabilities
FOCUS: Password hashing, sessions, SQL injection
CONTEXT: Healthcare app requiring HIPAA compliance
OUTPUT FORMAT: Risk → HIPAA impact → Fix → Severity
三種方法的效果都一樣好。
結構化提示最適用的情況:
- 包含多個提示元件(任務、背景、示例、要求)
- 輸入內容較長(超過 10,000 個程式碼或文件標記)
- 步驟清晰的順序工作流程
- 需要反覆參考特定部分的任務
何時可以跳過結構化提示:純文字即可滿足需求的簡單問題。
有效性評分:複雜任務 9/10,簡單查詢 5/10。
2. 擴充套件思維在複雜問題中的應用
擴充套件思維能夠顯著提升複雜推理任務的完成能力,但代價是速度有所下降。
Anthropic 公司釋出的 Claude 4 系統公告顯示,啟用擴充套件思維後,系統效能得到了顯著提升。在 AIME 2025 數學競賽中,該系統的成績也得到了顯著提高。

Cognition AI 報告稱,Sonnet 4.5 的規劃效能提升了 18%,並稱之為“自 Claude Sonnet 3.6 以來最大的提升”。
之前(標準模式):Solve this logic puzzle: Five houses in a row, each a different color…(譯文:解決以下邏輯謎題:五個房子排成一排,每個房子顏色都不同……)

拓展思考:Understand the logic of this puzzle systematically. Go through the constraints step by step, checking each possibility before reaching conclusions.Five houses in a row, each a different color…(譯文:系統地理解這個謎題的邏輯。逐步檢查限制條件,在得出結論前逐一檢驗每一種可能性。五棟房子排成一排,每棟房子顏色都不同……)

對於像上面這樣的簡單提示,您可能感覺不到太大區別。但對於複雜、特殊的難題(例如自定義程式碼庫、多步驟邏輯規劃),區別就顯而易見了。
擴充套件功能適用場景:
- 需要驗證的多步驟邏輯規劃
- 具有多條解法的數學推理
- 跨越多個檔案的複雜編碼任務
- 正確性比速度更重要的場景
不適用場景:快速迭代、簡單查詢、創意寫作、時間緊迫的任務
有效性評分:複雜推理 10/10,簡單查詢 3/10
3. 明確具體地描述需求
Claude 4 模型經過訓練,能夠比以往的幾代模型更精確地執行指令。
Anthropic 的文件指出:
Claude 4.x 模型對清晰明確的指令反應良好。明確描述您期望的輸出有助於提升結果。如果客戶希望獲得之前 Claude 模型所具備的‘超越以往’的功能,則可能需要在新模型中更明確地提出這些功能需求。
文件還指出,如果您提供規則存在的理由(而不僅僅是命令),Claude 能夠根據解釋進行泛化。這意味著提供理由有助於模型在未明確涵蓋的特殊情況下正確應用原則。
16x Eval 的測試表明,當指令明確規定了需求、格式和成功標準時,Opus 4 和 Sonnet 4 在 TODO 任務上的得分均為 9.5/10。這些模型展現出了令人印象深刻的簡潔性和指令執行能力。
之前(隱含預期):Create an analytics dashboard.(譯文:建立分析儀表板。)

你會注意到,這個輸出結果完全符合我們的要求。雖然 Claude 在美觀方面做了一些創意發揮,但它沒有任何實際功能。
後續(明確要求):Create an analytics dashboard. Include as many relevant features and interactions as possible. Go beyond the basics to create a fully-featured implementation with data visualization, filtering capabilities, and export functions.(譯文:建立一個分析儀表板。儘可能包含所有相關功能和互動。超越基礎功能,建立一個功能齊全的實現,包括資料視覺化、篩選功能和匯出功能。)

第二個輸出包含更詳細的提示,功能更豐富,它基於一些虛擬資料構建了一個儀表盤,以圖形和表格兩種格式呈現,並使用標籤頁分隔所有資料。
這就是最新版 Claude 中明確說明指令的作用。
為了進一步闡明這一點,這裡還有一個例子,展示了上下文如何提升指令的執行效果:
之前(無上下文的命令):NEVER use ellipses in your response.(切勿在回覆中使用省略號。)
之後(基於上下文的指令):Your response will be read aloud by a text-to-speech engine, so avoid ellipses since the engine won’t know how to pronounce them.(譯文:您的回覆將由文字轉語音引擎朗讀,因此請避免使用省略號,因為引擎無法正確發音。)
明確指令的關鍵原則:
- 明確定義“全面”的含義,以適應您的具體任務:不要假設 Claude 會推斷出質量標準。
- 解釋規則存在的原因,而不僅僅是陳述規則:Claude 能更好地從有針對性的指令中進行概括。
- 明確指定輸出格式:要求輸出“散文段落”,而不是寄希望於 Claude 不會預設生成專案符號列表。
- 提供具體的成功標準:任務完成的標準是什麼?
有效性評分:所有任務型別均為 9/10
4. 展示預期行為示例
少量提示可以為 Claude 提供示例輸入和輸出,以展示期望的行為。這種方法有效,但前提是示例必須高質量且與任務相關,而且效果會因用例而異。
Claude 4.x 模型非常注重細節和示例,這是其精確執行指令的一部分。請確保您的示例與您希望鼓勵的行為相符,並儘量避免您希望避免的行為。
Anthropic 建議,對於複雜任務,應提供 3-5 個多樣化且相關的示例。示例越多,效能越好。
以下是一個實際應用示例:

在這裡,Claude 在格式、表情符號的使用、資訊傳遞和語氣方面都進行了自由發揮。通用的企業用語
新增示例之所以有效,是因為它們能展示而非講述,同時還能闡明僅憑描述難以表達的細微要求。

此輸出更貼近我在提示中提供的示例。您可以使用少量示例的方法,使 LinkedIn 帖子與您表現最佳的帖子類似。一篇關於有限狀態機 (FSM) 設計的學術論文表明,結構化示例的成功率比沒有示例的說明高出 90%。
如何實現:
- 將示例放在
<example>標籤中,並用<examples>標籤分組。 - 將示例放在第一條使用者訊息的開頭。
- 對於複雜的任務,使用 3-5 個不同的示例。
- 確保示例中的每個細節都與預期輸出完全一致(Claude 4.x 會複製命名約定、程式碼風格、格式和標點符號)。
- 避免冗餘示例。
示例的最佳應用場景:
- 需要精確結構的資料格式化。
- 需要特定方法的複雜編碼模式。
- 展示推理方法的分析任務。
- 需要一致風格和約定的輸出。
何時可以跳過示例:簡單的查詢,說明就足夠了;或者當您希望 Claude 使用其自身的判斷時。
有效性評分:格式化任務 10/10,簡單查詢 6/10。
5. 在提問前新增上下文
Claude 的上下文視窗大小為 20 萬個詞元(某些情況下可達 100 萬),可以理解上下文中任何位置的查詢。但 Anthropic 的文件建議將較長的文件(2 萬個詞元以上)放在提示的頂部,查詢之前。
測試表明,與先問後答的排序方式相比,這種做法可以將響應質量提高高達 30%,尤其是在處理複雜的多文件輸入時。
原因在於,Claude 的注意力機制會賦予提示末尾的內容更高的權重。將問題放在上下文之後,可以讓模型在生成答案時參考之前的內容。
之前(問題優先):Analyze the quarterly financial performance and identify key trends.[20,000 tokens of financial data](譯文:分析季度財務業績並識別關鍵趨勢。[20,000 個財務資料詞元])
之後(上下文優先):[20,000 tokens of financial data]Based on the quarterly financial data provided above, analyze performance and identify key trends in revenue growth, margin expansion, and operating efficiency. Focus on actionable insights for executive decision-making.(譯文:[20,000 個財務資料詞元]基於以上提供的季度財務資料,分析業績並識別收入增長、利潤率提升和運營效率方面的關鍵趨勢。重點關注可供高管決策的可操作性見解。)
適用場景:需要 Claude 大量參考先前內容的長上下文分析。
可跳過場景:少於 5,000 個詞元的簡短提示。
有效性評分:長上下文任務 8/10,簡短提示 4/10
哪些提示技巧不再有效:破除常見誤區
Claude 4.5 的改動使一些在早期版本中行之有效的常用技巧失效。
1. 強調詞(全部大寫,“必須”、“總是”)
使用全部大寫字母不再能保證系統執行指令。Chris Tyson 的分析發現,Claude 現在更注重上下文和邏輯,而非強調。
如果你寫“絕不捏造資料”,但上下文暗示你需要估算值,Claude 4.5 會優先考慮邏輯需求,而非你使用大寫字母的指令。
改用條件邏輯:
- 錯誤:始終使用精確數字!
- 正確:如果有已驗證的資料,請使用精確數字。如果沒有,請提供範圍並將其標記為估算值。
2. 手動輸入思維導圖指令
在使用擴充套件思維模式時,告訴模型“按步驟思考”會浪費代幣。
啟用“擴充套件思維”後,模型會自行管理推理預算。此時新增“分步”指令是多餘的。
正確的做法:
信任工具。如果啟用“擴充套件思維”,請移除所有關於如何思考的指令。
3. 負面約束(“不要做X”)
直接告訴 Claude 不要做什麼往往會適得其反。
關於“粉紅大象”指令的研究表明,告訴高階模型不要思考某些事情反而會增加它關注該事情的可能性。
Claude 的注意力機制會突出顯示被禁止的概念,使其在上下文視窗中保持活躍。
因此,請將每個負面指令重新表述為正面指令:
- 錯誤做法:不要寫冗長空洞的引言。不要使用“深入研究”或“編織”之類的詞語。
- 正確做法:直接切入核心論點。使用簡潔有力的語言。
如何將提示詞從Claude 3.5遷移到Claude 4.5?
如果您要從 Claude 3.5 遷移到 4.5,可以按照五個經過開發者驗證的系統步驟來遷移您的提示詞庫。
本示例將使用一個常見的託管場景。目標是為在其 WordPress 網站上遇到“503 服務不可用”錯誤的客戶生成技術支援響應。

1. 稽覈隱含假設
首先,確定提示中哪些部分依賴於模型來猜測上下文。在舊版本中,模型會推斷您正在使用最常見的軟體棧。Claude 4.5 不會進行這種推斷。
舊版提示:“My website is loading slowly and showing errors. You are an expert server administrator. Think step by step and tell me how to fix the configuration to make it faster.”

稽覈結果:
- “Website”指的是通用設定,而非特定的內容管理系統(例如 WordPress)。
- “Slowly”一詞含義主觀,可能指首位元組響應時間過長或資源渲染緩慢。
- “Errors”缺少診斷所需的具體 HTTP 狀態程式碼。
- “Expert server administrator”和“Think step by step”是不必要的指導性說明。
在響應中,Claude 4.5 會要求提供更多資訊,因為它經過訓練,不會妄下斷言。
2. 重構以明確具體性
現在,請重寫提示資訊,以定義環境、具體問題和所需的輸出格式。您必須提供模型之前猜測的技術細節。
重構後的提示詞:“My WordPress site running on Nginx and Ubuntu 20.04 is experiencing high Time to First Byte (TTFB) and occasional 502 Bad Gateway errors. You are an expert server administrator. Think step by step and provide specific Nginx and PHP-FPM configuration changes to resolve these timeouts.”

結果:現在提示資訊會明確指出具體的軟體棧(Nginx、Ubuntu、WordPress)和具體錯誤(502 Bad Gateway),從而降低了出現與 Apache 或 IIS 無關建議的可能性。Claude 會提供分析和分步解決方案。
3. 實現條件邏輯
Claude 4.5 在處理決策樹時表現出色。與其要求模型給出單一的靜態解決方案,不如指示模型根據其分析的資料處理不同的場景。
使用邏輯提示詞:“My WordPress site running on Nginx and Ubuntu 20.04 is experiencing high TTFB and 502 Bad Gateway errors. You are an expert server administrator. Think step by step.If the error logs show ‘upstream sent too big header’, provide configuration changes for buffer sizes. If the error logs show ‘upstream timed out’, provide configuration changes for execution time limits.”

結果:輸出結果將變為動態的。該模型會根據您定義的特定根本原因邏輯提供針對性的解決方案,而不是提供通用的修復列表。
4. 移除過時的指示語
舊版提示通常包含使用者認為可以提升效能的思考指令。但對於 Claude 4.5 而言,這些指令已不再必要且冗餘,因為它已擴充套件了思考功能。
清理後的提示:“My WordPress site running on Nginx and Ubuntu 20.04 is experiencing high TTFB and 502 Bad Gateway errors.If the error logs show ‘upstream sent too big header’, provide configuration changes for buffer sizes. If the error logs show ‘upstream timed out’, provide configuration changes for execution time limits.”

結果:更簡潔的提示,專注於技術任務本身,避免了“你是專家”和“按步驟思考”等干擾性語句。
5. 系統性測試
使用 XML 或清晰的頭部資訊將各個元件組裝成結構化格式。這樣可以與模型的訓練資料相匹配,從而獲得最一致的結果。
ROLE: Linux System Administrator specializing in Nginx and WordPress performance. TASK: Resolve 502 Bad Gateway errors and reduce Time to First Byte (TTFB) for a WordPress site on Ubuntu 20.04. LOGIC: - If logs show 'upstream sent too big header', increase fastcgi_buffer_size and fastcgi_buffers. - If logs show 'upstream timed out', increase fastcgi_read_timeout in nginx.conf and request_terminate_timeout in www.conf. OUTPUT REQUIREMENTS: - Provide exact configuration lines to change. - Explain the impact of each change on server memory.

結果:回覆更有條理,讓我能夠按照要求使用可複製貼上的配置檔案資料解決問題,並且對解決方案的解釋也更加清晰。
這對您的工作流程意味著什麼
Claude 4.x 模型的工作方式與之前的模型有所不同。它們會嚴格按照您的指令執行,而不是假設您的意圖,這在您需要獲得一致結果時尤為重要。如果您需要重複執行相同的任務,那麼在初期投入到提示設計方面的精力將會得到回報。
本指南中的每項技術都經過精心挑選,因為它們與 Claude 4.x 的構建方式高度契合。XML 標籤、擴充套件思維模式、明確的指令、少量示例以及上下文優先的方法之所以有效,是因為根據 Claude 的提示指南和一些經驗證據,這很可能是 Anthropic 訓練模型的方式。
因此,不妨從本指南中選擇一兩項技術,並在您的實際工作流程中進行測試。評估哪些更改和方法對您有利。最好的方法是以你日常工作流程中的真實資料為依據的方法。

評論留言