聊天機器人使用自然語言處理(NLP)來理解使用者的意圖,並提供儘可能好的對話服務。意圖識別是聊天機器人架構中的一個關鍵特徵,它決定了聊天機器人是否能成功地滿足使用者在銷售、營銷或客戶服務方面的需求。
聊天機器人的訓練資料的數量是與使用者保持良好對話的關鍵。然而,資料質量決定了機器人檢測正確意圖和產生正確反應的能力。
在這篇文章中,我們為企業介紹了改善聊天機器人意圖識別的技術,以使其更有效率。
聊天機器人是如何識別意圖的?
來源: Journal of Information Science Theory and Practice
NLP允許聊天機器人理解使用者的資訊,而機器學習分類演算法則幫助它根據訓練資料對該資訊進行分類,以便做出正確的迴應。
聊天機器人進行有意義的對話所需的步驟包括:
1. 為NLU進行預處理
自然語言理解(NLU)是NLP的一個子領域,主要是組織使用者的非結構化輸入,使聊天機器人能夠理解和分析它。這個過程包括:
1. 語法分析: 識別基本的語法規則、單片語織、組合和彼此之間的關係。這包括:
- 將文字分割成更小的片段(單詞、短句),稱為 “標記”,”
- 將標記標記為名詞、動詞、形容詞,等等。這一步驟被稱為 “語篇標籤(PoS)”。
- 將單詞還原成它們的詞根,以便更好地分析。
- 過濾掉填充詞以節省處理大資料的空間和時間
2. 語義分析:通過以下方式推斷出輸入句子的含義:
- 區分每個詞的上下文
- 瞭解文字中單詞之間的關係。
3. NLU模型利用:
- 監督機器學習用於語法分析步驟(標記化、PoS標記),如支援向量機(SVM)、貝葉斯網路和最大熵演算法。
- 用於語義分析的無監督機器學習,如聚類演算法。
關於NLU和NLP之間的更多區別,你可以閱讀《NLU與NLP:主要區別與用例比較》一文。
2. 聊天機器人的意圖分類
客戶的潛在意圖的分類是由分類器完成的。一位客戶想檢查訂單的狀態,而另一位客戶可能想檢查她擁有的優惠券,這是兩種不同型別的查詢。
分類器是在相關標記的資料集上訓練出來的。因此,這是一個有監督的/人類在迴圈中的學習應用。分類器利用:
- 基於規則的模式匹配
- 機器學習分類演算法,如決策樹、naive Bayes和邏輯迴歸。
- 深度學習,如人工神經網路
意圖分類器用於將NLU過程的輸出與訓練資料集中的相關預定義標籤相匹配。例如,當使用者告訴聊天機器人 “我想預訂從休斯頓到洛杉磯的航班”,意圖分類器會將上下文和單詞序列分類到 “預訂航班” 標籤下。
3. 響應生成
為了產生反應,聊天機器人要麼依靠預先定義的建議,要麼可以在飛行中產生建議。
對於商業應用,迴應往往是預先定義的,以確保客戶獲得一致的服務,機器人不會以非預期的方式迴應,導致公共關係的失敗。
對話的制定是為了實現一個特定的目標,如獲取使用者的資訊,提供關於產品或服務的建議,或將使用者引向一個現場代理。
來源:Conversational AI for Real Estate
聊天機器人的意圖識別有哪些挑戰,以及如何克服這些挑戰?
挑戰
聊天機器人的目標是產生類似人類的全面對話,以滿足使用者的期望。然而,聊天機器人在理解使用者的意圖方面面臨著限制,因為:
- 自然語言是困難的,即使對人類也是如此。
- 作為人類,我們有能力使用不同的語言結構來表達我們的意圖。
- 使用者有時會打錯字,使用關鍵詞而不是完整的句子。
- 大多數聊天機器人的反應都侷限於訓練過的資料集中的預定義的意圖。
侷限性導致聊天機器人誤解了使用者的意圖,提供了錯誤的迴應,未能實現其使用目的。歡迎閱讀我們關於聊天機器人史詩般的失敗的文章,瞭解更多細節。
最佳實踐
然而,一些限制可以通過整合不同的解決方案來解決:
- 人工智慧拼寫檢查演算法可以通過NLP模型來實現自動糾正使用者的錯誤拼寫和錯別字。
例如,Google Docs的自動更正功能可以指出拼寫錯誤、語法錯誤,並提供關於文字結構的改進。 - 使用者可以建立自定義意圖。例如,在亞馬遜的Alexa中,使用者可以通過提供一個名字和使用者為呼叫該意圖而說的話語列表,為聊天機器人執行特定任務設定規則。
- 增加訓練資料量會降低意圖檢測的誤差率。
我們預計這個問題最終會通過擁有更多的訓練資料而得到解決。對話式機器人的使用量已經很大,而且在不斷增加。根據我們對聊天機器人的統計:
- 23%的組織在行政部門使用聊天機器人。
- 20%在客戶服務部門使用。
- 16%在銷售和營銷部門使用人工智慧聊天機器人和助手。
- 40%的千禧一代每天都會與聊天機器人打交道。
評論留言