作為學生,我們經常會思考期末考試後我們的成績會如何。因此,我們開始根據之前的室內考試成績、熬夜的次數以及之前在類似課程中的表現進行推測。這種更新我們對潛在表現的信念的方法與一個稱為“貝葉斯思維”的強大統計框架非常吻合。這項技術採用了貝葉斯定理的邏輯,在機器學習中我們稱之為貝葉斯公式。你可能從未完全意識到這一點,但我們對未來的大部分反思都嚴重依賴於貝葉斯條件機率。在本文中,我們將深入探討如何將貝葉斯思維與我們的日常生活聯絡起來,以形式化和改進我們對未來結果的估計。
貝葉斯思維的核心
顧名思義,貝葉斯思維基於貝葉斯定理,該定理主要遵循三個基本概念——先驗機率、似然機率和後驗機率。讓我們以評估期末考試成績為例來理解它們。
- 先驗機率:在看到新資料之前,我們對不確定因素(例如,期末考試得 A 的機率)的初始信念。
- 似然機率:在給定特定假設的情況下理解新資料的機率(例如,如果我們每天學習 x 小時,期末考試取得好成績的可能性有多大)。
- 後驗機率:當新情況發生時,我們更新後的信念,使用貝葉斯定理計算得出。
Source – Medium
這裡,對於兩個事件 A 和 B:
P(A) 是假設 B 的先驗機率。P(B|A) 是在假設 A 的情況下資料 B 的似然值。P(B) 是資料 B 的邊際機率。P(A|B) 是觀察到 B 之後 A 的後驗機率。
因此,在我們基於考試的場景中:
- 假設 (H):“我的期末考試成績能達到 85-90% 左右。”的想法。
- 資料 (D):期末考試前可獲得的資訊,例如剩餘學習時間、內部考試分數、以往主題的難度、模組數量等。
- 先驗:我們根據過去的表現(例如,之前的期末考試成績、總 CGPA 等)對 85-90% 得分的初始信念。
- 似然值:如果你的成績確實達到了 85-90%,那麼你獲得觀察到的內部考試分數的機率是多少。
- 後驗機率:在考慮了自身表現和剩餘學習天數後,我們對獲得 85-90% 分數機率的最新信念。
為什麼要使用貝葉斯思維?
既然您已經瞭解了貝葉斯思維,讓我來告訴您它如何幫助我們進行決策,以及我們為什麼需要使用它。
- 不確定性建模:簡而言之,這意味著我們對自己考試表現的直覺。貝葉斯思維迫使我們量化不確定性,例如假設自己的分數在 83-85 分之間。這可以讓我們做出更好的決策。
- 融合多重證據:我們可以系統地收集各種資訊,例如過去的成績、過去一年的常見問題解答等。這些證據可以被視為我們的獨立特徵。
- 動態更新:隨著我們收集到更多資訊,例如小組學習的有效性或參考優等生的筆記等,我們將更新後驗機率,並將其作為下一個證據的新先驗機率。
- 更好的規劃和資源分配:如果儘管我們付出了額外的學習,但獲得 A 的後驗機率仍然很低,我們或許可以把注意力轉移到下一個最佳成績——B,透過加大對薄弱模組的投入並最佳化計劃。
更好地理解情景
讓我們透過整合以下所有貝葉斯條件機率來更深入地理解我們的考試情景是如何進行的。在這種情況下,我們的計算方法如下:
Source – Vitalflux
1. 設定先驗機率
假設你是一名三年級工程專業的學生,你的專業科目歷年平均成績為 75%。根據你的整體學業記錄,你可能認為:
- 有 25% 的機率獲得 >= 90% 的成績(A 級)
- 有 50% 的機率獲得 80-90% 的成績(B 級)
- 有 25% 的機率獲得 70-80% 的成績(C 級)
以上百分比構成了我們各個成績等級的先驗分佈。我們將遵循貝葉斯公式的基本概念來繪製我們的值。
這些值可以被視為貝葉斯條件機率或分佈。
成績等級 | 先驗機率 P|H |
A (>=90%) | 0.25 |
B (80-90%) | 0.5 |
C (70-80%) | 0.25 |
2. 收集新證據
期末考試前兩週,你收到了 80% 的期末考試成績。這會如何影響你對期末考試的信心?首先,我們必須評估以下可能性:
- 假設你真的是一位 A 級績效者(≥90%),那麼你過去 80% 的時間內在質量方面得分超過 80%。
- 假設你是一位 B 級績效者(80-90%),那麼你 40% 的時間內在質量方面得分超過 80%。
- 假設你是一位 C 級績效者(70-80%),那麼你很少能達到這麼高的分數,大概只有 10% 的時間。
成績等級 | 先驗機率 P(H) | 似然值 P(D=80% | H) |
A (>=90%) | 0.25 | 0.8 |
B (80-90%) | 0.5 | 0.4 |
C (70-80%) | 0.25 | 0.1 |
3. 計算證據機率
為了歸一化並計算 P(D),內部得分 80% 的總體機率如下:
P(D)=(0.80×0.25)+(0.40×0.50)+(0.10×0.25)
P(D) = 0.20+0.20+0.025=0.425
4. 計算後驗機率
這裡我們將對每個等級應用貝葉斯定理:
P(A∣D)=(0.80×0.25) / 0.425 ≈ 0.47
P(B∣D)=(0.40×0.50) / 0.425 ≈ 0.47
P(C∣D)=(0.10×0.25) / 0.425 ≈ 0.06
結果顯示:
- 獲得 A-level 成績的機率為 47%,
- 獲得 B-level 成績的機率為 47%,
- 獲得 C-level 成績的機率為 6%。
5. 整合學習投入
接下來的一週,你記錄並追蹤你的每日學習時長。假設歷史資料顯示你在過去兩週內每天學習時間≥5 小時。那麼,
- A-level 學生通常 70% 的時間會遵循此原則。
- B-level 學生為 30% 的時間。
- C-level 學生為 5% 的時間。
假設你平均每天工作 6 小時。這會成為另一個資料“S”,我們需要計算其更新後的似然值:
等級 | 當前後驗機率 P(H) | 似然值 P(S = 6hrs/day | H) |
A | 0.47 | 0.7 |
B | 0.47 | 0.3 |
C | 0.06 | 0.05 |
我們將在此迴圈使用貝葉斯公式,隨著新證據的出現,我們的信念每次都會更新。用 P(S) 進行歸一化:
P(S)=(0.70×0.47)+(0.30×0.47)+(0.05×0.06) ≈ 0.329+0.141+0.003=0.473
進一步更新後:
P(A∣D,S)=0.70×0.47 / 0.473 ≈ 0.70
P(B∣D,S)=0.30×0.47 / 0.473 ≈ 0.30
P(C∣D,S)=0.05×0.06 / 0.473 ≈ 0.01
考慮到你勤奮學習的成果,你獲得 A 的信心上升到了 70% 。
6. 考慮剩餘天數
現在,我們假設距離期末考試還有 7 天,每一天都是複習或鞏固學習的機會。假設掌握剩餘主題意味著期末考試額外獲得 5% 的分數:
- 對於認真學習的 A-level 學生,獲得額外分數的可能性為 70%,
- 對於 B-level 學生,可能性為 30%,
- 對於 C-level 學生,可能性為 5%。
等級 | 先驗機率 P(H) | 似然值 P(Δ=+5%∣H) |
A | 0.7 | 0.7 |
B | 0.3 | 0.3 |
C | 0.01 | 0.05 |
再次進行歸一化和更新。最終的後驗機率如下:
P(A ∣ all) ≈ 0.84
P(B ∣ all) ≈ 0.16
P(C ∣ all) ≈ <0.01
最終的後驗機率顯示,A 的機率為 75%,B 的機率為 24%,C 的機率小於 1%。基於此,我們的總體機率很可能會上升。
如果您恰好有機器學習背景,我相信您可能會對這篇文章非常熟悉。是的,我們遵循的機制與樸素貝葉斯中使用的機制完全相同,即貝葉斯公式。
基於貝葉斯思維的決策
有了後驗分佈,我們現在可以做出合理且最佳化的決策。方法如下:
- 有針對性的複習:如果你獲得 A 的機率仍然很小(比如 55%),那就專注於那些能讓你從 B 升到 A 的高收益主題,而不是在已經掌握的素材上浪費更多時間。
- 風險管理:如果你獲得 B 的機率很高,但獲得 A 的機率很小,那就確保你在有挑戰性的問題上獲得部分學分,以鎖定 B。這將有助於確保你有更多的時間最佳化你的時間和資源,用於其他更容易獲得 A 的科目。
- 資源分配:透過估計這些干預措施對後驗分佈的影響程度,來決定是否在小組學習或優等生筆記上投入額外的時間是最合理的。
應用貝葉斯思維的實用技巧
貝葉斯思維並不需要複雜的數學知識。當我們獲得新的證據時,我們只需要一個清晰、結構化的方法來更新我們的信念。無論你是在個人生活、工作、研究還是學習中做出決策,將你的進步視為一個由資料塑造的動態信念系統,都能讓你做出更明智、更明智的決策。
以下是一些在日常場景中應用貝葉斯推理的實用方法:
- 量化你的先驗知識:首先反思你已知的知識,併為可能的結果分配粗略的機率(我們採用估計值,因為我們無法精確計算)。
- 收集可靠的似然估計:尋找與你的情況相關的歷史模式或相關性。如果沒有個人資料,可以從類似經歷、值得信賴的同行或領域專家那裡尋求見解。這些資訊也可以從他人的經驗中收集。
- 有條理地追蹤證據:記錄有意義的觀察、反饋、小型實驗的結果等,以便每一條新資料都能被納入更新你的信念中。
- 使用簡單的工具:您可以維護一個基本的電子表格,來追蹤您先前的信念如何隨著每個新證據的出現而演變。標註每個步驟可以使更新過程更加透明和易於管理。
- 頻繁更新,但要深思熟慮:不要對噪音或細微的波動反應過度。相反,選擇合理的檢查點(例如每週回顧、里程碑或關鍵決策)來正式更新您的信念。
- 結合具體情況解讀後驗機率:60% 的成功機率可能令人鼓舞,但並非絕對。使用這些更新後的機率來指導您的行動,同時繼續完善您的策略並尋求新的證據。
貝葉斯思維的應用
雖然我們的例子主要關注考試成績,但貝葉斯推理具有普遍適用性。一些常見的應用包括:
- 醫學診斷:醫生會在檢查結果出來後更新疾病機率。
- 機器學習:貝葉斯模型將引數視為分佈,從而實現原則性的不確定性估計。
- 商業預測:公司會根據新的市場資料調整銷售預測。
- 日常生活:即使是根據天氣預報和當前的天氣狀況來決定是否帶傘,也是一種貝葉斯思維。
透過有意識地用先驗機率、似然機率和後驗機率來構建問題,我們可以在決策過程中獲得更清晰的思路和更靈活的適應能力。我們可以量化新資訊對我們思維的影響,避免對噪音反應過度或對關鍵證據反應不足。
小結
貝葉斯思維能夠將任何不確定性轉化為清晰、透明且最佳化的決策流程。明確你的初始假設,評估新資訊或新特徵將如何改變這些假設,並持續更新這些資料,可以幫助你提升決策的清晰度和自信心。無論你是在評估專案成果、醫療診斷、市場趨勢,還是日常選擇,掌握這種方法都能為在不確定的情況下進行決策提供強大的框架。下次你面對未知時,不妨借鑑你的先驗知識,權衡你的證據,並讓貝葉斯定理指引你做出更明智的判斷。
評論留言