作为学生,我们经常会思考期末考试后我们的成绩会如何。因此,我们开始根据之前的室内考试成绩、熬夜的次数以及之前在类似课程中的表现进行推测。这种更新我们对潜在表现的信念的方法与一个称为“贝叶斯思维”的强大统计框架非常吻合。这项技术采用了贝叶斯定理的逻辑,在机器学习中我们称之为贝叶斯公式。你可能从未完全意识到这一点,但我们对未来的大部分反思都严重依赖于贝叶斯条件概率。在本文中,我们将深入探讨如何将贝叶斯思维与我们的日常生活联系起来,以形式化和改进我们对未来结果的估计。
贝叶斯思维的核心
顾名思义,贝叶斯思维基于贝叶斯定理,该定理主要遵循三个基本概念——先验概率、似然概率和后验概率。让我们以评估期末考试成绩为例来理解它们。
- 先验概率:在看到新数据之前,我们对不确定因素(例如,期末考试得 A 的概率)的初始信念。
- 似然概率:在给定特定假设的情况下理解新数据的概率(例如,如果我们每天学习 x 小时,期末考试取得好成绩的可能性有多大)。
- 后验概率:当新情况发生时,我们更新后的信念,使用贝叶斯定理计算得出。
Source – Medium
这里,对于两个事件 A 和 B:
P(A) 是假设 B 的先验概率。P(B|A) 是在假设 A 的情况下数据 B 的似然值。P(B) 是数据 B 的边际概率。P(A|B) 是观察到 B 之后 A 的后验概率。
因此,在我们基于考试的场景中:
- 假设 (H):“我的期末考试成绩能达到 85-90% 左右。”的想法。
- 数据 (D):期末考试前可获得的信息,例如剩余学习时间、内部考试分数、以往主题的难度、模块数量等。
- 先验:我们根据过去的表现(例如,之前的期末考试成绩、总 CGPA 等)对 85-90% 得分的初始信念。
- 似然值:如果你的成绩确实达到了 85-90%,那么你获得观察到的内部考试分数的概率是多少。
- 后验概率:在考虑了自身表现和剩余学习天数后,我们对获得 85-90% 分数概率的最新信念。
为什么要使用贝叶斯思维?
既然您已经了解了贝叶斯思维,让我来告诉您它如何帮助我们进行决策,以及我们为什么需要使用它。
- 不确定性建模:简而言之,这意味着我们对自己考试表现的直觉。贝叶斯思维迫使我们量化不确定性,例如假设自己的分数在 83-85 分之间。这可以让我们做出更好的决策。
- 融合多重证据:我们可以系统地收集各种信息,例如过去的成绩、过去一年的常见问题解答等。这些证据可以被视为我们的独立特征。
- 动态更新:随着我们收集到更多信息,例如小组学习的有效性或参考优等生的笔记等,我们将更新后验概率,并将其作为下一个证据的新先验概率。
- 更好的规划和资源分配:如果尽管我们付出了额外的学习,但获得 A 的后验概率仍然很低,我们或许可以把注意力转移到下一个最佳成绩——B,通过加大对薄弱模块的投入并优化计划。
更好地理解情景
让我们通过整合以下所有贝叶斯条件概率来更深入地理解我们的考试情景是如何进行的。在这种情况下,我们的计算方法如下:
Source – Vitalflux
1. 设定先验概率
假设你是一名三年级工程专业的学生,你的专业科目历年平均成绩为 75%。根据你的整体学业记录,你可能认为:
- 有 25% 的概率获得 >= 90% 的成绩(A 级)
- 有 50% 的概率获得 80-90% 的成绩(B 级)
- 有 25% 的概率获得 70-80% 的成绩(C 级)
以上百分比构成了我们各个成绩等级的先验分布。我们将遵循贝叶斯公式的基本概念来绘制我们的值。
这些值可以被视为贝叶斯条件概率或分布。
成绩等级 | 先验概率 P|H |
A (>=90%) | 0.25 |
B (80-90%) | 0.5 |
C (70-80%) | 0.25 |
2. 收集新证据
期末考试前两周,你收到了 80% 的期末考试成绩。这会如何影响你对期末考试的信心?首先,我们必须评估以下可能性:
- 假设你真的是一位 A 级绩效者(≥90%),那么你过去 80% 的时间内在质量方面得分超过 80%。
- 假设你是一位 B 级绩效者(80-90%),那么你 40% 的时间内在质量方面得分超过 80%。
- 假设你是一位 C 级绩效者(70-80%),那么你很少能达到这么高的分数,大概只有 10% 的时间。
成绩等级 | 先验概率 P(H) | 似然值 P(D=80% | H) |
A (>=90%) | 0.25 | 0.8 |
B (80-90%) | 0.5 | 0.4 |
C (70-80%) | 0.25 | 0.1 |
3. 计算证据概率
为了归一化并计算 P(D),内部得分 80% 的总体概率如下:
P(D)=(0.80×0.25)+(0.40×0.50)+(0.10×0.25)
P(D) = 0.20+0.20+0.025=0.425
4. 计算后验概率
这里我们将对每个等级应用贝叶斯定理:
P(A∣D)=(0.80×0.25) / 0.425 ≈ 0.47
P(B∣D)=(0.40×0.50) / 0.425 ≈ 0.47
P(C∣D)=(0.10×0.25) / 0.425 ≈ 0.06
结果显示:
- 获得 A-level 成绩的概率为 47%,
- 获得 B-level 成绩的概率为 47%,
- 获得 C-level 成绩的概率为 6%。
5. 整合学习投入
接下来的一周,你记录并追踪你的每日学习时长。假设历史数据显示你在过去两周内每天学习时间≥5 小时。那么,
- A-level 学生通常 70% 的时间会遵循此原则。
- B-level 学生为 30% 的时间。
- C-level 学生为 5% 的时间。
假设你平均每天工作 6 小时。这会成为另一个数据“S”,我们需要计算其更新后的似然值:
等级 | 当前后验概率 P(H) | 似然值 P(S = 6hrs/day | H) |
A | 0.47 | 0.7 |
B | 0.47 | 0.3 |
C | 0.06 | 0.05 |
我们将在此循环使用贝叶斯公式,随着新证据的出现,我们的信念每次都会更新。用 P(S) 进行归一化:
P(S)=(0.70×0.47)+(0.30×0.47)+(0.05×0.06) ≈ 0.329+0.141+0.003=0.473
进一步更新后:
P(A∣D,S)=0.70×0.47 / 0.473 ≈ 0.70
P(B∣D,S)=0.30×0.47 / 0.473 ≈ 0.30
P(C∣D,S)=0.05×0.06 / 0.473 ≈ 0.01
考虑到你勤奋学习的成果,你获得 A 的信心上升到了 70% 。
6. 考虑剩余天数
现在,我们假设距离期末考试还有 7 天,每一天都是复习或巩固学习的机会。假设掌握剩余主题意味着期末考试额外获得 5% 的分数:
- 对于认真学习的 A-level 学生,获得额外分数的可能性为 70%,
- 对于 B-level 学生,可能性为 30%,
- 对于 C-level 学生,可能性为 5%。
等级 | 先验概率 P(H) | 似然值 P(Δ=+5%∣H) |
A | 0.7 | 0.7 |
B | 0.3 | 0.3 |
C | 0.01 | 0.05 |
再次进行归一化和更新。最终的后验概率如下:
P(A ∣ all) ≈ 0.84
P(B ∣ all) ≈ 0.16
P(C ∣ all) ≈ <0.01
最终的后验概率显示,A 的概率为 75%,B 的概率为 24%,C 的概率小于 1%。基于此,我们的总体概率很可能会上升。
如果您恰好有机器学习背景,我相信您可能会对这篇文章非常熟悉。是的,我们遵循的机制与朴素贝叶斯中使用的机制完全相同,即贝叶斯公式。
基于贝叶斯思维的决策
有了后验分布,我们现在可以做出合理且优化的决策。方法如下:
- 有针对性的复习:如果你获得 A 的几率仍然很小(比如 55%),那就专注于那些能让你从 B 升到 A 的高收益主题,而不是在已经掌握的素材上浪费更多时间。
- 风险管理:如果你获得 B 的几率很高,但获得 A 的几率很小,那就确保你在有挑战性的问题上获得部分学分,以锁定 B。这将有助于确保你有更多的时间优化你的时间和资源,用于其他更容易获得 A 的科目。
- 资源分配:通过估计这些干预措施对后验分布的影响程度,来决定是否在小组学习或优等生笔记上投入额外的时间是最合理的。
应用贝叶斯思维的实用技巧
贝叶斯思维并不需要复杂的数学知识。当我们获得新的证据时,我们只需要一个清晰、结构化的方法来更新我们的信念。无论你是在个人生活、工作、研究还是学习中做出决策,将你的进步视为一个由数据塑造的动态信念系统,都能让你做出更明智、更明智的决策。
以下是一些在日常场景中应用贝叶斯推理的实用方法:
- 量化你的先验知识:首先反思你已知的知识,并为可能的结果分配粗略的概率(我们采用估计值,因为我们无法精确计算)。
- 收集可靠的似然估计:寻找与你的情况相关的历史模式或相关性。如果没有个人数据,可以从类似经历、值得信赖的同行或领域专家那里寻求见解。这些信息也可以从他人的经验中收集。
- 有条理地追踪证据:记录有意义的观察、反馈、小型实验的结果等,以便每一条新数据都能被纳入更新你的信念中。
- 使用简单的工具:您可以维护一个基本的电子表格,来追踪您先前的信念如何随着每个新证据的出现而演变。标注每个步骤可以使更新过程更加透明和易于管理。
- 频繁更新,但要深思熟虑:不要对噪音或细微的波动反应过度。相反,选择合理的检查点(例如每周回顾、里程碑或关键决策)来正式更新您的信念。
- 结合具体情况解读后验概率:60% 的成功概率可能令人鼓舞,但并非绝对。使用这些更新后的概率来指导您的行动,同时继续完善您的策略并寻求新的证据。
贝叶斯思维的应用
虽然我们的例子主要关注考试成绩,但贝叶斯推理具有普遍适用性。一些常见的应用包括:
- 医学诊断:医生会在检查结果出来后更新疾病概率。
- 机器学习:贝叶斯模型将参数视为分布,从而实现原则性的不确定性估计。
- 商业预测:公司会根据新的市场数据调整销售预测。
- 日常生活:即使是根据天气预报和当前的天气状况来决定是否带伞,也是一种贝叶斯思维。
通过有意识地用先验概率、似然概率和后验概率来构建问题,我们可以在决策过程中获得更清晰的思路和更灵活的适应能力。我们可以量化新信息对我们思维的影响,避免对噪音反应过度或对关键证据反应不足。
小结
贝叶斯思维能够将任何不确定性转化为清晰、透明且优化的决策流程。明确你的初始假设,评估新信息或新特征将如何改变这些假设,并持续更新这些数据,可以帮助你提升决策的清晰度和自信心。无论你是在评估项目成果、医疗诊断、市场趋势,还是日常选择,掌握这种方法都能为在不确定的情况下进行决策提供强大的框架。下次你面对未知时,不妨借鉴你的先验知识,权衡你的证据,并让贝叶斯定理指引你做出更明智的判断。
评论留言