
醫療保健因其高昂的成本和各種挑戰而備受關注。然而,問題遠不止於此,包括頻繁的診斷誤報和手術失誤,這些都導致了結果的不確定性。隨著大型語言模型 (LLM) 的興起,人們可能會思考它們如何改善醫療保健。如今,憑藉 LLM,醫療保健不僅變得更加經濟實惠,而且更加可靠。本文重點介紹人工智慧在醫療保健領域的進展,以及以前所未有的規模和精度解決問題的最新突破。
醫療保健現狀

全球醫療保健均等化
世界各地的醫療費用高昂,且不均衡。由於成本和公平性,良好的醫療保健在一些國家是一種奢侈,而在其他國家,由於質量和可及性不足,良好的醫療保健卻是一個問題。全球約有一半人缺乏基本醫療保險,超過十億人因醫療費用而面臨嚴重的經濟困難。人均支出差異巨大!一項調查預測,到 2024 年,美國的人均醫療費用將達到 12,703 美元,而巴基斯坦僅為 37 美元,這反映出醫療支出的巨大不平等。自付費用在較貧窮地區仍然是一個沉重的負擔。在非洲,世界衛生組織估計,超過 1.5 億人因醫療費用而陷入貧困。此外,全球一半的醫療費用貧困發生在非洲。這些數字強調,在某些地方,醫療保健等基本設施實際上可能是一種奢侈品。

美國和巴基斯坦醫療支出差距
為人工智慧奠定基礎
與人工智慧最初進入並落地的技術領域不同,人工智慧在醫療保健領域的發展歷程漫長而曲折。該領域尚未成熟到可以完全融入,但隨著一些發展,這一階段已經做好準備。
遠端醫療與數字化轉型
自新冠疫情爆發以來,遠端醫療諮詢和遠端監控已變得普遍,並且遠高於2020年前的水平。到2021年中期,遠端醫療在所有門診就診中的佔比穩定在13-17%左右。這種持續的使用反映了患者和醫療服務提供者的需求。德勤的一項調查發現,約80%的消費者打算在疫情後再次進行線上就診。分析師估計,如果廣泛採用,高達20%的美國醫療保健支出(約2500億美元)有可能實現線上化。換句話說,遠端醫療可以將大量的醫療服務轉移到線上,從而在不犧牲醫療服務可及性的情況下降低成本。
AI在醫療保健領域的崛起
人工智慧已逐漸成為現代醫療保健的基礎組成部分。從輔助醫學影像到自動化診斷,人工智慧已被證明在減少人為錯誤和提高效率方面具有重要價值。它還使以前無法獲得人工智慧服務的領域得以應用。早期的人工智慧工具專注於一些較為狹窄的任務,例如標記X光片中的異常以進行診斷,或預測醫院的再入院率以保障保險。但最近的進展使人工智慧系統能夠推理和解讀複雜的醫療資料。這一演變的核心是大型語言模型,它代表了醫療保健領域的新前沿。該技術提供的模型超越了任務自動化,提供了能夠分析、解讀甚至模擬真實場景的工具。
醫學LLM的最新進展
微軟和谷歌在醫療保健領域的最新進展,即谷歌的 MedGemma 和微軟的 MAI-DxO,都深深植根於 LLM。它們利用 LLM 進行臨床推理、生成醫療報告,並增強臨床醫生的決策能力。
MedGemma
谷歌釋出了兩款面向醫療 AI 的全新開放模型:MedGemma 27B Multimodal 和 MedSigLIP。此舉旨在擴充套件其在健康 AI 開發者基金會 (HAI-DEF) 倡議下的 MedGemma 模型庫。
- MedGemma 27B Multimodal 可以同時處理文字和影像,非常適合生成醫療報告。它在 MedQA 基準測試中的得分高達 87.7%,足以媲美大型模型,但成本卻低得多。
- MedSigLIP 是一個擁有 4 億引數的影像文字編碼器,基於醫學影像(例如胸部 X 光片和病理切片)進行訓練。它非常適合分類、影像搜尋和零樣本任務,並且在處理一般影像時也表現出色。
這兩個模型均為開源模型,可在單個 GPU 上執行,並可針對特定用例進行微調。MedGemma 4B 和 MedSigLIP 等小型模型甚至可以在移動裝置上執行。

Source: Google
開發者已將這些 LLM 應用於實際任務:X 光分診、臨床記錄彙總,甚至多語言醫療問答。谷歌還提供了 Hugging Face 和 Vertex AI 的示例程式碼、部署指南和演示。
MAI-DxO
微軟的 AI Diagnostic Orchestrator (MAI-DxO) 是一個旨在應對醫學領域最棘手診斷挑戰的全新系統。該模型在準確性和成本效益方面均優於醫生。在《新英格蘭醫學雜誌》的 304 個真實臨床病例上進行測試,MAI-DxO 的診斷準確率高達 85.5%,比經驗豐富的醫生(平均 20%)高出 4 倍以上。它的工作原理是模擬臨床醫生逐步收集和評估資訊的方式,而不是依賴於多項選擇題。每個診斷操作都透過虛擬成本進行跟蹤,這表明 MAI-DxO 比傳統方法更智慧、更高效。

Source: Microsoft
這項工作以微軟更廣泛的醫療 AI 工作為基礎,包括面向臨床醫生的 Dragon Copilot 和麵向放射科的 RAD-DINO。其中一項關鍵創新是協調器能夠協調多個 LLM,就像一個虛擬醫生小組,共同協作以達成診斷。微軟研究團隊認為,這是邁向醫療保健領域負責任、值得信賴的 AI 的重要一步,尤其是在複雜病例的治療方面。
人工智慧應用帶來的影響
包括 LLM 在內的人工智慧正在提高多種工作流程的效率。最近的一項估計表明,更廣泛地採用 AI 可以將美國的醫療支出減少 5-10%,每年約 2000-3600 億美元。AI 工具可以自動執行臨床文件、診斷和行政協助等任務。然而,專家強調,這些優勢取決於合適的基礎設施和成本。在實踐中,醫療系統需要權衡定製的 AI 解決方案和工具,這些工具的選擇範圍從開發新模型到使用外部服務。最終決策取決於系統需求和成本考慮。總體而言,雖然 LLM 可以透過提高效率來降低醫療保健成本,但它們需要在技術方面進行大量的初始投資。
混合訊號和剩餘挑戰
總體而言,儘管存在這些趨勢,但醫療可負擔性的改善並不均衡。以下是醫療可負擔性和醫療保健系統面臨的一些挑戰:
- 改善不均衡:雖然存在積極的趨勢,但醫療保健可負擔性的改善在不同國家或不同人群之間並不一致(從非洲的例子可以看出)。
- 有前景的工具存在,但成本仍在上升:政府的政策變化以及遠端醫療和人工智慧等解決方案顯示出希望,但許多地區的醫療保健成本仍在上升。
- 災難性的醫療費用仍然很常見:據世界銀行專家稱,許多人仍然面臨災難性的醫療支出,醫療費用使他們陷入貧困。
- 自2015年以來,醫療保險的進展停滯不前:全球醫療保險的進展基本停滯,近年來幾乎沒有取得任何進展。
- 大多數國家缺乏全面保障:根據世界衛生組織的資料,許多地區的自付費用仍然很高,只有30%的國家同時改善了醫療保險覆蓋率和財務保障。
小結
技術和政策正透過 LLM 和人工智慧 (AI) 推動醫療服務更加平價,但差距依然存在。數十億人仍然無法獲得平價醫療服務。要在全球範圍內實現平價醫療,需要數字化應用、智慧融資和持續創新——一些高收入國家正在快速推進這些努力,但較貧窮的國家尚未啟動。隨著這些龐大的醫療 LLM 專案的推出,這些不同地區之間的差距正在縮小。前景充滿希望,但並不完整:我們擁有降低醫療成本的工具,但這些工具的全球實施和接受還遠未實現。
常見問題
問題 1:我們真的在朝著全球更便宜的醫療服務邁進嗎?
答:答案喜憂參半。全球醫療可負擔性的改善並不均衡。人工智慧、遠端醫療和仿製藥具有節省成本的潛力,但不斷上漲的成本和數十億人面臨的經濟困境意味著實施工作尚未完成。
問題 2:大型語言模型 (LLM) 和人工智慧如何讓醫療服務更平價?
A. LLM 和人工智慧 (AI) 可以改善診斷,自動化管理任務,並提高臨床效率,從而可能節省數十億美元。其效益取決於基礎設施和訓練有素的員工。
Q3. 自新冠疫情 (COVID-19) 以來,遠端醫療對醫療成本有何影響?
A. 新冠疫情後,遠端醫療的使用率有所上升,穩定在 13-17% 的就診率,80% 的患者有重複使用意願。它可以降低成本,並將 2500 億美元的美國醫療服務轉移到線上。
Q4. 仿製藥和定價政策如何促進醫療可負擔性?
A. 仿製藥和定價政策可以降低成本。到 2028 年,仿製藥市場將增長 50%。美國醫療保險 (Medicare) 透過談判在 2023 年節省了 60 億美元的藥品價格。
Q5. 阻礙全民醫療可負擔性的主要挑戰是什麼?
A. 挑戰包括全球不平等、災難性的成本、覆蓋進展停滯以及對基礎設施的需求。只有30%的國家同時提高覆蓋率和財務保障。

評論留言