隨著SARS-CoV-2傳播程度的人工持續不確定性以及SARS-CoV-2變種的出現,早期診斷仍將是開辟COVID-19預防策略的核心。在有癥狀的胸片患者中及時發現COVID-19,不僅可以減少傳播,檢測還可以進行適當的人工治療以避免病情的進一步進展。雖然逆轉錄聚合酶鏈式反應(RT-PCR)檢測仍然是開辟診斷COVID-19的黃金標準,但檢測周轉時間長、胸片檢測和勞動力成本高以及檢測試劑短缺都阻礙了RT-PCR檢測的檢測獲得和使用。事實上,人工降低分析靈敏度以換取縮短檢測周轉時間和增加檢測的開辟可及性,可以非常有效地限制COVID-19的胸片傳播。因此,檢測迫切需要可獲得的人工、準確的開辟和具有成本效益的COVID-19篩查工具的提出,以便對有癥狀的胸片患者進行更好的分流,并優先對那些檢測前具有和可能傳播COVID-19的高概率患者進行確認性RT-PCR檢測。
雖然計算機斷層掃描(CT)成像已被常規用于COVID-19的檢測和疾病定性,但在臨床上,CT并不適用于大多數輕度疾病患者。相對而言,胸片(CXR)通常是對有急性呼吸道癥狀的患者進行初步評估的常規手段,且價格便宜、輻射劑量低,而且在絕大多數的醫院中都可以獲得。因此,CXR有可能被用來幫助有癥狀的患者檢測COVID-19的存在。但實際上,相當一部分患者缺乏可用于區分其與其他呼吸道感染的特征性CXR表現,因此在CXR上檢測COVID-19十分困難。
最近的研究表明,采用基于計算機視覺的深度神經網絡的人工智能(AI)模型可以檢測和學習CXR上的COVID-19特征。雖然十分具有臨床價值,但許多人工智能模型存在訓練數據集的偏差和較差的可推廣性。此外,由于許多研究集中在檢測健康人群中的COVID-19可能,沒有解決更多的臨床相關問題。因此,這些人工智能模型在臨床相關環境中的真正表現仍然是未知的。
為了應對這些挑戰,近日,發表在European Radiology雜志的一項研究使用COVID-19 CXR AI預測模型(RadGenX)對有癥狀的懷疑患有COVID-19的患者進行了驗證評估,為進一步實現以CXR為基礎的COVID-19快速準確診斷提供了支持。
本研究在168850張CXR上對深度學習模型(RadGenX)進行訓練,并在9個研究地點(美國、意大利和香港特區)的有癥狀患者的大型國際測試集和美國、歐洲的兩個公共數據集上得到驗證。性能由受試者工作特征曲線下的面積(AUC)來衡量。進行了引證模擬,以評估COVID-19疾病流行率的潛在范圍(3.33%至33.3%)的性能。在852個病例的獨立測試集上與放射科醫師進行了比較。
RadGenX在4倍交叉驗證中取得了0.89的AUC,在5894名患者的獨立測試群中取得了0.79(95%CI 0.78-0.80)的AUC。德隆測試顯示,來自不同地區(p < 0.01)、疾病嚴重程度(p < 0.001)、性別(p < 0.001)和年齡(p = 0.03)的患者的模型性能存在統計差異?;疾÷誓M顯示,陰性預測值從33.3%患病率時的86.1%增加到98.5%。與放射科醫生相比,McNemar測試顯示該模型具有更高的敏感性(p < 0.001),但特異性較低(p < 0.001)。
圖 AI模型的性能。A 來自4倍交叉驗證的RadGenX人工智能模型的ROC曲線;B RadGenX在合并的4倍交叉驗證上的ROC曲線
本研究驗證了一個通過CXR預測有癥狀患者COVID-19狀態的人工智能模型,同時提供了建模分析以顯示該模型在各種模擬的COVID-19疾病流行水平下的表現,并將其與放射科醫生進行了比較,作為PCR檢測的輔助診斷工具具有良好的靈敏度和高NPV,這在COVID-19流行的資源匱乏地區意義重大。
原文出處:
Michael D Kuo,Keith W H Chiu,David S Wang,et al.Multi-center validation of an artificial intelligence system for detection of COVID-19 on chest radiographs in symptomatic patients.DOI:10.1007/s00330-022-08969-z