亞洲健康互聯
優化產業的推手,生醫商機的GPS!

首頁產業資訊醫材報導醫材產業機器學習與檢驗醫學的現在和未來

機器學習與檢驗醫學的現在和未來

來源 : 亞洲健康互聯海外中心
update : 2019/04/03

隨著醫療保健需求持續增長,實驗室測試的數量也在增長。與其他行業類似,檢驗醫學領域的研究已開始研究機器學習(ML)的使用,以減輕增加服務需求和提高品質與安全的負擔。

在過去的十年中,由於高速電腦對圖形處理單元的可用性、卷積神經網絡的整合,深度學習的優化以及更大的數據集,機器學習對基準任務的統計性能顯著提高。

然而,正在形成的共識是,依賴於標記數據集的監督機器學習演算法的一般性能,已達到臨界實驗室人員應認真考慮企業級任務關鍵型應用的臨界點。

近年來,與機器學習相關的研究出版物在病理學和實驗室醫學中顯著增加。然而,儘管最近在技術方面取得了很大進展並且文獻越來越多,但很少有例子可以用於常規臨床實踐。這強調了儘管技術進步,但由於現有數據集的內在局限性和技術本身的狀態以及其他障礙,機器學習的進展仍然緩慢。

隨著實驗室醫學繼續進行數位化和自動化,臨床實驗室人員可能會面臨與評估、實施和驗證機器學習演算法相關的挑戰,無論是在實驗室內部還是外部。了解機器學習的優點、可以應用的地方,以及機器學習領域的最新技術和局限性對實踐專業人員有用。

耶魯大學醫學院實驗室醫學系臨床研究員暨住院醫師Thomas JS Durant醫學博士,在美國臨床實驗室新聞上發表了一篇文章,討論了機器學習技術在現代臨床實驗室工作流程中的當前實施,以及對齊兩個歷史悠久領域的潛在障礙。

機器從哪裡學習?
Durant博士寫道,隨著機器學習技術的採用並整合到健康資訊(HIS)的複雜基礎設施中,機器學習如何影響實驗室醫學實踐仍然是一個懸而未決的問題。特別是,必須考慮實施障礙,並確定利益相關者的治理、開發、 驗證和維護,但是,臨床實驗室應首先考慮實驗室內部或下游的機器學習應用。

機器學習內部實驗室
由總部位於瑞典隆德的Cellavision AB銷售的《Cellavision DM96》,是少數經過美國食品暨藥物管理FDA批准,被廣泛採用於臨床實驗室的商業產品。該產品於2001年獲得FDA批准。

最近,由亞利桑那州圖桑的Accelerate Diagnostics銷售的Accelerate Pheno,採用了一種結合了多變量對數回歸和電腦視覺的分層系統。兩個系統都嚴重依賴數位圖像採集和分析來生成結果。

考慮到當前電腦科學的進步,特別是研究人員對基於圖像的數據所取得的重大進展,最近出現了FDA批准的數位圖像處理儀器並不令人驚訝。近年來,諸如圖像卷積、神經網絡和深度學習等方法,加速了基於圖像的機器學習性能。然而,數位圖像在臨床實驗室中並不像其他診斷專業那樣豐富,例如放射學或解剖病理學,可能限制基於圖像的機器學習在實驗室醫學中的未來應用。

Durant博士認為,除了有限的商業應用之外,實驗室醫學的機器學習研究也在不斷增長,儘管出版物的總數仍然相對較低。近年來,研究人員已經研究了機器學習用於廣泛數據集的實用性,例如分析紅細胞形態、細菌菌落形態、甲狀腺組、尿液類固醇譜流式細胞術,並審查測試結果報告以確保品質。

雖然一些機構已經成功地將自行開發的機器學習系統整合到工作流程中,但很少有人成功地轉向臨床實踐。儘管有更好的表現模型發展,研究人員由於各種原因,經常在最後一里路上發現臨床整合的困難。特別是,文獻對評估機器學習模型、臨床驗證實驗設計,或如何創建與當前實驗室醫學資訊技術基礎設施整合的更多模塊化機器學習模型的統計性能指標,幾乎沒有提供工作流程指導。

很可能,臨床實驗室從商業和研究來源緩慢採用機器學習的原因是多方面的,並且可以說不僅僅源於核心技術本身的內在局限性。與其他受到廣泛關注的技術類似,例如大數據或區塊鏈,機器學習仍然是一種需要支持系統架構的工具。雖然核心技術正在展示出前景,但在開發人員和軟體工程師,提供允許與現有工作流程輕鬆整合的臨床IT系統之前,其在日常實踐中的普及程度可能仍然有限。

機器學習外部實驗室
隨著電子健康紀錄(EHR)不斷發展和積累更多數據,商業EHR供應商正在尋求擴展其數據使用和分析功能。他們已經開始提供專為其系統設計的機器學習模型,並且在某些情況下允許使用第三方模型。供應商經常將機器學習軟體打包到臨床決策支持(CDS)中,這是一個日益流行的混合機器學習和臨床醫學的地方。

雖然CDS工具傳統上依賴於基於規則的系統,但現在供應商正在將機器學習用於預測警報和綜合症監測工具,旨在幫助臨床決策者解決複雜情況。

在當前狀態下,機器學習演算法通常依靠結構化數據進行訓練並隨後生成預測。雖然EHR的很大一部分包含非結構化和半結構化數據,但實驗室資訊仍然是結構化數據的最大來源之一,並且基於機器學習的CDS工具嚴重依賴實驗室數據作為輸入並不罕見。隨著CDS工具的激增,實驗室醫學在開發、驗證和維護這些模型中的作用仍然很重要,但定義不明確。

此外,類似於電腦的實驗室結果,例如估計的腎小球濾過率,依賴於實驗室數據的機器學習模型,所產生的概率分數可能受到傳統管理和認證組織(如美國病理學家學會、FDA或聯合會)的監管。

雖然機器學習的規定仍然是電腦科學領域公開辯論的主題,但醫學界專家們日益達成的共識是嚴格監督這些模型,以確保其在臨床醫學中的安全性與可靠性。

2017年,FDA發布了關於CDS軟體的指南草案,試圖澄清其監管範圍。雖然這些指導方針仍有待改變,但很明顯該機構致力於在這一領域進行監督。在指南正式化之前,將機器學習模型置於同行評審過程的嚴格程度,可能是一件極好的事情。

為了在床邊提供有前景的機器學習技術,IT和醫療團體可能需要與機器學習研究人員和供應商合作,以支持驗證研究。臨床實驗室人員可能特別適合指導這些類型的工作,這不僅歸功於機器學習模型經常依賴於實驗室數據,還因為實驗室人員,在驗證用於臨床目的的新技術方面的專業知識。

隨著後分析階段的機器學習傳播,臨床實驗室人員將需要越來越關注使用哪些實驗室數據,以及如何使用。例如,實驗室資訊系統內的變化,可能會對依賴於正確映射的實驗室結果數據的下游應用,產生意想不到的後果。衛生系統也將受益於,臨床實驗室人員對機器學習如何使用實驗室數據改善患者護理的見解。

發展和採用的障礙
Durant博士在文中說道,三類通常描述機器學習的常用方法:監督、半監督和無監督。受監督的機器學習依賴於大且精確標記的數據集來訓練機器學習模型,例如將白細胞的圖像標記為淋巴細胞或嗜中性粒細胞用於隨後的分類。目前,共識是受監督的機器學習將生成用於有針對性地檢測已知類別數據的最佳模型。但在許多情況下,所需的數據集不夠大或標記不夠準確。然而,精確標記數據集的策劃過程既困難又耗時。

透過EHR,研究人員肯定可以獲得比過去幾年更多的數據訪問權限。然而,其原生狀態的健康資訊,通常沒有足夠的結構來嚴格開發機器學習模型。例如,使用受監督的機器學習的預測警報和綜合症監測工具,通常依賴於臨床疾病的存在或不存在所描繪的數據集。雖然ICD-10代碼可用於標記目的的離散數據元素,但耶魯大學醫學院實驗室醫學系的經驗表明,ICD-10代碼沒有足夠可靠地紀錄以培訓受監督的機器學習模型。

為了避免與不一致標籤相關的性能問題,數據科學家可以根據特定標準策劃自定義標籤,以定義其數據集中的類。但是,定義類的標準通常是主觀的,可能缺乏普遍接受性。例如,敗血症預測演算法,可能依賴於在一個機構而不是另一個機構使用的敗血症臨床標準。對於臨床實驗室人員來說,考慮如何訓練模型以及哪些特定的臨床定義,在機器學習模型中確定所檢測的類別或疾病的功能性與真實性,將變得越來越重要。

除了臨床疾病的可變標準問題之外,一些標籤還具有內在的可變性,這可能妨礙機器學習在各機構之間的最佳表現。諸如邏輯和線性回歸之類的線性模型,顯示出不同機構之間的普遍性。在醫療保健領域,問題是多因素的,可能是由於人口異質性,或者是機器學習培訓人群,與用例或測試人群之間的差異造成的。因此,在一個機構之外接受培訓的機器學習模型,可能會在上線前受益於再培訓。但是,文獻中沒有任何內容支持這種做法。

最後,Durant博士認為機器學習模型的黑盒性質本身就是一個很好的採用障礙。電腦科學家試圖闡明模型如何以及為什麼得出它們產生的答案,以便向最終用戶證明可解釋的人工智能(XAI),以說明用於達到給定分數或分類的決策點。

XAI的支持者認為,在模型產生錯誤結果的情況下,它可能有助於調查機器學習模型中的偏差來源。理想情況下,這樣的工具還將包括交互式特徵,以允許校正所識別的偏差。然而,隨著機器學習模型變得更加強大和複雜,能夠對其內部邏輯進行有意義的洞察變得更加困難。調查XAI方法的實踐仍然很新,其實用性仍然是一個懸而未決的問題。

機器學習的下一步
機器學習的強大技術為提高實驗室醫學服務品質提供了巨大潛力。早期的商業和研究驅動的應用,已經證明了有希望的結果。儘管在模型普遍性、監督和醫生採用方面存在著棘手的問題,但在未來幾年內,基於機器學習的技術不斷湧入實驗室醫學仍是可以期待的。

Durant博士在文中結論道,實驗室醫學專業人員需要了解,可以用機器學習技術可靠地完成什麼?陷阱是什麼?以及在將機器學習模型引入臨床工作流程時確定什麼是最佳實踐。