亞洲健康互聯
優化產業的推手,生醫商機的GPS!

首頁產業資訊醫材報導醫材產業影像組學的圖像分析及模型構建

影像組學的圖像分析及模型構建

來源 : 中國醫療設備雜誌2019年第4期
update : 2019/06/13
引言
影像組學是在最初為分子生物學學科創建的組學(Omics)基礎上產生的。組學是指從研究目標整體中提取大量參數,假設這些參數和臨床資料的適當組合可以表達顯著的組織學特性,將這些參數在先驗統計方法的基礎上進行數學處理,那麼對每一個患者的治療診斷或預後就具有一定的個性化意義[1-2]。

影像組學可以通過提取形態學及功能學影像中的定量資訊,反映組織的潛在病理及生理學特徵,在病變組織及正常的人體組織中均可應用[2]。影像組學的分析過程包括圖像採集和重建、圖像分割、特徵值定義及提取、特徵值分析和模型構建等。基於臨床病理學資訊及影像圖像所構建的影像組學模型,可應用於疾病檢測、腫瘤分型分期、評估疾病預後、評價療效等方向。影像組學特徵可以通過多種數學軟體進行特徵值提取、計算,並選取最佳參數以保證輸出結果的穩定可靠。

本文著重對CT、MR 的成像特徵,影像組學特徵(形狀、一階、二階、高階特徵)進行了介紹,並簡要討論了影像組學參數的選擇方法,包括聚類分析、主成分分析、隨機森林、線性/ 邏輯回歸等。參數的再現性以及臨床價值應首先通過內部交叉驗證進行測試,然後在獨立的外部群體中進行驗證。圖像的採集、後處理以及圖像的分割方式等都會影響影像特徵值的品質及其與臨床資料的相關性,同時對模型的構建也產生影響。

1 圖像採集及重建
常規臨床成像技術涉及圖像解析度、造影劑應用情況、超音波頻率及增益、PET 晶體材料與尺寸、CT 的kVp 和mAs、MRI 序列類型、回波時間、重複時間、激發次數等諸多資料獲取。在資料獲取的過程中,即使是同一影像學檢查,也會因為設備的重建演算法、影像中心的重建參數、掃描參數等各方面差異干擾圖像的雜訊和紋理特徵,最終影響影像組學特徵值的提取結果。因此,對於同一臨床問題所構建的影像組學模型,需評價圖像採集及重建因素對預測結果穩定性、可靠性的影響。

透過整合每種成像模式的特性及來自文獻和其他實驗測量的資訊,排除受採集及重建參數影響的特徵,以克服影像組學在圖像採集及重建方面的某些局限。現以CT 及MRI 的成像特徵為例。

1.1 CT
在CT 掃描過程中,減小掃描層厚會減少斷層內的光子統計資料(除非相應地增加mAs 或kVp),從而增加圖像雜訊。同時,重建矩陣大小會決定圖元尺寸並由此確定平面中的空間採樣,這會對圖像的異質性產生影響;當其他參數保持不變時,圖元尺寸減小會增加圖像雜訊,但空間解析度會有所增加。當採用螺旋CT 採集時,螺距是影響圖像雜訊的變數,這就增加了不同設備廠商掃描器之間的比較難度。在臨床中,金屬假體所引起的偽影也可能會影響圖像品質,並有礙於定量分析[3]。此外,Hounsfield 單位(HU)值也可能隨重建演算法的變更或掃描器校準情況而發生變化[4]。因此,為了詳細研究圖像採集設置和重建演算法對影像學特徵的影響,需採用更為複雜、貼近臨床實際的模型。
 
一種是Credence Cartridge Radiomics 體模,它包括多個不同紋理特徵的墨水匣,用於測試不同掃描器之間、多中心之間的差異[5],並測試在不同採集和重建條件下所得的資料特徵的穩定性[6]。另一種是類比感興趣區的特製CT 模型[7],在不同位置嵌入具有不同大小和紋理特徵的組織插入物,以類比真實臨床條件下的測試方案。許多研究者通過進行反復測量研究,或者比較用不同成像設置和處理演算法獲得的結果,對臨床圖像的穩定性特徵進行了統計[8-9]。通過這些研究,我們發現仍需納入足夠大的樣本量來增加患者內部的可重複性,並降低對CT 圖像採集及重建方案的敏感程度[10]。

1.2 MRI
MR 圖像中的信號強度源於內在組織特性之間的複雜相互作用(弛豫時間等),且與MR 設備磁體屬性、採集設置、影像處理等相關參數有關。對於T1 或T2 加權序列,體素強度值也並非一成不變。即使在相同的位置使用相同的掃描器掃描同一名患者,信號強度也可能因掃描時段的不同而變化。但組織間的對比度仍保持不變[11]。如果不對這種效應加以校正,患者間的影像學特徵比較就會失去意義。一種方法是將圖像影像組學特徵提取和分析集中在量化體素強度比上,而不是依賴於單個的體素強度值;另一種方法是在進行定量圖像分析之前,先進行圖像補償(也就是歸一化)[11]。
 
Depeursinge 等[12] 與John 等[13] 的研究對比了不同MRI 掃描參數對影像組學特徵穩定性的影響,有資料顯示,影像組學中的紋理特徵對圖像採集參數的變化十分敏感;圖像空間解析度越高,則紋理特徵的靈敏度越高。所以在不同MR 設備、不同掃描參數情況下所獲得的影像學特徵,應謹慎比較[14]。
 
2 圖像分割
影像組學研究的特徵資料均提取於“分割區域”,因此圖像分割是此項研究中最重要的環節。在實際研究過程中圖像分割具有很大的難度,大部分病變邊界不清導致無法對所分割的區域進行實體對比或實體再現,因此分割方式尚無共識[15]。
 
手工勾畫是大部分研究者所採用的圖像分割方法,但在影像組學分析需要以大量資料為基礎的情況下,這種耗時耗力的方式並不實用[16-17]。
 
自動和半自動分割方法已在多種成像模式和不同解剖結構中得以應用。常見的分割要求包括:最大程度的自動化、最小程度的人為操作干預、較高的時間效率、準確性和病變範圍的可重複性。一些分割演算法依賴於區域生長法,需要操作員在感興趣區域(Region of Interest, ROI)內選擇種子點[18]。這些方法比較適用於相對均勻的病變,在不均質的病變中需進行密集的人工糾錯。例如,大多數早期肺腫瘤在低密度肺實質的背景下凸顯為均勻的高密度病變,因此可以採用自動分割,並且這種方法具有較高的重複性和準確性[19-20]。然而,對於部分實性結節、磨玻璃密度結節及附著在血管和胸膜表面的結節,這種自動分割方法的可重複性及準確性就會明顯降低[20]。
 
此外還有一些方法如:圖割演算法(Graph-Cut Methods),把圖像分割問題與圖的最小割(Min-Cut)問題相關聯,構建了基於圖像的多個圖形,並實現了能量最小化函數的全域最優解[21]。但這種方式計算成本高[22],並可能導致過度分割[23]。水準集法(Level-Set Methods),它將病變輪廓表示為更高維度函數的零級集(水準集函數),將低維度曲線嵌入高維度曲面中[24]。活動輪廓演算法(Active Contour Algorithms),是指起點圍繞病灶進行繪製,像伸展的鬆緊帶一樣的連續曲線來表達目標邊緣,然後通過反覆運算過程移動到具有最低能量函數值的點,一般可通過求解函數對應的歐拉方程(Euler. Lagrange)來實現,能量達到最小時的曲線位置就是目標的輪廓所在[25]。由於依賴最佳起始點並且對雜訊很敏感,所以這種演算法在某些情況下也可能會導致較大偏差[26]。半自動分割演算法通過局部活動輪廓分析進行圖形搜索,同時使用動態程式設計使其成本函數最小化。現階段的半自動化分割過程仍然需要人類的參與[16]。因此,目前仍沒有針對所有圖像的通用分割演算法,研究者也正在評估新的演算法來克服這些局限[27]。
 
3 圖像特徵值的定義及提取
臨床圖像可以提取出不同類型的影像組學特徵。在影像學中,定性特徵通常用於描述病變[28],而定量特徵則是通過利用數學演算法的軟體從圖像中提取的描述值[29]。它們呈現出不同程度的複雜性,首先表現出的是病變形狀和體素強度長條圖,其次是體素水準強度值的空間排列(紋理)。幾十年前,人們就通過濾波器和數學變換來處理信號,發現紋理特徵可以量化圖像屬性[30]。在影像組學中,紋理特徵可以直接從原始圖像中提取,或者在應用不同的濾波器或變換(例如:小波變換)之後提取。定量特徵通常分為以下幾類:
 
形狀特徵:描述的是ROI 的形狀及其幾何特性,例如ROI 的體積、沿不同正交方向的最大直徑、最大表面積、腫瘤緊湊度和類球形度等。例如,表面呈多毛刺狀的腫瘤與相似體積的球形腫瘤相比,其表面- 體積比更高。
 
一階統計特徵:描述了各個體素值的分佈,但不涉及體素的空間排列。這些是基於長條圖的屬性,包括體素強度的平均值、中間值、最大值、最小值以及它們的偏度(不對稱性),峰度(平直度),均勻性和隨機性(熵)。
 
二階統計特徵:包括所謂的紋理特徵[31],它們是通過計算相鄰體素之間的統計相互關係而獲得的,反映了空間排列的體素強度,提示了病變的異質性[5,32]。這些特徵可以從灰度共生矩陣法(Gray-Level Co-Occurrence Matrix,GLCM)匯出,量化沿固定方向在預定距離處具有相同強度的體素的發生率,或者從灰度游程矩陣(Gray-Level Run-Length Matrix,GLRLM)量化,量化沿固定方向具有相同強度的連續體素[33]。
 
高階統計特徵:是在對圖像應用濾波器或數學變換之後,通過統計學方法所獲得。這些變換旨在識別重複或非重複模式、抑制雜訊或突出細節。包括碎片分析、Minkowski 函數、小波變換以及高斯濾波圖像的拉普拉斯變換等。單個圖像中可以生成千餘個參數變數。
 
4 特徵值分析及模型構建
即使影像組學充分利用了其他組學學科開發的資料分析方法以及大資料分析經驗,組學參數的選取仍較為困難。目前常用的兩種方法,一種是從計算工具提供的所有特徵開始,執行初步分析以選擇最可重複和可再現的參數,隨後通過相關分析和冗餘分析來進行縮減[34] ;另一種是基於它們的數學定義對特徵進行先驗選擇,集中選擇在視覺外觀方面易於解釋的參數,或者與組織直接相關的一些生物特性。電腦可以從以往的例子中進行學習,並在大量複雜的資料中檢測出難以識別的關聯模式,以此為基礎的機器學習方法可成為特徵優選的有效工具[35-36]。
 
因此,最初的工作應集中於確定具有潛在臨床意義的特徵上,以選擇對特定目的有用的資訊。影像組學的分析通常包括兩個主要步驟:一是降低維度和特徵選擇,通常通過無監督學習方法獲得;二是通過監督學習方法對一個或多個特定結果之間進行關聯分析。
 
人們已經對不同的降維( 特徵) 選擇分類方法進行了對比[37]。兩種最常用的無監督學習方法是聚類分析(Cluster Analysis)[38] 和主成分分析(Principle Component Analysis,PCA)[39]。聚類分析旨在創建具有高群集內冗餘和低群集間相關性的類似功能(群集)組。這種類型的分析通常由聚類熱圖描述,可以從每個聚類中選擇單個特徵作為代表,並用於以下關聯分析[40]。PCA 的目的是從一大組相關變數中創建一組較小的最大不相關變數,並盡可能地用最少的主成分解釋資料集中的總變數。從圖形上看,PCA 的輸出由得分圖組成,指出了資料集中的相似性。可以將所有被視為可重現、具有資訊性和非冗餘的選定特徵用於關聯性分析。單變數分析的一個重要因素是多重測試,克服多重測試問題的最常見方法是使用Bonferroni 校正或不太保守的錯誤發現率校正[41]。通過多變數分析建立數學模型,以預測結果或回應變數。不同的分析方法取決於研究的目的和結果類別,主要的機器學習分類方法包括:隨機森林(Random Forest,RF)[42],鄰近演算法(K-Nearest Neighbor,KNN)[43],支持向量機(Support Vector Machine,SVM)[44],XGBOOST 演算法[45], 決策樹(Decision Tree,DT)[46] 等。Zhang 等[37] 的研究比較了不同的模型構建方法,發現隨機森林分類方法具有最高的預後性能。
 
影像組學模型建立之後,需通過驗證的方法評估模型的穩定性和可重複性。模型驗證可分為內部驗證與外部獨立佇列資料驗證,而評估模型潛在臨床價值的最佳方法是使用前瞻性收集的獨立佇列資料進行驗證。因此,多影像中心共同建立的具有標準化影像檢查與品質控制的共用資料庫將發揮巨大作用,可以為組學模型的驗證,提供良好的獨立佇列資料。
 
5 局限及展望
影像組學作為一種新興研究方法,可以提供多種疾病的豐富資訊。從標準臨床試驗、組織病理學、遺傳學以及最終放射學結果中獲取的資料將為個性化治療方案的實施提供條件。與具有非侵入性特徵的放射學相結合,通過發現圖像的編碼規則和模式,可以更好地識別癌症等疾病的病理生理學,有助於疾病的早期發現,提高治療效率。
 
數學演算法與電腦技術的飛速發展,為影像組學提供了理論基礎和技術支援,使其可以通過從醫學影像中提取和挖掘的大量特徵,分析隱含在圖像背後的問題,為臨床診斷提供更多思路,並已在癌症、血液學及自身免疫疾病等高發疾病的診斷、治療和預後方面取得了可靠結果,有助於早期相關診斷,調整最佳治療方案,並提高患者的生活品質。標準化方案的實施是獲取具代表性、可靠、可重複結果的前提。目前,來自不同機構的資料仍缺乏一致性,面臨著圖像標準化不足、缺乏品質控制等問題,導致成果轉化難度較大。創建共同的、連貫的資料庫是當代醫學所面臨的最大挑戰之一。相信隨著醫學影像學資料的不斷積累和標準化,以及各類圖像分割、特徵提取、特徵選擇和模式識別方法的迅速發展,影像組學將會對臨床醫學產生深遠的影響。
 
[參考文獻]
[1] Lambin P,Rios-Velazquez E,Leijenaar R,et al.Radiomics: Extracting more information from medical images using advanced feature analysis[J].Eur J Cancer,2012,48(4):441-446.
[2] Lambin P,Leijenaar RTH,Deist TM,et al.Radiomics: the bridge between medical imaging and personalized medicine[J].Nat Rev Clin Oncol,2017,14(12):749.
[3] Dalal T,Kalra MK,Rizzo SB,et al.Metallic prosthesis: Technique to avoid increase in CT radiation dose with automatic tube current modulation in a phantom and patients[J]. Radiology,2016,236(2):671-675.
[4] Rizzo SMR,Kalra MK,Schmidt B,et al.CT images of abdomen and pelvis: Effect of nonlinear three-dimensional optimized reconstruction algorithm on image quality and lesion characteristics[J].Radiology,2005,237(1):309-315.
[5] Mackin D,Fave X,Zhang L,et al.Measuring computed tomography scanner variability of radiomics features[J].Invest Radiol,2015,50(11):757.
[6] Larue RTHM,Van Timmeren JE,De Jong EEC,et al.Influence of gray level discretization on radiomic feature stability for different CT scanners, tube currents and slice thicknesses: a comprehensive phantom study[J].Act Oncol,2017:1-10.
[7] Groenewald A,Groenewald WA.Development of a universal medical X-ray imaging phantom prototype[J].J Appl Clin Med Phys,2016,17(6):356-365.
[8] Timmeren JEV,Leijenaar RTH,Elmpt WV,et al.Test-retest data for radiomics feature stability analysis: Generalizable or study specific?[J].Tomography,2016,2(4):361-365.
[9] Bologna M,Corino VDA,Montin E,et al.Assessment of stability and discrimination capacity of radiomic features on apparent diffusion coefficient images[J].J Dig Imaging,2018,879-894.
[10] Fave X,Cook M,Frederick A,et.al.Preliminary investigation into sources of uncertainty in quantitative imaging features[J]. Comput Med Imaging Graph,2015,44:54-61.
[11] Madabhushi A,Udupa JK.New methods of MR image intensity standardization via generalized scale[J].Med Phys,2006,33(9):3426-3434.
[12] Depeursinge A, Foncubiertarodriguez A, Dimitri VDV,et al. Three-dimensional solid texture analysis in biomedical imaging:Review and opportunities[J].Med Image Anal,2014,18(1):176-196.
[13] John F,Nesrin D,Lori Y,et al.Quantitative radiomics:Impact of pulse sequence parameter selection on MRIbased textural features of the brain[J].Contr Media Mol Imaging,2018,2018:1-9.
[14] Molina D,Julián Pérez-Beteta,Alicia Martínez-González,et al.Lack of robustness of textural measures obtained from 3D brain tumor MRIs impose a need for standardization[J].PLoS One,2017,12(6):e0178843.
[15] Gillies RJ,Kinahan PE,Hricak H.Radiomics: Images are more than pictures, they are data[J].Radiology,2015,278(2):151169.
[16] Kumar V,Gu Y,Basu S,et al.Radiomics: the process and the challenges[J].Magn Reson Imaging,2012,30(9):1234-1248.
[17] Owens CA,Peterson CB,Tang C,et al.Lung tumor segmentation methods: Impact on the uncertainty of radiomics features for non-small cell lung cancer[J].PloS one,2018,13(10):e0205003.
[18] Zhang Y,Chandler DM,Mou X.Quality assessment of screen content images via convolutional-neural-networkbased synthetic/natural segmentation[J].IEEE Trans Image Process,2018,27(10):5113-5128.
[19] Ma J,Zhou Z,Ren Y,et al.Computerized detection of lung nodules through radiomics[J].Med Phys,2017,44(8):4148-4158.
[20] Al Mohammad B,Brennan PC,Mello-Thoms C.A review of lung cancer screening and the role of computer-aided detection[J].Clin Radiol,2017,72(6):433-442.
[21] Kim T,Ahn C,Lee O.Image segmentation by graph cut for radiation images of small animal blood vessels[J].Microsc Res Tech,2018,81(12):1506-1512.
[22] Banerjee I,Kurtz C,Devorah AE,et al.Relevance feedback for enhancing content based image retrieval and automatic prediction of semantic image features: Application to bone tumor radiographs[J].J Biomed Inform,2018,84:123-135.
[23] Oyebode KO,Du S,van Wyk BJ,et al.Investigating the relevance of graph cut parameter on interactive and automatic cell segmentation[J].Comput Math Methods Med,2018,(2018):7396910.
[24] Chen YT.A novel approach to segmentation and measurement of medical image using level set methods[J].Magn Reason Imaging,2017,39:175-193.
[25] Dey S,Sarkar R,Chatterjee K,et al.Pre-cancer risk assessment in habitual smokers from DIC images of oral exfoliative cells using active contour and SVM analysis[J].Tissue Cell,2017,49(2):296-306.
[26] Arce-Santana ER,Mejia-Rodriguez AR,Martinez-Peña E,et al. A new probabilistic active contour region-based method for multiclass medical image segmentation[J].Med Biol Eng Compu,2018:1-12.
[27] Weston AD,Korfiatis P,Kline TL,et al.Automated abdominal segmentation of CT scans for body composition analysis using deep learning[J].Radiology,2018:181432.
[28] Qiu X,Yuan H,Sima B.Relationship between EGFR mutation and computed tomography characteristics of the lung in patients with lung adenocarcinoma[J].Thor Cancer,2018.
[29] Zhang L,Chen B,Liu X,et al.Quantitative biomarkers for prediction of epidermal growth factor receptor mutation in nonsmall cell lung cancer[J].Transl Oncol,2018,11(1):94-101.
[30] Davis LS,Johns SA,Aggarwal JK.Texture analysis using generalized co-occurrence matrices[J].IEEE Trans Patt Anal Mach Intell,1979,(3):251-259.
[31] Ergen B,Baykara M.Texture based feature extraction methods for content based medical image retrieval systems[J].Biomed Mater Eng,2014,24(6):3055-3062.
[32] Alic L,Niessen WJ,Veenland JF.Quantification of heterogeneity as a biomarker in tumor imaging: a systematic review[J].PloS One,2014,9(10):e110300.
[33] Lubner MG,Smith AD,Sandrasegaran K,et al.CT texture analysis: definitions, applications, biologic correlates, and challenges[J].Radiographics,2017,37(5):1483-1503.
[34] Zhao X,Nie F,Wang S,et al.Unsupervised 2D dimensionality reduction with adaptive structure learning[J].Neural Comput, 2017,29(5):1352-1374.
[35] Suzuki K.Overview of deep learning in medical imaging[J].Radiol Phys Technol,2017,10(3):257-273.
[36] Lee JG,Jun S,Cho YW,et al.Deep learning in medical imaging:general overview[J].Korean J Radiol,2017,18(4):570-584.
[37] Zhang Y,Oikonomou A,Wong A,et al.Radiomics-based prognosis analysis for non-small cell lung cancer[J].Sci Rep,2017,7:46349.
[38] 王琳璘,謝忠局,陳永權,等.機器學習聚類組合演算法及其應用[J].山東農業大學學報(自然科學版),2018,49(3):96-99.
[39] Behbahani BA,Yazdi FT,Shahidi F,et al.Principle component analysis (PCA) for investigation of relationship between population dynamics of microbial pathogenesis, chemical and sensory characteristics in beef slices containing Tarragon essential oil[J].Microb Pathogenesis,2017,105:37-50.
[40] Rizzo S,Botta F,Raimondi S,et al.Radiomics of high-grade serous ovarian cancer: association between quantitative CT features, residual tumour and disease progression within 12 months[J].Eur Radiol,2018,28(11):4849-4859.
[41] Soares DP,de Castro MP,Mendes EA,et al.Principal component analysis in ground reaction forces and center of pressure gait waveforms of people with transfemoral amputation[J].Prosthet Orthot Int,2016,40(6):729-738.
[42] Sarica A,Cerasa A,Quattrone A.Random forest algorithm for the classification of neuroimaging data in Alzheimer's disease: A systematic review[J].Front Aging Neurosci,2017,9:329.
[43] Zhao M,Tang Y,Kim H,et al.Machine learning with k-means dimensional reduction for predicting survival outcomes in patients with breast cancer[J].Cancer Inform,2018,17:1176935118810215.
[44] Kang C,Huo Y,Xin L,et al.Feature selection and tumor classification for microarray data using relaxed Lasso and generalized multi-class support vector machine[J].J Theor Biol,2019,463:77-91.
[45] Torlay L,Perrone-Bertolotti M,Thomas E,et al.Machine learning–XGBoost analysis of language networks to classify patients with epilepsy[J].Brain Inform,2017,4(3):159.
[46] Qu Z,Krauth C,Amelung VE,et al.Decision modelling for economic evaluation of liver transplantation[J].World J Hepatol,2018,10(11):837.