Radiomics feature aggregation [paper 分享]


Posted by PeiDS on 2022-07-22

Tumor sub-region 中潛藏有資訊的特徵,計算特徵時aggregation的方法是值得注意的因素。我們習以為常的平均整顆ROI,可能導致特徵稀釋。

Paper : The importance of feature aggregation in radiomics : a head and neck cancer study


動機 : 魔鬼藏在細節裡

Radiomics 領域使用machine learning的論文中,特徵提取(feature extraction)的方法幾乎相同:對整顆腫瘤的ROI進行計算,再除上pixel數得到平均。大家對於此feature extraction的流程也沒有質疑。然而作者認為,平均整顆ROI會忽視不同sub-region的資訊,或許有的region有突出資訊,平均會把有用的資訊稀釋掉。
所以作者想要實驗,不同的feature aggregation方法是否造成影響。

Fig1, c1及c2皆充分表達了M1及M2,然而平均整張圖(M3)的c3被稀釋並沒有意義。


Paper摘要

這裡濃縮paper的方法,主要比較三種aggregation方法:

  1. Classic : 傳統整顆ROI平均
  2. Patch : 5x5x5 sliding window
  3. BoVW : Bag of Visual Words。

每一種方法皆會對每個tumor產生一個 [pixel數 x feature數] 維的feature map。評估方法則是對214位頭頸癌做病患survival預測。

Bag of Visual Words(BoVW)是一種multiple instance learning的方法,簡單來說就是以clustering的方式濃縮tumor的特徵。以這篇paper為例,會將每個pixel計算出的features進行clustering,並使用histogram的方式統計pixel分布在各cluster的情形。最後以這個histogram作為feature vector做分類。

結果以BoVW (C-index:0.627)顯著的勝出傳統做法(C-index:0.505),也優於使用patch (C-index:0.543/0.547/0.530)。此結果也符合作者的想法,region資訊有其價值,應挑選適當的 feature aggregation方法。由於實驗重點是feature aggregation方法,作者只選了一些aggregation是主要影響的feature來使用。feature計算方式詳見論文,這邊就不細談了。

Fig6, 不同feature aggregation的結果(* p < 0.01)


結論

傳統radiomics作法在預測腫瘤性質時,會平均整顆ROI。雖然得到整體腫瘤的資訊,但相對忽視region的資訊與其差異性(intra-region variations)。Patch的方式介於中間,有利用region的資訊,缺點是region以人工定義且window大小也是一個因素。BoVW藉由clustering讓pixels自己分出region,也許這也是勝出的關鍵(unsupervised)。

我想究竟哪種 feature aggregation最好可能有點 case-wise,但這篇paper的亮點不是找到最好的方法,而是提醒我們對任何”習以為常”也該抱持懷疑。在思考問題時,比起發展複雜的架構,也許重點就藏在地基的石磚上。

(cover photo : Medical technology photo created by rawpixel.com - www.freepik.com)


#Radiomics #Feature aggregation #Feature extraction #machine learning #Medical image







Related Posts

NPM & Node.js & Package.json的關係與使用

NPM & Node.js & Package.json的關係與使用

CSS定位 inset

CSS定位 inset

D31_eslint 與 LIOJ 的愛恨情仇 + 開始第四週

D31_eslint 與 LIOJ 的愛恨情仇 + 開始第四週


Comments