人工智慧可以改善乳癌腫瘤分級的一致性與重複性,但很難建立 AI 解決方案。為訓練標註圖像耗時又費力,而且已有標記的圖像也不多。
兩名研究員開創先河。它使用標記和未標記的圖像來實現高精確度,同時將標註工作負載降至最低。該解決方案無法在 GPU 上執行,因此 Intel 提供基於第 2 代 Intel® Xeon® 可擴充處理器的技術架構。
挑戰
- 深度學習解決方案可協助診斷癌症,但需要標記的圖像進行訓練。
- 標記組織病理學圖像耗時又費力。
- 為了取得最佳成果,深度學習解決方案必須能夠處理高解析度的圖像,且 GPU 無法在記憶體中保存整個 AI 模型。
解決方案
- NAS-SGAN 方法使用未標記的圖像來理解資料分佈,並使用標記的圖像為癌症分級。
- 四部搭載第 2 代 Intel Xeon 可擴充處理器的伺服器同時訓練解決方案,每部伺服器配備 192 GB 的記憶體。
- Intel® Optimization for TensorFlow 可以輕鬆使用處理器的加速功能。
成果
- NAS-SGAN 僅標註 20% 的資料就實現了 98%的準確度。1
- 新的解決方案不僅可以偵測癌症,而且可以進行分類,這是先前基於生成對抗網路(GANs)的解決方案所辦不到的。
- 解決方案簡化了診斷流程,醫師可以透過審閲圖像和分類做出治療決策。
有限的標記資料使癌症 AI 成為挑戰
乳癌是世界上最普遍的癌症,2020 年有 230 萬 名婦女診斷罹患乳癌。2在每個國家都會發生,主要影響青春期後所有年齡層的婦女。
目前使用組織病理學圖像來診斷和監控疾病。這些是組織樣本的微觀圖像。核異型評分(NAS)按腫瘤細胞與正常組織的差異程度對腫瘤進行分級。世界衞生組織(WHO)採用諾丁漢分級系統(NGS)作為乳癌分級標準。NGS 與患者生存機會相關,可用於指導個體化治療計畫。
對圖像手動分級很不容易。分析圖像的醫生可能無法始終如一地做出相同的分級決定,而執行分析的人意見可能不盡相同。這也是相當耗時的程序。
使用深度學習的自動篩選可以克服手動分析的侷限。然而,由於訓練資料不足,很難產生深度學習的模型。雖然可以在幾分鐘內經濟高效地建立原始圖像,但標記的過程耗時費力。標記的組織病理學圖像少之又少。
此外,深度學習模型必須能夠處理大型圖像(1024x1024 像素),以便取得最佳結果。「為了準確地分級圖像,重要的是必須精確擷取形態特徵,」印度 Cochin University of Science and Technology 人工智慧與電腦視覺實驗室的 Madhu Nair 博士說。「癌症的等級和分期取決於形態特徵。不能直接縮小圖像的大小來適應模型的大小。我們必須使用高解析度的圖像,來擷取所有差異。」
印度 Union Christian College 的 Asha Das 博士與 Nair 一同接受挑戰。「我們的問題是:是否可以使用較少標記的資料開發模型,但仍然可以獲得高精確度?」 Nair 說。
生成對抗網路模型幫助 AI 歸納
生成對抗網路(GAN)是一種可用於產生新圖像的神經網路解決方案,可判斷圖像的真偽。GAN 由兩個合作的神經網路組成:建立圖像的產生器,和判斷圖像是否和樣本集相符的鑑別器。
GAN 可用來產生組織病理圖像。這些可以新增至真正組織病理圖像的訓練資料集;如此一來,深度學習模型在顯示前所未見的圖像時,可以更佳歸納。
過去 GAN 也用來偵測腫瘤與其它異常,但以前的做法無法對圖像進行分級。
圖 1。NAS-SGAN 模型使用未標記的圖像產生新圖像,以擴大訓練資料集,並使用標記的圖像訓練鑑別器,以為不同的癌症分級進行分類。
Das 與 Nair 建立了一個名為 NAS-SGAN 的模型,鑑別不同的癌症等級(見圖 1)。名稱是核異型評分(NAS)半監督生成對抗網路(SGAN)的縮寫。NAS-SGAN 使用未標記的圖像來理解資料分佈,並使用標記的圖像來分級癌症。
它分兩階段運作:
- GAN 用於建立真正的組織病理學圖像無法區分的圖像。GAN 使用未標記的圖像進行訓練,這些圖像相對容易取得。新圖像用來協助解決方案理解資料分佈。
- 然後使用標記圖像訓練 GAN 鑑別器以預測癌症等級。
嘗試使用 GPU 實施解決方案失敗。「執行需要數天的時間,有時會中斷,」Nair 表示。「我們無法使用這些機器完成專案。」
Das 和 Nair 與 Intel 合作使用第 2 代 Intel Xeon 可擴充處理器執行解決方案。四台伺服器組成一個運算叢集,沒有任何深度學習加速器。伺服器和儲存裝置是以 25 G 乙太網路連接。
「Intel® 架構令人驚艷,」 Nair 表示。「我們可以在數小時內完成訓練。由於伺服器擁有 192 GB 的記憶體,比顯示卡可用的 40 GB 或 80 GB 多,我們可以使用高解析度圖像,並將整個模型放進記憶體。」
軟體堆疊使用 Intel Optimization for TensorFlow,旨在使用 Intel® 處理器的加速功能。其中包括 Intel® Deep Learning Boost (Intel® DL Boost),加速深度學習訓練中常用的矩陣運算。「 Intel Optimization for TensorFlow 與 TensorFlow 的主要版本運作方式相同,」 Nair 表示。
開源 Horovod 訓練架構用於啟用跨伺服器叢集的分散式訓練。
Intel 支持研究
Intel 與 Das 和 Nair 密切合作,研究專案的技術層面。「我們心中有構想,只是擔心無法落實,」 Nair 表示。「我將問題告知 Intel 團隊,非常高興他們馬上理解這項工作的重要性。他們供了使用這個分散式架構的機會。」
他補充道:「他們也協助我們改善模型,與我們共享最佳化,使其正常運行。這就是我們能夠成功的原因。Intel 的支持,我們非常感謝。和 Intel 團隊合作的經驗很棒,我們期待繼續合作。」
使用有限標記的訓練資料,達到高精確度
Das 和 Nair 將 NAS-SGAN 的效能與偵測乳癌的另外十種 GAN 演算法進行比較。NASSGAN 達到了 98% 的精確度,比下個等級的 GAN(WGAN-GP)高出約 10%。1 精確度 97%,比 WGANGP 高出 18%。1
NAS-SGAN 在 F1 分數上也表現出色,其代表調和平均數。1 它包括(除其他事項外)誤報和漏報。NAS-GAN 的 F1 分數為 97%,比 WGAN-GP 高 15%1。
「我們對結果非常滿意,」 Das 表示。「只用 20% 標註的資料就能實現 98% 的精確度確實很不簡單。相當令人振奮。」
她補充道:「由於使用兩個 GAN 的方式,我們的模型可以更明確地鑑別區分等級的特徵。我們也能使用中等大小的圖像獲得幾乎相當的結果。」
若是使用其他 GAN,醫師必須研究圖像才能將其分級。NAS-SGAN 的自動化評分有助於簡化診斷流程與分析流程,協助改善分級的一致性和精確度。醫生可以檢閱圖像和分級,做出治療決策。
未來展望呢?研究員正在研究如何使用類似的方法來解決腦動脈瘤導致的死亡率,以及對內視鏡下的瘜肉進行分類。
學到的經驗
這項專案帶來的主要經驗是:
- NAS-SGAN 演算法透過增加分級癌症圖像的能力,解決其他 GAN 模型用於乳癌篩選的缺陷。
- 即使在使用有限數量的標註資料時, NAS-SGAN 也能實現高精確度的結果。1 這麼做可以盡量減少耗時費力的圖像分類過程。
- 研究員無法使用 GPU 實現專案。透過 CPU,便能使用 1024 x1024 像素的高解析度訓練圖像來訓練 AI 模型,並將整個模型保留在記憶體中。
- Intel Optimization for TensorFlow 的功能包括加速 TensorFlow 在 Intel 架構上的效能。
解決方案的技術元件
- Intel® Xeon® Gold 6248 處理器。雙插槽處理器提供 20 核心。處理器置於具有 192 GB 記憶體的伺服器中,用於深度學習解決方案。
- Intel Optimization for TensorFlow。此軟體利用 Intel 處理器中的加速功能,增強 Intel 架構上的 TensorFlow 效能。
- Horovod。此開源解決方案能讓研究員在單一叢集中跨多部伺服器運行訓練。每部伺服器同時處理 64 張圖像中的 16 張圖像。