RCNP 加速核子物理研究

大阪大學核子物理研究中心使用 Lenovo 伺服器支援巨量資料分析和 HPC。

概覽:

  • 大阪大學核子物理研究中心成立於1971年,是研究核子物理及其應用的先進機構。

  • 為了提供 600 多名使用者無縫存取龐大的資料集和高效能分析,該中心汰換了其陳舊的核子物理電腦系統,改用基於 Lenovo ThinkSystem SD530 和 SR630 伺服器、搭載第 2 代 Intel® Xeon 可擴充處理器的新基礎結構。

author-image

作者

背景

大阪大學核子物理研究中心成立於1971年,是研究核子物理及其應用的先進機構。RCNP 擁有日本大學中規模最大的迴旋加速器設施,並於 2018 年認證為國際聯合使用/研究中心。

RCNP 主任 Takashi Nakano 教授表示:「RCNP 的一個決定性特徵是我們對精密核子物理學的研究,我們將各種粒子與原子核碰撞,並準確測量振動和能量的變化。我們也根據這個實驗資料進行理論研究。」

RCNP 也與其他機構合作,在直接應用於日常生活的領域進行全面研究,例如在材料科學研究中使用介子,以及在醫學研究中採用加速器。

Nakano 教授解釋道:「比方說,在醫學領域,我們正在研究 α射線核子醫學治療。這對於治療全身都有癌細胞的患者很有用;諸如此類的病例,其他類型的治療可能難以治癒。」

RCNP 也是該大學優秀研究生學程的中心設施,該學程旨在培養能夠推動生物醫學科學在社會落實的傑出研究人員。

「作為一個國際聯合使用/研究中心,我們是與全球研究人員交流的樞紐,」Nakano 教授表示。「曾經在 RCNP 就讀的研究人員如今在世界各地的研究所和大學服務,我們也參與了許多國際合作計畫。」

挑戰

2019年,RCNP 開始規劃汰換核子物理電腦系統,該系統的功用是儲存實驗資料、分析結果,以及處理理論計算。

這些系統目前為 600 位使用者服務,包括 RCNP 研究人員,以及來自其他國內和國際機構的遠端使用者。該中心持有的資料用於許多合作研究專案,因此遠端使用者佔總數的很大比例。

正如Nakano 教授所說:「IT 對我們的研究中心來說,與我們的雷射電子設備和加速器設備一樣重要。只有使用合適的 IT 系統,才能打造完美的研究環境。」

他補充道:「我們的系統是研究設施的核心。一個實驗或許只會持續數週,但世界各地的研究人員可能會持續分析實驗資料數月甚至數年之久。透過詢問有關資料的新問題,我們就能獲得新的見解。」

由於這些理由,RCNP 察覺替換核子物理系統需要滿足若干關鍵需求。它必須讓世界各地的使用者輕鬆存取,以通用的語言進行分析,以及最重要的是,提供極快的資料分析處理。

為什麼選擇 Lenovo?高效能、復原系統

RCNP 決定採用 Lenovo ThinkSystem 作為新型核子物理電腦系統的伺服器平台。RCNP 環形迴旋加速器大樓的研究員 Tomoaki Hotta 副教授是系統更新專案的靈魂人物,他解釋了升級的關鍵因素:

「我們的首要任務是高處理能力,因為這對於處理核子物理的龐大實驗資料集和核子理論的大規模研究來說不可或缺。其次,穩定性舉足輕重,我們希望即使在使用者人數眾多的情況下,也能輕易操作新系統,不會產生任何問題。第三,我們的實驗資料高度機密,一旦遺失就無法復原,因此需要考量資料安全與防護。」

Nakano 教授證實:「運算能力與儲存大量資料的能力是關鍵,我們也需要建立一個環境,以便不間斷地分析多年來累積的研究資料。這表示我們必須瞭解,在可用的預算範圍內,我們能提升多少 IT 支援能力。比方說,如果出了問題,我們是否能與現場機房團隊一同解決?」

他補充說明:「除了可靠性,我們也需因應與日俱增的資料量以及加速分析處理的需求,因此在這裡強調 Lenovo 解決方案在未來發展的巨大潛力。」

在艱困情況下成功交付

選定 Lenovo ThinkSystem 解決方案後,RCN團隊在大約五個月內成功交付了新的核子物理電腦系統。

為了處理 RCNP 核子物理計算,新平台使用 24 個 Lenovo ThinkSystem SD530 伺服器,搭載第 2 代 Intel® Xeon可擴充處理器,為資料分析處理提供約末 800 個 CPU 晶片。此外使用 8 個 Lenovo ThinkSystem Service SR630 伺服器來管理節點,負責傳輸及接收資料,並控制作業。Lenovo ThinkSystem SD530 是一款超密度 2U 4 節點(2U4N)系統,專為在小空間提供最大效能而設計,並具有進階的硬體安全性功能。同時,Lenovo ThinkSystem SR630 是一款 1U 機架伺服器,可為業務關鍵工作負載提供多種功能及高度可靠性。

在正常情況下,這種系統更新專案需要大批人員在現場進行硬體安裝、作業系統、軟體安裝、設定和上線等任務。然而,RCNP 的專案在冠狀病毒大流行期間展開,人們的活動受到限制,因此有必要壓縮專案時間表,大幅縮小團隊規模進行交付。

「儘管冠狀病毒造成影響,但我們在 Lenovo 高效營運團隊和遠端管理功能的支援下,仍能成功啟動系統。」—大阪大學核子物理研究中心副教授 Tomoaki Hotta

成果

RCNP 目前正在使用全球效能最高的加速器進行加速器和束流物理研究。此外,該中心也與醫學科學機構合作,挑戰開發及研究用於創新癌症治療與診斷的新一代加速器和輻照系統。

Nakano 教授表示:「在我們進行的加速器研究類型,必須累積大量資料並儲存在我們的系統中。然後,我們向全球各地的使用者提供資料處理時間。我們希望持續提供始終可用、穩定且易於存取的環境。」

他補充道:「首次引進系統時,主要吸引我的是 Lenovo 硬體的效能。有了 Lenovo 作為策略合作夥伴,今後我希望更專注於解決問題和系統改良,這表示要加深我們在軟體方面的合作。」

除了實踐和理論研究,Nakano 教授認為IT 技能發展是研究中心的重要使命。透過使用在國際研究與教育領域具有廣大市場份額的 Lenovo 系統,他希望 RCNP 能培養出在該領域積極表現且技術純熟的研究人員。

副教授 Hotta 表示:「我們在 RCNP 根據研究內容和方法,有多種使用電腦的方式。因此,我們的 Lenovo 系統不僅是專用於特定應用程式的 HPC 平台,也能適應多種使用案例。舉例來說,我們有團隊希望將機器學習納入研究並執行大規模平行運算。我們的目標是開發一個能靈活因應此類需求的最佳化系統。」

他續稱:「我們今後會考慮使用雲端來加強本地部署的伺服器和儲存環境。如此一來,有助於我們提供電腦資源,滿足使用者在不同研究領域的需求。雲端廠商不僅能提供經濟實惠且高效能的硬體,也可為操作及支援系統的人員減輕負擔。我們希望 Lenovo 能為我們提供合適的技術與訣竅:一個結合硬體和營運支援,提高整體價值的先進系統。」

規劃未來

Nakano 教授放眼大局,表示:「為了在日益複雜的世界打造更美好的未來社會,我們可以從想要實現的未來『回溯分析』,瞭解我們目前需要的是什麼。我們察覺到,我們需要發展研究人員並建設人力資源。」

預計IT 將在實現 RCNP 願景上扮演日益重要的角色;但同時,Nakano 教授指出:「如果我們繼續以目前的速度使用系統,用電量會增加,儲存空間也會受到限制。」

「我們的目標是產生對解決研究以外的人類問題有用的結果,也就是透過更有效地使用 IT,推動中心未來的發展。」—大阪大學核子物理研究中心主任 Takashi Nakano 教授

副教授 Hotta 表示同意:「在安裝及操作電腦系統時,考量耗電量和其對環境的影響再自然不過。這個觀點與有效運用研究資金直接相關,今後要牢記這一點。」

自 2019 年起,Lenovo 便一直提供 Lenovo TruScale Infrastructure Services,這是一項基於功率按需付費的全方位訂閱服務,用於資料中心硬體和服務。該公司也正努力利用 Lenovo Neptune 水冷式技術,提高功耗效率並降低成本。「透過採用這些措施,Lenovo 正與聯合國的永續發展目標 [SDG] 保持一致,」副教授Hotta 表示。「和 Nakano 教授所見略同,我認為有必要改變思維並使用回溯,以便穩步開發與 SDG 一致的最佳系統環境。」

Nakano 教授 總結道:「我們未來需要的系統環境更小巧、更節能,並帶來史無前例的高運算能力。只要建構及妥善維護這種系統,我們就會成為核子物理領域的龍頭。」

大阪大學核子物理研究中心

 

  • 日本三大研究型大學之一
  • 《QS世界大學排名》名列 751
  • 擁有日本大學中最大的迴旋加速器設施