中國(guó)科學(xué)院GPU加速電磁模擬預(yù)處理技術(shù)研究取得進(jìn)展
關(guān)鍵詞: 三維電磁數(shù)值模擬 CN - FDTD方法 FlashMP 電磁方程求解 計(jì)算效率提升
隨著高性能計(jì)算與人工智能融合發(fā)展的深入,三維電磁數(shù)值模擬在雷達(dá)、光子晶體、地球物理勘探等領(lǐng)域的需求日益增長(zhǎng)。作為電磁仿真中的核心方法之一,Crank-Nicolson有限差分時(shí)域(CN-FDTD)方法因無(wú)條件穩(wěn)定性和能量守恒特性,廣泛應(yīng)用于大規(guī)模長(zhǎng)時(shí)間模擬。然而,該方法在每一步時(shí)間推進(jìn)中需求解由雙旋度算子構(gòu)成的大型稀疏線性系統(tǒng),計(jì)算開(kāi)銷大,限制了其工程應(yīng)用。
近日,中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心科研團(tuán)隊(duì),提出了基于離散變換的子域精確預(yù)處理系統(tǒng)——FlashMP,用于高效求解CN-FDTD方法中的線性系統(tǒng)。該方法首次在GPU集群上實(shí)現(xiàn)了對(duì)電磁方程預(yù)處理求解的實(shí)用加速,提升了大規(guī)模電磁模擬的計(jì)算效率。
FlashMP通過(guò)奇異值分解,將雙旋度算子解耦為格點(diǎn)子系統(tǒng),在每個(gè)子域內(nèi)構(gòu)建精確求解器作為預(yù)處理器,降低了迭代次數(shù)。同時(shí),針對(duì)邊界誤差問(wèn)題,團(tuán)隊(duì)設(shè)計(jì)了低秩修正策略,實(shí)現(xiàn)了高效邊界處理。這一方法在多GPU環(huán)境下具備良好的可擴(kuò)展性,支持上千GPU并行計(jì)算。實(shí)驗(yàn)結(jié)果表明,在AMD MI60 GPU集群上,F(xiàn)lashMP與主流迭代求解器BiCGSTAB和GMRES結(jié)合使用,相比無(wú)預(yù)處理情況,可將迭代次數(shù)減少高達(dá)16倍,整體求解速度提升2.5倍至4.9倍。在1000 GPU規(guī)模下,F(xiàn)lashMP仍保持84.1%的并行效率,展現(xiàn)出優(yōu)異的弱擴(kuò)展性能。
相關(guān)研究成果已被IEEE International Conference on Computer Design錄用并發(fā)表。研究工作得到中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)的支持。

基于離散變換與低秩修正的子域精確求解
- 硅谷機(jī)器人明星公司K-Scale Labs猝死,融資600多萬(wàn)美元一年燒光!11-14
- 荷蘭高級(jí)代表團(tuán)下周訪華,共商安世半導(dǎo)體問(wèn)題解決方案11-14
- 因過(guò)熱和起火風(fēng)險(xiǎn),特斯拉大規(guī)模召回10500套Powerwall 211-14
- 立中集團(tuán)又獲3客戶項(xiàng)目定點(diǎn),合計(jì)金額約2.7億元11-14
- 蘇州固锝:含銀量10%的銀包銅產(chǎn)品已進(jìn)入量產(chǎn)階段11-14
- 關(guān)于美光禁售,商務(wù)部這樣回應(yīng)......11-07