理大 AI 研發成果入選「香港十大創科新聞」|新訓練範式大幅降低成本,推動全球科研普及

2025年10月24日
香港理工大學
香港理工大學高級副校長(研究及創新)趙汝恒教授(左)與領導該研究項目的楊紅霞教授(右)
香港理工大學高級副校長(研究及創新)趙汝恒教授(左)與領導該研究項目的楊紅霞教授(右)

香港理工大學人工智能高等研究院(PAAI)執行院長楊紅霞教授及團隊,在生成式人工智能(GenAI)領域取得多項突破,包括提出「協作式生成人工智能」(Co-Generative AI)模式,即分散式 AI 訓練,有助大幅降低訓練成本、保障數據隱私、打破資源壁壘。近期,團隊進一步啟動更低成本的 FP4 精度訓練探索,相關成果已作預印發表。

論文:https://arxiv.org/html/2509.22536v3

研究背景

當前,GenAI 領域面臨三重核心制約:

基礎模型訓練需耗費巨量計算資源,使得學術界難以直接參與基礎模型的訓練、領域專屬知識與數據無法融入模型。

隱私保護與版權歸屬問題,使醫療、金融等敏感數據難以用於訓練。

基礎模型難以及時吸收新知識,每次重新訓練,進一步耗費巨量資源,嚴重阻礙技術迭代。

研究成果

團隊近期提出 InfiFusion 模型融合技術。僅需數百 GPU 小時,即可融合出傳統需 100 萬至 200 萬 GPU 小時訓練的大模型;團隊用 160 個 GPU 小時,完成了 4 個尖端模型的融合,且融合後的模型,在多項權威測試中性能顯著優於原始模型。

團隊還通過嚴謹的數學推導,提出了「模型融合縮放定律」(Model Merging Scaling Law),這意味,除了傳統的「縮放定律」(參數越多、知識越廣、性能越強)外,可能還有另一條通往通用人工智能(AGI)的途徑。

理大憑藉此成果,成為首個開源發布「端到端 FP8 低比特訓練全套方案」(涵蓋預訓練及後訓練)的大學團隊,該技術打破全球基礎模型以 BF16 精度訓練的主流格局。與 BF16 相比,FP8 核心優勢體現在多方面:訓練速度提高逾 20%、顯存峰值佔用減少逾 10%、成本大幅下降;整合「持續預訓練」、「監督式微調」和「強化學習」,訓練效果媲美 BF16 模型且訓練時間和顯存佔用進一步壓縮。

此外,團隊已啟動更低成本的 FP4 精度訓練探索。經測試,其在醫療的診斷和推理上的效果,超過目前業界發布同等尺寸最優模型;在科研智能體領域(Research Agent)中的任務複雜度、泛化能力和生成報告質量上,均取得重大突破。

在醫療領域,團隊已研發專屬模型「癌症 GenAI」,可快速積累高質量醫療數據、直接對接醫療設備,用於癌症個性化治療規劃。該模型目前正聯合復旦大學附屬華山醫院、中山大學腫瘤防治中心、山東省腫瘤醫院及香港伊利沙伯醫院推動合作與臨床落地。

楊紅霞教授指出:「以超低資源實現基礎模型訓練,加上高效模型融合,可助全球學術人員投入 GenAI 研究,匯聚更多力量創新。」

理大高級副校長(研究及創新)趙汝恒教授表示,理大新成立的 PAAI 致力加速人工智能技術在各個重點領域的深度融合,並針對不同行業開發具備專業領域知識的人工智能模型,此舉將助力推動香港成為全球生成式人工智能發展的樞紐。

参考文献

[1] InfiR2: A Comprehensive FP8 Training Recipe for Reasoning-Enhanced Language Models, https://arxiv.org/html/2509.22536v3

[2] InfiMed: Low-Resource Medical MLLMs with Advancing Understanding and Reasoning, https://arxiv.org/html/2505.23867

[3] InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios, https://arxiv.org/html/2509.22502

[4] InfiGFusion: Graph-on-Logits Distillation via Efficient Gromov-Wasserstein for Model Fusion, https://arxiv.org/html/2505.13893

[5] InfiFPO: Implicit Model Fusion via Preference Optimization in Large Language Models, https://arxiv.org/abs/2505.13878

[6] Model Merging Scaling Laws in Large Language Models, https://arxiv.org/html/2509.24244