理大 AI 研发成果入选「香港十大创科新闻」|新训练范式大幅降低成本,推动全球科研普及

2025年10月24日
香港理工大学
香港理工大学高级副校长(研究及创新)赵汝恒教授(左)与领导该研究项目的杨红霞教授(右)
香港理工大学高级副校长(研究及创新)赵汝恒教授(左)与领导该研究项目的杨红霞教授(右)

香港理工大学人工智能高等研究院(PAAI)执行院长杨红霞教授及团队,在生成式人工智能(GenAI)领域取得多项突破,包括提出「协作式生成式人工智能」(Co-Generative AI)模式,即分散式 AI 训练,有助大幅降低训练成本、保障数据隐私、打破资源壁垒。近期,团队进一步启动更低成本的 FP4 精度训练探索,相关成果已作预印发表。

论文:https://arxiv.org/html/2509.22536v3

研究背景

当前,GenAI 领域面临三重核心制约:

基础模型训练需耗费巨量计算资源,使得学术界难以直接参与基础模型的训练,领域专属知识与数据无法融入模型。

隐私保护与版权归属问题,使医疗、金融等敏感数据难以用于训练。

基础模型难以及时吸收新知识,每次重新训练都会进一步耗费巨量资源,严重阻碍技术迭代。

研究成果

团队近期提出 InfiFusion 模型融合技术。仅需数百 GPU 小时,即可融合出传统需 100 万至 200 万 GPU 小时训练的大模型;团队用 160 个 GPU 小时,完成了 4 个尖端模型的融合,且融合后的模型在多项权威测试中性能显著优于原始模型。

团队还通过严谨的数学推导,提出了「模型融合缩放定律」(Model Merging Scaling Law)。这意味着,除了传统的「缩放定律」(参数越多、知识越广、性能越强)外,可能还存在另一条通往通用人工智能(AGI)的途径。

理大凭借此成果,成为首个开源发布「端到端 FP8 低比特训练全套方案」(涵盖预训练及后训练)的大学团队,该技术打破全球基础模型以 BF16 精度训练的主流格局。与 BF16 相比,FP8 核心优势体现在多方面:训练速度提高逾 20%、显存峰值占用减少逾 10%、成本大幅下降;整合「持续预训练」、「监督式微调」和「强化学习」,训练效果媲美 BF16 模型且训练时间和显存占用进一步压缩。

此外,团队已启动更低成本的 FP4 精度训练探索。经测试,其在医疗的诊断和推理上的效果,超过目前业界发布同等尺寸最优模型;在科研智能体领域(Research Agent)中的任务复杂度、泛化能力和生成报告质量上,均取得重大突破。

在医疗领域,团队已研发专属模型「癌症 GenAI」,可快速积累高质量医疗数据、直接对接医疗设备,用于癌症个性化治疗规划。该模型目前正联合复旦大学附属华山医院、中山大学肿瘤防治中心、山东省肿瘤医院及香港伊利沙伯医院推动合作与临床落地。

杨红霞教授指出:“以超低资源实现基础模型训练,加上高效模型融合,可助全球学术人员投入 GenAI 研究,汇聚更多力量创新。”

理大高级副校长(研究及创新)赵汝恒教授表示,理大新成立的 PAAI 致力加速人工智能技术在各个重点领域的深度融合,并针对不同行业开发具备专业领域知识的人工智能模型,此举将助力推动香港成为全球生成式人工智能发展的枢纽。

参考文献

[1] InfiR2: A Comprehensive FP8 Training Recipe for Reasoning-Enhanced Language Models, https://arxiv.org/html/2509.22536v3

[2] InfiMed: Low-Resource Medical MLLMs with Advancing Understanding and Reasoning, https://arxiv.org/html/2505.23867

[3] InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios, https://arxiv.org/html/2509.22502

[4] InfiGFusion: Graph-on-Logits Distillation via Efficient Gromov-Wasserstein for Model Fusion, https://arxiv.org/html/2505.13893

[5] InfiFPO: Implicit Model Fusion via Preference Optimization in Large Language Models, https://arxiv.org/abs/2505.13878

[6] Model Merging Scaling Laws in Large Language Models, https://arxiv.org/html/2509.24244