2025 年 8 月,数工科技首席技术官陈志远在《中国信息化》杂志发表署名长文《国产 GPU 的下一道关:软件生态的体系化建设》。文章基于数工科技五年来在 GPGPU 产品化过程中积累的一线经验与客户反馈,系统梳理了国产 GPU 在硬件性能快速追赶之后即将面临的软件生态挑战。
文章指出,当前国产 GPU 头部厂商在硬件 PPA(性能、功耗、面积)核心指标上已初步具备与国际顶级产品正面对话的能力,但在软件层面仍存在三大核心瓶颈:CUDA 生态的兼容性深度不足、编译器对特定硬件架构的深度优化能力缺位、以及主流分布式训练框架的原生适配工作存在厂商间碎片化现象。
“硬件决定性能的上限,软件决定客户体验的下限。下一个五年,国产 GPU 的胜负将在软件生态上分出。”
针对上述系统性问题,陈志远给出了数工科技的明确技术路径选择:第一,通过「DGRT 运行时 + CUDA 算子兼容层」的双轨策略,平衡客户的迁移成本与原生性能;第二,自研基于 MLIR 框架的 DG-Compiler 编译器栈,对主流大模型算子做图级融合与调度优化;第三,与国内主流 AI 框架厂商建立原生适配联合工程团队,避免行业层面生态碎片化。
文章还特别强调,国产 GPU 软件生态的体系化建设需要整个产业界形成合力,单一厂商难以独立承担。数工科技已于 2025 年 5 月联合六家国产 GPU 厂商共同发起「中国 GPU 软件生态联盟」,致力于推动国产 GPU 算子规范、测试套件与接口标准的统一,为国产 AI 算力走向规模化商用扫清软件侧障碍。