自主研发通用图形处理器
全场景算力,自主可控
数工 DG 系列 GPGPU 采用自研芯片架构,覆盖大模型训练、高并发推理与专业图形渲染三大场景。兼容 CUDA 生态迁移路径,最大限度降低国产替代迁移成本。
核心技术
为什么选择 国产 GPGPU
硬核工程能力铸就的差异化优势,每一项都来自数工研发团队多年深耕与客户场景的反复打磨。
- 自研张量计算核心(DTC),矩阵运算吞吐量业界领先
- DGLink 芯片互联协议,单节点 8 卡全互联带宽达 3.2 TB/s
- 原生支持 FP8/FP16/BF16/INT8/INT4 混合精度计算
- CUDA 迁移工具链,主流训练框架无需修改代码即可运行
- DG-Driver 统一驱动架构,支持裸金属与虚拟化混合部署
- 军工级可靠性设计,MTBF ≥ 200,000 小时
产品矩阵
按场景匹配 覆盖全量需求
国产 GPGPU 产品线覆盖从入门到旗舰的完整谱系,客户可按算力需求、功耗预算、部署形态灵活选择。
MODEL 01
DG-X900
DG-X900 数据中心训练卡
大模型训练 · 科学计算 · HPC制程工艺8nm 国产工艺
FP16 峰值算力320 TFLOPS
BF16 峰值算力320 TFLOPS
显存容量80GB HBM3
显存带宽3.2 TB/s
功耗(TDP)700W
互联接口PCIe 5.0 × 16 / DGLink 400GB/s
外形规格SXM5 / OAM
MODEL 02
DG-X600
DG-X600 数据中心训练卡
中等规模模型训练 · 科学计算制程工艺10nm 国产工艺
FP16 峰值算力180 TFLOPS
BF16 峰值算力180 TFLOPS
显存容量48GB HBM2e
显存带宽1.8 TB/s
功耗(TDP)400W
互联接口PCIe 5.0 × 16 / NVLink 兼容桥接
外形规格PCIe Full-Height Full-Length
MODEL 03
DG-X300
DG-X300 工作站训练卡
中小规模训练 · 开发调试制程工艺12nm 国产工艺
FP16 峰值算力80 TFLOPS
BF16 峰值算力80 TFLOPS
显存容量24GB GDDR6X
显存带宽960 GB/s
功耗(TDP)250W
互联接口PCIe 4.0 × 16
外形规格双槽全高半长
MODEL 04
DG-V700
DG-V700 高并发推理卡
在线推理 · 多模型并行 · 边缘推理制程工艺8nm 国产工艺
INT8 峰值算力4000 TOPS
FP16 峰值算力160 TFLOPS
显存容量32GB LPDDR5X
显存带宽512 GB/s
功耗(TDP)150W
互联接口PCIe 5.0 × 8
外形规格半高半长
MODEL 05
DG-G480
DG-G480 专业图形卡
图形渲染 · 数字孪生 · 三维仿真制程工艺10nm 国产工艺
FP32 峰值算力24 TFLOPS
显存容量24GB GDDR6
显存带宽576 GB/s
最大分辨率7680 × 4320 (8K@60Hz)
功耗(TDP)220W
显示接口4× DisplayPort 2.0 / 2× HDMI 2.1
外形规格全高双槽
场景落地
哪些典型场景 能获得最大收益
下列场景是我们与客户共创验证的典型部署方案,交付过的合同金额与客户口碑可提供给商务对接人查阅。
01
大模型预训练
DG-X900 组成万卡集群,承载千亿参数大模型的预训练与持续学习任务
02
实时推理服务
DG-V700 高并发推理架构,支持单卡同时运行 16 路独立推理实例
03
科学计算仿真
气象、地质勘探、流体力学等高性能计算场景,FP64 精度全面兼容
04
专业图形渲染
DG-G480 支持光线追踪与 AI 超分辨率,适用于影视、工业设计与数字孪生
生态兼容
主流生态 无缝衔接
CUDA 迁移兼容PyTorchTensorFlowPaddlePaddleMindSporeONNX RuntimeOpenCLVulkan