自主研发通用图形处理器

三类场景，一套架构

数工 DG 系列 GPGPU 采用自研芯片架构，覆盖大模型训练、高并发推理与专业图形渲染三大场景。兼容 CUDA 生态迁移路径，最大限度降低国产替代迁移成本。

核心技术

为什么选择国产 GPGPU

硬核工程能力铸就的差异化优势，每一项都来自数工研发团队多年深耕与客户场景的反复打磨。

自研张量计算核心（DTC），矩阵指令集为千亿参数训练做了专门优化
DGLink 芯片互联协议，单节点 8 卡全互联带宽达 3.2 TB/s
原生支持 FP8/FP16/BF16/INT8/INT4 混合精度计算
CUDA 迁移工具链，主流训练框架无需修改代码即可运行
DG-Driver 统一驱动架构，支持裸金属与虚拟化混合部署
军工级可靠性设计，MTBF ≥ 200,000 小时

产品矩阵

按场景匹配覆盖全量需求

国产 GPGPU 产品线覆盖从入门到旗舰的完整谱系，客户可按算力需求、功耗预算、部署形态灵活选择。

MODEL 01

DG-X900

DG-X900 数据中心训练卡

大模型训练 · 科学计算 · HPC

制程工艺8nm 国产工艺

FP16 峰值算力320 TFLOPS

BF16 峰值算力320 TFLOPS

显存容量80GB HBM3

显存带宽3.2 TB/s

功耗（TDP）700W

互联接口PCIe 5.0 × 16 / DGLink 400GB/s

外形规格SXM5 / OAM

MODEL 02

DG-X600

DG-X600 数据中心训练卡

中等规模模型训练 · 科学计算

制程工艺10nm 国产工艺

FP16 峰值算力180 TFLOPS

BF16 峰值算力180 TFLOPS

显存容量48GB HBM2e

显存带宽1.8 TB/s

功耗（TDP）400W

互联接口PCIe 5.0 × 16 / NVLink 兼容桥接

外形规格PCIe Full-Height Full-Length

MODEL 03

DG-X300

DG-X300 工作站训练卡

中小规模训练 · 开发调试

制程工艺12nm 国产工艺

FP16 峰值算力80 TFLOPS

BF16 峰值算力80 TFLOPS

显存容量24GB GDDR6X

显存带宽960 GB/s

功耗（TDP）250W

互联接口PCIe 4.0 × 16

外形规格双槽全高半长

MODEL 04

DG-V700

DG-V700 高并发推理卡

在线推理 · 多模型并行 · 边缘推理

制程工艺8nm 国产工艺

INT8 峰值算力4000 TOPS

FP16 峰值算力160 TFLOPS

显存容量32GB LPDDR5X

显存带宽512 GB/s

功耗（TDP）150W

互联接口PCIe 5.0 × 8

外形规格半高半长

MODEL 05

DG-G480

DG-G480 专业图形卡

图形渲染 · 数字孪生 · 三维仿真

制程工艺10nm 国产工艺

FP32 峰值算力24 TFLOPS

显存容量24GB GDDR6

显存带宽576 GB/s

最大分辨率7680 × 4320 (8K@60Hz)

功耗（TDP）220W

显示接口4× DisplayPort 2.0 / 2× HDMI 2.1

外形规格全高双槽

场景落地

哪些典型场景能获得最大收益

下列场景是我们与客户共创验证的典型部署方案，交付过的合同金额与客户口碑可提供给商务对接人查阅。

大模型预训练

DG-X900 组成万卡集群，承载千亿参数大模型的预训练与持续学习任务

实时推理服务

DG-V700 高并发推理架构，支持单卡同时运行 16 路独立推理实例

科学计算仿真

气象、地质勘探、流体力学等高性能计算场景，FP64 精度全面兼容

专业图形渲染

DG-G480 支持光线追踪与 AI 超分辨率，适用于影视、工业设计与数字孪生

生态兼容

主流生态无缝衔接

CUDA 迁移兼容PyTorchTensorFlowPaddlePaddleMindSporeONNX RuntimeOpenCLVulkan

为你的场景定制国产 GPGPU 方案

数工销售团队将在 24 小时内与你联系，提供选型建议、性能测试、现场 POC 支持与报价。

预约方案沟通下载产品手册