数工科技DIGIT·CN

全场景算力,自主可控

数工 DG 系列 GPGPU 采用自研芯片架构,覆盖大模型训练、高并发推理与专业图形渲染三大场景。兼容 CUDA 生态迁移路径,最大限度降低国产替代迁移成本。

国产 GPGPU

为什么选择 国产 GPGPU

硬核工程能力铸就的差异化优势,每一项都来自数工研发团队多年深耕与客户场景的反复打磨。

  • 自研张量计算核心(DTC),矩阵运算吞吐量业界领先
  • DGLink 芯片互联协议,单节点 8 卡全互联带宽达 3.2 TB/s
  • 原生支持 FP8/FP16/BF16/INT8/INT4 混合精度计算
  • CUDA 迁移工具链,主流训练框架无需修改代码即可运行
  • DG-Driver 统一驱动架构,支持裸金属与虚拟化混合部署
  • 军工级可靠性设计,MTBF ≥ 200,000 小时

按场景匹配 覆盖全量需求

国产 GPGPU 产品线覆盖从入门到旗舰的完整谱系,客户可按算力需求、功耗预算、部署形态灵活选择。

MODEL 01

DG-X900

DG-X900 数据中心训练卡

大模型训练 · 科学计算 · HPC
制程工艺8nm 国产工艺
FP16 峰值算力320 TFLOPS
BF16 峰值算力320 TFLOPS
显存容量80GB HBM3
显存带宽3.2 TB/s
功耗(TDP)700W
互联接口PCIe 5.0 × 16 / DGLink 400GB/s
外形规格SXM5 / OAM
MODEL 02

DG-X600

DG-X600 数据中心训练卡

中等规模模型训练 · 科学计算
制程工艺10nm 国产工艺
FP16 峰值算力180 TFLOPS
BF16 峰值算力180 TFLOPS
显存容量48GB HBM2e
显存带宽1.8 TB/s
功耗(TDP)400W
互联接口PCIe 5.0 × 16 / NVLink 兼容桥接
外形规格PCIe Full-Height Full-Length
MODEL 03

DG-X300

DG-X300 工作站训练卡

中小规模训练 · 开发调试
制程工艺12nm 国产工艺
FP16 峰值算力80 TFLOPS
BF16 峰值算力80 TFLOPS
显存容量24GB GDDR6X
显存带宽960 GB/s
功耗(TDP)250W
互联接口PCIe 4.0 × 16
外形规格双槽全高半长
MODEL 04

DG-V700

DG-V700 高并发推理卡

在线推理 · 多模型并行 · 边缘推理
制程工艺8nm 国产工艺
INT8 峰值算力4000 TOPS
FP16 峰值算力160 TFLOPS
显存容量32GB LPDDR5X
显存带宽512 GB/s
功耗(TDP)150W
互联接口PCIe 5.0 × 8
外形规格半高半长
MODEL 05

DG-G480

DG-G480 专业图形卡

图形渲染 · 数字孪生 · 三维仿真
制程工艺10nm 国产工艺
FP32 峰值算力24 TFLOPS
显存容量24GB GDDR6
显存带宽576 GB/s
最大分辨率7680 × 4320 (8K@60Hz)
功耗(TDP)220W
显示接口4× DisplayPort 2.0 / 2× HDMI 2.1
外形规格全高双槽

哪些典型场景 能获得最大收益

下列场景是我们与客户共创验证的典型部署方案,交付过的合同金额与客户口碑可提供给商务对接人查阅。

01

大模型预训练

DG-X900 组成万卡集群,承载千亿参数大模型的预训练与持续学习任务

02

实时推理服务

DG-V700 高并发推理架构,支持单卡同时运行 16 路独立推理实例

03

科学计算仿真

气象、地质勘探、流体力学等高性能计算场景,FP64 精度全面兼容

04

专业图形渲染

DG-G480 支持光线追踪与 AI 超分辨率,适用于影视、工业设计与数字孪生

主流生态 无缝衔接

CUDA 迁移兼容PyTorchTensorFlowPaddlePaddleMindSporeONNX RuntimeOpenCLVulkan

为你的场景定制 国产 GPGPU 方案

数工销售团队将在 24 小时内与你联系,提供选型建议、性能测试、现场 POC 支持与报价。