01安装与环境
数工 SDK 支持 Linux / macOS / Windows 三大平台。推荐使用 Python 3.10+、CUDA 11.8 兼容层或 DG-Driver 2.0+。
install.sh
# Python
pip install digit-sdk
# C++(CMake)
find_package(digit REQUIRED)
target_link_libraries(myapp PRIVATE digit::sdk)
# Go
go get github.com/digit-cn/digit-go02快速上手
以下示例在 3 分钟内完成首次调用。你需要先在 console.digit.cn 创建 API Key。
hello_digit.py
from digit import Client
client = Client(api_key="dk_live_xxxxxxxx")
resp = client.chat.completions.create(
model="digit-chat-13b",
messages=[{"role": "user", "content": "Hello!"}],
temperature=0.7,
)
print(resp.choices[0].message.content)03API 参考
所有 REST 接口遵循 OpenAPI 3.1 规范,Base URL 为 https://api.digit.cn。gRPC 接口使用端口 443 的 TLS 通道。
| 方法 | 路径 | 说明 |
|---|---|---|
| POST | /v1/infer | 云端推理接口。支持文本、图像、音频多模态输入,返回流式或整段响应。 |
| POST | /v1/train/jobs | 提交训练任务。支持 LoRA 微调、全参数训练、持续学习三种模式。 |
| GET | /v1/models | 列出可用模型与版本,包含参数量、上下文窗口、授权状态等元信息。 |
| POST | /v1/embeddings | 获取文本 Embedding 向量。支持 768/1024/2048 三种维度。 |
| GET | /v1/usage | 查询调用量与算力消耗,支持按日期、模型、项目维度聚合。 |
04CUDA 迁移
数工迁移工具链支持 CUDA 代码自动转译为 DG-Kernel,已覆盖 1800+ 算子映射。主流训练框架无需修改源码。
migrate.sh
# 扫描项目,输出兼容性报告
digit-migrate scan ./src --report ./migrate-report.html
# 自动转译(保守模式)
digit-migrate convert ./src --mode conservative
# 性能对比
digit-bench compare --baseline cuda --target dg05Docker 镜像
官方镜像仓库地址:registry.digit.cn/digit/runtime
- ▸
:2.6.0-cuda12— CUDA 兼容层镜像(4.2 GB) - ▸
:2.6.0-dg— 原生 DG 运行时(2.8 GB) - ▸
:2.6.0-edge— 边缘轻量版(780 MB,ARM 64)
06API Playground
在浏览器中直接调试 API,无需编写代码。支持请求构造、鉴权注入、响应 diff 与代码片段生成。
07教程索引
T01从 CUDA 迁移到 DG:端到端实战
T02LoRA 微调 13B 模型:单卡即可完成
T03分布式训练:万卡集群的数据并行与流水并行
T04生产部署:K8s Operator 与蓝绿发布
T05边端推理:DE-Nano 上部署 Vision 模型
T06性能调优:Profiler 与火焰图解读
08常见问题
SDK 是否支持离线部署?
支持。企业版 SDK 提供离线许可证激活方式,全部算子与运行时可在无公网环境运行。
CUDA 代码迁移需要多久?
数工迁移工具对 95% 的 PyTorch / TensorFlow 主流场景做到零代码改动,复杂自定义算子平均 2-5 个工作日。
是否开源?授权方式是什么?
SDK 前端库以 Apache 2.0 开源,底层驱动与编译器为商业许可。企业版含源代码 Escrow 选项。
如何升级 LTS 版本?
LTS 分支仅接受安全补丁与关键修复,不引入破坏性改动。签约客户可获得 2 年支持承诺。
09发布日志
v2.6.02026-03-28
- ▸新增 DG-X900 FP8 训练支持,相同显存下吞吐量提升 2.3×
- ▸CUDA 迁移工具新增 220 条算子等价映射
- ▸Python SDK 的 stream 接口改用 Server-Sent Events,兼容更广
v2.5.4 LTS2026-02-15
- ▸LTS 长期支持版本,维护至 2028-02
- ▸修复 gRPC 长连接在 K8s Ingress 下偶发断流的问题
- ▸升级 OpenSSL 至 3.2.1(CVE-2026-0001 修复)
v2.5.02026-01-10
- ▸Go 绑定正式 GA,与 Python SDK 能力对齐
- ▸新增 Observability API:Trace / Metrics / Logs 三合一
- ▸支持国密 SM2/SM4 加密通道
10开源社区
数工 SDK 前端库在 GitHub 开源,欢迎通过 Issues / PR 参与建设。每月社区例会公开。