天数智芯不是只用一个“自研大模型框架 用什么框架做预训练 / 微调
2026/6/6 16:42:25 网站建设 项目流程

天数智芯不是只用一个“自研大模型框架”,而是在自家软件栈上兼容并封装了主流开源框架,典型就是 DeepSpeed / Megatron-DeepSpeed / Colossal-AI / BMTrain 这一套,再加上自家推理引擎和 DeepSpark 社区模型库。

文章由ai生成

可以理解成:

天数智芯 = “国产 GPU + 自研软件栈 + 兼容主流开源框架(DeepSpeed/Megatron/Colossal-AI 等)+ 自研推理引擎 + DeepSpark 生态”


1. 训练侧:用什么框架做预训练 / 微调?

官方公开资料里,天数智芯明确说自己支持的大模型训练框架包括:

  • DeepSpeed
  • Megatron-DeepSpeed(Megatron-LM + DeepSpeed 的 3D 并行组合)
  • Megatron-LM
  • Colossal-AI
  • BMTrain 等
    一些典型说法:
  • 产品页写得很直接:

    支持包括 DeepSpeed、Megatron-DeepSpeed、Megatron-LM、Colossal-AI 等主流框架

  • 智源大会上演讲也强调:

    天垓、智铠系列通用 GPU 广泛支持 DeepSpeed、Colossal、BMTrain 等各种大模型框架

  • 还和潞晨 Colossal-AI 做了专门的兼容互认证。
    所以,实战上:
  • 大模型预训练 / 微调,在天数智芯上常见组合就是:
    • DeepSpeed + Megatron-LM(Megatron-DeepSpeed)做 TP+PP+ZeRO 3D 并行,和你在 NVIDIA/A100 上用的一模一样;
    • 或者Colossal-AI / BMTrain这类更偏“易用+国产适配”的框架。
  • 天数智芯自己主要做的是:
    • 自研算子库 + IXCCL 通信库 + 驱动/运行时,把上面这些框架“搬到”自家 GPU 上跑;
    • 在 DeepSpark 社区里提供一堆已经适配好的训练/推理示例和脚本。

2. 推理侧:用什么框架做部署?

推理侧天数智芯也是“兼容为主,自研加速”:

  • 官方明确说自家推理框架无缝兼容 vLLM 和 TGI(Text Generation Inference)
  • 展会上也强调智铠系列推理卡兼容 GPTQ、vLLM 等量化和推理引擎;
  • DeepSpark 社区里还有基于自研推理引擎 IGIE / IxRT 的示例,以及 vLLM / Megatron-DeepSpeed / Firefly 等的训练/推理示例。
    典型推理栈:
  • 大语言模型在线服务:
    天数智芯 GPU + 自研推理引擎 / vLLM / TGI,配合量化(GPTQ 等)。
  • 多模态 / 视觉语言模型:
    同样是 vLLM / 自研引擎,只是模型换成 VLM 版本。

3. 和华为昇腾的对比,帮你串一下

你之前问的是“DeepSeek 适配华为昇腾是不是做了类似框架”,现在看天数智芯会更清楚:

  • 华为昇腾
    • 底层:CANN + HCCL
    • 训练:MindSpeed‑LLM + Megatron‑LM(昇腾版 Megatron)
    • 推理:MindIE / vLLM‑Ascend
      → 明确有一套“昇腾版 Megatron + 自研推理引擎”的栈。
  • 天数智芯
    • 底层:自研算子库 + IXCCL + 驱动
    • 训练:直接用开源框架(DeepSpeed / Megatron-DeepSpeed / Colossal-AI / BMTrain),不是另起一个“天数版 Megatron”
    • 推理:自研推理引擎 + 兼容 vLLM / TGI
      → 是“兼容主流开源框架 + 自研底层栈”,不是“再造一个 Megatron”。

4. 一句话总结

  • 天数智芯没有搞一个完全独立的“天数大模型框架”,而是:
    • 训练:用DeepSpeed / Megatron-DeepSpeed / Colossal-AI / BMTrain等开源框架,跑在天垓/智铠卡上;
    • 推理:用自研推理引擎 + vLLM / TGI等主流量化/推理引擎;
    • 生态:DeepSpark 社区提供大量适配好的模型和脚本。
      所以如果你要在天数智芯上做大模型训练,技术栈和你在 NVIDIA 上用 DeepSpeed + Megatron 基本是一套,只是底层从 CUDA+NCCL 换成了天数自家的算子库 + IXCCL。

文章由ai生成

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询