中国移动推出九天深度思考大模型 已完成17款国产AI芯片适配
2025-03-11 18:20:32
  • 0
  • 0
  • 0

3月11日消息,中国移动于近日推出了自主研发的“九天深度思考大模型”。

中国移动从2013年开始人工智能技术和产品的自主研发,经过十一年技术攻关,打造了“九天”大模型和人工智能平台等标志性产品,其中,“九天”大模型已囊括多模态、语言、视觉、语音及结构化数据等全系列,覆盖从十亿到万亿参数量全规格。

近日,“九天”多模态大模型在MVBench视频理解评测榜单上荣登榜首。为进一步解决人工智能落地行业过程中必须要攻克的“复杂系统智能化”难题,中国移动专门全新研发了“九天深度思考大模型”,通过模拟人类思维过程的进阶处理方式,在复杂任务推理、精准意图理解和专业领域知识应用等方面展现出显著优势。

据了解,“九天深度思考大模型”具备严谨的数学推理能力、文字组织能力及丰富的行业知识。与传统语言大模型不同,“九天深度思考大模型”在处理问题时并非直接生成答案,而是通过多次迭代的“慢思考”过程,确保每个结论均经过严谨推演。例如,面对数学问题,大模型会先拆解题目条件,调用相关公式和定理,再通过分步计算验证结果;对于开放性问题,则通过语义深度分析生成结构化的论述。这种“慢思考”模式不仅提升了复杂任务的准确性,还显著增强了答案的可解释性。此外,中国移动九天团队在大模型训练中引入了跨领域知识融合策略,结合大规模行业语料库与通用语料,使其能够灵活切换专业场景,同时保持自然语言生成的流畅性。

测试结果表明,“九天深度思考大模型”在代码理解、数学计算、生成内容逻辑、专业知识全面性和准确性等方面效果显著提高,并在奥林匹克数学考试题、GPQA两个数据集中表现优异。

九天大模型的技术优势体现在四大核心领域,一是实现全链路自主创新,覆盖数据集构建、预训练、微调、强化学习及推理等关键环节;二是完成全栈国产化支持,基于国产万卡算力集群与算法框架,完成17款国产AI芯片的适配验证,实现跨芯片架构的无缝迁移与持续训练;三是打造体系化AI技术体系,凭借算力网络优势实现开放环境下AI能力的智能调度与弹性部署;四是强化复杂系统智能化能力,打造行业智能化引擎,深度解构通信、能源等重点领域业务逻辑,实现AI能力与产业场景的有机融合。(崔玉贤)

来源: 网易科技报道

 
最新文章
相关阅读