商汤推出“日日新V6”,将加持具身“智能”
2025-04-11 14:09:47
  • 0
  • 0
  • 0

4月10日,商汤科技在2025技术交流日上推出升级的“日日新SenseNova V6”(下称“日日新V6”)大模型体系,通过多模态长思维链训练、全局记忆、强化学习的技术突破,形成多模态推理能力。

在长思维链、推理、数理、全局记忆方面,日日新V6多模态推理能力对标OpenAI o1,数据分析能力领先GPT-4o,并且涵盖国内首个支持10分钟中长视频深度解析的大模型。

“现在已经可以做到分析10分钟的视频,不是用rag的方法而是整个框架视频都通过自研的视频压缩技术,我们会在今年内做到一个小时的视频整个放进输入窗口来进行分析。”商汤科技执行董事及联合创始人、商汤大模型首席科学家林达华向媒体表示,对视频做分析理解是跟快手可灵等视频大模型相对错位的竞争,比起文本性的内容消费,视频、图文结合是更大的内容消费市场。

不同于其他的上下文窗口都是纯文本Token,日日新V6可以把语音、视频、文字形成一个统一跟时间轴对齐的上下文表达。而这个潜力正与具身智能的发展相呼应,在交互方面,多模态上下文表达使得人机交互更加自然和高效,从学习和泛化能力来看,多模态上下文表达也将为具身智能体提供了更丰富的训练数据。现场傅利叶、松应科技两家机器人公司也分别与商汤科技进行了战略签约。

“选择具身智能并不是我主动的选择,更多的还是主要在服务科技创新的群体。”商汤科技联合创始人、大装置事业群总裁杨帆说。同时做基础大装置和大模型是商汤科技的一大特色,其中比较典型的协同场景是对推理过程做预填充和解码的分离,这是一种架构优化技术,可以提升 GPU 硬件利用率并降低推理延迟。

在这一点上商汤科技也与阿里、腾讯这类既有云业务又有自研大模型的业务类似,并且较大厂而言业务专注力更加“纯粹”。“大装置最开始的初心和愿景,就是要去提高AI模型的生产和应用的性价比,要去降低它的门槛。”杨帆表示。

来源: 第一财经资讯

 
最新文章
相关阅读