本文作者:访客

日日新大模型升级,商汤盘中暴涨超30%停牌,明起恢复交易

访客 2024-04-24 21:02:45 31748 抢沙发

4月24日,商汤集团股份有限公司(商汤-W,0020.HK)公告称,已向联交所申请B类股份于4月25日上午9时起恢复买卖。

当天11时15分,商汤股票暂停交易,暂停交易前涨31.15%,股价0.8港元/股,交易12.61亿港元,最高涨幅超36%。

商汤在公告中表示,4月23日,公司于上海临港AIDC举办技术交流日活动,其中本公司推出6000亿参数大模型(日日新5.0),在知识、数学、推理和代码能力方面大幅提升,综合性能全面对标GPT-4Turbo。同时,公司推出行业大模型一体机版本以及移动端侧大模型SDK版本。

4月23日,商汤科技发布全新“日日新SenseNova 5.0”大模型体系,采用混合专家架构,基于超过10TB tokens训练数据,推理时上下文窗口可以有效到200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。

商汤科技董事长兼CEO徐立在技术交流日上表示:“端侧是行业应用铺开的关键。”

商汤23日推出了行业首个云、端、边全栈大模型产品矩阵。端侧大语言模型可在中端平台实现18.3字/s的平均生成速度,旗舰平台可达78.3字/s。扩散模型端侧推理速度小于1.5秒,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

商汤还推出企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署。相比行业同类产品,推理成本节约80%,CPU工作负载50%。

此外,商汤发布了基于昇腾原生的行业大模型,共同打造面向金融、医疗、政务、代码等大模型产业生态。

徐立还展示了商汤的文生视频能力,并表示会在很短时间发布文生视频平台。

徐立表示,商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。

根据商汤此前公布的2023年年报,公司实现全年营收34.06亿元,同比减少10.6%;年度亏损64.94亿元,同比扩大6.6%;EBITDA(息税折旧及摊销前利润)为亏损54.5亿元,同比收窄2.2%。其中,生成式AI实现收入11.84亿元,占总收入的34.8%,相较2022年仅占10.4%的3.95亿元,增长了199.9%。

据介绍,商汤生成式AI客户包含三大运营商、招商银行、海通证券等机构,京东、小米、阅文等头部互联网公司,以及清华大学、上海交大等学术机构。小米SU7汽车小爱同学也集合应用了商汤的大模型技术能力,有基于商汤端云大模型解决方案。

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,31748人围观)参与讨论

还没有评论,来说两句吧...