本文作者:博学多才

商汤盘中大涨超30%,公司发布日日新5.0大模型

博学多才 2024-04-25 72041

24日,商汤-W(00020.HK)高开3.28%,开盘后公司股价迅速拉升一度涨超36%。截至发稿,该股涨约30%。

消息面上,商汤科技23日发布日日新5.0大模型,该模型采用混合专家架构,基于超过10TB tokens训练数据,推理时上下文窗口可以有效到200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。

商汤科技董事长兼CEO徐立表示,商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。

据悉,商汤端侧大语言模型可在中端平台实现18.3字/s的平均生成速度,旗舰平台可达78.3字/s。扩散模型端侧推理速度小于1.5秒,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

徐立还展示了商汤的文生视频能力,并表示会在很短时间发布文生视频平台。

在商汤-W的带领下,科网股今日再度走强,恒科指涨近3%,截至发稿,哔哩哔哩-W(09626)涨7%;快手-W(01024)涨6.31%;阿里巴巴-SW(09988)涨3.65%。

阅读