商汤发布日日新大模型体系,包含多种大模型及能力

在日前举行的技术交流日上,商汤科技除了分享以“大模型+大算力”推进通用人工智能(AGI)发展的战略布局外,还发布了在该战略下诞生的“日日新SenseNova”大模型体系。

nEO_IMG_1681179153558.jpg

对此商汤科技董事长兼CEO徐立表示,“在AI大模型时代,数据、算法和算力这三要素在经历新的演变,大模型参数量将以指数级速率提升,而数据量随着多模态的引入也将大规模增长,因此必然会导致对算力需求的剧增。我们以商汤AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为‘日日新’,寓意‘苟日新、日日新、又日新’,希望在模型迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”


据了解,日日新大模型体系可提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力,并为政企客户提供了多种灵活的API接口和服务,客户可根据实际应用需求,调用日日新大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。

nEO_IMG_微信图片_20230411101959.jpg

其中,商汤的自研语言大模型名为“商量SenseChat”,拥有1800亿参数,还充分考虑了中文语境,能够更好地理解和处理中文文本,并且知识能自动及时更新。其目前已面向合作伙伴开启内测,未来将主要面向B端业务。


在此次活动的现场,“商量”展现了多轮对话和超长文本的理解能力,可实现逻辑推理、语言纠错、内容创作、情感分析等。例如当被要求为“商量”语言大模型写一条广告语,它所给出的回答是,“与商量携手,让语言成为你的优势,开启无限可能。”

nEO_IMG_微信图片_20230411131130.jpg

此外,商汤方面还展示了“商量”支持的创新应用,其中包括编程助手、健康咨询助手、PDF文件阅读助手等。据了解,“商量”编程助手核心功能包括代码补全、扩写、翻译、重构、修正,以及注释生成代码、复杂度分析、测试用例生成等。


据徐立透露,内部实测“商量”可实现将代码编写效率提升62%,且HumanEval测试集一次通过率达40.2%。而健康咨询助手则可为用户提供个性化的医疗建议,PDF文件阅读助手可轻松从复杂文档中提取和概括信息。


除“商量”外,日日新大模型体系还包含各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,其中包括文生图创作平台“秒画SenseMirage”、AI数字人视频生成平台“如影SenseAvatar”、3D内容生成平台“琼宇SenseSpace”和“格物SenseThings”等。

nEO_IMG_微信图片_20230411131116.jpg

据了解,“秒画”具有光影真实、细节丰富、风格多变的强大的文生图能力,可支持6K高清图的生成,并且用户还可根据自身需求训练生成模型。“如影”则仅需一段5分钟的真人视频素材,便可生成声音及动作自然、口型准确、多语种精通的数字人分身。


而“琼宇”(场景生成)和“格物”(物体生成)则能够高效低成本的生成大规模三维场景和精细化物件,为元宇宙、虚实融合应用打开新的想象空间。其中“琼宇”具有厘米级重建精度,应用场景涵盖城市及园区数字孪生、建筑设计、影视创作、文旅和电商等。


值得一提的是,基于商汤AI大装置和日日新大模型体系,商汤方面将面向行业伙伴提供涵盖自动化数据标注、自定义大模型并行训练、模型增量训练、模型推理部署、开发者效率提升等多种大模型即服务(Model-as-a-Service)。


据商汤方面公布的相关数据显示,基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升;模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看