出品 | 搜狐科技
作者 | 梁昌均
(资料图片仅供参考)
在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。
在4月10日下午的技术交流日上,商汤正式发布“日日新SenseNova”大模型体系。这一大模型体系的名称取自《礼记·大学》中“汤之盘铭曰:苟日新、日日新、又日新“。
商汤科技董事长兼CEO徐立表示,这寓意商汤在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI(通用人工智能)的更多可能。“日日新很像是一个超市,寓意也不错,商汤将提供一个大模型的超市。”
他现场演示了这个超市中的语言大模型、AI文生图创作、2D/3D数字人生成、大场景/小物体生成等生成式AI模型及应用。整体表现收获不少好评,有网友称之为“AI实干家”。
这背后是商汤长期的技术积累,包括投资百亿的算力基础设施SenseCore AI大装置,五年累计超过128亿元的投入,以及在计算机视觉、自然语言理解等大模型领域的多点开花。
“AI大模型会带来新的生产范式,将为我们带来无限的可能性,这件事情无比让人兴奋。我们也会将AGI作为核心的发展目标,在未来几年持续推动大模型和AGI技术的突破。”徐立在发布会上表示。
大模型+大算力,走出自己的AGI发展之路
在活动现场,商汤重点演示了基于“日日新SenseNova”大模型体系自研的大型语言模型“商量SenseChat”。它具备多轮对话和超长文本的理解能力,以及逻辑推演能力,让它编写广告语、邀请函、小说故事都不在话下。
同时,“商量SenseChat”可以作为编程助手,帮助开发者更高效地编写和调试代码;可以是健康咨询助手,提供个性化的医疗建议;也可以是PDF文件阅读助手,从复杂文档中提取和概括信息。
此外,商汤还演示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等AIGC(人工智能内容生成)大模型及应用。
秒画“SenseMirage”不仅融合了超10亿参数的商汤自研文生图生成模型,支持二次元、三次元等多种生成风格,能表现出光影、细节等,并支持6K高清图的生成,还支持一键导入多个平台的开源模型或上传用户本地模型并对其进行特异性推理加速优化,结合自研模型及训练能力,用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。
技术交流会现场,徐立不仅演示了基于商汤自研AIGC模型的作图(MH team作品),也介绍了用户可导入开源模型并通过秒画平台对该模型加速推理(作画)的能力”。
AI数字人视频生成平台“如影SenseAvatar”仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。3D内容生成平台“琼宇SenseSpace”和“格物SenseThings”则可以高效低成本生成大规模三维场景和精细化的物件,适用于元宇宙、虚实融合应用等场景。
这些大模型的背后都离不开大规模AI基础设施的算力支持,“日日新SenseNova”大模型体系正是基于商汤AI大装置SenseCore打造。
徐立表示,在AI大模型时代,数据、算法和算力这三要素在经历新的演变,对模型能力也有新的注解。“今天衡量一个模型能力的时候,不能够简单来看模型的参数量,而是要用计算量来做标定。”计算量即为参数量和数据量的乘积,拆解来看就是GPU数量乘以大规模并行计算的效率再乘以运行的时间。
徐立表示,过去10年最好的AI算法对算力的需求增长超过100万倍,也就是每两年最先进的算力要提高一个数量级才能支持好最好的AI大模型,而未来对计算量需求将呈现爆发式增长。
这一方面是大模型参数量将以指数级的速率提升,另一方面是数据量随着多模态的引入也将大规模增长。不过,徐立提到,虽然目前业界训练模型对基础算力、基础设施的需求非常旺盛,但基础算力里对并行效率的要求非常高,真正好用的基础设施非常稀缺。
为此商汤从2016年开始,累计投入百亿打造了算力、平台和算法一体化的人工智能底层基础设施SenseCore AI大装置,并在上海临港兴建了亚洲最大的人工智能计算中心(AIDC),是亚洲目前最大的智能计算平台之一。
自AIDC在去年启用后,SenseCore持续扩建,在27000块GPU芯片卡的加持下,可以输出5.0 exaFLOPS(每秒5百亿亿次)的总算力,可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。
同时,基于AI大装置的能力,商汤大模型也加速成长,已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型。
在这个过程中,商汤形成以“大模型+大算力”的方式推进AGI的发展路径。商汤认为,在“日日新SenseNova”大模型体系和SenseCore AI大装置的支持下,持续演进的多模态大模型,加上决策智能大模型,将成为AGI实现的重要起点。
坚持长期投入,从数据飞轮向智慧飞轮演进
面对AIGC和大模型的浪潮,商汤能够抢先抓住机遇,很大程度来讲,是其坚持长期研发投入和技术积累的必然。
虽然人类的80%的信息是通过眼睛来获取,但商汤并不仅仅着眼于计算机视觉领域,而是寻求技术多点开花。除了计算机视觉大模型,商汤还在自然语言处理、多模态、AIGC、决策智能等AI大模型上取得突破,包括此次发布的1800亿参数的NLP大模型,以及早前宣布开源的30亿参数的多模态大模型书生2.5等。
“所有这些积累,不同的模态,它的汇聚,促使我们正在去训练一个更加强大的多模态大模型。”商汤科技联合创始人、首席科学家王晓刚表示。
而为了满足这些大型复杂AI模型的训练需求,商汤也续优化分布式计算平台、节能数据中心、高速网络架构、高性能存储系统、训练容错与可靠性、数据安全平台、混合云计算及性能监控分析等系统和能力。
“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。”王晓刚表示。
同时,他认为,AGI将实现从数据飞轮到智慧飞轮的演进,最终迈向人机共智。通过长期的研发投入和技术积累,商汤正在这条演进之路上大步向前。
加速大模型落地,重塑生产力和交互工具
对于此次推出的“日日新SenseNova”大模型体系,商汤也宣布提供API接口和服务,包括图片生成、自然语言生成、视觉感知通用任务与数据标注服务。
基于AI大装置SenseCore和“日日新SenseNova”大模型体系,商汤还面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署等多种大模型即服务(MaaS),并带来效率的快速提升,如基于预训练大模型的自动化数据标注相较于人工速度提升近百倍,模型推理部署服务可将大模型推理效率提高100%以上。
去年商汤就已对外开放了SenseCore的服务能力,已支持8家客户进行大模型训练,总共提供了7000多张GPU卡。目前,SenseCore已支持超过10个大模型训练项目,包括语言大模型、文生图模型、视觉大模型、多模态模型等自研模型和客户自定义模型。
“日日新SenseNova”等大模型也为商汤的自身业务实现突破。据王晓刚介绍,商汤的超大模型已覆盖了公司核心业务,在智慧城市、智慧商业、智能汽车和智慧生活四大板块20多个场景实现落地。
在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,构建了感知决策一体化的自动驾驶多模态模型。
目前,智能汽车是商汤增长最快的业务代表之一,去年营收近3亿元,同比增长近60%,相关产品量产交付数量超50万,新增定点数超800万辆。王晓刚称,未来将利用多模态大模型,进一步去推动自动驾驶技术的发展。
在智慧生活的场景落地方面,商汤升级了SenseMARS混合现实平台,以AIGC多模态能力赋能小红书、微博、B站等超过200个APP应用。
商汤还透露,去年SenseCore对外服务产生的收入在智慧商业板块总的占比超过20%,并预计该业务在今年的收入规模将大幅增加。随着“日日新SenseNova”大模型体系开放API和MaaS服务,该板块有望迎来更快增长。
1956年,人工智能这个词和粒子对撞机同时发明出来,粒子对撞机作为物理学最大的基础设施大装置,给行业推进带来了动力。徐立希望,商汤的AI大装置不仅可以支持自身的大模型训练,也能支持下游生态,从而使得AI在大模型时代更好地赋能百业。
“我们将通用人工智能作为核心发展战略,以期在未来几年内实现重大突破。商汤将一如既往地坚定投入在迈向通用人工智能的前沿研发与商业化进程中。”徐立表示。
关键词: