旷视科技联合创始人、CTO唐文斌接受采访
(资料图)
出品 | 搜狐科技
作者 | 梁昌均
“在ChatGPT出来之前,视觉、语言都是在物理世界,现在出现一些深层次的东西,比如数字世界的人机交互。”近日,旷视科技联合创始人、CTO唐文斌对搜狐科技等媒体谈及ChatGPT时表示,AI技术将迎来新一轮浪潮。
他认为,所有的AI可以分为两种,一类是数字世界的AI,模型更多是在决策环节里面,通过知识和逻辑引擎解决数字世界中的任务;另一类是物理世界的AI,通过感知、决策、执行这样的闭环,用机器人的方式跟物理世界做交互。
具体来说,物理世界的AI需要通过感知的方式把物理世界映射到数字世界中,然后在数字世界中做出好的计算、模拟、推理、生成,形成好的解决方案,并通过控制能够输出到物理世界里面去。
“物理世界更加复杂,用AI去解决物理世界的问题更难,因为这里面包含着很多决策。”唐文斌表示,基于自身优势,旷视会把创新放在跟物理世界打交道的AI上面。
在唐文斌看来,AI场景或说技术可以分成三部分,即感知、决策和执行,如果只有感知,整个价值链是不完整的,需要通过感知、决策、执行整个链路形成场景中的闭环价值。
物流就是旷视用AI解决物理世界问题一个典型领域。在昨日的业务沟通交流会上,旷视科技物流业务事业部负责人徐庆才表示,智慧物流整个行业的春天来了,实体企业数智物流转型出现“去伪存真”,开始追求高ROI和真实经济价值,降本增效的业务需要更加真切,同时企业也更加期待转型方案的快速落地与真实交付。
唐文斌表示,这跟这波AI热潮没有关系,反而跟疫情有关。“客户需求变强,尤其是在疫情之后,希望业务本身更加可控,不被更多的因素所干扰。”比如说人力成本上升,对人员不想形成更强的依赖,同时强调标准化和可复制性,希望能够以较低成本去做转型。
不过,物流行业的场景也非常分散和复杂,仓库中存在托盘、箱、件、货架等多种形态,且高矮不同、轻重不同,这就可能导致相应的自动化解决方案不同。旷视并未选择全盘通吃,而是聚焦做托盘的自动化。
中国作为制造业大国,生产出来的商品集中化趋势明显,很多工厂包括大型的城市仓城都是以托盘的形式来进行存储。数据显示,托盘类需求在整体仓储市场占比90%。
“旷视早先的时候也做了挺多的东西,但这几年一直在聚焦,聚焦再聚焦,希望把产品做得更少,但是做得更好。”唐文斌表示,目前托盘的自动化尚未被解决得足够好。
基于市场需求,旷视借助AI能力打造了柔性的托盘解决方案,推出了智能四向车、河图等软硬件平台。旷视四向车目前是业内最薄的、最快的四向车,同时能做到低维护甚至免维护,还能够通过摄像头的“眼睛”能够对异常情况实现自愈。
同时,在决策层面,旷视通过河图软件调度能力,不仅可以做到高密度存储,也可以做到高密度进出。旷视还推出常温车、冷库车、防尘车、清扫车等,实现对物流场景更加个性化的覆盖,能够让四向车产品扩展更多应用场景,成为更加通用化的托盘解决方案。
这也帮助客户起到降本增效的效果,比如四年合作四次的国药控股,借助旷视物流解决方案使得整仓效率提升25%,单笔订单复核时间从150S下降到57秒,并在未来五年将节约上千万元成本。
据介绍,旷视智能四向车在去年的销量已突破400台,位列市场前三;落地案例超过200个,签约项目达470个,覆盖新能源、食品、医药、鞋服、化纤、机械等领域,客户如中粮集团、宁德时代、公牛集团、徐福记等企业。
目前,物流是旷视除个人物联网和城市物联网之外的第三大核心业务。而早在2021年3月就提交科创板招股书的旷视,目前在过会后仍在等待进一步注册结果,其后续在上市后也需要更为强劲的业务来支撑估值。
徐庆才透露,旷视物流业务这几年呈现翻番甚至是更高的成长,并希望旷视物流解决方案在今年能够成为多个行业的首选,明年将四向车规模做到行业第一。
对于未来的技术趋势,ChatGPT等生成式AI让业内外关注到了大模型的力量。唐文斌也对搜狐科技表示,旷视一直在视觉大模型上有比较大的投入和研究。
他表示,计算机视觉以前在检测、分类、分割有三套模型,现在发现可以用一个生成模型统一。“这将使得很多算法的演进出现新变化,模型统一化和模型变大之后也可以带来收益,需要把它看做是一个工具。”
唐文斌认为,AI当前的应用场景和理想场景还存在一定差距。结合物流场景来看,它从原先纯手工时代走向现在比较自动化、智能化的状态,但机器人的速度、调度的方式、驾驶的方式、人机交互和系统交互的方式,其实都跟理想的情况有差距,还无法做到像人类一样灵活地互动交付。
“这个差距来自于目前技术上的不可实现,还没有找到一个好的方式。我认为类似大模型这样的新技术发展,未来可以解决这些问题,弥合目前的差距。”唐文斌表示。
关键词: