文 | 周鑫雨 邓咏仪
(资料图片仅供参考)
编辑 | 苏建勋 杨轩
2023年,大模型成了点燃市场的第一把火。
在ChatGPT带动的大模型热潮中,拥有文心大模型的百度已经率先发令,计划在3月推出语言大模型“文心一言”。随后,原美团联合创始人王慧文、出门问问创始人李志飞、前搜狗CEO王小川等互联网老将竞相出山,宣告做“中国的OpenAI”。
字节跳动也并未缺席。36氪从多个独立信源处获悉,字节跳动在大模型上已有所布局,分别在语言和图像两种模态上发力。字节跳动相关技术负责人对此回应:技术中台在这些领域有探索,还很初期,不成熟。
一名知情人士透露,语言大模型团队由字节搜索部门牵头,目前团队规模在十数人左右。图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。
另有知情人士表示,字节跳动语言大模型团队在今年组建,探索方向主要为与搜索、广告等下游业务的结合,“搜索业务部门、AI Lab和AML(应用机器学习)团队都调了一部分人支援语言大模型,团队目前的预期是在今年年中推出大模型”。
据悉,语言大模型团队负责人与图像大模型团队负责人的间接和直接汇报对象,均为Tik Tok产品技术负责人朱文佳。
朱文佳能成为字节大模型业务中的“隐形领队”,与他在算法和搜索业务上具有深厚的经验不无关联。加入字节跳动前,朱文佳曾在百度担任搜索部主任架构师。2015年,朱文佳进入头条,被称为“头条里算法技术的Top 3人选”。四年后,他成为今日头条CEO。2021年2月,他又调任成为Tik Tok产品技术负责人,向Tik Tok CEO周受资汇报。
不少人认为,最后能在大模型上与百度一较高下的公司,大概率会是字节跳动。
资金,人才,算力,这是训练大模型所需的入场费。对于头部互联网公司而言,前两者不算难以攻克的问题。但英伟达A100显卡在国内停止供应后,训练大模型所需的高性能GPU成了不少公司稀缺的重要资源。
不过,一名AI资深从业者透露,字节并不缺GPU。字节旗下的企业技术服务平台火山引擎,在2021年正式进军基础云市场(IaaS层),为大模型所需的算力奠定了基础。
上述从业者告诉36氪:“从训练大模型的角度而言,工程团队和云服务团队一样关键,在两者上均无短板的字节跳动具有一定优势。”
对AI领域的布局,字节的反应速度一直较快。据了解,目前AIGC(AI生成内容)技术也已结合到头条的内容创作以及抖音的图文内容生成中。比如2021年,抖音上线的可以把人脸卡通画的“漫画脸”特效就小有出圈。
但ChatGPT的成功模式已证明,大模型的训练是入场费高昂的长跑。另有知情人士表示,在ChatGPT公开前,字节内部对大模型的投入依然较为犹疑,“对于字节的产品矩阵来说,目前的算法已经够用”。
字节跳动能交出怎样一份大模型答卷,还需要时间验证。
延伸阅读:
《ChatGPT中国变形记|深氪》
36kr制图
36kr制图