当前速递!腾讯“散装”大模型
2023-06-02 10:32:40来源:钛媒体
图片来源 @视觉中国

文|光子星球,作者 | 吴坤谚,编辑 | 吴先之

大模型浪潮下的互联网行业暗流涌动,大家都在翘首以盼谁能率先跑出中国 GPT。


(资料图片)

百度、360、阿里、昆仑万维、商汤、金山、科大讯飞 ...... 即使抛去高校国家队和创业公司,已经在大模型领域秀过肌肉的大厂也能拉出一张清单来。中国科技巨头历来喜欢追逐风口,大模型的航海时代自然也不会免俗,但有那么一家巨头却很沉得住气,至今未曾露出什么大动作。

作为早在 2022 年 4 月便正式亮出旗下混元大模型的腾讯,在计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向均有所建树,如今却给外界一种 " 失声 " 的感觉。

自今年 2 月起,腾讯在大模型领域为外界所感知的大动作仅有两次,一是 2 月 27 日针对类 ChatGPT 对话式产品已成立「混元助手(HunyuanAide)」项目组,腾讯史上最高专业职级拥有者张正友为项目 Owner;二是 4 月 14 日发布新一代 HCC(High-Performance Computing Cluster)高性能计算集群。

在友商纷纷下场展示实力与声量,争取在大模型时代获取更多认知,腾讯的失声很可能是一部慢,步步慢。更有意思的是,腾讯控股自 3 月 29 日起便跌跌不休,以 Naspers 为首的大股东更是在持续减持套现,这兴许也是资本市场对腾讯在大模型赛道失声现状的不满情绪体现。

难道,腾讯还在 " 等风来 "?

" 失声 " 是表象

北上广不相信眼泪,互联网大厂只相信效率。即使是 OpenAI 这个不停烧钱的公司也会不时对外放出一些意见以及信息,在信息爆炸的现代社会中试图短暂地获取关注力,而腾讯也是如此。

我们不妨以 2 月 27 日为节点,从腾讯对外宣布的动作中寻找其大模型训练进度的蛛丝马迹。据光子星球不完全统计,腾讯自 2 月 27 日起至今的动作集中在三方面,一个是 AI 商业化应用,另一个是视频号,最后是政企合作。

细数下来,其实腾讯在各方面的动作并不小。除了分别于移动、联通两大运营商达成云计算方面的合作外,3 月 30 日,腾讯发布 AI 智能创作助手 " 腾讯智影 "。4 月,腾讯在上海智慧车站前夕发布智慧出行汽车云,发布了据称是国内性能最强的大模型计算集群,还与字节跳动破冰,探索视频合作。当时间到了 5 月,腾讯微视面向头部的抖音、小红书与快手招募创作者,于 5 月 9 日发布了 " 开悟 "AI 开放研究平台,更是开放 QQ 渠道为载体,让 AI 绘图工具 Midjourney 开启官方中文版内测。

与率先发布通用大模型并展开应用探索的诸位友商相比,腾讯的声量虽小却也谈不上 " 安静 "。而且其中无论是 " 开悟 "AI 开放研究平台、" 腾讯智影 "AI 智能创作助、计算集群的发布还是 Midjourney 相关动作,其实都与大模型训练有不小的关系。

智慧出行汽车云是基于云服务以及 AI 训练的 " 车云一体 " 服务," 开悟 " 本身是由 AI Labs 联合王者荣耀项目组推出的,本身是借用游戏场景进行 AI 训练的平台;" 腾讯智影 " 这款支持虚拟数字人、文本配音、智能 AI 绘画、文章转视频的应用本身也属于大语言模型的功能范畴;Midjourney 开放内测是对 AI 原生应用于 C 端落地的探索;高效的计算集群更是在大模型训练中不可或缺的基础设施。

再往下深挖,这三个项目其实也分属腾讯内部不同事业群。" 车云一体 " 属于 CSIG(云与智慧产业事业群)," 开悟 " 属于 IEG ( 互动娱乐事业群 ) ," 腾讯智影 " 应属于 WXG(微信事业群),大模型计算集群分属 TEG(技术工程事业群),QQ 的应用探索属于 SNG(社交网络事业群)。

这不免让我们联想到腾讯特色的 " 内部赛马 " 机制,这是在过去的腾讯业务线中,不同竞品之间养蛊最后确认胜者的流程。而光子星球自某位接近腾讯人士处获悉,CSIG、TEG 与 PGC 均在训练业务范围内的大模型。

但考虑到大模型训练极高的投入,内部赛马将造成更大的沉没成本。因此,目前的 " 赛马 " 现象更大可能是 TEG 统领全局,由各个 BG 提供语料以及数据集标注,为各 BG 的业务线打造专属模型,最后再通过知识蒸馏汇总到混元 AI 之中。

这样的战略布局好处很明显,既可以最大限度调动全局并提供高质量数据集,也能在长时间的模型训练中探索商业场景落地的可行路径。但弊端也同样显著,大型组织架构中各个 BG 难以相互配合,庞杂组织架构难免的山头林立也让成果互通变得困难。

" 我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。所以我们觉得(AI)非常重要,但这的确需要有很多的积累 ",结合 Tony 在腾讯一季度财报会议上的讲话,腾讯在试图对外解释自己的 " 不紧不慢 ",但在各家发力开卷的当下,未曾透露具体进度的回应总归显得有些苍白。

不受待见的 AI Labs 走上风口浪尖

无论最终腾讯通过田忌赛马落地了多少个 BG 的大模型应用,最终的目的一定是保证最顶端的 " 混元 " 能够帮助腾讯在 AI 时代站稳脚跟,甚至再现移动互联网时代的社交辉煌。

于是,一直以来在组织架构中显得有些边缘的 AI Labs 踏上舞台中央,享受着最集中的资源同时也承受着前所未有的压力。

这是因为,以腾讯 AI Labs 以及阿里达摩院为代表的大厂 AI 研究实验室通常进行的是较为前沿且高通用的算法研究,研究成果通常会通过 API 接口或 SDK 形式对其他 BG 输出,而业务性强的具体场景一般都需要算法的定制化,按需制作。相比以主导者的身份统筹业务 BG,更多的可能是以中台的定位帮助业务 BG 打造搭载前沿技术的产品。

光子星球自一位接近腾讯人士处了解到,AI Labs 一贯给其他 BG 的印象便是 " 不干实事、论文灌水 ",之所以会让同僚们产生如此刻板印象, 是因为许多前沿研究仅有成果而未能投产," 并非研究人员划水 "。其中比较典型的是经过 AI Labs 多次优化后的智能音箱,作为腾讯 20 周年庆的员工礼物于内部送出的同时项目也面临叫停的风险。

据了解,智能音箱项目于 2018 年 4 月上马,隶属于当时腾讯移动互联网事业群(MIG)旗下的智能创新业务事业部,其发布首日便在京东商城取得了两万台的首日销量。只是在智能音箱项目上线后 8 个月,CSIG 作为当时腾讯的业务重心也推出了自己的智能音箱项目叮当带屏音箱,项目划分问题与不同 BG 间微妙的 " 市场竞争 " 关系耐人寻味,这或许也是智能音箱项目被叫停的原因。

" 当一群本应专研算法,头脑风暴公司下一阶段核心竞争力的组织疲于应付各个业务 BG 的产品,甚至下场田忌赛马,即使如此还是不能落下学术产出,(公司)还能指望它做得多好?" 一位接近腾讯人士说。

技术变现是大厂技术部门的永恒命题,关键在于着急与否。一位咨询顾问告诉光子星球,相比于进入大厂的中台,沦为 " 算法外包工 ",无论是进入工业界的业务部门还是转身高校专研学术,都是性价比更高的选择。这或许也解释了曾经腾讯 AI Labs 主任、斯坦福博士张潼于 2018 年 12 月离职并重返学术界的原因。

如果未曾出现大模型这样目前公认的通往 AGI 的切实路径,AI Labs 可能也不会走上风口浪尖。只是中台的角色定位不变的话,没有强有力的话语权支撑,AI Labs 能否完成组织交付的任务还是要打一个问号。

毕竟曾经展开中台这个故事的阿里已经通过分拆上市解构了中台神话,就像亟需数字化的中小企业中业务部门与 IT 部门相互不对付,中台与各事业群之间的微妙关系已然让互联网企业组织架构走进了一个死胡同。

成也赛马,败也赛马?

人都是经验的奴隶,如果说 AI Labs 为中台乃是腾讯发展至今的惯性使然,显然这样的惯性并不止一种。其中比较典型的是腾讯长期坐镇南山巍然不动," 把半条命交给合作伙伴 " 的投资扩张逻辑,以及众所周知的内部赛马。

在 MaaS(model as a service)愈发为人所重视的当下,大模型如果可以被视作一个产品的话,极大可能是通往新世界的船票。因此在大模型赛道,腾讯想必不会将哥伦布的角色拱手让人,尤其是模型层,只是在应用层可能会依靠合作伙伴建立生态圈,远有微信上的丰富应用,近也有 QQ 上开始内测的 midjourney。

至于腾讯为何选择 QQ 生态而非微信生态,可想而知的原因可能是 QQ 用户群体相对年轻化,而且在 PC 端的产品呈现上显然是 QQ 更胜一筹。此外,这一选择也存在强烈的 " 试水 " 性质,毕竟 midjourney 本身还未曾以成熟的产品形式呈现,在 QQ 之前,仅以 API 形式接入了 discord。

更值得一提的是大模型赛道的赛马,曾经赛马跑出的神话实际上早已在算法时代为头条系的崛起而破灭,因为赛马机制本质上是建立在冗余前提下,通过资源优势以面找点,重复造轮子,有点类似于数学中的穷举法。之所以神话破灭,是在于赛马在保险的同时也让腾讯丧失了曾经的敏捷,最典型的便是短视频应用至今只跑出来了视频号这个全村的希望。

不过,大模型赛道的赛马说不定还真能行。

因为大模型训练非一夕之功,更不是某个强烈需求敏捷能力的垂类。重资产投入、试错成本高昂的预期以及应用层呈现的千奇百怪很大程度上弥平了赛马机制的缺陷,一方面是应用多样化避免了重复造轮子造成的资源浪费,另一方面是大模型特有的知识蒸馏让试错不再可怕,即使 OpenAI 珠玉在前,大家对国内的各家大模型仍抱有宽容的态度,无论是公众层面还是公司内部。

所幸新一轮的赛马或许不需要决出个胜负,更重要的是胜负之外的结果。腾讯也应该感谢 OpenAI 开启的新时代,一个不再追求短平快,连方向路径都已昭然若揭的时代,让缺乏敏捷、缺乏对核心抓手的嗅觉的腾讯重回棋盘之上,与竞对一起自天元落子。

只是大模型也并非万能,最起码,腾讯组织架构的顽疾以及整体战略上的模糊尚待调整。

如果希望 AI Labs 是腾讯这艘船的哥伦布,那么拆除组织架构内的部门墙以及重塑对创新的态度将是重中之重。例如光子星球自一位接近腾讯人士处了解到,AI Labs 曾出走多位顶尖人才,他们曾经在腾讯内部的创新成果也在出走后落地多个垂直领域,甚至其中不乏龙头的存在。

如果希望 AI Labs 这位哥伦布能真的发现新大陆,起码需要坚定地朝着正确方向前进。这一点恰是腾讯在开启赛马之路后丢失的能力,因为赛马的本质在于有力却不知何处使。现在的腾讯能否在赛马机制的路径依赖下突破以面找点,以各个 BG 在应用层积累的数据库为基础,在高效协同之下跑出一个大模型来,我们还在等待这份答卷。

只是留给腾讯的时间可能不多了,随着夏季到来,今年又恰是厄尔尼诺之年,用电问题将愈发严峻,届时大模型训练想必会受到不小的影响。

一步慢可能步步慢,赛马机制在短视频上的失败让曾经的 " 后发先至 " 从神话变成遮羞布,大模型将是腾讯能否正视自身问题,向世界证明自己仍具备打硬仗能力的最好机会。毕竟,就算是在腾讯如今最重视的市值管理上,大股东们还在减持套现。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App

标签:

最后一页
全球热门:内容正在升级改造,请稍后再试!

精彩推荐

资讯News

  • 聚焦Policy