解密百度「文心一言」:首个中国 ChatGPT 的幕后故事

Foresight · 2023-02-15 13:43

Facebook

Sam Altman

OpenAI

AI 巨潮,中国互联网「二次洗牌」。


撰文:懂财帝

来源:懂财帝


图片作者:文心一格


八年前,硅谷罗斯伍德桑德希尔酒店,30 岁的初创孵化器公司负责人、斯坦福大学计算机科学专业肄业生山姆·阿尔特曼(Sam Altman)与 26 岁的麻省理工学院肄业学生布洛克曼一脸青涩,他们与马斯克等一众大佬谈论着,当时的 AI 霸主谷歌刚刚收购了神经网络初创公司 DeepMind。他们商讨,要成立一家实验室(后来的 OpenAI)与其对抗,避免谷歌一家独大。

 

但他们很快发现,训练庞大的神经网络成本高昂,计算成本高达数千万美元。阿尔特曼一方面坚守技术至上理想,另一方面踏上了漫长的融资之旅,他多次飞往西雅图找微软 CEO 纳德拉。直到 2019 年 7 月,OpenAI 获得 10 亿美元。

 

而早在 10 年前,百度 CEO 李彦宏就看到了流量的天花板,同时他也窥到新世界的裂缝——AI。

 

2013 年,百度设立深度学习研究院,连投十年,超过 1000 亿元。2018 年,百度将深度学习平台「飞桨」升级为操作系统,并不计成本投入人力财力。

 

飞桨十年铸剑,厚积薄发,已成为国内第一操作平台。飞桨也是开源的,往下孕育了 67 万个 AI 模型,向上承接了 500 多万开发者,服务 20 万企事业单位。

 

2022 年 11 月 30 日,OpenAI 联合创始人兼 CEO 阿尔特曼宣布,旗下 ChatGPT 正式发布。该产品一面世,就引爆全球。

 

在 ChatGPT 身上,人们看到了解放生产力的曙光,疯狂追捧。工程师用它来检查程序代码漏洞,美食博主要求它编写健康食谱,编剧借助它来撰写电视剧剧本,医学专家向它提出医学难题……

 

短短 5 天,ChatGPT 注册用户就突破 100 万。仅两个月,月活用户超过 1 亿,成为史上增长最快的消费者应用。

 

比尔·盖茨惊叹,它(ChatGPT)让我们窥见了未来。

 

十年积淀,中国的科技公司在生成式 AI 领域也即将结出硕果。

 

今年三月,中国首个 ChatGPT——文心一言(英文名 ERNIE Bot)亮相,背后的支持系统正是百度飞桨操作系统。

 

低调的李彦宏筹谋十年,如今回到「主场」AI 互联网,他极度兴奋,为自己定下了 OKR——「引领搜索体验的代际变革」。

 

中国互联网战火重燃,百度强势归来,意欲把移动互联网时代失去的,无论是流量,还是估值,从对手手中都夺回来。


1. 全球 AI「拐点」

 

短短三十年,人类创造出的三个超级工具,孕育出了三场大革命。


三十年前,互联网技术大规模应用,彻底打破了地理限制。数十亿人第一次被聚合在简陋的线上聊天框,「空间革命」由此爆发。


微软亦由此崛起。彼时,它凭借 Windows 操作系统一跃成为 PC 时代的霸主,市值不断刷新纪录,傲视群雄。


十六年前,乔布斯发布第一台 iPhone 手机,开启了线上化、移动化的互联网新时代。


人们不再痴迷 PC 终端,而是随时随地,每时每刻盯着智能手机屏幕。睡眠外的几乎所有时间,都被智能手机所占据。


「时间革命」的浪潮也更加汹涌。美国的苹果、Facebook、谷歌,中国的阿里、腾讯、字节跳动实现群像崛起,市值数千乃至数万亿美元,而微软却逐渐沉沦、迷失。


现如今,ChatGPT 爆红。与此前在算法推荐、人脸识别、智能辅助驾驶等领域应用的决策式 AI 相比,它有了质的飞跃。ChatGPT 可以通过多轮深度对话,为用户提供更加精准的答案和策略,甚至还能生成原创内容、修改程序。


它同时也打开了通往 AI 互联网时代的大门,将会激起「思维革命」。


但革命方式并不是取代人类,而是成为全球 80 亿人的辅助「智脑」,重塑他们的思考方式,进而大幅度提升和创造生产力。


前世界首富,曾经浪潮最大获利者,比尔·盖茨意味深长地提示:ChatGPT 出现的重大历史意义,不亚于 PC 和互联网诞生。


这无疑是一场创世纪的科技「聚变」,投资者和蛰伏了数年的科技公司都沸腾了起来。2023 开年至今,美股市场上的 C3.ai、 BigBear.ai 和 SoundHound 等 AI 公司的市值已经翻倍。


曾在移动互联网时代「掉队」的微软更是视 ChatGPT 为「复仇之矛」,纳德拉再次押注 OpenAI,总额高达 100 亿美元。


大洋彼岸,国内互联网公司不会错过任何一个产业风口,从 BATJ 等巨头到小冰、元语智能等初创企业,所有沾边 AI 的玩家都已下场。


有的某局一隅。京东推出的 ChatJD,就将应用于零售、金融领域,网易有道称,将在教育和学习等场景推出 AIGC 服务。


有的志在全域,百度希望在 AI 互联网时代重铸荣光,正是其中的代表。


去年 9 月,李彦宏振臂高呼,「AI 技术在技术层面和商业应用层面都有方向性改变」。也就是从那时起,百度开始调兵遣将,「重仓」类 ChatGPT 产品文心一言。


截至目前,文心一言正在做上线前的最后冲刺。预计 3 月完成内测后,将面向公众开放。


百度称,文心一言将会更了解中文语义,并将率先嵌入百度搜索服务中,普通用户届时注册账号即可享受到惊艳的 AI 体验。


百度是中国人工智能加速崛起的缩影。中国 AI 发展成效显著,人工智能创新水平已经进入世界第一梯队,与美国的差距正进一步缩小。


全球 AI 产业也正呈现出中美两国引领、主要国家激烈竞争的总体格局。大国竞速之间,百度已跻身全球 AI 四强,是中国人工智能市场长期增长的强劲选手。


2. 万丈高楼的地基

 

参数量 1750 亿,预训练数据量 45TB,一次性的训练费用 8.4 亿美元,这是 OpenAI 培育 ChatGPT 的成本。


它也规定了入局的门槛,后来者必须同时拥有坚实的 AI 底座(算力、数据和算法模型)和充裕的资金。仅有单种 AI 能力,不可能做出 ChatGPT 一样的产品。


对于中小 AI 公司来说,这无异于天方夜谭。有从业者在接受财新网采访时表示,部分长期亏损的 AI 公司如果要追逐风口做类 ChatGPT 技术,可行性很低。


但对于中国 AI 龙头百度而言,集齐上述生产要素轻而易举。


过去十余年,李彦宏始终保持对 AI 技术的狂热,百度一直延续压强式、马拉松式的研发投入,累计超过 1000 亿元,是全球创新投入最多的互联网公司之一。


十年磨一剑,百度「涅槃」,已经成为国内唯一一家拥有全栈自研 AI 技术的公司,包括芯片层、框架层、模型层和应用层。


尤其在模型层,AI 业内的共识是大参数的大语言模型功能更为齐全,能够给出更准确结果,是弱人工智能向通用智能跨越的技术基础。


百度在这一领域,积淀极为深厚。早在 2019 年,百度开发的知识增强语义理解模型 ERNIE 就登顶了全球权威数据集 GLUE 榜单,并刷新榜单历史。


现在,该模型已更新迭代至文心 ERNIE 3.0,参数规模高达 2600 亿,几乎比谷歌 LaMDA(1350 万)高了一倍,也高于 ChatGPT(1750 万),是全球最大的中文单体模型。


与此同时,文心 ERNIE 3.0 还支持生成式 AI,具备强大的跨模态、跨语言的深度语义理解与生成能力。


技术之外,是成本门槛。据 Semianalysis 估算,ChatGPT 一次性训练用就达 8.4 亿美元,生成一条信息的成本在 1.3 美分左右,是目前传统搜索引擎的 3 到 4 倍。


OpenAI 就因为钱不够烧,而差点倒闭。


但百度依旧押注 ChatGPT,这要归功于稳固的基础业务和健康的现金流。


2022Q3 财报数据显示,报告期内,百度实现营收 325.4 亿元,保持稳健增长态势。其中,核心收入为 252 亿元,同比增长 2%。


截至三季度末,百度账上的现金及现金等价物 551.64 亿元,现金流充裕。


但百度并不能松一口气。ChatGPT 目前仍未找到明确的盈利商业模式,其成本依然高企。此外,在落地场景方面,ChatGPT 能否适应中国各行各业的碎片化转型需求,尚有待验证。


李彦宏也坦言,「ChatGPT 是 AI 技术发展到一定地步后产生的新机会。但怎么把这么酷的技术,变成人人都需要的好产品,这一步其实才是最难的,最伟大的,也是最能产生影响力的。」


百度和文心一言才刚刚出发,未来还有很长的路要走。


3. 中国互联网「二次洗牌」

 

很少有中国互联网大公司的「掌舵者」会制定个人 OKR,李彦宏是一个例外。


2 月 8 日,他罕见地向媒体披露了个人一季度 OKR——「引领搜索体验的代际变革」。


无独有偶,随后,一份百度内部讲话流出。在其中,李彦宏再次强调,「技术已经到了临界点,类似 ChatGPT 这样的技术如何运用在搜索场景上,未来一年,在这方面我们非常有机会」。


李彦宏的信心和决心,源于 ChatGPT 对传统搜索引擎的颠覆式创新。


它将搜索引擎带入到「精准推送」时代,用户通过自然语言交互的方式即可轻松获得内容或链接,且结果较为精准。这将降低用户浏览广告的频次。


另外,与 ChatGPT 同源的 AIGC 技术还将颠覆现有内容生产模式,它仅用「十分之一成本」,就能以百倍千倍的速度生成 AI 原创内容。


谷歌拉响「红色警报」更是验证了李彦宏的判断。据报道,拉里·佩奇和谢尔盖·布林,两位隐退的创始人已紧急「出山」,寻找对策,升级代码。


百度计划先将文心一言接入到百度搜索中,为用户提供包括多答案回复、智能生成等服务。


事实上,搜索引擎只是生成式 AI 应用场景的一隅。在办公、云计算、智能驾驶等场景,ChatGPT 同样有丰富的想象力。


微软就正在整合 OpenAI 的相关技术以改进 Office、Teams 等应用,以及结合微软云 Azure 来打造 AI 基础设施。


这与百度的布局不谋而合。去年底,百度同样提出了「AI 大底座」的概念。


近期,据透露,百度还将把类 ChatGPT 技术和自动驾驶,生态公司如小度、爱奇艺等深度融合。这极为重要,生成式 AI 技术的最大价值就是与产业相结合,而百度正好拥有庞大的搜索、自动驾驶、视频等生态,它们是 ChatGPT 落地的最佳场景。


此外,百度会把类 ChatGPT 技术作为平台对外开放,供第三方开发应用。截至目前,每日经济新闻、澎湃新闻等多家媒体已宣布接入文心一言。


百度已构筑先发优势,未来还将会基于文心一言,继续向外辐射,构建更加多元的人工智能生态体系。


一旦做成,百度或将同时拥有生成式 AI 技术优势和搜索引擎优势,或将成为中国的「OpenAI+Google」,成为 AI 技术落地的标杆。


资本市场已经提前嗅到百度的增长潜能,截至 2 月 13 日,百度美股股价年内已上涨 28.4%


券商机构亦看好中国「核心资产」百度。


摩根士丹利认为,百度推出中国 ChatGPT 将展示公司的人工智能研发能力。同时,这又与公司的云业务战略方针步伐相同,可达到云业务中长期增长,并领跑行业。


美国投行麦格理将百度 2023 年、2024 年的经调整每股盈利预测分别上调了 13%、4%,并预计 2023 年经调整经营利润率将提高 2.4 个百分点至 18.3%。


而这只是业绩上的显性收益。


AI 技术已开启第四次工业革命的大门,生成式 AI 或将成为与蒸汽机、电力、信息技术一样重要的基础设施。


它也将成为重估科技公司投资价值的核心逻辑。过去一段时间,微软依靠投资 OpenAI,市值已成功从 1 万亿美元上升至 2 万亿美元,而谷歌则因为生成式 AI 产品 Bard 出现瑕疵,市值持续下挫,已从 2 万亿跌落至 1 万亿美元。


一个向上,一个向下,AI 互联网时代的发展轨迹或许已经明晰。


AI 时代的大幕正徐徐拉开,中国科技公司市值排名,可能要剧烈变动了。

免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表Bi123的观点或立场

扫码下载APP添加官方微信
行情机会交流