OpenAI 的未来展望:Strawberry、Orion 和 GPT 下一代计划

Foresight · 09-04 19:15

数据

AI

OpenAI

OpenAI 即将发布两款革命性模型 Strawberry 和 Orion,旨在推进 AI 能力,特别是在推理、解决问题和语言处理方面,朝着人工通用智能(AGI)更进一步。


撰文:Jose Antonio Lanz

编译:Koala,火星财经


OpenAI 即将发布两款可能重新定义机器学习领域的革命性模型,代号分别为 Strawberry 和 Orion。这些项目的目标是将 AI 的能力推向新的高度,特别是在推理、解决问题和语言处理方面,朝着人工通用智能(AGI)更进一步。


Strawberry(之前被称为 Q* 或 Q-Star)似乎不仅仅是一个聊天机器人;它的重点是展示 AI 推理能力的显著飞跃。知情人士向路透社和 The Information 等媒体透露,该项目在解决复杂数学问题和增强逻辑分析方面表现出色。


另一方面,Orion 被定位为 OpenAI 的下一代旗舰语言模型,可能是 GPT-4 的继任者。它旨在在语言理解和生成方面超越其前身,并具备处理多模态输入(包括文本、图像和视频)的能力。


这两个项目引起了美国国家安全官员的关注,突显了它们可能具有的战略重要性。在 OpenAI 尽管收入增长显著的情况下,仍在继续筹集资金,这可能与开发和训练这些先进模型所需的高昂成本有关。


Strawberry 与推理能力


尽管网上不断有关于「Strawberry 项目」的猜测,OpenAI 并未正式发布任何相关信息。然而,据称泄露的信息表明,Strawberry 在复杂推理方面表现出色。


据称,与传统模型提供快速响应不同,Strawberry 采用了研究人员称为「系统 2 思维」的方法,能够花时间仔细推理并解决问题,而不仅仅是通过预测更长的词语序列来完成响应。据路透社报道,该模型在 MATH 基准测试中取得了 90% 以上的成绩,表现令人印象深刻。


另一个预计由 Strawberry 带来的关键创新是其生成高质量合成训练数据的能力。这一功能解决了 AI 开发中的一个重要挑战:缺乏多样且高质量的训练数据。如果这一点属实,Strawberry 不仅能提升自身能力,还为更先进的模型如 Orion 铺平了道路。


考虑到 OpenAI 已经获取的大量数据,以及用户日益重视隐私而不愿向 AI 提供数据的趋势,这一功能可能在未来 AI 模型的质量中发挥重要作用,就像如今一些用户利用 Stable Diffusion 生成的图像训练自己的定制模型一样。


然而,Strawberry 的这种深思熟虑的处理方式可能在实时应用中面临挑战。据报道,OpenAI 的研究人员正在研究如何「蒸馏」Strawberry 的能力,基本上是降低其质量,以便用户能够在低计算成本下进行大量推理。


即便如此,将 Strawberry 的技术整合到面向消费者的产品(如 ChatGPT)中,可能会显著提升 OpenAI 训练新模型的方式。然而,更有可能的是,OpenAI 将利用 Strawberry 作为训练新模型的基础,而不是直接向消费者广泛提供。


Project Orion 或 GPT 下一代


Project Orion 作为 OpenAI 对 GPT-4 的雄心勃勃的继任者,旨在设定语言 AI 的新标准。根据 OpenAI 日本公司 CEO 永崎忠雄的最新演讲,项目可能被命名为 GPT 下一代(GPT Next)。利用来自 Project Strawberry 的先进技术,Orion 设计不仅在自然语言处理方面表现卓越,还扩展到多模态能力。


OpenAI 声称,下一代 AI 模型的进步将不会是渐进的。


根据 IT Media 的报道,OpenAI 日本公司 CEO 永崎忠雄在 2024 年日本 KDDI 峰会上表示:「即将推出的 AI 模型可能被称为『GPT Next』,其发展速度将是前几代模型的近 100 倍。与传统软件不同,AI 技术呈指数级增长。因此,我们希望尽快支持一个将 AI 全面整合的世界的诞生。」


将 Strawberry 生成的数据用于训练 Orion 对 OpenAI 来说是一项技术优势。然而,这种技术需要谨慎使用。研究人员已经证明,当模型在过多的合成数据上进行训练时,其性能会开始下降。因此,找到一个合适的平衡点,使 Strawberry 可以增强 Orion 的能力而不影响其准确性,对于 OpenAI 保持竞争力至关重要。


Orion 的原生多模态功能也将是一个显著的进步。据《The Information》报道,该模型正在开发中,旨在无缝整合文本、图像,甚至视频输入和输出,为 ChatGPT 用户带来全新的可能性,并使公司与谷歌的 Gemini 直接竞争。后者可以处理长达 2 小时的视频输入。


这是用户在使用 ChatGPT 或 OpenAI 的 API Playground 时将与之交互的模型。


Orion 的开发与 OpenAI 的整体战略相一致,旨在保持其在日益拥挤的 AI 领域中的竞争优势。随着开源模型(如 Meta 的 LLaMA-3.1)和先进模型(如 Claude 或 Gemini)的快速进展,Orion 基本上是 OpenAI 保持领先地位的举措。

免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表Bi123的观点或立场

相关推荐

上一篇:「防狙击」Meme 开盘就失灵,想挑战 Pump.fun 的 SICK 看上去不太行?

下一篇:数据研究:2016 年后 BTC 减半效应已式微

扫码下载APP添加官方微信
行情机会交流