「草莓」即将上线,OpenAI新旗舰大模型曝光,代号「猎户座」

本月初,OpenAI的创始人兼CEO山姆·奥特曼在X平台上突然发布了一张引发强烈好奇心的照片。

这张照片中有四个红草莓,其中一个还是青色的未成熟草莓,奥特曼在回应网友时暗示,这或许是在预告下一代AI大模型GPT-5的到来,惊喜似乎即将揭晓。

根据科技媒体《The Information》的报道,传说中的「草莓」真的要来了!

两位参与该项目的人士透露,OpenAI计划最早在今年秋季推出代号为「草莓」(之前称为Q*,发音为Q Star)的新人工智能,可能将其作为聊天机器人的一部分(并集成在ChatGPT内)。「草莓」将能够解决从未见过的数学问题,这是当今聊天机器人无法准确完成的任务。同时,经过训练后,它还可以处理编程相关的问题,但并不局限于技术领域的回答。

《The Information》称,OpenAI正在开发新旗舰大型语言模型(LLM),代号为「Orion」。该模型旨在改进去年推出的现有旗舰LLM——GPT-4。

「草莓」的推出旨在增强即将发布的「Orion(猎户座)」,OpenAI已向安全监管人员展示了该模型。较小版本的「草莓」预计将以聊天机器人的形式发布。

知情人士表示,OpenAI正利用较大版本的「草莓」生成用于训练「Orion」的数据。这种AI生成的数据被称为「合成数据」,这意味着「草莓」可以帮助OpenAI突破获取足够高质量训练数据的障碍,以利用现实世界的数据(如从互联网上提取的文本和图像)来训练新模型。

在给予额外的「思考」时间时,「草莓」能够回答用户更主观的问题,例如制定产品营销策略。

OpenAI推出「草莓」是为了解决对话式人工智能或大型语言模型领域的竞争,同时对未来能够完成多步骤任务的智能体产品也将产生影响。OpenAI希望在智能体领域开辟更多的收入机会。

### 为什么「草莓」对「Orion」如此重要

「草莓」的其中一个关键应用是为下一代旗舰大语言模型「Orion」生成高质量训练数据。这个代号此前并没有被报道。

简单来说,「草莓」可以生成更高质量的训练数据。智能体初创公司Minion AI的首席执行官、GitHub Copilot的前首席架构师Alex Graveley表示,通过「草莓」生成高质量训练数据可以帮助OpenAI减少模型生成错误(也称为幻觉)的数量,并指出这归功于训练数据中较少的歧义性。

需要提及的是,OpenAI的CEO山姆·奥特曼在今年五月的一次活动中曾提到:「我们认为已经为下一个模型提供了足够的数据,并进行了各种实验,包括生成合成数据。」这个下一个模型很可能就是「Orion」。

目前,OpenAI内部正在推动一种称为蒸馏(distillation)的过程,以简化和缩小「草莓」。

虽然尚不确定基于「草莓」的最终产品形态,但一个显而易见的构想是将「草莓」的推理能力融入到ChatGPT中。这意味着答案的准确性可能会更高,但反应时间也可能更慢。

这表明,「草莓」可能不太适合那些急需立即响应的用户需求,但对一些对时间不那么敏感的用例则非常适用。

或许在不久的将来,用户将能够根据对时间的敏感程度选择是否启用「草莓」功能。

今年夏天,OpenAI已经向安全监管人员展示了「草莓」模型。这次演示可能是OpenAI努力提高透明度的一部分,特别是在今年早些时候,几位安全负责人如Ilya Sutskever离职后,技术透明对OpenAI显得尤为重要。

参考链接:
[The Information – OpenAI Races to Launch Strawberry Reasoning AI to Boost Chatbot Business](https://www.theinformation.com/articles/openai-races-to-launch-strawberry-reasoning-ai-to-boost-chatbot-business?rc=ks2jbm)
[The Information – OpenAI Shows Strawberry AI to the Feds and Uses It to Develop Orion](https://www.theinformation.com/articles/openai-shows-strawberry-ai-to-the-feds-and-uses-it-to-develop-orion?rc=ks2jbm)

标签



热门标签