OpenAI提前发布性价比最高的GPT-4o Mini,背刺下周将发布的 LLama3

 

人工智能领域的竞争再次升温。两个月前,OpenAI 推出了其最新力作 GPT-4o,这款 AI 模型首次实现了对文本、图像和音频等多模态数据的处理,并计划未来扩展至视频。发布之初,GPT-4o 在第三方基准测试中被评为全球最强大的公开 AI 模型,但不久后便被对手 Anthropic 的 Claude 3.5 Sonnet 超越,从此双方展开了激烈的竞争。

然而,OpenAI 并未止步于此。今天,公司宣布推出 GPT-4o 的精简版——GPT-4o mini,并称其为“市场上最具成本效益的小型模型”。使用该模型时,开发者每输入 100 万个 token 仅需支付 0.15 美元,而每从模型接收 100 万个 token 则需支付 0.60 美元。对于依赖 OpenAI API 构建的第三方应用和服务来说,这无疑是个重大利好。

相比之下,GPT-4o mini 的费用远低于 GPT-4o,后者每输入 100 万个 token 需要 5 美元,每输出 100 万个 token 则需支付 15 美元。Token 通常指在大型或小型语言模型中代表语义单元、单词、数字等信息的数字代码。尽管 OpenAI 未透露 GPT-4o mini 的参数数量,但从其“mini”的名称可见其规模明显较小。

OpenAI 的产品和 API 负责人 Olivier Godement 认为,GPT-4o mini 对企业、初创公司和开发者尤其重要,他们可以利用该模型构建客户支持、金融服务等各种应用。这些应用往往需要频繁调用 API,从而产生大量的输入和输出 token,进而增加成本。

Godement 表示:“智能的成本效益如此显著,我相信它将在客户支持、软件工程、创意写作等多个领域得到广泛应用。每当我们引入新模型,总会激发新的应用场景,我认为 GPT-4o mini 更是如此。”

推出 GPT-4o mini 的时机恰到好处,正值 Meta 即将发布其拥有 4000 亿参数的 Llama 3 模型,表明 OpenAI 旨在抢占先机,巩固其在企业级 AI 领域的领导地位。

与 GPT-3.5 Turbo 相比,GPT-4o mini 的成本降低了 60%,因为后者自 GPT-4o 发布以来一直是 OpenAI 的最经济模型。同时,GPT-4o mini 的处理速度与 GPT-3.5 Turbo 相当,每秒可传输约 67 个 token。

OpenAI 将 GPT-4o mini 定位为 GPT-3.5 Turbo 的直接升级版,不仅成本更低,还能够处理文本和视觉输入,而 GPT-3.5 Turbo 仅支持文本。未来,GPT-4o mini 还将支持生成图像、音频和视频等多模态输出,并能够将其作为输入,但目前仅支持文本和静态图像/文档输入。

根据一系列第三方基准测试,GPT-4o mini 的表现优于 GPT-3.5 Turbo,甚至在某些任务上超过了 Google 的 Gemini 1.5 Flash 和 Anthropic 的 Claude 3 Haiku,以及 GPT-4 本身。例如,在 Massive Multitask Language Understanding (MMLU) 基准测试中,GPT-4o mini 的得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。

此外,Godement 透露,GPT-4o mini 将于今年秋季通过 Apple Intelligence 服务在苹果的移动设备和 Mac 桌面计算机上推出,正值苹果即将发布的 iOS 18 软件同步。不过,该模型仍将在 OpenAI 的云服务器上运行,而非直接在设备上,这可能会削弱小型模型本地推理的优势。

尽管如此,Godement 指出,即使通过 OpenAI 的云服务器连接,GPT-4o mini 的速度依然优于其他模型。他还提到,许多与 OpenAI 合作的第三方开发者目前不太愿意在本地运行这些模型,因为这需要更复杂的设置和更强大的计算硬件。

然而,GPT-4o mini 的推出为开发者提供了在本地更经济、高效地运行模型的可能性。Godement 表示,未来可能会提供这样的解决方案。

从今天晚些时候开始,GPT-4o mini 将取代 GPT-3.5 Turbo,成为 ChatGPT 付费订阅用户(包括 Plus 和 Teams 计划)的选项之一,并将在未来一周内支持 ChatGPT Enterprise。用户可以在网页和 Mac 桌面应用的左上角下拉菜单中选择该模型。

尽管 ChatGPT 用户在选择 GPT-4o mini 时不会享受到订阅费用的减免,但他们将自动获得比 GPT-3.5 Turbo 更加更新、更快、更强大的模型,这无疑是一个额外的好处。

OpenAI 目前没有计划淘汰或逐步停止对 GPT-3.5 Turbo 的 API 支持,因为公司不想强迫开发者升级或破坏基于旧模型构建的应用程序。相反,公司相信开发者会自然而迅速地转向使用新模型,因为在成本、智能和其他能力方面,它们有显著提升。

据 Godement 称,一些开发者已经在 alpha 测试 GPT-4o mini,包括企业费用管理和账户软件初创公司 Ramp,以及云电子邮件 AI 初创公司 Superhuman,他们都报告了良好的结果。特别是 Ramp 在收据数据提取测试中取得了令人瞩目的成绩。

尽管如此,仍会有开发者选择使用更昂贵的 GPT-4o 完整模型。OpenAI 认为,对于计算密集型、复杂且要求高的应用,GPT-4o 仍然是最佳选择。Godement 举例说:“如果我正在开发医疗应用,需要总结并为患者提供诊断建议,我会选择最智能的模型。同样,如果你开发的是一个处理复杂代码库的软件工程助手,GPT-4o 会提供更好的结果。如果智能是产品的关键,我建议你继续使用 GPT-4o,以获得最佳效果。”

标签



热门标签