OpenAI提前发布性价比最高的GPT-4o Mini，背刺下周将发布的 LLama3

管理员 9 月 12, 2024 313 0

人工智能领域的竞争再次升温。两个月前，OpenAI 推出了其最新力作 GPT-4o，这款 AI 模型首次实现了对文本、图像和音频等多模态数据的处理，并计划未来扩展至视频。发布之初，GPT-4o 在第三方基准测试中被评为全球最强大的公开 AI 模型，但不久后便被对手 Anthropic 的 Claude 3.5 Sonnet 超越，从此双方展开了激烈的竞争。

然而，OpenAI 并未止步于此。今天，公司宣布推出 GPT-4o 的精简版——GPT-4o mini，并称其为“市场上最具成本效益的小型模型”。使用该模型时，开发者每输入 100 万个 token 仅需支付 0.15 美元，而每从模型接收 100 万个 token 则需支付 0.60 美元。对于依赖 OpenAI API 构建的第三方应用和服务来说，这无疑是个重大利好。

相比之下，GPT-4o mini 的费用远低于 GPT-4o，后者每输入 100 万个 token 需要 5 美元，每输出 100 万个 token 则需支付 15 美元。Token 通常指在大型或小型语言模型中代表语义单元、单词、数字等信息的数字代码。尽管 OpenAI 未透露 GPT-4o mini 的参数数量，但从其“mini”的名称可见其规模明显较小。

OpenAI 的产品和 API 负责人 Olivier Godement 认为，GPT-4o mini 对企业、初创公司和开发者尤其重要，他们可以利用该模型构建客户支持、金融服务等各种应用。这些应用往往需要频繁调用 API，从而产生大量的输入和输出 token，进而增加成本。

Godement 表示：“智能的成本效益如此显著，我相信它将在客户支持、软件工程、创意写作等多个领域得到广泛应用。每当我们引入新模型，总会激发新的应用场景，我认为 GPT-4o mini 更是如此。”

推出 GPT-4o mini 的时机恰到好处，正值 Meta 即将发布其拥有 4000 亿参数的 Llama 3 模型，表明 OpenAI 旨在抢占先机，巩固其在企业级 AI 领域的领导地位。

与 GPT-3.5 Turbo 相比，GPT-4o mini 的成本降低了 60%，因为后者自 GPT-4o 发布以来一直是 OpenAI 的最经济模型。同时，GPT-4o mini 的处理速度与 GPT-3.5 Turbo 相当，每秒可传输约 67 个 token。

OpenAI 将 GPT-4o mini 定位为 GPT-3.5 Turbo 的直接升级版，不仅成本更低，还能够处理文本和视觉输入，而 GPT-3.5 Turbo 仅支持文本。未来，GPT-4o mini 还将支持生成图像、音频和视频等多模态输出，并能够将其作为输入，但目前仅支持文本和静态图像/文档输入。

根据一系列第三方基准测试，GPT-4o mini 的表现优于 GPT-3.5 Turbo，甚至在某些任务上超过了 Google 的 Gemini 1.5 Flash 和 Anthropic 的 Claude 3 Haiku，以及 GPT-4 本身。例如，在 Massive Multitask Language Understanding (MMLU) 基准测试中，GPT-4o mini 的得分为 82.0%，而 Gemini Flash 为 77.9%，Claude Haiku 为 73.8%。

此外，Godement 透露，GPT-4o mini 将于今年秋季通过 Apple Intelligence 服务在苹果的移动设备和 Mac 桌面计算机上推出，正值苹果即将发布的 iOS 18 软件同步。不过，该模型仍将在 OpenAI 的云服务器上运行，而非直接在设备上，这可能会削弱小型模型本地推理的优势。

尽管如此，Godement 指出，即使通过 OpenAI 的云服务器连接，GPT-4o mini 的速度依然优于其他模型。他还提到，许多与 OpenAI 合作的第三方开发者目前不太愿意在本地运行这些模型，因为这需要更复杂的设置和更强大的计算硬件。

然而，GPT-4o mini 的推出为开发者提供了在本地更经济、高效地运行模型的可能性。Godement 表示，未来可能会提供这样的解决方案。

从今天晚些时候开始，GPT-4o mini 将取代 GPT-3.5 Turbo，成为 ChatGPT 付费订阅用户（包括 Plus 和 Teams 计划）的选项之一，并将在未来一周内支持 ChatGPT Enterprise。用户可以在网页和 Mac 桌面应用的左上角下拉菜单中选择该模型。

尽管 ChatGPT 用户在选择 GPT-4o mini 时不会享受到订阅费用的减免，但他们将自动获得比 GPT-3.5 Turbo 更加更新、更快、更强大的模型，这无疑是一个额外的好处。

OpenAI 目前没有计划淘汰或逐步停止对 GPT-3.5 Turbo 的 API 支持，因为公司不想强迫开发者升级或破坏基于旧模型构建的应用程序。相反，公司相信开发者会自然而迅速地转向使用新模型，因为在成本、智能和其他能力方面，它们有显著提升。

据 Godement 称，一些开发者已经在 alpha 测试 GPT-4o mini，包括企业费用管理和账户软件初创公司 Ramp，以及云电子邮件 AI 初创公司 Superhuman，他们都报告了良好的结果。特别是 Ramp 在收据数据提取测试中取得了令人瞩目的成绩。

尽管如此，仍会有开发者选择使用更昂贵的 GPT-4o 完整模型。OpenAI 认为，对于计算密集型、复杂且要求高的应用，GPT-4o 仍然是最佳选择。Godement 举例说：“如果我正在开发医疗应用，需要总结并为患者提供诊断建议，我会选择最智能的模型。同样，如果你开发的是一个处理复杂代码库的软件工程助手，GPT-4o 会提供更好的结果。如果智能是产品的关键，我建议你继续使用 GPT-4o，以获得最佳效果。”

OpenAI提前发布性价比最高的GPT-4o Mini，背刺下周将发布的 LLama3

标签

近期文章

友情链接

归档

分类

热门标签

标签

相关推荐

近期文章

友情链接

归档

分类

热门标签