终于,OpenAI开放ChatGPT API,成本直降90%,百万token才2美元
现在,第三方开发者可以通过 API 将对话模型 ChatGPT 和语音转文本模型 Whisper 集成到其应用程序和服务中。
自2022年11月推出以来,OpenAI 的 ChatGPT 一直备受瞩目。毫不夸张地说,自推出以来,与 ChatGPT 相关的话题已成为继 AlphaGo 之后,最引人注目的人工智能热点之一。仅两个月时间,月活跃用户便突破亿级,成为史上用户增长速度最快的消费级应用程序。
ChatGPT 的问世让人们觉得,AI 似乎终于能够与人类进行正常的交流。尽管偶尔出现错误,但在交流过程中,它至少没有显示出语言和逻辑上的障碍,能够“理解”用户表达的意思,并按照人类的思维模式和语言规范进行反馈。
与此同时,各大科技公司、高校乃至个人开发者也在加紧研发类似 ChatGPT 的技术,试图赶上这股潮流。
OpenAI 也在不断进行模型的升级。2023年3月1日,OpenAI 官方宣布,开发者现在可以通过 API 将 ChatGPT 和 Whisper 模型集成到其应用程序和产品中。
具体来看,OpenAI 当前允许第三方开发者通过 API 将 ChatGPT 集成到他们的应用程序和服务中,而这种集成方式的成本比使用其现有语言模型要低得多。此外,OpenAI 还推出了新的 Whisper API,这是一款由人工智能驱动的语音转文本模型,去年9月首次发布,通过 API 也可以轻松使用。这两项 API 的推出可谓是相当震撼。
OpenAI 表示,ChatGPT API 可以用于构建人工智能驱动的聊天界面,而这一技术已经在科技公司 Snap 的 My AI 中得到了应用。OpenAI 还提到,这次 ChatGPT API 集成的模型名为 gpt-3.5-turbo,是许多非聊天用例的最佳选择。值得一提的是,该模型可能与 Bing 使用的模型不同,OpenAI 声称,其速度、准确性和性能相比于 ChatGPT 和 GPT-3.5 都有显著提升。
OpenAI 官宣之后,便有人直呼被 ChatGPT 的表现震撼到。有人表示,自己正在寻找一个快速的方法来提取公司的 logo,便请 ChatGPT 帮忙构建工具。仅仅 15 分钟后,ChatGPT 就提供了一个解决方案,用户只需修改一行代码即可实现。
还有人利用该 API 在 Python 中构建命令行聊天机器人,ChatGPT 为其提供了 16 行的实现代码。
接下来,我们来细看 ChatGPT API 和 Whisper API 的具体内容。
#### ChatGPT API:使用成本骤降 90%
OpenAI 表示,gpt-3.5-turbo 模型与 ChatGPT 产品中使用的是同一款,其费用为每 1000 tokens 仅需 0.002 美元,相比于之前 GPT-3.5 的使用成本降低了 90%。gpt-3.5-turbo 是许多非聊天用例的最佳选择,测试者只需对 prompts 进行极少调整,就能将其从 text-davinci-003 迁移至 gpt-3.5-turbo。
传统上,GPT 模型使用非结构化文本表示为一系列 tokens,而 ChatGPT 模型则采用了带元数据的消息序列。在后台,输入仍以 tokens 的形式呈现给模型,所用的原始格式称为 Chat Markup Language(ChatML)。
OpenAI 创建了一个新的 API 端点以与 ChatGPT 模型交互。该新 API 同样可以通过 Python 绑定使用,代码示例如下:
“`python
import openai
completion = openai.ChatCompletion.create (
model=”gpt-3.5-turbo”,
messages=[{“role”: “user”, “content”: “Tell the world about the ChatGPT API in the style of a pirate.”}]
)
print(completion)
“`
#### ChatGPT 更新计划
OpenAI 持续改进 ChatGPT 模型,并希望将这些增强的功能开放给开发者。因此,使用 gpt-3.5-turbo 模型的开发者将始终获得 OpenAI 推荐的稳定模型,同时依然能够灵活选择特定的模型版本。例如,OpenAI 今天发布了 gpt-3.5-turbo-0301,该版本将至少在6月1日之前得到支持,而4月将发布 gpt-3.5-turbo 的稳定更新版本。
#### Whisper API:语音转录文本更轻松
作为 OpenAI 于2022年9月开源的语音到文本模型,Whisper 在开发者社区中获得了良好的口碑,但实施过程较为复杂。
如今,OpenAI 通过开放 API 提供 large-v2 模型,支持按需访问,同时价格也很合理(0.006 美元/分钟)。与其他同类服务相比,OpenAI 优化的服务堆栈确保了更快的输出速度。
具体而言,Whisper API 可以通过 transcriptions(源语言转录)或 translations(翻译为英语)端点使用,支持 m4a、mp3、mp4、mpeg、mpga、wav、webm 等多种格式的输入。
Whisper API 也可以通过 Python 绑定使用,相关代码示例如下:
“`python
import openai
file = open(“/path/to/file/openai.mp3”, “rb”)
transcription = openai.Audio.transcribe(“whisper-1”, file)
print(transcription)
“`
总的来看,ChatGPT 和 Whisper 的开放 API 使得第三方能够开始构建以这两个模型为基础的下一代应用程序,以便让更多人从中受益。
### 见解
OpenAI 推出的 ChatGPT 和 Whisper API,标志着人工智能技术与开发工具之间的进一步融合。通过降低使用成本并提升技术可用性,这些 API 将助力开发者在更多应用场景中实现 AI 功能。这不仅能极大提升用户体验,同时也推动了产业数字化转型的进程。随着更多人能够接触和使用这些强大的工具,未来的创新和应用将会更加丰富多彩。