OpenAI最近的新闻不少

推荐使用GPT,国内可直接访问:https://www.chatgp4.com/

模型交互的高级语音技术在软基础设施领域逐渐从 TTFT 的关注点转向 TTFA(time-to-first-audio)。除了将语音延迟降低到人类自然交流所能接受的范围之外,提供卓越的交互体验同样至关重要。在 9 月 3 日公开的与 OpenAI 受让的专利 US12079587 中,展示了多任务变换器模型如何通过输入音频片段生成相应的文本转录。该专利的提交日期为2023年4月18日,彼时 Ilya 仍在职,这是与 Whisper 相关的工作,也是高级语音技术的基础,其技术开发与公开之间相隔一年多。

语音竞争的形势也日益激烈。Claude 目前并无语音功能,而 Alexa 计划让 Claude 进行推理,这使得其与 Google 的 Gemma Live 和 OpenAI 竞争。与此同时,模型的订阅价格也在上调,聚焦于推理的 Strawberry 模型与旗舰模型 Orion(并不包含 GPT Next)。ChatGPT 的企业订阅量已经超过 100 万,这使得其有底气推出 2000 美元的订阅计划,之前 a16z 获得的快速融资显示了一个巨大的市场潜力,前天 Claude for Enterprise 的推出进一步证明了这一点。

之前提到的猜测——UCL 的 Eric Fraga 和 Abdellah Salhi 提出的基于草莓繁殖的进化搜索算法,可能是 OpenAI 命名 Strawberry 的灵感来源。如今,OpenAI 逐渐放出了匿名模型,结合三星高管泄露的高达 5TB 的信息(另外,TSMC 与三星共同开发的 HBM4 无缓冲技术),加上自我对弈(Self-Play),可以推测合成数据与 Debate 对齐的 RLAIF+RLHF,这种进化与草莓繁殖十分相似。

OpenAI 需要专用芯片来处理 Sora 的训练,以构建世界模型,这也是对齐后期系统奖励函数的基础。因此,OpenAI 的全球基础设施和 Sora 芯片的投资,都是为了实现总体拥有成本(TCO)和运营成本(OPEX),需要持续注入资金以保持领先地位。在训练强大模型的初期,需要大量资金,而在后期推广人工智能时,则需要高能效(PUE)成本的训练加速器和系统,以覆盖大规模语言模型(PLM)的生命周期。

经历不久,Musk 的 Grok 性能部分追赶上了 GPT-4o,背后的 Black Forest Lab 模型同样令人瞩目。最近发布的 Reflection 模型引入了 CoS 技术,在符号链推理能力上表现不错,但与 LlaMA 相比仍有差距。DeepSeek 则合并了 Coder 模型与 Magic LTM。如今的 AI 发展日新月异,不断涌现出新技术。

市场上的 Kiling、Minimax 和 Zhipu 的视频模型表现突出,但与 OpenAI 在物理经验生成方面有所不同,一个是单纯的动态扩散模型,另一个则是世界知识的模拟器。OpenAI 的期货应用进展缓慢,目前仅向纽约美术馆及少数人开放了体验权限。

Apple 在 IP 设计和出色工程师方面具备优势,特别是在移动端的入口控制方面。Apple 的 MLX 发展迅速,诸如惰性求值等概念也在逐渐完善,端侧小模型和隐私保护计算的生态体系也在不断扩展。近期,RWKV 被引入做端侧模型,采用 RNN 及 SSM 类思路,MLX 也对 Rene SSM 模型进行了整合。因此,从软件层面来说,Apple 能够提供软硬件相结合的低功耗计算解决方案。

NVIDIA 则在 GPU 相关电气设计方面拥有强大优势,再加上 OpenAI 从前 Google TPU 团队挖来的专业人才,联合打造低能耗高性能芯片,尽管这种组合听起来似乎有些矛盾。未来的基础设施将变得更大、更持久和更多样化。NVIDIA 有能力在硬件上提供低功耗计算,而 OpenAI 则可以通过 CUDA 更好地融合语言模型。

高功耗的 NVIDIA GPU 在 2019 年为 300W,2023 年提升至 600W,到 2025 年预计将超过 1000W。限制功耗的则是 12VHPWR 连接器,因此需要制定低能耗计算战略。

之前提到的 Eliyan 在 LBL OCP 体验中心展示的 BoW 2.0 原型中提到,“具有1个ASIC和24个HBM的1个 SiP 可以取代具有10个ASIC和60个HBM的10个 SiP。”在相同性能下,这种设计实现了更高的产量、更少的芯片和更低的能耗,从而带来了显著的可持续性收益。

Apple 关注大规模的持续计算,是一家披着硬件外衣的软件公司,代表着端侧 AI 的未来;而 Tesla 进行的是大规模计算,是一家披着汽车外衣的机器人公司,代表着具身智能的未来。相对比较而言,OpenAI 作为一家从 ImageNet 兴起的扩展公司,至今尚未见到扩展法则的天花板,未来依然会继续扩展。至于 SSI 代表的另一种发展路线又将如何呢?

推荐使用GPT,国内可直接访问:https://www.chatgp4.com/

标签



热门标签