大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸

根据广大网友的反馈,GPT-4 似乎真的变得不那么出色了。

自从 OpenAI 于四个月前发布 GPT-4 后,随着时间的推移,网上开始涌现出一些质疑的声音。许多人认为,打造出世界上最强大 AI 的 GPT-4 现如今却显得不那么强大。

一些业内人士认为,这可能与 OpenAI 对该系统的重大重新设计有关。

在最近几周,许多用户在网上表达对 GPT-4 性能下降的不满,称该模型在推理能力和其他输出方面变得“懒惰”(lazier)和“愚笨”(dumber)。用户在 Twitter 和 OpenAI 的在线开发者论坛中反映,GPT-4 的逻辑能力减弱、错误回答增多以及对提供信息失去追踪能力等问题引发了广泛关注。

### 网友反馈:GPT-4「变笨」,抱怨声不断

一位使用 GPT-4 开发网站的用户写道:“现在的 GPT-4 让我非常失望。就像你开了一段时间的法拉利,结果它突然变成了一辆破旧的皮卡。照这样下去,我不确定我是否还愿意为此付费。”

另一位用户表示:“我使用 ChatGPT 已经有一段时间了,自从 GPT-4 发布以来,我一直是 GPT Plus 的付费用户。过去几天,GPT-4 似乎在之前表现良好的任务上遇到了困难。使用时,我发现它似乎无法很好理解我的请求,对信息的追踪能力下降,提供错误信息,并且经常误解我的问题。”

Roblox 的产品负责人 Peter Yang 在 Twitter 上评论称,GPT-4 的输出速度得到提升,但输出质量却相对下降。他坦言:“在一些简单任务中,我希望 GPT-4 能提供更清晰、更有创意的文字输出,但结果却令我失望。”

另一位用户则表示:“GPT-4 开始在输出代码和信息时反复循环,似乎就像脑死亡了一样。如果你之前没有充分体验过它的能力,你可能不会注意到这一点;但若你曾经充分使用过 GPT-4,肯定能明显感觉到它变得愚蠢。”

还有其他用户也分享到相似的困惑:“我也遇到了相同的问题,有人知道怎么解决吗?”

“我确实注意到这一点。它似乎在一天中的某些时间只记得最近的提示,整体性能波动不定。”通过这些反馈,不难看出,许多用户都对 GPT-4 性能下降感到失望。

### 从前慢而贵,现在快但不准确

早在去年年底,OpenAI 发布的 ChatGPT 便震惊了整个 AI 界,最初它运行在 GPT-3 和 GPT-3.5 之上。而在今年 3 月中旬,GPT-4 的发布让开发者和科技行业人士迅速转向这款 AI 模型。

GPT-4 被广泛认为是最强大的可用 AI 模型,具备多模态功能,能够理解图像和文本输入。Lamini 创始人兼首席执行官 Sharon Zhou 表示,尽管 GPT-4 反应较慢,但准确性极高。

然而,几周前,这种情况开始改变。虽说 GPT-4 变得更快了,但其性能却明显下降,引发了整个 AI 社区的热议。根据 Sharon Zhou 和其他专家的说法,这标志着一个重大的变化正在发生。

他们认为 OpenAI 可能正在开发多个较小的 GPT-4 模型,它们的功能与大型模型类似,但运行成本更低。几天前,SemiAnalysis 发布的一篇付费订阅内容也提到这一点。文章指出,OpenAI 能够通过混合专家(MoE)模型有效控制成本,使用了 16 个专家模型,每个专家模型大约有 111B 个参数,其中 2 个被路由到每次前向传递中。

Sharon Zhou 进一步解释道:“这些较小的专家模型对不同任务和领域进行了训练。例如,可能会有一个专门用于生物学的迷你 GPT-4,其他模型则用于物理学、化学等。当用户提出问题时,新系统能够根据不同查询发送请求至相应的专家模型,并将结果汇总。”

此外,开发者兼黑客 George Hotz 在最近的广播节目中称 GPT-4 是一个 8 路混合模型。

值得一提的是,艾伦人工智能研究所创始人 Oren Etzioni 在看到这些信息后致函 Business Insider 表达了自己的观点:“我推测这些猜测大致准确,但我没有证据。”他认为,使用 MoE 方法主要是为了提高生成模型的输出质量、降低成本并加快响应速度。

“有效地使用混合模型确实能够实现这些目标,但往往需要在成本与质量之间做出取舍。”Etzioni 补充道:“关于 OpenAI 是否在降低成本的同时牺牲了一些质量,这仍是一种猜测。”

实际上,早在 2022 年,OpenAI 总裁 Greg Brockman 就与几位同事共同撰写了关于 MoE 方法的论文,指出当采用该方法时,模型可以在不增加计算成本的情况下支持更多参数。

Sharon Zhou 认为:“GPT-4 最近几周的性能下降很可能与 OpenAI 推出的较小专家 GPT-4 模型的训练有关。当用户进行测试时,系统会收集各种不同问题的反馈,虽然可能会表现不佳,但也在不断改进和学习。”

### 结语

总体来看,尽管 GPT-4 的发布曾引发极大的关注和期待,但近期的反馈显示出用户对其性能下降的失望。这一现象既可能与 OpenAI 对模型的战略调整有关,也反映出在追求速度和成本效益时,可能会在质量方面有所妥协。未来,OpenAI 如何解决这些问题,将直接影响 GPT-4 在市场中的表现和用户的信任。

标签



热门标签