GPT-4不披露技术细节,马斯克批判其背离初心,OpenAI不“open“了
推荐使用GPT,国内可直接访问:https://www.chatgp4.com/
3月15日凌晨,OpenAI出乎意料地发布了GPT-4。
这一发布令科技界感到震惊,毕竟人们普遍认为GPT-4将在微软周四的“The Future of Work with AI”活动上宣布。距离ChatGPT首次亮相不过四个月,这款应用已经创造了“历史上增长最快的消费者应用程序”的记录。而今,GPT-4的上线使其应对能力更上层楼。
然而,在震撼之余,许多研究者仔细阅读了GPT-4的技术报告,却感到失望:为何没有技术细节呢?
**一次违背初衷的发布**
在公告中,OpenAI分享了大量关于GPT-4的基准测试结果及一些有趣的演示,但几乎没有提供关于训练系统的数据、算力成本或创建GPT-4所用的硬件和方法等信息。
例如,关于GPT-4论文的总结之一是:“我们使用了Python。”
有网友戏谑地表示:“我发现GPT-4是基于Transformer架构的。”
许多AI领域的专家对此表示批评,认为这一决定违背了OpenAI作为研究型组织的初衷,并使其他研究者很难复现其工作。
对于GPT-4封闭模型的大多数初步反应都是负面的,但似乎愤怒並未能改变其“闭源”的决定。
实际上,对于OpenAI不开放源代码的批评已持续一段时间。就连OpenAI的创始团队成员马斯克也公开质疑这一“背离初心”的行为。他至今仍困惑:“我不明白,最初投入近1亿美元的非营利组织怎么会变成市值300亿美元的商业公司?”
Nomic AI的信息设计副总裁Ben Schmidt表示:“我认为可以停止称其为‘Open’了——介绍GPT-4的98页论文自豪地宣称他们没有披露关于训练集内容的任何信息。”
还有一些人认为,OpenAI隐瞒GPT-4细节的另一个原因可能是法律责任。AI语言模型是基于庞大的文本数据集训练的,许多模型(包括早期的GPT系统)会抓取网络信息,其中一些来源可能涉及受版权保护的材料。目前,已有几家公司因这一原因被独立艺术家和图片网站Getty Images起诉。
一些人担心,这一隐瞒使得制定针对GPT-4的安全保障措施变得更加困难。Ben Schmidt同样认为,由于无法访问GPT-4的训练数据,很难知道该系统的安全使用场景,并提出修复方案。他指出:“众所周知,像GPT-4这样的神经网络是黑箱。它们的操作是不可预测且难以理解的,这是该如何使用它们以及在何处使用它们的关键问题之一。现在OpenAI正在逐步建立一个行业标准,进一步加深了这一谜团。”
**OpenAI首席科学家:开源GPT-4并不明智**
OpenAI首席科学家兼联合创始人Ilya Sutskever对这一争议作出了回应,表示OpenAI不分享更多GPT-4细节的原因是“出于竞争压力和安全顾虑”:
“从竞争角度来看,外界竞争非常激烈。GPT-4的开发并不容易,几乎汇聚了OpenAI的所有力量,经过长期努力才取得成果,而许多公司也都在尝试做同样的事情。”
“虽然安全方面的顾虑并不像竞争那么突出,但情况也在变化。这些模型非常高效,并且变得越来越高效。有时候,如果有人愿意,就很容易用这些模型造成巨大的伤害。随着这些能力的提升,不公开它们是有道理的。”
当被问及“为何OpenAI改变了分享研究成果的方式”时,Sutskever表示:“坦率地说,我们错了。如果你像我们一样相信,在某个时间点,AI或AGI将变得极其强大且令人惊叹,那么开源就没有意义。这是一个糟糕的主意,我坚信在几年内,每个人都会清楚开源AI是不可行的。”
Lightning AI首席执行官、开源工具PyTorch Lightning的创始人William Falcon在接受《VentureBeat》采访时表示,他能够从商业角度理解这一决定:“作为一家企业,你完全有权这样做。”
但是,他也指出,OpenAI的做法为更广泛的社区树立了一个“糟糕的模板”,可能带来有害的后果。
对于OpenAI不共享训练数据的原因,Sutskever解释称:“我认为训练数据是技术。我们不公开训练数据的原因与我们不公开参数数量的原因几乎相同。”当被问及OpenAI是否可以明确声明其训练数据不包含盗版材料时,Sutskever未给出回应。
Sutskever同意批评者的观点,即开源模型有助于保障措施的开发:“如果更多人对这些模型进行研究,我们将了解到更多信息,这很好。”基于这些原因,OpenAI已向某些学术和研究机构提供了系统的访问权限。
**接下来,我们期待什么?**
围绕GPT-4引发的热议预计将持续一段时间,以至于人们可能会忽略一些其他动态。例如,近日的讨论中,谷歌的发布显得相对平静。目前,Google Workspace已全面集成生成式AI,更新了生成图片、演示文稿、电子邮件、文档等功能。这预计将大幅提升生产力。
接下来,人们还可以期待更多:不久后,微软CEO萨蒂亚·纳德拉将亲自登台介绍微软与OpenAI的更多合作,包括基于GPT-4的Office套件。
让我们拭目以待。
推荐使用GPT,国内可直接访问:https://www.chatgp4.com/