刚刚,GPT-4o关键人物离职创业!曾在OpenAI最早提出构建「Her」

**OpenAI 最早构建「Her」的关键人物宣布离职创业**

在今年5月,OpenAI 发布了令人瞩目的 GPT-4o 模型,这一创新的人工智能技术可以自然地与人类进行语音对话,跨越文本、视觉和音频,无延迟相当于人类的响应时间。同时,它允许用户随时打断,并能够感知与回应用户的情绪。这一发布后,许多人将科幻电影《Her》中的场景与现实时刻相连。

离职的 Alexis Conneau 是 GPT-4o 项目的重要参与者之一。离职前,他担任 OpenAI 音频 AGI 研究负责人,也是《Her》愿景的最早提出者之一。在他的领英简介中,他表示自己是一名专注于多模态和音频 AGI 的人工智能研究员,主导了「Her」研究(包括 GPT-4o 和 GPT-5),这是首个原生集成音频的 GPT 模型。

关于离职后的创业方向,Conneau 尚未透露细节,不过在被问及「AGI 时间表」时,他表示自己更倾向于追求「通用情感智能(AGEI)」。

Conneau 的离职引发了广泛关注,令许多风险投资者开始行动。

有趣的是,直到 Conneau 离开时,他参与构建的 GPT-4o 仍未向所有用户开放,目前仅部分 ChatGPT Plus 用户可以使用(此前有消息称计划在今年秋季向所有 Plus 付费用户开放)。

与此同时,他的离职引发了外界对 OpenAI 内部变动的疑问:最近有那么多人选择离开,OpenAI 到底发生了什么?

**Alexis Conneau 的个人经历**

Alexis Conneau 本科毕业于法国巴黎综合理工学院(在法国高校中的排名一向名列前茅),并在该校获得硕士学位。随后,他又取得了巴黎-萨克雷高等师范学校的机器学习硕士学位,奠定了扎实的数学和计算机科学基础。

他在巴黎综合理工学院学习时倾向于纯数学,并对此领域产生浓厚兴趣。当时,科技行业正在将数字游戏发展成为一项价值数十亿美元的创新艺术。于是,当他毕业后,他选择了投身科技行业。

2015 年,Conneau 加入了 Facebook 在巴黎设立的新人工智能实验室,正值美国顶尖科技企业全球扩张之际。2019 年,Conneau 获得博士学位。

此后,Conneau 分别在 Facebook AI Research、谷歌和 OpenAI 工作,在文本和语音神经网络领域做出了重要贡献。

他的主要成就包括:

– 在 OpenAI 通过 GPT-4o 创建了《Her》的第一个实现版本。他表达自己是如何将这一愿景带入 OpenAI,并与一位同事几乎从零开始构建音频 LLM 研究的。
– 开发首个无监督的神经网络,用于文本翻译和语音转录(无监督 MT 和 ASR)。
– 构建通用多语言掩蔽语言模型表示(如 XLM-R、Wav2vec 2.0 XLS-R),应用于文本分类、机器翻译和语音识别等,影响超过10亿用户。
– 提出了「零样本跨语言迁移」理念,证明了经过单一语言微调的多语言模型在其他语言上同样有效(如 XNLI、XLM)。
– 开源 Facebook AI Research 最受欢迎的基础文本和语音掩蔽语言模型(如 XLM-R 和 Wav2vec 2.0 XLS-R),可在 Hugging Face 上获得。

此外,他曾在 EMNLP(2017 年、2018 年)和 SLT(2022 年)上获得最佳论文奖,并在 JMLR、NeurIPS 和 ICML 等顶级期刊与会议上发表多篇论文。Conneau 的工作极大提升了数亿人所使用的文本和语音系统的性能。

三年前,《华盛顿邮报》曾为他撰写专题文章。

关于 Conneau 新公司的后续情况,我们将保持关注,敬请期待。

**见解**

Alexis Conneau 的离职不仅标志着他个人职业生涯的新起点,也引发了对 OpenAI 未来发展方向的热烈讨论。随着 GPT-4o 技术的逐渐成熟,尤其是其情感智能与人机交互的创新能力,更令外界对 AGI 的愿景充满期待。Conneau 的追求,尤其是对通用情感智能的探索,暗示着人工智能未来可能朝着更具人性化的方向发展,这无疑会推动整个行业的发展与变革。在众多研发者相继离开的背景下,OpenAI 需要在团队稳定性与创新能力之间找到平衡,以应对未来的挑战与机遇。

标签



热门标签