OpenAI 宣布推出集成 ChatGPT 的 DALL-E 3
OpenAI 发布了其最新的文本转图像生成技术DALL·E 3。与之前的版本相比,新系统在创建细节丰富、细节鲜明的图像方面表现出了显著增强的能力,这些图像与复杂的文本描述高度吻合。
DALL-E 3 的功能代表了文本到图像合成的重大飞跃,使用户能够以相对较少的努力将他们的想法转化为非常准确的视觉描述。据 OpenAI 称,DALL-E 3 可以轻松处理请求特定对象、元素之间的关系和其他复杂细节的提示,而这些提示通常会让早期的 AI 图像生成器(如 DALL-E 2)陷入困境。
OpenAI 重点介绍的一些示例包括 DALL-E 3 在生成嵌入文本的图像时提高了精度,以及更好地渲染了人手等棘手元素。该系统还擅长自动生成视觉上引人入胜的图像,而无需用户采用特殊技术来“提示设计”所需的品质。
DALL-E 3 以 OpenAI 于 2021 年首次推出的突破性 DALL-E 模型为基础,该模型展示了前所未有的从文本字幕创建原始图像的能力。然而,它需要对提示进行大量微调才能输出合适的结果。DALL-E 3 旨在通过其更强大的架构来克服这些限制,优化精度并遵循提示细节。
DALL-E 3 现已面向特定客户进行研究预览,并将于 10 月初向 OpenAI 的 ChatGPT Plus 和 Enterprise 计划中的用户提供。
独特的是,DALL-E 3 是建立在 OpenAI 广受欢迎的对话式 AI 聊天机器人 ChatGPT 之上的。通过这种集成,用户可以使用 ChatGPT 本身以交互方式完善和细化输入 DALL-E 3 的文本提示。例如,ChatGPT 可以从用户那里获取基本想法,并建议扩展提示和附加细节,以更好地捕捉所需的图像特征。
OpenAI 还概述了为限制这种强大的生成技术的潜在滥用而采取的措施。与之前的版本一样,DALL-E 3 旨在拒绝创建有害、暴力或成人内容。它还将拒绝直接指名道姓或描述特定公众人物的请求。该公司还在测试自动检测 AI 生成的图像的工具,以更好地了解它们在创建后可能被如何使用。
DALL-E 3 在展示 AI 创造力方面的巨大进步的同时,也带来了一些重要的警告。作为一项研究预览,它仍然是一个实验系统,可用性有限。OpenAI 承认 DALL-E 3 偶尔会生成与提示不完全匹配或包含不准确的图像。关于如何正确地归功于 AI 艺术品并避免侵犯人类创作者的权利,也存在一些悬而未决的问题。
尽管如此,DALL-E 3 代表了人工智能研究的一个重要里程碑,肯定了文本转图像算法的快速发展。能够以最少的人力将书面想法转化为精细的可视化效果,不仅带来了令人兴奋的可能性,也暴露了负责任的人工智能开发方面的复杂问题。OpenAI 的谨慎推出表明,尽管该技术具有令人信服的能力,但他们仍打算谨慎创新。
好啦,今天就到这里,如果你也想在体验ChatGPT4.0
具有GPT4对话、DALL·E3绘画、GPT4V看图助手。
可以点击下方红色链接进行使用。