ChatGPT 词汇表:每个人都应该知道的 48 个 AI 术语
随着人工智能技术嵌入谷歌、微软、苹果、Anthropic、Perplexity 和 OpenAI 的产品中,及时了解所有最新术语大有裨益。
代理:具有代理能力的系统或模型,能够自主采取行动以实现目标。在人工智能的背景下,代理模型可以在没有持续监督的情况下行动,例如高级自动驾驶汽车。与处于后台的“代理”框架不同,代理框架处于前端,专注于用户体验。
人工智能伦理:旨在防止人工智能伤害人类的原则,通过确定人工智能系统应如何收集数据或处理偏见等方式实现。
人工智能安全:一个跨学科领域,关注人工智能的长期影响以及它如何突然发展成为对人类具有敌意的超级智能。
算法:一系列指令,允许计算机程序以特定方式学习和分析数据(例如识别模式),然后从中学习并自行完成任务。
对齐:调整人工智能以更好地产生预期结果。这可以指从审核内容到保持与人类的积极互动等任何事情。
拟人化:人类倾向于赋予非人类物体类似人类的特征。在人工智能中,这可能包括相信聊天机器人比实际更像人类且更具有意识,例如相信它会快乐、悲伤,甚至有知觉。
人工智能,简称 AI:利用技术模拟人类智能,无论是在计算机程序中还是在机器人中。计算机科学的一个领域,旨在构建能够执行人类任务的系统。
自主代理:具有完成特定任务所需的能力、编程和其他工具的 AI 模型。例如,自动驾驶汽车就是一个自主代理,因为它具有传感输入、GPS 和驾驶算法,可以自行导航。斯坦福大学的研究人员已经证明,自主代理可以发展自己的文化、传统和共同语言。
偏见:对于大型语言模型来说,由训练数据导致的错误。这可能导致基于刻板印象将某些特征错误地归因于某些种族或群体。
聊天机器人:通过模拟人类语言的文本与人类交流的程序。
ChatGPT : OpenAI开发的利用大型语言模型技术的AI聊天机器人
认知计算:人工智能的另一个术语。
数据增强:重新混合现有数据或添加更多样化的数据集来训练人工智能。
深度学习:人工智能的一种方法,也是机器学习的一个子领域,它使用多个参数来识别图片、声音和文本中的复杂模式。该过程受到人类大脑的启发,使用人工神经网络来创建模式。
扩散:一种机器学习方法,采用现有数据(如照片)并添加随机噪声。扩散模型训练其网络重新设计或恢复该照片。
突发行为:当人工智能模型表现出意想不到的能力时。
端到端学习,或 E2E:一种深度学习过程,其中模型被指示从头到尾执行任务。它不是按顺序训练完成任务,而是从输入中学习并一次性解决所有问题。
道德考虑:意识到人工智能的道德影响以及与隐私、数据使用、公平性、滥用和其他安全问题相关的问题。
foom:也称为快速起飞或硬起飞。如果有人制造出 AGI,那么拯救人类可能已经太迟了。
生成对抗网络 (GAN):由两个神经网络组成的生成 AI 模型,用于生成新数据:生成器和鉴别器。生成器创建新内容,鉴别器检查其是否真实。
生成式人工智能:一种使用人工智能创建文本、视频、计算机代码或图像的内容生成技术。人工智能会接收大量训练数据,找到模式来生成自己的新反应,这些反应有时可能与源材料相似。
Google Gemini:谷歌推出的一款人工智能聊天机器人,功能与 ChatGPT 类似,但从当前网络中提取信息,而 ChatGPT 仅限于 2021 年之前的数据,并且不连接到互联网。
护栏:对人工智能模型施加的政策和限制,以确保负责任地处理数据并且模型不会产生令人不安的内容。
幻觉:AI 的错误反应。可能包括生成式 AI 给出的答案不正确,但却自信地将其陈述为正确。造成这种情况的原因尚不完全清楚。例如,当问 AI 聊天机器人“列奥纳多达芬奇什么时候画了蒙娜丽莎?”时,它可能会以错误的陈述回答:“列奥纳多达芬奇在 1815 年画了蒙娜丽莎”,这比实际画作晚了 300 年。
推理:人工智能模型通过从训练数据中 推断来生成有关新数据的文本、图像和其他内容的过程。
大型语言模型,或 LLM:一种基于大量文本数据训练的人工智能模型,用于理解语言并以类似人类的语言生成新内容。
机器学习(ML):人工智能的一个组成部分,允许计算机学习并在没有明确编程的情况下做出更好的预测结果。可以与训练集结合以生成新内容。
Microsoft Bing:微软推出的一款搜索引擎,现在可以使用 ChatGPT 技术提供人工智能搜索结果。它与 Google Gemini 类似,可以连接到互联网。
多模式人工智能:一种可以处理多种类型输入的人工智能,包括文本、图像、视频和语音。
自然语言处理:人工智能的一个分支,利用机器学习和深度学习使计算机具有理解人类语言的能力,通常使用学习算法、统计模型和语言规则。
神经网络:一种与人脑结构相似的计算模型,用于识别数据中的模式。由相互连接的节点或神经元组成,可以识别模式并随着时间的推移进行学习。
过度拟合:机器学习中的错误,其功能与训练数据过于接近,可能只能识别所述数据中的特定示例,而不能识别新数据。
回形针:牛津大学哲学家Nick Boström提出的“回形针最大化理论” 是一个假设场景,其中人工智能系统将制造尽可能多的回形针。为了生产出尽可能多的回形针,人工智能系统会消耗或转化所有材料以实现其目标。这可能包括拆除其他机器以生产更多回形针,这些机器可能对人类有益。这种人工智能系统的意外后果是,它可能会为了制造回形针而毁灭人类。
参数:赋予 LLM 结构和行为的数值,使其能够做出预测。
Perplexity: Perplexity AI 旗下的一款人工智能聊天机器人和搜索引擎的名称。它使用大型语言模型(与其他人工智能聊天机器人中的模型类似)来回答问题并提供新颖的答案。它与开放互联网的连接还使其能够提供最新信息并从网络中提取结果。Perplexity Pro 是该服务的付费版本,它使用其他模型,包括 GPT-4o、Claude 3 Opus、Mistral Large、开源 LlaMa 3 及其自己的 Sonar 32k。Pro 用户还可以上传文档进行分析、生成图像和解释代码。
提示:您输入到 AI 聊天机器人中以获得答复的建议或问题。
提示链:人工智能使用以前交互中的信息来为未来的响应提供信息的能力。
随机鹦鹉:与 LLM 的类比,说明软件无法更深入地理解语言或周围世界背后的含义,无论输出听起来多么令人信服。这个短语指的是鹦鹉如何模仿人类的话语,却不理解其背后的含义。
风格转换:将一张图片的风格适应另一张图片的内容的能力,允许人工智能解释一张图片的视觉属性并将其应用于另一张图片。例如,拿来伦勃朗的自画像,然后以毕加索的风格重新创作。
温度:设置参数以控制语言模型输出的随机性。温度越高,模型承担的风险越大。
文本到图像生成:根据文本描述创建图像。
标记: AI 语言模型处理的小段书面文本,以形成对您的提示的响应。一个标记相当于四个英文字符,或大约四分之三的单词。
训练数据:用于帮助AI模型学习的数据集,包括文本,图像,代码或数据。
Transformer 模型:一种神经网络架构和深度学习模型,通过跟踪数据中的关系(例如句子或图像的各个部分)来学习上下文。因此,它不是一次分析一个单词,而是可以查看整个句子并理解上下文。
图灵测试:以著名数学家和计算机科学家艾伦·图灵命名,测试机器像人类一样行动的能力。如果人类无法区分机器的反应与另一个人的反应,则机器通过测试。
弱人工智能,又称狭义人工智能:专注于特定任务且无法学习其技能范围之外内容的人工智能。当今的大多数人工智能都是弱人工智能。
零样本学习:模型必须在没有获得必要训练数据的情况下完成任务的测试。例如,仅接受老虎训练即可识别狮子。