ChatGPT 支持的语言
推荐使用GPT,国内可直接访问:https://www.chatgp4.com/
ChatGPT 拥有超过 1.8 亿活跃用户,并已被世界各地的公司采用。这是否意味着它支持其他语言?
简短的回答是肯定的。
长话短说,答案是肯定的——但是……
ChatGPT 确实正式支持数十种语言。而且人们发现,它在更多语言中的能力水平各不相同,包括多种编程和编码语言。
然而,当使用非英语语言时,ChatGPT 的能力会有很大差异。
那么,ChatGPT 可以识别哪些语言?哪种语言最适合用于提示?
在本文中,我们将探讨 ChatGPT 的语言能力。我们还将分析 ChatGPT 在其他语言中的优势和劣势,以及原因。
ChatGPT 支持和使用的语言完整列表
语言 | 官方支持 | 有限的支持或表现出一定的能力 | 国家 |
阿尔巴尼亚语 | ✔️ | 阿尔巴尼亚、科索沃、北马其顿 | |
阿姆哈拉语 | ✔️ | 埃塞俄比亚 | |
阿拉伯 | ✔️ | 阿尔及利亚、巴林、乍得、科摩罗、吉布提、埃及、厄立特里亚、伊拉克、约旦、科威特、黎巴嫩、利比亚、毛里塔尼亚、摩洛哥、阿曼、巴勒斯坦、卡塔尔、沙特阿拉伯、索马里、苏丹、叙利亚、突尼斯、阿拉伯联合酋长国、也门 | |
亚美尼亚语 | ✔️ | 亚美尼亚 | |
阿瓦德语 | ✔️ | 印度 | |
阿塞拜疆语 | ✔️ | 阿塞拜疆 | |
巴什基尔语 | ✔️ | 俄罗斯 | |
巴斯克 | ✔️ | 西班牙 | |
白俄罗斯语 | ✔️ | 白俄罗斯 | |
孟加拉 | ✔️ | 孟加拉国、印度 | |
博杰普尔语 | ✔️ | 印度、尼泊尔 | |
波斯尼亚语 | ✔️ | 波斯尼亚和黑塞哥维那 | |
巴西葡萄牙语 | ✔️ | 巴西 | |
保加利亚语 | ✔️ | 保加利亚 | |
缅甸语 | ✔️ | 缅甸 | |
粤语 | ✔️ | 中国 | |
加泰罗尼亚语 | ✔️ | 西班牙、安道尔、意大利 | |
恰蒂斯加尔邦 | ✔️ | 印度 | |
克罗地亚语 | ✔️ | 克罗地亚、波斯尼亚和黑塞哥维那 | |
捷克语 | ✔️ | 捷克共和国 | |
丹麦语 | ✔️ | 丹麦、格陵兰、法罗群岛 | |
多格里 | ✔️ | 印度 | |
荷兰语 | ✔️ | 荷兰、比利时、苏里南、阿鲁巴、库拉索、荷属圣马丁 | |
英语 | ✔️ | 澳大利亚、巴巴多斯、伯利兹、博茨瓦纳、加拿大、斯威士兰、斐济、加纳、印度、爱尔兰、牙买加、肯尼亚、莱索托、利比里亚、马拉维、马耳他、马绍尔群岛、毛里求斯、密克罗尼西亚、纳米比亚、新西兰、尼日利亚、巴基斯坦、帕劳、巴布亚新几内亚、菲律宾、卢旺达、萨摩亚、塞舌尔、塞拉利昂、新加坡、所罗门群岛、南非、南苏丹、斯里兰卡、坦桑尼亚、乌干达、瓦努阿图、赞比亚、津巴布韦 | |
爱沙尼亚语 | ✔️ | 爱沙尼亚 | |
法罗语 | ✔️ | 法罗群岛 | |
芬兰 | ✔️ | 芬兰 | |
法语 | ✔️ | 比利时、贝宁、布基纳法索、布隆迪、喀麦隆、加拿大、中非共和国、乍得、科摩罗、刚果共和国、刚果民主共和国、吉布提、赤道几内亚、法国、加蓬、几内亚、海地、科特迪瓦、卢森堡、马达加斯加、马里、摩纳哥、尼日尔、卢旺达、塞内加尔、塞舌尔、瑞士、多哥、瓦努阿图 | |
加利西亚语 | ✔️ | 西班牙 | |
格鲁吉亚 | ✔️ | 乔治亚州 | |
德语 | ✔️ | 奥地利、比利时、德国、列支敦士登、卢森堡、瑞士 | |
希腊语 | ✔️ | 希腊、塞浦路斯 | |
古吉拉特语 | ✔️ | 印度 | |
哈里亚纳邦 | ✔️ | 印度 | |
印地语 | ✔️ | 印度 | |
匈牙利 | ✔️ | 匈牙利 | |
冰岛的 | ✔️ | 冰岛 | |
印度尼西亚 | ✔️ | 印度尼西亚 | |
爱尔兰语 | ✔️ | 爱尔兰 | |
意大利语 | ✔️ | 意大利、圣马力诺、瑞士、梵蒂冈 | |
日本人 | ✔️ | 日本 | |
爪哇语 | ✔️ | 印度尼西亚 | |
卡纳达语 | ✔️ | 印度 | |
克什米尔语 | ✔️ | 印度 | |
哈萨克语 | ✔️ | 哈萨克斯坦 | |
孔卡尼语 | ✔️ | 印度 | |
韩国人 | ✔️ | 韩国、朝鲜 | |
吉尔吉斯 | ✔️ | 吉尔吉斯斯坦 | |
拉脱维亚语 | ✔️ | 拉脱维亚 | |
立陶宛语 | ✔️ | 立陶宛 | |
马其顿语 | ✔️ | 北马其顿 | |
迈蒂利 | ✔️ | 印度 | |
马来语 | ✔️ | 马来西亚、文莱、新加坡 | |
马拉雅拉姆语 | ✔️ | 印度 | |
马耳他语 | ✔️ | 马耳他 | |
普通话 | ✔️ | 中国、台湾、新加坡 | |
马拉地语 | ✔️ | 印度 | |
马尔瓦里 | ✔️ | 印度 | |
闽南语 | ✔️ | 中国台湾 | |
摩尔多瓦 | ✔️ | 摩尔多瓦 | |
蒙 | ✔️ | 蒙古 | |
黑山 | ✔️ | 黑山 | |
尼泊尔语 | ✔️ | 尼泊尔、印度 | |
挪威 | ✔️ | 挪威 | |
奥里亚语 | ✔️ | 印度 | |
普什图语 | ✔️ | 阿富汗、巴基斯坦 | |
波斯语(Farsi) | ✔️ | 伊朗、阿富汗、塔吉克斯坦 | |
抛光 | ✔️ | 波兰 | |
葡萄牙语 | ✔️ | 葡萄牙、巴西、莫桑比克、安哥拉、佛得角、几内亚比绍、东帝汶、赤道几内亚、圣多美和普林西比 | |
旁遮普语 | ✔️ | 印度、巴基斯坦 | |
拉贾斯坦语 | ✔️ | 印度 | |
罗马尼亚语 | ✔️ | 罗马尼亚 | |
俄语 | ✔️ | 俄罗斯、白俄罗斯、哈萨克斯坦、吉尔吉斯斯坦 | |
梵文 | ✔️ | 印度 | |
桑塔利 | ✔️ | 印度 | |
塞尔维亚 | ✔️ | 塞尔维亚、波斯尼亚和黑塞哥维那、黑山 | |
信德语 | ✔️ | 巴基斯坦、印度 | |
僧伽罗语 | ✔️ | 斯里兰卡 | |
斯洛伐克语 | ✔️ | 斯洛伐克 | |
斯洛文尼亚语 | ✔️ | 斯洛文尼亚 | |
索马里 | ✔️ | 索马里、吉布提、埃塞俄比亚 | |
西班牙语 | ✔️ | 阿根廷、玻利维亚、智利、哥伦比亚、哥斯达黎加、古巴、多米尼加共和国、厄瓜多尔、萨尔瓦多、赤道几内亚、危地马拉、洪都拉斯、墨西哥、尼加拉瓜、巴拿马、巴拉圭、秘鲁、西班牙、乌拉圭、委内瑞拉、安道尔 | |
斯瓦希里语 | ✔️ | 坦桑尼亚、肯尼亚、乌干达 | |
瑞典 | ✔️ | 瑞典、芬兰 | |
他加禄语 | ✔️ | 菲律宾 | |
塔吉克 | ✔️ | 塔吉克斯坦 | |
泰米尔语 | ✔️ | 印度、斯里兰卡、新加坡 | |
鞑靼语 | ✔️ | 俄罗斯 | |
泰卢固语 | ✔️ | 印度 | |
泰国 | ✔️ | 泰国 | |
土耳其 | ✔️ | 土耳其、北塞浦路斯 | |
土库曼人 | ✔️ | 土库曼斯坦 | |
乌克兰 | ✔️ | 乌克兰 | |
乌尔都语 | ✔️ | 巴基斯坦、印度 | |
乌兹别克语 | ✔️ | 乌兹别克斯坦 | |
越南语 | ✔️ | 越南 | |
威尔士语 | ✔️ | 英国威尔士 | |
吴 | ✔️ | 中国 |
ChatGPT 支持多少种语言?
据开发 ChatGPT 的公司 OpenAI 称, ChatGPT正式支持 58 种语言。
一方面,这还不到世界上所有语言的 1%。
另一方面,这 50 多种语言涵盖了世界人口的绝大多数。 支持的语言包括英语、西班牙语、法语、葡萄牙语、俄语、日语、中文、阿拉伯语以及几乎所有其他主要语言。
大多数国家都有 ChatGPT 支持的官方语言
大约有 45 亿人以 ChatGPT 官方支持的至少一种语言为母语。还有更多的人以其中至少一种语言为第二语言。
您能更改 ChatGPT 的语言吗?
是的。不过,你可能不必这么做。ChatGPT 会自动检测你的浏览器或移动设备使用的语言。然后,只要它是官方支持的语言之一,它就会切换到该语言。
您可以在设置中手动更改 ChatGPT 使用的语言。
ChatGPT 支持哪些语言?
这看起来与“支持哪些语言”是同一个问题,但实际上有很大不同。
ChatGPT 可能正式支持超过五十种语言,但它在几乎两倍的自然语言中表现出一定程度的能力。
ChatGPT 甚至可以处理和响应以不同文字提交的查询,从西里尔文、阿拉伯文、中文到象形文字。
如何在 ChatGPT 中生成不同的语言
您可以通过两种方式让 ChatGPT 使用不同的语言讲话。
第一种是直接询问。用一种语言提交您的查询,最后指定您希望 ChatGPT 用哪种语言回答。
ChatGPT 根据要求用西班牙语回答用英语提交的问题
第二种方法是使用您希望收到的答复的语言提交您的请求。
当用西班牙语提问时,ChatGPT 会正确地用西班牙语回答
您可能会注意到,尽管问题相同,但两个答案却不同。我们稍后再讨论这个问题。
ChatGPT 支持的语言数量目前尚不清楚。消息来源给出了不同的估计,有的估计略低于 100 种,有的估计略高于 100 种。
这种不确定性的原因与 ChatGPT 能够识别如此多语言的原因相同。它基于大型语言模型如何学习新信息。
ChatGPT 如何学习新语言?
ChatGPT 是一种自然语言处理器。换句话说,它非常擅长处理和生成人类可能会说的信息。这就是为什么它可以生成类似人类的响应,让您可以与它交谈。
但是 ChatGPT 如何知道该如何回答查询呢?
简单来说,ChatGPT 是一种非常强大的算法,它经过大量数据的训练,可以识别某些模式并做出适当的反应。每种语言都由不同的模式组成,ChatGPT 能够学习、处理和响应其中任何一种模式。
当你提交查询时,ChatGPT 会处理收到的信息。它会识别某些模式(你使用的单词、单词顺序等),并生成适当的响应。或者至少,这就是它的目的。由于 ChatGPT 并不真正理解事物,因此它的响应并不总是合适的。
稍等一下。ChatGPT 听不懂东西?
ChatGPT 是多语言的吗?
认为 ChatGPT “理解”一种语言是错误的。因为它无法像人类一样真正理解事物。
例如,ChatGPT有时被比作婴儿。人类婴儿不会通过学习教科书、记忆词汇、学习语法规则等来学习语言。
相反,婴儿会自然而然地学习语言。随着时间的推移,有了足够的输入,他们开始识别单词的含义,这些单词如何组合成句子等等。婴儿甚至可以同时学习多种语言。
从表面上看,ChatGPT 的功能相同,但规模要大得多。通过研究训练数据,ChatGPT 可以学习定义语言的模式和结构。它可以处理语言中的查询并做出响应。
然而,与人类不同,ChatGPT并不真正理解自己正在处理或生成什么。它会在收到的信息中识别出某些模式,并根据训练识别这些模式,然后生成适当的模式作为响应。
简而言之,ChatGPT 并不是真正意义上的多语言者。例如,ChatGPT 可以说西班牙语,但它并不像母语人士甚至翻译那样真正理解西班牙语。
这似乎只是一个小小的区别。然而,这也解释了为什么 ChatGPT 所支持的语言数量列表通常不完整。ChatGPT 的能力并不是固定的。
这也意味着你可能不应该尝试使用 ChatGPT 来学习语言。ChatGPT 可能是一个帮助你学习语言的绝佳工具,但它本身并不能真正教你一门全新的语言。
最后,最重要的是,识别模式和真正理解之间看似微小的差异有助于解释为什么 ChatGPT 难以处理非英语语言。
为什么 ChatGPT 在其他语言上表现不佳
用于训练 ChatGPT 的数据语料库主要包含英语。部分原因是 OpenAI 是一家美国公司。还因为绝大多数数字化内容都是英文的。
简单来说,ChatGPT 掌握的某种语言的信息越多,它掌握这种语言的能力就越强。这是因为它有更多的机会学习定义该语言的模式和结构。
ChatGPT 可用的数据量(或任何 AI 工具可用的数据量)是一种资源。资源丰富的语言(如英语)拥有大量可供 ChatGPT 学习的材料。资源匮乏的语言则拥有少量可用材料。
英语是迄今为止资源最多的语言。中文是另一种资源丰富的语言,这要归功于其庞大的使用者数量。出于同样的原因,西班牙语也是另一种资源相当丰富的语言。
根据语言在 CommonCrawl 语料库中的流行程度(“CC 大小”)对所选语言进行排序,并根据其资源水平高、中、低或极低分为几类
研究一再表明,ChatGPT在资源较少的语言中表现较差。
当然,新资源不断产生。然而,这些资源的产生速度并不相同,也不一定全部都包含在 ChatGPT 的训练中。
ChatGPT 的知识截止值是多少?
ChatGPT-4o 是截至 2024 年 6 月最先进的 ChatGPT 版本,其知识截止日期为2023 年 10 月。
这意味着过去几个月制作的任何新材料都不包含在 ChatGPT 的培训中。
首先,这意味着 ChatGPT 不会意识到语言的新部分——例如 2023 年 10 月之后发明的新俚语或习语。
ChatGPT 会说西班牙语吗?
说到成语,ChatGPT 经常会遇到困难,即使是在资源相对丰富的语言(非英语)中也是如此。
例如,在一项研究中,研究人员要求 GPT-4 列出一些运动鞋的口语术语。它成功指出了 Trainers(在英国使用)和 Joggers(在澳大利亚使用)。然而,当用西班牙语提出同样的问题时,GPT-4 就遇到了困难。它无法识别西班牙语中的等效俚语,例如 zapatillas deportivas(西班牙)或 championes(乌拉圭)。
这些困难甚至会蔓延到用同一种语言给出的回答中。还记得 GPT-4 对我关于最受欢迎的西班牙菜的问题的回答略有不同吗?研究表明,当用英语提问时,ChatGPT 会给出更好的答案,即使回答总是用另一种语言。
总体而言,使用 ChatGPT 的原则适用于任何语言。优化查询有助于获得更好的答案。坚持在线广泛讨论的主题也有帮助。
除此之外,即使技术上熟练掌握所需的语言,用英语向 ChatGPT 询问问题仍然可以产生更好的结果。
归根结底,ChatGPT 的重点还是英语。2022 年 12 月,OpenAI 的一名工作人员在论坛讨论中明确表示了这一点。他们表示,“任何好的西班牙语成绩都是加分项。”
ChatGPT 可以翻译东西吗?
再次,简短的回答是肯定的,较长的回答也是肯定的——但是……
ChatGPT 可以翻译什么
ChatGPT 可能难以处理习语和类似的复杂语言特征。尽管如此,它在翻译这些短语方面仍然比标准翻译工具表现更好。
这是因为翻译工具会孤立地转换单词和短语,而 ChatGPT 则会根据训练过的所有数据来看待事物。它对语言的文化、区域差异、俚语和其他模式有更多的了解,而传统翻译工具在单独输入短语时可能无法识别这些模式。
以一个常见的西班牙语习语“como la copa de un pino”为例。让我们使用 ChatGPT 来翻译它。
ChatGPT 成功识别并翻译西班牙语习语
ChatGPT 成功识别了这个成语。它提供了几种不同的英文翻译,甚至给出了一个例句,让这个成语的真正含义一目了然。
现在,让我们向翻译工具提出同样的问题。
谷歌翻译将西班牙语习语逐字翻译,这并不是特别有帮助
以下是谷歌翻译的结果。结果在技术上是正确的,但实际上并没有什么意义。它显然没有传达出这句西班牙语短语的实际含义。“像松树的顶端”可能意味着某物很高,或多叶,或者,嗯,几乎任何东西。
DeepL 稍好一些,但其翻译结果仍可能会让不熟悉西班牙语习语的人感到困惑
翻译工具 DeepL 稍好一些,但仍然非常直白。对于不了解西班牙语习语的英语使用者来说,“和松树顶端一样好”可能毫无意义。是什么让松树顶端变得好?同样,也许是它的高度?
这只是 ChatGPT 优于翻译工具的一个案例。
另一种情况是当你处理充满错误或俚语的语言时。例如,Sam Quillen 发现 ChatGPT 可以翻译出充满错误的西班牙语句子,而 Google Translate 则会吐出胡言乱语。
但总体而言,ChatGPT 还没有准备好取代翻译工具——至少现在还不行。
ChatGPT 无法翻译的内容
在某些习语方面,ChatGPT 的表现可能比翻译工具更好,但其性能会根据语言、提示和其他可能超出用户控制范围的因素而有很大差异。
微软已向 OpenAI 投资了约 100 亿美元,并对 ChatGPT 等大型语言模型的翻译能力进行了广泛研究。研究人员发现,LLM 在常见或资源相对丰富的语言(如西班牙语)上表现良好。然而,语言越不常见,LLM 的表现就越差。
即使在资源丰富的语言中,ChatGPT 的表现也比英语差。它会产生更多幻觉,会弄错用英语询问时能得到的事实。
2023 年的一项 研究发现,大型语言模型在非英语语言中运行时更容易出现错误、不一致和不正确的情况。
不过,这种情况在未来可能会改变。世界各地的研究人员正在研究数据语料库,以帮助提高 ChatGPT 在资源较少的语言方面的能力。去年 3 月,OpenAI 首席执行官 Sam Altman 在国会听证会上表示,他的目标是与政府和组织合作,获取更多数据,以帮助提高 ChatGPT 的非英语语言技能。
然而,截至目前,ChatGPT 仍然是一款以英语为中心的工具。记住 OpenAI 员工说的话。其他语言只是额外的福利。
ChatGPT 的英语翻译有误
ChatGPT 的翻译工作还存在另一个问题。仅在 2023 年,就有十多项研究得出结论,它在从英语翻译成另一种语言时的表现要差得多。
当多种语言混合在一起时,它也会遇到严重的问题。这是全世界数百万人每天都在做的事情,这很自然。
这严重削弱了 ChatGPT 作为翻译器的功能。例如,ChatGPT 通常用作多语言支持机器人,或用于促进两个不说同一种语言的人之间的贸易。但是,如果任何对话的一半(从英语翻译的一半)充满错误,那么自然会出现问题。
ChatGPT 使用哪种编码语言?
我们讨论过 ChatGPT 知道和会说哪些语言,但是它是用什么语言构建的呢?
ChatGPT 的主要结构是用 Python 创建的。大约一半的软件开发人员使用 Python,这使其成为最流行的语言之一。它用于开发网站、分析数据和构建 ChatGPT 等人工智能工具。
ChatGPT 也是通过将此基础 Python 代码连接到 TensorFlow 和 PyTorch 两个强大的框架而构建的。
在这个核心结构之上还层叠了各种其他框架来帮助提高 ChatGPT 的性能。这些框架包括 Gensim、NLTK 和 spaCy。
您还可以将 ChatGPT 连接到其他库或 API,以进一步增强其能力。目前,OpenAI 支持来自 180 多个国家和地区的访问。
ChatGPT 知道哪些编码语言?
ChatGPT 可能是用 Python 构建的,但它在其他几种编程和编码语言中也表现出了令人印象深刻的能力。这些包括所有最流行的语言,以及其他一些语言:
- Python
- JavaScript
- Java
- Ruby
- HTML
- R
- C++
- C#
ChatGPT 是否值得用于编码?
请记住,ChatGPT 并不真正理解编码和编程语言,就像它不理解自然语言一样。
因此,虽然它非常有用,但不应完全依赖它。相反,在构建或编辑代码时,应将其作为工具包中的工具之一。
结论
ChatGPT 推出 18 个月以来,已在 100 多种语言中展现出强大的能力。它和其他大型语言模型帮助世界各地的人们克服了以前看似无法逾越的语言障碍。
话虽如此,ChatGPT 仍然以英语为中心。它是由一家美国公司开发的,重点是美式英语。尽管它在其他语言上表现出了一些惊人的技能,但它在英语方面的表现仍然最好。
尽管如此,随着时间的推移,ChatGPT 在非英语语言方面的技能几乎肯定会提高。
推荐使用GPT,国内可直接访问:https://www.chatgp4.com/