ChatGPT怎么用,才能发挥最大功能? |ChatGPT使用须知8件事
GPT-4有何优势与限制?如何发挥ChatGPT的能力?
ChatGPT-4和前一代有何不同?它又有哪些优势和限制?
政治大学应用数学系副教授兼学务长蔡炎龙回应,目前看来,OpenAI训练GPT-4和GPT-3在文字上应是运用相同的训练资料——GPT-3(ChatGPT)大概「看」了正常人要花超过9,000辈子才能看完的资讯;也就是说,一般人读过的资讯数量远远不及GPT-4读过的。因此,GPT-4和GPT-3都比你我知道更多资讯。
蔡炎龙也说,相比两者可阅读的字数,GPT-4能一次看超过2.5万个字,比GPT-3约只能看2,048个字好非常多。
- GPT-3:以GPT-3(更严格说是GPT-3.5)为底的ChatGPT,一次不能看那么多字,长一点的文章,要它作摘要就做得没那么好,写一个报告前后风格有时会有差异,讨论事情有时方向也会突然有点改变等等。这主要都是因为GPT-3能看的字数限制。
- GPT-4: GPT-4是用一种叫transformers的架构,我们可以想成是「看完前面若干字,再预测下一个字」的模型。前面提到,GPT-3一次输入是2,048个字,所以大概最多看前面两千多个字,再合理预测下一个字是什么。而GPT-4只是用神经网路的原理训练后,计算出文句;只是它真的看过太多资讯,所以可以推出好像非常合理的文句;但是它没有意识、没有情绪,单纯是经训练后算出来的,而非基于事实。
蔡炎龙举例,如果是一个名人,GPT-4可能生成的文字会合理一点;但若不是名人,比方说请GPT-4介绍「政治大学应用数学系的蔡炎龙老师」,它会知道政大是在台湾的一所大学,但因关于蔡炎龙的资讯太少,他就会依是应用数学系的老师,「合理」推出一堆文句通顺但并非事实的文句。
GPT-4有何优势与限制?如何发挥ChatGPT的能力?
ChatGPT-4和前一代有何不同?它又有哪些优势和限制?
政治大学应用数学系副教授兼学务长蔡炎龙回应,目前看来,OpenAI训练GPT-4和GPT-3在文字上应是运用相同的训练资料——GPT-3(ChatGPT)大概「看」了正常人要花超过9,000辈子才能看完的资讯;也就是说,一般人读过的资讯数量远远不及GPT-4读过的。因此,GPT-4和GPT-3都比你我知道更多资讯。
蔡炎龙也说,相比两者可阅读的字数,GPT-4能一次看超过2.5万个字,比GPT-3约只能看2,048个字好非常多。
- GPT-3:以GPT-3(更严格说是GPT-3.5)为底的ChatGPT,一次不能看那么多字,长一点的文章,要它作摘要就做得没那么好,写一个报告前后风格有时会有差异,讨论事情有时方向也会突然有点改变等等。这主要都是因为GPT-3能看的字数限制。
- GPT-4: GPT-4是用一种叫transformers的架构,我们可以想成是「看完前面若干字,再预测下一个字」的模型。前面提到,GPT-3一次输入是2,048个字,所以大概最多看前面两千多个字,再合理预测下一个字是什么。而GPT-4只是用神经网路的原理训练后,计算出文句;只是它真的看过太多资讯,所以可以推出好像非常合理的文句;但是它没有意识、没有情绪,单纯是经训练后算出来的,而非基于事实。
蔡炎龙举例,如果是一个名人,GPT-4可能生成的文字会合理一点;但若不是名人,比方说请GPT-4介绍「政治大学应用数学系的蔡炎龙老师」,它会知道政大是在台湾的一所大学,但因关于蔡炎龙的资讯太少,他就会依是应用数学系的老师,「合理」推出一堆文句通顺但并非事实的文句。
目前,想改善这样的问题是困难的。
微软(Microsoft)Bing使用的方法是让ChatGPT有搜寻的能力,这是其中一个改善的部份。更合理的方法是,既然GPT-4最大特点不是说出完全符合真实情况的东西,那为何不由使用者提供呢?
蔡炎龙认为,使用者已发现,如果提供基本资讯,ChatGPT就会生成相当好的文章;很多专家也发现,我们可以和ChatGPT「讨论」一些概念,ChatGPT有时说的部份是错的,你可以纠正它,它就会产生更好的文字。微软执行长纳德拉(Satya Nadella)用了一个很精确的词,那就是GPT-4这类的模型,是我们的「对话型智慧代理人」(conversational intelligent agents);代理人的意思是,它功能有多好,其实是人类的责任——也就是你越会用它,它就能发挥越多的功能。
ChatGPT是怎么演进的?
GPT-4是由GPT、GPT-2、GPT-3逐渐演化而来的。
台湾师范大学图书资讯学研究所特聘教授曾元显说明,GPT是Generative Pre-trained Transformer(生成式预训练转换器)的简称;其中,「生成式」代表它可生成文字做为输出的资讯,预训练代表它经过大量资料的事先训练,转换器Transformer则是人工神经网路的一种架构,可以接受一段文字做为输入,将其转换成一串数值向量,使得类似的概念,有相似的向量,再进而生成相同主题的文字。
继2017年Transformer被提出来后,OpenAI公司基于Transformer的神经网路架构以及预测下个字的训练方式,于2018年六月提出GPT模型。由于成效良好,OpenAI公司将模型加大,于2019年二月提出可以根据人工撰写的前导文输出完整文章的GPT-2,2020年五月提出更大型且可依照前导文指示完成多项任务的GPT -3。
虽然GPT-3在语言理解与生成方面已属不凡,但其生成的内容不见得非常符合使用者的意图;因此,OpenAI遂在2022年一月发表更能符合使用任务的InstructGPT(GPT-3.5) ,并于2022年11月底提出可跟使用者对话、并依照指示生成回应的ChatGPT,近期则在2023年三月发表除了接受文字指示外也能接受图片做为输入的GPT-4模型。
GPT系列的模型越来越大,训练资料也越来越多,接受的输入资讯也越来越长。从一开始GPT只使用到数千万个参数,GPT-2使用15亿个参数,到GPT-3使用到1,750亿个参数,但OpenAI并没有透露GPT-4的模型大小,推测应该不会比GPT-3更大(因为更大需要更久的推论和执行时间),但可能用更多资料训练得更久(因为Meta AI的研究指出,较GPT-3小的模型用更多训练资料、训练更久,可以得到跟GPT-3类似甚至超越的成效)。
因此,GPT-4有几项优势:
- 阅读更多文字: GPT-4可以接受更长的输入,最长到32K(差不多53页的文字),比GPT-3长16倍,亦即可以理解更长的文章,回应出更长的文字。
- 文字理解与生成能力更好: GPT-4的文字理解及生成能力提升,特别是在专业与学术领域,比GPT-3更强。例如,GPT-4在模拟的律师考试方面,其成绩已达前10%的程度,而GPT-3仅能达到后10%的程度。
- 文字、图片都接受: GPT-4除可以接受文字输入,也可同时接受图片输入,理解后再以文字回应。而GPT-3仅能做到文字输入与文字输出。
- 可操纵性更高: GPT-4更具可操纵性(steerability),亦即比前一代更易于有效的规范GPT-4回应的风格与定义GPT-4的任务。
然而,GPT-4的限制跟其前一代一样,仍旧会有无中生有、推理错误、各种偏见(如性别、种族、职业等偏见)、不理解训练资料之后发生的事物(训练资料只到2021年9月的网路资料)。因此,在高风险的任务上,使用仍须小心,必须尽力求证。尽管如此,GPT-4回应出事实的能力比其前一代高出40%。
ChatGPT4解读图像的原理是什么?
中央大学资讯电机学院资讯工程学系教授蔡宗翰解析,GPT-4是目前为止最强大的语言模型之一,它的优势在于,GPT-4现在使用更多的训练资料和计算资源,能够更准确地回答问题和生成文字,并减少语言偏见的影响。
此外,GPT-4透过学习大量的文字和图像资料,获得更高的创造力和想像力,能生成更有趣和独特的文字和图像描述。它也具备解读图片的能力,可以从图像中发掘关键资讯并生成相关的文字描述。
值得注意的是,GPT-4需大量计算资源才能运行和训练,会消耗大量的能源,因此在某些设备上可能会难以实现。此外,即使GPT-4的准确性比之前的版本更高,仍可能出现一些错误,使用时需格外小心,并且进一步确认。