GPT-4o与Claude3.5实测:优缺点各在哪?
Anthropic 20日推出最新AI版本Claude 3.5,声称能打败OpenAI备受关注的GPT-4o!对一般使用者而言,Claude 3.5和ChatGPT-4o,谁才是AI界的实用王者?本文精选5个日常AI应用情境,包括对这类欧美大模型来说,挑战难度颇高的台语理解。这两项工具到底最后差别与优缺点各在哪?谁在两项中胜出,其余平手?
如何使用Claude 3.5?
目前Claude 3.5已开放免费体验,付费用户则可拥有更高的使用额度。进入Claude网站并登入后,直接输入问题即可使用最新的Claude 3.5模型。
Claude 3.5已开放免费使用。截取自Claude
如何使用ChatGPT-4o?
ChatGPT-4o也可免费使用,付费用户同样享有比免费用户更高的使用额度。在ChatGPT使用介面的左上角,选择最新模型GPT-4o后,便能开始使用。
ChatGPT-4o也可免费使用。截取自ChatGPT
Claude 3.5 vs. GPT-4o 实测1:发想创意料理
想在下厨时获得一些创意料理灵感,可以问问AI。要求两款AI将台湾特色料理和芒果结合,设计创意套餐。两者提供的菜单皆有符合要求,不过Claude的说明较详细,菜色也较有创意。
实测Claude 3.5发想创意料理。截取自Claude
实测GPT-4o发想创意料理。截取自ChatGPT
Claude 3.5 vs. GPT-4o 实测2:生成文章
要求两款AI以「未来世界的人类与AI合作」为主题,写一篇文章。结果发现,两款AI生成的文章结构和内容类似,皆是以列点方式讨论此主题的不同面向,包括教育、工作和环境领域的讨论等。
实测Claude 3.5生成文章。截取自Claude
在这里可以看到ChatGPT生成的全文。
实测GPT-4o生成文章。截取自ChatGPT
Claude 3.5 vs. GPT-4o 实测3:担任营养师
AI也可以成为个人专属的营养师!上传一张午餐的照片,要求两款AI辨识图中的食物,分析各类营养摄取是否足够,并提供一些饮食建议。结果发现,两款AI皆能大致正确辨识出照片中的食物种类,提供的建议也合理完整。
实测Claude 3.5扮演营养师,提供饮食建议。截取自Claude
实测GPT-4o扮演营养师,提供饮食建议。截取自ChatGPT
Claude 3.5 vs. GPT-4o 实测4:用Python做小游戏
为测试AI撰写程式码的能力,要求两款AI用Python制作简单的横向卷轴游戏,规则包括跳过障碍物和吃掉宝物。将两者生成的程式码复制进Visual Studio Code之后,皆能顺利执行,不过Claude还多了计分版的设计。
实测Claude 3.5制作python小游戏。截取自Claude
Claude 3.5 vs. GPT-4o 实测5:翻译台语
英文翻译可说是AI的强项,但如果是请AI翻译台语呢?记者输入了郑宜农的台语歌曲〈新世纪的女儿〉中的一段歌词,并请两款AI翻译成华文。结果发现,两者都能理解台语歌词的含义,不过Claude的翻译有经过改写、ChatGPT则是逐字翻译。
实测Claude 3.5翻译台语歌词。截取自Claude
实测GPT-4o翻译台语歌词。截取自ChatGPT
Claude 3.5 vs. GPT-4o 最终比较:两者优缺点各在哪?
以下表格为本次实测五项功能中,Claude 3.5 和GPT-4o 的优缺点比较。请注意,此表格仅为本次实测结果分析,实际表现可能因指令差异或模型更新而有所不同。
Claude 3.5 | GPT-4 | |
发想创意料理 | 能符合要求,菜色较有创意【胜】 | 能符合要求 |
生成文章 | 文章切合主题、结构完整(平手) | |
担任营养师 | 能大致正确辨识食物、建议合理(平手) | |
用python做小游戏 | 能顺利生成可执行游戏的程式码,较为完整【胜】 | 能顺利生成可执行游戏的程式码 |
翻译台语 | 正确大意翻译(平手) | 正确逐字翻译(平手) |
好啦,今天就到这里,如果你也想在体验ChatGPT4.0
具有GPT4对话、DALL·E3绘画、GPT4V看图助手。
可以点击下方红色链接进行使用。