OpenAI重磅研究:ChatGPT可能影响80%工作岗位,收入越高影响越大
ChatGPT 的影响遍及所有收入阶层,高收入工作可能面临更大的风险。
随着 ChatGPT 的到来,失业是否已不再遥远?上周,当 GPT-4 发布时,ChatGPT 迅速上线了新版本。OpenAI 首席执行官 Sam Altman 表示,他对此技术“有些害怕”。和许多专家一样,Altman 对于人工智能技术的强大能力可能导致虚假信息泛滥深感担忧,同时,他也认为新技术将改变经济、劳动力市场和教育环境。
有趣的是,有人开玩笑说,Sam Altman 每天都背着一个装有紧急关闭 AI 的红色按钮的包。之前,AI作画已经让许多艺术家感到工作可能被取代。最近,OpenAI 研究人员提交的一份报告引发了广泛讨论,研究表明,ChatGPT 及基于该程序的未来应用可能影响美国约 19% 的工作岗位,并对其至少 50% 的工作任务产生影响。
同时,约 80% 的美国劳动力中,至少有 10% 的工作任务在某种程度上会受到 ChatGPT 的影响。
该研究分析显示,像 GPT-4 这样的 大型语言模型(LLM)影响可能是普遍存在的。此外,收入较高的工作——其许多任务需要基于软件的操作——更可能受到人工智能聊天机器人的潜在影响。
在职业影响方面,受影响最大的职业包括翻译、作家、记者、数学家、财务工作者及区块链工程师等。
研究还对各行业的 ChatGPT 影响进行了细分。数据处理、出版等行业最容易受到影响,而体力劳动占比较大的行业,如食品、林业和社会援助等,受到的潜在影响相对较小。
OpenAI 研究了美国超过 1000 个职业,并为这些职业所需完成的任务贴上标签。研究人员使用人工注释和 GPT-4 模型评估访问由 ChatGPT 驱动的系统是否能够减少人类执行特定任务所需的时间至少 50%。
让我们来看一下这项研究的具体内容:
#### 研究介绍
OpenAI 本次调查了 GPT 模型及相关技术对美国劳动力市场的潜在影响。他们通过衡量不同职业与 GPT 能力的匹配程度进行评估,研究结果显示,大约 80% 的美国劳动力中的工作任务将受 GPT 影响,而大约 19% 的员工可能会看到其工作任务中至少 50% 的部分受到影响。这种影响波及各个收入阶层,其中高收入工作面临更大的风险,且这一影响不仅限于生产效率高的行业。
通过分析,研究发现,像 GPT-4 这样的大型语言模型的影响可能是普遍的。随着时间推移,LLM 的能力不断增强,即使目前开发者停止了新模型的研究,它们依然会对经济产生深远的影响。因此,LLM 的潜在影响在考虑到互补技术的发展后,将显著扩大,这显示出 GPT 正逐渐走向普遍化。
为了解释这些影响,研究还提出了一个新的标准,用于理解 LLM 的能力以及它们对工作潜在影响的总暴露程度。
研究使用了 O*NET 27.2 数据集(O*NET, 2023),该数据集包含 1016 个职业的信息,并且数据集中包括从美国劳工统计局获得的 2020-2021 年的就业和工资数据。这些数据涵盖职业头衔以及各种职业的从业人数。
在方法上,研究采用了 exposure rubric 来展示结果,定义为访问 GPT 或 GPT 驱动的系统是否能够将人类执行特定任务所需时间减少至少 50%(注:DWA 全称 Detailed Work Activities,即完成任务所需的具体行为,例如,对于计算机系统工程师,其 DWA 包括监控电脑系统性能、确保正常运行等)。
研究对每个 O*NET 数据集中的 DWA 和所有 O*NET 任务进行了人工注释,并在任务和职业层面汇总了这些得分。为了确保注释质量,研究对大量任务和 DWA 样本进行了标记,并招募经验丰富的人工注释员,广泛审查了 GPT 的输出结果。
以下表格为人类与 GPT-4 一致性比较的皮尔逊相关系数。一致性分数是通过观察两组人在注释上的一致率来确定的。
该研究为感兴趣的因变量构建了三个主要度量:(i) 𝛼,对应于 exposure rubric 中的 E1;(ii) 𝛽,是 E1 和 0.5*E2 的总和;(iii) 𝜁,代表 E1 和 E2 的总和。该研究在表 2 中总结了注释组与度量之间的一致性。
#### 研究结果
OpenAI 的这项研究以 GPT 模型对经济的普遍影响为假设,以下是具体的研究结果。
表 3 显示了人类和 GPT-4 模型的总体 exposure 数据。人类与 GPT-4 的数据表明,平均职业级 𝛼 值介于 0.14 和 0.15 之间,表明中等职业的约 15% 的任务直接受到 GPT 的影响。对于 𝛽,该比例上升至 30% 以上,而对于 𝜁,该比例则超过 50%。
根据 𝛽 值,该研究估计约 80% 的人群至少有一项工作任务受 GPT 影响,而 19% 的人所从事的职业中,超过一半的工作任务受到了影响。
#### 工资与就业
下图 3 描绘了 GPT 模型对经济整体的影响,而下图 4 则体现了工作薪资与接触使用 GPT 等语言模型的关系。
研究进一步探讨了 GPT 模型在不同职业分类中的影响,包括 O*NET 数据库中的五个 Job Zone。Job Zone 1 的工作入职要求最低,而 Job Zone 5 则要求最高。
总体而言,该研究发现,工作对科学方法和批判性思维的依赖程度与接触 LLM 的使用呈负相关,而编程和写作技能则与 LLM 使用呈正相关。
不过,该研究也承认,试图通过简单标签描述工作任务及代表每个职业存在固有偏见,并可能忽略一些特有技能或任务。当然,GPT 模型目前仍存在许多缺陷,包括生成虚假信息,这让人工监督工作变得尤为重要。
大模型的广泛应用或许意味着许多人将失去工作,但 OpenAI 首席执行官 Sam Altman 认为,这同样提供了找到更好工作的机会。他表示:“我们可以享有更高的生活质量,同时,人们需要时间来适应、更新和响应这一新技术。”
### 见解
ChatGPT 的推出不仅是技术创新的表现,也深刻影响了劳动市场的结构。尽管其带来的高效性与便捷性为我们提供了更高的生产力,但确实也形成了对某些职业的威胁。对于从业者而言,重要的是不断提升自我技能,以应对随之而来的技术变革。同时,社会各界应关注如何在推广新技术的同时,减轻对弱势群体的冲击,以保障经济的健康稳定发展。