|
|
问AI · Anthropic研究如何用真实数据刷新AI就业影响认知?
) A4 S/ T. f7 I8 E8 M3 Q) G# F. M P/ N& c3 n J
7 N- u# Q- j9 l3 S" I+ R2 S; b8 M l6 |
3.30
( w, q" v& R) Z/ b! Y" b; {知识分子
! v0 ^: X' {' I3 u# T/ Z9 H8 L: [5 KThe Intellectual' z: y+ {7 ~: p: r3 F% v5 `0 o
' P3 ?4 g/ s- a8 @
7 E6 E3 \$ V- ?1 N, D) z5 A9 e
$ s# S# W, d4 P. T! l$ f图源:Unsplash / julien Tromeur9 I T( T- n1 [/ c, N' a! L) D
撰文|知识分子- Z0 Z \) J5 _
) Z, k$ Z5 |) n! d9 p% s3 u6 u" w
* F6 t* }7 F7 l: ]- ?$ `% L ● ● ● $ |5 x. ]: W# n
u, e6 q3 y0 K) j, ~) M
6 j7 M3 F' E q6 k8 B( @6 `1 h过去两年,关于人工智能是否会大规模取代人类工作、重塑劳动力市场的讨论几乎充斥了全球的媒体、学术和政策圈。预测、报告和热议层出不穷,但真正基于真实使用数据、可以量化 AI 对不同职业影响的研究却寥寥无几。
7 W/ n1 v2 s, {7 j2 n/ X7 {
I7 p8 G0 q# E7 J" S$ g; \/ Z: W4 W. D1 r
近日,美国人工智能公司 Anthropic 发布的Anthropic经济指数(Anthropic Economic Index)提供了一种全新的观察视角。Anthropic 是 OpenAI 之外全球最重要的大模型研发机构之一,旗下的Claude已经成为最著名的AI大模型之一,而且在AI编程方面影响力突出。2 G) D p' W) x" f6 e9 ~
+ _# R" t v X/ q/ W( C& {4 _& B! \1 `" d
过去关于 AI 与就业的研究,大多遵循一种相似的思路,先把一项职业拆解成许多具体任务,再根据任务描述,推断它们在多大程度上可能被 AI 替代。这种方法引出的很多结论实际上是建立在推断上,而不是来自真实的使用数据。0 {: V* K0 y8 V5 }) [, O7 }6 R( e
. Q! I. X( D$ c- R
. C. ]" c1 I$ r$ D# j2 S
但是作为最有影响力的AI公司,Anthropic 有着可靠的一手数据,研究者直接观察现实世界里人们是如何使用 AI 的。通过对 Claude大量使用数据进行整理,并与美国劳工部的 O*NET 职业数据库进行匹配,做出了全新的分析[1]。7 |( @. {4 t6 d2 @/ @+ w/ _& A$ z
% ^; K- [* @9 v. _. l1 G
# x) H, |! H' V. R研究团队没有只停留在AI能完成什么任务的能力评估上,他们试图进一步回答一个更现实的问题:这些理论上可以由大模型完成的任务,在真实的专业工作流程中,究竟有多少真的被AI接管了。' A& n7 b; g3 D+ y
: \/ [9 l* n& p/ Z) r* Z+ a
: D2 c' K$ u- ?" T
010 T$ ]+ U7 V2 V! Y; [9 a+ u
0 x3 f" ?8 U. C0 g( r i1 H6 W! g7 z+ y
8 a' N7 Q; t5 q* s& m5 w( QAI对当下就业的冲击没有达到预期
) ]/ @2 Q2 `0 p& B8 I; j8 s6 _& G
) j* g( S- I3 O0 h; ~. I
/ m9 A( x' i9 b$ y$ C0 a$ F; ^3 d) ?
从结果上看,这项研究发现,AI实际的应用远远没有达到理论估计的潜力。0 \4 q/ N! w+ A" c& i2 o3 B
$ g2 O3 f4 M) _; T. F
, L+ A c w/ b$ N5 S; b
下图蓝色的部分,是2023年由OpenAI研究人员在一项发表在SCIence的研究中做出的理论估计,在这份估计中,计算机和数学类职业理论上约 94% 的任务,都有可能被人工智能加速完成[2]。管理、商业金融、法律等等行业都是重灾区,这更符合我们对于AI带来就业危机的想象。
+ g" |! s7 `1 e. ]" B0 {1 p! a& `' b5 P/ c0 C+ k: A& E
5 \+ a8 n3 O5 ]" T8 E: v
但按照Anthropic研究的结论,AI实际的影响范围,只有初看这幅图时可能不会注意到的红色部分,Claude 目前只覆盖了计算机与数学类职业33%的任务,而这几乎是AI影响最大的一个领域了。
: X2 U' u7 [8 q6 y+ X; C5 U4 s6 a& R( L4 I7 H; z+ o
7 _5 E! o% U4 O& J5 _- k" u
大语言模型在理论上可以执行的工作任务占比(蓝色区域),以及研究者基于实际使用数据得出的岗位覆盖度指标(红色区域)
3 N9 Z+ g+ W, C& k! w. @; W' u( @" y; {& Z
( _7 P" V6 P; X" P# w
- g, y$ o# U/ @ I# r0 u
为什么这次得出的结论和过去差距很大?因为作者根据Claude的真实数据,进行了更详细的任务权重分配,并且在把工作拆解成任务之后,还用真实数据估测了每项任务的在工作中占据的时间。
; n/ s+ C" z# p
+ r. I) K8 I4 G& e0 a$ {
9 S' Z9 b" D; c7 A, ~ v. ]过去的研究很多只是简单计算了各个工作任务是不是能由AI替代,从而得出一项工作整体的AI替代情况。可是AI虽然能够替人完成工作中的很多内容,却往往处理不了一项工作中最重要、最费时的任务,这导致理论上的替代率和实际的使用情况相差极大。' o8 }) e2 B! r5 C
" J$ U- y* s2 b/ H9 ~9 _# x# h% e
这次,研究者从任务和时间两个层面入手来衡量职业对 AI 的“观察到的暴露度”(observed exposure)。具体方法是把一个职业里所有任务的 AI 暴露程度算出来,再根据这些任务在工作中占多少时间进行加权平均。 b, [3 u$ w A
" A+ m5 T/ H0 h
9 V& k9 T: W* L7 h5 Z+ Z
首先,研究团队统计了 Claude 中所有被分类为工作相关的任务,并利用已有方法将教育或个人用途的对话剔除,只留下工作场景下相关的内容。比如,用 AI 辅助讲解科学课程或提供健康建议,并不等同于自动化教师或护士的核心工作,因此不纳入统计。1 n/ m5 m; b; }+ z, k& Z
2 z4 S+ O. `- G9 [
' S2 A9 d# K6 F, g4 K. L2 p
接下来,作者将这些使用记录与职业数据库中的任务进行匹配。他们先识别出一批在能力上理论上可以被大模型加速的任务,例如撰写说明、总结资料、检索信息或对文本进行分类。这些都是大语言模型能够处理的信息型工作。
. d8 G5 x4 M" |8 C
7 ]& m0 I4 u7 m. X7 ~9 u
Q' Q* r4 H4 v5 }. S) g最后,研究者再利用大模型 API 的调用记录来观察这些任务在现实中的使用情况。当企业或软件系统通过接口调用模型时,会留下调用频率、提示词以及使用方式等信息。通过分析这些数据,研究者能够大致还原出 AI 在实际工作流程中的位置,并判断这些任务究竟是被自动完成,还是仅仅作为辅助工具使用。
9 F% l% }0 C1 p/ W0 K3 K0 \" L5 x1 a' b
; T0 d% i; E& v6 F* h) R: H在此基础上,研究团队进一步区分了两种不同的使用情境。
9 Y1 i( z0 p2 z% o& W" b' q; O% v3 w4 u2 a! w8 y5 }
& m; j( c, V& p+ u/ `, u4 c) J如果某项任务在 API 流量中表现出明显的自动化特征。例如,模型的输出会被系统直接接收并进入下一步流程,这种不需要人工介入的情况。研究者便将其视为完全自动化,并在统计中赋予 1 的权重。这意味着,这部分工作已经基本由机器承担。
1 t( D8 j& m! j# V9 ^* J: A" x7 d# U# r; G3 C1 z. H
" e( o$ y3 O8 P5 {8 F另一种更常见的情况,则是 AI 被当作辅助工具。例如生成报告初稿、总结资料,或提供若干备选方案,随后仍需要由人类进行筛选、修改和定稿。在这种人机协作的场景中,研究者将该任务记为 0.5 的权重。
8 c) f5 p! T* z! I' S
+ U: c) Y3 {8 U' ]4 U3 c& |6 s' h
至于每个任务在工作中占多长时间,这里研究团队用了独家数据,在去年年底的一项研究里,他们从 Claude中抽取了十万次真实对话,估算这些对话中有无 AI 辅助,以及每个任务所需时间。$ e" b, |2 d% m# F6 L! P0 }+ T* i
]# ^; Q5 X) \ t/ Y' y/ G8 ]( L' h
022 ]# @& h; H0 K \5 |
2 a: _) K; Q: w2 }4 M3 O
$ j' S. l1 W& b4 ]9 V9 o7 v, r# ^程序员才是最大AI受害者?
6 P# g; ^9 ^$ s1 k5 w5 d+ V# n# @. K7 d# y8 J9 @
7 ~; h6 C+ c* N! q
利用新的分析结果,研究团队重排了AI暴露最严重,也就是受影响最大的十个具体工种,这些职业大多数都是信息处理相关。3 |1 K9 a$ Z0 e: p/ T8 P) r6 ]3 e
. K& P; `, K+ b
- G2 U0 }# E ?* x7 i- e4 q! [
排在首位的是程序员,他们的日常工作中约有74.5%的任务可以被 AI 覆盖。其次是客服,这项工作是调用API,也就是自动化的比例最高的。数据录入员、医疗信息录入员,以及金融、市场分析师、信息安全分析师这种分析数据的工作,工作的内容很大程度上也会被替代。
1 `& W2 {7 o, ~5 ?7 Y
& }/ @8 h* t$ d0 ]* W2 C: O0 ?$ X6 B1 O! W" i8 Y! l
所有工作里,有30%完全没有AI暴露度,比如厨师、摩托车机械师、救生员、调酒师、洗碗工等等。这些工作的内容不太可能被AI替代,因为利用AI数据太少,它们甚至无法被有效统计。' E) s" S2 x0 l* q* U. [# S
. o) J7 d; t1 i& H$ k
% t$ q. ? h6 G- F% y
3 r+ }6 J. X# N: {
; T9 W6 S! H/ n2 U7 `
; K5 ~: V0 O8 S7 V, g( m- C, L工作内容被AI替代不一定直接等同于工作消失,但是工作的形态可能会发生变化。研究团队在今年年初的另一项研究中做了一项推演,他们尝试去掉那些可以被AI接管的任务,看看剩下的工作内容会是什么。需要注意的是,这个推演是比较理想化的,它更多反映了一种理论上的可能性,而非短期内必然发生的职业演化[3]。 k; N( @2 d, ]* |8 y
6 g+ X1 I4 I4 u0 R7 i2 b2 c: B! k7 d7 j2 N2 j" P8 f/ L
推演的结果是,对于许多白领职业而言,首要的影响是技能降级(deskilling),由于 AI 承担了原本需要高学历才能胜任的任务,这些工作的专业护城河正在崩坏。
- }( b! G( Y# Z& S. `% w' h! z9 m1 h/ y8 Y
& N1 X2 {6 U( Y5 a5 ~/ d
以技术写作这个职业为例,过去需要完成一些含金量高的任务,如“分析特定领域发展以确定修订需求”,通常需要 18.7 年的受教育背景。或者“审阅已发布材料并提出修改建议”,大约需要 16.4 年的教育。8 j* P* o1 s1 E" ^
0 G5 r' P9 M. c- I- H. D
* J0 R. q2 r/ z. J: e
当算法接管了这些脑力活后,留给人类的任务便退化成了“画草图说明材料”这类,它的门槛低多了,仅需 13 年左右的受教育年限。和过去相比,岗位整体技能水平明显下降,如果说以前需要的是大学生,现在高中生就能完成了。可以做这份工作的人多了,但是它的门槛也没了,薪资可能会受到冲击。) [+ Z" ]4 O$ }
* h. `# A9 Y% m/ Q" l
% d$ O( p) M4 ]. W* Y* V o; z
与之相反,部分职业可能经历技能升级(Upskilling),被迫走上高学历路线。房地产经理便是一个典型。当 AI 自动化处理了维护记录(12.8 年)和比对租金(12.6 年)等行政杂事后,剩下的工作内容反而向更高阶的谈判、贷款申请和利益相关者沟通集中。这种演化的结局是,职业门槛被进一步拉高,就业人数可能会减少,但留下的精英群体将获得更高的薪资溢价。" Z( T% C' H/ D3 R
3 d, y- V7 U, n' }( b$ m$ ~* o
+ @( V. K& E+ A
对高学历群体而言,他们从事的职业可能会向两极演变。要么像房地产经理那样,向高技能、高判断力任务集中实现升级,但代价是行业只能容纳一小部分精英。要么就像技术写作行业一样,向标准化、低技能靠拢,高学历群体只能眼睁睁看着自己多年寒窗苦读换来的专业技能,在算法的蚕食下失去价值。/ y6 A9 E% V% S0 M7 S3 k N
. q1 I$ W L% t7 Q5 o
s% v; H2 E& O: i; M03" T$ x1 `, V6 x" e
7 T( w6 j* ~7 P, v" a' ]( n
: g1 p& C s, R. R4 x- [
受冲击的工作没有消失,但是逐渐不招人了
6 j1 W% `0 A& J i& V( x& [& K2 d3 N( Q5 s% i
; o$ v* h9 i, I* }9 g( [
哪种工作,哪个人群最容易受到AI的冲击,也是讨论AI就业冲击的经久不衰话题。
, p6 r4 g$ z( e4 t' X/ i3 h5 B# Y3 J1 o& m ]2 \& O
' j2 } `0 k! Z/ |4 G' ]& D, O在分析中,研究者根据各职业的“观察到的暴露度”(observed exposure)对所有职业进行了排序,并按暴露程度划分为四个等份。其中,暴露度最高的 25% 职业被归为“高暴露”群体,而暴露度最低的 25% 职业则被视为“低暴露”或“未暴露”群体。
1 r5 A2 |( D# w' s" V6 v
4 ^/ [: Q' E4 ^9 y, v
9 Z3 l, J4 ~) ]按照这一划分方式,一些计算机与数学类、商业与金融类、办公室与行政支持类以及销售类职业往往出现在暴露度较高的区间,因为这些岗位包含大量可以被 AI 辅助或自动化完成的信息处理任务。相反,一些需要现场操作或体力劳动的职业,例如厨师、机械维修工、救生员、酒吧服务员或洗碗工则几乎没有出现在 AI 使用数据中,因此被归入暴露度最低的区间。8 a! d* ]: B5 t' }! ~/ O4 }
+ ?( g1 q' W+ D+ }, F1 w
4 D& Q/ Z) V$ Y
AI高暴露的职业,往往是传统上我们印象中的办公室工作,或者说白领、知识性的工作。这些劳动者普遍拥有着高学历,女性、亚裔的比例也更高。
8 h) ?) J1 Y2 K7 z$ t6 a
, C- j4 e p* ]- f7 |6 H2 J- H6 N% z! R- I# S- ~) Z
统计显示,在 AI 暴露度最高的职业中,女性比例比低暴露职业高出约 16 个百分点。同时,这些职业中的劳动者通常具有更高的教育水平和更高的收入。例如,拥有研究生学历的比例在高暴露职业中达到 17.4%,而在低暴露职业中仅为 4.5%。. E7 R/ `7 V# C2 _, s" y
0 z4 `9 H/ ]7 `5 I
) D, y# ]3 E# r9 q从总体就业角度看,目前仍没有明显证据表明人工智能已经导致失业率上升。自 ChatGPT 在 2022 年末发布以来,美国劳动力市场中那些 AI 暴露程度最高的职业群体,其失业率变化与其他职业群体基本相同。这意味着,至少在目前阶段,人工智能尚未引发大规模的就业冲击。
4 U" m5 F% ?5 i& V1 U7 e8 R; W+ g. A! |
! u ^! v! c$ X( X4 r# Q6 H. i& r/ H9 }0 |5 `! q
但暴露度最高的职业,未来就业的增长可能有着温水煮青蛙的风险。美国劳工部下属的 U.S. Bureau of Labor Statistics 定期发布的职业就业预测显示,将职业 AI 覆盖率与 2024—2034 年的就业增长预测进行比较后可以发现,覆盖率每增加 10 个百分点,对应的就业增长预测平均下降约 0.6 个百分点。
6 t) @$ V. ^9 P* Y- W% u" d. G4 Q! h- ^7 D8 `! N
+ u' w3 b, n* L" M, r2 N
虽然幅度看似不大,但在长期累积下,这意味着 AI 使用最密集的职业,未来扩张空间会持续受到压制。换句话说,那些以信息处理为主的白领岗位,虽然还没直接面临裁员的危机,但就业前景可能会缓慢收紧。9 ~$ J! P3 L9 O7 B
# Q0 V' U2 t- {" y0 L
3 U( V: y4 L) P3 s
另外,失业率维持平稳背后可能隐藏着一个统计上陷阱。一个人得先有一份工作,才有资格在丢掉它时被计入失业统计。对于那群刚走出校门,简历还没投出去,就撞上行业大门紧闭的年轻人来说,他们甚至连在统计系统里获得一个职业标签的机会都没有。6 O% }1 d( R! i1 w
5 [7 s9 `. \) S d' X
; ^( o: T3 z7 U2 Q1 O数据细节显示,如今低暴露职业的月均入职率稳定在 2% 左右,而进入高暴露职业的入职率则下降了约 0.5 个百分点。. l( \* J; t& G
+ l1 o8 H* r" T$ X, }, c
7 G/ }; x- J) |2 }; }6 e更直白的数据是,与 2022 年相比,ChatGPT 发布后高暴露职业的入职率平均下降了 14%,尽管这个变化在统计上还不够显著。值得注意的是,这种招聘放缓的现象在 25 岁以上的劳动者群体中并未出现。
* P, a) ]$ n: V8 t
( Y7 D- d& D: @" E0 _$ S0 G* n1 m1 f) H9 q
原本以为 AI 带来的就业危机会是一场大规模的裁员,将人扫地出门。可现实却是,它并没有急着赶走屋子里的人,而是把本就对年轻人敞开程度有限的职场大门,关得更紧了。
3 x) U' c, ]7 w3 n8 J
( y" | A% m6 w+ J3 E, F3 V
) ^) A6 `* V ?. A$ v
参考资料:0 r& _- ~6 {; T0 b) y0 r C0 ^
[1] Anthropic. (2026, March 5).Labor market impacts of AI: A new measure and early evidence. Anthropic.
! P$ L9 \# N& e* ^5 _0 D3 u) }[2] Eloundou, T., Manning, S., Mishkin, P., & Rock, D. (2023).GPTs are GPTs: An early look at the labor market impact potential of large language models. Science.
( [5 n: z* ?2 S9 p, Y1 z[3] Appel, R., Massenkoff, M., McCrory, P., McCain, M., Heller, R., Neylon, T., & Tamkin, A. (2026, January 15).Anthropic Economic Index report: January 2026. Anthropic. |
|