|
|
问AI · Anthropic研究如何用真实数据刷新AI就业影响认知?
, T: h- b* E4 A. B2 w0 u
: z: W9 c& X& ]& R6 J" c! ^0 j2 e% @
( b! M7 f+ n3 B0 |" C
3.300 ]: F: U8 |: t `3 r* u& }8 [
知识分子9 ^- B O2 _0 q
The Intellectual0 n. T) b) p' v" V8 A( `! T
% S, d7 J; {8 n0 [) W+ d
, `! u0 z6 n5 K$ ]
( I" @3 f& U3 @' B% b- Y; y; I, P图源:Unsplash / julien Tromeur0 {1 R# G( Z1 k- M: [
撰文|知识分子) X3 E: G7 k. a# E) u5 X+ w* R& U
/ P. W* K4 b: A1 e9 l8 I1 e( X, F. e7 R: Q9 ^& S" U2 d5 O8 A* z% Q
● ● ● ) b- a& t* X% @
: N: S8 d3 Q0 K
+ ~: P( u) k2 d1 t过去两年,关于人工智能是否会大规模取代人类工作、重塑劳动力市场的讨论几乎充斥了全球的媒体、学术和政策圈。预测、报告和热议层出不穷,但真正基于真实使用数据、可以量化 AI 对不同职业影响的研究却寥寥无几。7 |# K6 t6 G; M$ Z1 z& F+ }
6 M; U- f: J% T5 C
, `5 @. m) v4 T- Y2 \9 H6 J) v近日,美国人工智能公司 Anthropic 发布的Anthropic经济指数(Anthropic Economic Index)提供了一种全新的观察视角。Anthropic 是 OpenAI 之外全球最重要的大模型研发机构之一,旗下的Claude已经成为最著名的AI大模型之一,而且在AI编程方面影响力突出。
. s6 k# ]3 k7 a. h
6 [% W3 Y x- E4 a! W3 l1 M7 m" C9 e7 Y+ x, ~7 v
过去关于 AI 与就业的研究,大多遵循一种相似的思路,先把一项职业拆解成许多具体任务,再根据任务描述,推断它们在多大程度上可能被 AI 替代。这种方法引出的很多结论实际上是建立在推断上,而不是来自真实的使用数据。- w7 \3 _+ U1 F
h3 y9 c5 V. Q9 E: B. k
0 D4 E4 K5 s: w2 l) d( e4 i
但是作为最有影响力的AI公司,Anthropic 有着可靠的一手数据,研究者直接观察现实世界里人们是如何使用 AI 的。通过对 Claude大量使用数据进行整理,并与美国劳工部的 O*NET 职业数据库进行匹配,做出了全新的分析[1]。2 o) X: `3 X) l, |7 Q) L! g
9 j6 B% S' ?' t8 `3 E0 }
1 ~, a+ ?' b. U4 S: j4 L0 O. d/ o研究团队没有只停留在AI能完成什么任务的能力评估上,他们试图进一步回答一个更现实的问题:这些理论上可以由大模型完成的任务,在真实的专业工作流程中,究竟有多少真的被AI接管了。
' n) y& P. v' M2 }
% f& F- Z2 L$ r/ j$ n3 C$ P# L; ^8 X1 K9 D
01
5 r/ G% E( w4 T, M# B4 o; Q& _7 u
' u# o$ v& V- J% d: T5 t- O6 l7 s& O# P, \' Y/ S8 c4 O8 T
AI对当下就业的冲击没有达到预期3 T7 ^- Z$ g0 N6 O) q
$ R! g" y$ w( s" p4 q0 H! s
8 _( n: q/ x- I8 r) O) R
, }- ]8 B7 `. k8 b8 ^
从结果上看,这项研究发现,AI实际的应用远远没有达到理论估计的潜力。
8 ~; {! K( K3 N6 E/ H1 D: P$ e2 n
$ i5 @: ?7 o- E! G6 x9 T' J: V下图蓝色的部分,是2023年由OpenAI研究人员在一项发表在SCIence的研究中做出的理论估计,在这份估计中,计算机和数学类职业理论上约 94% 的任务,都有可能被人工智能加速完成[2]。管理、商业金融、法律等等行业都是重灾区,这更符合我们对于AI带来就业危机的想象。
7 _5 W6 h6 J; y" T0 w4 P
! L/ {, `2 E: a
|6 z' K; r* K* \. K! l& L但按照Anthropic研究的结论,AI实际的影响范围,只有初看这幅图时可能不会注意到的红色部分,Claude 目前只覆盖了计算机与数学类职业33%的任务,而这几乎是AI影响最大的一个领域了。$ g- k' }; z2 d, h z
5 M R- e; \ C3 s& B6 l: M7 O2 {. S1 j
2 x& u2 _8 C4 y+ G* u. u$ X
大语言模型在理论上可以执行的工作任务占比(蓝色区域),以及研究者基于实际使用数据得出的岗位覆盖度指标(红色区域) 7 W0 n. @9 z$ ]4 c9 t7 D) L
9 d; R( i2 D! `4 f) o5 }% v9 O( G8 |( d3 e
0 ], G1 I& E; @+ t/ S5 x, W' S
为什么这次得出的结论和过去差距很大?因为作者根据Claude的真实数据,进行了更详细的任务权重分配,并且在把工作拆解成任务之后,还用真实数据估测了每项任务的在工作中占据的时间。 `' n( E; h' T% p: a; ?
/ c5 P% ?( }! O5 q8 C: N
3 W" m- L! j$ X K过去的研究很多只是简单计算了各个工作任务是不是能由AI替代,从而得出一项工作整体的AI替代情况。可是AI虽然能够替人完成工作中的很多内容,却往往处理不了一项工作中最重要、最费时的任务,这导致理论上的替代率和实际的使用情况相差极大。
- W! d4 S0 X: b' X7 s2 i$ h. ^) Q" \7 ?
2 [6 {5 W8 {, h5 ^这次,研究者从任务和时间两个层面入手来衡量职业对 AI 的“观察到的暴露度”(observed exposure)。具体方法是把一个职业里所有任务的 AI 暴露程度算出来,再根据这些任务在工作中占多少时间进行加权平均。
\, R( p6 R2 X7 |# `3 Z) A
0 Z1 d, Q$ @6 R6 j v9 k( F5 M
$ o; `+ N6 \8 x$ q6 F3 ~/ ?首先,研究团队统计了 Claude 中所有被分类为工作相关的任务,并利用已有方法将教育或个人用途的对话剔除,只留下工作场景下相关的内容。比如,用 AI 辅助讲解科学课程或提供健康建议,并不等同于自动化教师或护士的核心工作,因此不纳入统计。2 D2 r2 N4 }' Y; ?( S f
/ ?9 d6 Q; M8 w3 Y5 ^
/ F7 X$ \7 D3 R' \& b接下来,作者将这些使用记录与职业数据库中的任务进行匹配。他们先识别出一批在能力上理论上可以被大模型加速的任务,例如撰写说明、总结资料、检索信息或对文本进行分类。这些都是大语言模型能够处理的信息型工作。, X/ h8 X! J: j* T8 ?8 i8 A9 ^
5 G# {: o/ z9 F% e7 |+ s9 a9 Y' {
% q( n9 Q- T; B4 M' {1 f% ]1 [- s最后,研究者再利用大模型 API 的调用记录来观察这些任务在现实中的使用情况。当企业或软件系统通过接口调用模型时,会留下调用频率、提示词以及使用方式等信息。通过分析这些数据,研究者能够大致还原出 AI 在实际工作流程中的位置,并判断这些任务究竟是被自动完成,还是仅仅作为辅助工具使用。& D- r- B" Q, Z+ f5 N
3 F2 H# A# y+ ^! V% K5 ?3 Q* o
: d* [6 U F t# {在此基础上,研究团队进一步区分了两种不同的使用情境。) j1 E: h/ B. ^. m# Q
1 m- R' H |6 X( I, P
* Q; _; \# L' c+ K) [
如果某项任务在 API 流量中表现出明显的自动化特征。例如,模型的输出会被系统直接接收并进入下一步流程,这种不需要人工介入的情况。研究者便将其视为完全自动化,并在统计中赋予 1 的权重。这意味着,这部分工作已经基本由机器承担。
" d: z( A& u8 G2 o1 R
. R9 Y' E7 i C9 ^) Y+ ]4 f* k) E, r( J
另一种更常见的情况,则是 AI 被当作辅助工具。例如生成报告初稿、总结资料,或提供若干备选方案,随后仍需要由人类进行筛选、修改和定稿。在这种人机协作的场景中,研究者将该任务记为 0.5 的权重。* V& e9 o5 U& k, ^
& o; T6 O1 d. A0 I
2 w3 P- q3 Q) j/ o至于每个任务在工作中占多长时间,这里研究团队用了独家数据,在去年年底的一项研究里,他们从 Claude中抽取了十万次真实对话,估算这些对话中有无 AI 辅助,以及每个任务所需时间。) J$ q& |, v" z; @
5 W5 z4 z) p# U1 f3 O5 s
* d/ O$ x+ j1 q+ Z+ R" h: _
02
' @' l, r; \$ o, i1 a4 \
! }8 J$ z6 v, B. I% W" P k' t! Y- X7 h1 o3 r
程序员才是最大AI受害者?
- d! B/ d9 f+ b+ ?, B+ }1 p& `( P$ S7 A8 o9 U
4 M l, V4 Y: S- O
利用新的分析结果,研究团队重排了AI暴露最严重,也就是受影响最大的十个具体工种,这些职业大多数都是信息处理相关。
2 A; O/ R+ y7 g! Q9 R* y8 u2 b! {. v* v& F
) ?! S' q; O5 t& x z1 q排在首位的是程序员,他们的日常工作中约有74.5%的任务可以被 AI 覆盖。其次是客服,这项工作是调用API,也就是自动化的比例最高的。数据录入员、医疗信息录入员,以及金融、市场分析师、信息安全分析师这种分析数据的工作,工作的内容很大程度上也会被替代。
: ~: n( Z1 j" I `9 `( m7 W. x, z; ~+ d/ U' G" Z: W0 Y$ H
7 \" w9 H, R) u" d3 X所有工作里,有30%完全没有AI暴露度,比如厨师、摩托车机械师、救生员、调酒师、洗碗工等等。这些工作的内容不太可能被AI替代,因为利用AI数据太少,它们甚至无法被有效统计。
) ?0 d+ }# x: c( b$ z
! G4 [5 ?4 Q- R) |, q2 @ s1 O1 C9 i7 \0 g+ G
/ d* y( W- C( k2 |5 F3 I: q% o M3 z/ n% S1 i3 m' @$ o Q
1 \% C$ G0 s2 |! z; P
工作内容被AI替代不一定直接等同于工作消失,但是工作的形态可能会发生变化。研究团队在今年年初的另一项研究中做了一项推演,他们尝试去掉那些可以被AI接管的任务,看看剩下的工作内容会是什么。需要注意的是,这个推演是比较理想化的,它更多反映了一种理论上的可能性,而非短期内必然发生的职业演化[3]。
" ?' Y/ [; a$ T9 I! T7 p, G3 l$ P; e( F2 M9 g# I$ H' X
$ G8 v" p" ^: h8 v" {) z0 u
推演的结果是,对于许多白领职业而言,首要的影响是技能降级(deskilling),由于 AI 承担了原本需要高学历才能胜任的任务,这些工作的专业护城河正在崩坏。. p& z# G- A, S# I
9 ]1 b/ t2 U. n0 `0 e# w
: p( l3 X* H# }- E) c* P& ]以技术写作这个职业为例,过去需要完成一些含金量高的任务,如“分析特定领域发展以确定修订需求”,通常需要 18.7 年的受教育背景。或者“审阅已发布材料并提出修改建议”,大约需要 16.4 年的教育。
8 s% n" C- M0 e0 b9 f8 D* [( S. x, k& d9 c6 C- U
1 X" L6 _/ ?$ h9 W8 [
当算法接管了这些脑力活后,留给人类的任务便退化成了“画草图说明材料”这类,它的门槛低多了,仅需 13 年左右的受教育年限。和过去相比,岗位整体技能水平明显下降,如果说以前需要的是大学生,现在高中生就能完成了。可以做这份工作的人多了,但是它的门槛也没了,薪资可能会受到冲击。( T$ p' T& |* V3 R' L m6 k/ M
. V4 `% X, P2 s5 h6 q
! F" s2 d0 w1 N6 `. m( m) |与之相反,部分职业可能经历技能升级(Upskilling),被迫走上高学历路线。房地产经理便是一个典型。当 AI 自动化处理了维护记录(12.8 年)和比对租金(12.6 年)等行政杂事后,剩下的工作内容反而向更高阶的谈判、贷款申请和利益相关者沟通集中。这种演化的结局是,职业门槛被进一步拉高,就业人数可能会减少,但留下的精英群体将获得更高的薪资溢价。
9 D7 Y6 r. q2 [5 l n
$ B& X* @3 }5 x# W7 T2 X) u& \+ ?( @9 M. U
对高学历群体而言,他们从事的职业可能会向两极演变。要么像房地产经理那样,向高技能、高判断力任务集中实现升级,但代价是行业只能容纳一小部分精英。要么就像技术写作行业一样,向标准化、低技能靠拢,高学历群体只能眼睁睁看着自己多年寒窗苦读换来的专业技能,在算法的蚕食下失去价值。' n. U$ p2 e. ~& ]
0 m1 F, h' }. y" c& [( c/ N1 m- v; n
& O7 i' _ c4 ~1 q |- b2 t! C
03
& i, ~: N& d4 _( g$ T" G' E
8 a5 d/ q/ L+ P" ]6 b5 g
- q' D- t8 p0 h( N受冲击的工作没有消失,但是逐渐不招人了
0 ^3 X e+ p* c# E- \
% i% t: n7 @9 J% l Z$ W Z& j+ G. H, D& \) g4 }; u* t
哪种工作,哪个人群最容易受到AI的冲击,也是讨论AI就业冲击的经久不衰话题。
+ o! t! m! [4 B9 |- O' M; o
, m& h9 a0 i. l& u. V; ?) U8 ~
在分析中,研究者根据各职业的“观察到的暴露度”(observed exposure)对所有职业进行了排序,并按暴露程度划分为四个等份。其中,暴露度最高的 25% 职业被归为“高暴露”群体,而暴露度最低的 25% 职业则被视为“低暴露”或“未暴露”群体。
" X! y" Q2 g# X) ?" z) S, ~; W) f1 R( }% u
+ C" v. [5 R+ Z4 J% a1 t) ]按照这一划分方式,一些计算机与数学类、商业与金融类、办公室与行政支持类以及销售类职业往往出现在暴露度较高的区间,因为这些岗位包含大量可以被 AI 辅助或自动化完成的信息处理任务。相反,一些需要现场操作或体力劳动的职业,例如厨师、机械维修工、救生员、酒吧服务员或洗碗工则几乎没有出现在 AI 使用数据中,因此被归入暴露度最低的区间。
, Q9 L: X: A- H- n0 Y' M' l, ]! X, n! i& ^0 c' C( y
/ o3 E4 ~% M4 a( WAI高暴露的职业,往往是传统上我们印象中的办公室工作,或者说白领、知识性的工作。这些劳动者普遍拥有着高学历,女性、亚裔的比例也更高。
7 Y, w! W1 R+ u% m2 L% a J$ J+ ~" r$ d( P B( F$ C
# _/ g# B! Z0 a' Y4 g. j统计显示,在 AI 暴露度最高的职业中,女性比例比低暴露职业高出约 16 个百分点。同时,这些职业中的劳动者通常具有更高的教育水平和更高的收入。例如,拥有研究生学历的比例在高暴露职业中达到 17.4%,而在低暴露职业中仅为 4.5%。) ?3 P) m# n7 y: R/ U% w& I
. O4 B) ~+ f/ Q8 g
' s$ o" S1 c/ n从总体就业角度看,目前仍没有明显证据表明人工智能已经导致失业率上升。自 ChatGPT 在 2022 年末发布以来,美国劳动力市场中那些 AI 暴露程度最高的职业群体,其失业率变化与其他职业群体基本相同。这意味着,至少在目前阶段,人工智能尚未引发大规模的就业冲击。
. `/ R3 x/ q$ l- m# L
( G) P7 y1 \2 R9 W8 B' X8 B8 d$ i' n* R7 x3 [+ r8 b q: n" f
但暴露度最高的职业,未来就业的增长可能有着温水煮青蛙的风险。美国劳工部下属的 U.S. Bureau of Labor Statistics 定期发布的职业就业预测显示,将职业 AI 覆盖率与 2024—2034 年的就业增长预测进行比较后可以发现,覆盖率每增加 10 个百分点,对应的就业增长预测平均下降约 0.6 个百分点。" ?/ s; e" h7 }3 Y
9 L) f+ \* W7 o4 e* Q
% J5 V& o+ S @虽然幅度看似不大,但在长期累积下,这意味着 AI 使用最密集的职业,未来扩张空间会持续受到压制。换句话说,那些以信息处理为主的白领岗位,虽然还没直接面临裁员的危机,但就业前景可能会缓慢收紧。
* Q! K; ?& ^( T4 R
/ d5 X" R L) N' w7 d' @9 x! L) [1 ]. N0 } ~6 ?* U
另外,失业率维持平稳背后可能隐藏着一个统计上陷阱。一个人得先有一份工作,才有资格在丢掉它时被计入失业统计。对于那群刚走出校门,简历还没投出去,就撞上行业大门紧闭的年轻人来说,他们甚至连在统计系统里获得一个职业标签的机会都没有。0 q; n1 z9 ^& M
! D8 A3 O. [" _: G2 t) Y6 a5 n, V% A; f- g
数据细节显示,如今低暴露职业的月均入职率稳定在 2% 左右,而进入高暴露职业的入职率则下降了约 0.5 个百分点。1 _- J) q% v0 O1 D& e2 m
% y Y5 @" L5 J( F. y" F
$ A7 j+ t. _0 h5 i8 V$ B5 F, I5 x
更直白的数据是,与 2022 年相比,ChatGPT 发布后高暴露职业的入职率平均下降了 14%,尽管这个变化在统计上还不够显著。值得注意的是,这种招聘放缓的现象在 25 岁以上的劳动者群体中并未出现。
+ N9 U+ F; m A+ b* l
- o: \! m! E P8 T6 F7 |
* {' ]/ d, x9 a2 Q7 J, ]7 ~6 x# B原本以为 AI 带来的就业危机会是一场大规模的裁员,将人扫地出门。可现实却是,它并没有急着赶走屋子里的人,而是把本就对年轻人敞开程度有限的职场大门,关得更紧了。
( J: [2 J6 f- K, T4 ~1 r0 z/ U4 a2 \( m8 ~( T3 f1 c
9 a# h2 d& f* e' F# h
参考资料:
( c- Q. A/ J @6 J. q- V5 s$ q' N[1] Anthropic. (2026, March 5).Labor market impacts of AI: A new measure and early evidence. Anthropic.- Q5 I. ^# S: {7 G( U% ~
[2] Eloundou, T., Manning, S., Mishkin, P., & Rock, D. (2023).GPTs are GPTs: An early look at the labor market impact potential of large language models. Science.
; q, E; v' R* x6 l+ ]- D[3] Appel, R., Massenkoff, M., McCrory, P., McCain, M., Heller, R., Neylon, T., & Tamkin, A. (2026, January 15).Anthropic Economic Index report: January 2026. Anthropic. |
|