|
|
导语:随着人工智能特别是大语言模型(LLM)和深度学习工具的迅猛发展,科研界正在经历前所未有的变革。AI 不仅改变了科学家的工作方式,也正在重塑科研岗位的结构与技能需求。本文结合 SCIence 与 Nature 的最新研究,从科研产出、岗位结构和团队协作三个维度探讨未来科研岗位可能面临的冲击。2 A/ M* i7 D( `4 S% E c. p
关键词:大语言模型(LLM)、科学学、学术写作、语言公平、科学计量学、科研生产力、马太效应
# K2 }) x0 \- l$ n4 g- [! o一、大语言模型如何改变科研产出
6 q/ y! S6 V- H6 d j6 M' L
5 Z5 O# r1 q9 h4 Q5 P6 C
9 \5 n7 P7 k9 Z/ Q: A& k. c6 F
论文题目:Scientific production in the era of large language models: With the production process rapidly evolving, science policy must consider how institutions could evolve2 _5 s) `7 r3 B0 U
论文链接:- W! n8 u3 w) b! s! r3 n+ ]" q3 x
https://doi.org/10.1126/science.adw3000
1 X( K7 l( f% M# e发表时间:2025年12月18日
' i0 {( p* C8 {: d+ h论文来源:Science ?6 ~3 j+ W/ {: i
康奈尔大学殷裔安团队发表于 Science 的研究基于 2018—2024 年三大预印本数据库的 210 余万篇论文数据,通过文本特征算法识别 LLM 辅助写作的论文,系统考察大语言模型对科研产出的影响。结果显示,采用 LLM 的研究者论文产出显著增长,在不同数据库中增幅达到 36% 至近 60%。尽管研究者谨慎指出这种关联并不等同于严格的因果关系,但在多种识别方法和统计模型下,这种“采用—产出跃升”的趋势都保持稳健。* v d( {: Q2 F. B: n* m; \! g
$ F& p. G; @% p* I" A; C' a
( g2 ~" A- l$ X) g4 K) }7 x y图1:以作者首次被检测为 LLM-assisted所在月份为 0(竖虚线),横轴为相对月份,纵轴为采用者相对未采用者的产出变化(%);点为估计值,竖线代表 95% 置信区间。图中可见采用后产出在多个后续月份保持在更高水平。' Z! [* ^' d c9 l% t. ^' Y
LLM 的作用首先体现在程序性写作环节,例如摘要撰写、文献综述整合、语言润色与结构整理等。这些任务高频、耗时,但高度语言化,因而容易被自动化工具接管。从劳动经济学角度看,这是一种典型的“任务替代”而非“岗位替代”。科研人员并未消失,而是部分劳动模块被技术抽离、重组。若将这一机制外推至更广泛的就业结构,可以看到,AI 更可能重构工作内容,而非简单地消灭职业本身。
g6 S2 c. P$ G1 F二、语言门槛的降低与隐性不平等的缓解
- p. ]9 I) h4 K) z/ Y/ z
( X. Z) q1 l- n5 c% x) X- c该研究还揭示了一个重要的分配效应。数据显示,在部分数据库中,来自非英语国家机构的研究者在采用 LLM 后的产出增幅显著高于英语国家同行。这意味着,语言模型在一定程度上缓解了长期存在的语言壁垒问题。过去,非英语母语研究者不仅要完成高质量研究,还需承担额外的语言表达成本,而 LLM 的普及削弱了这一隐性门槛。6 v2 b$ V0 l* T# I5 Z. C
这一现象提示我们,AI 并非只会扩大差距。技术也可能在某些维度上推动“语言平权”。然而,语言门槛的下降同时带来了新的问题——当复杂表达不再需要高昂成本,传统评价体系是否仍然有效?% f b- l# ~* y7 U! T! A5 l
三、质量信号失灵:当语言不再代表投入
8 i8 C! G9 U. `2 f+ e
/ h8 Q! O4 e4 H3 `- }研究发现,在传统人类撰写论文中,语言复杂度与发表概率之间存在正相关关系。复杂句式与专业术语通常被视为研究投入与学术训练的信号。然而,在 LLM 辅助论文中,这种关系发生逆转:语言越复杂,发表概率反而下降。9 ]& n. f6 ]1 Q2 U; {
$ l: [; \) D+ s0 f3 I! c* u
* {7 n7 Y/ J2 p N- x1 P1 o5 \' P图2:横轴为写作复杂度,纵轴为稿件最终发表(同行评审期刊/会议)的概率;橙线为 LLM-assisted样本,蓝线为 non–LLM-assisted样本,阴影为 95% 置信区间。非 LLM 文本里复杂度越高,发表概率越高;但在 LLM 辅助文本里,复杂度越高对应更低的发表概率。7 J" p/ s/ i% V: R
其根本原因在于,LLM 降低了生成复杂语言的成本,使“语言投入”与“学术投入”发生解耦。当任何人都可以轻松生成结构精致、术语密集的文本时,复杂性本身不再具有区分度。由此带来的风险是“看起来像优秀论文”的文本数量上升,评审负担加重,传统筛选机制的有效性被削弱。
$ ?6 e% E' g, w9 n$ }* v在更宏观的就业语境下,这一变化具有象征意义。当 AI 可以低成本生成专业化成果时,基于形式与表达的能力信号会迅速贬值。评估机制若不更新,可能转而依赖更隐性的地位标记,例如机构背景或既有声望,从而在无形中重塑新的门槛。5 S2 E& P& j; i: U1 |1 { q9 w3 a
四、个体受益与团队收缩:效率提升的另一面, h; @9 J' f; }
, w u* R4 |+ A5 P/ ^
+ f8 N Q y3 T( Q, u
# Q8 h9 V% p" c1 t% c1 F
论文题目:Artificial intelligence tools expand scientists’ impact but contract science’s focus
' H; k# r/ {5 H: W; Z$ S7 C论文链接:7 z; o( O2 @ z+ T" E: k
https://doi.org/10.1038/s41586-025-09922-y* I) N+ n) Y0 F& q8 r
发表时间:2026年1月14日- C! K" W6 X+ r/ C
论文来源:nature2 l4 D- Q. z# W
清华大学电子工程系李勇教授团队发表于 Nature 的研究则从更宏观的科学计量视角出发,分析了 1980—2025 年间 4130 万篇自然科学论文,识别 AI 赋能研究对科学家个体与整体结构的影响。结果显示,采用 AI 的研究者在论文产出、引用数量与职业晋升方面均显著优于未采用者。初级科学家更快成为项目负责人,退出学术界的概率也有所降低。
8 L ~+ u X& r( n7 [0 V9 O4 i( q8 o1 X E; a
$ A* F/ w" f. n' ~* E/ [! T1 m7 g4 ?图1:AI 扩大了论文影响力并促进了研究人员的职业生涯。a, AI 论文(红色)与非 AI 论文(蓝色)发表后的平均年引用次数(插图显示了前 1% 和前 10% 的情况;样本量 n = 27,405,011),结果显示 AI 论文吸引了更多引用。b, 使用 AI 的研究人员与未使用 AI 的同行(对照组)的平均年引用次数(P < 0.001,样本量 n = 5,377,346),其中采用 AI 的研究人员获得的引用次数是未采用者的 4.84 倍。c, 采用 AI 的初级科学家与未采用 AI 的同行之间两种角色转变的概率(每个领域 n = 46 年的观测值)。与未采用 AI 的同行相比,采用 AI 的初级科学家成为知名研究者(established researchers,即项目负责人)的概率更高,而退出学术界的概率更低。d, 从初级科学家向既定研究者转变的生存函数(P < 0.001,样本量 n = 2,282,029)。生存函数可以很好地用指数分布拟合,结果表明采用 AI 的初级科学家更早成为既定研究者。对于所有面板,99% 置信区间(CIs)均以误差条形式显示,其中图 a 的插图以 1% 和 10% 分位数为中心,其他子图以均值为中心。所有统计检验均使用双侧 t 检验
; `4 h9 b! U! U6 v4 R& ~- N* d9 M然而,这种个体层面的“增强”伴随着团队规模的缩小。AI 研究团队平均成员数减少,尤其是初级研究人员数量显著下降。这表明,AI 在提升核心研究者效率的同时,可能替代部分初级岗位的功能。数据处理、模式识别等原本由年轻研究者承担的任务,逐渐被算法承担。
0 P \2 P6 ?$ c$ @! a! j1 D8 w) p" U
' m( y; d0 E0 Z, d+ i1 x2 _, N$ R
图2: AI 研究与研究团队规模的缩小有关,平均减少了 1.33 名科学家(P < 0.001,样本量 n = 33,528,469)。具体而言,初级科学家(junior scientists)的平均数量从非 AI 团队的 2.89 人减少至 AI 团队的 1.99 人(降幅 31.14%),而既定科学家(established scientists)的数量从 4.01 人减少至 3.58 人(降幅 10.77%)。
( ^4 E/ \. U+ B" @5 a' ]9 X在“90% 失业”的讨论框架下,这一点尤为关键。问题或许不在于工作是否彻底消失,而在于岗位结构是否向更少数高技能核心成员集中。效率红利的分配可能更加集中,而非均匀扩散。. _3 ^0 W+ S+ `4 N; ~# b% \& }: Z
五、探索空间的收缩:集体层面的隐忧
X& g! d8 D% u( w$ W* m, M w, l2 m; f
更值得关注的是集体层面的变化。Nature 研究引入“知识广度”指标,发现 AI 驱动研究在向量空间中的覆盖范围显著收缩,知识熵降低,研究焦点更加集中于数据丰富的热门领域。引用结构也呈现更明显的“星状分布”,少数顶尖论文吸引大量后续研究,而不同团队之间的横向互动反而减少。
1 R# R$ P, X, q( S
$ @% b2 `5 C7 B2 ?, c% ]% y
) ]' }# ^, S6 l8 y2 c1 _# Y9 S图3:AI 的采用与科学领域内外知识程度的收缩有关。a,研究团队使用预训练的文本嵌入模型将研究论文嵌入 768 维向量空间;然后测量该空间内论文的知识程度。b,为了可视化,研究团队使用 t 分布随机邻域嵌入 (t-SNE) 算法将随机批次 10,000 篇论文 (其中一半是 AI 论文) 的高维嵌入平铺到二维图中。如实心箭头和圆形边界所示,在整个自然科学领域,AI 论文的知识程度 (在未平铺的空间中计算) 较小。此外,AI 论文在知识空间中更加集中,表明对特定问题的关注更加集中。c,每个领域中 AI 和非 AI 论文的知识程度 (P<0.001,每个领域中 n = 1,000 个样本),其中 AI 研究侧重于更加收缩的知识空间。d,每个领域人工智能和非人工智能论文的知识熵 (P<0.001,每个领域 n = 1,000 个样本),其中人工智能研究的熵较低。对于面板 c 和 d,方框图以中位数为中心,以第一和第三四分位数 (Q1 和 Q3) 为界。所有统计检验都使用中位数检验。) m- n- ~& m9 ?; p) e5 {
这一现象与 Science 研究形成一种张力。前者表明 LLM 可能拓宽阅读与引用范围,使研究者接触更多样的文献;后者却发现,在实际研究产出层面,AI 倾向于将资源集中于已有数据优势的领域。换言之,我们可能“读得更广”,却“做得更窄”。5 |! }0 l) ?8 d
从创新生态的角度看,如果所有研究者都被激励去追逐“数据富矿”,那些数据稀缺但潜在重要的基础问题可能被长期边缘化。效率的提升未必等同于探索的扩张。
6 d$ u" R6 B/ ]( Y. Q7 Y六、科研岗位冲击的隐性机制5 J7 m3 A' b4 [: A9 _
. G- P4 ~3 p2 f. _" U7 Y综合两项研究可以看出,AI 对科研岗位的冲击具有以下特征:" Y( k7 c# g, _
9 R' }) b# E, V# B# y% N
- 可替代性强的程序性岗位最易受影响:文献整理、初稿撰写、数据预处理等高频、重复性任务可能被 AI 工具取代。
2 h5 @0 a9 L w0 L. A L - 语言与写作依赖岗位的价值下降:LLM 可生成复杂学术语言,降低了对人工语言能力的依赖。
* s& _: V3 ~& [9 q( |: [ - 初级科研岗位的风险高于高级科研岗位:初级科研人员的工作易被自动化替代,同时晋升压力和职业路径的不确定性增加。
% V: b+ D6 I+ \$ W; `* \ - 科研团队结构与协作模式调整:AI 推动小型、高效团队成为趋势,岗位需求向跨学科整合和高级决策倾斜。
. j: {9 g2 T0 j x# w |
|