找回密码
 立即注册
查看: 726|回复: 2

OpenAI又摊上事了!大英百科状告ChatGPT:查资料也算侵权 ...

[复制链接]

67

主题

33

回帖

308

积分

中级会员

积分
308
发表于 2026-3-23 09:16:01 | 显示全部楼层 |阅读模式
新智元报道" g, y9 Q" s2 Q* e
编辑:倾倾8 E  k. @3 a) g7 X! Y8 f
【新智元导读】3月16日,大英百科全书联合韦氏词典,起诉了OpenAI,并且罗列了ChatGPT的「四宗罪」。不要觉得Britannica心狠,此前ChatGPT编造错误信息,却把来源伪托给Britannica。OpenAI未作回应。
. Z1 I3 E1 A: x% X( X- }3 s, F* vOpenAI又被起诉了。+ c: o7 f$ o  t% B5 u
3月16日,大英百科全书联合旗下的韦氏词典,对OpenAI提起诉讼。( v4 W  T( J/ I) \7 h5 N5 B" `, R
原因是,它认为ChatGPT进行了大规模的版权侵权。
0 y* ^3 b# J5 B4 T9 V+ uBritannica比所有原告准备得更充分:它紧抓训练数据抓取、模型记忆输出、RAG实时检索,同时追加《兰纳姆法》商标侵权。
7 R; f  ]+ P% x* b0 \这是AI版权诉讼史上,第一次有人试图把整条生成链路一锅端。
* N( p$ W% x3 \" V2 ZGPT-4能逐字默写大英百科
1 t' w! f2 b9 g3 B; x; a根据TechCrunch报道,Britannica直接点名GPT-4,认为它已经记住了其大量版权内容,能够按需输出近乎逐字逐句的复制品。
$ v2 N% z/ a+ X; d7 h不是相似,不是接近,是逐、字、复、制。
7 y( E+ D3 d7 d* Z$ r8 [- q3 t这背后有一定的技术依据。斯坦福和耶鲁的研究团队曾做过实验,从主流大模型中提取《哈利·波特》原文,最高提取率达到96%。+ n, B+ f6 B. T# |2 m. y
7 ~/ @( T$ h/ ~* R0 C4 T

+ z' G9 _, D9 L2 q2 ?6 [- c8 v也就是说,训练数据里的内容,有相当一部分被记在了模型权重里,在特定提示词下可以几乎原样还原。/ F4 G# M0 U' A  C) p8 q
Britannica持有的版权内容规模并不小。它旗下近10万篇在线文章、百科条目和词典释义,覆盖从科学、历史到文学的几乎所有主要知识领域。
- J( p# b$ O6 y2 F- T0 C6 b这些内容由专业编辑和学科专家历经数十年积累而成。在维基百科崛起之前,这套体系就是人类知识的标准索引。8 J4 l! \6 c% A. ?
而OpenAI一直在灰色地带游走。8 n: [: ^' C) O7 U, Z/ f, L9 U6 {3 h
查一次资料,也算侵权
7 d4 r0 D3 ^8 x) p此前,各方一直在争论:用我的内容训练模型,算不算版权侵权?
$ O; V" t: l% f3 o6 W: B( s2 O3 nBritannica这次的指控更进一步。他的指控分三层:; z3 S( U8 ^8 J6 {; R
第一层,未经许可抓取近10万篇内容用于大模型训练。2 \) i3 `& m9 \6 D" d
第二层,ChatGPT在生成回答时,输出了Britannica内容的完整或部分逐字复制,这构成直接侵权。& T% N9 A' A/ v' s% ?7 V2 w$ f
第三层,也是最具争议的一层。OpenAI在ChatGPT的RAG工作流中使用了Britannica文章。& T: k1 n& y6 L5 u) R
RAG是ChatGPT扫描外部数据库、获取最新信息的机制。* X# T2 j! ~. }+ x6 s, }$ R6 C

5 H7 C, d+ b9 u- E, ?/ |
) B% L: A  N% B( U/ m# p# ]Britannica认为,即便它的内容没有进入训练集,但只要它出现在实时检索里,就被视为侵权。
2 k5 |5 w. t( |+ @7 a% X5 c$ Q7 S这种想法前所未有,它意味着不管是静态训练还是动态检索,只要调用了版权内容而未获授权,都要负责。
3 o, Q  J5 H2 \1 {0 I( ~更有意思的是第四条指控:Lanham Act商标侵权。( L" s2 ]1 ?) H3 x# D! Z
Britannica认为,ChatGPT有时会产生幻觉,然后把这些错误内容归因于Britannica,制造Britannica生成了错误信息的假象。
# z! u* X+ ~4 o这不单单是侵权,Britannica的品牌信誉都要替OpenAI的错误买单。
) B, `3 e$ A& u这危及公众持续获取高质量、可信赖在线信息的能力。; r1 O/ C$ M# L1 z, N' a/ `6 J
同一个问题:德国说侵权,英国说没有# D0 l9 Y1 g* o5 M8 L
这是整场官司的核心,也是目前全球司法界争论最激烈的问题之一。
! x$ i( V! b. w  `6 m: N7 M1 ~德国慕尼黑法院在GEMA诉OpenAI案中认定:GPT-4和GPT-4o的模型权重中确实嵌入了歌词,这构成版权意义上的复制,可以提出禁令和赔偿请求。6 i6 Y. G8 N. K: q- i
# n# j. o: N- x# Y* u, l" a: |& c
8 [# r" Q% R: g7 H/ G1 U& R8 }
模型权重是AI在训练过程中学到的数值参数,它决定了模型会输出什么。在慕尼黑法院看来,只要能从这些参数里还原出作品就足以构成侵权。
9 _8 \3 Q: ~" i! G. Z, |/ x2 e英国高等法院在Getty Images诉Stability AI案中得出了完全相反的结论。6 e2 I2 ^' Z) b* [
4 Q) N7 X% c" Q; J

; g% ~6 C7 e1 oAI模型不是侵权副本,因为其权重既不包含也不复制版权作品本身,只存储了学习到的规律性模式。* J- d* L/ _9 v1 N7 k% Q
美国这边,Anthropic曾在版权诉讼中说服联邦法官William Alsup,认定将内容用作训练数据具有足够的转化性,可以适用合理使用原则。  m4 q, ]8 @9 y+ ^. Z; d
但Alsup同时认定Anthropic非法下载了数百万本书而非付费获取,这一点构成违法,最终促成了1.5亿美元的集体和解。3 K* A- V& s  ^+ a/ r* i' S
Britannica这起案子在纽约提起,适用的是美国联邦法律。
3 I# e' H5 o- I, {但目前没有确立性先例明确说明用版权内容训练LLM究竟算不算侵权,每起案子的结果,在相当程度上仍取决于具体法官的认定逻辑。
* X' z0 a" Y* Y! O# R如果法院认可实时检索也构成侵权,那对整个AI行业的影响将远超任何一起训练数据纠纷。
, I$ X; s! A; y7 g: B; p  c" M2 V" z告Perplexity,是在给OpenAI热身
8 V1 V4 i' V5 ~) P. k这不是Britannica第一次出手。. ?+ A3 K3 ^* ?
早在2025年9月,Britannica就对Perplexity提起了类似的版权和商标侵权诉讼,该案目前仍在审理中。
: {, R5 n9 i9 _5 ?1 B
% @* {+ V0 v6 @, H. k" l' T% M! R3 M
Perplexity是一家以RAG为核心产品逻辑的AI搜索公司。. Y& ^- l* P. t. g. i
Britannica选择先打Perplexity,像是在做法律预演,摸清RAG侵权这条路的可行性,然后再把同样的逻辑复制到OpenAI身上。
5 ?7 N* t$ B' }" N( n+ G: B5 Z: p与此同时,行业里的版权战场正在全面升温。
; y& f7 Y' j# ]" T  `" K' c# ?《纽约时报》、Ziff Davis、美国和加拿大十余家报纸先后起诉OpenAI。
' S! x2 K* P  z, [4 u5 b1 S
* a2 Z4 Z1 K; [
1 L4 H7 S. S4 a5 I" `# ]9 aThe Intercept和US News & World Report也已加入原告队伍。
* Q- e- |5 k' [8 G! i截至目前,专门追踪AI版权诉讼的网站ChatGPT Is Eating The World统计显示,这已是针对OpenAI的第63起版权诉讼。
& R8 a% A. B. E7 MOpenAI对TechCrunch的置评请求未作回应。
- X- D5 t1 j& e* }0 O被维基百科打残,又被ChatGPT截流' i; \& \% s$ i3 m+ Q
退一步看,有些事情比赔偿金额更值得关注。6 O8 w, o. O- v! e3 h, l4 [
Britannica创立于1768年,是英文世界里持续时间最长的百科全书品牌,它代表的是几百年人类知识整理传统的某种象征。
2 T- N( Z* B; `* Z' J, v9 n当这样一个机构出现在AI版权诉讼的原告席上,传递的信号很清晰:知识权威这个概念,正在试图通过法律手段,重新在AI生态里划定自己的边界。
7 k  O6 g5 r, m5 t! oBritannica曾是纸质百科时代的绝对权威,被维基百科打得几乎找不到存在感。6 ?1 ^" |" m6 t; B1 D+ L$ X' g

% k" e. N, [6 l; c# k% g
& K' ~* v3 V: }; m后来转型为数字订阅平台,靠着内容的可信度和专业性重新站稳脚跟。6 M! `5 ^( V9 k2 L8 O
如今,ChatGPT的出现让它又一次面临被替代的威胁——但不是被更好的百科替代,而是被一个用它内容训练出来、但不分给它一分钱的模型替代。. Z3 O+ s4 e& K& u, T
诉状里有一句话:
4 \5 n% S/ A% t; s$ fChatGPT通过生成替代出版商内容的回复,抢走了出版商的流量。
. M5 C- K2 N3 X8 r( K这是商业模式的正面冲突。RAG这条指控是否能站住脚,目前没有人能给出确定答案。
  e. O$ \) W5 g( n  U但如果法院哪天认可了这个逻辑,整个行业的实时检索管道都需要重新谈授权。; O: p. b4 R8 j: B9 j* S( x) n
所有以联网搜索+AI生成为核心产品的公司,都要面临这样的问题。2 |. |6 t6 J  S3 i
250年的老牌百科,正在用一份诉状,尝试给AI的边界划一条线。
$ x: B: A' q4 ^7 y, Y4 G这条线最终画在哪里?2026年,大概会有答案。. p$ P' ], c8 b! O
参考资料:" A# z  i  p& C4 e& }. P" n
https://www.reuters.com/legal/litigation/encyclopedia-britannica-sues-openai-over-ai-training-2026-03-16/
: t% n3 Y0 m6 W+ Phttps://techcrunch.com/2026/03/16/merriam-webster-openai-encyclopedia-brittanica-lawsuit/+ F- A. K8 b: m7 A/ @, e
https://the-decoder.com/encyclopedia-britannica-sues-openai-for-training-on-nearly-100000-articles-without-permission/5 P/ L' {; A' _
https://gizmodo.com/encyclopedia-britannica-sues-openai-over-ai-training-data-2000607770
  \. K; H! {2 xhttps://news.bloomberglaw.com/ip-law/britannica-merriam-webster-accuse-openai-of-copying-thEIr-works
0 w$ R3 N$ b4 u) D; n/ q1 y4 L! B0 ]. Y: Nhttps://chatgptiseatingtheworld.com/wp-content/uploads/2026/03/Encyclopedia_Britannica_Inc-v-OpenAI-COMPLAINT-Mar-13-2026.pdf
. H5 A) y4 x& ?) P& z/ ^/ Phttps://www.aol.com/articles/encyclopedia-britannica-sues-openai-over-141324436.html
集群智慧云科服专利申请服务

77

主题

24

回帖

305

积分

中级会员

积分
305
发表于 2026-3-23 09:16:30 | 显示全部楼层
anthropic超越openai 迟早的事,openai还没盈利就开始得大公司病,anthropic聚焦编程,不急不躁,没有舆论压力。
集群智慧云科服SCI/SSCI/EI期刊发表服务

68

主题

28

回帖

316

积分

中级会员

积分
316
发表于 2026-3-23 09:16:59 | 显示全部楼层
竟然是openai[喷水]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表