找回密码
 立即注册
查看: 661|回复: 0

谷歌Gemini上线AI音乐创作,一夜革了Suno的命!

[复制链接]

4077

主题

535

回帖

1万

积分

论坛元老

积分
12921
发表于 2026-2-19 15:41:20 | 显示全部楼层 |阅读模式
新智元报道
; _" I1 \" O) A; N" V编辑:艾伦' I' l6 w8 Z+ D8 F
【新智元导读】谷歌在 7.5 亿月活的 Gemini 中上线了 AI 音乐生成功能,输入一句话或一张照片,几秒就能得到一首带人声和歌词的完整歌曲。背后是 DeepMind 最新的 Lyria 3 模型,训练数据超 200 万首曲目。对 Suno 等 AI 音乐创业公司而言,竞争从此不再只是比模型,更是要比入口。  Y4 o* w3 _$ }9 I/ e- ?7 r
昨天,谷歌在 Gemini App 中上线了 AI 音乐生成功能。+ T4 K5 N+ t* j8 t2 C
7 D1 d" U% ?9 ]2 O4 Z
. l' N8 O- E% U' x: G% {: i# |
用户输入一段文字描述,或者上传一张照片,几秒钟内就能得到一首 30 秒的完整歌曲,带人声、带歌词、带 AI 生成的封面。纯器乐当然也是支持的。
- k- O* x2 y2 y2 }. c驱动这个功能的是 DeepMind 最新的音乐生成模型 Lyria 3。6 v  Q: n5 H6 X; z
1 x2 u. n9 R0 @, C
! f, c1 N! G! X5 H# {4 P( y
谷歌对这项功能的定位,不是取代音乐人,而是让普通人获得一种全新的自我表达方式。0 _+ m1 z% W# A* P; }& J7 y4 _  x8 S$ }
做 AI 音乐生成的公司不少,但把它直接塞进一个拥有超过 7.5 亿月活用户的超级应用里,谷歌是头一个。
9 L- h7 M* x* \「30 秒」背后的技术跃迁
% q1 s" l% e0 H' J从 2023 年发布初代 Lyria 算起,这已经是谷歌在音乐生成领域的第三代模型。
: Y1 N6 Q* r7 |相比前代,Lyria 3 有几个明显的进步。
3 P4 u2 @& G* K3 q7 f过去用户需要自己写歌词输入模型,现在 Lyria 3 可以根据提示词自动生成歌词。$ I- p( O% }6 ?
用户对风格、人声类型、节拍速度等元素的控制也更精细了。
4 m! @/ |% M8 w+ z4 J9 A. U, E7 x根据 DeepMind 官方推文,Lyria 3 输出 48kHz 立体声音频,人声表现更自然,歌词的咬字清晰度也有了明显提升。
* T8 q4 i4 n! b; D% D5 h4 L据数字音乐媒体 Digital Music News 报道,Lyria 3 的训练数据规模从 Lyria 2 的约 50 万首曲目扩展到了超过 200 万首,音频位深从此前版本升级到了 24-bit。6 U* _1 `7 b& O% x
这意味着它在音质维度上甚至超过了 YouTube Music 等主流流媒体平台的标准。
# a7 U6 p# v4 ^/ j* ?除了文本生成音乐,用户还可以上传照片或视频,让 Gemini 根据视觉内容的情绪来作曲配词。* E3 x2 S+ i2 @8 ^6 ~! U$ J- a* C
比如上传一张徒步的照片,Gemini 就能创作一首与之匹配的歌曲。
$ b- T/ P4 I6 A封面则由谷歌的图像生成模型 Nano Banana 自动完成。4 Y0 z+ i1 `# C% k/ e8 b
功能目前以 Beta 形式向全球 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,桌面端已率先上线,移动端将在未来几天内陆续推送。$ V; o( |% P  b4 z' I4 ?
谷歌 AI Plus、Pro 和 Ultra 订阅用户将享有更高的使用额度。
; l5 d2 F" I, s( v  q. ]7 t3 I与此同时,Lyria 3 也被整合进了 YouTube 的 Dream Track 功能,帮助创作者为 Shorts 短视频生成背景音乐。这项功能此前仅限美国地区,此次正式面向全球创作者开放。
( ]! V* ~0 o# s( v0 w9 h7 _" M版权这张牌
: f: n4 `3 {& u: ~  W谷歌打得很小心0 d" j3 u' b) b( s0 @
AI 音乐生成领域的版权纠纷从未停歇。
- c( U7 Q+ H3 r* I. k2024 年夏天,环球音乐、索尼音乐和华纳音乐联手对 AI 音乐初创公司 Suno 和 Udio 提起了总金额达 5 亿美元的版权侵权诉讼。0 Z5 ~# ]; a' [5 p
到 2025 年底,Suno 与华纳达成和解并获得授权,Udio 也分别与环球和华纳签署了协议。
% d8 j8 F! _) O! p整个行业正在从对抗走向合作,但紧张关系远未消散。4 a" U, @  b2 Z  U2 K3 v; `1 `1 i# O- d
在这个背景下,谷歌的措辞格外谨慎。
  U6 e- \% ~+ i0 F/ R6 v: I9 }! f! y0 x官方公告强调 Lyria 3 的设计目标是「原创表达,而非模仿现有艺术家」。
2 Z6 s! l4 o+ r0 Y如果用户在提示词中提到某位具体艺术家的名字,Gemini 只会将其作为宽泛的创作灵感,生成风格或情绪相似的作品,而非模仿该艺术家的声音。) X3 j6 ]4 d4 B: f" ]& j# H
谷歌还表示在训练过程中「非常注意版权和合作伙伴协议」,并设置了过滤器来比对输出内容与已有作品。
) A! V1 N- T2 d( z在内容标识层面,所有通过 Gemini 生成的音乐都会嵌入 SynthID 水印。5 M. t8 j, W8 N. J) l7 W! `4 M, @
更值得关注的是,Gemini 现在还新增了音频鉴别功能——用户可以上传一段音频文件,询问它是否由谷歌AI 生成,Gemini 会检测 SynthID 标记并结合自身推理给出判断。
; |! r  @# E2 |' Q" h# F5 @* `5 S这是继图片和视频鉴别之后,SynthID 覆盖的第三种媒体类型。  j$ o; v  r) ?  m6 n0 a/ O
当音乐生成变成一场平台战争
( S6 M8 ~/ v& a# l2 P8 z* |3 Z, L如果说 Suno 和 Udio 代表了 AI 音乐的创业浪潮,谷歌此举则标志着这场竞赛正式升级为平台级别的角力。0 n7 A5 G, |1 o/ M
Suno 在 2024 年 11 月完成了 2.5 亿美元融资,其付费版本已经提供了虚拟音频工作站等专业编辑功能。. Z  _0 M* _; K, n( p/ l
但 Suno 的月活用户量级与 Gemini 的 7.5 亿相比,根本不在同一个数量级。
3 ^. I$ w. r/ z! X. V  G* JTom's Guide 的编辑在体验后写道,她把丈夫的待办事项清单变成了一首朋克摇滚歌曲,然后通过短信发了出去。1 Z- C* D( q) I
这种场景可能正是谷歌想要的:音乐生成的杀手级应用也许并不在录音棚里,而是藏在日常生活的每一条消息、每一次分享中。
, P5 @" Y6 z, e3 c1 s3 w30 秒的长度限制、Beta 阶段的粗糙感、版权争议的暗涌——Lyria 3 显然还远谈不上完美。
5 h" I- F( e" W3 G但谷歌选择在这个时间点把它推向 7.5 亿用户面前,传递的信号已经足够清晰:AI 音乐生成这件事,它不打算再等了。4 j" }3 T7 o- ?: P
当每个人的口袋里都装着一个作曲家的时候,改变的或许不是音乐本身,而是我们与音乐之间的关系。6 ^( G+ k9 ?, a: l/ y
参考资料:
4 g$ d: r" ?( S7 j" ~1 l) d. a  o+ E" ^) L8 s3 `, m/ @, f, v9 w
https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/
. t8 `/ O5 m: j4 W' [. e9 c8 khttps://x.com/GoogleDeepMind/status/2024153067654902014
集群智慧云科服专利申请服务
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表