查看: 60218|回复: 0
上一主题 下一主题 打印

DJING 改变的那一天——DJAY PRO AI 和 VIRTUALDJ 的源分离  [复制链接]

我计划了一篇完全不同的文章,其中一篇讲述了我两个小时的预发布 djay Pro AI 沙发混合会议的故事。它是这样开始的:

“去他妈的——现在是凌晨 1.30”。

转向沙发上我的另一半,我向她保证这不是及时的请求,而是感叹。

“我知道。我留给你玩了。好久没见你这么开心了。”

那天我只期待一个改变游戏规则的公告,但随后 VirtualDJ 为他们自己的完全相同的事情点亮了绿灯。因此,那个特定的故事情节被激增了。

所以发生了什么事?好吧,Algoriddim 宣布了适用于 iOS 和 iPadOS 的djay Pro AI  ,这是一个全新的重建,配备了名为 Neural Mix 的音频源分离技术。面对别无选择,Atomix 发布了适用于 macOS 和 Windows 的VirtualDJ 2021,它提供了完全相同的功能——实时音频源拆分为词干。

而 DJ 游戏……永远改变了?再也不会一样了吗?时间会证明一切,但在我撰写本文时,此类夸张的营销用语似乎确实有些合适。

这不是为了戏剧效果而发表的油嘴滑舌的声明——音乐源分离的引入改变了一切。在早期(在撰写本文时实际上还有几个小时),您正在见证下一场真正的革命。稍后我会解释原因。

由于我正在远离纯 DJ 新闻报道,我将让您在此处和此处发现各自的 djay Pro AI 和 VirtualDJ 2021 新闻。相反,我想带你走一条不同的路,解释我们是如何走到这一步的,以及为什么这非常重要。

免责声明——多年来我一直是 Algoriddim 的视频制作人。然而,这并不妨碍我发表独立意见。

在一开始的时候
长期以来,我一直认为 DJ 需要完成的所有工作都已通过 DJ 技术进行了第 n 次清洗,下一个真正的创新将发生在音乐上。这体现在对流媒体服务的倾斜,以及将所述服务插入通常嫌疑人的软件中,现在 Denon DJ 直接插入硬件中。

但我们谈论的是单独的音轨操纵,而不是它们的交付。我们总是能够以各种方式处理我们的音乐,无论是直接在软件中创建新版本,还是通过循环、热指示、样本、效果和过滤器进行表演。

让我们谈谈 SPLEETER
对于 DJ 来说,这是一场全新的比赛。但它是一个在一段时间内开发了许多产品的产品。但最近,Deezer 的 Spleeter技术通过积极提取优质词干的真实演示掀起了波澜。这不是你所理解的最干净的词干,但没有人会争辩说这无异于音频魔法。

问题是使用。你不能只下载一个应用程序然后解压——这是命令行的东西。该死,人们在 App Store 上苦苦挣扎,更不用说在Github上浏览晦涩难懂的指令了。

但真正的乐趣在于它是开源的,这意味着任何人都可以使用它。虽然 Algoriddim 没有明确表示他们没有使用Spleeter,但 Atomix特意强调他们的作品都是他们自己的作品。如果 Algoriddim 的专利申请获得批准,让我们看看这是否值得。

旧方法与新方法之间的根本区别在于即时性。融入表演软件意味着这一切都是现场发生的。无需准备,它适用于任何音频源,包括流媒体音乐。我很高兴地通过 TIDAL 和 djay Pro AI 顺利完成了两个小时的比赛。

但它是短暂的和暂时的。没有将词干提取到已保存的文件中——唱片公司和流媒体平台可能会遇到这个问题。但没有什么能阻止您实时记录输出。呃 - 多么古老。

相同但不同
从表面上看,Algoriddim 和 Atomix 只是宣布了同样的事情。在一个层面上,是的,这是真的。虽然最终结果大体相同,但实施方式和目标受众却大不相同。

首先,djay Pro AI 将其称为 Neural Mix,它通过隔离节拍、乐器和人声来工作。您可以在所有四个面板上独立地完全控制这些,但在双面板模式下,您可以独奏、静音或与另一个面板交换源。或者您可以将节拍和乐器或乐器和人声结合起来,在它们之间切换或淡入淡出,以获得即时的阿卡贝拉或节拍。还有查看源波形的选项。

当您亲身体验时,它非常简单但功能强大。在这两者中,它是即时满足并且以最简单的方式实现。它可以正常工作,而且可以立即工作,即使在我相对较旧的 iPhone 7 Plus 上也是如此。


查看打击垫和 EQ。

然而,VirtualDJ 采用了分离源音频的基本功能,并创建了自己的更广泛的功能。它也采用更多的互补 EQ 方法来处理添加的 stem on/off pad 模式。有趣的是,VirtualDJ 将歌曲分成五个主干——人声、乐器、贝斯、底鼓和踩镲,并将它们组合成不同的模式。



Atomix 确实强调,要获得实时源拆分的即时感觉,您需要一台 Mac 或 PC 并配备一些功能。我的 2014 MacBook Pro 确实运行良好,但它并不完全是 djay Pro AI 的绝对即时感觉。

据我所知,最大的区别在于 djay Pro AI 完全是实时的,即它开始分析播放头处的块,而 VirtualDJ 分析整个曲目,因此需要强大的机器来提供必要的即时实时 -时间响应。

从一开始,djay Pro AI 的版本就更精致、更容易理解并提供即时的感觉。VirtualDJ 感觉它需要做更多的工作,但五路词干提取可能对某些人来说是一个赢家。将它与 kick 和 snare/clap 分开,这就是我卖的。他们显然在不断开发它,因为它自发布以来已经进行了三个更新。

归根结底,它们是两种截然不同的动物。一个在 iOS/iPadOS 平台上,另一个在 macOS/Windows 上。一个很简单,另一个做的更多。让武器茎比赛开始。
但听起来如何?
引用足球专家的话说,这绝对是一场两半的比赛。第一次尝试这两种软件时,您都会有一种真正的惊叹感,就好像您对 DJ 的了解都发生了变化,再也回不去了。

去掉你的第一个人声或制作你渴望已久的器乐的经历是史诗般的。在过去 2 周左右的时间里反复这样做,这种感觉不会很快消失。

也就是说,您尝试的次数越多,您就越会意识到这项技术还处于早期阶段。将有许多方法来实现 stem 的争论,但关键是输出的质量。

现在它是一个混合包,但这是可以预料的。源材料很重要,因此在鼓、乐器和人声周围留有空间的音乐显然会产生最佳效果。

人声显然效果最好。甚至将一些非常愤怒的 Sepultura 推过他们,也能发出相当干净的声音。但不可否认的是,主干的轻微反向混响感觉。但我强调,这是坐下来用单一曲目聆听这些东西的时候。在混音时,它不太明显——就像您的大脑在混音中听到了熟悉的声音,并使用真正的智慧来填补质量上的听觉差距。

期望很快就能从每首曲目中获得真正的词干水平质量是愚蠢的。但它会变得更好,而且很快。它只需要一些机器来做更多的学习,并将其直接输入到驱动这些东西的 AI 中,或者无论如何这都是有效的。

但没有两种解决方法——即使在这个刚刚起步的阶段,这项技术也非常神奇。随着它的发展,可能性变得深不可测。

一个值得深思的有趣想法——考虑到 SoundCloud 即将被试图成为制作人的 DJ 使用这项技术制作的非常糟糕的混搭淹没(想听听我的 Good Times/Another One Bites The Dust 混搭吗?不?),它会成为音乐产业终于考虑将真实作品货币化?还是这种思想过于进步,他们无法理解?流媒体删除是否会受到影响,因为这种新奇特的词干分层会混淆算法?

但是其他软件呢?我想说 Pioneer DJ 的 rekordbox 已经小心翼翼地尝试通过最近宣布的人声位置功能进行更深入的音轨分析。Native Instruments 可能会因为免费的 Stems 会扼杀他们真正的 Stems 项目而感到震惊,尽管我认为他们从来没有真正参与过它。

评论者已经在关注 Serato 以做出回应。我怀疑他们会太担心人们从 Serato DJ Pro 迁移到 djay 和 VirtualDJ,但这可能会让新 DJ 的头脑不再那么固守在特定的生态系统中。

超越软件
眼前的问题是让它与硬件一起工作。短期内,您可以移动地图控制器,但这是一个即时的解决方法实施,而不是一个合适的解决方案。

连锁反应将是一系列新的完整控制器,旨在让硬件直接访问这些新功能。刚刚看到一棵新的摇钱树,我敢肯定该行业正在集体搓手。正如我们所说,产品经理将研究如何以硬件形式实现这些新功能。

我敦促业界谨慎——此时并不是每个人都想使用这种源分离技术,所以不要急于将它提供给每个人。采取一些小步骤来提供一些模块化控制器解决方案,然后看看哪些最先成功。这可能还不是可以快速融入您的范围的技术。

对于大多数人来说,尤其是调音台用户,动手使用模块化控制器(如Kontrol X1或Korg Nano)并亲自体验这项新功能可能是明智之举。如果这个功能起飞,跟上竞争对手的步伐,一个高人一等的决定硬件流失也将同样迅速。

此外,考虑到独立性能的发展,我们在硬件中看到这种情况也发生只是时间问题。看起来已经令人惊叹的Denon DJ SC6000/M Primes的潜在更新获得了下一个主要 USP。也许我会等待那些会到来的。
加起来
戴上我的编辑的帽子,我已经有一段时间没有经历过糟糕的时刻了。尽管近年来有一些硬件实现了这一点,但没有一个是真正的革命。在过去的几十年里,你可以用手指数一数。

但对我来说,音源分离为我们向人群播放音乐的方式提供了下一个真正的转变。当我们回顾我们现在认为理所当然的事情时,它们都是从某个地方开始的,并且按照现代标准来看非常糟糕,并且无论如何都应该注定要失败。

一开始,DVS 延迟感觉更像是一种延迟效果,而不是一种功能。但是这个承诺是如此强大,以至于人们坚持了下来。我对此也有同感。

它提供工作室级别的词干吗?当然不是。任何人都说它永远不会是不明智的,因为我们距离 Spleeter 的推出只有七个月,而且这些算法只能显着改进,就像数字音频压缩和 DVS 延迟一样。

但这是一个开始,也是一个非常好的开始。我完全沉浸在音乐中两个小时,甚至没有注意到质量下降。这纯粹是纯粹的乐趣,让我更多地思考可能性而不是声音。

最大的考验不是我们 DJ 的耳朵,而是观众的耳朵。如果还不够好,他们很快就会告诉您。当然,挑剔的观众只会对通过价值 5000 英镑的旋转播放器播放的无损录音感到满意,尽管 Void 音响系统不会有任何这些废话。但即使在早期,我敢肯定您的普通听众也会喜欢在以前陌生的节拍上欣赏人声。便宜的啤酒和几颗药片可以让任何东西听起来都很棒。

很长一段时间以来,我都没有对 DJ 的未来如此兴奋过。它终于朝着我多年来一直想要的方向发展。
您所在的用户组只能看到部分内容.
如查看全部内容, 请先登錄或者註冊.
附件: 您需要登錄才可以下載或查看附件。沒有帳號?註冊
收藏 分享