Refold Drafts 压缩音频提高被动沉浸效率

(本系列内容整理自 Matt 的相关视频,文本由语音转录翻译而成,可能存在一定偏差)
视频链接:Optimizing Passive Immersion: Condensed Audio
(注:该视频发布于5年前,当前压缩音频软件推荐 Condenser

  • 优化语言习得不仅要看沉浸时长(量),也要看沉浸质量,其中一个重要因素是语言密度。
  • 语言密度指单位时间内接触到的目标语言量;播客等音频密度高,影视剧因画面叙事密度较低。
  • 通过 subs2srs 提取影视剧每句对话的音频,再用脚本去除静音片段,合并成高密度音频文件用于被动沉浸。

沉浸的量与质

在 Refold(原 Mass Immersion Approach)中,我们高度重视沉浸在外语习得中的作用。谈到沉浸,时长(量)固然极其重要,我们花了很多时间讨论这一点。但如果想完全优化语言习得过程,我们还必须考虑沉浸的质量。

沉浸质量的要素:语言密度

沉浸质量涉及多个因素,比如你的注意力质量(你投入了多少注意力),以及与沉浸材料本身相关的因素,如其可理解性(comprehensibility)、你对它的喜爱程度等等。此外,还有一个我们需要考虑的重要因素是沉浸材料的语言密度(language density)。

语言密度可以定义为:在你花费的每一个小时消费目标语言内容的时间里,你实际接触到了多少语言量?

举个例子,像播客(Podcast)这类材料,它们的语言密度极高。因为在播客的整个时长里,人们通常一直在说话,中间几乎没有或完全没有空白时段。

相对地,对于像电影或电视剧这样的视觉媒介,由于可能存在通过视觉画面进行叙事的部分,就会有无人说话、没有对话的片段。因此,在这些时段你实际上并没有接触到目标语言。

语言密度的重要性

显然,一段沉浸材料的语言密度越高,它作为语言学习者的你的价值就越大。

然而,不幸的是,语言密度最高的沉浸材料,例如广播节目、播客、小说等,对于初学者和中低阶学习者来说,往往难以理解和接触。

提高影视材料语言密度的方法

所以,在本视频中,我将向你展示如何处理像电视剧和电影这样的材料,提高它们的沉浸密度,特别是为了被动沉浸(passive immersion)。

技术说明:Subs2srs 与音频合并

我马上要解释这个技术,但我想先提醒一下,乍听之下可能有点复杂,不过一旦你看到我的实际演示,就会觉得非常简单了。请耐心看下去。

这项技术依赖于一个叫做 subs2srs 的程序,如果你在看这个视频,可能已经知道了。subs2srs 可以让你导入一个视频文件和对应的目标语言字幕文件,然后生成一个 Anki 卡组。这个卡组会为你导入的节目中的每一句台词创建一个卡片,并且附带从原节目中提取的该句台词的音频。

我们要做的就是,利用 subs2srs 生成卡组时导出的所有音频文件(通常是 MP3 格式),并将它们合并成一个单一的音频文件,用于被动沉浸。

我的意思是,当你制作 subs2srs 卡组时,程序会导出很多 MP3 文件,这些文件基本上对应了原始视频文件中每一次有人说话的片段。所以,如果我们把这些单独的音频文件合并起来,我们就会得到一个去除了所有空白(静音)片段的原始节目音频。这个文件将充满从头到尾连续不断的语音。

我最近在处理我看过的中文节目时就在用这个方法。我发现,如果我把一个大约 40 分钟的节目用 subs2srs 处理,然后使用这个技术,最终得到的音频文件大约只有 20 分钟长。这意味着时长减少了整整 50%!也就是说,听这个合并后的浓缩音频文件,你获得的沉浸量是听原始音频的两倍。

工具与演示:mp3Combiner

Yoga 已经为大家编写了一个脚本,使得在 Mac 和 PC 上都能极其方便地完成这个操作。接下来,我将进行演示,展示它如何工作,以及实际上有多么简单。

PC 端演示

我将在我的 PC 上进行演示,视频最后也会附上 Mac 上的操作片段。

  1. 下载与解压:我会把 mp3Combiner.zip 的下载链接放在描述中。下载并解压它,你会得到一个 mp3Combiner 文件夹,把它存到你电脑上任何方便的位置。

  2. 文件夹内容:mp3Combiner 文件夹里只有两个简单的文件:

    • combiner.bat:这是 Yoga 编写的脚本,用于运行 mp3cat.exe 来处理文件夹内的所有 MP3 文件。
    • mp3cat.exe:这是一个我们在 GitHub 上找到的第三方程序(GitHub 链接也会放在描述中),用于合并 MP3 文件。它的特别之处在于,合并前会移除所有 MP3 文件的元数据(metadata)和文件识别信息。这对于创建一个没有损坏、能在任何 MP3 播放器上正常播放的文件非常重要。(如果你不懂代码,不理解这些也没关系,关键是它能确保合并后的文件可用。)一些简单的 MP3 合并方法可能不会移除这些信息,导致最终文件损坏或无法在某些播放器上完整播放。但使用这个视频里展示的方法,可以保证完美运行。
  3. 操作步骤

    • 将你想要合并的所有 MP3 文件(比如从 subs2srs 的 media 文件夹中得到的)复制并粘贴到 mp3Combiner 文件夹中。(注意:是复制粘贴,不是拖拽或移动。因为运行脚本后,原始的 MP3 文件会被删除。如果你之后还想用这些原始文件导入 Anki,就需要保留它们的原件。)
    • 双击运行 combiner.bat 脚本。
    • 脚本会自动处理,移除所有单个 MP3 文件,并留下一个名为 combined.mp3 的新文件。这就是你需要的浓缩音频文件。
  4. 首次运行注意:第一次运行 combiner.bat 时,你的杀毒软件或系统(如 Windows Defender SmartScreen)可能会阻止它,提示是未识别的软件。请确保你给予运行权限。这只是个简单的脚本,不是病毒。这种情况只会在首次运行时发生。

  5. 结果:现在你可以听一下这个 combined.mp3 文件。你会发现,整个文件几乎都是连续的对话,空白(静音)时间极少。例如,我用《银河英雄传说》第一集(原长 24 分钟)制作的浓缩音频只有 11 分 3 秒,长度不到一半,密度却提高了一倍。这意味着你能获得快得多的进步。

  6. 后续处理:你可以把这个 combined.mp3 文件移动到任何地方,重命名(比如 ginga01.mp3),然后放到你的 MP3 播放器或其他设备上。重要提示:在下次使用 mp3Combiner 文件夹合并其他音频之前,请确保将已生成的 combined.mp3 文件移出该文件夹,否则可能导致处理出错。

Mac 端演示

在 Mac 上的操作基本相同,但有一个额外的步骤:

  1. 默认权限问题:在 Mac 上,默认情况下你不能直接执行一个脚本,除非你授予它执行权限。

  2. 授予权限:我们需要给 Terminal(终端)权限来执行这个脚本。

    • 首先,像解压其他 zip 文件一样,解压 mp3Combiner.zip。

    • 右键点击解压后的 mp3Combiner 文件夹,选择“服务” (Services) → “新建位于文件夹位置的终端窗口” (New Terminal at Folder)。(译注:根据 macOS 版本不同,选项可能是 “New Terminal Tab at Folder” 或类似名称)

    • 在打开的终端窗口中,输入以下命令(我也会把这个命令放在描述中,方便你复制粘贴):
      chmod +x combiner.command

    • 按下回车键。这样就授予了执行权限。这个授权操作只需要做一次,之后就不用再做了。

  3. 合并音频:完成授权后,你就可以像在 PC 上使用 combiner.bat 一样,通过双击 combiner.command 文件来合并放在 mp3Combiner 文件夹里的 MP3 文件了。

结合主动与被动沉浸

可能有些人还记得我之前做过一个关于听力沉浸的视频(链接在描述中)。我在视频里谈到,我推荐给初学者和中级学习者的沉浸方式是:

  • 主动沉浸 (Active Immersion):观看你从未见过的内容。
  • 被动沉浸 (Passive Immersion):重听你之前主动观看过的材料的音频。

这种制作浓缩音频的技术与上述方法完美契合。

当你第一次主动观看某材料时,你当然需要观看完整版,不加压缩,因为那些空白(静音)片段对于你通过视觉跟上情节、感受对话节奏等都很重要。

但是,一旦你主动观看完毕,你就可以提取音频,将其压缩(去除静音),然后将被动沉浸时听这个浓缩音频文件。这样一来,你的被动沉浸就变得语言密度极高,同时又不会因为跟不上而迷失,因为你第一次观看时已经了解了内容。

简化工作流程

虽然用 subs2srs 等工具制作浓缩音频文件看起来可能需要一些工作,但仔细想想,如果你已经在用 MorphMan,或者只是喜欢用 subs2srs 来方便地为你的 Anki 卡片添加音频,那么大部分工作其实已经完成了。你只需要去 Anki 的 media 文件夹,把相关的音频文件复制粘贴到一个单独的文件夹,然后运行一下刚才演示的脚本就行了。

所以,如果你正在结合使用我频道里谈到的各种技术,比如主动/被动沉浸结合同一材料、使用 MorphMan 和 subs2srs 等,那么我认为建立一个能轻松整合这项技术的工作流是完全可能的,并不需要过多地折腾软件。

结语

希望这个方法对大家有用。感谢 Yoga 编写了这个脚本。我们下次再见,感谢观看!