Refold Drafts 压缩音频提高被动沉浸效率

Roamer · 2025 年5 月 3 日 09:52

（本系列内容整理自 Matt 的相关视频，文本由语音转录翻译而成，可能存在一定偏差）
视频链接：Optimizing Passive Immersion: Condensed Audio
（注：该视频发布于5年前，当前压缩音频软件推荐 Condenser）

优化语言习得不仅要看沉浸时长（量），也要看沉浸质量，其中一个重要因素是语言密度。

语言密度指单位时间内接触到的目标语言量；播客等音频密度高，影视剧因画面叙事密度较低。

通过 subs2srs 提取影视剧每句对话的音频，再用脚本去除静音片段，合并成高密度音频文件用于被动沉浸。

沉浸的量与质

在 Refold（原 Mass Immersion Approach）中，我们高度重视沉浸在外语习得中的作用。谈到沉浸，时长（量）固然极其重要，我们花了很多时间讨论这一点。但如果想完全优化语言习得过程，我们还必须考虑沉浸的质量。

沉浸质量的要素：语言密度

沉浸质量涉及多个因素，比如你的注意力质量（你投入了多少注意力），以及与沉浸材料本身相关的因素，如其可理解性（comprehensibility）、你对它的喜爱程度等等。此外，还有一个我们需要考虑的重要因素是沉浸材料的语言密度（language density）。

语言密度可以定义为：在你花费的每一个小时消费目标语言内容的时间里，你实际接触到了多少语言量？

举个例子，像播客（Podcast）这类材料，它们的语言密度极高。因为在播客的整个时长里，人们通常一直在说话，中间几乎没有或完全没有空白时段。

相对地，对于像电影或电视剧这样的视觉媒介，由于可能存在通过视觉画面进行叙事的部分，就会有无人说话、没有对话的片段。因此，在这些时段你实际上并没有接触到目标语言。

语言密度的重要性

显然，一段沉浸材料的语言密度越高，它作为语言学习者的你的价值就越大。

然而，不幸的是，语言密度最高的沉浸材料，例如广播节目、播客、小说等，对于初学者和中低阶学习者来说，往往难以理解和接触。

提高影视材料语言密度的方法

所以，在本视频中，我将向你展示如何处理像电视剧和电影这样的材料，提高它们的沉浸密度，特别是为了被动沉浸（passive immersion）。

技术说明：Subs2srs 与音频合并

我马上要解释这个技术，但我想先提醒一下，乍听之下可能有点复杂，不过一旦你看到我的实际演示，就会觉得非常简单了。请耐心看下去。

这项技术依赖于一个叫做 subs2srs 的程序，如果你在看这个视频，可能已经知道了。subs2srs 可以让你导入一个视频文件和对应的目标语言字幕文件，然后生成一个 Anki 卡组。这个卡组会为你导入的节目中的每一句台词创建一个卡片，并且附带从原节目中提取的该句台词的音频。

我们要做的就是，利用 subs2srs 生成卡组时导出的所有音频文件（通常是 MP3 格式），并将它们合并成一个单一的音频文件，用于被动沉浸。

我的意思是，当你制作 subs2srs 卡组时，程序会导出很多 MP3 文件，这些文件基本上对应了原始视频文件中每一次有人说话的片段。所以，如果我们把这些单独的音频文件合并起来，我们就会得到一个去除了所有空白（静音）片段的原始节目音频。这个文件将充满从头到尾连续不断的语音。

我最近在处理我看过的中文节目时就在用这个方法。我发现，如果我把一个大约 40 分钟的节目用 subs2srs 处理，然后使用这个技术，最终得到的音频文件大约只有 20 分钟长。这意味着时长减少了整整 50%！也就是说，听这个合并后的浓缩音频文件，你获得的沉浸量是听原始音频的两倍。

工具与演示：mp3Combiner

Yoga 已经为大家编写了一个脚本，使得在 Mac 和 PC 上都能极其方便地完成这个操作。接下来，我将进行演示，展示它如何工作，以及实际上有多么简单。

PC 端演示

我将在我的 PC 上进行演示，视频最后也会附上 Mac 上的操作片段。

下载与解压：我会把 mp3Combiner.zip 的下载链接放在描述中。下载并解压它，你会得到一个 mp3Combiner 文件夹，把它存到你电脑上任何方便的位置。
文件夹内容：mp3Combiner 文件夹里只有两个简单的文件：
- combiner.bat：这是 Yoga 编写的脚本，用于运行 mp3cat.exe 来处理文件夹内的所有 MP3 文件。
- mp3cat.exe：这是一个我们在 GitHub 上找到的第三方程序（GitHub 链接也会放在描述中），用于合并 MP3 文件。它的特别之处在于，合并前会移除所有 MP3 文件的元数据（metadata）和文件识别信息。这对于创建一个没有损坏、能在任何 MP3 播放器上正常播放的文件非常重要。（如果你不懂代码，不理解这些也没关系，关键是它能确保合并后的文件可用。）一些简单的 MP3 合并方法可能不会移除这些信息，导致最终文件损坏或无法在某些播放器上完整播放。但使用这个视频里展示的方法，可以保证完美运行。
操作步骤：
- 将你想要合并的所有 MP3 文件（比如从 subs2srs 的 media 文件夹中得到的）复制并粘贴到 mp3Combiner 文件夹中。（注意：是复制粘贴，不是拖拽或移动。因为运行脚本后，原始的 MP3 文件会被删除。如果你之后还想用这些原始文件导入 Anki，就需要保留它们的原件。）
- 双击运行 combiner.bat 脚本。
- 脚本会自动处理，移除所有单个 MP3 文件，并留下一个名为 combined.mp3 的新文件。这就是你需要的浓缩音频文件。
首次运行注意：第一次运行 combiner.bat 时，你的杀毒软件或系统（如 Windows Defender SmartScreen）可能会阻止它，提示是未识别的软件。请确保你给予运行权限。这只是个简单的脚本，不是病毒。这种情况只会在首次运行时发生。
结果：现在你可以听一下这个 combined.mp3 文件。你会发现，整个文件几乎都是连续的对话，空白（静音）时间极少。例如，我用《银河英雄传说》第一集（原长 24 分钟）制作的浓缩音频只有 11 分 3 秒，长度不到一半，密度却提高了一倍。这意味着你能获得快得多的进步。
后续处理：你可以把这个 combined.mp3 文件移动到任何地方，重命名（比如 ginga01.mp3），然后放到你的 MP3 播放器或其他设备上。重要提示：在下次使用 mp3Combiner 文件夹合并其他音频之前，请确保将已生成的 combined.mp3 文件移出该文件夹，否则可能导致处理出错。

Mac 端演示

在 Mac 上的操作基本相同，但有一个额外的步骤：

默认权限问题：在 Mac 上，默认情况下你不能直接执行一个脚本，除非你授予它执行权限。
授予权限：我们需要给 Terminal（终端）权限来执行这个脚本。
- 首先，像解压其他 zip 文件一样，解压 mp3Combiner.zip。
- 右键点击解压后的 mp3Combiner 文件夹，选择“服务” (Services) → “新建位于文件夹位置的终端窗口” (New Terminal at Folder)。（译注：根据 macOS 版本不同，选项可能是 “New Terminal Tab at Folder” 或类似名称）
- 在打开的终端窗口中，输入以下命令（我也会把这个命令放在描述中，方便你复制粘贴）：
  chmod +x combiner.command
- 按下回车键。这样就授予了执行权限。这个授权操作只需要做一次，之后就不用再做了。
合并音频：完成授权后，你就可以像在 PC 上使用 combiner.bat 一样，通过双击 combiner.command 文件来合并放在 mp3Combiner 文件夹里的 MP3 文件了。

结合主动与被动沉浸

可能有些人还记得我之前做过一个关于听力沉浸的视频（链接在描述中）。我在视频里谈到，我推荐给初学者和中级学习者的沉浸方式是：

主动沉浸 (Active Immersion)：观看你从未见过的内容。
被动沉浸 (Passive Immersion)：重听你之前主动观看过的材料的音频。

这种制作浓缩音频的技术与上述方法完美契合。

当你第一次主动观看某材料时，你当然需要观看完整版，不加压缩，因为那些空白（静音）片段对于你通过视觉跟上情节、感受对话节奏等都很重要。

但是，一旦你主动观看完毕，你就可以提取音频，将其压缩（去除静音），然后将被动沉浸时听这个浓缩音频文件。这样一来，你的被动沉浸就变得语言密度极高，同时又不会因为跟不上而迷失，因为你第一次观看时已经了解了内容。

简化工作流程

虽然用 subs2srs 等工具制作浓缩音频文件看起来可能需要一些工作，但仔细想想，如果你已经在用 MorphMan，或者只是喜欢用 subs2srs 来方便地为你的 Anki 卡片添加音频，那么大部分工作其实已经完成了。你只需要去 Anki 的 media 文件夹，把相关的音频文件复制粘贴到一个单独的文件夹，然后运行一下刚才演示的脚本就行了。

所以，如果你正在结合使用我频道里谈到的各种技术，比如主动/被动沉浸结合同一材料、使用 MorphMan 和 subs2srs 等，那么我认为建立一个能轻松整合这项技术的工作流是完全可能的，并不需要过多地折腾软件。

结语

希望这个方法对大家有用。感谢 Yoga 编写了这个脚本。我们下次再见，感谢观看！

话题	回复	浏览
Refold Drafts 主动沉浸与被动沉浸的最佳比例语言 · 语料 refold , 二语习得	5	2025 年4 月 28 日
Refold Drafts AJATT 听力沉浸指南语言 · 语料二语习得 , refold	5	2025 年5 月 21 日
Refold Drafts 如何复习句子卡片语言 · 语料 refold , 二语习得	9	2025 年4 月 27 日
Refold Q&A 能否通过音频进行 Anki 式的学习语言 · 语料二语习得 , refold	9	2025 年1 月 24 日
Refold Q&A 总是开启目标语言字幕有害吗？语言 · 语料 refold , 二语习得	10	2025 年4 月 4 日
Refold Drafts SRS 的滥用与反思语言 · 语料 refold , 二语习得	4	2025 年5 月 16 日