Refold Q&A 词句挖掘是否要考虑词频

(本系列内容摘录自 https://www.youtube.com/@Refold/ 中 Matt 参与的问答。因内容由语音转录翻译而成,文本可能存在一定偏差)

Q:
该如何利用词频表来挑选要制作 Anki 卡片的单词?我是个日语学习者,目前在 2B 阶段,已经做了 2500 张句子卡了。沉浸和查词的时候,我一般不考虑那些词频在一万以后的词。但总觉得我对此太神经质了,而且感觉这会让我错过一些在我的领域里很重要、但整体上不那么常见的词。比如说,在学校生活/日常类型的动画里,‘田径社’这个词可能很重要,但它整体词频肯定不高。那么,我应该如何把握制卡的词频呢?

A:
我没怎么考虑词频表这个东西,查词的时候也从来不用。因为,不同的词频表会非常不同,这取决于制作词频表所用的语料来源。

比方说,如果你有一个通用的日语词频表,它涵盖了各种各样的内容,那它和专门针对动漫制作的词频表肯定大相径庭。所以,如果你参考那个通用的词频表,它并不能有效引导你朝预期的方向前进。因为如果你主要沉浸在动漫里,那么最重要的就是提升你对动漫的理解能力。

就像你说的,对你来说,「田径社」这个词可能很重要,但你的词频表可能体现不出这一点。就算你有一个专门针对动漫的词频表,它还是会受到具体节目的影响。

当然,长远来看,你希望的是能够理解一切。所以,就算你学了一个比较冷僻的词,也许当下不是最有用,但假设你的目标是达到高水平的流利,那你最终还是会需要知道这个词的。所以,这并不算什么损失,对吧?

另一方面,如果你为那些特别吸引你、或者感觉很有趣、或者出现在一个很酷的句子里的词制作卡片,这样会给你带来情感上的满足感,这些词会更容易记住,复习起来也更愉快。因为有趣的东西本身就更容易被记住。所以我觉得,就算不参考词频表会损失一点效率,但通过享受这个过程,你会把效率重新补回来,而且会觉得学习更有趣,所以记忆会更容易形成,并且在整个过程中保持得更好。

最后,你通常可以只运用常识来判断词频和单词的重要性。比如说,如果你查到一个词,发现它是某种特定花的名字,或者某种你甚至在母语里都没听说过的化合物,那么很显然,你可能不需要知道那个词。而像「田径社」这样的词,很可能是一个你想要掌握的基础词汇。

所以,我会结合运用常识和个人兴趣来做决定一个单词是否制卡。另外,如果某个词给你的感觉很熟悉,这表明你过去可能见过很多次,反过来也说明它可能很常见,所以也应该优先考虑这些词。如果某个词感觉你以前从未见过,那么也许要三思而后行,看看你是否真的想添加它。

总的来说,如果你只是用这种方式运用常识,就不会偏离太远。而且,这样做更有趣,你不必担心自己太神经质。

如果你还在 Refold 的第 1 阶段,使用预制牌组学习词汇,那这个牌组应该是基于词频的,这样可以让你获得最大的收益。但当涉及到词句挖掘时,很大程度上取决于什么词句对你来说很突出,什么词句哪些吸引你及对你有意义。所以我真的不认为你需要经常参考词频表。特别是当你觉得这让你变得神经质的情况。

最后,既然你一直都在使用词频表,不妨试试另一个极端。尝试一两个月不使用词频表,看看感觉如何,然后也许你可以考虑找到一个中间状态。我认为现在你从未体验过不使用词频表的情况。所以,从那里过渡到一个更温和的状态,实际上可能比直接走向另一个极端、完全扔掉词频表更难。

一旦你有了来自这两个极端的直接经验,你可能就能更自然地找到最适合你的方式,也许你会选择中间的某个状态。但即便如此,我认为你只有在体验了另一个极端之后才能真正做到这一点。所以这就是我的建议。

(注:目前推荐的 yomitan 日语词频词典主要有基于动漫语料的 JPDBV2 和基于现代书面语料的 BCCWJ,问答中有一种情况没有涉及,当出现一个虚词或习语时,有时候从常识很难判断其是否生僻,参照一下词频会更好选择。而且,虽然最终的词汇量可能会包括一些现在还不大用的到的词汇,但大量学习这种暂时用不上的词汇实际上是严重降低了学习效率的,制卡、刷卡都是有成本的。如果主要是用动画沉浸,建议可以给词频定个粗略的标准,比方个人目前定的 JPDBV2 或 BCCWJ 在 20000 之内。当然,问答里说的,有趣的词句不受此限)