(本系列内容整理自 Matt 的相关视频,文本由语音转录翻译而成,可能存在一定偏差)
视频链接:Why You Still Can’t Understand Your Target Language
- 许多语言学习者错误地认为只需记忆词汇和语法,而忽略了通过大量接触目标语言来培养理解能力。
- 语言理解是一种需要通过大量练习(即沉浸式听力和阅读)培养的“能力”,而非仅仅通过学习获得的“知识”。
- 掌握听力理解需要发展潜意识层面的微技能,如辨音、处理连读和利用语境,这只能通过大量听力输入实现。
(电影片段)
女: 你从什么时候开始说意大利语的?
男: 哦,自我提升月。
(Matt): 表面上看,学会理解一门外语似乎并不那么困难。只要记住几千个单词和几百个语法结构,基本上就差不多了。是的,这听起来确实需要大量记忆,但至少这方法直接又简单,对吧?
(Anki 图标出现)
这是我见过的语言学习者中最常见的一种思维定式。持有这种想法的人通常不会花太多时间真正在目标语言中做些什么,比如看电视节目或阅读书籍。相反,他们主要专注于记忆更多的词汇和语法。
如果你问这些人为什么不花时间接触目标语言,他们通常会说,是因为他们还听不懂或看不懂。既然大部分内容都无法理解,为什么要花时间去看一部电视剧或读一本书呢?这似乎完全是浪费时间。因此,一个看似更明智的策略是:继续专注于记忆词汇和语法结构,推迟接触原生内容(native content),直到掌握了足够多的语言知识,能够理解大部分内容为止。
理论上,这种方法看起来非常合理。但实际上,这可能是一个真正的陷阱。原因是,无论你记住多少单词和语法结构,单靠这些永远不足以让你真正具备理解目标语言的能力。
(文字出现:知识 vs 能力)
这其中的原因归结为一个事实:知识(knowledge)和能力(ability)是两回事。在这里,“知识”指的是关于某个主题的事实和信息,而“能力”指的是执行特定任务所需的实际技能。知识可以通过学习(study)获得,但能力只能通过练习(practice)获得。在本视频中我会阐明,理解一门外语需要非凡的能力,而这反过来又需要大量的练习才能培养。
起初,将知识和能力区分开来应用到语言学习上,可能有点反直觉。为了更好地说明我的观点,让我们先把它应用到一个更容易理解的概念上:游泳。
游泳的类比:知识 vs 能力
想象一下,一个从未下过水的人决定学习游泳。他决定从蛙泳开始学,于是花了五个小时观看 YouTube 上所有的蛙泳教学视频。五小时后,这位假设中的学习者对蛙泳的原理以及如何移动身体来完成动作有了完美的概念性理解。那么,当这个人第一次跳进泳池时,他能游蛙泳吗?当然不能。因为游泳的能力需要通过实际练习来培养,知识永远无法替代实际练习。
这并不是说通过看 YouTube 视频获得的知识没有帮助。扎实的概念性理解可以帮助你更有效地练习,更容易识别错误。但归根结底,知识不过是一张地图,而地图并非实际的疆域。为了真正学会蛙泳,这个人必须花几个小时去尝试——并且会失败——练习蛙泳。只有通过反复试错的物理过程,他的大脑才能弄清楚到底该如何移动手臂和腿来保持漂浮。而且,很可能当他最终掌握技巧后,回过头会发现,当初通过观看视频形成的对蛙泳的概念性理解其实有些偏差。
这就是理论与实践的区别。正如尤吉·贝拉(Yogi Berra)的名言所说:“理论上,理论与实践没有区别。实践中,却有区别。”
(标题卡:理论 vs 实践)
关于理论与实践,我已经有了一个完整的视频专门讨论,所以这里不再赘述。简而言之,在生活的许多领域,仅仅通过学习而不进行任何直接的实践所能达到的理解深度是极其有限的。理论知识在指导实践方面非常有用,但它永远不能替代实践本身。基本上,对蛙泳的理论理解并不能保证你在跳入泳池时不会沉下去。
将“知识 vs 能力”应用于语言理解
好了,现在让我们谈谈“知识 vs 能力”这个概念如何实际应用于理解一门外语。
接收语言并将其转化为意义的过程,实际上是一项极其复杂的活动。它需要你的大脑同时运用一系列不同的**微技能(micro-abilities)**才能顺畅运作。我所说的“微技能”,就像游泳一样,是指需要通过实际练习才能培养的技能。
我最初准备这个视频的稿子时,本打算详细介绍我能想到的所有这些微技能。但我很快意识到,内容实在太多,无法放进一个视频里。
(维恩图出现)
因此,我决定将本视频的范围限定在理解口语所特有的能力上。至于理解口语和书面语都必需的能力,以及书面语理解的特有难点,则留到将来的视频中讨论。而且,看这视频的长度就知道,由于我实在缺乏简洁表达的能力,即使是这样限定范围,内容可能还是有点多了。
听力理解的独特挑战
与阅读相比,听力理解主要存在两个独特的困难。
首先,口语自带一种时间限制。阅读时,你可以花任意多的时间去回想词义、思考语法。但听的时候,为了跟上对话,你几乎需要以别人说话的同样速度去理解,而人们说话通常很快。关于这一点,我会在视频末尾进一步讨论。
其次,也是本视频将重点讨论的,听力理解的第二个独特困难在于:**听的时候,需要由你来判断实际说出的到底是哪些词。**换句话说,阅读时,每个词都清晰地写在纸上或屏幕上。除了字体上的细微差别,单词看起来总是一样的。这意味着,在大多数情况下,如果你能在一种情境下认出一个词,那么在任何情境下你都能自动认出它。然而,对于口语来说,识别你听到的词语要困难得多。
(普通话片段)
可以说,在语言学习的初始阶段,最常见的经历之一就是:听到目标语言里的一段话,完全听不出哪怕一个词,但检查文字记录或字幕后,却发现你实际上认识其中一部分甚至所有单词。你“认识”这些词,但你“听”不出来。它们就那样从你耳边溜走了。这就是我所说的知识与能力的区别。
需要强调的是,我并不是说背单词没用。事实上,我专门做过一期视频,解释为什么我认为背单词是个非常好的主意。我想说的是,当你观看一部没有字幕的目标语言电视剧,然后立刻带目标语言字幕再看一遍同样的内容时,你很可能会发现其中有很多你认识却没注意到的词。这种“认识”与“能可靠地听到”之间的差距应该让你意识到,词汇知识并非听力理解的唯一必要成分。
识别口语单词所需的三种微技能
因此,在本视频中,我认为除了词汇知识之外,你还需要培养三种不同的能力,才能在听目标语言时可靠地识别单词。
(文字出现:识别单词所需的微技能:1. 2. 3.)
它们是:
- 准确感知音素(phoneme)的能力
- 直觉地处理连读(connected speech)中语音变化的能力
- 利用语境(context)解决语音模糊性(phonetic ambiguity)的能力
我认为,如果这三种能力中的任何一种缺失,那么无论你有意识地学习了多少单词,你在听的时候都会一直难以识别单词。我还认为,就像游泳一样,这些能力无法通过任何有意识的学习获得,它们只能通过投入大量时间听目标语言来培养。
1. 准确感知音素的能力
你需要掌握的第一项也是最明显的能力,就是能够准确区分目标语言中使用的所有不同声音,即音素。我的意思是,当你刚开始听一门新的外语时,很可能会遇到一些在你的母语中不存在的元音、辅音,或者根据语言不同,还有其他语音特征(如声调或音高重音),而你暂时还无法感知它们。
举个我个人的例子,我学普通话断断续续有好几年了(但因为老是放弃,其实没什么进展)。普通话里有一些元音和辅音,在英语母语者听来非常相似。例如,“香”(xiāng)和“商”(shāng),或者“江”(jiāng)和“张”(zhāng)。我已经到了能比较好地区分单个发音的程度,但在快速的母语者语速的句子中,我的大脑通常还是跟不上。
(普通话片段:你在说什么啊?)
在这种情况下,单靠知识是无法解决问题的。我已经学习过普通话的语音系统,对语言中存在的所有不同元音、辅音和声调,包括它们具体的舌位和口型,都有不错的理论理解。但这并不能改变一个事实:在听快速的普通话时,我就是没有能力清晰地听出那些相似音之间的区别。
就像学习游泳的唯一方法是真正跳进泳池一样,要提高我在实时语流中区分普通话元音和辅音的能力,唯一的途径就是进行实际练习。而练习这项能力最简单、最直接,也是在我看来最有效的方法,就是花大量时间听目标语言的全速语音。你的大脑是一台模式识别机器,只要给它足够的机会,它自然会越来越擅长解析目标语言的声音。
值得注意的是,你对一个语音系统的整体熟悉程度,很大程度上独立于你对语法和词汇的知识。下面的练习可以帮助说明这一点:
(音频:尽力大声重复以下短语)
(音频 1:普通话 - 宰相肚里好撑船)
(音频 2:胡言乱语 - Jodangle Cropisbundy)
(音频 3:日语 - 代表取締役)
第一个短语是普通话,第二个是胡言乱语,第三个是日语。如果你觉得第二个短语最容易重复,那是因为尽管它毫无意义,但它完全符合英语的语音规则。如果你在看这个视频,那你很可能已经完全掌握了英语的语音系统。正是这种对英语语音系统的熟悉,让你的大脑能够毫不费力地解析英语单词的组成音,即使是那些你从未听过的词。
这项能力至关重要,因为如果你听不清发音,显然就很难确定说的是什么词。
在掌握目标语言的语音系统方面,学习语音学肯定是有用的。但是,要真正做到像处理英语一样准确、毫不费力地解析目标语言的音素,唯一的办法就是进行数百小时的练习。如前所述,我认为最好的练习方式就是花大量时间听目标语言的全速语音。记住,你能流利地重复听起来像英语的胡言乱语,这意味着你对语音系统的熟悉程度很大程度上独立于你的语法和词汇知识。因此,练习,也就是听目标语言的母语语音,从你开始学习的那一刻起就非常有益。
2. 直觉处理连读语音变化的能力
(文字出现:识别单词所需的微技能:… 2. 直觉地处理连读中语音变化的能力)
你需要掌握的第二项能力,是能够下意识地处理**连读(connected speech)**的特征。在语言学中,连读指的是在自然的口语中单词如何串联在一起。
你看,正如人类语音的示波图所显示的,我们说话时通常不会在单词之间留出明显的空隙。这乍听可能令人惊讶,但仔细想想,在每个词后都停顿会使说话变得非常缓慢和笨拙。相反,我们会把单词**混合(blend)和连接(link)**在一起,以尽可能减少说话时的物理负担。这种连接常常导致单词在连读中的发音与单独发音时有显著不同。
例如,在美式英语中,有一种现象叫做侵入(intrusion),即在两个相邻发音的单词之间插入一个新的音。比如,当 “he” 和 “asked” 在连读中一起发音时,它们之间会插入一个 “y” 音,变成 “he-yasked”,而不是 “he asked”。(片段:He-yasked that it be delivered upon his death)
类似地,当 “do” 和 “it” 一起发音时,它们之间会插入一个 “w” 音,变成 “do-wit”,而不是 “do it”。(片段:Just do-wit!)
另一方面,还有一种现象叫做省略(elision),即由于两个单词一起发音而导致某些音被完全省略。例如,在 “next door” 中,“next” 末尾的 “t” 音被完全省略,变成 “nex-door”。(片段:The rising big power nex-door) 或者,在 “most common” 中,“most” 末尾的 “t” 音被省略,变成 “mos-common”。(片段:And the mos-common reason we’re told not to worry is time)
此外,还有同化(assimilation)现象,即两个音混合在一起形成一个全新的音。例如,“don’t you” 常常会变成 “don-chew”,“t” 和 “y” 音组合成类似 “ch” 的音。(片段:Little bit cryptic, don-chew think?)
而这些还仅仅是连读中可能发生的所有不同语音变化的冰山一角。
如果你英语流利,那么理解像**(片段:Doncha wanna be happy?)这样的短语就不会有任何困难。因为你的大脑已经知道,当 “don’t” 和 “you” 相邻时,它们会混合成 “don-chew”,当后面跟着 “want” 时进一步变成 “doncha”,而当 “want” 和 “to” 相邻时,它们会混合成 “wanna”。“Doncha-wanna”。(片段:Doncha wanna be happy?)**
但不难想象,一个刚开始学英语作为第二语言的人,可能会期望 “don’t” 总是发成 “don’t”,“you” 总是发成 “you”,无论上下文如何。所以,即使他们能清楚地听出英语母语者口中的每个元音和辅音,他们仍然可能难以识别说的是什么词。
根据你正在学习的语言,你也许能找到一些资源来解释这类语音变化发生的时机和方式规则。但是,就像你不能只通过看 YouTube 视频就学会游泳一样,单靠记忆这些规则本身并不能真正提高你的理解能力。
因为母语者语速非常快,而且发音在连读中变化剧烈,为了能在实时语流中真正理解口语,你必须训练你的大脑在潜意识层面预期到这些发音变化。而现实中,唯一可能做到这一点的方法就是实际投入数百小时听这门语言。即使你从未明确学习过连读规则,只要你的大脑大量接触这门语言,它就会利用模式识别和语境推断来自己解码其运作方式。这自然会引导你的大脑预期到母语者实际发音的方式。
仔细想想,这很可能就是你学会理解我现在说的英语的方式。
3. 利用语境解决语音模糊性的能力
(文字出现:识别单词所需的微技能:… 3. 利用语境解决语音模糊性的能力)
我在视频开头说过,无论你记住多少词汇,如果你不投入大量时间去实际听你的目标语言,你的听力理解能力永远不会提高。尽管原因有很多,但可以说最根本的原因是你将无法识别单词。基本上,在听目标语言时,即使是你本应“认识”的词,也会从你耳边溜走。
到目前为止,我已经深入探讨了造成这种情况的两个主要原因:没有数小时的听力练习,你将无法准确感知目标语言的所有音素,也无法处理连读中发音变化的各种方式。这两个方面都与你**自下而上(bottom-up)**处理语言的能力有关。我说的“自下而上”是指,你从感知到的声音开始,将这些声音拼凑起来,看它们组成了什么词。
但是,由于口语包含大量的语音模糊性(phonetic ambiguity),单靠自下而上的处理通常不足以识别出说的是什么词。语音模糊性是指多个单词或短语共享完全相同的发音。例如,同音异形异义词(homophones)如 “ate” 和 “eight”,或同形同音异义词(homonyms)如 “bat”(蝙蝠)和 “bat”(球棒),单凭发音不足以确定意图表达的是哪个词。因此,每当你在句子中听到 “ate” 或 “bat” 时,你都必须依赖周围的语境来推断其含义。
这可以被认为是一种**自上而下(top-down)**的处理方式,即利用先验知识来解读耳朵接收到的原始数据。
在连读中,连接(linking)也常常在短语层面上造成语音模糊。例如,在我的美式英语方言中,“got a” 和 “got to” 在句子中发音时都会变成 “gotta”:“I gotta (got a) new car”,“I gotta (got to) go”。另一个例子是 “let her”、“lead her” 和 “letter”。这三者在句子中发音时都变成 “letter”:“I letter (let her) do it”,“I letter (lead her) the wrong way”,“I gotta letter”。在 “bag of chips”、“should have went” 和 “it’s a good movie” 中,“of”、“have” 和 “a” 都发音为 “uh”:“bag-uh chips”,“should-uh went”,“it’s-uh good movie”。
除了这些比较标准的语音变化外,当母语者开始说得很快或含糊不清时,模糊和省略的音素数量往往会继续增加,进一步加剧了模糊性。
对于你流利的语言,每当你遇到这种语音模糊性时,你的大脑会利用对话的语境,以及语调、句法和搭配(collocation)等语言线索,来瞬间推断出预期的含义。事实上,在理解口语时,你的大脑可能至少和依赖自下而上的处理一样多地依赖这种自上而下的过程。之所以你可能感觉不到这一点,只是因为你的大脑速度太快,通常能在模糊的语音进入意识之前就已经解决了其含义。
例如,如果我说:“I have 3 baseball gloves and 2 bats”,你可能根本不会想到我指的是两只宠物蝙蝠。另一方面,如果我们正在动物园排队,我说:“Do you think they have bats?”,你可能根本不会考虑我指的是棒球棒的可能性。
有趣的是,观察这种自上而下过程的最佳时机之一,恰恰是当它出错、你的大脑延迟了一两秒的时候。也许你有过这样的经历:没太听清别人说了什么,问了句“什么?”,但在对方开口重复之前,你就追溯性地意识到他们说了什么。仔细想想,这里真正发生的是,你的耳朵接收到的原始声音不足以确定单词,所以你的大脑必须结合原始声音和基于语境的合理推断来得出答案。而由于某种原因,你的大脑比平时多花了几秒钟才找到答案。
母语语音中包含的大量语音模糊性也是直到最近,语音转文本软件在判断你想说什么方面表现如此糟糕的原因。(片段:Ellen 语音转文本失败) 这不是麦克风质量的问题;而是缺乏利用语境来填补空白的能力的问题。只是在最近几年,语音转文本软件才真正开始变得准确,我猜测其原因是现在采用了更先进的人工智能来帮助预测人们实际想说的话。这也是为什么,在使用语音转文本时,你经常会看到句子开头的词语会一直变化,直到你到达句子末尾。随着软件接收到更多的语境信息,它会不断更新其预测。
我还应该指出,语音模糊性并不是你的大脑依赖自上而下过程来确定所说内容的唯一情况。正是由于大脑惊人的推断能力,我们才有可能理解口音很重的人、低质量的机器人声音以及信号不好的电话通话。在这些情况下,每当对方说话者的发音与你习惯的发音大相径庭时,你的大脑会自动利用语境来推断他们意图表达的词语。
最终,即使是使用相同方言的母语者,每个人说话的方式也都有细微的独特性(个人语型/idiolect)(片段:个人语型是一个人独特的说话方式),这也是为什么能够根据语境进行推断、领会言外之意对于高水平的理解能力来说绝对至关重要的又一个原因。
仔细想想,理解口语很像解数独谜题。在数独中,目标是用数字填满一个 9x9 的网格,使得每列、每行以及九个 3x3 的子网格都包含从 1 到 9 的每个数字。你开始时得到一个部分填充的网格,你的任务是填补剩余的部分。所以基本上,你被提供了一部分答案,然后你必须从中推断出其他所有内容。
类似地,在听口语时,你被提供了关于所说内容的线索(发音),然后你必须利用语境来得出最终的答案。
这个比喻之所以效果很好,原因之一在于,通常情况下,数独谜题开始时填充的方格越少,谜题就越难解,因为你需要从更少的信息中推断出更多内容。
类似地,语音越快、越模糊,发音就变得越模糊不清,你就越需要依赖语境推断来确定所说内容。这就是为什么理解含糊不清的话对语言学习者来说是出了名的困难:他们根据语境进行推断的能力尚未发展成熟。(片段:Migos 含糊不清的说话)
现在,让我们尝试在“知识 vs 能力”的背景下思考这个比喻。你认为看几个教学视频就足以让一个从未解过数独的人在合理的时间内完成一个困难的数独谜题吗?当然不行。我自己也只解过几个数独,但我敢打赌,任何能够快速解决困难数独的人,至少花了 100 个小时来练习。
当然,对于理解口语来说也是如此。存在哪些词?哪些词倾向于和哪些其他词一起使用?哪些词倾向于用在哪些句法结构中,它们通常出现在这些结构中的什么位置?这种语调模式暗示了什么意思?在这种情况下,可能表达的是什么意思,哪些词反映了这些意思?
为了能够可靠地实时理解口语,你的大脑需要能够访问并交叉引用所有这些以及更多问题的答案。试图通过传统的学习达到这一点根本不现实。这就好比试图通过解物理方程来学开车一样。
现实地看,要建立一个足够复杂的内部神经网络来支持这个过程,唯一的途径就是通过数千小时的练习。而当涉及到利用语境的各个方面来准确识别所说单词的这个过程时,练习就意味着大量地接触这门语言,并去尝试、失败、偶尔成功地去理解。
基本上,每次你理解目标语言中的一个句子时,你的大脑就相当于解了一个数独谜题。就像解数独谜题能恰到好处地挑战你、从而逐渐提高你的数独技能一样,通过理解真实的口语片段,你的大脑会逐渐建立起必要的连接,以理解越来越难的语言。
结论
(文字出现:识别单词所需的微技能:… 4. 结论)
好了,到目前为止,我已经谈到了在听口语时识别单词所需的三种不同技能。有两种与自下而上的处理过程相关:能够准确感知音素,以及能够处理连读中的语音变化。还有一种是利用自上而下的处理过程,即利用语境来填补自下而上处理过程中的任何空白。
在整个视频中,我一直在将语言学习与学习游泳进行比较。但是,这些与听力理解相关的技能和像游泳这样更普遍的技能之间有一个重要的区别。对于像游泳这样更普遍的技能,你首先有意识地学习如何去做,然后通过练习,这项技能慢慢变得无意识。但对于理解口语来说,相关的技能很大程度上是从一开始就在无意识中发展起来的。
想想你现在理解我说的英语的体验。假设你很流利,那么在你听到我发出的声音和你理解我说的话之间,几乎没有时间延迟。理解是完全不费力的,甚至到了你想不理解都不行的程度。这就是真正理解语言的感觉。你能理解的部分大多是自动且毫不费力的,而你不能理解的部分则大多是难以理解、难以捉摸的。
当然,偶尔也会有你没听懂、想了一下然后明白了的情况。但这是例外,不是常态。只有当你的无意识能力正好处于理解与不理解的临界线上时,才有可能用有意识的思考来帮助你的大脑倾向于理解的那一边。
例如,在听普通话时,我通常能理解不到 50%。但即使我的理解程度如此之低,我能理解的部分仍然是完全不费力的。我无法做到不去理解它。声音一入耳,就已经被转换成了意义。反过来说,我不能理解的部分,大多听起来就像一团模糊不清的噪音。随着我学习更多单词、听得更多,我能毫不费力理解的普通话比例会增加,而听起来像模糊噪音的比例会减少。但是,我的有意识思维无法有意义地参与到这个提高理解能力的过程中。
这很大程度上与速度问题有关。到目前为止,我在这个视频中的语速大约是每分钟 180 个单词。这大约是每秒 3 个单词。当你考虑到仅仅识别单个单词的过程有多复杂时,这意味着我在这个视频中谈到的三种技能必须在毫秒级的时间内完成,你才能实时理解完整的句子。而唯一可能实现的方式就是通过无意识的本能。对于有意识的思维来说,这个速度实在太快了,跟不上。
现实地说,有意识的思维所能做的,最多就是尽力集中注意力,以便为无意识的思维收集更多数据来进行解码。
这种无意识地获得语言技能的过程,就是所谓的语言习得(language acquisition)。根据语言学家斯蒂芬·克拉申(Stephen Krashen)的观点,语言习得发生的唯一途径就是通过获得该语言的输入(input),换句话说,就是实际地听和读。
所以,尽管理解语言和游泳一样,都需要通过练习才能培养真正的技能,但它也与游泳不同,因为从有意识思维的角度来看,培养听力理解所需的练习是一种比游泳练习被动得多的活动。你基本上就是坐在那里听语言。
起初,这可能会让你觉得没什么成效,因为你听不懂多少。但只有通过实际地听这门语言,你的大脑才能培养出理解所必需的技能。如果你只学习而不练习,最终你会拥有很多知识,却没有能力。如果你等到自己已经会游泳了才跳进泳池,你最终会成为一个不会游蛙泳的蛙泳专家。
我在这个视频中谈到的能力需要很长时间才能培养起来,所以你不妨现在就开始。继续背单词,但也要开始尝试花尽可能多的时间去听这门语言。这样,等到明天来临的时候,你也许就能听懂一些你今天刚学到的单词了。