语言背后的神秘规律:Zipf 定律

91download.com supports a wide range of platforms, including YouTube, Facebook, Twitter, TikTok, Instagram, Dailymotion, Reddit, Bilibili, Douyin, Xiaohongshu and Zhihu, etc.
Click the download button below to parse and download the current video

The video belongs to the relevant website and the author. This site does not store any video or pictures.

在英语中,有一个非常有趣的现象:大约 6% 的语言使用中都是单词 "the" —— 这是最常见的英语单词。在日常生活中,我们遇到的每个单词中,大约有 1/16 是 "the"。这真是一个有趣的事实,一个小知识。然而,这背后隐藏的规律远不止如此。

开篇问题:语言中隐藏了怎样的秘密?

在所有语言中,无论是整个语言还是一本书、一篇文章,最常用的单词的出现频率总是呈现出一种奇特的规律:排名第二的单词出现的频率大约是排名第一的一半,排名第三的单词出现的频率大约是排名第三的三分之一,以此类推。这是怎么回事呢?

Zipf 定律的神奇之处

这个现象被称为 Zipf 定律。它不仅适用于英语,还适用于其他所有语言,甚至是我们尚未能翻译的古老语言。但是,我们对其背后的原因却一无所知。这是令人惊讶的,因为现实世界是复杂的,语言是创造性的,它们以如此可预测的方式表达出来。

Zipf 定律的启示

尽管我们对 Zipf 定律的原因感到困惑,但它在我们生活中的应用却是无处不在。这背后的原理其实与帕累托分布有关,即著名的 80/20 原则。在语言中,最常使用的 18% 的单词占据了超过 80% 的使用频率。

语言与最小努力原理

语言的发展可能遵循最小努力原理,即生命和事物总是遵循阻力最小的路径。语言的使用也是一样,我们倾向于使用尽可能少的单词来表达我们的思想。但是,听者却偏好更大的词汇量,以获得更多的特异性。这种折中导致了我们目前语言的状况:一些单词被频繁使用,而许多单词却很少被使用。

Zipf 定律的数学解释

一些研究者认为,Zipf 定律可能并没有那么神秘。例如,随机打字也会产生符合 Zipf 定律的单词分布。这是因为长单词的数量远多于短单词,而且在随机打字中,单词的终止总是有一定的概率,这使得长单词出现的频率远低于短单词。

语言中的 Zipf 定律

然而,实际的语言使用与随机打字有很大的不同。语言是确定性的,话题和表述是基于之前的对话内容。而且,我们的词汇量并非完全由随机命名产生。即使是元素、行星和星期的名称,也遵循 Zipf 定律。

Zipf 定律与偏好连接

Zipf 定律可能还与偏好连接过程有关。一旦一个单词被使用,它很快就会被再次使用。这种偏好连接的过程在许多其他现象中也可以观察到,比如财富分配、网站流量、地震强度等。

Zipf 定律与记忆

Zipf 定律甚至影响我们的记忆。我们日常生活中的大部分经历都会被遗忘,而只有少数事情会被记住。这也许是因为我们的思维和交流方式遵循 Zipf 定律。

结语

Zipf 定律是语言中的一个神秘规律,它揭示了语言使用的模式和我们的记忆方式。尽管我们对其背后的原因尚不了解,但它无疑为我们提供了一个全新的视角来理解语言和记忆。

感谢您的阅读,希望这篇文章能引发您对语言背后规律的思考。如果您有任何想法或问题,欢迎在评论区留言讨论。

Currently unrated