近日,我院2019级硕士研究生孔超作为第一作者在人文社科权威期刊《外语教学与研究》(2022年第3期)上发表题为《人类语言信息传递速率的共性》的重要论文。孔超同学的导师我院副教授刘娟为该论文的通讯作者。
人类语言在形式上纷繁多样,但因其高度一致的交际功能,一直以来语言学家们试图找到人类语言可能存在的共性。以往对人类语言共性特征的研究和探索大多是定性的或经验性的,孔超等对覆盖全球近50亿母语者的61种语言或方言进行了大规模的计算考察,考察范围不仅包括不同语族的语言,还包括了拉丁语、世界语等已经没有母语者使用的语言。他们发现人类语言的信息速率存在一个常数,即14.15比特每秒,这是基于大规模计算得出的实证性结论。古往今来人们一般认为能够表现为常数的数学规律多存在于物理、化学等自然学科中,而本文的结论表明在语言中也存在这样精确而普适的数学规律。这一发现推进了我们对人类语言共性的认识,具有创新性的学术价值。
在过去的十多年,法国里昂大学François Pellegrino 教授的团队一直致力于对语言信息速率问题研究。2019年他们通过对17种不同语言的计算得出这些语言的信息速率平均约为39.15比特每秒的结论。这是人类首次通过较大量语言的比较测得人类语言信息速率的具体数值。这一结果发表在Science (《科学》)的子刊Science Advance (《科学进展》)杂志上,在学术界引起不小的轰动。但其团队的主要成员,也是论文的第一作者,目前在香港大学任职的Coupé教授在接受DeepTech采访时曾表示:对于 39.15 比特每秒语言传输效率的研究还有待深入。研究人员准备将研究范围扩展到非洲、美洲和巴布亚新几内亚的语言。语言种类越多,这个研究的普适性会更强。
孔超的研究将人类语言信息速率的数值从39.15比特每秒改写为14.15比特每秒,并且发现这一数值在61种语言中有更小的标准差。孔超使用了更符合语言实际的词作为计算单位,将语言中的语法关系、语义搭配的信息量也纳入考量,改进和完善了测算语言信息速率的方法框架,使得今后相关研究有了更精确的测量工具。这将探索人类语言信息速率的研究推进到新的阶段。
另外,孔超等在论文中还讨论到,目前的常数14.15比特每秒是基于人类演化到现阶段的舌头、口腔、声带等生理发声装置得出的,而非大脑感知理解的限制。如此一来,可以想见,从宏观的视角随人类发音器官的生理结构的进一步演化,也可能带来这一常数的变化。而人类语言信息传递速率与感知速率的关系,发音器官的生理限制与大脑语义理解速率的相关性,这些有趣的问题则有待进一步的实验求证。因此该研究的结论不仅对语言学的研究有创新性贡献,对于语言的演化与人类演化的相关性也有重要的启发意义。
目前,孔超及刘娟副教授团队的其他成员还在继续致力于对微观视域人类语言信息速率的研究,其结果对于人类语言的某些共性特征、语音的历史演变现象能提供很好的解释性,具有重要的学术价值和意义。