基于Agent社会圈子网络的语言竞争模型
时间:2015-01-26
语言传播网络作为一种典型的社会网络,其竞争与传播具有复杂多向的特点。基于此,本研究利用基于Agent的社会圈子网络构建了一个更接近实际的社会网络模型。该模型中,网络参数和整体网络结构均具有良好的社会网络特性。网络中的Agent被赋予不同大小的社会圈子,可以在网络中移动、新生和死亡,从而引起社会网络旧关系的断开和新关系的建立。Agent的语言类型代表单语X、单语Y和双语Z(单语X和单语Y)。传播模型包括横向传播和纵向传播。在分析语言地理吸引因子、横纵向传播的基础上,研究了社会交往半径和社会流动对语言竞争的影响。仿真结果表明,与静态网络模型相比,所提模型更贴近实际社会,能有效提高语言共存的可能性,为研究濒危语言保护提供较好的环境。
文献标志码:A
0引言
通过几千年的历史文化的演变,到目前为止世界已经累积了近6000种语言。在全球范围内,已经有超过750种语言灭绝,还有许多语言也只有少数的使用者。联合国估计,目前世界上现存语言中,有一半的语言只有不到一万名使用者,四分之一的语言只有不到一千名使用者,并且除非采取有效措施,否则在一个世纪之内这些语言(至少3000种)都要灭亡。目前中国少数民族语言的多样性正在遭受严峻的威胁。
为了拯救濒危语言,有必要对语言传播、竞争和调控的机制和动力学特性深入研究,以揭示语言衰退、消亡和共存的原因,进而寻求濒危语言保护和干预措施。现如今的研究模型主要分为基于微分方程的语言竞争动力学模型、基于Agent的微观建模方法、基于复杂网络的语言交流模型和基于Agent的复杂网络动态演化语言交流模型。
Abrams等提出了一个简单的确定性系统动力学方程,来描述在一个人群中两种语言竞争引起的语言使用模式变化情况。其目的是利用模型解释濒危语言历史和数据中语言数量减少的规律,进一步给出语言濒危的定量指标,以期望在语言濒危早期采取有效的语言保护方案。Patriarca等扩展了AS(AbramsStrogatz)请补充AS的英文全称。模型,模型考虑了语言传播受到说话者扩散的影响因素,并在AS模型中引入了空间依赖关系,并扩展为扩散反应方程。Pinasco等扩展了AS模型,模型描述了两种语言在同一竞争区域共存的机制,模型中引入了一个附加的Logistic人口增长变量。Kander等在文献方法的基础上将人口增长和空间扩散的人口学因素包含进反应扩散系统中,同时考虑了两种语言的不同社会地位。Mira等对AS模型作了存在双语者的扩展,模型中两种语言可部分相互理解,允许单语言者转变为双语言者。Minett等用稍微不同的方式在模型中引入了双语者模型,双语者可以同时说两种语言,所以共包含3种说话者人群。 基于Agent的微观建模方法也得到了越来越多研究者的注意。Kosmidis等提出了一个类似Agent建模方法――蒙特卡洛方法来研究两种语言竞争问题;Casteó等通过研究理想网络(如小世界网络、无标度网络等)中的语言交流传播过程去间接了解实际的语言交流传播过程与真实社会接触网络结构特征之间的关系。除了理想网络之外,研究者们还提出了一些更为复杂的网络模型,比较有代表性的如具有层次网络模型(如文献)和具有社群结构的网络模型等(如文献)。
现有的这些基于复杂网络的语言交流模型研究主要关注的是网络的拓扑结构特征,如小世界特征、无标度特性、高聚类特征和网络的模块性等对语言交流传播的影响,一方面这些研究构造的语言传播网络与实际社会网络有较大的差距,而且很难用社会理论来解释;另一方面对网络结构随时间的变化关注甚少,也就是说,这些研究基本上都是以静态网络为基础的。而真实的社会接触网络由于受到人员日常行为不断变化的驱动,必然是一个动态演化的过程,这种演化过程将使得网络拓扑结构特征发生变化,从而影响到其上的语言交流传播过程。
Hami等提出了一种基于Agent的社会圈子网络理论来构建具有多种实际社会网络统计特征的社会网络生成方法,它是一种基于微观个体行为生成社会网络的方法,网络的生成和演化由Agent来管理,更加接近实际社会的运行机制。本文引入基于Agent的社会圈子网络模型来研究个体行为和个体之间的语言传播构成的社会网络复杂Agent网络模型,该模型能很好地体现语言网络中的这些特点:
1)社会圈子网络中的个体网络参数和整体网络参数都更接近实际,个体网络参数具有异质性、度胖尾分布、高聚类系数及随时间变化等特点;整体网络参数具有低密度、度度相关性、社群结构以及短路径等特点。
2)通过为个体设置不同的社会半径可以改变社会圈子的大小,而社会半径大的个体有可能连接到其他小团体,形成圈子之间的弱连接,并且社会半径大的个体之间倾向于互相连接,可以表达人们社会交往圈子和社会网络复杂的社群和层次结构的异质性。
3)Agent可以断开原来的社会圈子里的关系,移动到不同的位置,在社会圈子内重新构建新的社会网络,可以描述具有流动性的社会网络。
本文在社会圈子网络的社会结构基础下引入Minett等的模型中个体之间的语言传播模型,来研究复杂现实社会网络条件下的语言竞争和保护问题,同时加入现实社会可能会出现的波动因素以及人口的流动,体现其动态流动性。
1社会圈子网络模型
基于社会圈子的网络是由Hami等提出,社会圈子网络模型用个体在二维空间中的位置来代表它在现实社会中所处的地理位置;认为两个个体在二维空间中位置越近,它们的联系就越紧密。个体的社会圈子表示其社交范围,即个体认识处于它的社会圈子内的其他个体,社会圈子的大小用它的社会半径来描述。在创建个体间联系时,要求双方都认识对方才认为两者是认识的,如图1所示。
如图1(a)所示,如果A的社会半径比B大,那么B包含在A的圈子中,可以看作为A认识B,但是B不认识A;如图1(b)所示,两个个体的社会半径相同,那么A和B相互认识。如果社会半径被设置得非常低,那么个体的圈子就会很小,它可能认识的个体几乎就没有,网络的密度就趋向于0;相反,如果社会半径很大,网络的密度就趋向于1。现实社会中,每个人的社会圈子大小是不同的,少数人的圈子要比其他人的大得多。为了体现个体的这种差异性可以设置2种或3种具有不同社会半径的个体种类,本文设置了3种社会半径。
复杂网络的实证研究表明社会网络具有如下特点:1)个体网络规模有限且有差异、聚类系数较高和规模随时间变化。2)整体网络密度低、具有度连接的相关性、社群结构和短路径长度等特点。社会圈子网络比之前常用的4种网络模型――规则网络、随机网络、小世界网络和无标度网络能更好地表现实际中复杂社会网络的特点。因为这4种网络模型在体现社会网络的特性方面存在缺陷,导致它们都不是很好的社会网络模型。表1总结了这4种基本网络模型的特点。
因为语言传播竞争网络是一种典型的社会网络,使用社会圈子能正确描述语言网络由异质的个体网络构造成整体网络的现实,所以采用社会圈子网络对语言传播竞争网络中语言的传播和竞争进行建模。本文中使用社会圈子网络模型来模拟语言传播竞争网络是因为它比较灵活,通过对社会半径的设置可以得到一个很直观地反映语言传播竞争网络中人群结构特点的网络。依据社会人口的分布:大多数人的联系是靠小的社会半径连接的小圈子,只有少部分人的联系是依靠较大或者更大的社会半径连接的大圈子。其中会出现一部分人由于多种原因随时随地在移动,例如搬家或者改变自己的习惯等,称之为社会移动人口。图2中的网络模型使1000个个体随机分布在25600个单元面积的二维空间中,并将75%的个体社会半径Ssr(Sma Socia Reach)设置为20,多数个体的社会半径小表示大多数普通个体只连接周围小范围的其他个体,从而使接近的个体互相连接形成小圈子;将15%和10%比例的个体的社会半径Msr(Midde Socia Reach)设置为30,Bsr(Big Socia Reach)为40,代表联系广泛的个体,它们还起到连接不同小圈子的作用。根据这一设置生成的初始网络如图2所示,可以看到网络中有多个小圈子,圈子之间又存在着弱连接。图3给出了网络度分布和不同圈子个体和全部个体聚类系数的度量值。
利用社会圈子理论构建的社会网络能实现社会网络所具有的绝大部分特点,主要体现在个体网络和社会网络两个方面(本模型初始Ssr为20,Msr为30,Bsr为40)。
1)在个体网络方面。
①通过使用社会圈子来限制个体网络的规模,模型所生成个体网络大小最小为2,最大为30,平均为13.5。 ②社会圈子的大小可以通过社会半径改变,当选取3个合适的社会半径可以形成连续的长尾分布(如图3(a)所示),图3(a)中度代表网络中每个节点与其有连接关系的节点的个数,无特定单位表示。通过观察3种不同社会半径的社会圈子的度度相关性可知,在不同社会半径的不同的社会圈子中,度越高的节点越少,度相对较低的节点往往比较密集,这与大部分普通人联系范围小、少部分人联系广泛是相一致的。
③有较高聚类系数,通过重叠的社会圈子产生的网络(无特定单位):如图3(b)所示,大部分个体的聚类系数在0.3到0.7之间,平均0.57,但是单个个体的聚类系数根据参数的选择可以从0到1变化,符合社会人口的情况,依据个体的情况,既可以不与外界联系,也可以联系很广泛,这与现实社会中朋友的朋友也是朋友的情况相吻合。
④个体网络可以随时间流动。
2)社会网络的结构方面。
3语言传播模拟流程
系统模拟流程模型可用图6表示。为了更真实地模拟社会语言网络,本模型首先设定了个体总数、每个个体的社会半径、每种社会半径的人口比例、每种语言所占的人口比例;为了模拟现实生活中人们可能出现的状况,模型中还设定了出生率、死亡率以及人口移动比例;通过设定语言传播概率公式的参数,包括最高比率、语言地位、吸引因子,用以计算语言传播的可能性大小,即通过VMode和HMode来推导X或Y到Z的转变、Z到X或者Y的转变,或者自身语言的传播和保留。本模型没有设定两种竞争语言的相互转化,通常来讲,一个个体不可能完全抛弃母语而去学习其竞争语言,这会导致完全不能交流的情况出现,例如只会X语言的父母和其只会Y语言的孩子之间存在无法交流的情况,所以这种情况几乎不可能出现,模型中排除此情况。
4仿真结果分析
本模型以NetLogo为平台。模型基准情况中涉及到的参数初始值设置借鉴了Minett等提出的模型中的经验值,他们提出的模型将个体总数设定为1000,死亡率设定为1%,VMode的语言传播最高比例设定为1,HMode的语言传播最高比例设定为0.35,吸引因子在大于等于0.63的范围内稳定,单语Y的语言地位设定为0.7,规定当某种语言的语言地位大于0.5时,该语言为优势语言。个体所处环境设定为160×160(约25600个单元网格)的网格空间,具体如表4所示。
4.1语言地位对语言传播模型的影响
图7表示增加语言地位后的对比。图7中,初始状态的单语X的地位为0.3
从图7中看,应该为0.4,请核实是否正确?
,根据公式sX+sY=1,可知单语Y的地位为0.7;通过改变单语X的语言地位,模型中将单语X的地位提升到0.8,根据sX+sY=1,可知单语Y的语言地位降低到0.2,也就是说通过单语X前后的地位的改变会导致语言的最终走向,虽然单语X的初始人口小于单语Y的初始人口,但是调整语言的地位,也就可以提高该语言在人口中的占比。即在实际社会生活中,虽然某种语言的初始人口比例较小,但是随着语言地位的提升,便会提高该语言在经济、政治和文化方面的地位,增强持该种语言的自豪感,改变未来的趋势。
图7表示改变语言地位的对比,单语X的语言地位由0.3增加到0.8;单语Y的语言地位由0.7减小到0.2。由图7可知,在调整语言地位之前,单语Y的人口比例在1700步达到100%,而单语X和双语全部消亡;调整语言地位后,单语X的人口比例在1700步达到100%,单语Y以及双语全部消亡,即改变语言地位会影响掌握不同语言的人口比例。实际社会生活中,虽然某种语言的初始人口比例较小,但是随着语言地位的提升,便会提高该语言在经济、政治和文化方面的地位,增强持该种语言的自豪感,改变未来的趋势。
4.6社会半径的改变对语言传播概率模型的影响
图12表示了增大社会半径后,语言共存状况的改变。模型中3种社会圈子的社会半径由初始的小社会半径为25、中社会半径为35、大社会半径为45变成小社会半径为35、中社会半径为45、大社会半径为55。个体的圈子大小变化对语言传播竞争的影响明显,当个体圈子小时,网络密度也较小,随着个体圈子的扩大,网络中的连接不断增加,表示能联系到的个体范围增加,交流就会增加。模型中社会半径逐渐增加,社会圈子的大小就会不断增加,个体之间的交流就会越来越多,语言之间的竞争传播可能性就会越来越大。随着两种竞争语言之间的交流增加,语言地位较低的语言就会逐渐走向消亡,图12中语言地位较低的单语X在1000步时基本消亡,双语者随着交流的增加而增加,最终出现双语和地位较高的优势语言共存的情况。因此,适当控制社会圈子的规模,控制语言地位较低的语言的个体与语言地位较高语言个体之间的竞争交流,可以很好地维持两种语言共存的状态,如图12中适当缩小社会半径后的语言共存的情况,表明了地理上的隔绝有利于语言的保存。现实社会中,随着交通和通信技术的发展,人们之间的时空隔绝越来越被淡化,人们的交往范围已经不受地理位置的限制。目前条件下,需要出台一些政策配合以达到弱势语言的保护的目的。
4.7综合参数调整后的语言传播概率模型
通过对上述模型参数的分析,提升吸引因子a可以延长弱势语言和双语的消亡时间;增加hc提升同辈成年个体学习双语的积极性;提升语言地位sX或者sY可以提高该语言在经济、政治和文化方面的地位,增强持该种语言的自豪感,改变未来的趋势;减小vc可以提高双语学习的氛围,增加子代学习双语的热情和机会,产生弱势语言通过双语的情况保留下来的现象;语言人口比例的改变不起决定性因素,只具有一定的辅助作用;移动人口的增加会增加弱势语言保护的难度,增加弱势语言消亡的可能性;社会半径的改变表明了地理上的隔绝有利于语言的保存。这些因素是相互影响相互制约的,需要充分考虑各种因素间的平衡调配。通过综合分析以及参数调整多次仿真,得到3类语言状态相对稳定的共存状态。图13表示通过上述对模型内各个参数的分析后进行适当调整以后的模型仿真。图中3类语言基本达到一种稳定共存的状态,在750的时间步长时基本达到语言的共存,之后的波动不大,基本保持平衡。达到语言稳定共存状态的模型参数设定值如表5所示。 5结语
本文采用基于社会圈子理论的Agent技术来构建网络模型,该模型除了模拟影响语言传播概率大小的因素以外(吸引因子、语言地位和最高比率),还考虑到现实的社会因素,包括个体的出生死亡、个体的特殊移动、个体社会圈子大小、人口比例,这些因素能正确描述动态语言传播网络的特点,并能从社会网络角度给出语言传播的定量解释,模型框架为进一步研究语言的传播机制提供了一个可行的新方法。仿真实验中通过调整模型传播概率公式中的模型参数中的吸引因子a,最高比率vc和hc,语言地位sX或者sY,语言人口比例,移动人口比例和社会半径的大小分析对语言竞争传播的影响。这一段结论(即1)~8)部分)与4.7节中的正文描述重复,已删除。
