1. 简单百科
  2. 社团结构

社团结构

网络社团结构是指网络中的节点可以划分为若干个群组,群组内部的节点连接紧密,而群组之间的节点连接较稀疏。这一特性在许多实际网络中普遍存在。

定义

网络社团结构的定义尚未达成共识,常见的定义是基于相对连接频率,即将网络中的节点划分为群组,使得群组内部连接密集,而群组之间连接稀疏。然而,“密集”和“稀疏”的具体标准并不明确,因此在研究过程中难以量化。为此,研究人员提出了一些定量定义,如强社团和弱社团。强社团指子图中任一节点与其内部节点的连接度高于其与外部节点的连接度。弱社团则指子图中所有节点与其内部节点的总连接度大于其与外部节点的总连接度。此外,还有更加严格的定义,如LS集,即由节点组成的一个集合,其任何真子集与集合内部的连接均多于与集合外部的连接。另一种定义是基于连通性,称为派系。派系指的是至少三个节点组成的全连通子图,即任意两个节点之间均有直接连接。此定义可通过减弱连接条件扩展至n-派系,如2-派系表示子图中任意两个节点不必直接连接,但最多通过一个中间节点即可连接。3-派系则表示子图中任意两个节点最多通过两个中间节点即可连接。随着n值的增大,n-派系的限制逐渐放宽。这种定义允许社团之间存在重叠,即单个节点可能同时属于多个社团。社团与社团之间的连接由这些重叠节点实现。重叠社团结构在实际系统中具有研究价值,因为个体通常具备多重群体属性。除此之外,还有多种其他的社团定义方式,详见相关文献。

社团划分思路及社团划分的相关问题

社团划分思路

网络社团结构的划分思路大致可分为四类:凝聚过程、分裂过程、搜索过程以及其他过程。凝聚过程以节点为基础,通过逐步聚合形成社团。其主要步骤包括:1)设定衡量社团间距离或相似度的标准;2)将网络中的每个节点视为一个社团,初始社团数量等于节点数量;3)根据设定标准计算社团间距离或相似度,并合并最近或最相似的社团形成新社团;4)重新计算社团间距离或相似度;5)不断重复合并和计算步骤,直至所有节点聚集在一个社团中。整个过程可用倒置树形图表示。分裂过程则相反,先将所有节点视为一个大社团,然后逐步分割形成小社团。其主要步骤包括:1)设定衡量节点间亲密程度或边对网络结构影响程度的指标;2)按一定标准断开边;3)不断重复计算和断边过程,网络将被划分成越来越小的连通社团,这些连通社团即是相应阶段的社团;4)整个过程以每个节点单独成为一个社团结束。整个过程可用竖立的树形图表示,方向与凝聚过程相反。搜索过程不受固定凝结或分裂约束,而是建立一个逐步优化目标的探索过程,社团结构直接由最终优化结果确定。搜索方法可以应用成熟的算法,如Potts模型算法中使用的模拟退火算法。

划分方法的复杂度研究

由于各种划分方法在判断标准、优化思路、搜索步骤等方面的差异,每种划分算法都有其特定的复杂度。复杂度通常与网络节点数、边数、层级数、社团数等相关。划分方法的复杂度越高,所需的划分时间就越长。对于小型网络,划分时间的长短并不会产生实质性影响。但由于计算机技术的限制,划分方法的复杂度决定了其能否应用于大型网络。因此,算法复杂度不仅是评估划分方法速度的标准,也是评估其适用范围的标准。复杂度越低的划分方法,划分速度越快,适用于更大的网络。因此,开发复杂度低的算法是科研人员追求的目标之一。

检验划分方法的经典网络

检验划分方法的网络可分为人工网和实际网两类。人工网因其结构可人为设定,且含有较多预先知道的信息,常用于检验划分方法的有效性和准确性。此外,人工网的参数可控,可用于研究划分方法的适用范围及其与参数的关系。常用的128节点人工网被平均分为四个社团,每个社团包含32个节点。节点间随机独立连接,同社团节点以概率P_in连接,异社团节点以概率P_out连接。P_in和P_out的设置确保每个节点的预期度为16。Z_in表示节点与社团内部节点连接数目的预期值,Z_out表示节点与社团外部节点连接数目的预期值,Z_in + Z_out = 16。Z_out越小,表示节点与社团外部节点的连接越少,网络社团结构越明显;反之,Z_out越大,表示节点与社团外部节点的连接越多,网络越混乱,社团结构越不明显。实验表明,当Z_out在一定范围内时,其值对节点划分正确率无影响,且正确率为100%。但当Z_out超出临界值后,节点正确划分比例与Z_out呈负相关,即Z_out越大,节点正确划分比例越低。尽管人工网的检验在一定程度上反映划分方法的有效性,但由于实际网络更受关注,因此还需利用实际网络进行再次检验。选择实际网络时应考虑数据采集工具的便利性、网络的实际意义以及与其他划分方法的比较。常用的实际网络包括空手道俱乐部网、科学家合作网、美国大学橄榄球队网、猴子社交网等。其中,空手道俱乐部网和美国大学橄榄球队网具有已知的社团结构,可用于判断划分的准确性;其他网络虽无已知标准,但仍可根据划分结果的可解释性来评估算法的质量。

社团划分的具体算法

随着研究网络社团结构的科研人员增多,出现了多种划分网络社团结构的算法。这些算法可以根据不同的标准分类,如根据社团结构的形成过程分为凝聚算法、分裂算法、搜索算法及其他算法四大类。从算法的物理背景来看,可分为基于网络拓扑结构的算法、基于网络动力学的算法、基于Q函数优化的算法及其他算法。

研究意义

网络社团结构在实际系统中具有重要意义。在人际关系网中,社团可能基于职业、年龄等因素形成;在引文网中,不同社团可能代表不同的研究领域;在万维网中,不同社团可能表示不同主题的主页;在新陈代谢网、神经网中,社团可能反映出功能单位;在食物链网中,社团可能反映出生态系统的子系统。在网络性质和功能的研究中,社团结构也有所体现。例如,在网络动力学研究中,当外界能量较低时,同一社团的个体能实现同步状态;在网络演化研究中,相同社团内的个体可能最终连接在一起。综上所述,对网络中社团结构的研究是理解整个网络结构和功能的重要手段。

参考资料

什么是社团结构.搜狐网.2024-11-02

社团结构.集智百科.2024-11-02

基于网络社团结构的节点传播影响力分析.计算机学报.2024-11-02