基于《计算机学报》科研合作网络的特征分析.doc
《基于《计算机学报》科研合作网络的特征分析.doc》由会员分享,可在线阅读,更多相关《基于《计算机学报》科研合作网络的特征分析.doc(17页珍藏版)》请在沃文网上搜索。
1、青海师范大学2012届毕业论文摘 要本文以作者为节点、作者之间的合作关系为边,将核心作者的评价问题转化为科研合作网络中节点重要性的评价问题。通过统计2007年1月1日至2011年12月31日期间,在计算机学报上发表论文的作者及其合作关系,来建立网络模型。分析发现:在该领域内相关学科的研究工作者之间的科研合作形成的复杂网络是一个由许多子网络组成的非连通网络,但仍然具有比较明显的无标度网络特性。进一步对该网络及其内部连通子网络的相关性质及相互关系进行分析,发现该网络内部连通子网络呈现小世界特性。本本文立足于科研合作网络,整合复杂网络理论和分析方法,对科研合作网络进行研究,分析了复杂网络模型的特性。
2、关键字:作者;小世界;无标度;科研合作网络ABSTRACTIn this paper, the author regards the author as the node between the relations of cooperation for the edge, core author evaluation into scientific collaboration network node importance evaluation problem. Through the statistics during the period of computer, in journal p
3、apers published authors and their relations of cooperation, to build a network model. Analysis showed that: in the field of the research on the related disciplines workers between the scientific collaboration complex network is formed by a lot of sub network consisting of a connected network, but st
4、ill has obvious scale-free characteristic. Further on the network and its internal communication network related properties and correlation analysis, found that the internal network communication sub network presents the small world property. The paper based on the scientific collaboration network,
5、integration of complex network theory and analysis method, on the scientific collaboration network research, analyzes the characteristics of complex network model.Key words: author; complex network; small-world; scale-free; research partnership1、引言1.1、复杂网络的起源用网络的观点描述客观世界起源于 1736 年德国数学家欧拉 Eular 使用图论解
6、决哥尼斯堡七桥问题。数学家和物理学家在考虑网络的时候,往往只关心节点之间有没有边相连至于节点到底在什么位置,边是长还是短是弯曲还是平直 有没有相交等等都是他们不在意的。科学家认为真实系统各因素之间的关系可以用一些规则的结构表示,例如二维平面上的欧几里德格网,它看起来像是格子体恤衫上的花纹。又如最近邻环网,它总是会让你想到一群手牵着手,围着篝火跳圆圈舞的姑娘。也就是说网络中任意两个节点之间的联系遵循既定的规则,用得最多的规则网络是由 N 个节点组成的环状网络,网络中每个节点只与它最近的 K 个节点连接规则网络的特点就是每个节点的近邻数目都相同,但是对于大规模网络而言由于其复杂性并不能完全用规则网
7、络来表示。复杂网络(Complex Network)的理论研究始于20世纪60年代由著名的数学家Erdos和Renyi提出的ER随机模型。1998年Watts和Strogatz在Nature杂志上发表文章,引入小世界(Small-Word)网络模型,以描述从完全规则网络到完全随机网络的转变。小世界网络既有与规则网络类似的聚类特性,又具有与随机网络类似的较小的平均路径长度。1999年Barabasi与Abert在Science上发表文章指出:许多复杂网络的连接分布具有幂律形式,该类网络被称为无标度(Scale-Free)网络,无标度网络的节点分布服从幂律(Power-Law)分布:p(k)k-,
8、因此,无标度网络的连接分布极不均匀,网络中大量节点拥有少量的连接,而少量节点却拥有网络的大多数连接。现实世界中有许多的复杂网络,例如:WWW、Internet、邮件系统、科研合作网络、食物链等网络。都无标度或小世界网络,这两种网络都具有2个特征:高平均聚集度、小的最短路径,而无标度网络的分布有具体幂律分布的特征1-3。1.2、复杂网络的应用领域当前,复杂网络已经广泛应用于各个科学技术领域,例如道路交通运输网、航空线网、电力网、互联网、万维网、神经网络、生物中的蛋白-蛋白相互作用网和基因调控网络、各种通讯网络、各种社会网络、科学家合作网、科学期刊引文网等等。通过最近几年来对于各种不同复杂网络的结
9、构、功能和动力学的研究 ,人们已经对于广泛的复杂系统的行为和基本规律获得了前所未有的理解 ,并在实际的工业技术层面上付诸应用 4- 6。研究复杂网络主要包括:几何性质、形成机制、结构稳定性以及演化动力学机制等问题7。它为我们提供了一种复杂性研究的新方法、新思维,同时,也为在社会科学领域研究人与人之间的关系提供了新的途径。科研合作网络是描述科研人员合作关系的网络,通常把每个科研人员作为网络中的定点(或称节点),如果两个科研人员之间共同发表一篇论文,这两个定点就连接成一条边。所有的科研人员形成了一个结构复杂的网络。在复杂网络中该类网络的节点之间的复杂性、网络演化特性及网络的动力学行为等问题,一直都
10、是复杂网络研究的热点。1.3、复杂网络的研究现状近年来,学界关于复杂网络的研究方兴未艾。特别是,国际上有两项开创性工作掀起了一股不小的研究复杂网络的热潮。1998年Watts和Strogatz在Nature杂志上发表文章,引入了小世界(Small-World)网络模型,以描述从完全规则网络到完全随机网络的转变。小世界网络既具有与规则网络类似的聚类特性,又具有与随机网络类似的较小的平均路径长度。在1999年,Barabsi和Albert在Science上发表文章指出,许多实际的复杂网络的连接度分布具有幂律形式。由于幂律分布没有明显的特征长度,该类网络又被称为无标度(Scale-Free)网络。而
11、后科学家们又研究了各种复杂网络的各种特性。国内学界也已经注意到了这种趋势,并且也开始展开研究。加入复杂网络研究的学者主要来自图论、统计物理学、计算机网络研究、生态学、社会学以及经济学等领域,研究所涉及的网络主要有:生命科学领域的各种网络(如细胞网络、蛋白质蛋白质作用网络、蛋白质折叠网络、神经网络、生态网络)、Internet/WWW网络、社会网络,包括流行性疾病的传播网络、科学家合作网络、人类性关系网络、语言学网络,等等;所使用的主要方法是数学上的图论、物理学中的统计物理学方法和社会网络分析方法。本文以科研人员之间的合作关系为研究对象,基于复杂网络的理论,建立一个科研人员合作网络模型。通过对2
12、007年1月1日至2011年12月31日期间发表在计算机学报的文章进行统计,来分析科研人员之间的合作关系,进一步来研究复杂网络的特征。2、复杂网络的常见特征21、复杂网络的定义钱学森给出了复杂网络的一个较严格的定义:具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络称为复杂网络 8-9 。复杂网络简而言之即呈现高度复杂性的网络。其复杂性主要表现在以下几个方面: (1)结构复杂,表现在节点数目巨大,网络结构呈现多种不同特征。 (2)网络进化:表现在节点或连接的产生与消失。例如world-widenetwork,网页或链接随时可能出现或断开,导致网络结构不断发生变化。 (3)连接多样
13、性:节点之间的连接权重存在诧异,且有可能存在方向性。 (4)动力学复杂性:节点集可能属于非线性动力学系统,例如节点状态随时间发生复杂变化。 (5)节点多样性:复杂网络中的节点可以代表任何事物,例如,人际关系构成的复杂网络节点代表单独个体,万维网组成的复杂网络节点可以表示不同网页。 (6)多重复杂性融合:即以上多重复杂性相互影响,导致更为难以预料的结果。例如,设计一个电力供应网络需要考虑此网络的进化过程,其进化过程决定网络的拓扑结构。当两个节点之间频繁进行能量传输时,他们之间的连接权重会随之增加,通过不断的学习与记忆逐步改善网络性能。22、复杂网络的特性221 小世界(small-world)它
14、以简单的措辞描述了大多数网络尽管模很大,但是任意两个节(顶)点间却有一条相当短的路径的事实。以日常语言看,它反映的是相互关系的数目可以很小但却能够连接世界的事实,例如,在社会网络中,人与人相互认识的关系很少,但是却可以找到很远的无关系的其他人。正如麦克卢汉所说,地球变得越来越小,变成一个地球村,也就是说,变成一个小世界。 222 集聚程度(clustering coefficient) 例如,社会网络中总是存在熟人圈或朋友圈,其中每个成员都认识其他成员。集聚程度的意义是网络集团化的程度;这是一种网络的内聚倾向。连通集团概念反映的是一个大网络中各集聚的小网络分布和相互联系的状况。例如,它可以反映
15、这个朋友圈与另一个朋友圈的相互关系。223 幂律(power law)的度分布度指的是网络中顶(节)点(相当于一个个体)与顶点关系(用网络中的边表达)的数量;度的相关性指顶点之间关系的联系紧密性;介数是一个重要的全局几何量。顶点u的介数含义为网络中所有的最短路径之中,经过u的数量。它反映了顶点u(即网络中有关联的个体)的影响力。无标度网络(Scale-freenetwork)的特征主要集中反映了集聚的集中性。23、复杂网络的基本概念231 度(Degree)在哲学中,度是质和量的统一的范畴,是事物保持其质的量的界限、幅度和范围。这种统一表现在:度是质和量的互相结合和相互规定。关节点是度的两端,
16、是一定的质所能容纳的量的活动范围的最高界限和最低界限。度是关节点范围内的幅度,在这个范围内,事物的质保持不变;突破关节点,事物的质就要发生变化10。度也称为连通度,节点的度指连接节点的边数。度在不同的网络中代表的含义不尽相同,例如:在城市航空交通网中,度分布表示城市之间的航线的多少和重要程度,度越大的城市,其重要性就越大;在社会网络中,度可以表示个体的作用力和影响程度,一个节点的度越大,一般表示在整个网络系统中的作用和影响越大,反之亦然。度分布则表示节点度的概率分布函数P(k),她是节点有K条边连接的概率。232 路径(path)路径,又称初级通路,即无向图中满足通路上所有顶点(除起点、终点外
17、)各异,所有边也各异的的通路。 绘制时产生的线条称为路径。 路径由一个或多个直线段或曲线段组成。 线段的起始点和结束点由锚点标记,就像用于固定线的针。 通过编辑路径的锚点,您可以改变路径的形状。 您可以通过拖动方向线末尾类似锚点的方向点来控制曲线。 路径可以是开放的,也可以是闭合的。 对于开放路径,路径的起始锚点称为端点。 路径可以具有两种锚点:角点和平滑点。 在角点,路径突然改变方向。 在平滑点,路径段连接为连续曲线。 您可以使用角点和平滑点的任意组合绘制路径。 如果您绘制的点类型有误,可随时更改11-12。 路径:就是用钢笔工具或贝塞尔工具等描绘出来的线或路径,从s到t所经历的边数的数量最
18、少的路径,称为从s到t的最短路径。233 节点(node) “节点”这个概念被广泛应用于许多领域。电力学中,节点是塔的若干部件的汇合点。机械工程学中,节点是在一对相啮合的齿轮上,其两节圆的切点。在网络拓扑学中,节点是网络任何支路的终端或网络中两个或更多支路的互连公共点。生化工程中,代谢网络分流处的代谢产物称为节点。在程序语言中,节点是XML文件中有效而完整的结构的最小单元。在作图软件MAYA中,节点是最小的单位。每个节点都是一个属性组。节点可以输入,输出,保存属性。网络的基本单元,也称为site(物理学用)或演员actor(社会学用),我们在本文中主要使用节点这一术语。节点在科研合作网络中就是
19、指科研合作网络中的科研人员。节点及其属性的选择在网络分析中是首要工作,进行科研合作网络分析首先应该将要进行研究的对象搞清楚,研究对象具有什么样的特点和属性应该在研究前描述清楚。234 边(edge)连接两个节点的线。也称为bond(物理学用)、link(计算机科学用)、tie(社会学用)。科研合作网络中的边所代表的就是科研合作网络中的科研人员之间存在的科研合作关系。科研合作关系一般比较复杂抽象,所以在进行研究时应该首先将科研合作关系定义好,分清网络中纷繁芜杂的各种关系中哪些才是我们应该进行研究的。关系定义的正确与否直接影响研究的结论。一条边如果仅有一个方向可通行则称为有向边(如两点之间的单行道
20、),一条边如果两个方向均可通行则称为无向边。有向边,有时也称为弧(arc),可以比作是指向目尺的箭矢。一个图若其中所有边均为有向边,则此图为有向图。无向图也可视为是有向图,图中相关联的边等同于有向图中的两条有向边。在科研合作网络中如果科研合作关系是相互的那么我们就会采用无向图,否则就应该采取有向图。本文中可以合作关系是相互的,所以使用无向网。24、复杂网络的参数241 平均路径长度(Average Path Length,APL)网络拓扑特性的另一个重要的特征度量是平均路径长度,它系网络中所有节点对之间的平均最短距离。这里节点间的距离是这从一个节点到另一个节点所要经历的边的最小数目,其中所有节
21、点对之间的最大距离称为网络的直径。平均路径长度和直径衡量的是网络的传输性和效率。它表明网络中节点间的分离程度,即网络有多小,反映了网络的全局特性。不同的网络结构可赋予 L 不同的含义,如在疾病传播模型中L 可定义为疾病传播时间 ,交通网络模型中 L 为站点之间的距离 ,科学家合作网络中 L 为交流频率13。平均路径长度L的计算公式为:其中N为网络节点数。表示从节点i到节点j的最短距离网络的平均路径长度称为网络的特征路径长度(characteristic path length)。242 群聚系数(Clustering Coefficient)群聚系数是用来衡量一个网络复杂网络的集团化程度的,它
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机学报 基于 计算机 学报 科研 合作 网络 特征 分析
