鉴于大家对计算机论文十分关注,我们编辑小组在此为大家搜集整理了“探究复杂邮件网络和恶意代码传播模型”一文,供大家参考学习
1 引言
网络拓扑结构经过以下三个发展阶段: 1959 年Erdos 和Renyi 提出一种随机网络模型(ER)模型来描述网络,在接下来的数十年里这种模型一直被研究和引用;从上世纪末开始,由于互联网的发展,科学家们发现大量的真实网络并不是随机网络,而是具有与随机网络不同的统计特征的网络,这样的一些网络被科学家们叫做复杂网络。关于复杂网络, 1999年Barabasi 和Albert 在Science 上发表文章指出,许多实际的复杂网络的连接度分布具有幂律形式,由于幂律分布没有明显的特征长度, 该类网络又被称为无标度(Scale-Free, 简称为SF)网络。后来的研究表明并非万维网独有,无标度网络无处不在。包括:生命科学领域的各种网络、社会网络(流行性疾病的传播网络、科学家合作网络、人类性关系网络)、语言学网络,等等。当然电子邮件网络也不例外,它是符合幂律分布规律的网络之一,因而也具有无标度的特性。
Newman 等人分析了电子邮件网络的实际拓扑结构,统计了和调查了一个实际的电子网络,通过电子邮件簿来构建该网络的模型。在这个模型中,节点代表实际的计算机用户,如果B 的电子邮件地址出现在A 的电子邮件地址簿中,则认为从A 到B 有一条连接。
该网络共有16881 个节点,这些节点间共有4581 个地址簿。
可以看出,该邮件网络的入度及出度均服从明显的指数型分布,但入度服从纯指数分布,而出度服从幂为1/ 2 的拉伸的指数分布。
Ebel 等人建立了另外一种电子邮件拓扑结构网络模型。该模型基于美国Keil 大学的一组电子邮件网络服务器。该网络共有59812 个节点。与Newman 的调查方式不同,他通过这个实际网络的电子邮件帐户来构建该模型。
可以看出,该邮件网络是一个明显的有向无标度网络,其入度服从指数为1.49±0.18 的幂律分布,出度服从指数为2.03±0.12 的的幂律分布。
2. 本文的目的与贡献
综合以上对于实际邮件网络的调查结果可知,现实中的电子邮件网络应该是一个符合幂律分布的有向SF 网络。可是在目前的复杂网络研究文献中,对于SF 网络的研究与仿真绝大多数都是建立于无向SF 模型之上,对于电子邮件这种有向SF 网络而言,这些模型及其仿真结果并不能令人信服。
本文以Bollobás 的理论为基础,在Matlab 中构建一个有向SF 网络模型,并通过调整模型的参数,使其尽量符合实际的邮件网络。在此基础上,通过高性能集群计算系统,在Matlab 环境中仿真了恶意代码在该模型上的传播过程和特性;并根据恶意代码的传播模式,对不同的免疫策略进行仿真,提出有针对性的免疫策略。
3 SF 有向电子邮件网络模型的演化与建立
按照 Bollobás 的模型,有向网络的演化过程分为两个阶段:生长阶段及内部连边阶段。由于这个网络的有向性,其生长阶段又分为两种可能:新加节点为出度的情况(我们把它称为生长过程A)及新加节点为入度的情况(我们把它称为生长过程B)。设定三个参数分别代表这三个阶段的概率:
α代表生长过程A 的概率, β代表内部连边的概率, γ代表生长过程B 的概率。显然,在该模型中,有α+β+γ=1;另外,按照BA 模型的网络生长规则,新加入的节点和连线将优先与原网络中连接度大的节点连接,这种效应被称为“马太效应”。在本模型中,按照这个规则,如果一个节点在演化过程中的某个步骤中没有得到连接,在网络以后的演化过程中,它将永远变为孤立节点(因为它的连接概率是零)。为避免这种情况出现,这个模型中引入了两个参数:δin、δout,分别代表出度及入度的修正值,并且假定这两个参数都是非负的实数。引入这两个参数后,每个节点的入度和出度分别是din(Vi)+δin和dout(Vi)+δout。
该网络的生长过程如下:
(1) 初始化:设网络中有N0 个节点,并在节点之间随机的连接M0 条边;
(2) 生长过程A:在每个时间步,以α的概率进行以下过程:添加一个新的节点N,并从N 连接一条边到已有的节点W。在这里,W 按照以下的概率公式计算选择:
Pr(Vi=W)=(din(Vi)+δin)/(t+δinN(t)) (1)(3) 内部连边:以β的概率进行以下过程:从已有的节点V 连接一条边到另外一个节点W。在这里,V 和W 都是独立选择的,W 按照公式(1)的原则选择,而V 按照以下的概率公式计算选择:
Pr(Vi=V)=(dout(Vi)+δout)/(t+δoutN(t)) (2)(4) 生长过程B:以γ的概率进行以下过程:添加一个新的节点 N,并在已有的节点中选择一个节点W 连接一条边到N。
反复进行以上步骤,直到生成的网络足够大。
令C1=(α+β)/(1+δin (α+γ));C2=(β+γ)/(1+δout (α+γ));根据Bollobas 的分析,该模型生成的网络其入度符合以下的关系:
~ Xinin in P Ci? ;其中Xin = 1+1/C1;其出度符合以下的关系:
~ Xoutout out P C i? ;其中Xout = 1+1/C2;考虑到许多现实的网络其幂律分布一般在2~3 之间,我们的参数设置如下:
α=0.2;β=0.7;γ=0.1。中国代写网学网为您代写硕士论文。
在Matlab 中,仿真程序运行50000 步,生成15092 个节点。
可以看出,该模型生成的网络为典型的有向SF 网络,可以用于进行下一步的仿真。
4 电子邮件蠕虫病毒的传播模式