计算机网络-服务推荐社会网络模型的构建方法及研究

作者：用户投稿来源：网络发布时间： 13/05/09

【编者按】网学网计算机其他语言频道为大家收集整理了“计算机网络-服务推荐社会网络模型的构建方法及研究“提供大家参考，希望对大家有所帮助!

客服咨询，网学网竭诚为您服务，本站永久域名：myeducs.cn

目录
第1章引言 1
1.1 选题背景 1
1.2 研究目标和意义 1
1.3 论文研究内容 2
1.4 论文结构安排 3
第2章个性化服务技术 4
2.1 个性化服务分类 4
2.1.1 基于规则的系统 5
2.1.2 基于内容过滤系统 5
2.1.3 协作过滤系统 5
2.1.4 混合系统 5
2.2 个性化服务实现 6
2.2.1 用户描述文件 6
2.2.2 资源描述文件 8
2.2.3 个性化推荐 9
2.2.4 个性化服务体系结构 9
2.3 代表个性化服务系统 10
2.4 本章小结 11
第3章社会网络概要 12
3.1 社会网络发展简史 12
3.1.1 六度分隔理论(Six Degrees of Separation) 12
3.1.2 150法则（Rule Of 150） 12
3.2 社会网络表示 13
3.2.1 早期社会学者的调研 13
3.2.2 定量化社会网络建模 13
3.2.3 基于图论的现实网络研究 13
3.2.4 用矩阵法表示社会网络 14
3.2.5 社会网络分析所依据的数据类型 14
3.3 社会网络特性 15
3.3.1 小世界效应（small-world effect） 15
3.3.2 无标度特性（scale-free property） 16
3.4 本章小结 17
第4章社会网络模型的构建 18
4.1 社会网络构建概述 18
4.1.1 通信网络（Communication Network） 18
4.1.2 协作网络（Collaboration Network） 18
4.1.3 提名网络（Referral Web） 18
4.1.4 基于连接跳转函数（Jumping Connection Function）的协作网络 19
4.2 社会网络构建模型 20
4.2.1 二部图(Bipartite Graph) 20
4.2.2 二部图单投影(One-mode Projection of Bigraph) 21
4.2.3 两层图(Two-layer Graph) 22
4.2.4 推荐图(Recommendation Graph) 24
4.3 对比加权网络和无权网络 25
4.4 本章小结 27
第5章社会网络存储结构及快速操作 28
5.1 存储结构 28
5.1.1 三元组 28
5.1.2 十字链表 30
5.2 快速操作 31
5.2.1 带辅助向量的三元组 31
5.3 本章小结 32
第6章结束语 33
6.1 总结 33
6.2 展望 33
参考文献 35
致谢 37
外文资料原文 38
翻译文稿 45

第1章个性化服务技术

本章对个性化服务技术中用户描述文件的表达与更新、资源描述文件的表达、个性化推荐技术、个性化服务体系结构以及该领域的主要研究成果进行了综述.通过比较现有原型系统的实现方式,详细讨论了实现个性化服务的关键技术.此外,分析了 3 个具有代表性的个性化服务系统.最后对个性化服务技术进一步研究工作的方向进行了展望.

1.1 个性化服务分类

Web 已成为人们获取信息的一个重要途径,由于 Web 信息的日益增长,人们不得不花费大量的时间去搜索。浏览自己需要的信息。搜索引擎(search engine)是最普遍的辅助人们检索信息的工具,比如传统的搜索引擎AltaVista,Yahoo 和新一代的搜索引擎 Google 等.信息检索技术满足了人们一定的需要,但由于其通用的性质,仍不能满足不同背景、不同目的和不同时期的查询请求。个性化服务技术就是针对这个问题而提出的,它为不同用户提供不同的服务,以满足不同的需求。个性化服务通过收集和分析用户信息来学习用户的兴趣和行为,从而实现主动推荐的目的.个性化服务技术能充分提高站点的服务质量和访问效率,从而吸引更多的访问者。

目前存在着许多个性化服务系统，它们提出了各种思路以实现个性化服务.个性化服务系统根据其所采

用的推荐技术可以分为两种:基于规则的系统和信息过滤系统.信息过滤系统又可分为基于内容过滤的系统和协作过滤系统。分类情况如下图2-1所示

图2-1 个性化服务分类

1.1.1 基于规则的系统

基于规则的系统:管理员根据用户静态特征和动态属性制定规则，一个规则本质是一个If-Then语句，规则决定服务。如IBM 的 WebSphere，BroadVision，ILOG等，它们允许系统管理员根据用户的静态特征和动态属性来制定规则。

基于规则的系统的优点：简单直接。

基于规则的系统的缺点：规则质量难以保证，不能动态更新，规则增多系统难以管理。

1.1.2 基于内容过滤系统

基于内容过滤：根据资源与用户兴趣相似性过滤信息。

基于内容过滤系统的优点: 简单有效。

基于内容过滤系统的缺点：难区分资源内容品质和风格，不能发现用户新感兴趣的资源。只能发现和用户已有兴趣相似的资源。

1.1.3 协作过滤系统

协作过滤系统：利用用户之间的相似性来过滤信息。

协作过滤系统的优点: 能为用户发现新的感兴趣的信息。

协作过滤系统的两个很难解决的问题：

（1）稀疏性：亦即在系统使用初期,由于系统资源还未获得足够多的评价,系统很难利用这些评价来发现相似的用户。

（2）可扩展性：亦即随着系统用户和资源的增多,系统的性能会越来越低。

1.1.4 混合系统

还有一些个性化服务系统同时采用了基于内容过滤和协作过滤这两种过滤技术可以克服各自的一些缺点，为了克服协作过滤的稀疏性问题，可以利用用户浏览过的资源内容预期用户对其他资源的评价,这样可以增加资源评价的密度,利用这些评价再进行协作过滤,从而提高协作过滤的性能。

1.2 个性化服务实现

为了实现个性化服务,首先需要跟踪和学习用户的兴趣和行为,并设计一种合适的表达方式。为了把资源推荐给用户,必须组织好资源,选取资源的特征,并采用合适的推荐方式。此外,还必须考虑系统的体系结构,考虑在服务器端、客户端和代理端实现的利弊。下面,我们从用户描述文件的表达与更新、资源描述文件的表达、个性化推荐以及体系结构这 4 方面讨论个性化服务的实现。

1.2.1 用户描述文件

1．制定用户描述文件前考虑问题

对个性化服务系统来说,最重要的是用户的参与,为了跟踪用户的兴趣与行为,有必要为每个用户建立一个用户描述文件(user profile).用户描述文件刻画用户的特征与用户之间的关系.在制定用户描述文件之前,需考虑下面几个问题:① 有没有现成的标准?② 收集什么数据?收集的数据用于什么目的?③ 如何收集数据?根据什么信息源来收集?④ 收集的数据如何组织?⑤ 用户信息能否自适应地更新?

2．用户描述文件表达

图2-2 用户描述文件分类

不同个性化服务系统的用户描述文件各有其特点,用户描述文件从内容上可以划分为基于兴趣的和基于行为的两种类型。基于兴趣的用户描述文件可以表示为加权矢量模型、类型层次结构模型、加权语义网模型、书签和目录结构等。基于行为的用户描述文件可以表示为用户浏览模式或访问模式。在具体实现时可以综合基于兴趣和基于行为这两种表达方式。

用户描述文件可以用文件来组织,也可以用关系数据库或其他数据库来组织。目前有一些系统采用基于XML的RDF(resource definition framework)来表达用户描述文件,并利用支持XML的数据库系统来存储用户描述文件,这样,不仅利用了 XML 的优点,也保持了系统的性能。

3．用户信息的收集与更新

自适应修改用户信息必须分析用户行为调整用户兴趣权重或层次结构。

图2-3 用户跟踪分类

在用户第 1 次使用个性化服务系统的时候,系统可以要求用户注册自己的基本信息和感兴趣的内容,系统也可以隐式地收集用户信息。在定制好一个用户描述文件之后,系统可以让用户自主修改,也可以由系统自适应地修改,这样,系统就可以随用户兴趣的变化而变化.系统要自适应修改用户信息,必须根据学习的信息源分析当前用户的行为,从而调整用户兴趣的权重或调整用户兴趣层次结构。根据学习的信息源,用户跟踪的方法可分为两种:显式跟踪和隐式跟踪.显式跟踪是指系统要求用户对推荐的资源进行反馈和评价,从而达到学习的目的。隐式跟踪不要求用户提供什么信息,所有的跟踪都由系统自动完成,隐式跟踪又可分为行为跟踪和日志挖掘。

显式跟踪是简单而直接的做法,系统可以要求用户反馈自己对推荐资源的喜好程度.一般情况下,这种做法很难收到实效,因为很少有用户向系统主动表达自己的喜好。比较实际的做法是行为跟踪,因为用户的很多动作都能暗示用户的喜好。用户行为可以表现为查询、浏览页面和文章、标记书签、反馈信息、点击鼠标、拖动滚动条、前进、后退等等。

基于Web日志的挖掘技术：常用点击次数评价用户兴趣。

Web日志挖掘4步：a.清除无关信息 b.构建数据立方体 c.在线分析处理 d.数据挖掘方法预测，分类和发现关系。

目前基于 Web 日志的挖掘技术发展迅速,利用 Web 日志可以获得页面的点击次数、页面停留时间和

页面访问顺序等信息。通过分析 Web 日志可以获得相关页面、相似用户群体和用户访问模式等信息,个性化服务系统可以利用这些信息创建或更新用户描述文件。Web 日志挖掘中最常使用的方法是根据网页的点击次数来评价用户对该网页的兴趣,其实这种方法是不完整的,而且经常是不正确的.但该方法可用于辅助其他日志分析技术。尽管 Web 日志的信息不够全面,但还是可以从中发现许多有意义的信息,比如通过收集用户顺序请求的日期和时间,可以分析出用户在每个资源上所花费的时间,从而可以推断用户对该资源感兴趣的程度;通过收集用户感兴趣的领域,有利于对用户感兴趣的内容进行分类;通过分析用户请求的顺序有利于预测用户将来可能的行为,从而推荐合适的信息。