鉴于大家对其他类别十分关注,我们编辑小组在此为大家搜集整理了“基于项目的相似度计算方法”一文,供大家参考学习!
客服咨询,网学网竭诚为您服务,本站永久域名:myeducs.cn |
4.4 基于项目的相似度计算方法 由于用户评分数据的极端稀疏性,传统的基于用户的相似性度量方法不能有效地计算目标用户的最近邻居,协同过滤推荐系统的推荐质量难以保证。为了解决用户评分数据的极端稀疏性,引入了基于项目的相似度计算方法。 Sarwar 教授于 2001 年最早提出 Item-Based 协同过滤推荐算法,为了解决User-Based 协同过滤算法的数据稀疏性问题。算法的基本思想是:根据目标用户已经评价过的项目与目标项目 i 的相似性,选择 k 个最相似的项目{i1,i2, ……, ik},同时得到对应的相似度{si1,si2,……,sik},然后将目标用户对这 k个最相似的项目的评分及这 k 个最相似的项目与目标项目的相似度加权平均值作为对目标项目的评分。
4.4.1项目的类别属性 基于项目的相似度计算方法分析项目之间的相关性,然后根据最相似的项目形成推荐,提供给用户。同时计算出项目间相似度后,可以通过最相似的项目的评分来预测用户未评分项目,通过降低评分矩阵的稀疏性,可以更准确地寻找用户的最近邻居,从而提高推荐质量。 虽然采用相似项目的评分来预测用户的未评分项目[8],在计算用户相似性时可以较好地解决可信度问题,但是它用来计算项目相似性的方法仍然是在未经过处理的用户-项目矩阵上进行余弦计算,这样一来,基础性数据的可信度无法保证,后续工作也将受到影响。在一个实际的系统中,用户评分数据的多少是无法确定的。有些用户可能评价的项目多一些,在评价自己喜欢项目的同时也对其他一些项目进行了评价,除去没有进行任何评价的用户,其余的用户可能评价少一些,甚至只有一两项,但这并不能说明这些用户只喜欢该网站提供的项目中的一两项,相反,对于某些只对很少项目评分的用户来说,他们所给出的评价信息可能恰恰就代表了他在某一方面的爱好,而且给出的评分更有参考价值,如果仅仅因为他的评价信息过少,没有达到规定的阈值而将其不予考虑,就会造成信息丢失。 |
本站发布的计算机毕业设计均是完整无错的全套作品,包含开题报告+程序+论文+源代码+翻译+答辩稿PPT |
本文选自计算机毕业设计http://myeducs.cn |