PaperTan: 写论文从未如此简单

图书馆管理

一键写论文

数字图书馆中的关联书目检索推荐方法改进与设计

时间:2019-01-20

针对数字图书馆中书目资源规模增大,关联图书书目检索的时效性和准确性受到挑战的问题,提出了一种基于图记忆的关联书目检索推荐方法。该方法通过相似度计算,在图引下进行关联节目检索,提升了检索效率和信息参考价值。

0 引 言

数字图书馆资源作为一种开放性的公共资源,随着大数据的更新和图书出版的增多,数字图书馆馆藏的书目规模不断增多。图书馆馆藏资源的增加和大数据信息规模的增大具有关联关系。在进行数字图书馆的资源检索和图书借阅中,需要有效的检索方法,结合图书馆管理系统的有效推荐,提高对图书资源的准确检索和获取能力,对数字图书馆的关联图书的可靠性检索成为评价图书馆的智能化和个性化服务水平的重要参考标准。研究图书馆的图书个性化推荐服务模型,对解决图书的过载借阅和用户不能有效获取有用图书之间的矛盾关系[1?2]同样具有重要意义。本文对当前国内外图书馆推荐模型研究的基础上,以协同过滤推荐和内容推荐模型为基础,提出一种基于相似度标签索引和关联规则挖掘的数字图书馆中的关联书目检索推荐方法,实现图书资源的个性化推荐。

1 图书关联书目的相似度计算

为了实现对数字图书馆中的关联书目检索推荐,需要分析标签的上下文信息,这就需要进行图书管关联书目的相似度计算,用户相似度计算方法包括皮尔逊相关系数法、向量余弦法、斯皮尔曼相关系数法等[3?4]。采用不同的方法计算用户的不同关联信息特征,图书检索用户在进行图书检索中,备选标签集特征向量是依赖于其所有邻居节点,对用户文档进行分析,显性特征?稻荼硎疚?:

式中:表示用户对数字图书馆中的关联书目的推荐评分;表示用户对数字图书馆中的关联书目推荐已给出的评分;是利用式(1)求得的歧义标签的权值。则用户u对图书馆关联书目推荐的语义相关度矩阵可表示为:

基于同义词和歧义词的协作过滤,提高推荐的可靠性,更好地反映图书内容和用户兴趣,采用余弦相似度进行图书推荐过程中的同义词过滤,余弦相似度计算式描述为:

式中:sim(i,j)表示浏览图书的关键词和图书之间的相似度;和表示被同一用户评分同义词和歧义词的评分向量。

采用皮尔逊相关系数(Pearson Correation Coefficient)方法分析对图书检索中的语义隐形特征数据挖掘用户之间的关联性,皮尔逊相关系数相似度计算为:

式中:表示关联规则挖掘中待推荐的图书组合集合;表示WordNet词汇本体的推荐结果平均评分。在皮尔逊相关系数约束下,得到基于相似度标签索引的关联书目推荐的皮尔逊准则为:

分析标签的上下文信息进行图书数目的关联行为替换,构建图书馆关联书目相似度约束下的优先级列表见表1。

通过表1所示的相似度约束下的优先级列表进行书目检索的协同过滤推荐控制,确定一个标签的涵义,根据优先级列表,分析标签的上下文信息,采用皮尔逊相关系数相似度算法,进行推荐模型的积极评估和消极评估。 2 基于关联规则挖掘的推荐方法实现

根据上述关联规则设计方案,在语义本体模型中通过关联规则挖掘实现对相似用户和相似书目的信息融合和协同推荐,计算相似用户对图书检索中的语义信息的相似度。用表示用户感兴趣的图书集,间的相似度,其值在0和1之间变化,相似用户对图书感兴趣时,,否则。最终的推荐图书包含在图书集,中,语义本体为,其中的计算公式为:

式中:和分别表示用户感兴趣的图书集的目标用户相似的用户集数目;表示推荐图书的公共结点数目。的计算公式为:

式中:表示相似用户集中相似标签之间的词义消岐向量;,分别表示图书书目集,中推荐结果生成器对备选标签集的数目。

计算相似标签之间的相似度,计算完和后,对结果进行综合,并对每个语义返回相似度值,形成语义相似度,如下:

式中,当时,查询图书标签有最高的相似度值,在协同过滤推荐模块中计算中的连接度如下:

式中,表示图书集中选出相似用户感兴趣的图书。根据用户查询请求,从WordNet词汇本体数据库中提取标签信息进行查询索引,从而将经过过滤的图书集推荐给目标用户,实现关联书目的检索推荐。

3 实验结果分析

在Matab仿真软件中进行数字图书馆关联书目检索推荐的仿真分析,实验采用大型网络数字图书馆的BookCrossing数据集作为测试集,测试数据有1 000 000条,使用爬虫程序采集图书标签数据进行语义分析和信息加载,关联规则的阈值设定为:规则1,0.033 5;规则2,0.045 5;规则3,0.054 59;规则4,0.290 9;规则5,0.098 5;规则6,0.089 76;规则7,0.087 53;规则8,0.257 8。以图书书目检索推荐准确率(Precision,Pr)、召回率(Reca,Re)、准确率和召回率的相关性关系R为测试指标,R值越大,表示推荐的可靠度越高,采用不同推荐算法在三组实验中取平均值,得到不同方法进行图书推荐的测试结果见表2。

为了更好地直观分析,对上述数据进行绘图处理,得到不通推荐模型进行图书推荐的准确性和召回性对比结果如图1所示。

分析上述实验结果得知,采用本文方法进行数字图书馆的关联书目推荐,准确度较高,可靠度较好,表明本文方法具有优越性。

4 结 语

为了提高数字图书馆的图书推荐和检索能力,本文提出一种基于相似度标签索引和关联规则挖掘的数字图书馆中的关联书目检索推荐方法。首先在传统的内容推荐和协同过滤推荐的基础上,计算数字图书馆中的关联图书书目的相似度标签信息参量。然后在相似度便签索引下进行图书检索的语义分析,在语义本体模型中通过关联规则挖掘实现对相似用户和相似书目的信息融合和协同推荐,提高了对数字图书馆的检索效能。研究得出。本文提出的推荐方法相比于传统方法具有较高的推荐准确性和可靠性。