出版社:中国水利水电出版社
年代:2013
定价:36.0
随着网络技术的飞速发展,信息爆炸所产生的个人信息疲劳和信息压力使搜索引擎变得越来越重要,搜索引擎已经成为名副其实的信息枢纽和信息门户,是用户获取网络信息的首选工具。本文从用户潜在语义动机的理解出发,针对个性化搜索各个环节中的关键技术展开研究,如用户建模技术、查询扩展技术、网页局部优化排序技术、聚类技术等,力求达到用户查询与搜索引擎返回结果的高效匹配。
前言第1章 绪论1.1 搜索引擎体系结构及功能1.1.1 信息的收集1.1.2 信息预处理1.1.3 查询服务1.2 个性化搜索引擎1.2.1 个性化搜索引擎的体系结构1.2.2 个性化搜索关键技术1.2.3 个性化搜索研究现状1.2.4 个性化搜索面临的问题与挑战1.3 本文研究的主要内容1.4 本文的组织结构第2章 基于概率潜在语义的用户模型构造
前言第1章 绪论1.1 搜索引擎体系结构及功能1.1.1 信息的收集1.1.2 信息预处理1.1.3 查询服务1.2 个性化搜索引擎1.2.1 个性化搜索引擎的体系结构1.2.2 个性化搜索关键技术1.2.3 个性化搜索研究现状1.2.4 个性化搜索面临的问题与挑战1.3 本文研究的主要内容1.4 本文的组织结构第2章 基于概率潜在语义的用户模型构造2.1 问题提出2.2 用户模型研究综述2.2.1 用户模型的创建技术研究2.2.2 用户模型的学习与更新技术研究2.2.3 用户模型应用技术的研究2.3 用户搜索行为的理论分析2.3.1 从认知角度分析用户的搜索行为2.3.2 用户搜索行为的不确定性2.3.3 用户搜索行为分析的逻辑框架2.4 用户动机分析的两类不确定问题2.5 基于PLSA的潜在概念获取与用户模型构建2.5.1 概率潜在语义分析2.5.2 潜在语义空间的Zipf分布2.5.3 基于PLSA的用户动机建模2.5.4 用户模型的学习与更新2.6 实验及评价2.6.1 数据集2.6.2 评价标准2.6.3 实验结果及分析2.7 本章小结第3章 基于有限混合模型的文本聚类3.1 问题提出3.2 传统聚类算法的概述3.2.1 基于相似性的聚类方法3.2.2 基于模型的聚类3.2.3 各类算法的对比分析3.3 传统聚类方式在个性化搜索中存在的问题3.4 基于有限混合主题模型的文档聚类分析3.4.1 有限混合模型3.4.2 EM算法3.4.3 基于有限混合模型的文档聚类3.5 实验及评价3.5.1 实验数据集3.5.2 评价标准3.5.3 实验结果及分析3.6 本章小结第4章 基于用户潜在语义动机的查询扩展4.1 问题提出4.2 现有的查询扩展方法概述4.2.1 基于大规模语料库的查询扩展方法4.2.2 基于语义关系/语义结构的查询扩展方法4.3 目前查询扩展方法的不足4.4 基于潜在语义动机的查询扩展4.4.1 ULSM-QE的框架4.4.2 查询词处理4.4.3 查询语义动机分析4.4.4 相关度计算4.4.5 查询词的语义消歧4.4.6 生成新查询4.5 实验及评价4.5.1 数据集4.5.2 评价标准4.5.3 实验结果及分析4.6 本章小结第5章 基于用户偏好的网页排序局部优化策略5.1 问题提出5.2 传统网页排序算法介绍5.2.1 PageRank算法及其衍生算法5.2.2 HITS算法5.3 传统排序算法存在的问题5.4 基于用户偏好的网页排序5.4.1 UP-PR.框架5.4.2 查询词的主题分类5.4.3 网页的主题分类5.4.4 参数的选择5.5 实验及评价5.5.1 数据集5.5.2 评价标准5.5.3 实验结果及分析5.6 本章小结第6章 结论6.1 本文的主要贡献与结论6.2 进一步的工作参考文献作者简介
《基于潜在语义的个性化搜索关键技术研究》包括以下几个方面: (1)在计算机研究领域内,从哲学、心理学角度剖析用户搜索行为,并从认知学的角度,提出了基于概率潜在语义动机分析的用户行为模型,高度概括了各种具体搜索行为,从抽象的角度去理解用户的搜索行为。该模型的提出为进一步研究个性化搜索提供了新的思路。 (2)在文档潜在语义空间中,应用Zipf分布与概率潜在语义分析算法相结合的方式进行文档潜在主题提取,改善了文档潜在主题提取的质量。 (3)以狄氏先验的有限混合模型理论为基础,提出了高效无监督的网页聚类算法。可以有效克服一般的文本聚类算法无法有效应对的高维性、稀疏性文本,以及文本数据之间的相似性函数定义困难,聚类质量和效率低等不足,改善了聚类效果,提高了捕获用户兴趣潜在主题需求的能力。 (4)提出了一种新的基于用户潜在语义分析的查询扩展技术。即将通用搜索中查询扩展的技术与用户动机挖掘技术相结合,而开发出的一种新的查询扩展技术,解决了搜索引擎由于通用的性质而缺乏面向用户的个性化的信息处理的能力,从了解用户的语义上的搜索动机以及了解认知与心理相互作用的角度出发,从根本上解决了查询过程中的一词多义及多词同义等问题,在个性化搜索过程中有效的进行语义消歧。 (5)针对面向查询的排名算法的不足提出了面向用户的重排名算法。即在原有网页排序算法的基础上,根据用户的兴趣偏好而提出的一种局部优化排序算法,既符合用户的个性化需求,又不影响搜索结果的查全率,尽可能做到其排序结果与用户语义动机相符合。