出版社:科学出版社
年代:2017
定价:66.0
向量空间检索模型在话题识别与追踪领域的成功应用,从理论上证明用于信息检索的贝叶斯网络模型亦可用于该领域。信念网络模型属于基于贝叶斯网络的检索模型的一种,专著围绕该思想,将其用于话题识别与追踪模型的构建,为该领域提出新的研究方法。考虑到新闻报道的特殊性,在文本处理阶段,将在基本互信息的基础上,提出融合聚类思想和时间距离的新闻话题特征选择方法,用于计算新闻报道中术语的权重。为了获得每个话题的初始特征子集规模,给出基于类内距离最小、类间距离最大的目标函数,并采用坐标下降法对其求解结合信念网络模型和新闻报道的特点,给出四个基于信念网络的话题模型BSTM-I、BSTM-II、BDTM-I和BDTM-II。BSTM-I、BSTM-II属于静态话题模型,其区别是节点层数、类型。BDTM-I属于动态话题模型,节点类型和弧的意义与静态模型相同,不同的是在话题追踪过程中,其术语层会随着话题的发展而不断更新,包括术语权重的更新和术语节点的插入、删除。以上三个话题模型沿用了传统建模思想,具备和以往模型相同的优缺点。BDTM-II打破传统建模的思想,运用信念网络模型提供了一个灵活框架的优势,将术语节点分为两类:初始核心术语节点和更新术语节点,并采用析取手段将它们作为两类证据进行归并。依据模型的拓扑结构、贝叶斯概率和条件独立性假设给出了上述四个话题模型的概率推导。最后,专著将在上述内容的基础上,进行基于信念网络的话题模型优化研究,以期进一步提高模型的综合性能。