生物序列数值化表征模型的矩阵分解方法及其应用

生物序列数值化表征模型的矩阵分解方法及其应用

余宏杰, 著

出版社:中国科学技术大学出版社

年代:2014

定价:36.0

书籍简介:

本书以生物序列的数值化表征模型所涉及的矩阵分解为核心,以序列的特征信息提取为主要目标,在非序列比对(Alignment-free)的框架下,分别提出了针对DNA/蛋白质序列、基因组序列等若干个不同的特征信息抽取模型,并将所抽取的特征信息,应用于序列的相似度分析.本书取材广泛、内容新颖、理论与应用紧密结合。书中所介绍的生物序列的建模方法、矩阵分解抽取其特征信息的研究策略,可供读者在解决实际问题时予以借鉴。本书适合生物信息学、图像处理、信号处理等领域有关科研人员参考使用。

书籍目录:

前言第1章 绪论 1.1 生物信息学海量数据的产生背景 1.1.1 生物信息学简介 1.1.2 两种基本的生物序列 1.2 生物序列比对概述 1.3 基于序列比对的系统发育树构建方法 1.3.1 分子进化研究的基本方法 1.3.2 构建系统进化树的详细步骤 1.3.3 构建系统发育树需要注意的几个问题 1.4 生物序列数值化表征模型的矩阵分解方法的研究背景 1.4.1 序列图形化表征 1.4.2 基因组序列数值化表征及应用 1.4.3 蛋白质序列数值化表征及应用 1.4.4 有关x-mer的算法概述 1.5 本书的内容安排第2章 基于矩阵束联合对角化的DNA序列图形化表征及其应用 2.1 DNA序列的图形化表征方法概述 2.2 DNA序列的描述符 2.2.1 相关的一些工作 2.2.2 构建序列的邻接矩阵 2.2.3 矩阵分解理论简介 2.2.4 有关矩阵对角化的理论 2.2.5 近似联合对角化(AJD) 2.2.6 算法的保距性 2.3 图形化表示法 2.3.1 计算特征值组成的序列表征向量(EVV) 2.3.2 AJD算法收敛性分析 2.3.3 基于特征值组成的表征向量(EVV)的序列图形聚类 2.4 相似度分析 2.4.1 聚类分析基本原理 2.4.2 计算成对距离 2.4.3 u条卢球蛋白基因的系统谱系分析 2.4.4 与相关工作的比较 2.5 本章结论第3章 基于SVD的基因组序列保序变换及其应用 3.1 DNA序列数值描述符 3.2 从基因组序列向数值向量的保序变换 3.2.1 基因组序列变换矩阵的构建 3.2.2 所提出的序列变換算法具有的良好性质 3.2.3 保序变换-奇异值分解(OPT-SVD)算法的过程描述 3.3 保序变换算法在基因组序列相似度/相异度分析中的应用 3.4 本章结论第4章 基于保距映射算法的基因组序列Map示图及应用 4.1 受PCA的启发尝试对基因组序列数值描述 4.2 基因组序列的“保距”变换 4.2.1 特征矩阵的构建 4.2.2 基因组序列变换的特性 4.3 基于保距变换算法的基因组序列的相似度分析 4.3.1 第一个数据集上的实验结果 4.3.2 另一个更大规模数据集上的实验结果 4.4 本章结论第5章 基于NFV-AAA算法的蛋白质序列相似度分析 5.1 基于K-mer的组分向量法背景概述 5.2 基于氨基酸(AAA)分布的蛋白质序列描述符 5.2.1 描述符的范式 5.2.2 蛋白质序列转换成400×(L-1)稀疏矩阵 5.2.3 AAA优于SAA 5.2.4 对特征矩阵M施行SVD以抽取序列的特征 5.3 NFV在相似度分析中的应用 5.3.1 九条ND5蛋白质序列的相似度分析 5.3.2 在24条转铁蛋白序列的数据集上的应用 5.4 本章结论第6章 分段K-mer算法及其在序列相似度分析中的应用 6.1 K-mer分析法优劣性分析 6.2 基因组序列的描述符 6.3 s-K-mer在34条线粒体基因组序列数据集上的应用 6.3.1 优化算法的数据准备 6.3.2 对K-mer进行寻优以便获得其最优阶数K*值 6.3.3 s-K-mer算法的性能 6.3.4 利用s-K-mer对基因组作系统发生分析 6.4 本章结论第7章 基于层级虚拟混合与投影抽取的基因组序列比较 7.1 有关FFP与ICA背景概述 7.2 基因组序列特征提取模型 7.2.1 基于K-mer虚拟混合器的基因组序列数据预处理 7.2.2 虚拟混合与投影抽取模型 7.2.3 层级的VMPE模型 7.3 HVMPE模型在真实基因组数据集上的应用 7.3.1 先行相关数据的准备 7.3.2 确定虚拟混合器(VM)的最佳阶数K* 7.3.3 对HVMPIE模型进行最佳段数S*值的寻优 7.3.4 层级的VMPE模型的效果分析 7.3.5 基于HVMPE模型的基因组序列种系发生分析 7.3.6 在另一个基因组数据集上的应用 7.4 本章结论第8章 总结与展望 8.1 本书的主要工作与创新点 8.2 未来工作的设想 8.2.1 NMF的基本原理 8.2.2 序列分析中引入NMF算法的构想参考文献

内容摘要:

  《生物序列数值化表征模型的矩阵分解方法及其应用》以生物序列的数值化表征模型所涉及的矩阵分解为核心,以序列的特征信息提取为主要目标,在非序列比对(Aignment-free)的框架下,分别提出了针对DNA/蛋白质序列、基因组序列等的若干个不同的特征信息抽取模型,并将所抽取的特征信息应用于序列的相似度分析。本书取材广泛,内容新颖,理论与应用紧密结合。书中所介绍的生物序列的建模方法、矩阵分解抽取其特征信息的研究策略,可供读者在解决实际问题时予以借鉴。  本书适合生物信息学、图像处理、信号处理等领域有关科研人员参考使用。

书籍规格:

书籍详细信息
书名生物序列数值化表征模型的矩阵分解方法及其应用站内查询相似图书
9787312034541
如需购买下载《生物序列数值化表征模型的矩阵分解方法及其应用》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地合肥出版单位中国科学技术大学出版社
版次1版印次1
定价(元)36.0语种简体中文
尺寸23 × 17装帧平装
页数印数

书籍信息归属:

生物序列数值化表征模型的矩阵分解方法及其应用是中国科学技术大学出版社于2014.6出版的中图分类号为 Q5 的主题关于 生物分析-序列-数据模型-生物信息论 的书籍。