出版社:科学出版社
年代:2010
定价:60.0
实现对大规模真实文本的处理是计算语言学今后一个时期的战略目标,建设高质量的大规模语料库是中文信息处理领域的基础性工程。基于语料库的语言研究是计算语言学一个重要领域,语料库的建立为语言学的研究提供了丰富的语言现象;为计算语言学学者从加工的语料库中获取语言知识、建立语言模型、研究语言信息处理技术,提供了翔实的语言信息数据。作为研究资源的语料库的价值是通过对语料的加工来体现的,对语料库加工的层次越高,语料库的应用价值就越高。当前,对大规模的中文文本语料库的深加工,主要包括词法分析、句法分析和语义分析等。本书将以编者主持的若干国家项目和合作项目为依托,重点介绍语料库深加工中的若干技术,涉及到分词、词性标注、句法分析和各项分析中的自动校对和一致性检验技术,同时还将就语料库加工质量的评价技术和加工过程中的一些辅助软件作详细介绍。