出版社:科学出版社
年代:2016
定价:90.0
词语是语言的建筑材料,语是比词更大的重要的建筑材料。但是,语言学界对于语的研究却一向比较薄弱。目前,对于成语、谚语、歇后语和惯用语之外的语的关注越来越多。语言信息处理领域不但需要成语、谚语、歇后语、惯用语这些传统称为“熟语”的固定短语,而且更需要面向实际应用的“结合紧密、使用稳定”的其他固定短语。信息处理领域定义的“结合紧密、使用稳定”的“分词单位”既包括词也包括语,但对于“结合紧密、使用稳定”的语却没有办法大量收录。“结合紧密、使用稳定”是中文信息处理领域定义“分词单位”的基本原则,但是中文信息处理界所定义的“分词单位”没有一个具体标准去实施,判断是否”结合紧密、使用稳定”主要依靠人的语感,在自动分词时具有不可操作性。