古籍汉字字频统计

古籍汉字字频统计

北京书同文数字化技术有限公司, 编

出版社:商务印书馆

年代:2007

定价:30.0

书籍简介:

本书中的古代汉语字频统计是借助国际标准编码字符集,对《四库全书》和《四部丛刊》中8亿多字的古籍语料进行分析,对语料中约3万编码汉字进行了逐字字频统计。

书籍目录:

1.前言

2.凡例

3.大规模古籍汉字用字统计报告

4.古籍字频统计表

5.古籍字频统计表索引

6.附录A:《四库全书》电子版工程“保真原则”说明

7.附录B

(1)样张说明

(2)ISO/IEC10646:2003CJK汉字与《康熙字典》关联表说明

(3)ISO/IEC10646:2003CJK汉字与《康熙字典》关联表页码.字位序说明

(4)ISO/IEc10646:2003CJK汉字与《康熙字典》关联表重复字表说明

内容摘要:

  本书的编写源于五年前书同文公司向国家语委申请的古籍汉字信息处理攻关研究成果。该成果以ISO/IEC10646CJK标准与《康熙字典》字头建立一一对应作为字频统计的基础纲目,以《文渊阁四库全书》和《四部丛刊》全文数码数据作为统计对象(超过八亿古籍汉字语料),最终得出每个汉字的字频排序、出现次数、出现频率,同时也揭示了中文古籍汉字用字量、用字临界点等奥秘,使过去一直模糊不清的技术和应用参数得到明确的验证。  该书的成书发行将为海内外古籍出版业者、中文数字化工程、中文信息处理工作者提供强有力的帮助以及权威性的理论和实用性依据。

书籍规格:

书籍详细信息
书名古籍汉字字频统计站内查询相似图书
9787100056076
如需购买下载《古籍汉字字频统计》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位商务印书馆
版次1版印次1
定价(元)30.0语种简体中文
尺寸26装帧精装
页数印数

书籍信息归属:

古籍汉字字频统计是商务印书馆于2008.01出版的中图分类号为 H087 的主题关于 古籍-汉字-使用频率-言语统计 的书籍。