--谈今日的资料压缩陈之藩
①大致说来,人类社会赖以生存的三大基本要素是物质、能量与信息。从最原始的到最近的社会一直是如此。不过在上古的人没有意识到信息的重要,虽然语言、符号、图像、文字与人类的历史几乎可以说是同时演进而来。
②我们意识到信息的极端重要与信息的定量估测是始于二十世纪中叶。大致是由控制
第1页 共7页
理论的创立者温纳(NorbertWiener)及信息理论的定义者山农(ClaudeShannon)所启迪的。温纳说:"信息就是信息,不是物质,也不是能量。如不承认这一点,我们就不易存在下去。"山农则是把玻耳兹曼(LudwigBoltzmann)墓志铭上那个"熵"的公式借来,为信息做了定量工作并构建了分析理论。
③信息不仅包括我们所有的知识,还包括感官所触到的一切。报纸上的新闻,书本上的报告,市场上的行情起伏,电视上的天气预报;简单到一张照片或一幅图画,复杂到终端机上的种种显示,印表机上的列列标记都是信息。我们固然一直是生活在物质--如空气或水--的海洋中,也是生活在能量--如光或热--的海洋中;而今,我们忽然悟出更是生活在信息的海洋中。从古以来就是如此,二十世纪下半叶情况尤然。
④但信息与物质或能量有所不同。信息的最大特征是:它并非单独存在的东西,而是以互相联系为前提。没有联系,就没有信息。于是信息必依附于一定的载体。通过载体,这信息才能被处理、传输、操作。而今,呈现在我们面前的信息多是经电子为载体、用数字作处理而表现出来的资料。
⑤信息资料不能单独存在,是由互相联系而来。所谓互相联系,主要是传递与储存;而储存可以视为延迟了的传递,于是信息与传递,或者信息与储存的关系也就特别密切了。
⑥经由数字处理而得出的信息资料,自然因频繁的传递与大量的堆存,而逐渐成了问题;并且这个问题随着时间的推移而日形严重。人们遂发展出特别的储存与传递的方法,称之为资料压缩。
⑦我们现在以电脑问世以后的眼光,回顾一下历史,也许对于人类目前对付资料压缩的问题能够有所理解。
⑧我们先以司马迁的《史记》作为例子。司马迁是把从轩辕到汉武帝时代汗牛充栋的史实,用一片片竹简写出五十二万字的《史记》。他的志趣所在,是把这一大堆竹简写成的《史记》,"藏之名山,传之其人"的。这整个的过程与目的可以说是信息的传递,也就是他所谓的"传之其人"。而储存的方法则是写在竹简上,把竹简"藏之名山"。当然如果能省掉一