关灯
护眼
字体:

军事资料百科_随风落叶【完结】(985)

  汉字的重复利用率非常高,历代积累的汉字总数以万计,康熙字典就收录了4万多,专家指出常用仅三千五,选取当代的常用字作为学习和使用汉字的重点,是历代历朝整理和教学汉字的一个重要内容。历史上的《三字经》《千字文》都是用当时的常用字编成的识字课本。

  而英文呢?例如因为一个地名就是一个单词,想正确认识,需要的时间精力只有少数人能够应付,英文真是笨人的语言,由于在表达方面的缺陷,靠字母的一维线性组合,试图给天下每一事物起一个名字,一种东西就是一个单词。宇宙无穷,英文词汇无穷——可惜人的精力有限!

  英文是发散的。

  在英文世界里,一般美国高中毕业生掌握的单词量也就在三千到三千五百个左右,这样已经应付日常生活需求足矣,但是没有20000个字别想读报,没有30000个字别想把周刊读顺,大学毕业10年后的职业人士一般都懂80000字。新事物的涌现,总伴随着英文新词,例如火箭(ROCKET),计算机(COMPUTER)等,可汉语表达这些很轻松,不就是用“火”驱动的“箭”么,会“计算”的“机”么!可英文就不能这么干,不能靠组词,原因是“太长”了。如火箭将成为“FIRE-DRIVEN-ARROW”,计算机将成为“COMPUTAIONAL-MACHINE”等。人的视角有限,太长的字会降低文章的可读性与读者的理解能力。这是因为英语的字母对应汉字的笔划,单个汉字对应的是英语的词,中文的词对应的是英语的词组,中文表达、传递信息的优势一目了然。

  目前英语词汇量已经超过40万,预计本世纪中叶会达到百万。而汉语则相对稳定,现在只有很少的古文知识的中学生就可以琅琅上口地读屈原的楚辞。英文就难了,太不稳定。现在的人们读沙士比亚的原著已困难重重,更不用说读400年前英国诗人乔叟的诗了。由于英语以表音为主,同时号称是讲者分布最广泛的语言。正因如此,讲英语者往往因语义词汇和地域习惯,引起误会。因此谓英语是“世上最广泛被误解语言”,也绝不过分。英语也是世界上最容易引起人事纠纷的语言。就目前英国和美国还分出了英式和美式英语,加上其他所谓的英语国家,虽然都说英语,其拼写读的差异不次于中国各地方言之间的差别,交流的难度是远超过使用表意的中文的。

  现代所有学科领域,中国都有很好的学者,没听说哪位因汉语“不精确”而搞不好研究的。中国的火箭照样可以精确升空,中国的原子弹照样可以精确爆炸。所有的英文科技文献都可以翻译成汉语。个别人会说了,为什么中国现在落后,就是由于中华文化中杀气少,数百年来对杀人武器研究太少,遭到掠夺以至落后了,虽然如此,最困难的时候已经过去,中国现在正以世界最快的速度复兴。汉语文献影响力正随着国力的增强而在世界范围内增强。

  .

  *现代汉语的发展(本节引用自《谈汉语与英语的优劣》)

  研究表明:汉字作为一个复杂的文字符号系统,其信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值 (平均信息量)是9.65比特。通过数理语言学中著名的齐普夫定律(ZIPF’SLAW)核算,这是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:

  法文:3.98比特

  西班牙文:4.01比特

  英文:4.03比特

  俄文:4.35比特

  中文:9.65比特

  可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。

  汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆0-9,10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9表,二进制只需要学会与、或、非的简单逻辑。但是,人类在日常生活中为什么不使用二进制数字系统呢?因为那样很浪费,一个数字“7”表示成二进制就成了“111”,记个大数不把人累死?反过来,人类为什么不用十六进制,或更高的进制呢?一方面是人脑智力的限制,另一方面,十六进制也未必能大幅度提高信息熵。这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。信息熵高是不是就不利于计算机处理呢?这方面恐怕还很难下结论。简单的比较汉与英文的输入速度是不能说明问题的,因为“字”与“word”是不同的概念。要比较只能比较同一内容的中英文两个不同文本,计算击键数的差值。在“词”的单位基础上,现代汉语与英语是可以进行比较的。现代英语为了应付不断涌现的新事物、新思想、新科技、新概念,也在不断地造词。无非是借助拉丁词根、或重新组合已有单词,结果越是专业科技的词汇,就越长、越难记。或者是大量使用缩写:如WTO、FBI、IBM、UFO等等,缩写一多就容易混淆、难以理解。在这方面,现代汉语造词的优势就十分突出了。这就是汉字字符集信息熵高的优势。

  用现代计算机技术作为信息化的标准,来衡量汉字与英文字母的优劣是件很荒诞的事情。现代计算机技术说到底就是基于“二极管”的技术,将来的发展很难预料。难道要人类高度智能的思维模式,去模仿“二极管”式的思维?那是典型的削足适履。试想,难道当年就因为发明了黑白照像术,人们就该废掉油画的色彩?难道当年就因为摩尔斯电码适合新发明的电报,人们的语言就都应该改成“ 嘀嗒”?


小贴士:如果觉得52书库不错,记得收藏网址 https://www.52shuku.vip/ 或推荐给朋友哦~拜托啦 (>.<)
传送门:排行榜单 | 好书推荐 |