听到秦毅安慰的话,王正阳微微苦笑。
能够进入星河科技研究院,他的工资待遇非常不错,富足的小康生活是完全没有任何的问题,生活上没有什么烦恼的事情。
可是这工作上面,研究这汉语编程和汉语操作系统,长期没有什么进展之下,整个人都变的非常的烦躁,一度甚至都想要辞职不干了。
“跟我说说,这汉语编程和汉语操作系统方面到底有那些问题?”
秦毅笑了笑,其实汉语编程和汉语操作系统的研究方面,秦毅多少也是知道一些的,并且自己也是去认真的学习和研究过。
在科技塔之中,秦毅也是仔细的研究了宇宙之中诸多文明的语言和文字,找到了很多和汉语差不多的语言,仔细的研究他们的计算机操作系统和编程系统。
而科技塔作为高级文明的作品,对于不懂语言和文字之间的系统、编程之类的也是有详细的说明,各种各样的文字该如何去出发,如何去理清思路都有一个指引。
这一次过来,秦毅也是打算将这些思路和方法传授给大家,不然,等虚拟机都研究出来了,这汉语操作系统和汉语编程系统都未必已经研究出来。
“从哪里说起好呢~”
王正阳带着秦毅来到了研究所里面,来到一间会议室当中,会议室里面坐满了研究所的研究汉语编程和汉语操作系统的人。
王正阳仔细的整理了一番自己的语言,想了想说道:“先从语言说起吧,汉语相比起英语来,有很多优势。”
“汉语文字精炼,言简意赅,冗余度低,以最少的符号表达最丰富的含义,我们从信息学的角度予以阐述,汉字、西文字母作为语言文字的最基本单位,用以构成词汇、句子,传达一定的信息,是信息的载体,如何对每一个汉字、字母所负载的信息进行度量?”
“现代信息学用熵来衡量平均信息量,熵表示指定符号出现的不肯定性。西文字母采用的拼音文字字母有30个左右,汉语以方块字为书写单位,数目成千上万,显然其随机出现的不肯定程度比西文字母的不肯定程度要大得多,从这一角度讲每个汉字载荷的信息量远远大于一个字母的信息载荷量。”
“我们经过统计计算,得出法语字母的零阶熵值为3.98比特,意大利字母零阶熵值为4.00比特,西班牙字母零阶熵值为4.01比特,英语字母的零阶熵值为4.03比特,德语4.10比特,罗马尼亚语为4.12比特,俄语为4.35比特。”
“英语词的零阶熵为10.0比特,汉语词的零阶熵为11.46比特,这表明汉语的词义也比英语丰富。”
王正阳一边说,旁边有人开始打开投影仪,播放出他们对汉语和英语差异方面的研究成果。
“因为我们的汉语太过言简意赅,一个字、一个词表达的意思太丰富了,同样的一个字一个词在不同的场合下,语气下,意思就完全不一样。”
“因而由汉字组成的句,它的意思就更加的丰富,往往非常简单的一句话,它却是拥有多个意思。”
“比如能穿多少是多少?”