第1048页

一拳歼星 剑走偏锋 971 字 2022-11-28

“《辞海》收录有14872个汉字,《康熙字典》收录有47035个汉字,我们通常用的《新华字典》收录有8500个汉字。”韩幼薇报出了一连串的数据。

伊芙拿眼瞪牛大志,一副很得意的样子。

牛大志一挥手,直接评价道:“她不是正常人,不算。”

过了一会儿,他又想起刚才说的正题,又绕回来:“不对啊。你别岔开话题,我原本想说的是怎么知道基因序列里的碱基是人为排列的?也许是自然形成的呢。”

伊芙一脸鄙视把脸扭到一边去,哼道:“幼薇,你来告诉他,我不想和这家伙说话。”

“你自己说呀,干嘛老是让我说。”韩幼薇咕哝一句。

伊芙在桌子下面,用手拽韩幼薇的手指,小声的催促道:“你说,你说,你快说。”

韩幼薇无奈的摇摇头,组织一下语言,开始解释道:“好吧。按照我的理解,如果用dna序列当做编码记录信息,那么应该是一种四进制编码。

“而我们的计算机用的是二进制编码,单从数学上来说,四进制编码可以记录的信息是二进制的两倍。

“二进制需要四位数才能记录的信息,四进制只需要两位数就能完成。

“两倍的差距,其实不算大,所以如果用生物的基因序列记录信息,那么所用的编码方式,应该不会有太大的区别。

“陨石文明,我们暂时将这个在微生物基因序列中记录信息的文明叫做陨石文明好了。

“陨石文明用的肯定不是汉字,但无论用的是什么文字,表达情感、思想的作用是不会变的。

“也就是说,陨石文明把他们的语言,用四进制编码写在了微生物的基因序列里,那么我们可以通过我们的语言特征,对陨石文明的文字编码做一些推测。

“大家都懂电脑,应该知道,一个汉字占用两个字节。而一个字节,换成二进制编码,其实是8位数。

“也就是说,在我们的计算机编码里面,一个汉字需要16位二进制数字才能表示。

“我们的汉字有几万个,但其实1000个常用字就覆盖了92的书面资料,剩下的几万个生僻字,是很少用到的。