区位码和标准电码之争持续了一小会,最后还是因为区位码直接和以后电子计算机的汉字国标码挂钩而获得了多数与会者的倾向性赞同。
“农业口要控制土地,工业口要控制技术,财金口要控制货币,军政口要控制位子,到咱IT圈,就要控制标准啊标准。”冯诺神秘一笑,心理暗想。
政务院要控制的的就是大数据。冯诺十分清楚统计对于政务院的意义。没有数字,一切的施政措施就是无本之木,无源之水。而元老院的政务院系统对数据的采集、整理的需求非常大,而且需要铺开的场所也很多。
“如果采用4位数字编码1个汉字的话,每张穿孔卡片可以存储20个汉字。”编码方案本身,与编码在穿孔卡上的表示实际是两个问题。如果按穿孔与否作为2进制的观点来看,每列实际上有12位,一个半字节的信息。足可以编码4000多个字符。
“这也太少了,好像还不如80个英文字母的信息含量大,7张卡片才能发一条微博,还没算标点符号。”又有人说道。
“4位数的中文编码在实践中可以用两列来表示,只是机械设计的难度会增大。具体方案请大家查看附录3。”
原来冯诺的设想是每列打3个孔来表示两位数字,其中在每列的09位置上打两个孔表示两位数字。高区11行打孔表示下面穿孔的两位数字从小到大排列,12行穿孔表示下面穿孔的两位数字从大到小排列。
“两位数字相同怎么办?”
“11行和12行同时穿孔,09只打1个孔。下一页有说明。”
不过3孔的方式虽然能把汉字编码长度缩减到一半,让一张卡片最多存储40个汉字,但显然机电系统和控制系统设计都不是一日之功,讨论来讨论去,会议还是决定本次人口普查的卡片设计采用4位数字编码汉字,毕竟欧美人姓名也是动辄十几个字母,相比之下汉字姓名也不算太长。
冯诺接下来又简要介绍了资料上的一些内容,最后特意说道:“我们做这个工作时间比较匆忙,部分资料查得有不到位的地方,以后也会继续完善。督……马国务卿对机械式计算机的研究很久也很深入,期望能给我们一些方向上的指导和细节上的补充。”
马千瞩笑着说,“我今天本来打定主意只带着耳朵来。不过你们讨论得这么热烈,我就当自己是个爱好者说两句。你们的工作还是很充分细致,我只提两点,一个是机电设备的制造,继电器的开发有没有把握?工作要先易后难,先急后缓,就人口普查来说,最紧迫的是什么?打孔机器,量产可靠便携耐用的打孔机器,而打孔机器又是穿孔机系统里最基本、最简单的设备。也最容易设计制造。调查需要时间,后面的设备可以同步研发制造。等调查做完了,卡片收上来了,等一等也是可以的,宁可让数据等机器,不让机器等数据。这是第一点。”
“第二点是卡片,我看精度要求还是要符合咱们生产力的现状,建议你们把造纸厂和印刷厂的同志们请来一起商量一下,德隆现在在造纸币,他们的经验也要听一听。现阶段技术成熟、能够稳定量产、成本上可以接受的卡片标准是什么样的,一开始慢一点、粗一点不要紧,有原型系统,后面的事情就好办……”
“我可以补充一下1890年打孔卡技术,我之前也查了一些资料,1890年美国人口普查也用80列卡片,但是当时打的是圆孔,卡片尺寸与现在我们说的IBM卡还不一样,打孔设备极为简单,几乎就和我们过去坐火车检票的钳子差不多,人工打孔,也没有印制对应取值的功能。错误率和偏斜律高达1/20。同期的分类机和制表机想必也精密不到哪里去。而就是这样简陋的机器设备水平,仍然比1880年人口普查的统计效率高出百倍千倍。这样的水平,我们完