李勇军接着说道:“关键在于,字库里面的字本身就有六万多个,两个字组合起来的可能性更是数不胜数,我们需要将这无数种组合先列出来,放到汉卡里,然后在用户输入第一个字的时候搜索这个字相关的所有组合,再从这些组合里找到用户想要的这个组合。”
秦奕一听李勇军说的这个从无数选择里面选出最有可能组合的思路就明白了,前世先进的输入法处理这种联想问题估计是用的人工智能模型来找出结果的。
但现在这个时候硬件的算力完全提供不了这种能力,只能依靠人工将所有的可能先列出来。
想想这工作量就让人发麻。
联想那边有充足的人手做这事情,他们可没有。
这下有点难办了。
不对!
就算是联想人多,但是六万的平方这个数字还是大得难以想象的。
联想那边应该也没有处理这么多词组。
是了,我刚才陷入了一个误区,实际上并不是每个汉字都能互相组合的!
用户也不会要求词组联想给你生成一些没见过或者特别生僻的组合。
其实只要他们的汉卡能处理出现频率比较频繁的词语便可。
这样其实他们只要把《现代汉语词典》里面收录的词组都联想出来便可。
秦奕把这个想法告知了李勇军,李勇军也是一拍脑袋笑了。
之前他因为处理字库信息的原因,就买了不少字典词典,这时他赶紧拿过旁边的词典翻了翻,粗略地估计了下词典里面的词组数量。
“应该不到十万!那感觉还是可以处理的,不过相对之前的字库信息还是要难处理些,大概需要两周时间吧。”李勇军说道。
“可以,两周之后估计我们图形界面对 WORDSTAR 的兼容应该也处理好了,到时候一起给电子工业局的人看看吧,说不定他们又会成为我们第一批用户!”秦奕开心地笑道。