MindManager果然不是盖的,是我目前用过的最适合我的辅助设计工具,虽然它没有针对开发设计功能,但是在辅助设计方面非常棒。下周有时间的时候我写个详细的评测出来。
巨硬II在MindManager的帮助下迅速走上正轨,很快就可以再度回到代码阶段。大部分算法问题现在都有了着落。唯一遇到的问题是,新的巨硬设计大量统计汉语的词序相关性,目前找不到这方面的资料和数据,恐怕在完工之后得写个机器人程序才行。因为仅仅在设备上Training的话,多数用户的输入量很小,很难快速进入较好的预测状态。这是个不大不小的麻烦。
在巨硬II的设计过程中,我对新算法越来越有信心。举个例子,下班的时候我想发这样一条短信:晚上回来吃饭吗。在现有的巨硬中,
1)先按w键,出现候选字[我,为,完,晚,王],这里至少有两个明显的问题(1)[完]字出现在一句话的句首,是不是很罕见的情况?(2)[晚]其实是一个很少单独使用的字,为什么不能直接出现[晚上]呢?
2)输入[晚上]之后按h键,出现候选字[和,号,很,好,还],这里的[号]字几乎是不可能出现在[晚上]一词之后的,[和,很,还]也是可能性很低的。
3)输入[回来]之后按c键,出现候选字[陈,吃,车,从,程],除了[吃]字之外,其它几个字也相当莫名其妙。
4)输入吃饭之后按m键,出现候选字[吗,卖,买,没,马],同样,[买,卖,马]出现在[吃饭]一词之后也是不合常理的,象[买]和[卖]这样几乎只会单独使用的动词很容易以高词频姿态出现在前面,但是其实只有非常少的词可以放在前面搭配的。
在使用简码的情况下,这句话键入了ws#hl#cf#m,一共10键。而巨硬II追求的目标是:w#h#c#m,而如果这句话你经常写,那么最好的情况应该是w####,:)。能做到吗?现在还不知道,但是这绝对worth a trial。你觉得呢?
注:#代表选字键,在巨硬上可以是四大天王加空格键中的一个,视目标词语出现的位置而定。
Subscribe to:
Post Comments (Atom)

2 comments:
一个意见,我觉得用户是不能接受把“晚上回来吃饭吗”输成whcm,思维跳跃太大,对用户来说并没有意义。而且重码率实在太高了。
而且应该注意到的一点是,很多老网虫在PC上喜欢用智能ABC甚至全拼,而不用微软拼音等其它的。因为他们熟练的差不多能记住每个词的位置,频繁的变动带来的体验并不好。
你没明白我的意思。我的意思是,如果考虑上下文的语意关联,很多候选字词是根本不合格的。筛去这些字词是巨硬II要尝试的主要目标,实际上这等同于降低重码率。当重码率能降低到一定水平之后,象数字键盘这种“天生”重码率问题也许就可以得到一个很好的解决。
我今天在快速切换电视频道的时候,听到一个播音员说了“二零”,然后就把这个频道切换过去了。此时我的脑海中就很自然的把它填补成“二零零X年”,这就象输入法一样,如果输入了二零之后,写了l,我想像不出除了“零”这个候选字,以及逻辑上有可能但实际上可能性很低的“六”字之外还有什么其它字合格,如果x不是0-9中的一个数字的话,我也会觉得很意外,x之后如果不是“年”的话,那也很费解。现在的非整句输入法大多不会考虑在一个词前面输入的词是什么,但实际上,前面输入的词对预测下一个字的帮助更大,写一个字母只能是26个编码中的一个,而前面可能出现的词的可能就太多了;而且,及时前面没有词,在写下第一个字的时候,也不是两万个汉字出现的几率一样的,真的认真统计一下的话,也会发现能出现在标点符号后面的第一字的可能性并不是很多。
Post a Comment