博客首页|TW首页| 同事录|业界社区
2007-04-08

晚上刚开机,谷歌输入法提示正在下载更新,等待的时候看到网上已经有报道,并且搜狗与谷歌分别就词库的事情发了说明。


等候片刻,谷歌提示开始安装更新,结果安装失败。去到帮助网页,没找到明确的更新的位置。索性重新下载安装,重新启动后,版本变成为1.0.17.0。


输入以前论坛上曝光过的所谓和搜狐相同的错误词汇,已经不再是相同的结果了。当然我知道的“错误词汇”有限,我想搜狐会去验证更多的“错误词汇”。在这个事件中,“错误词汇”成了最有效的证据。(注:错误词汇产生于根据词频从网页提取的过程中)。


这个事情发展到目前阶段,做个小结:


1、搜狐说:经过我公司技术人员技术鉴察,google谷歌的拼音输入法词库确系直接盗用搜狗拼音输入法词库(包括且不限于1.5beta2版本,含词表及对应注音)。

2、谷歌说:该词库在试验阶段确实包含了一些非Google(谷歌)的数据源,我们愿意直面自己的问题。目前的词库是从谷歌多年积累的海量搜索数据库数千万条目中产生。


我对此事情的一些想法:


1、搜狗输入法从诞生起就费了很多力气一遍遍改正错词,肯定不愿意让别人用,有理由愤怒。


2、搜狗输入法为了证明被抄袭,大方地接受了网友指正的错误词汇。会促进改正的速度。


3、搜狗输入法刚推出的时候,有很多声音说很像紫光拼音输入法,紫光拼音输入法咋没想到错误词汇这件事?


4、搜狗输入法通过这次事件,传播面更广泛了。但也促进了谷歌输入法的快速升级。


5、搜狗的声势造成了谷歌对网友的不便抱歉,在中国尚属首次。


6、谷歌推出输入法在后,词库方面得了些便宜。不过也证明了搜狐推出搜狗输入法这个项目的正确性、前瞻性。


7、搜索引擎独有的分词、词频等优势一定会使搜索引擎自己的输入法超过其他输入法的词汇增长,从而确定领先地位。不知道百度会不会动心。


8、此次输入法舆论大战的胜利属于搜狗,但这事情很难起诉。接下来,才是两家拼用户体验服务的长期较量。输入法所带来的词频与词汇,能否让各自的搜索引擎更准确、更好用?拭目以待。