2012年4月20日星期五

Google 跟同桌 Bing 说:同学,别再抄袭俺的搜索结果了嘛

好吧,尽管Google也在向Bing致敬(比如可更换搜索的背景图Google Images的搜索结果界面),但好歹不是那种赤裸裸的复制(微创新?),相当于扫了一眼答案,然后再用自己的能力从头到尾验算一遍。但是Bing直接抄袭Google同学的搜索结果就比较说不过去了,抄袭证据呢?嘿嘿,Google同学发现搜索A同时自动纠正为B的搜索结果,在Bing同学那边搜索A,出来的结果居然直接就是B。

Google一名专家Amit Singhal说:

我用自己的职业生涯致力于做出一个优秀的搜索引擎,如果竞争对手的算法比我们的好也就认了,但在我的词典里,抄袭不等于创新(在腾讯的字典里抄袭等于微创新?)。

在去年5月的时候,Google发现Bing的某些搜索结果非常棒,跟Google的搜索结果一模一样的棒,即便是你输入了一个错误的搜索关键字。比如你搜索一个错误拼写torsoraphy,Google返回结果是这样的:

Google并不会给你错误拼写单词的错误结果,而是给出正确拼写Tarsorrhaphy的搜索结果,同时在最上方告诉你我们现在给你的是正确拼写Tarsorrhaphy的结果,你也可以坚持搜索错误拼写的torsoraphy。

咱再看看Bing同学,搜索错误拼写的torsoraphy,天那它居然在第一条直接给你返回正确拼写的Tarsorrhaphy结果了(目前依然是如此),那个第一条结果的维基百科页面里压根就没有错误拼写的torsoraphy单词:

Google的团队对于错误拼写的纠正下了很大的功夫,他们甚至可以纠正那些之前从没人搜索过的单词。拼写纠正团队的工程师们一直在监视竞争对手是否也会出现非正常的搜索关键字,所以当他们看到Bing居然能在错误拼写搜索结果页面给出正确拼写搜索结果条目的时候,他们震惊了。

到了去年10月,Google团队这帮人已经被震的麻木了,在做了广泛调查后他们发现Bing显示的搜索结果与Google的重合度大大提升了,最厉害的是前10个搜索结果100%重合度的情况也大大增加了。

此时Google开始怀疑Bing同学在抄袭他们的搜索结果了,你搜索结果越来越像我可以说是自己算法提升了,但你连我错误自动纠正的结果都自动按照对的结果抄了去,这个就露馅了啊。然后Google也开始邪恶的想,是不是微软的IE浏览器在搜集用户跟Google搜索的结果呢?他们的Bing工具条也很有可能是帮凶。

请Bing君入瓮:

猜测不能当证据使,于是邪恶的Google同学干脆决定以后考试的时候故意写错几题,答案还要非常离谱,看看Bing同学说是不是也写了同样离谱的答案。于是Google首次手动更改了100个关键字的搜索结果排名(啊哈,Google终于承认自己手动改排名了,但是为了吊Bing同学上钩),把一些很糟糕的网站提到前面显示。

这个实验开始于去年12月17日,大概有20位工程师参与,他们被要求回家后使用IE浏览器,打开“推荐的网站”(Suggested Sites)功能,并安装Bing工具栏,对这些手动调节过的搜索关键字进行搜索,同时点击第一位的搜索结果。到12月31日,这些关键字里出现的那些糟糕的搜索结果已经陆续登上了Bing的搜索结果页面,啊哈,Bing就这么乖乖的上钩了。

提供当时他们测试用的mbzrxpgjys这个关键字的截图证据(Google的实验已经结束,该关键字第一位已经不再是RIM),这个无意义的关键字之所以第一位搜索结果是RIM,都是Google手动调节的结果:

然后12月31日,Bing同学已经抄袭完毕mbzrxpgjys(到目前为止,Bing依然将RIM作为这个无意义关键字的搜索结果第一位),把错误的答案交上来了:

微软利用自己的IE和Bing工具条嗅探人们在Google搜索关键字和搜索结果,然后抄袭到自己的搜索结果里:

当然如果你现在尝试搜索一些关键字的话,你会发现Bing同学的答案跟Google同学完全是不同的啊?咱们可以这么理解,对于那些热门关键字,Bing的搜索算法会起到作用实现不错的搜索结果,那么他们就用自己的算法。而对于那些生僻的关键字,或者说那些Bing知道自己搜索结果不佳的关键字,Bing就会去抄袭Google的搜索结果,以掩盖自己欠佳的搜索结果。实际上在Google测试的100个生僻关键字里,只有7-9个被Bing抄了去,Google自己也不明白这是为什么。

作弊方法:

那么IE到底有没有在搜集用户的搜索信息呢?当然是这样的,而且默认的设置就是如此,不过罪魁祸首很可能是“推荐的网站”(Suggested Sites)功能:

“推荐的网站”(Suggested Sites)功能会基于你浏览过的网站,来给你推荐出类似的网站。当这个功能打开的时候,你在地址栏里输入的网页地址会连同一些基本的电脑信息发送给微软。

另外一个罪魁祸首则是Bing工具栏,它会搜集你的系统和一些额外信息,将包括搜索关键字、你访问的网站和你如何使用软件的信息发送给微软,以提升服务水平(抄袭Google确实可以提升Bing的搜索质量,恩,微软这次没撒谎):

尽管Google的Chrome也有这个功能,但他们表示他们的做法跟微软不同。他们只会让Chrome返回用户访问的URL地址,但不会使用这些URL地址和其中包含的信息,也不会把这些信息用于Google的搜索结果页面里。

合法性:

那么Bing同学是否违法了呢?不太好说,不过起码Google并未想要发起诉讼,他们认为Bing还是有自己的算法的,只不过在某些搜索关键字上在模仿Google。

合理性:

那我可以说Bing同学的做法是合法不合理的吗?恩……也不太好说。我为什么不能复制Google的搜索结果?人人都可以这么做,Google管不到你,只不过Bing的做法有点旁门左道,或者说不是一个大公司应该做的事儿。Bing并没有偷取Google的搜索算法,而只是用最拙劣的方法复制Google前几位的搜索排名结果,就是说它只能看到Google同学的最终计算结果,而没看到Google同学的整个解题过程,如果Google同学的正确答案可以得10分的话,Bing同学只有结果没过程的答卷也许只能得2分?3分?不过也得看是哪种类型的题了,如果是判断题的话……那Bing同学还是可以拿10分。

当微软在2009年发布Bing的时候,业界都戏称这个名字的全拼写法是“Because It’s Not Google”(因为它不是Google)或者“But It’s Not Google”(但它不是Google),现在我们终于知道了正确的写法:“Bing Is Now Google”(Bing现在就是Google),嘎嘎~~

Via SEL
Pic via fotosa.ruHype Lounge and bookofodds




Related posts

coded by nessus

没有评论:

发表评论