DDG研究发现,谷歌的隐姓埋名的搜索结果仍然因人而异。-王其杉博客|程序员|科技新闻
反跟踪竞争对手DuckDuckGo对Google搜索结果的一项研究显示,对于那些只想在网络上开辟一点无偏见的空间,而不想利用互联网进行个性化搜索的消费者来说,逃避所谓的“过滤泡沫”是个极其棘手的问题。暗示算法手指的污染。
DDG认为,即使那些同样在Incognito模式下浏览的Google搜索的注销用户也不可能阻止他们的在线活动被Google用来编程,从而影响他们看到的结果。
DDG表示,他们发现谷歌搜索结果存在显著差异,参与研究的大多数人都看到了自己独有的搜索结果,而另一些则根本没有看到。
结果发现,新闻和视频信息框也有显著差异。
虽然它表示,登录的隐姓埋名浏览器几乎没有什么差别。
“这是不可能的,使用谷歌搜索,避免它的过滤泡沫,”它总结道。
谷歌回应称,DuckDuckGo的研究是“有缺陷的”。
个性化程度
DuckDuckGo说,他们进行了这项研究,以测试Google最近关于调整算法以减少个性化的说法。
美国全国广播公司9月份的一份报告,利用谷歌提供的访问权限,让记者参加内部会议,并与其算法团队的员工交谈,表明山景现在只使用非常少的个性化来生成搜索结果。
今年秋天,谷歌搜索排名小组负责人纳亚克(Pandu Nayak)告诉CNBC:“用户提出的查询通常具有如此多的上下文,因此个性化的机会非常有限。”
从表面上看,这将代表对谷歌搜索方式的彻底重新编程,因为谷歌在2009年就把“个性化搜索”作为甚至注销用户的默认设置。
Google在宣布这项功能的扩展时解释说,它将通过“匿名cookie”为这些注销的用户“定制”搜索结果:
这个添加使我们能够根据180天的搜索活动来为您定制搜索结果,这些搜索活动链接到您的浏览器中的一个匿名cookie。它完全独立于您的Google帐户和Web历史(只有登录用户可用)。您将知道我们何时定制结果,因为搜索结果页面的右上角将出现“View customizations”链接。单击链接将让您看到我们是如何定制结果的,并且还让您关闭这种类型的定制。
在Google推出个性化搜索开关几年后,Eli Pariser出版了他现在著名的一本描述过滤泡沫问题的书。从那时起,在线个性化的坏消息只增长了。
近年来,人们尤其关注大型科技的主观漏斗对民主进程的影响,这些算法经过精心设计,以保证为用户提供更多的相同服务,现在人们普遍指责这些算法捏造了党派观点,而不是起到了帮助作用。开阔人们的眼界。
尤其是政治和政治议题。而且,在最终,算法过滤器泡沫被指责破坏民主本身——通过为个人有针对性的宣传创造高效的分销渠道。
尽管近年来学术界也出现了一些反诉,暗示回声室效应本身被夸大了。(尽管有时也会从那些像谷歌这样的科技巨头提供资金的机构中发泄出来)。
和以往一样,在商业算法的操作不透明性方面,真相可能很难挖掘出来。
当然,DDG在这场大火中也有自己的利己之心,它暗示“Google正在影响你点击的内容”——鉴于它为同名的Google搜索提供了一个反跟踪的替代品。
但这并不值得立即否定一项甚至被认为“隐姓埋名”的谷歌搜索结果存在重大变化的发现。
DDG还使得来自该研究的数据可下载——以及用于分析数据开源的代码——允许其他人查看并得出他们自己的结论。
在2012年早些时候的美国总统选举之后,谷歌进行了一项类似的研究,并声称随后发现谷歌的搜索为奥巴马插入了比罗姆尼在竞选之前多数千万的链接。
它表示,在2016年总统选举之后,它现在想重新审视谷歌搜索结果的状况,这次选举在白宫安装了Trump,看看它能否找到证据来支持谷歌宣称的“去个性化”搜索。
DDG要求美国87名志愿者在2018年6月24日星期日美国东部时间晚上9点搜索“枪支管制”、“移民”和“疫苗接种”(按顺序)这些政治性收费的话题。又不使用匿名模式。
你可以在这里阅读完整的研究结果。
结果基于76个用户,因为排除了在移动搜索的用户以控制所显示的信息框数量的显著变化。
以下是DDG发现的线索:
私人浏览模式(并注销):
“枪支管制”:62个变种,52/76个参与者(68%)看到独特的结果。
“移民”:57个变异,43/76个参与者(57%)看到独特的结果。
“接种疫苗”:73个变异,70/76个参与者(92%)看到独特的结果。
“正常”模式:
“枪支管制”:58个变种,45/76个参与者(59%)看到独特的结果。
“移民”:59个变异,48/76个参与者(63%)看到独特的结果。
“接种疫苗”:73个变异,70/76个参与者(92%)看到独特的结果。
DDG的论点是,真正的“无偏见”搜索结果应该产生大体相同的结果。
然而,相比之下,其志愿者得到的搜索结果却占大多数。(从低端的57%到上端的满92%)。
“没有过滤泡沫,人们会期望看到搜索结果页面的极少变化——几乎每个人都会看到相同的一组结果,”它写道。相反,大多数人看到的结果是独一无二的。我们还发现,在私人浏览模式下,与普通模式下相比,Google退出了登录。
“我们经常听说,私有浏览模式允许匿名上网,这让人感到困惑,但这一发现表明,Google不考虑浏览模式而专门定制搜索结果。DDG补充说,人们不应该因为所谓的“隐匿”模式使他们匿名而陷入一种错误的安全感。
Google最初拒绝提供对这项研究的回应,而是告诉我们,有几个因素可能导致搜索结果的变化——标记时间和位置的差异。
它甚至暗示,根据用户查询所连接的数据中心,结果可能会有所不同——可能引入一些基于爬虫的微滞后。
Google还声称,它不会根据登录用户的搜索历史来个性化登录用户在Incognito模式下浏览的结果。
然而,该公司承认,即使对于注销的用户(如2009年的博客文章所描述的),它也使用上下文信号来对结果进行排名,例如当试图澄清一个模糊的查询时。
在这种情况下,它表示最近的搜索可能用于消除歧义的目的。(虽然它也描述这种类型的上下文化在搜索中是极其有限的,但它不会解释显著不同的结果。)
但是,由于DDG志愿者数据中存在如此明显的变化,谷歌的做法常常导致个性化——有时是高度个性化——搜索结果似乎没有什么问题。
一些谷歌用户甚至比其他用户拥有更多或更少的唯一域名。
许多问题自然而然地从这个问题中流露出来。
比如:如果游戏的名字正在破灭过滤泡沫,那么Google应用一些“排名上下文化”听起来像是一种充分“去个性化”的方法吗?
它是否使得服务的结果甚至更少地点击、偏颇和/或影响?
还是从隐私的角度来看,“排名”那么少?
你告诉我。
即使是以稍微不同的配置提供的相同一组链接也有可能非常重要,因为顶级搜索链接总是得到不成比例的点击量。(DDG说第一链接大约是40%。)
如果Google搜索的话题在政治上特别昂贵,那么即使是很小的搜索结果变化,至少在理论上,也会对一些重大的民主影响做出贡献。
有很多值得咀嚼的东西。
DDG表示,通过让所有参与这项研究的参与者从美国进行搜索,并同时进行搜索,它控制了所服务的搜索结果中基于时间和位置的变化。
虽然它表示通过将此类结果绑定到localdomain.com占位符(以及信息框的“Local Source”)来控制包含本地链接(即取消任何基于本地化的变体)。
然而,即使采取措施控制时空变化,谷歌仍发现大多数谷歌搜索结果对个人来说是独一无二的。
“这些编辑结果由Google关于你的个人信息(比如你的搜索、浏览和购买历史)告知,并且基于Google的算法认为你最有可能点击的内容,将你置于泡沫之中,”它争辩道。
谷歌会反驳说这是“语境化”,而不是社论化。
而且搜索结果的任何“微小变化”都是谷歌搜索响应业务动态性质的自然属性。
尽管如此,正如上面提到的,DDG发现一些志愿者没有得到某些链接(当其他人有链接时),这听起来比“细微的差别”更为显著。