推荐平台 链接 平台介绍
币安网 注册链接 币安是全球领先的区块链生态系统,推出了一系列产品,其中包括最大的加密货币交易平台。我们的使命是在未来成为全球性加密货币基础架构供应商。
欧易OKX 注册链接 欧易是全球著名的数字资产交易平台之一,主要面向全球用户提供比特币、莱特币、以太币等数字资产的币币和衍生品交易服务。
HTX火币 注册链接 火币全球专业站,是火币集团旗下服务于全球专业交易用户的创新数字资产国际站,致力于发现优质的创新数字资产投资机会。

原文来源:量子位

谷歌AI正在吞食一切!爬取所有公开内容用于训练AI,隐私政策已更新

图片来源:由无界 AI‌ 生成

从今往后,你在网上公开说的每一句话,都可能被谷歌 拿去训练AI!

没错,继画画之后,文字作品 也要被用来喂大模型了——

无论是技术博客、代码、论文,还是所有你在网上公开的帖子,都可能被扔进“谷歌大模型搅拌机”,即使有版权也是如此。

谷歌AI正在吞食一切!爬取所有公开内容用于训练AI,隐私政策已更新

就在这周,谷歌更新了一版隐私政策,明确表示他们保留有抓取网上所有公开内容,以构建其AI工具的权利。

网友们立刻炸了。有人警告“谷歌正抓取一切”:

一旦谷歌能够读取你写的东西,就意味着这些都是他们的“所有物”了。

谷歌AI正在吞食一切!爬取所有公开内容用于训练AI,隐私政策已更新

还有网友抱持更悲观的想法:

很快啊,所有内容产出者就都会是AI了。

谷歌AI正在吞食一切!爬取所有公开内容用于训练AI,隐私政策已更新

所以,这版隐私政策究竟是怎么回事?

用于训练Bard等AI产品

事情还得从谷歌这几天更新的隐私政策说起。

在最新的隐私权政策中,谷歌增加了一个关于“研究和开发”的AI模型条款:

Google会利用信息来改进我们的服务并开发新的产品、功能和技术,以惠及我们的用户和公众。
例如,我们会利用 公开信息 来帮助训练Google的AI模型并打造实用产品和功能(比如Google翻译、Bard和Cloud AI功能)。

换言之,就是将所有可能收集到的公开信息,用在谷歌翻译BardCloud AI 等AI相关产品或功能的训练中。

谷歌AI正在吞食一切!爬取所有公开内容用于训练AI,隐私政策已更新

那么,这些公开信息具体包括什么?

例如互联网、网络和其他活动信息,包括搜索字词、应用和浏览器与谷歌服务进行互动的相关信息,以及在第三方网站和应用中使用谷歌服务等。

换而言之,不止是此前已经公开的博客等内容,包括公开到网上的谷歌文档 、或是一些包含个人信息 的发帖,也可能会被谷歌收集起来,用于大模型训练。

当然,目前这些内容都还限定在“公开信息”。

像谷歌提供的Gmail等电子邮件服务,应该还是不会被爬进数据里的。

而且谷歌也明确在隐私权政策中表示,在其他如防范安全威胁、信息审核、服务维护、个性化广告或法律等原因情况下,同样可以使用这些个人或公开信息。

不过,谷歌为啥在这个节骨眼更新这个政策?

“AI正挑战文字版权”

或许也与Reddit和推特等一众公司搞出的“限流”操作有关。

先是今年4月,Reddit宣布对接入API的公司开始收费。

公司CEO认为,Reddit的数据库很有价值 ,但是他们不想将这些有价值的内容免费提供给科技大公司。

随后,推特也开始以“不想让AI公司白嫖数据 ”的理由,来给推特限流,未经验证用户日浏览量只有600,经过验证后增加到6000。

这一系列政策对用户和第三方工具影响很严重,例如Reddit引发了大规模的讨论版块抗议,不少版主直接关闭了自己管理的论坛,以对Reddit这一活动进行抗议,推特上也有不少人在声讨,甚至有网友表示“推特被杀死了”。

但无论如何,让AI白嫖数据这件事,现在都已经是一个无法忽视的矛盾了。

对于谷歌AI爬数据这件事,有网友表示疑惑:

为啥之前互联网如搜索引擎也有爬取数据一类的操作,但人们却偏偏对“AI抓取”感到抗拒。

谷歌AI正在吞食一切!爬取所有公开内容用于训练AI,隐私政策已更新

有网友回应称:

本质上还是版权的问题。如果只是引用受版权保护的材料,那么不一定侵犯版权,但如果用AI对有版权的内容进行“搅拌清洗”,而且这事儿合法化了,那么本质上 版权已死

谷歌AI正在吞食一切!爬取所有公开内容用于训练AI,隐私政策已更新

也正是因此,他对于这件事感到悲观:

如果有人在不标注来源的情况下复制了你的博客,或是将你的开源代码拿去做付费服务,又或是将你在StackOverflow上的答案用作答题方法,你能接受这些情况发生吗?
我之前做的一切都是 免费 的。但现在如果AI想让我消失,那我就会消失。

谷歌AI正在吞食一切!爬取所有公开内容用于训练AI,隐私政策已更新

当然,也有网友已经接受了这个政策的推出,警惕大家自身防范意识不可或缺:

细读新政策,注意我们泄露了多少信息到网上。

谷歌AI正在吞食一切!爬取所有公开内容用于训练AI,隐私政策已更新

那么,你怎么看待这件事?

参考链接:
[1]https://gizmodo.com/google-says-itll-scrape-everything-you-post-online-for-1850601486
[2]https://news.ycombinator.com/item?id=36577626

推荐平台 链接 平台介绍
Gate芝麻开门 平台介绍 Gate.io芝麻开门创立于2013年,是全球真实交易量TOP10的加密货币交易平台,向全球数千万用户提供安全可靠、真实透明的数字资产交易服务。
Bitget 注册链接 Bitget的背后是一群区块链技术的早期接受者,也是区块链未来发展的信仰者,一直致力于提供安全、一站式的交易解决方案,帮助用户更聪明地交易。
Bybit 注册链接 Bybit通过数字资产与传统金融的结合,引领数字资产的生态发展。提供一流的流动性,致力于打造业内最安全、公平、高效及人性化的交易服务平台。
派网 注册链接 派网提供多样化的量化交易机器人,用户可依照自身交易需求和策略选择最适合的机器人。 同时派网也提供合约交易与合约网格机器人,给予更方便的合约交易体验。