当前位置:
首页
>
专栏
>
文章详情

你免费帮谷歌训练了15年的人工智能,只是一直被蒙在鼓里

来源: 91币圈网 编辑: 厂商投稿 发布时间: 2026-03-18 17:22:45

编者语:验证码(CAPTCHA),就是每次登陆网站时需要点击的数字或者图案,每一位互联网用户都再熟悉不过。但当你一次次点击我不是机器人的时候,你以为这只是在验证身份,实际上却在参与全球最大、最隐秘的数据生产。Luis von Ahn 推出的 reCAPTCHA 将零散的人类行为,汇聚成支撑谷歌和旗下自动驾驶公司 Waymo 等核心业务的数据基石。

在免费安全的表象下,互联网悄然重塑了一种全新劳动关系:你花费时间证明自己是人类,却为 AI 训练做出贡献,而一旦 AI 学会,这份劳动便被彻底取代。本文发布不到 20 小时,已在推特收获超 950 万浏览量。以下为原文内容:

每天约有 50 万小时的人类劳动,被谷歌免费利用。而贡献这些的人,仅仅是想登录一下网银而已。

reCAPTCHA 是互联网历史上最成功的隐形数据运作。在高峰期,每天有 2 亿人完成验证。但几乎没有人意识到,每一次点击的背后意味着什么。

谷歌的自动驾驶汽车公司 Waymo,如今市值为 450 亿美元。而它大部分的核心训练数据,都是你在访问各个网站时免费提供的。

以下是完整的故事:

缘起:一个聪明的构思

2000 年,垃圾邮件机器人正在摧毁互联网。论坛被灌水,收件箱被塞爆,网站急需一种方法来区分人类与机器。

卡内基梅隆大学的 Luis von Ahn 教授解决了这个问题。他发明了验证码(CAPTCHA):一个只有人类能读懂的扭曲文字,机器人无法通过。

但 von Ahn 看到的不止这些。数以百万计的人在这些挑战中耗费了精力。那如果这种精力能同时做两件事呢?

2007 年,他又推出了 reCAPTCHA。其精妙之处在于:它不再显示随机的乱码,而是显示两个词。一个是系统已知的,另一个是计算机尚无法辨认的真实扫描书籍。而你的回答帮助了这些图书的数字化

这些书来自《纽约时报》档案库和谷歌图书,多达 1.3 亿册。

你以为你只是在登录一个普通的网站,其实你正在为全球最大的数字图书馆做 OCR(光学字符识别)。

2009 年,谷歌正式收购了 reCAPTCHA。

你免费帮谷歌训练了15年的人工智能,只是一直被蒙在鼓里

后来,谷歌改变了玩法

扭曲文字的时代在 2012 年左右结束了。

谷歌又遇到了新的挑战:街景车拍摄了全球每一条路,但照片只是原始数据。为了让 AI 发挥作用,它需要理解所见之物:路牌、斑马线、红绿灯、店铺门面。

所以谷歌重新设计了 reCAPTCHA v2。画面中没有扭曲的文字,而是照片网格。点击所有有红绿灯的方格。选择每一条斑马线。识别店面。

这些图片直接来自谷歌街景。你的点击就是标签。

每一次选择都在告诉谷歌的计算机视觉模型:这一簇像素是红绿灯,那个形状是斑马线。你不是在通过测试,你是在构建数据集。

你免费帮谷歌训练了15年的人工智能,只是一直被蒙在鼓里

超乎想象的规模

在巅峰时期,每天有 2 亿个 reCAPTCHA 被解开。每个挑战耗时 10 秒,这意味着每天产生 20 亿秒的人类劳动。即:每天 50 万小时。

有偿的数据标注成本约为每小时 10 到 50 美元。按最低标准计算:每天被免费提取的劳动价值高达 500 万美元。

而且 reCAPTCHA 不只存在于某个 App。它遍布每家银行、每个政府门户、每个电商网站。你别无选择:想登陆账户?先来标注数据集。谷歌从未问过你的意见,没付过一毛钱薪水,甚至从未告诉过你这件事。

你免费帮谷歌训练了15年的人工智能,只是一直被蒙在鼓里

这一切造就了什么?

这些数据直接喂给了两个产品:

-谷歌地图:全球最常用的导航工具。它识别路牌、店铺和城市地理的能力,部分归功于数十亿次人类在登录网站时的标注。

-Waymo:谷歌的无人驾驶项目。为了安全导航,无人车需要近乎完美地识别数千种视觉模式。

那些识别工作的真值训练数据正是由数百万人在不知情的情况下通过 reCAPTCHA 标注的。Waymo 在 2024 年完成了超过 400 万次付费行程,估值 450 亿美元。其基石,正是由那些只想查个邮件的无偿互联网民奠定的。

为什么没人能复制这种模式?

数据标注极其昂贵。Scale AI、Appen 和 Labelbox 等公司的存在就是为了解决这个问题,他们雇佣数十万工人,有时时薪不足 1 美元。

谷歌的解法另辟蹊径:他们让标注变成了强制性的。无需付费,无需征得同意,而是作为进入互联网每个角落的门票。结果是:数十亿张带标签的图像、全球覆盖、全天候天气、世界每个城市。没有任何标注公司能做到这一点。互联网本身就是工厂,每个网民都是未签合同的员工。

你至今仍在参与

2018 年推出的 reCAPTCHA v3 甚至不再显示挑战。它通过观察你移动鼠标的方式、滚动速度、停留时间。你的行为指纹会告知它你是否为人类。这些行为数据同样会回馈到谷歌的 AI 系统中。

你从未主动选择加入,从来没有一个复选框供你勾选。但此刻,在你访问的大多数网站上,你依然在这样做。

令人不安的讽刺

Luis von Ahn 的初衷是天才的:将人类本就在浪费的精力转化为有用的产出。但谷歌利用这一愿景做的事却另当别论。他们利用了用户不得不使用的安全机制,将其部署在全网,收割产出来构建价值数百亿美元的商业产品。用户一无所获,甚至一无所知。

最深刻的讽刺在于:你花费数年时间证明自己是人类,通过完成 AI 当时还无法做到的视觉识别工作。而一旦 AI 学会了这些,人类的视觉标注就不再被需要。

你证明了自己是人类,结果却是让自己变得可被取代。

更多资讯
更多+

编者按:过去几年,预测市场从一个相对边缘的金融实验,逐渐走到科技、金融与公共政策讨论的中心。它之所以受到广泛关注,不仅是因为押注未来本身的吸引力,还因为在社交媒体不断放大噪音、民调屡屡失准、传统信息体系公信力下滑的背景下,一个更根本的问题浮...

编者语:验证码(CAPTCHA),就是每次登陆网站时需要点击的数字或者图案,每一位互联网用户都再熟悉不过。但当你一次次点击我不是机器人的时候,你以为这只是在验证身份,实际上却在参与全球最大、最隐秘的数据生产。Luis von Ahn 推出的...

编者语:验证码(CAPTCHA),就是每次登陆网站时需要点击的数字或者图案,每一位互联网用户都再熟悉不过。但当你一次次点击我不是机器人的时候,你以为这只是在验证身份,实际上却在参与全球最大、最隐秘的数据生产。Luis von Ahn 推出的...

今年年初,全球金融市场的情绪,其实是偏暖的。虽然美联储自己在去年底的最后一次会议上表现得很矜持,暗示全年可能只象征性地降一次息,但华尔街显然有自己的判断体系。高盛、摩根士丹利、美国银行这些老牌机构,几乎一致给出了更积极的答案:至少两次降息。...

国际资讯
更多+
Caitlyn Jenner(JENNER)发行价多少钱?
Caitlyn Jenner发行价多少钱?据悉,Caitlyn Jenner在去年推出了自己的写真集《The Secre...
06-18
CatSolHat(SOLCAT)发行量是多少?
CatSolHat(SOLCAT)发行量是多少? CatSolHat,简称SOLCAT,是一种基于区块链技术的加密数字资...
06-19
Bitro Coin(BTRC)流通量是多少?
Bitro Coin(BTRC)流通量是多少?Bitro Coin(BTRC)是一种数字货币,也是一种区块链资产。它的流...
06-19
Atocha 流通量是多少?
ATO流通量究竟是多少? ATO(Atocha Protocol)是一个基于区块链技术的新兴数字资产。它的流通量是指在市...
06-18
CADAICO(WCADAI)发行量是多少?
CADAICO(WCADAI)发行量是多少? CADAICO(WCADAI)是一种新型的数字货币,它的发行量是多少呢?这...
06-19
热门币种
更多+
+5.83%
-3.09%
+0.27%
-0.65%
-1.98%
-3.33%
+0.28%
-2.37%
-0.38%
+8.8%
+0.04%
+7.88%
热门文章
更多+
1
你免费帮谷歌训练了15年的人工智能,只是一直被蒙在鼓里
编者语:验证码(CAPTCHA),就是每次登陆网站时需要点击的数字或者图案,每一位互联网用户都再熟悉不过。但当你一次次点...
2
你免费帮谷歌训练了15年人工智能,只是一直被蒙在鼓里
编者语:验证码(CAPTCHA),就是每次登陆网站时需要点击的数字或者图案,每一位互联网用户都再熟悉不过。但当你一次次点...
3
美联储会议前夜,交易员开始押注加息?
今年年初,全球金融市场的情绪,其实是偏暖的。虽然美联储自己在去年底的最后一次会议上表现得很矜持,暗示全年可能只象征性地降...
4
慢雾:把钱交给「龙虾」等AI Agent真的安全吗?
随着大模型技术的快速发展,AI Agent 正在从简单的智能助手逐渐演变为能够自主执行任务的自动化系统。在 Web3 生...
5
专访Kalshi联创:起诉政府,不做暗杀、战争市场,Kalshi如何拿下合规预测市场运营?
编者按:过去几年,预测市场从一个相对边缘的金融实验,逐渐走到科技、金融与公共政策讨论的中心。它之所以受到广泛关注,不仅是...
6
监管、内幕与本质,Kalshi的200亿估值背后故事
编者按:过去几年,预测市场从一个相对边缘的金融实验,逐渐走到科技、金融与公共政策讨论的中心。它之所以受到广泛关注,不仅是...