外賣員居然成了 AI 訓練數據最重要的一環?
近期,美國外送巨頭 DoorDash 發布了一款名為「Tasks」的應用,旗下外賣員可以使用這款應用,在每次送餐結束后,拍攝一段街景、送餐的視頻,或者一些圖片,即可獲得一定的報酬。DoorDash 表示,Tasks 的意義是幫助商家獲得更真實的線下洞察,同時讓 AI 和機器人系統更好地理解現實世界。
![]()
(圖源:knowledgewharton)
換句話說,過去外賣員送的是一份餐食,而在 Tasks 推出之后,他們不僅要送餐,還要負責提交一份訓練數據。這兩年時間,大模型最常見的訓練路徑通常都是先用海量網頁、書籍、代碼、圖片這類公開或授權數據做預訓練,再靠人工標注、人工反饋和后續微調,讓大模型越來越聰明。
而 Tasks 似乎改變了 AI 訓練的方向,從互聯網上的文本、圖片,進一步卷向了現實世界本身。但這也不禁讓人疑問,采集現實數據有這么多方式,為何偏偏是外賣員呢?
平臺的數據生意,全靠外賣員
DoorDash 這次上線的 Tasks 并不是我們想象中的在外送流程里多加一項任務,而是開發出完全獨立的全新體系。騎手除了接外賣單,還可以接拍菜品照片、拍酒店入口、記錄日常動作、錄制外語對話等零散任務。雖然 DoorDash 表示每次完成任務后都會給外賣員一份報酬,但這個兼職沒有大家想象中輕松。
據《洛杉磯時報》報道,Tasks 里的內容不只是商家信息采集,還包括錄制西班牙語自然對話、拍自己洗碗、疊衣服、裝洗碗機,甚至處理和自動駕駛車輛有關的現場任務。也就是說,除了送餐,外賣員想要達到領取報酬的標準,需要做的事情并不少。
![]()
(圖源:DoorDash)
明眼人都能發現,DoorDash 并不是只要一些簡單的圖片、視頻素材,而是要更標準化、更可復用的現實世界音視頻樣本。尤其是官方還強調,DoorDash 目前擁有超 800 萬 Dashers(外賣員),覆蓋城市的每個角落。更直白地說,DoorDash 其實是在借 Tasks 的名義,向市場宣布自己擁有 AI 訓練數據采集的能力。
當然,回到我們最關注的部分,外賣員在完成這些任務后究竟能獲得怎樣的報酬?DoorDash 在這方面含糊其辭。媒體 WIRED 參與實際體驗得到了一個數據樣本,一個拍攝洗衣過程的任務標注為時薪 15 美元、最長 20 分鐘,但按平臺給出的估算,實際報酬低到只有 0.37 美元;像掃描貨架這樣的任務,頁面會直接顯示 16 美元報酬。
平臺確實在給外賣員提供額外收入,但價格并不穩定,任務價值也也各有不同。但 DoorDash 為何突然愿意為這些并不起眼的場景提供報酬呢?答案也很簡單,DoorDash 要把這些音視頻數據拿去自己以及合作伙伴的 AI 模型進行數據訓練。更耐人尋味的是,DoorDash 在今年 3 月正式上線了自研的配送機器人 Dot,目前僅在個別城市與地區運營。
![]()
(圖源:DoorDash)
對于 DoorDash 而言,它要搶占的是目前 AI 大模型里最難做好的「長尾場景」,也就是除用文本、數據、圖片訓練出來的標準化數據之外,還得有離開實驗室也能正常落地的場景數據支持。而這些恰好就對應了 Tasks 任務里那些奇怪的需求,比如拍攝那些門口被遮住的招牌、臨時改過的入口、貨架上擺放混亂的商品等等。
外賣員跑過的路,正在變成 AI 的訓練場
過去的大模型訓練,主要靠的其實是互聯網文本、圖片、代碼和公開視頻,再加上人工標注、人工偏好排序這類后處理,核心目的是讓模型先學會「看」和「說」。OpenAI 早期在 InstructGPT 的論文已經有過解釋,語言模型即便參數再大,也還需要人類反饋去微調。而隨著多模態和機器人的發展,這些數據已經不夠用了。
多模態、身智能需要的數據,不再只是“杯子是什么”、“路牌長什么樣”這種認知,而是更具體的物理世界經驗,比如從哪個角度靠近門口、不同材質的物體該怎么抓、陌生街道里什么信息最影響路徑判斷等等。
比如Google DeepMind 在 RT-2 論文里也有提到,互聯網規模的視覺和語言數據,確實能幫助機器人獲得更強的語義理解能力,但真正讓機器人完成控制和動作映射的,仍然是機器人軌跡數據,也就是看到/聽到了什么,接下來要做什么動作。
![]()
(圖源:Google)
這也是為什么 DoorDash 這套 Tasks,看起來像給外賣員增加零活,實質上卻很像一條低成本的數據采集流水線。外賣員這個職業天然就非常適合干這件事,相比坐在電腦前打標簽的傳統標注員,外賣員最大的優勢是他們本來就活在這些復雜場景里,每天送餐進出不同門店、社區、寫字樓和酒店,一些很復雜的出入口,或者比正門更方便的小路,都由他們拍攝記錄上傳,形成真實的可用的訓練數據。
![]()
(圖源:supplychaindive)
往更深一點說,這個行為其實也是在推動具身智能的發展。DeepMind 在 2025 年發布 Gemini Robotics 時就有提到,進入物理世界之后,模型要同時處理感知、空間理解、狀態估計、規劃和控制,這比單純在屏幕里生成文本復雜得多。像 Google 近兩年做的機器人大模型,都在解決一個問題,那就是怎樣讓機器人不只會背固定動作,而是真的看懂現實場景、理解人類指令,再完成對應操作。為了做到這一點,模型既需要互聯網里的圖文知識,也需要大量真實世界里的操作數據。
當然,外賣員之所以適合被加進 AI 訓練流程里,倒也不完全是因為「性價比」,更多的還是因為模型要走向真實世界,最缺的正是這種更具「活人感」的操作。試想一下,假如聘請大量專業的工程師做這類到現實世界里采集數據的活兒,他們未必能干得比外送員更好。
DoorDash 押注的未來,早已不新鮮了
客觀來說,DoorDash 的 Tasks 計劃就是幫助企業快速獲得“地面信息”的工具,提前囤積一批能讓 AI 和機器人更懂現實世界的底層素材。但事實上,自動化配送早已經不是新鮮的概念了。
在中國大陸,美團已經把自動配送車和無人機落實到真實配送場景。據美團官方在 2025 年公布的數據,截至 2024 年底,自動配送車累計完成近 500 萬單,自動駕駛里程占比 99%,還幫助騎手減少了超過 240 萬公里的路途奔波;無人機累計訂單則超過 45 萬單。這份數據說明,至少在校園、小區、機場這類線路穩定的場景里,自動配送的效率已經達到及格線以上。
![]()
(圖源:Forber)
海外市場里,Serve Robotics 今年 3 月宣布和 White Castle 通過 Uber Eats 推出機器人配送服務,前者已經在美國多個城市落地機器人配送,并在 2025 年底完成了 2000 多臺機器人部署。還有Starship Technologies,它們家的自動配送機器人累計已經完成了 900 萬次配送。
正因如此,DoorDash 現在讓騎手順手給 AI “喂”數據這件事,就顯得十分微妙。目前 DoorDash 自家的 Dot 配送機器人在公開的案例里,自動化配送成功率已經夠高,但場景還是相對局限,畢竟機器人最難啃下的硬骨頭,還是門口招牌被擋住了、小區入口臨時換了、外賣收件點位置不對等等瑣碎的問題。DoorDash 作為美國市場的外賣巨頭之一,自然也明白自動配送當前的困境。
DoorDash 最聰明的地方就在此,它一邊保持讓外賣員繼續送餐,并用一定的報酬鼓勵他們完成 AI 數據采集的任務;另一邊則是用這些數據進行深度訓練,為即將到來的自動配送機器人做準備。但說到底,外送騎手短期時間里,還是這條流程里最不可缺少的一部分,他們的工作也很難被自動化配送取代。
![]()
(圖源:BGR)
但長期來看,當平臺一邊積累現實世界數據、一邊推進自動配送落地,人和機器的關系可能會慢慢從協同工作,轉變為被取代。技術進步當然值得肯定,自動配送、具身智能和現實世界數據采集,本質上都在推動行業效率提升,也有機會把一些重復、辛苦的環節交給系統去完成;但另一方面,外賣和即時配送從來都不是一門只關注“送貨”的生意,它里面有太多需要和客戶溝通溝通判斷和復雜情況處理的問題。因此,至少在相當長一段時間里,配送這件事依然要靠人來兜底。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.