![]()
整理 | 褚杏娟
當(dāng)?shù)貢r間 3 月 26 日,GitHub 宣布,自 4 月 24 日起,除非用戶主動選擇退出,Copilot Free、Pro 和 Pro+ 用戶與 Copilot 的交互數(shù)據(jù)將被用于訓(xùn)練和改進(jìn)其 AI 模型。此次調(diào)整不適用于 Copilot Business 和 Copilot Enterprise 用戶。此外,免費獲得 Copilot Pro 權(quán)限的學(xué)生和教師不受此次更新影響。
![]()
GitHub 強調(diào)用戶仍然保有選擇權(quán)。對于不希望參與訓(xùn)練的個人用戶,可以在設(shè)置中的 “Privacy(隱私)”選項里手動退出。GitHub 強調(diào)會提前 30 天通知用戶,并允許隨時退出。不過,值得注意的是,F(xiàn)ree、Pro 和 Pro+ 個人用戶被默認(rèn)納入了訓(xùn)練范圍,需要自行設(shè)置退出。
![]()
被吐槽很難找到的退出設(shè)置
被拿去訓(xùn)練模型的數(shù)據(jù)
根據(jù) GitHub 的說明,可被用于模型訓(xùn)練的數(shù)據(jù)包括:
用戶接受或修改后的輸出內(nèi)容
用戶發(fā)送給 GitHub Copilot 的輸入內(nèi)容,包括展示給模型的代碼片段
用戶光標(biāo)位置周圍的代碼上下文
用戶編寫的注釋和文檔
文件名、代碼倉庫結(jié)構(gòu)以及導(dǎo)航模式
用戶與 Copilot 功能的交互,包括 Chat 和行內(nèi)建議
不過,GitHub 也劃出了一些不會被納入本次項目的數(shù)據(jù)范圍:
來自 Copilot Business、Copilot Enterprise 或企業(yè)擁有的代碼倉庫的交互數(shù)據(jù)
在 Copilot 設(shè)置中選擇退出模型訓(xùn)練的用戶的交互數(shù)據(jù)
靜態(tài)存儲的 issue、discussion 或私有倉庫內(nèi)容。
官方特意使用了“靜態(tài)存儲”這個說法,是因為當(dāng)用戶主動使用 Copilot 時,Copilot 確實會處理來自私有倉庫的代碼。這些交互數(shù)據(jù)是運行服務(wù)所必需的,并且除非選擇退出,否則它們可能會被用于模型訓(xùn)練。
GitHub 明確表示,Business 和 Enterprise 客戶的數(shù)據(jù)不會用于模型訓(xùn)練,原因是現(xiàn)有合同明確禁止這樣做;如果某個 GitHub 賬戶屬于付費組織,或者是付費組織的外部協(xié)作者,該賬戶的交互數(shù)據(jù)也會被排除在訓(xùn)練之外。對此,GitHub 的解釋是,這是合同義務(wù)所決定的,并稱自己對保護(hù)訓(xùn)練數(shù)據(jù)“很有信心”。
GitHub 對這項調(diào)整的解釋是,Copilot 的使用量正在快速增長,模型需要更多“真實世界數(shù)據(jù)”來覆蓋越來越多的編碼場景。
GitHub 稱,過去一年,其已經(jīng)開始利用微軟員工的交互數(shù)據(jù)訓(xùn)練模型,這一做法帶來了明顯改進(jìn),包括多種編程語言中的建議采納率提升,“這證明了真實世界的交互數(shù)據(jù)確實能夠提升模型在更廣泛、更多樣的使用場景中的表現(xiàn)。”
GitHub 強調(diào),AI 輔助開發(fā)的未來賴于開發(fā)者提供的真實世界交互數(shù)據(jù),因此除了微軟員工數(shù)據(jù)之外,公司也將開始使用 GitHub 員工的交互數(shù)據(jù)來訓(xùn)練模型。”
數(shù)據(jù)共享方面,用于訓(xùn)練的數(shù)據(jù)可能會被 GitHub 和微軟內(nèi)部負(fù)責(zé) AI 模型開發(fā)的人員訪問,也可能交由簽有合同限制的服務(wù)提供商代為處理,但不會賣給第三方,也不會提供給第三方模型廠商用于訓(xùn)練他們自己的模型。
GitHub:微軟、Anthropic 和 JetBrains 也這樣
GitHub 提到微軟、Anthropic 和 JetBrains 也在采取類似措施,以說明自己并不是孤例。與此同時,GitHub 直接回應(yīng)了一個尖銳問題:如果真實用戶代碼對模型這么重要,這是否意味著 GitHub 的競爭優(yōu)勢更多來自現(xiàn)有用戶基礎(chǔ),而不是更好的研究?
對此,GitHub 的回答是,“目前已有 2600 萬開發(fā)者 在使用 Copilot,這提供了極為豐富的使用場景和需求,因此公司希望通過用戶自愿貢獻(xiàn)的交互數(shù)據(jù),讓 Copilot 更好地覆蓋多樣化編碼任務(wù)。”
除此之外,GitHub 還面臨一個信任層面的老問題。GitHub 專門回應(yīng)了外界對 Copilot Chat 暴露私有代碼的擔(dān)憂。GitHub 的說法是,外界提到的案例涉及第三方收集“曾短暫公開后又轉(zhuǎn)為私有”的代碼,不屬于 GitHub 主動暴露數(shù)據(jù)的范疇;對于此次新計劃收集的數(shù)據(jù),公司會通過訪問控制、審計日志和自動化過濾來保護(hù),包括過濾 API key、密碼、token 和個人身份信息。
GitHub 的回應(yīng),顯然沒有開發(fā)者買單。
有用戶直言:“我真的非常討厭這種做法。”
首先,它一上來就給出了具有誤導(dǎo)性的“退出”操作說明。 如果我進(jìn)入賬戶設(shè)置,再點 Copilot,實際上什么都不會發(fā)生,只是那個列表項展開而已。我根本沒法像郵件里寫的那樣,在那里“選擇是否允許將你的數(shù)據(jù)用于 AI 模型訓(xùn)練”。
其次,真正可以退出的設(shè)置項,文字表述和郵件里的說明也對不上。 所以他們就是在故意把人繞暈,賭很多用戶根本找不到這個設(shè)置。更離譜的是,它還被放在設(shè)置頁面最底部。
第三,我也不清楚,如果我的倉庫里加了協(xié)作者,而他們沒有選擇退出,那我的代碼會不會也被拿去用? 總之,這次政策調(diào)整爛透了。也許是時候看看別的 Git 平臺了。我對 GitHub 也算有些經(jīng)驗,確實該試試別家了。這件事反而成了一個催化劑。
貪婪是沒有盡頭的。
而且這種事情本來就不該默認(rèn)開啟。 賬戶應(yīng)該默認(rèn)是退出狀態(tài),只有在你自己愿意的情況下,才主動打開。
除了退出設(shè)置的坑,還有用戶陷入賬戶界定的迷茫中:
我有一個大約 20 人的組織。我們并沒有在組織層級啟用 Copilot;但當(dāng)我進(jìn)入 Security Code Quality 時,我卻能使用 Copilot 來生成修復(fù)建議。而且正因為它沒有被正式啟用,所以那里也沒有“退出”的選項。 所以我現(xiàn)在想知道,這個功能到底是來自我個人賬號的 Copilot 免費版(因為它并沒有在組織層面啟用),還是說其實存在一個我沒看到的、某種“隱藏的”組織級 Copilot 免費版。我只想弄清楚,我是不是需要去推動所有能訪問這個組織的人都退出這次更新。
“這是我做過最快的退出操作。”“我正在認(rèn)真考慮因為這件事關(guān)閉我的 GitHub 賬號。”“如果有其他替代方案請告訴我,我實在受夠了這種把消費者當(dāng)成產(chǎn)品對待的做法。”這類聲音充斥整個社區(qū)。
![]()
https://github.blog/news-insights/company-news/updates-to-github-copilot-interaction-data-usage-policy/
聲明:本文為 InfoQ 整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。
會議推薦
OpenClaw 出圈,“養(yǎng)蝦”潮狂熱,開年 Agentic AI 這把火燒得不可謂不旺。在這一熱潮下,自托管 Agent 形態(tài)迅速普及:多入口對話、持久記憶、Skills 工具鏈帶來強大生產(chǎn)力。但這背后也暴露了工程化落地的真實難題——權(quán)限邊界與隔離運行、Skills 供應(yīng)鏈安全、可觀測與可追溯、記憶分層與跨場景污染、以及如何把 Agent 納入團(tuán)隊研發(fā) / 運維流程并形成穩(wěn)定收益。
針對這一系列挑戰(zhàn),在 4 月 16-18 日即將舉辦的 QCon 北京站上,我們特別策劃了「OpenClaw 生態(tài)實踐」專題,將聚焦一線實踐與踩坑復(fù)盤,分享企業(yè)如何構(gòu)建私有 Skills、制定安全護(hù)欄、搭建審計與回放機制、建立質(zhì)量 / 效率指標(biāo)體系,最終把自托管 Agent 從可用的 Demo 升級為可靠的生產(chǎn)系統(tǒng)。
今日薦文
![]()
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.