![]()
不同國家間的差異不僅影響AI企業的創業地域選擇、跨境合作與市場準入,還正在引發知識產權合規、AI生成內容版權歸屬等關鍵問題的討論。
文|錢麗娜
ID | BMR2004
隨著AI產業從爆發期進入深度應用期,數據治理與版權歸屬已成為決定企業能否行穩致遠的關鍵合規命題。面對模型訓練數據的溯源難題與人機協同創作下的權益界定模糊,企業正陷入執法難度高、舉證責任重的合規困局。
浙江大學光華法學院特聘研究員、博士生導師,杭州這里有法數據有限公司創始人周翔長期深耕數字法學、司法人工智能等領域研究,他指出,中美歐因AI產業發展階段、國際競爭力不同,形成了各具特色的監管立場與立法體系。不同國家間的差異不僅影響AI企業的創業地域選擇、跨境合作與市場準入,還引發知識產權合規、AI生成內容版權歸屬等關鍵問題的討論,而人機協同作為未來內容創作的必然趨勢,其相關權益界定與證據留存也成為行業關注焦點。
01
AI監管體系的國際格局
全球AI產業的發展,始終是國家利益與商業企業全球化之間相互妥協、尋求平衡的過程。
從法律視角理解AI產業,首先要建立對AI國際發展格局的清晰認知。
當前全球格局中,美國仍是AI發展的領頭羊;歐洲在AI基礎研發與應用層面相對落后;中國則處于兩者之間。三方AI產業的發展階段、國際競爭力存在顯著不同,這也直接導致各方在AI監管上的基本立場差異。
在監管層面,歐盟始終將捍衛數字主權、保障公民基本權利作為監管的基本立場與核心訴求,也因此在立法層面構建起全球AI監管的標桿體系。
美國的AI監管則始終圍繞維護并鞏固其全球AI技術領導者地位、提升產業核心競爭力展開,這是其監管工作的核心導向。美國近期的監管導向同樣值得關注,特朗普政府已頒布法令,要求各州不得出臺相關限制AI發展的法律法規,美國整體呈現出對AI產業極為寬松的監管態勢。
在全球AI產業競爭格局中,中國的AI產業已具備一定國際競爭力,相關政策將保障國家安全作為監管的重要基本立場與訴求,也始終重視對公民私權的保護。中國的AI立法雖較多參考歐盟體系,但同時也兼顧與美國在AI領域的競爭需求,形成了立法向歐盟看齊、執法向美國靠攏的特點,力求在國家安全、國家產業競爭力與公民私權保障之間找到最優解。
從國內監管來看,部分法律在落地執行階段,仍面臨執法成本較高、執法難度較大等現實障礙。我國AI領域相關立法在實際執法中并未采取嚴苛尺度,整體執法工作始終以促進AI產業發展為導向。
再看中美監管壁壘對AI企業跨境合作與市場準入的影響。我國要求面向公眾提供服務的AI產品完成備案,而美國因數據共享的相關考量,并未設置AI產品備案制度,這種監管差異也造成了跨境合作與市場準入的諸多障礙。近期有典型案例可印證這一現狀:AI企業Manus在國內完成初期發展后,先將團隊與業務遷移至新加坡,后被Meta收購,這一發展路徑在一定程度上反映出中美AI跨境合作的現實壁壘,而這一壁壘的形成,核心源于我國AI監管中對國家安全的核心考量。
不過中美及全球各國在AI監管領域仍有達成合作的基礎,主要體現在理念與技術兩個層面:
首先,理念層面存在普世性共識。美國雖監管寬松,但對本國公民的個人信息保護力度并未滯后,各國在私權保障層面的訴求具有共通性,因此全球AI監管能夠形成最低限度的共識。
其次,技術層面有實現跨境合作的可行路徑。可將算法模型訓練與數據跨境流動兩個問題拆分處理,在保障數據本地化的前提下,通過聯邦學習、傳輸加密后的模型參數等技術手段,實現AI技術的跨境流通與商業合作。
整體而言,全球AI產業的發展,始終是國家利益與商業全球化之間相互妥協、尋求平衡的過程。
02
AI訓練數據合理使用的邊界
AI數據合理使用的邊界界定,目前仍處于司法實踐先行、通過個案積累經驗的微觀探索階段。
對于AI企業而言,當下大量受知識產權保護的語料、作品成為模型訓練數據,其中涉及合規的核心問題是:AI企業使用受版權保護的數據開展模型訓練時,合理使用的邊界應如何界定?
從中美兩國的立法與司法實踐來看,目前尚未出臺針對該問題的成文法,也未形成統一、明確的界定標準。“合理使用”雖是傳統知識產權領域的經典概念,但在AI時代,使得這一概念的適用邊界發生變化,全球范圍內尚未在立法層面形成共識,目前仍處于司法實踐先行、通過個案積累經驗的微觀探索階段。
中美兩國在AI數據合理使用的司法判斷上,形成了不同的側重點:
美國采用“四要素框架”(注:主要有兩個核心體系,分別是NIST AI RMF 1.0的“治理、映射、測量、管理”四功能框架,以及GAO的“治理、數據、性能、監控”四原則框架,二者均為自愿性指南)。對合理使用進行個案權衡,其中最核心的判斷要素是“使用的目的與性質”,即利用受版權保護的素材形成的新作品、新用途,不能是對原作品的簡單替代,需增加新的功能、體現新的目的性,否則即超出合理使用邊界,可能構成侵權。此外,判斷還會涉及使用部分的數量與實質性、使用行為對原作品潛在市場的影響等要素。
中國的司法判斷更側重數據獲取的合法性。近期在國內某繪畫大模型知識產權糾紛案中,法院的裁判邏輯為,模型訓練是否構成侵權,首要判斷標準是訓練數據的來源是否合法,具體包括是否遵守相關協議、是否破壞技術安全屏障(如防火墻)等。我國采用這種判斷方式,是因其具有明確的舉證導向,便于在司法實踐中收集證據、做出認定。
當前AI大模型在訓練過程中,數據爬取是普遍存在的現象,甚至部分企業存在“暴力爬取”行為,這一問題的根源在于數據是AI產業發展的核心先決條件,而爬取是獲取海量數據的主要方式。但AI模型訓練對數據的處理,如同“小麥磨成面粉”的過程:原始數據被高度拆解、融合,最終的模型輸出結果無法回溯至具體的原始數據來源,即便原始數據存在侵權問題,也難以舉證,這也使得知識產權保護面臨嚴峻挑戰,因為法律的認定以證據為核心,一旦無法追溯、無法舉證,就難以認定侵權行為。
針對這一難題,我國司法實踐采取了“避繁就簡、先易后難”的治理思路:先避開模型訓練后難以舉證的復雜環節,先治理數據獲取這一相對簡單、司法實踐積累更豐富的環節。數據爬取作為網絡數據獲取的主要方式,在AI產業發展前就已存在,司法領域已形成大量相關案例,明確了爬取行為的合法邊界、爬取范圍與尺度,形成了相對成熟的判斷標準,這也是當前司法層面能夠有效規制的環節。
例如,若企業未經平臺許可爬取其營銷數據,卻在備案時申報該數據為訓練來源,看似存在自相矛盾的問題,但結合爬蟲技術的特性與行業實際來看,這一問題需客觀解讀。爬蟲技術有一個通俗的行業認知——“可見即可得”,即網絡上可被用戶瀏覽到的信息,會加載至本地瀏覽器,從技術本質而言,爬蟲是一項中立技術;且若完全杜絕爬蟲行為,反而會對整個互聯網行業的發展產生負面效應。
這也意味著,AI數據合理使用的邊界界定,目前仍需依托具體訴訟案件的推動。數據流通環節的侵權判斷,比模型訓練環節的合理使用判斷更具可操作性,前者有成熟的司法標準與舉證路徑,而后者因數據無法回溯、舉證困難,難以形成明確的法律認定。
AI大模型訓練階段的合理使用界定,還面臨舉證與監管的雙重難題:
舉證層面:大模型的預訓練環節對數據的拆解融合具有不可逆性,無法通過模型輸出結果追溯輸入數據的來源,被侵權人難以舉證證明自身權益受損,這也是合理使用邊界難以界定的核心原因。
監管層面:行政執法若僅依靠大模型廠商的自我約束,本質上屬于道德層面的要求,缺乏法律層面的剛性約束。即便我國推行AI產品備案制度,也難以規避廠商的“數據加塞”行為,例如廠商備案的訓練數據為100份,卻在實際訓練中偷偷增加50份未備案數據,執法者難以發現此類行為。目前針對這一問題,尚無有效的外部監管手段,只能依托行業自律,而在缺乏證據的前提下,執法與司法均無法對合理使用邊界做出有效判斷。
目前相關監管要求已明確部分臨時合規措施,例如AI產品備案、企業需對訓練數據的范圍進行內部記錄并建立完善的記錄流程,這一要求與工業時代工廠流水線記錄原材料采購、產品產出的邏輯一致,但二者存在本質區別:工業時代的流水線記錄具有可追溯性,外部可通過各類證據交叉印證記錄的真實性;而AI大模型的訓練記錄,外部難以驗證、證偽,企業是否真實按照備案與內部記錄的范圍開展訓練,執法者與監管機構無法有效核實。簡言之,當前AI企業的訓練數據來源備案,本質上是企業的自我申報,申報內容的真實性缺乏有效的外部核驗手段。
03
AI生成內容的版權歸屬
版權制度的核心初衷,正是通過保護創新來鼓勵創作。唯有建立合理的經濟利益分配機制,才能充分激發創作者的創作動力,這也是知識產權制度誕生的核心價值訴求之一。
當前AI技術已發展至足夠智能、強大的階段,人機協同成為未來內容創作的必然趨勢。它能有效提升工作效率,是極具價值的輔助工具。大家關注的AI生成內容的版權歸屬問題,本質上是如何在人機協同的創作模式中,留存人類參與的證據、明確版權歸屬,確認人類在創作中發揮的創意、創作等作用,保障人類創作者的版權權益。
要厘清這一問題,周翔認為,核心在于追溯人機協同過程中人類的參與行為,界定其中具有獨創性的部分,版權(著作權)的認定標準是獨創性,這是法律層面的明確要求。同樣的AI工具,不同使用者創作的內容卻存在顯著差異,原因便在于人類在創作各環節的主觀參與和個性化選擇。周翔總結了AI生成內容時人機協作的四個關鍵階段。
素材收集與篩選是第一個關鍵階段,也是人與人之間創作差異的重要起點。不同創作者的知識儲備、閱讀積累、行業經驗存在差異,導致其素材收集的范圍、渠道各不相同,對素材的篩選標準、取舍判斷也各有側重,最終留存并用于AI生成或人工創作的素材基底,自然存在本質區別。
提示詞工程是人機協同創作中第二個關鍵環節,也是人類指揮AI開展創作的關鍵紐帶。人類與AI的協同創作,始終離不開提示詞的設計與輸入,這是連接人類創作需求與AI生成能力的核心機制。
可以將AI理解為一位學識廣博卻缺乏場景適配能力的從業者,它掌握著海量知識與能力,卻無法自主判斷在具體場景中該如何運用,而提示詞正是讓AI在特定場景中施展能力的關鍵。提示詞的設計水平,直接決定了AI的輸出效果。創作者在設計、迭代提示詞的過程中,本身就蘊含著獨創性思考,這份思考的留存,便是人機協同創作中人類參與的重要證據。
第三個關鍵環節是大模型參數的個性化調節。當前面向C端的大模型產品,開放的可調變量相對有限,但如果通過大模型的API接口進行使用,會有大量可調節參數,這些參數的不同設置會直接影響模型的最終輸出結果。不同創作者的參數調節思路與方案存在顯著差異,將這些參數設置的方案以日志、截圖等形式留存,同樣能證明人類在人機協同創作中的原創性貢獻。
第四個關鍵環節則是后期人工制作與優化。現階段,AI尚無法完全替代人類完成專題報道、學術論文這類專業性較強的內容創作,多數情況下,AI僅能完成初稿的生成,后續仍需要人類進行深度修改、潤色,若是圖文、視頻類內容,還包括圖片修圖、視頻剪輯等人工加工環節。這些在AI生成內容基礎上的二次創作與優化,是人類創作思路的直接體現,也是人機協同創作中極具獨創性的部分。
綜上,從創作者的微觀視角來看,只要做好素材收集篩選、提示詞設計迭代、參數調節設置、后期人工優化這四個環節的證據留存,便能有效證明其在人機協同創作過程中的原創性貢獻,為版權歸屬的界定提供核心依據。
杭州此前審結的一起相關案例,正印證了這一邏輯:一位創作者通過原創的提示詞工程微調AI生成圖片,后某房地產公司擅自使用該作品,創作者憑借留存的提示詞相關證據提起訴訟并勝訴,核心便是依托了提示詞設計環節的證據留存。這類證據留存并非僅靠簡單截屏,具備專業證據意識的創作者,還會借助時間戳、電子存證等工具強化證據效力。近5年來,國內時間戳、電子存證技術發展迅猛,依托區塊鏈技術為創作證據添加時間戳,能夠有效證明創作行為的首創性與時間在先性,為版權認定提供關鍵支撐。
周翔認為,基于技術的現實限制,現階段更具可行性的解決方案是:只要AI相關衍生應用與原作品的傳播渠道不重合,便可以認定為合理的轉化使用。若未來技術層面能實現數據使用的精準追溯與監管,再建立對應的自動付費機制方為可行;在技術與制度尚未完善的當下,渠道管控是最具實操性的監管方式,而若衍生應用與原作品出現渠道重合,則應遵循原創者優先的原則。
同時需要注意的是,內容大廠自身也在積極布局AI應用,將其作為降本增效的重要手段。如今諸多游戲公司已廣泛運用AI開展游戲制作,大幅降低美術設計、內容創作等環節的成本,這類內容大廠對AI技術的主動運用,使得其對AI訓練數據的版權訴求,呈現出更為復雜的行業現實。
周翔說,從產品視角來看待這一問題,核心判斷標準應聚焦于產品的迭代與創新。如果新一代產品相較于上一代有本質性的提升與突破,那么這款產品本身就具備獲得版權保護的基礎。工業時代所形成的、內容大廠向AI開發主體收取版權費用的利益分配機制,在AI時代并非唯一選擇,也并非必要選擇。在AI時代,只要創作者能在上一代作品或他人內容的基礎上完成有效迭代與優化,其產品的市場價值自然會由用戶用腳投票來檢驗,用戶的付費意愿便是最直接的市場反饋。同時,被借鑒、模仿的主體,也可反向借鑒新的創作成果進行自身的創新,畢竟所有創作成果在網絡環境中均具備一定的可見性。
周翔說:“這種基于產品層面的市場競爭,本質上會推動整個行業的持續迭代,而版權制度的核心初衷,正是通過保護創新來鼓勵創作。唯有建立合理的經濟利益分配機制,才能充分激發創作者的創作動力,這也是知識產權制度誕生的核心價值訴求之一。從經濟維度分析,若將所有作品都視作市場產品,那么通過產品的市場化迭代與競爭,完全能夠實現鼓勵創新的根本目的。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.