在人工智能迅猛發展的當下,大語言模型正逐步滲透到各個專業領域。然而,當我們將目光聚焦于專利這一特殊行業時,必須清醒地認識到,僅僅依靠大語言模型本身,要達到理想的應用效果,還有很長的路要走。
![]()
專利行業具有高度的獨特性和復雜性。一方面,專利檢索要求極高的精準度,任何細微的不匹配都可能導致重要專利被遺漏。另一方面,專利文獻包含大量高度細致和專業的場景描述,這些內容在大語言模型的訓練數據中占比有限。
要知道,專利數據庫規模龐大,可達幾十至上百TB,但實際用于訓練大語言模型的專利數據只是其中一小部分。這就意味著,模型對很多專業場景的理解存在天然局限性。
許多人對大語言模型抱有“輸入目標,自動得到完美結果”的期望,這在專利領域尤其不現實。以專利撰寫為例,直接要求模型“寫一份關于某技術的權利要求書”,通常會得到格式正確但內容空洞、保護范圍不合理的結果,這不僅無法滿足專業需求,甚至可能導致專利保護不力,事與愿違。
專利檢索是專利申請過程中的關鍵任務,目的是尋找與現有專利相關的技術文獻。很多人誤認為可以直接將檢索式交給大語言模型生成,期待它能提供準確的檢索結果。然而,大語言模型的輸出往往依賴于其訓練數據的范圍和質量,而專利數據庫內容龐大且結構化。大語言模型雖然可以生成一些常見的檢索式,但它無法準確地從海量的專利中篩選出相關性較高的專利。因為它沒有直接連接到專利數據庫,不能基于最新的專利數據進行深度檢索,也無法處理專利中的技術細節和法律術語。所以,直接依賴模型生成檢索式,往往會導致檢索結果的相關性不足,影響后續分析的質量。
專利的權利要求書是專利申請中至關重要的一部分,它定義了發明的保護范圍。撰寫權利要求書不僅需要對技術細節有深入的了解,還需要遵循嚴格的法律和格式要求。大語言模型在生成權利要求時,可以根據輸入的背景信息和技術方向生成文本,但這些生成的內容常常缺乏法律精確性,可能存在描述不清、定義模糊的問題。例如,如果沒有提供足夠的技術背景、發明目標以及相關領域的詳細信息,大語言模型生成的權利要求可能會過于籠統或過于詳細,導致無法準確保護發明的獨特性。
專利實施例是專利申請中的技術實現部分,它詳細描述了如何實現發明的具體步驟和方法。在這方面,大語言模型的表現同樣有限。專利實施例通常涉及大量的技術細節和具體的操作步驟,依賴于發明人對技術的深刻理解以及行業經驗。大語言模型雖然可以根據給定的描述生成實施例的初步文本,但往往不能在技術層面提供高質量的細節。因此,依賴大語言模型生成的實施例文本,需要經過專家的審核和修改,才能達到實際應用的標準。
大語言模型是概率模型,并非知識數據庫:大語言模型 回答本質上是基于統計預測下一個最可能的詞語,它并沒有實時訪問權威知識庫,生成內容靠的是訓練語料中學到的模式。這意味著它有時會給出貌似合理但實際錯誤的信息,所謂 “AI 幻覺 ” 正來源于此。因此,大語言模型 提供的專利信息未必真實準確,尤其當涉及它未見過的新發明或最新專利時。
大模型覆蓋的專利數據不完整、更新不及時:專利檢索和分析依賴于各國專利局的權威數據庫,而大多數通用大模型的訓練語料并不包含這些封閉數據源的全部內容。大模型并不像專業檢索引擎那樣擁有完整、最新的專利文獻庫作為支撐。
專利文本高度專業化,結構嚴謹,容錯率極低:撰寫專利文件是一項精細的工作,術語選擇需要準確規范,權利要求范圍一字之差可能天差地別,邏輯結構要嚴密自洽。這些都是目前的大模型難以完全勝任的。模型生成的文字往往追求語義通順,但在法律嚴謹性上有所欠缺。
要在專利行業充分發揮大語言模型的價值,我們需要進行一些設計,例如:
提供充分的上下文信息,巧設提示,使用大語言模型前,務必先向其 “ 喂料 ” 。模型輸出質量高度依賴輸入提示( Prompt )的質量。盡可能詳細地提供技術背景、發明要解決的痛點、核心技術方案和目標等信息,讓模型明白你要它扮演的角色和任務。
善用多輪對話,逐步細化要求,不要指望模型一次回答就完美無缺。將復雜任務拆解,通過多輪交互引導模型優化結果。比如,先讓模型給出幾個備選方案,然后人眼篩選出較好的版本,再要求模型基于此版本進一步修改或完善。對于權利要求的撰寫,可以讓模型先生成獨立權利要求,再根據需要提示它 “ 增加某某技術特征 ” 或 “ 換一種更廣泛的表述方式 ” ,經過幾輪調整,往往能得到更符合預期的草案。
將大模型嵌入特定專利工具和流程:企業和服務機構可以開發更定制化的 AI 工具,將通用大模型與專利領域專業系統結合,打造 “ 人 + AI” 的高效工作流。例如:研發專利撰寫輔助軟件,由模型根據發明交底書自動生成說明書初稿和部分實例,然后由代理人校對修改,節省撰寫時間;利用模型的文本分類能力,對海量專利文獻進行初步分類、篩選,在情報分析時快速鎖定相關領域文獻;又或者讓模型根據輸入的技術方案,提供一個可專利性初步判斷,列出該方案可能涉及的現有技術要點,供代理人參考。
假設我們要讓大語言模型寫權利要求,不是把交底書直接輸入到大語言模型中,讓直接讓其生成最終的權利要求,以目前的大語言模型的能力,不可能達到想要的效果,因為現在的大語言模型還不是AGI,訓練的時候語料有限,最終的能力與數據質量、數量處理方式、訓練方式密切相關,專利相關的數據多大幾百T的容量,光文本部分多大十幾T,目前任何的大語言模型的訓練也只能抽取其中的一小部分,根本不可能達到很多人想象的那種輸入質量,直接得到理想效果的程度。
例如我們假設讓大語言模型修改權利要求,假設輸入一段技術資料給大語言模型,第一版的權利要求是原始的權利要求,筆者通過兩輪迭代就可以讓權利要求變成第三版本,大家看下效果如何,這是完全依靠大語言模型生成,筆者未修改任何一個字。倘若讓大語言模型直接在原始的權利要求基礎上直接修改,是不可能得到完善的結果的。
原始權利要求:一種雙層反轉刀片無渣豆漿機,包括機頭(1)、桶體(2)、電機(3)、電機軸(4)、下刀片(5)、加熱元件(6)、防溢傳感器(7)和溫度傳感器(8),所述機頭(1)與桶體(2)相配合,所述電機(3)安裝在機頭(1)中,所述電機軸(4)一端與電機(3)相連,另一端與所述下刀片(5)相連,所述下刀片(5)伸入桶體(2)內,所述加熱元件(6)、防溢傳感器(7)和溫度傳感器(8)的一端安裝在機頭(1)上,另一端伸入桶體(2)內;其特征在于:所述電機軸(4)上套設有一軸套(9),所述軸套(9)通過軸承與所述電機軸(4)轉動連接,并裝有上刀片(10),使得所述上刀片(10)能夠相對于所述下刀片(5)反向旋轉。
第一輪迭代:一種豆漿機,包括桶體(2)、電機(3)、電機軸(4)和位于所述桶體(2)內的下刀片(5),所述電機(3)通過所述電機軸(4)帶動所述下刀片(5)旋轉;其特征在于:所述電機軸(4)上可旋轉地安裝有上刀片(10),所述上刀片(10)設置成相對于所述下刀片(5)反向旋轉。
第二輪迭代:一種豆漿機,包括容器(2)和驅動裝置(3),所述驅動裝置(3)具有驅動軸(4),所述驅動軸(4)伸入所述容器(2)內,其末端連接第一刀片(5);其特征在于:所述驅動軸(4)上可旋轉地安裝有第二刀片(10),所述第一刀片(5)和第二刀片(10)分別設置成反向旋轉。
只要掌握大語言模型的原理,知道模型的界面和擅長的能力,通過對業務場景的拆解,大語言模型會高效出色地協助我們完成工具。通俗地說,現在的大語言模型更像是機器上的電動機,只能做簡單粗暴的工作,這是由大語言模型的本質決定,因為要完成相應的工作,就需要做工作流的拆解和流程的設計,讓大語言模型分階段去執行,結合人工去選擇。這也是Maxipat的理念。很多朋友經常說為什么Maxipat設計的流程那么復雜,為什么不能直接都一鍵完成,實際上一鍵完成恰恰是最簡單的,因為只要輸入提示詞就可以,但這樣沒有多少實際意義,任何人都可以在通用的大語言模型上這樣操作。
不同的人使用大語言模型產生的結果天壤之別,關鍵就在于對于模型的本質和業務場景的理解。要理解大模型作為任何行業的“電動機”能夠在特定的行業可以做什么?能力的邊界在哪里?模型本身的缺陷導致的沖突在哪里?行業的痛點在哪里?業務的流程如何拆解到模型能力勝任的地方。
大語言模型的出現,為專利行業帶來了前所未有的效率提升機會。它可以快速生成文本、分析語言模式,完成一些初步工作,從而解放專利人的部分精力。然而,大語言模型并不是全知全能的智囊,它有算法和訓練數據的先天局限。只有深刻理解這些本質和限制,我們才能避免把AI當成“神筆馬良”而用錯場景。
正確的做法是以人為主導,結合AI助手。人類專家擅長判斷、創造和決策,AI擅長速度和海量數據處理,兩者優勢互補,才能在專利工作中達到1 + 1 > 2的效果。相反,如果對AI寄予不切實際的期望,忽視必要的核查和平衡,最終可能會事與愿違,甚至造成嚴重失誤。
總而言之,大模型就像一把功能強大的新工具,掌握用法者收益無窮;但若盲目使用,這把“雙刃劍”也可能傷及自身,讓“人 + AI”的協作模式才能真正提高專利工作的質量和效率。
Maxipat致力于作為成為科技創新和知識產權工作的AI加速器,主要包括輔助創新:提高研發的科技創新效率;智能搜索與分析:將專利搜索和報告制作借助AI實現智能化,包括智能查新、無效、FTO、Landscaping報告;投資助手:快速生成投資賽道報告、專利購買篩選、專利轉化評估。目前開放注冊中。輔助科技創新和知識產權工作的AI智能體
感興趣的朋友可以通過以下三種方式填寫申請信息:
1. 請發郵件到郵箱:info@maxipat.com
2. 點擊文末閱讀全文;
3. 掃描以下二維碼
感興趣的朋友可以加筆者微信patentlight
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.