![]()
![]()
![]()
ragflow v0.23.0 已于 2025 年 12 月 27 日正式發布。本次版本更新內容非常龐大,涵蓋 Memory 能力、Agent 架構、數據攝取流水線、數據集能力、對話與語音、數據源、模型支持、API 行為,以及大量功能增強與問題修復
新特性
1.內存
? 實現了用于管理記憶的“內存”接口。
? 支持通過“檢索”或“消息”組件配置上下文。
2.智能體
? 通過重構底層架構提升了“智能體”組件的性能。
? “智能體”組件現在可以輸出結構化數據,供下游組件使用。
? 支持使用網絡鉤子來觸發智能體執行。
? 支持語音輸入/輸出。
? 支持為每個“智能體”組件配置多個“檢索”組件。
3.文檔處理流水線
? 支持在“轉換器”組件中提取文檔目錄,以提升長上下文檢索增強生成性能。
4.數據集
? 支持為圖像和表格配置上下文窗口。
? 引入了父子分塊策略。
? 支持在文件解析過程中自動生成元數據。
? 聊天:支持語音輸入。
? 將RAGFlow的文檔引擎Infinity升級至v0.6.15版本(向后兼容)。
?數據源支持新增:
? Google Cloud Storage
? Gmail
? Dropbox
? WebDAV
? Airtable
?新增模型支持:
? GPT-5.2
? GPT-5.2 Pro
? GPT-5.1
? GPT-5.1 Instant
? Claude Opus 4.5
? MiniMax M2
? GLM-4.7
? 新增MinerU配置界面。
? 新增AI Badgr(模型提供商)。
? HTTP API
? 與智能體對話的接口將返回完整的執行跟蹤日志。
? 創建聊天補全接口支持基于元數據的過濾。
? 與聊天助手對話接口支持基于元數據的過濾。
本次更新包含了大量的問題修復、代碼優化、文檔更新和本地化改進,例如:
? 修復了Cohere重排器的默認基礎URL。
? 新增了OceanBase文檔引擎支持。
? 優化了LLM響應中令牌總數的處理邏輯。
? 新增了PPTX和電子表格文檔類型的TCADP解析器。
? 更新了俄語語言包。
? 畫布新增思維導圖標簽支持。
? 優化了Docker Compose文件中的命令語法。
? 修復了RAGFlow使用Postgres數據庫時無法啟動的問題。
? 支持元數據過濾器的聯合邏輯操作。
? 修復了啟用分頁時檢索總數不正確的問題。
? 數據輸出現在可以直接同步到畫布而無需經過表單。
? 改進了多列文檔的檢測。
? 新增了更多分塊方法。
? 豐富了Notion連接器的功能。
? 修復了PDF原生模式解析文本時缺失參數的問題。
? 在循環操作符中新增了循環變量。
? 優化了PDF文本類型檢測的正則表達式。
? 支持忽略使用自定義分隔符時的分塊大小。
? API接口支持目錄增強功能。
? 在元數據中啟用邏輯運算符。
? 修復了變量為數組時會話無法保存的問題。
? 為Ollama聊天模型添加了認證頭部支持。
? 新增Moodle數據源集成。
? 修復了HTTPS模式下Nginx啟動失敗的問題。
? 新增Dropbox數據源。
? 重構了電子郵件解析器以更安全地處理緩沖區。
? 修復了保存聊天頁面模型參數后參數消失的問題。
? 支持元數據過濾器中的
in/not in操作符。? 修復了代碼執行組件的安全漏洞,并增加了對嵌套列表和字典對象的支持。
? 為S3兼容存儲添加了尋址樣式配置。
? 改進了原生Markdown解析器的圖像合并邏輯。
? 新增Webdav存儲作為數據源。
? 改進了連接器服務中的元數據處理。
? 修復了HTML文件解析可能丟失內容的問題。
? 為圖和表添加了上下文支持。
? 新增“循環”組件。
? 啟用了帶工具的智能體的結構化輸出。
? 支持通過HTTP API創建數據集時指定文檔處理流水線。
? 新增嵌入式聊天主題功能。
? 增加了Redis用戶名支持。
? 提升了Quart的響應和主體超時時間以適配慢速LLM響應。
? 使RAGFlow支持更多異步操作以提升性能。
? 對話框上傳的文件現在可以不綁定到數據集。
? 支持在對話框中上傳文件。
? 新增API接口將序列轉換為文本,并更新了QWen序列到文本模型。
? 新增了MiniMax-M2模型,并移除了過時的MiniMax模型。
? 從Infinity導入分詞器。
? 新增了MinerU自動安裝器。
? 改進了PDF解析器的呈現效果。
? 為智能體應用新增語音對話功能。
? 修復了異步聊天流式輸出不正確的問題。
? 智能體支持文本到語音。
? 支持目錄轉換器。
? 新增了RAG評估功能。
? 將用戶界面文本標準化為句子首字母大寫。
? 為結構化數據自動禁用Raptor分塊方法。
? 新增了Confluence空間密鑰支持。
? 修復了分塊列表函數中的分頁和提前終止錯誤。
? 新增了Google云存儲集成支持。
? 修復了相對頁碼定位問題。
? 修復了SDK中布爾對象屬性訪問錯誤。
? 為智能體畫布頁面添加了加載狀態。
? 通過檢查文件頭字節來檢測DOCX支持。
? 清理了智能體工具中的同步函數。
? 從RAGFlow中移除了測試文件,并將Infinity升級至0.6.10。
? 更改了Docker容器的重啟策略。
? 更新了Confluence連接器的更多屬性。
? 刪除了未使用的測試代碼。
? 修復了SDK中任務取消調用的端點問題。
? 為同名文件使用文件路徑進行區分。
? 用戶無需先創建會話即可直接開始聊天。
? 確保MCP服務器緩存所有文檔元數據。
? 修復了MinerU API的輸出查找和手動分塊元組處理。
? 修復了填充組件返回值非對象的問題。
? 新增用于下載“消息”組件輸出文件的API。
? 修復了流水線中的目錄處理問題。
? 為聊天模型和對話實現了同步機制。
? 新增了Huggingface Hub依賴。
? 默認創建管理員賬戶。
? 修復了高亮Markdown的組件名拼寫錯誤。
? 修復了高級文檔處理流水線配置問題。
? 修復了父子分塊方法。
? 對齊了HTTP客戶端的代理參數。
? 為Docker部署中的TEI配置文件設置默認嵌入模型。
? 修復了列表索引越界錯誤。
? 將CV模型聊天遷移至異步。
? 將Infinity升級至v0.6.11(要求Python>=3.11)。
? 防止異步聊天流在成功時進行冗余重試。
? 新增意大利語翻譯支持。
? 修復了消息節點中變量顯示不正確的問題。
? 將MinerU視為OCR模型進行處理。
? 修復了異步聊天流重復輸出的問題。
? 將并發庫從Trio替換為Asyncio。
? 將Python版本要求提升至>=3.12。
? 執行器管理器更新了Docker版本。
? 實現了內存功能。
? 修改了“重疊百分比”字段的名稱。
? 修復了表格中的CSV解析問題。
? 移除了敏感信息日志。
? 增強了OceanBase連接的搜索功能。
? 為“開始”節點添加了網絡鉤子配置。
? 修復了調用思維導圖端點時的事件循環錯誤。
? 增強了元數據操作。
? MinerU支持新的后端VLM-MLX引擎。
? 通過正確調用異步主函數修復了數據同步啟動崩潰問題。
? 為元數據過濾器添加了半自動模式。
? 修復了異步問題和敏感信息日志記錄。
? 新增了通義千問的DeepSeekV3.2模型,并移除了未使用的代碼。
? 將MinerU添加為模型制造商。
? 修復了分詞器問題。
? 為MinIO/S3添加了單桶模式支持。
? 簡化了網絡鉤子的請求模式。
? 新增了Box連接器。
? 修復了元數據更新行為。
? 新增了文檔生成器功能。
? 修復了忘記/重置密碼功能。
? 在網絡鉤子的請求體中顯示文件選項。
? 重構了元數據過濾器。
? 新增了GPT-5.2及Pro版本支持。
? 修復了Raptor分塊方法缺少聊天屬性的問題。
? 修復了Aspose幻燈片處理問題。
? 修復了Azure OpenAI資源未找到錯誤。
? 修復了演示文稿解析和嵌入編碼異常處理。
? 支持將加密文件上傳到對象存儲。
? 將網絡鉤子的返回值設置為字符串。
? 執行器管理器更新了Docker版本。
? 改進了計算嵌入令牌總數的邏輯。
? 修復了流水線忽略MinerU后端配置以及缺少vllm模塊的問題。
? 在用戶填充表單提交時顯示名稱而非鍵值。
? 更新了數據集配置和檢索測試。
? 修復了多個錯誤。
? 修復了AzureEmbed對象缺少令牌計數屬性的問題。
? 移除了未使用的Python模塊依賴。
? 對MinerU功能進行了多項改進。
? 修復了Excel導出問題。
? 修復了安全問題。
? 遷移到單桶模式的文檔更新。
? 啟用了編輯分塊時的圖像編輯功能。
? 將“知識庫”更名為“數據集”。
? 為文檔處理流水線新增了子分塊分隔符配置。
? 內存功能完善。
? 更新了默認提示詞。
? 現在僅支持MinerU-API。
? 修復了未修改子分隔符時無法保存文檔處理流水線配置的問題。
? 更新了文檔API示例響應以符合當前狀態。
? 修復了空內存參數的問題。
? 更新了日志記錄。
? 在聊天API中添加了多模態模型。
? 在文檔處理流水線的轉換器節點中新增目錄選項。
? 拒絕了默認管理員賬戶登錄普通服務。
? 修復了父子分塊方法。
? 添加了許可證并修復了IDE警告。
? 修復了Markdown文件中的表格格式警告。
? 修復了PDF解析器重復的問題。
? 修復了模型未授權錯誤。
? 在編輯分塊對話框中添加了圖片上傳器。
? 改進了時間戳的一致性。
? 修復了任務執行器問題。
? 改進了Cohere模型的令牌總數計算。
? 修復了IDE警告。
? 修復了編輯分塊時的圖片編輯問題。
? 更新了日志記錄。
? 智能體補全API可以返回跟蹤信息。
? Bedrock服務支持IAM認證。
? 為所有數據源類型的同名文件使用文件路徑。
? 更新了網絡鉤子組件。
? 進一步更新了Bedrock模型配置。
? 為添加OCR模型提供了更好的用戶體驗。
? 聊天補全API支持元數據過濾。
? 顯示網絡鉤子中間節點的錯誤信息。
? 支持將MinerU作為遠程服務調用的文檔說明。
? 顯示中間節點的錯誤信息。
? 新增AI Badgr作為OpenAI兼容的聊天模型提供商。
? 對話中連續出現的圖片將以輪播圖形式合并顯示。
? 實現了元數據功能。
? 在知識庫信息檢索中包含了文檔ID。
? 文檔列表和過濾器支持元數據過濾。
? 支持在一個智能體下使用多個檢索工具。
? 將連接器與S3分離。
? 為圖片添加了可選的緩存清除參數。
? 使用基于視覺的描述增強Excel圖片提取。
? 修復了Python SDK檢索文檔名稱為空的問題。
? 更新了RAGFlow SDK以保持一致性。
? 移除了中文注釋并修復了函數參數錯誤。
? 修復了列出MCP工具可能被阻塞的問題。
? 移除了PPT解析器中無用的異常捕獲。
? 修復了敏感信息明文日志記錄的安全問題。
? 修復了字符轉義問題。
? 當網絡鉤子返回流式格式字段時,消息顯示狀態字段。
? 對話中連續出現的圖片使用輪播組件顯示。
? 修復了Dashscope響應屬性訪問的令牌/日志工具。
? 在分塊編輯器和對話框中顯示分塊類型。
? 修復了IDE警告。
? 修復了多個UI相關問題。
? 當選擇了圖片時隱藏拖拽區域的上傳按鈕。
? 優化了AWS S3連接器。
? 重構了添加LLM和語音轉文本功能。
? 在數據集配置中增加了圖像上下文窗口。
? 輸出Infinity測試日志。
? Tika服務器升級。
? 增強網絡鉤子響應以包含狀態和成功字段,并簡化了ReAct智能體。
? 修復了任務取消功能。
? 更新了工作流。
? 在網絡鉤子模式下隱藏部分消息字段。
? 修復了多項錯誤(減少了元數據保存步驟等)。
? 修復了vision_figure_parser對docx/pdf的封裝處理。
? 為記憶召回和消息操作符表單添加了記憶多選下拉框。
? 新增了GLM-4.7模型支持。
? 更新了方法調用以使用簡化的異步工具反應。
? 修復了多個檢索工具中僅一個生效的問題。
? 修復了元數據相關錯誤。
? 翻譯了網絡鉤子調試界面的文本。
? 將標準錯誤重定向到標準輸出。
? 修復了元數據問題和graphrag加速問題。
? 增強了下一步提示詞。
? 修復了轉換器節點中目錄提示文本不正確的問題。
? 在網絡鉤子響應狀態鉤子中添加了空值安全檢查。
? 重新組織了本地化翻譯的措辭。
? 修復了對話消息中未顯示等待輸入的表單的問題。
? 優化了圖像和表格的上下文窗口處理。
? 修復了知識庫更新接口未更新文件服務的問題。
? 修復了測試錯誤。
? 修復了目錄處理中未找到分塊的問題。
? 支持通過空元數據過濾文檔。
? 修復了目錄名稱。
? 保持了與聊天助手對話接口行為的一致性。
? 從環境配置文件中移除了MinerU設置。
? 更新了德語語言文件。
? 聊天消息中引用的圖片以輪播形式顯示在消息底部。
? 修復了元數據提示信息。
? 修復了CI中的404未找到錯誤。
? 僅當分塊類型為圖片時才允許在分塊編輯器中更新圖片。
? 新增了Airtable連接器和數據同步集成。
? 修復了生成元數據錯誤。
? 修復了API密鑰模態框錯誤。
? 智能體聊天消息底部顯示圖片輪播。
? 在網絡鉤子模式下隱藏消息操作符的自動播放開關。
? 新增了消息管理功能。
? 修復了內存頁面中無法選擇LLM的問題。
? 修復了文本問題。
? 智能體只能從知識庫或記憶中檢索內容。
? 在消息底部預覽圖片。
? 修復了內存相關錯誤。
? 修復了檢索來源判斷邏輯。
? 修復了遺忘策略。
? 修復了內存配置中的用戶提示文本框。
? 修復了用戶界面上的小問題。
? 修復了消息持續時間顯示。
? 優化了內存功能。
? 更新了本地LLM部署文檔,增加了vLLM指南支持。
? 在檢索節點中顯示已選記憶列表。
? 允許更新記憶類型。
? 修復了更多內存相關錯誤。
? 修復了不允許檢查的字段移除問題。
? 改進了圖像和表格的上下文處理。
? 修復了內存保存問題。
? 修復了父子分塊流水線的錯誤案例。
? 發布了v0.23.0版本說明文檔。
? 修復了挑選消息到內存時的排序問題。
? 將“先進先出”的縮寫從“fifo”更正為“FIFO”。
? 修復了前端無法同步文檔窗口上下文的問題。
? 優化了內存大小的初始化。
? 修復了文檔顯示問題。
? 將Infinity引擎升級至0.6.15版本。
? 修復了在Infinity 0.6.15上的內存問題。
? 在README和文檔中將版本引用更新為v0.23.0。
代碼地址:github.com/infiniflow/ragflow
ragflow v0.23.0 是一個里程碑式的大版本更新,在 Memory、Agent、多檢索器、語音、多模態、數據源、模型支持與系統穩定性方面實現了全面提升。該版本為復雜 RAG 應用、企業級數據接入、多智能體與長期記憶場景奠定了堅實基礎,標志著 ragflow 在工程成熟度與功能完整性上邁入新階段。
我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.