![]()
![]()
![]()
2025 年 12 月 31 日,LlamaFactory 正式發布v0.9.4版本。這是一個具有里程碑意義的版本,被官方定義為不可變發布版本(Immutable Release),僅允許修改發布標題和發布說明內容。
該版本以 “Farewell to 2025” 為主題,向整個 2025 年告別,同時也宣布 LlamaFactory 將在 2026 年持續為社區提供簡單、高效、先進的大模型微調框架。
以下為LlamaFactory v0.9.4的完整更新內容詳解。
一、重要變更(Breaking Changes)
本次版本包含多項對使用者影響較大的變更,升級前請務必關注:
1.項目倉庫名稱變更
倉庫名稱已從LLaMA-Factory更新為LlamaFactory,后續所有官方資源將統一使用新名稱。2.Python 版本要求升級
Python 3.9 與 3.10 已正式廢棄。
LlamaFactory 現在要求Python 3.11 – 3.13。3.包管理工具遷移
項目從 pip 遷移至 uv。
安裝方式更新為:
使用uv pip install llamafactory4.官方博客上線
LlamaFactory 官方博客已正式發布:
https://blog.llamafactory.net/en/
v0.9.4 在算法、訓練后端和工程能力上實現了全面增強:
? 支持正交微調(Orthogonal Fine-Tuning, OFT)
? 支持新增 Token 的語義初始化(Semantic Initialization)
? 支持通過MCoreAdapter 進行 Megatron-LM 訓練
? 支持KTransformers 后端
? 支持MPO 算法
? 支持FP8 精度訓練
? 支持Transformers v5
? 支持在函數調用消息中同時使用推理內容與純文本
? 支持DeepSpeed AutoTP
? 支持高效的 NPU 融合算子
? 支持TRL 0.24
這些新特性進一步提升了 LlamaFactory 在大規模模型訓練、分布式效率、硬件適配以及前沿算法支持方面的能力。
三、模型支持更新(Models)
v0.9.4 新增與擴展了大量前沿模型與多模態模型支持,覆蓋文本、視覺及多任務場景:
? Falcon H1
? Kimi-VL
? GLM-4.5V
? Gemma3n
? Granite4
? Qwen3-2507
? MiniCPM-V 4.0
? Intern-S1-mini
? Seed-OSS
? MiniCPM-V 4.5
? InternVL-3.5
? ERNIE-4.5-Text
? ERNIE-4.5-VL
? Ling-V2
? Qwen3-VL
? Qwen3-Omni
? Hunyuan-mt
? GLM-4.6V
? Ministral 3
? VibeThinker
? MiMo-V2-Flash
? MiniMax-M1
? MiniMax-M2
該版本在多模態、視覺語言建模和新一代通用模型支持方面達到了新的高度。
四、總結
代碼地址:github.com/hiyouga/LlamaFactory
LlamaFactory v0.9.4不只是一次常規更新,而是一次承前啟后的關鍵版本:
? 告別 2025,面向 2026 全面進化
? Python、工具鏈與訓練體系全面升級
? 覆蓋最新算法、硬件能力與模型生態
? 繼續堅持“簡單 + 高效”的 LLM 微調理念
如果你正在使用或計劃使用 LlamaFactory 進行大模型訓練與微調,v0.9.4 是一個值得重點關注和升級的版本。
告別 2025,下一站,2026。
我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.