
近日,中國石化建設(shè)的“石油化工行業(yè)通用高質(zhì)量數(shù)據(jù)集”成功通過工業(yè)和信息化部電子工業(yè)標(biāo)準(zhǔn)化研究院測評,成為國內(nèi)首個通過國家標(biāo)準(zhǔn)測評的行業(yè)高質(zhì)量數(shù)據(jù)集。
![]()
此次測評依據(jù)國家標(biāo)準(zhǔn)《高質(zhì)量數(shù)據(jù)集 質(zhì)量評測規(guī)范》(TC609-5-2025-04),通過“數(shù)據(jù)+模型”相結(jié)合的測評方法,涵蓋數(shù)據(jù)集說明文檔、數(shù)據(jù)質(zhì)量、模型應(yīng)用3大維度17項(xiàng)指標(biāo),對數(shù)據(jù)集進(jìn)行多維度全鏈條質(zhì)量評估。“石油化工行業(yè)通用高質(zhì)量數(shù)據(jù)集”包含行業(yè)特定術(shù)語、公式、分子式等,在格式規(guī)范性、內(nèi)容一致性、內(nèi)容干凈性指標(biāo)上得分均超90分,數(shù)據(jù)質(zhì)量達(dá)到行業(yè)領(lǐng)先水平,充分驗(yàn)證其在支撐人工智能深度應(yīng)用方面可靠性。
該數(shù)據(jù)集有力支持了中國石化長城大模型訓(xùn)練,以及分子理解、分子生成、審計(jì)等專業(yè)大模型訓(xùn)練,自主研發(fā)的高質(zhì)量數(shù)據(jù)集全鏈路工具套件為系統(tǒng)內(nèi)86家單位近900個用戶開展數(shù)據(jù)加工處理工作提供支撐。同時,其標(biāo)準(zhǔn)化構(gòu)建方法也為石油化工行業(yè)提供了可參考的建設(shè)范本。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.