近日,國家數據局發布《關于推進行業高質量數據集建設行動的實施方案》,這是國家層面首次對數據賦能人工智能發展作出的系統性部署。
在聚焦行業領域推進高質量數據集建設方面,《實施方案》提出,聚焦社會信用等重點領域,以及相關創新領域,加快推進行業高質量數據集建設。
![]()
行業高質量數據集是經過采集、加工等數據處理,可直接用于開發和訓練人工智能模型,能有效提升模型性能的行業數據的集合,包含行業通識和行業專識數據集。行業高質量數據集是推動“人工智能+”賦能千行百業、實現產業落地的基礎性、關鍵性資源。
江蘇省
2025年9月,國家數據局公布首批140個高質量數據集建設先行先試任務,其中江蘇省萊斯信息申報的“公共信用檔案高質量數據集”項目同時入選先行先試項目和典型案例,成為政務服務與社會治理領域數據建設的標桿示范。
“公共信用檔案高質量數據集”聚焦社會信用體系構建,重點解決“無標準,難識別”“數據散,難處理”“源頭多,難追溯”等行業共性難題,建立了跨區域、跨主體、跨平臺的數據互聯互通交換機制,形成涵蓋安全管理、接入認證、運行監控于一體的數據傳輸保障體系,并創新推出數據授權使用機制,為信用數據的安全共享與規范應用構建“防護網”。
截至2025年9月,該數據集已在全國90多個省市縣部署應用,構建起國家、省、市、縣四級聯動體系,累計歸集數據超800億條,覆蓋超1.8億社會法人,年增量穩定超過20億條,有力支撐社會信用信息的實時應用。
蘇州市
蘇州市新建元數科的兩個項目入選江蘇省高質量數據集建設先行先試項目入庫名單,分別是“江蘇省企業負面信用數據高質量數據集”和“江蘇省企業經營指標區間特征高質量數據集”。
第一個數據集聚合統計江蘇省3200余萬家企業的負面信用數據,形成欠稅總數范圍、聯合懲戒次數、重大稅收違法次數等多個統計指標及標簽標定,主要用于信貸風控審批、風險預警監測迭代等模型訓練,預計提升負樣本特征區分度12%,降低模型訓練損失值15%。
第二個數據集提取全省1520余萬家企業經營數據,進行區間化特征構建與標簽映射,涵蓋資產總額、凈利潤、營業總收入、納稅總額等核心指標,主要用于企業信用評級監督學習、風險預警與“黑名單”預測等模型訓練,預計縮短數據準備時間20%,減少模型收斂迭代次數10%。
無錫市
2025年5月,無錫市申報的“無錫市社會法人公共信用評價數據集”與“無錫市個人信用積分阿福分數據集”成功獲取由江蘇省知識產權保護中心頒發的數據知識產權登記證書,此舉成功開辟了江蘇省內發改系統公共信用類數據知識產權確權登記的先河,為公共信用數據資源的合法合規使用奠定了堅實基礎。
“無錫市社會法人公共信用評價數據集”與“無錫市個人信用積分阿福分數據集”是無錫市發展改革委依托市公共信用信息服務平臺,遵循全國公共信用信息基礎目錄清單,全面歸集各相關行政部門的信用數據,經過數據清洗、比對流程,依據嚴謹的動態量化評估模型算法精煉而成的信用數據產品,覆蓋面廣、涉及部門多、數據量大,累計涵蓋超6億條信用數據。截至2025年5月,累計為全市各類市場主體出具社會法人公共信用評價報告45萬份,開通個人信用分“阿福分”近40萬人,在政務服務、醫療就診、文旅生活等領域提供“信易+”惠民場景約120萬余次,另外,通過“阿福貸”產品為中小微市場主體提供約2億元的信用額度,有力促進了社會信用體系的建設與金融服務的深度融合。
湖北省
湖北省武漢市中小微企業融資貼息數據集涵蓋武漢市創業擔保貸(青創貸)申請數據、紓困貼息數據。其中武漢創業擔保貸(青創貸)由多部門聯合打造,通過貫通政銀擔線上業企業融資務流程,融合多種先進數字技術,整合政務及公共信用數據資源,實現全線上申請審批、一鍵授權提交資料、秒出預授信額度等功能,緩解創業融資難題。紓困貼息申請審核系統也實現業務全流程線上化,通過接入企業工商數據、引入電子簽章、與銀行系統對接返數等多元化功能,提升效率、降低成本。
該數據集借助整合政府大數據資源,數據集能夠為企業給予精準的信用評價與持續經營能力評估。此類數據可用于構建“互聯網+政務+金融+大數據”融資服務鏈,切實緩解企業與金融機構之間的信息不對稱難題,提升融資對接的效率。
山東省
“格蘭德全球企業跨境數據集”項目,是保障國家安全、貿易安全、金融安全的重要基礎設施,是賦能企業出海的數據加速器和AI大模型訓練的新基座,作為國產化全球企業數據集的開拓者,項目已建成國內最大的國產化全球企業數據庫,覆蓋全球230多個國家和地區、超6億家企業數據,主要用于企業出海風險評估和AI大模型訓練。
該數據集解決了國際數據壟斷問題,提供企業征信、風險預警等服務,截至2025年11月,已服務20萬用戶,日訪問量百萬級,并支撐了6000億元貿易額,助力信用貸款10億元,挽回海外欠款超過1億元。其核心功能包括全球企業身份識別、跨境信用報告及商賬追收,支持企業市場拓展和合規管理。
![]()
【案例匯編】
【專家觀點】
【信用案例】
【工作進展】
【值得收藏】
編輯:源源
校稿:昊宇
來源:國家數據局、源點蘇研院
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.