zgzx1 |
|
等級:論壇騎士(三級) |
積分:2424分 |
注冊:2009-5-20 |
發表:727(423主題貼) |
登錄:1150 |
|
|
【解讀】國家數據局:7個數據標注基地已建設數據集524個 |

國家數據局7月22日舉行新聞發布會,介紹2025中國國際大數據產業博覽會相關情況。國家數據局有關負責人表示,全面加速高質量數據集建設和應用落地,進一步推動數據要素市場化、價值化。
【什么是數據標注?】
數據標注是對數據進行添加標記、說明、解釋、分類和編碼的過程。數據標注,是提升人工智能算法、模型核心能力的關鍵環節。
【我國七個數據標注基地】分別位于四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同,目前已形成醫療、工業、教育等行業的高質量數據集524個;賦能一百多個國產人工智能大模型研發(目前是163個);帶動數據標注行業相關產值超過100億元。
國家數據局有關負責人表示,未來將進一步暢通數據采集、標注、人工智能應用產業鏈,重點推動工業、金融、醫療、交通、教育等幾大領域的高質量數據集建設,促進數據標注產業高質量發展。
【什么是高質量數據集?】
高質量數據集是經過采集、加工等數據處理,可以直接用于開發和訓練人工智能模型,能夠有效地提升模型性能的高質量數據集合。
據介紹,國家數據局已組織開展高質量數據集典型案例征集和示范推廣,挖掘醫療、工業、交通、地理、氣象等重點領域標桿實踐,還指導合肥、成都等7個城市建設數據標注基地,先行先試探索數據標注產業發展經驗。截至今年上半年,7個數據標注基地已建設數據集524個,服務大模型也有163個。
當前數據標注產業發展仍面臨一些問題,從供給端看,面臨智能標注技術供給不足、產業基礎薄弱、標準體系不健全、高水平人才短缺等問題;從需求端看,面臨數據標注市場需求規模低的問題。數據標注基地作為數據標注產業發展的示范標桿,應從供需兩端雙向發力,“提升四類供給,釋放兩類需求”,為解決上述問題提供指引和路徑。
國家數據局副局長余英表示,國家數據局全面加速高質量數據集建設和應用落地,組織開展生態培育專項行動。開展高質量數據集典型案例征集和示范推廣,挖掘醫療、工業、交通等重點領域標桿實踐;定期舉辦技術交流活動,圍繞數據標注、合成、高質量數據集建設方法論等開展深度研討;搭建常態化供需對接平臺,促進數據供給方、技術提供方、場景應用方精準匹配。 下一步,國家數據局將著力打造“數據標注+高質量數據集+模型+應用場景+市場化價值化”的閉環生態,推進數據要素市場化配置改革和“人工智能+”行動同向發力、同頻共振。
北京大學《數據資產管理與數據資本化策略》2025專題研修班招生
數據資產服務聯盟暨北大數據資產研修班校友簽約儀式6月在北京舉行
10大國家試驗區“破冰”數據確權,萬億級數據資產化進程加速!
【名單】全國數據資產全過程管理試點單位清單
【解讀】穩定幣是什么?由誰發行?與美元或人民幣國家貨幣有什么關聯和區別?中國政府啥態度?

|
|