1月13日,國家發(fā)展改革委、國家數據局、財政部、人力資源和社會保障部四部門聯合發(fā)布《關于促進數據標注產業(yè)高質量發(fā)展的實施意見》(以下簡稱《意見》)。
什么是“數據標注”?簡單理解,就是給文本、語音、圖片、視頻等等各種各樣的數據“打標簽”。本次印發(fā)的文件是國家層面首次對數據標注這一新興產業(yè)進行系統謀劃。
年均復合增長率將超20%
數據標注產業(yè)向知識密集型轉變
自動駕駛、低空經濟、智能制造、智慧醫(yī)療等領域都離不開數據標注。據測算,2023年我國數據標注產業(yè)規(guī)模達800億元左右。本次發(fā)布的《意見》提出,到2027年,數據標注產業(yè)專業(yè)化、智能化及科技創(chuàng)新能力水平顯著提升,產業(yè)規(guī)模大幅躍升,年均復合增長率超過20%。培育壯大數據標注產業(yè),對于推動人工智能創(chuàng)新發(fā)展具有重要支撐作用。 清華大學計算社會科學與國家治理實驗室執(zhí)行主任 孟慶國:高質量數據短缺,是我們一些大模型發(fā)展過程中遇到的瓶頸,數據標注就是對數據進行篩選、清洗、分類、標記等各種加工處理,能產生高質量的數據集,讓機器讀得懂、學得快、訓得好,F在的一個新趨勢是,數據標注自身的自動化、智能化程度也在明顯提高,與此同時,細分領域變多,也需要金融、交通、能源、醫(yī)療等一些背景的專業(yè)人才,數據標注正在逐步從傳統的勞動密集型向知識密集型產業(yè)轉變。《意見》還提出,建設成效顯著、特色鮮明的數據標注基地,形成相對完善的數據標注產業(yè)生態(tài)。目前,我國已確定成都、沈陽、合肥、長沙等7個城市承擔數據標注基地建設任務。
|