以主流價值語料庫與人民智媒大模型為核心,構(gòu)建內(nèi)容創(chuàng)作、審校、問答與智能體開放的全鏈路 AI 應(yīng)用體系。
總體規(guī)模
基礎(chǔ)語料
問答語料
圖文語料
針對大模型面臨的瓶頸問題,人民網(wǎng)全員下足“笨功夫”,人工設(shè)問、人工作答、三審三校。結(jié)合大模型、自然語言處理等多種前沿技術(shù)歸集、清洗、標注、風控,以“笨功夫”“巧功夫”的有機結(jié)合推動高質(zhì)量語料的高效建設(shè)。
依托傳播內(nèi)容認知全國重點實驗室的技術(shù)、算力與數(shù)據(jù)資源,研究基于大模型與專有模型的語料數(shù)據(jù)自動分類、精細標注與體系化技術(shù),搭建面向主流價值語料處理的全棧式語料處理工具鏈和可控共享服務(wù)平臺。
凝練新聞、政策、著作、流行語等素材規(guī)律,構(gòu)建適配多領(lǐng)域的專業(yè)語料庫和語料生成大模型,結(jié)合人工經(jīng)驗對輸出內(nèi)容進行多維度糾偏提質(zhì)。