近日,全球人工智能領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議NeurIPS 2025公布了論文錄用結(jié)果。我校人工智能與大數(shù)據(jù)學(xué)院智能認(rèn)知與決策控制團(tuán)隊(duì)以第一作者單位發(fā)表論文《Towards Reliable LLM-based Robot Planning via Combined Uncertainty Estimation》,第一作者為該團(tuán)隊(duì)尹世遠(yuǎn)博士,通訊作者為中國(guó)電信人工智能研究院白辰甲研究員。
NeurIPS(神經(jīng)信息處理系統(tǒng)年會(huì))2025將于今年12月在美國(guó)舉行,NeurIPS是機(jī)器學(xué)習(xí)與計(jì)算神經(jīng)科學(xué)領(lǐng)域的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議,被中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦為A類(lèi)國(guó)際學(xué)術(shù)會(huì)議。作為當(dāng)前全球最負(fù)盛名的人工智能學(xué)術(shù)會(huì)議之一,在谷歌學(xué)術(shù)發(fā)布的全球?qū)W術(shù)期刊和會(huì)議影響力排名中位列前列,與ICML、ICLR并稱(chēng)為人工智能領(lǐng)域難度最大、水平最高、影響力最強(qiáng)的“三大會(huì)議”。這也是河南工業(yè)大學(xué)人工智能與大數(shù)據(jù)學(xué)院首次在NeurIPS頂會(huì)上發(fā)表論文。
該論文立足機(jī)器人規(guī)劃領(lǐng)域,聚焦大型語(yǔ)言模型(LLMs)在機(jī)器人任務(wù)規(guī)劃中的可靠性問(wèn)題。LLMs雖能理解自然語(yǔ)言指令并生成高層計(jì)劃,但存在幻覺(jué)現(xiàn)象,可能導(dǎo)致過(guò)度自信的不安全計(jì)劃。論文針對(duì)現(xiàn)有研究未充分區(qū)分認(rèn)知不確定性和內(nèi)在不確定性的局限,提出了一種新型不確定性評(píng)估框架CURE(Combined Uncertainty estimation for Reliable Embodied planning),通過(guò)分解不確定性成分,提升規(guī)劃可靠性。

CURE算法概覽
CURE框架將認(rèn)知不確定性細(xì)分為任務(wù)清晰度和任務(wù)熟悉度,分別基于隨機(jī)網(wǎng)絡(luò)蒸餾(RND)和多層感知機(jī)回歸頭進(jìn)行評(píng)估;內(nèi)在不確定性則建模為計(jì)劃的預(yù)期成功率。該方法無(wú)需修改現(xiàn)有LLM規(guī)劃器,即可實(shí)現(xiàn)即插即用的不確定性估計(jì)。在任務(wù)熟悉度評(píng)估環(huán)節(jié),研究團(tuán)隊(duì)采用RND網(wǎng)絡(luò)計(jì)算任務(wù)描述向量的相似度指標(biāo),從而量化任務(wù)熟悉程度。

CURE訓(xùn)練推理流程
河南工業(yè)大學(xué)人工智能與大數(shù)據(jù)學(xué)院智能認(rèn)知與決策控制團(tuán)隊(duì)在我校特聘教授王震的帶領(lǐng)下長(zhǎng)期專(zhuān)注于人工智能、機(jī)器人規(guī)劃與多模態(tài)學(xué)習(xí)研究,與中國(guó)電信人工智能研究院開(kāi)展深入學(xué)術(shù)合作,在LLM與機(jī)器人系統(tǒng)集成方面具有深厚積累。未來(lái),團(tuán)隊(duì)將繼續(xù)聚焦大型語(yǔ)言模型在機(jī)器人任務(wù)規(guī)劃中的不確定性估計(jì)、違規(guī)無(wú)人機(jī)識(shí)別與意圖分析等核心挑戰(zhàn),推動(dòng)原創(chuàng)性、引領(lǐng)性科技攻關(guān),為推進(jìn)學(xué)?!半p一流”創(chuàng)建和人工智能學(xué)科發(fā)展貢獻(xiàn)力量。