專利名稱 復雜動態(tài)環(huán)境下基于強化學習的機器人自主導航的模型訓練方法
申請?zhí)?專利號 CN202511063822.9 專利權人(第一權利人) 長春工業(yè)大學
申請日 2025-07-31 授權日 2025-10-10
專利類別 授權發(fā)明 戰(zhàn)略新興產(chǎn)業(yè)分類 新一代信息技術
技術主題 機器人|學習機|決策網(wǎng)絡|訓練方法|強化學習|仿真|多目標|游戲結(jié)構(gòu)
應用領域 導航計算工具|設計優(yōu)化/仿真|推理方法|神經(jīng)學習方法
意向價格 具體面議
專利概述 本發(fā)明公開了一種復雜動態(tài)環(huán)境的基于強化學習的機器人自主導航方法,涉及強化學習、機器人導航等技術領域。本發(fā)明旨在解決多目標強化學習中,目標之間存在沖突,導致導航策略難以動態(tài)權衡、決策靈活性不足的問題。首先,創(chuàng)建仿真環(huán)境并構(gòu)建Bayesian?RVO模型用于對仿真環(huán)境中的行人行為模擬;其次,引入博弈論中的均衡響應原理設計獎勵函數(shù)并構(gòu)建博弈論框架;然后,設計基于Stackelberg博弈結(jié)構(gòu)的雙層決策網(wǎng)絡;在此基礎上,引入BNN結(jié)構(gòu)的Critic網(wǎng)絡;最后,進行模型訓練。與現(xiàn)有方法相比,本發(fā)明在復雜環(huán)境下表現(xiàn)出更高的導航成功率、更低的碰撞率和更強的路徑合理性,顯著提升了機器人在復雜環(huán)境中的自主導航性能,可應用于農(nóng)業(yè)、工業(yè)、服務業(yè)等領域。
圖片資料 復雜動態(tài)環(huán)境下基于強化學習的機器人自主導航的模型訓練方法
合作方式 具體面議
聯(lián)系人 戚梅宇 聯(lián)系電話 13074363281