| 專利名稱 |
復雜動態(tài)環(huán)境下基于強化學習的機器人自主導航的模型訓練方法 |
| 申請?zhí)?專利號 |
CN202511063822.9 |
專利權人(第一權利人) |
長春工業(yè)大學 |
| 申請日 |
2025-07-31 |
授權日 |
2025-10-10 |
| 專利類別 |
授權發(fā)明 |
戰(zhàn)略新興產(chǎn)業(yè)分類 |
新一代信息技術 |
| 技術主題 |
機器人|學習機|決策網(wǎng)絡|訓練方法|強化學習|仿真|多目標|游戲結(jié)構(gòu) |
| 應用領域 |
導航計算工具|設計優(yōu)化/仿真|推理方法|神經(jīng)學習方法 |
| 意向價格 |
具體面議 |
| 專利概述 |
本發(fā)明公開了一種復雜動態(tài)環(huán)境的基于強化學習的機器人自主導航方法,涉及強化學習、機器人導航等技術領域。本發(fā)明旨在解決多目標強化學習中,目標之間存在沖突,導致導航策略難以動態(tài)權衡、決策靈活性不足的問題。首先,創(chuàng)建仿真環(huán)境并構(gòu)建Bayesian?RVO模型用于對仿真環(huán)境中的行人行為模擬;其次,引入博弈論中的均衡響應原理設計獎勵函數(shù)并構(gòu)建博弈論框架;然后,設計基于Stackelberg博弈結(jié)構(gòu)的雙層決策網(wǎng)絡;在此基礎上,引入BNN結(jié)構(gòu)的Critic網(wǎng)絡;最后,進行模型訓練。與現(xiàn)有方法相比,本發(fā)明在復雜環(huán)境下表現(xiàn)出更高的導航成功率、更低的碰撞率和更強的路徑合理性,顯著提升了機器人在復雜環(huán)境中的自主導航性能,可應用于農(nóng)業(yè)、工業(yè)、服務業(yè)等領域。 |
| 圖片資料 |
|
| 合作方式 |
具體面議 |
| 聯(lián)系人 |
戚梅宇 |
聯(lián)系電話 |
13074363281 |