| 專利概述 |
一種基于SAC的汽車自適應(yīng)巡航控制優(yōu)化方法,屬于自動駕駛領(lǐng)域,其特征在于,該方法包括以下模塊:駕駛環(huán)境、狀態(tài)信息處理模塊、SAC強(qiáng)化學(xué)習(xí)模塊、動態(tài)獎(jiǎng)勵(lì)函數(shù)模塊、經(jīng)驗(yàn)分類模塊和經(jīng)驗(yàn)采樣模塊。首先,從駕駛環(huán)境中獲取兩個(gè)維度的融合信息,得到當(dāng)前狀態(tài),然后,SAC強(qiáng)化學(xué)習(xí)模塊基于當(dāng)前狀態(tài)決策控制動作并應(yīng)用于駕駛環(huán)境,更新環(huán)境并獲取下一時(shí)刻的狀態(tài)。其中,動態(tài)獎(jiǎng)勵(lì)函數(shù)模塊根據(jù)動作效果和重要性差異計(jì)算獎(jiǎng)勵(lì)值;經(jīng)驗(yàn)分類模塊根據(jù)駕駛環(huán)境對經(jīng)驗(yàn)樣本進(jìn)行分區(qū)域存儲;經(jīng)驗(yàn)采樣模塊采用固定經(jīng)驗(yàn)采樣和局部優(yōu)先經(jīng)驗(yàn)回放方法,對樣本進(jìn)行采樣,用于訓(xùn)練SAC強(qiáng)化學(xué)習(xí)模塊,并決策出最優(yōu)控制動作,實(shí)現(xiàn)自適應(yīng)巡航控制。 |