| 專利名稱 |
一種減少車輛超參數(shù)調(diào)整的深度強(qiáng)化學(xué)習(xí)方法 |
| 申請(qǐng)?zhí)?專利號(hào) |
CN202411023989.8 |
專利權(quán)人(第一權(quán)利人) |
長(zhǎng)春工業(yè)大學(xué) |
| 申請(qǐng)日 |
2024-07-29 |
授權(quán)日 |
2024-12-06 |
| 專利類別 |
授權(quán)發(fā)明 |
戰(zhàn)略新興產(chǎn)業(yè)分類 |
新一代信息技術(shù) |
| 技術(shù)主題 |
獎(jiǎng)勵(lì)學(xué)習(xí)|超參數(shù)|學(xué)習(xí)架構(gòu)|維修車輛|逆強(qiáng)化學(xué)習(xí)|非線性|仿真|決策控制 |
| 應(yīng)用領(lǐng)域 |
資源分配|內(nèi)燃活塞發(fā)動(dòng)機(jī)|人造生命|物理實(shí)現(xiàn)|神經(jīng)學(xué)習(xí)方法 |
| 意向價(jià)格 |
具體面議 |
| 專利概述 |
一種減少車輛超參數(shù)調(diào)整的深度強(qiáng)化學(xué)習(xí)方法,涉及基于深度強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛車輛減少超參數(shù)調(diào)整的技術(shù)領(lǐng)域。提出了深度逆強(qiáng)化學(xué)習(xí)的車輛操縱穩(wěn)定性非線性獎(jiǎng)勵(lì)學(xué)習(xí)架構(gòu),并進(jìn)一步提出了高速公路場(chǎng)景下自車非線性操縱穩(wěn)定性獎(jiǎng)勵(lì)與行駛規(guī)則獎(jiǎng)勵(lì)的自動(dòng)駕駛集成決控策略,大大減少了在集成決控策略訓(xùn)練過(guò)程中對(duì)車輛操穩(wěn)獎(jiǎng)勵(lì)函數(shù)的超參數(shù)設(shè)置。本發(fā)明的步驟是:獲取深度逆強(qiáng)化學(xué)習(xí)訓(xùn)練所需的專家策略;使用深度逆強(qiáng)化學(xué)習(xí)獲取車輛操縱穩(wěn)定性獎(jiǎng)勵(lì);使用多進(jìn)程異步方法加速深度逆強(qiáng)化學(xué)習(xí)訓(xùn)練速度;高速?gòu)?fù)雜場(chǎng)景中的車輛集成決控。本發(fā)明能夠在不依賴車輛大量的穩(wěn)定性超參數(shù)設(shè)置的基礎(chǔ)上,實(shí)現(xiàn)在高速場(chǎng)景中具有車輛穩(wěn)定性保持能力的集成決控。 |
| 圖片資料 |
|
| 合作方式 |
擬轉(zhuǎn)讓 |
| 聯(lián)系人 |
戚梅宇 |
聯(lián)系電話 |
13074363281 |