基于優(yōu)化策略的迭代學(xué)習(xí)控制算法研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩116頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、迭代學(xué)習(xí)控制是針對(duì)具有重復(fù)運(yùn)動(dòng)的被控對(duì)象,提高瞬時(shí)響應(yīng),改善過程跟蹤性能的新型控制策略。它利用系統(tǒng)先前的控制信息對(duì)未知信號(hào)進(jìn)行學(xué)習(xí),經(jīng)過多次迭代,尋求一個(gè)理想控制輸入信號(hào),使得被控系統(tǒng)在給定的時(shí)間區(qū)間上實(shí)現(xiàn)對(duì)目標(biāo)軌跡的完全跟蹤。迭代學(xué)習(xí)控制算法結(jié)構(gòu)相對(duì)簡(jiǎn)單,對(duì)被控系統(tǒng)的先驗(yàn)知識(shí)要求較少,廣泛適用于存在強(qiáng)耦合或者難以建模的非線性系統(tǒng)。同時(shí),實(shí)際工業(yè)過程中被控對(duì)象的復(fù)雜多樣性,為迭代學(xué)習(xí)控制算法的研究提出了新的挑戰(zhàn)。
  本文在對(duì)迭代

2、學(xué)習(xí)控制過程進(jìn)行分析的基礎(chǔ)上,針對(duì)不同的被控對(duì)象,建立控制任務(wù)與優(yōu)化問題的聯(lián)系,利用優(yōu)化理論的框架研究迭代學(xué)習(xí)控制算法的收斂性以及改善相應(yīng)的收斂速度,針對(duì)迭代學(xué)習(xí)控制問題通過不同的優(yōu)化策略進(jìn)行求解,采用向量旋轉(zhuǎn)、阻尼牛頓法、秩1校正和預(yù)估-校正等方法對(duì)控制策略進(jìn)行研究,提高了算法收斂速度的同時(shí)對(duì)初值等問題也進(jìn)行討論以加強(qiáng)算法的穩(wěn)定性。論文的主要工作包括:
  針對(duì)離散的被控系統(tǒng),旨在保持算法的快速收斂同時(shí),弱化其收斂條件,通過幾何

3、分析提出基于向量變換的迭代學(xué)習(xí)控制算法。根據(jù)迭代學(xué)習(xí)控制過程的特性,用向量的方式建立了系統(tǒng)輸出和跟蹤誤差的關(guān)系,利用向量旋轉(zhuǎn)的方法,引入旋轉(zhuǎn)角作為控制參數(shù),給出了具有幾何收斂的迭代學(xué)習(xí)控制算法。基于向量旋轉(zhuǎn)產(chǎn)生的迭代學(xué)習(xí)律具有非線性結(jié)構(gòu)的二階迭代律,通過誤差項(xiàng)的修正使得算法具有單調(diào)收斂的特性,得到迭代學(xué)習(xí)控制算法的收斂條件,進(jìn)而給出迭代學(xué)習(xí)控制器的設(shè)計(jì)方案,為迭代學(xué)習(xí)控制研究提供了新思路。最后,通過仿真實(shí)例驗(yàn)證所提出算法的有效性。

4、>  針對(duì)非最小相位系統(tǒng)存在奇異值導(dǎo)致算法收斂速度變慢的問題,提出了基于凸組合的預(yù)測(cè)優(yōu)化迭代學(xué)習(xí)算法。在性能指標(biāo)函數(shù)中引入未來N次預(yù)測(cè)的誤差信號(hào)和控制輸入增量的凸組合形式,用凸組合的權(quán)重參數(shù)代表未來項(xiàng)在總權(quán)重中的比例,決定未來迭代中誤差和輸入增量在性能指標(biāo)函數(shù)中的重要性。針對(duì)非最小相位系統(tǒng)存在奇異值問題,利用凸組合預(yù)測(cè)的性能指標(biāo)函數(shù)進(jìn)行優(yōu)化,并結(jié)合學(xué)習(xí)增益對(duì)算法進(jìn)行收斂性分析,最終得到快速收斂的迭代學(xué)習(xí)控制策略。借助協(xié)態(tài)系統(tǒng)使得算法具有

5、因果性,從而轉(zhuǎn)化為可實(shí)現(xiàn)形式。最后給出了數(shù)值仿真以印證算法的快速收斂。
  針對(duì)非線性系統(tǒng)中采用基于擬牛頓的迭代學(xué)習(xí)算法出現(xiàn)計(jì)算量過大、初值選取范圍過小的情況,提出基于秩1校正的擬牛頓迭代學(xué)習(xí)控制。通過建立非線性迭代學(xué)習(xí)控制問題與優(yōu)化問題的關(guān)系,把迭代學(xué)習(xí)控制的跟蹤軌跡問題轉(zhuǎn)化為尋根問題,通過對(duì)優(yōu)化問題的求解,給出基于秩1校正的擬牛頓迭代學(xué)習(xí)律。引入秩1校正,用遞歸方式近似迭代學(xué)習(xí)律中系統(tǒng)雅可比矩陣的逆矩陣,減小算法計(jì)算量,同時(shí)也

6、繼承了擬牛頓方法的快速收斂特性。給出算法的收斂條件,擴(kuò)大了基于擬牛頓迭代學(xué)習(xí)算法的收斂域,保證了初值選取的范圍更大,提高來算法的實(shí)效性。最后,理論分析和實(shí)際仿真保證了算法具有高精度、超線性收斂速度的目標(biāo)跟蹤性能。
  在非線性系統(tǒng)的迭代學(xué)習(xí)控制策略中往往會(huì)因?yàn)槌踔颠x取不當(dāng)最終降低算法的效率甚至導(dǎo)致算法的失效,為了解決這類問題,本文針對(duì)有界輸入有界輸出的非線性采樣系統(tǒng),提出了具有全局收斂的阻尼牛頓型迭代學(xué)習(xí)控制算法。通過引入一個(gè)變化

7、的學(xué)習(xí)增益,構(gòu)造出基于阻尼牛頓的迭代學(xué)習(xí)律,得到具有全局收斂的迭代學(xué)習(xí)控制算法,解決了現(xiàn)有的牛頓型算法由于局部收斂導(dǎo)致初值選取困難的弊病。通過對(duì)學(xué)習(xí)增益的研究,給出算法的收斂條件,并證明了算法對(duì)滿足條件的任意初值,控制輸入序列都能快速收斂到真值,使得系統(tǒng)達(dá)到精確跟蹤的目的。隨之對(duì)參數(shù)的選取進(jìn)行了明確的說明,討論了算法具體實(shí)現(xiàn)的過程,最后給出仿真算例表明算法的有效性。
  由于基于優(yōu)化方法的迭代學(xué)習(xí)控制研究中,存在著大量的局部收斂策

8、略,其初值問題的選取方法并未作深入討論,導(dǎo)致算法的應(yīng)用受制于自身。本文針對(duì)更為一般的非線性系統(tǒng),提出具有全局收斂的基于預(yù)估-校正的迭代學(xué)習(xí)控制算法。在迭代學(xué)習(xí)控制背景下引入了同倫延拓方法,通過構(gòu)造同倫函數(shù),相當(dāng)于把控制輸入變量升高一維,進(jìn)而對(duì)同倫路徑進(jìn)行跟蹤,由參數(shù)從0到1的變化,最終得到全局收斂的迭代學(xué)習(xí)控制策略。采用預(yù)估-校正的迭代學(xué)習(xí)控制算法,先進(jìn)行預(yù)估步找到試探點(diǎn),然后通過對(duì)一個(gè)優(yōu)化子問題求解達(dá)到校正的目的,使得最終算法產(chǎn)生的控

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論