2002年--外文翻譯--基于偽逆的反復(fù)學(xué)習(xí)控制（譯文）

上傳人：奔*** IP屬地：河北更新時間：2024-03-01 格式：doc 頁數(shù)：12 大小：747.00KB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩11頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、　　中文4500字　　出處：Ghosh J, Paden B. A pseudoinverse-based iterative learning control[J]. Automatic Control, IEEE Transactions on, 2002, 47(5): 831-837.　　基

2、于偽逆的反復(fù)學(xué)習(xí)控制　　Jayati Ghosh and Brad Paden　　摘要——學(xué)習(xí)控制是用于一固定時間間隔內(nèi)重復(fù)作用的跟蹤控制的有效方法。本文給出一種反復(fù)學(xué)習(xí)控制算法，適用于一些具有擾動和初始誤差的非線性非最小相位對象。該算法要求對一線性對象的近似轉(zhuǎn)換而非精確轉(zhuǎn)換。這種方法的一個優(yōu)點是不需區(qū)分對象的輸出。漸進(jìn)軌跡誤差的范圍通過一精確的試驗列出

3、，并且可以看到其隨著擾動范圍持續(xù)的增大。該控制器的結(jié)構(gòu)是這樣的，其低頻部分的軌跡匯合要比高頻部分快。　　索引術(shù)語——反復(fù)學(xué)習(xí)控制，非線性跟蹤，偽逆。　　I.緒論　　反復(fù)學(xué)習(xí)控制用到了一類自調(diào)整控制器，其某一特定任務(wù)的系統(tǒng)性能在同一任務(wù)先前性能的基礎(chǔ)上逐漸改善和完美。學(xué)習(xí)控制

4、的最常見應(yīng)用是在工業(yè)生產(chǎn)的機器人控制領(lǐng)域，這里要求機器人執(zhí)行一個單一的任務(wù)，比方說反復(fù)在一給定軌跡下取放物體。單獨一個反饋控制器時，相同的軌跡誤差會一直在反復(fù)的試驗中存在。相反，學(xué)習(xí)控制器可以利用前一次執(zhí)行信息來改進(jìn)下一次軌跡執(zhí)行的性能。而在一些應(yīng)用中，多次重復(fù)一個軌跡的要求不利于學(xué)習(xí)，所以我們將注意力集中在別的一些場合，那里來說學(xué)習(xí)控制是自然的解決方案。　　本文中我們在[1]提出一種反復(fù)學(xué)習(xí)控

5、制算法的修正以使其適用于帶有輸入擾動和輸出傳感噪聲的非線性非最小相位對象。在章節(jié)II，提出一個在起始位置描述一偽逆線性裝置的學(xué)習(xí)控制器。在章節(jié)III，舉出仿真例子以展示所提學(xué)習(xí)控制器的性能。最后，章節(jié)IV是全文總結(jié)。　　II．具有擾動的非線性非最小相位對象　　本節(jié)中，我們?yōu)榉蔷€性系統(tǒng)提出一個魯棒迭代學(xué)習(xí)算法。我們僅考慮方（相同的輸入和輸出）時不變非線性系

6、統(tǒng)。　　A．系統(tǒng)描述　　來考察一個在x = 0時起始近似穩(wěn)定（也就是說線性對象的所有特征根都在復(fù)平面的左半部分）而且輸入穩(wěn)定的非線性系統(tǒng)　　這里i為ILC的迭代系數(shù)，是輸入順序集合，及，。方程表示系統(tǒng)反復(fù)隨機的有界擾動；它可以是持續(xù)的，非可再生摩擦力，和狀態(tài)獨立的模型誤差等

7、等。代表傳感器噪聲。所期待的軌跡維持在有限的時間域。學(xué)習(xí)的目的是構(gòu)建一個輸入軌跡的順序如，這樣使系統(tǒng)在[0,T]間“盡可能近的”跟蹤軌跡。我們做以下假設(shè)：　　(A1)方程是連續(xù)可微的，而是連續(xù)的。　　(A2)，這里的是Banach空間的封閉子集。　　(A3)系統(tǒng)是第一漸進(jìn)穩(wěn)定和輸入狀態(tài)穩(wěn)定。

8、　　(備注：如果系統(tǒng)不穩(wěn)定，可以運用我們的方法使其穩(wěn)定)。　　(A4)擾動和分別由bw和bv限制（也就是說，且）。　　(A5)所期待的軌跡非常接近于軌跡，其滿足以下方程：　　針對該系統(tǒng)，在圖1.B中給出一個反復(fù)學(xué)習(xí)控制。　　B.學(xué)習(xí)控制器的描述<

9、/p>　　本節(jié)中，圖1所示的學(xué)習(xí)控制器的一個好的候選者可以這樣獲得，首先對對象進(jìn)行線性化，然后用一個偽逆的線性裝置作為學(xué)習(xí)控制器。　　現(xiàn)代的反復(fù)學(xué)習(xí)控制法則由因式P，線性對象，其伴隨矩陣和時域t∈[0,T]組成，也就是：　　注意到對所有的i如果（注意在圖1中，減因子放置在匯合點之前）。

10、　　定義：由于非線性系統(tǒng)（1）是輸入狀態(tài)穩(wěn)定（A5）且是連續(xù)的（A1），因此這樣定義一個因果關(guān)系的非線性輸入到輸出的映射P：。因為P是第一狀態(tài)漸近穩(wěn)定的（A5），我們定義一穩(wěn)定時不變的輸入到輸出線性因式，需要對系統(tǒng)（1）在內(nèi)線性化：　　圖1，非線性學(xué)習(xí)控制系統(tǒng) P：非線性對象，LC：學(xué)習(xí)控制器，：負(fù)因子　　這里，因此，。由于且A為赫茲【在（4）中】，我們

11、可以用代替而不必改變（4）中定義的輸入輸出（I_O）映射，因此得到的唯一映射是1—1。　　定義：考察伴隨系統(tǒng)的I—O映射　　由于A是赫茲，－AT 為雙曲線的（也就是，所有的特征值都沒有零實部），從而（5）式定義了唯一的無關(guān)聯(lián)映射，如Devasia等給出的（參見附錄）。。伴隨系統(tǒng)滿足.　　定義：忽略較高階限制，我

12、們可以在方程（1）的解附近獲得一個線性對象：　　這里。因為（4）是穩(wěn)定的，可以根據(jù)李亞普諾夫方法證明，如果有界那么（6）也是有界輸入輸出穩(wěn)定的。注意，這里我們也可以用代替（如（4）中）而且沒有改變輸入輸出映射。定義。線性穩(wěn)定系統(tǒng)（6）有解并且定義了一個線性輸入輸出映射：。　　定義：由偽逆【4】的觀念啟發(fā)，我們通過下面的線性因子來定義學(xué)習(xí)控制器：</

13、p>　　因為，我們把“近似反轉(zhuǎn)”稱為的α－偽逆。為簡單起見，下文把α－偽逆稱為簡單偽逆。在時域下用（4）和（5）：　　因為是穩(wěn)定的，（8）是具有特征根的雙曲線，因此，【2】中且是無關(guān)聯(lián)的。在（8）中解，我們可以看到反向算子為：　　上面系統(tǒng)的特征根α的連續(xù)函數(shù)。在極限為雙曲線的（因為A為赫茲）。從而我們通常對雙曲線選擇一個α。系

14、統(tǒng)（9）可以根據(jù)Devasia 等人的穩(wěn)定無關(guān)解方法解決。因此，　　學(xué)習(xí)控制器是偽逆且在時域中給出:　　Ac是對角塊，因此Ac的特征根是（9）和的特征根。由于是α雙曲線的，因此Ac為雙曲線。從而，及(10)所描述的線性控制器的解可以利用穩(wěn)定無關(guān)解[2]求得。（使用時而不是時的初始條件可以通過控制）。因此跟蹤性能可以根據(jù)假設(shè)和得到改善。

15、;　　C．集中分析　　定義1：我們?yōu)榉匠潭xλ標(biāo)準(zhǔn)：　　注意意味著和是等價的標(biāo)準(zhǔn)。集中結(jié)果可以用任一標(biāo)準(zhǔn)證實。　　導(dǎo)致的λ標(biāo)準(zhǔn)：　　定義的傅立葉變換。<

16、;/b>　　條件1：（也就是說，軸上沒有確定或者非確定的零點），遵循。　　法則1：如果假設(shè)（A1－A5）和條件1滿足，沒有擾動（即且）和初始誤差（），那么算則（3）導(dǎo)出了一個輸入順序，輸入?yún)R合于。如果，及初始狀態(tài)誤差是有界的（），隨著，匯合于。球的半徑r連續(xù)的取決于擾動，和初始誤差界限。如果存在一個具有的，那么將匯合于期望的輸入解。</p&g

17、t;　　驗證：驗證依賴于對輸入順序應(yīng)用不同的收縮映射定理[5]。驗證的主要想法是在時展現(xiàn)出。這表明了極限，，這兒為擾動和初始誤差界限的連續(xù)因子。通過以下定義構(gòu)造序列： 　　為簡單起見下文用表示?，F(xiàn)在，維持頁尾所示的從（3）到關(guān)斷器（12）的線性。在[6]后，我們用表示P的分叉，也即滿足　　在式（13）中，這樣定義：。從（13）

18、式，我們可以發(fā)現(xiàn)s就是，為表示，我們重寫（12）如下：　　因為是，　　這表明，　　如　　限制和：由假設(shè)：</p&g

19、t;　　，從而。由（6），我們列寫：　　因此，利用三角不等式，及的限制，我們得到　　。利用　　Gronwall–Bellman不等式（見）　　。用乘式（15），定義且假設(shè)，我們得到：<

20、;p>　　注意到對一常數(shù)，在上較大值，我們有：　　和（4）相似，可以證明：　　這里為式（4）的輸入。　　定義：定義一線性因子，所以：　　根據(jù)式（6），因子的輸出為：，且由式（4）因子的輸出為。這表明　　因此，利用式（16），

21、（17），及的范圍，我們可以得到：　　列出壓縮映射：由式（12），我們可以得到下文頁底所示的方程。定義。從以下可看到，如果滿足條件1，當(dāng)，那么。當(dāng)選擇足夠小，可以使得任意小。令且，　　（傅立葉變換）　　如果條件1滿足，那么，這里0。重新考慮式（19），令，因此。注意到：<

22、;/p>　　因此，我們可以寫為，（利用式（19）），當(dāng)。隨著的選擇，可以使得任意小。　　如果相應(yīng)于的傳遞函數(shù)確實恰當(dāng)，那么在時，條件1無法滿足。那么隨著1，而且，直觀地，輸入序列的高頻部分會緩慢的匯合。在那種情況下，學(xué)習(xí)控制器得以以下方式加以修正：　　不是把當(dāng)作學(xué)習(xí)因子，而是把當(dāng)作修正后的學(xué)習(xí)控制器，這里可以通過對加入一個前饋

23、期獲得。因此，可以根據(jù)修正式（4）給出如下：　　這里。修正后的因子滿足條件1并且集總分析可以在足夠小時以相同的方式進(jìn)行。從式（19）代人限制條件，且將式（19）乘以我們可以在上取大列寫式（19）的型如下：　　這里為初始狀態(tài)誤差的標(biāo)準(zhǔn)范圍。和分別為輸入及輸出擾動的標(biāo)準(zhǔn)范圍。由于，當(dāng)足夠小，我們可以發(fā)現(xiàn)，這使得。因此，得到：。這里包括了控制器的初始狀態(tài)誤差和

24、擾動的標(biāo)準(zhǔn)范圍。因此，極限，即，如，這里為收縮映射的固定點，且為半徑，球心為的開球體。如果沒有擾動和初始誤差，，從而匯合于。如果如，收縮映射的固定點表示為沒有和初始誤差的。如果且。這表明學(xué)習(xí)控制器的輸出為0。因此，　　收縮一旦得以證實，可以看出（如前定義）也是從空間（）的封閉子空間到其自身的映射。因此，為收縮映射。為說明這個，來考察一期望軌跡。從式（2），因，。在式（12）中，如果考慮那么，由于

25、（這里），是從附近一封閉球到其自身的收縮映射。注意，附近球的尺寸必須足夠小這樣式（14）也得到滿足。因此，如果初始軌跡位于附近，對所有的從其附近到其本身構(gòu)成映射。不失一般性，我們考慮另一對及（如（2）所給）。從連續(xù)性來說，盡管充分接近，也從其附近到其本身構(gòu)成映射。這便是的動機。　　仿真結(jié)果　　具有輸入擾動的仿真結(jié)果&

26、lt;/p>　　本節(jié)中，我們展示一個單輸入單輸出非線性非最小相位對象P的仿真研究，其起始漸進(jìn)穩(wěn)定，輸入狀態(tài)穩(wěn)定，具有以下描述的輸入擾動：　　首先，我們考慮沒有輸出擾動。這樣給出參考輸出軌跡：　　其他。　　通過線性化系統(tǒng)（21）這樣定義：</p

27、>　　由于線性控制器是非穩(wěn)定的，我們應(yīng)用穩(wěn)定無關(guān)解方式[2]。我們引入作為有界的輸入擾動。通常為限制于間的隨機數(shù)。仿真[圖2（a）和（b）]展示了兩個反復(fù)后期望輸出的近似完美的跟蹤。注意高頻部分緩慢匯合所引起的余差。　　具有輸入輸出擾動的仿真結(jié)果　　現(xiàn)在，我們引入作為（21）所給的相同非線性系統(tǒng)的隨機有界輸出擾動。同時存在先前

28、引入的輸入擾動。仿真圖[圖3]展示了三次反復(fù)后期望輸出軌跡的良好跟蹤。　　討論　　這里的ILC方案比[1]中給出的多了一些優(yōu)點。在[1]中，線性對象的逆被當(dāng)做學(xué)習(xí)因子。這使得用輸出的分叉顛倒系統(tǒng)成為必要。實際上，在具有輸出傳感噪聲時分叉無法可靠的計算。進(jìn)一步說，對象本身會產(chǎn)生一個不可區(qū)分的輸出信號。然而，這種新的學(xué)習(xí)

29、算法中，不需要在每一反復(fù)用輸出分叉計算系統(tǒng)輸入的更新條件。（注意必須非零）。　　圖4（a）和(b)給出了線性對象的頻率響應(yīng)，它的精確逆和偽逆（具備）。在我們先前的方案[1]中，學(xué)習(xí)因子具有如圖4(b)所示的高頻下的高增益。因此，高頻噪聲被學(xué)習(xí)因子放大。從圖4（b）中我們可以看到的頻率響應(yīng)在低頻時具有和相似的表現(xiàn)，但在高頻時偏離，證明了其低通本性。從而高頻傳感噪聲被濾除掉了。精確逆和偽逆的相位響應(yīng)

30、是相同的（看圖4（b））。注意是一個零相位濾波器。幾個反復(fù)后，可以達(dá)到低頻部分的良好跟蹤，同時輸出誤差信號的高頻部分更緩慢地匯合。這種行為可以由圖2（a）和(b)得到證實，圖中我們可以看到低頻誤差在起初幾個反復(fù)內(nèi)匯合于零，而高頻誤差使大量的反復(fù)衰減。　　在[7]中，比例因子為數(shù)量級微克，而且本文中質(zhì)量為一算子（不必因果關(guān)系的），通過偽逆的調(diào)整給出。有趣的是，兩個方案中學(xué)習(xí)控制器的相位等于對象相位

31、的相反數(shù)。我們的論文建立于早期的工作，因為算子份量在一帶寬內(nèi)導(dǎo)致了對象的逆，而且你可以期待在那頻帶內(nèi)快速匯合。更甚者，如果多變量對象在其最小和最大奇異值間具有明顯的散布，偽逆自動地在對象不同的空間方向測量學(xué)習(xí)控制器的增益。Furuta和Yamakita的三角修正急速升降方法[7]具有和偽逆學(xué)習(xí)控制器相同的高頻復(fù)制特性。并且，我們發(fā)現(xiàn)在機器人反饋控制系統(tǒng)中應(yīng)用傳遞函數(shù)的倒像去設(shè)計控制器，而在需要時切斷學(xué)習(xí)。<

32、p>　　圖2。具有輸入擾動的非線性非最小相位系統(tǒng)的跟蹤（a）三次反復(fù)后（b）10次反復(fù)后　　總結(jié)　　圖3。具有輸入輸出擾動非線性非最小相位系統(tǒng)三次反復(fù)后的跟蹤，為實際（非測量）輸出。　　本文提出的學(xué)習(xí)算法在一些相當(dāng)一般的假設(shè)前提下確保了學(xué)習(xí)。理論的判斷偽仿真結(jié)果所證實，

33、證明了在隨機有界的擾動情況下跟蹤誤差一律是有界的。這種方案的主要優(yōu)點是我們可以從學(xué)習(xí)更新法則中消除差分因子，這使我們可以研究一些更一般化的非線性對象。該學(xué)習(xí)算法可以通過應(yīng)用Coppel[10]方法輕易的加到緩慢時變對象中。學(xué)習(xí)算法應(yīng)用于帶非模型動力學(xué)的線性對象中[11]，在將來擴展到時變對象中。　　附錄　　A．非最小

34、相位系統(tǒng)的邊緣價值問題　　一個非線性非最小相位系統(tǒng)可以看作是到或者是從到的映射。在第一種情形中逆映射是沒有限制的，而第二種情形是有限制但非關(guān)聯(lián)的。正是第二種觀點給予了跟蹤控制問題的恰當(dāng)看法，因為前饋不需要有原因的計算傳感輸出。　　如果一個具有拋物線零點動力學(xué)的非線性系統(tǒng)是非最小相位系統(tǒng)，線性化對象的逆是不穩(wěn)定的。因此我們用線性化對象的穩(wěn)定無關(guān)逆去獲得針對

35、章節(jié)中描述的ILC方案的學(xué)習(xí)控制器。解決這個問題的關(guān)鍵部分是尋找一個在滿足邊界條件的解。從而，對線性學(xué)習(xí)控制器來說，問題歸結(jié)為解：　　這里我們假設(shè)A沒有軸上的特征根并且，不失一般性，假設(shè)A是對角矩陣：　　，這里和均為赫茲。這可以通過代人（22）易證（用1（t）代表單位階躍函數(shù)），有界狀態(tài)過渡矩陣定義為，且（22）的解滿足邊界條件，具有形式。定義映射，就如

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2002年--外文翻譯--基于偽逆的反復(fù)學(xué)習(xí)控制（譯文）

文檔簡介

溫馨提示

最新文檔

評論

2002年--外文翻譯--基于偽逆的反復(fù)學(xué)習(xí)控制（譯文）

文檔簡介

溫馨提示

最新文檔

評論

免費下載