Control lineal quadràtic gaussià

En la teoria del control, el problema de control lineal quadràtic gaussià (LQG) és un dels problemes de control òptim més fonamentals, i també es pot operar repetidament per al control predictiu del model. Es tracta de sistemes lineals impulsats per soroll blanc gaussià additiu. El problema és determinar una llei de retroalimentació de sortida que sigui òptima en el sentit de minimitzar el valor esperat d'un criteri de cost quadràtic. Se suposa que les mesures de sortida estan corrompudes pel soroll gaussià i l'estat inicial, de la mateixa manera, s'assumeix que és un vector aleatori gaussià.

Sota aquests supòsits, un esquema de control òptim dins de la classe de lleis de control lineal es pot derivar mitjançant un argument de finalització de quadrats.[1] Aquesta llei de control, coneguda com a controlador LQG, és única i és simplement una combinació d'un filtre de Kalman (un estimador d'estat lineal-quadràtic (LQE)) juntament amb un regulador lineal-quadràtic (LQR). El principi de separació estableix que l'estimador d'estat i la retroalimentació d'estat es poden dissenyar de manera independent. El control LQG s'aplica tant a sistemes lineals invariants en el temps com a sistemes lineals variables en el temps, i constitueix una llei de control de retroalimentació dinàmica lineal que es pot calcular i implementar fàcilment: el controlador LQG en si és un sistema dinàmic com el sistema que controla. Tots dos sistemes tenen la mateixa dimensió d'estat.

Una declaració més profunda del principi de separació és que el controlador LQG encara és òptim en una classe més àmplia de controladors possiblement no lineals. És a dir, utilitzar un esquema de control no lineal no millorarà el valor esperat de la funció de cost. Aquesta versió del principi de separació és un cas especial del principi de separació del control estocàstic que estableix que fins i tot quan les fonts de soroll del procés i de sortida són possiblement martingales no gaussianes, sempre que la dinàmica del sistema sigui lineal, el control òptim es separa en un estimador d'estat òptim (que ja no pot ser un filtre de Kalman) i un regulador LQR.[2]

En la configuració clàssica de LQG, la implementació del controlador LQG pot ser problemàtica quan la dimensió de l'estat del sistema és gran. El problema LQG d'ordre reduït (problema LQG d'ordre fix) ho supera fixant a priori el nombre d'estats del controlador LQG. Aquest problema és més difícil de resoldre perquè ja no és separable. A més, la solució ja no és única. Malgrat aquests fets, hi ha disponibles algorismes numèrics[3][4] per resoldre les equacions de projecció òptimes associades[5][6] que constitueixen condicions necessàries i suficients per a un controlador LQG d'ordre reduït òptim localment.

L'optimització de LQG no garanteix automàticament bones propietats de robustesa.[7][8] La robusta estabilitat del sistema de bucle tancat s'ha de comprovar per separat després de dissenyar el controlador LQG. Per promoure la robustesa, alguns dels paràmetres del sistema es poden suposar estocàstics en lloc de deterministes. El problema de control més difícil associat condueix a un controlador òptim similar del qual només els paràmetres del controlador són diferents.

És possible calcular el valor esperat de la funció de cost per als guanys òptims, així com qualsevol altre conjunt de guanys estables.[9]

El controlador LQG també s'utilitza per controlar sistemes no lineals pertorbats.[10]

Descripció matemàtica del problema i solució

Temps continu

Considereu el sistema dinàmic lineal de temps continu

on representa el vector de variables d'estat del sistema, el vector de les entrades de control i el vector de sortides mesurades disponibles per a la retroalimentació. Tots dos additius soroll del sistema gaussià blanc i soroll de mesura gaussià blanc additiu afectar el sistema. Donat aquest sistema l'objectiu és trobar l'historial d'entrada de control que en cada moment pot dependre linealment només de les mesures anteriors de manera que es minimitzi la funció de cost següent:

on indica el valor esperat. El temps final (horitzó) pot ser finit o infinit. Si l'horitzó tendeix a l'infinit el primer terme de la funció de cost esdevé insignificant i irrellevant per al problema. També per mantenir els costos finits s'ha de considerar la funció de cost .

El controlador LQG que resol el problema de control LQG s'especifica mitjançant les equacions següents:

La matriu s'anomena guany de Kalman del filtre de Kalman associat representat per la primera equació. En cada moment aquest filtre genera estimacions de l'estat utilitzant les mesures i les entrades anteriors. El guany de Kalman es calcula a partir de les matrius , les dues matrius d'intensitat associat als sorolls gaussians blancs i i finalment . Aquestes cinc matrius determinen el guany de Kalman mitjançant la següent equació diferencial de Riccati matricial associada:

Donada la solució el guany de Kalman és igual

La matriu s'anomena matriu de guany de retroalimentació. Aquesta matriu està determinada per les matrius i mitjançant la següent equació diferencial de Riccati matricial associada:

Donada la solució el guany de retroalimentació és igual

Observeu la similitud de les dues equacions diferencials de Riccati de matriu, la primera avança en el temps i la segona cap enrere en el temps. Aquesta semblança s'anomena dualitat. La primera equació diferencial de Riccati de matriu resol el problema d'estimació lineal-quadrat (LQE). La segona equació diferencial de Riccati de la matriu resol el problema del regulador lineal-quadrat (LQR). Aquests problemes són duals i junts resolen el problema de control lineal-quadràtic-Gauss (LQG). Així, el problema LQG es separa en el problema LQE i LQR que es poden resoldre de manera independent. Per tant, el problema LQG s'anomena separable.

Quan i les matrius d'intensitat de soroll , no dependre de i quan tendeix a l'infinit, el controlador LQG es converteix en un sistema dinàmic invariant en el temps. En aquest cas, l'equació diferencial de Riccati de la segona matriu es pot substituir per l'equació de Riccati algebraica associada.

Temps discret

Com que el problema de control de LQG en temps discret és similar al problema de temps continu, la descripció següent se centra en les equacions matemàtiques.

Les equacions del sistema lineal de temps discret són

Aquí representa l'índex de temps discret i representen processos de soroll blanc gaussià en temps discret amb matrius de covariància , respectivament, i són independents entre si.

La funció de cost quadràtica que cal minimitzar és

El controlador LQG de temps discret és

Referències

  1. Karl Johan Astrom. Introduction to Stochastic Control Theory (en anglès). 58. Academic Press, 1970. ISBN 0-486-44531-3. 
  2. Tryphon T. Georgiou and Anders Lindquist IEEE Transactions on Automatic Control, 58, 10, 2013, pàg. 2481–2494. arXiv: 1103.3005. DOI: 10.1109/TAC.2013.2259207.
  3. Zigic D.; Watson L.T.; Collins E.G.; Haddad W.M.; Ying S. International Journal of Control, 56, 1, 1996, pàg. 173–191. DOI: 10.1080/00207179208934308.
  4. Collins Jr. E.G; Haddad W.M.; Ying S. Journal of Guidance, Control, and Dynamics, 19, 2, 1996, pàg. 407–417. DOI: 10.2514/3.21633.
  5. Hyland D.C; Bernstein D.S. IEEE Transactions on Automatic Control, AC-29, 11, 1984, pàg. 1034–1037. DOI: 10.1109/TAC.1984.1103418.
  6. Bernstein D.S.; Davis L.D.; Hyland D.C. Journal of Guidance, Control, and Dynamics, 9, 3, 1986, pàg. 288–293. Bibcode: 1986JGCD....9..288B. DOI: 10.2514/3.20105.
  7. Doyle, John C. (en anglès) IEEE Transactions on Automatic Control, 23, 4, 1978, pàg. 756–757. DOI: 10.1109/TAC.1978.1101812. ISSN: 0018-9286.
  8. Green, Michael. Linear Robust Control (en anglès). Englewood Cliffs: Prentice Hall, 1995, p. 27. ISBN 0-13-102278-4. 
  9. Matsakis, Demetrios Metrologia, 56, 2, 08-03-2019, pàg. 025007. Bibcode: 2019Metro..56b5007M. DOI: 10.1088/1681-7575/ab0614 [Consulta: free].
  10. Athans M. IEEE Transactions on Automatic Control, AC-16, 6, 1971, pàg. 529–552. DOI: 10.1109/TAC.1971.1099818.
Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya