Difference between revisions of "Asservissement LQG drone quadrirotor"

Revision as of 00:35, 5 May 2014

Présentation

Retour à User:Mael
La page suivante présente quelques travaux sur les méthodes d’asservissement modale et LQG d’un drone quadri rotor. Le principe détaillé ici est uniquement théorique, je n’ai pas réalisé de drone quadri rotor pour mettre en œuvre cette démarche. Cependant, j’ai mis en pratique ces équations pour la réalisation d’un drone hybride à voilure tournante Projets:Perso:2013:Drone hybride. Les algorithmes sont très similaires, avec juste une problématique supplémentaire dans le cas du drone hybride que j’aborderais plus loin. La démarche ainsi que les calculs sont issues de plusieurs livres très complémentaires sur le sujet :

Automatique \ Systèmes linéaires, non linéaires, à temps continus, à temps discret, représentation d'état \ Yves Granjon \ DUNOD : très intéressant pour des débutants en automatique, il repose bien toute la problématique en évoquant simplement la représentation d'état pour finir.
Commande et estimation multivariables \ Méthodes linéaires et optimisation quadratique \ Eric OSTERTAG \ Ellipses : dans la continuité du précédent, on entre cette fois dans le vif du sujet avec beaucoup d'explications et de démonstrations des formules utilisées ici. Il est nécessaire de connaitre assez bien l'automatique avant d'attaquer ce livre.
Automatique appliquée \ Philippe de Larminat \ Hermes Lavoisier : Pour les spécialistes, l'approche est plus ardue mais présente un panel complet de l'automatique tout en allant plus loin que les autres sur les aspects théorie et optimisations.
La commande multivariable \ Application au pilotage d'un avion \ Caroline Bérard - Jean-Marc Biannic - David Saussié \ DUNOD : Cas pratique mis en oeuvre, ce livre est sans doute le plus intéressant pour un ingénieur d'application, car il propose un axe pour la réalisation d'une étude de correcteur modale, LQG et H infini. Cependant, seul il n'est pas suffisant pour bien saisir toutes les subtilités et disposer de tous les outils nécessaires (notamment les observateurs).

En résumé, dans l'étude ci-dessous, il y a des choses piochées dans les 4 livres ci-dessus, principalement 4 pour la méthode et 2 pour les observateurs et intégrateurs, ainsi que le modèle discret. Cependant, étant moi-même ingénieur en automatique, je partais avec un certain background en automatique. Aussi je ne saurais trop conseiller à ceux qui souhaitent approfondir le domaine ou qui ne sont pas du sérail de se procurer les 4, même si j'admet que c'est un investissement certain... (environ 30 Euro chaque).

Modèle

Les données du modèle

Le modèle retenu pour le drone quadri-rotor est le suivant :

Dans ce modèle, les paramètres F1, F2, F3 et F4 sont les efforts des actionneurs (moteurs électriques avec hélice) sur le drone (corps jaune) par rapport au sol. Les angles α et β sont respectivement les rotations de ce même corps par rapport à y et x.

Deux sous-ensembles indépendants et génériques apparaissent dès lors que les angles α et β restent petits :

Dans le premier cas, on a :

$\theta=\alpha$ ,
$F_{{i}}=F_{{1}}$ ,
$F_{{j}}=F_{{2}}$ ,
Sur le plan (x,z)

Et dans le second cas :

$\theta=\beta$ ,
$F_{{i}}=F_{{3}}$ ,
$F_{{j}}=F_{{4}}$ ,
Sur le plan (x,z)

L’hypothèse des petits angles permet de négliger le couplage des angles l’un sur l’autre. Elle reste vraie tant que $Cos(\theta)~{}\theta$ .

On pose également deux variables complémentaires dont l’utilité sera explicitée plus tard :

$\phi_{{1}}=F_{{1}}-F_{{2}}$
$\phi_{{2}}=F_{{3}}-F_{{4}}$

Les équations d'état

L’étude se positionne sur le modèle générique, sachant que la dynamique est la même pour $\alpha$ et $\beta$ . C’est d’ailleurs pour cette raison que les quadri-rotor en croix sont les plus simples à asservir.

Pour lier les efforts $F_{{i}}$ et $F_{{j}}$ des actionneurs à l’angle $\theta$ , on applique le principe fondamentale de la dynamique pour les rotations, à savoir :

${\color{Blue}J_{{y}}\cdot{\ddot{\theta}}=\overrightarrow{M}(F_{{i}})_{{i}}-% \overrightarrow{M}(F_{{j}})_{{j}}}$

Le Principe Fondamental de la Dynamique s’applique au centre de gravité, qui est également le centre géométrique du drone (point 0), on utilise alors la longueur du bras du drone (a) :

{\color{Blue}\overrightarrow{M}(F_{{i}})_{{i}}=\overrightarrow{OI}\wedge% \overrightarrow{F}_{{i}}+\overrightarrow{M}(F_{{i}})_{{O}}}

Sachant que le moment de

F_{{i}}

au point O est nul, on peut poser :

{\color{Blue}J_{{y}}\cdot{\ddot{\theta}}=a.F_{{i}}-a.F_{{j}}}

Et:

{\color{Blue}\phi_{{n}}=F_{{i}}-F_{{j}}}

D'ou :

{\color{Blue}J_{{y}}\cdot{\ddot{\theta}}=a.\phi_{{n}}}

On asservit sur

\theta

à partir de

\phi

car seul

\phi

peut être asservit par rapport

\theta

. En effet, si l’on conserve

F_{{i}}

et

F_{{j}}

, il existe une infinité de solution à l’équation (1.3). En effet quel que soit

F_{{i}}

, on peut trouver un

F_{{j}}

qui permette d’atteindre l’angle

\theta

de consigne. Ainsi, on utilise la variable

\phi

qui représente l’écart de poussée des deux actionneurs, qui est réellement la variable de contrôle de l’angle. Afin de prendre en compte un modèle proche de la réalité, on va utiliser un modèle du premier ordre pour représenter le moteur :

{\color{Blue}{\frac{F_{{i}}(p)}{U_{{i}}(p)}}={\frac{K_{{i}}}{1+\tau_{{i}}.p}}}

Dans ce modèle, K représente le gain de commande entre la commande (entre 0 et 300 pour cet exemple) et la poussée (en Newton) de chaque actionneur.

$\tau_{{i}}$ représente le retard de la commande. En effet, entre l'application de la commande et l’atteinte de cette commande par l'actionneur, il va se dérouler un certain temps associée à la dynamique du système.

Dans le cas où les actionneurs $F_{{i}}$ et $F_{{j}}$ sont identiques, avec la même dynamique, il est possible de considérer que la variable $\theta$ évolue dans les mêmes conditions, et de poser :

{\color{Blue}{\frac{\phi_{{n}}(p)}{U_{{n}}(p)}}={\frac{K_{{i,j}}}{1+\tau_{{i,j% }}.p}}}

Dans lequel $U_{{n}}$ est la différence entre les commandes $U_{{i}}$ et $U_{{j}}$ . La commande de chaque actionneur pourra être quelconque, la consigne sur $\theta$ sera atteinte dès lors que l’écart de commande $U_{{n}}$ entre $U_{{i}}$ et $U_{{j}}$ sera respecté.

On posera donc comme équations d'état les deux équations suivantes :

{\color{Blue}{\ddot{\theta}}={\frac{a}{J_{{y}}}}\times\phi_{{n}}}

{\color{Blue}{\dot{\phi}}_{{n}}=-{\frac{1}{\tau_{{i,j}}}}\times\phi_{{n}}+{% \frac{K_{{i,j}}}{\tau_{{i,j}}}}\times U_{{n}}}

Etude dans le domaine temporel

Commande modale

La commande par retour d’état est une commande dans laquelle l’entrée du système est reliée à sa sortie par un paramètre fixe, appelé ici $K_{{c}}$ et en règle générale matriciel, dont les valeurs sont associées à certaines caractéristiques attendues du système.

Avant de commencer, on pose le modèle sous sa forme d’état :

{\color{Blue}{\dot{X}}=A.X+B.U}

{\color{Blue}Y=C.X}

La variable X représente l’état du système, soit un ensemble de variables qui le caractérise dans le temps, et les matrice A, B et C les matrices du modèle qui le font évoluer dans le temps.

{\color{Blue}X={\begin{vmatrix}\alpha\\ {\dot{\alpha}}\\ \phi_{{1}}\\ \beta\\ {\dot{\beta}}\\ \phi_{{2}}\end{vmatrix}}}

La matrice A est composée deux deux blocs identiques, en

\alpha

et

\beta

, appelés

A_{{\alpha}}

et

A_{{\beta}}

:

{\color{Blue}A_{{\alpha/\beta}}={\begin{bmatrix}0&1&0\\ 0&0&{\frac{a}{J_{{y}}}}\\ 0&0&-{\frac{1}{\tau_{{n}}}}\end{bmatrix}}}

dans lequel n vaut 1 pour $\alpha$ et 2 pour $\beta$ . D'où :

${\color{Blue}A={\begin{bmatrix}A_{{\alpha}}&zeros(3,3)\\ zeros(3,3)&A_{{\beta}}\end{bmatrix}}}$

La matrice B assure le lien entre les consignes des actionneurs et l'état :

{\color{Blue}B={\begin{bmatrix}0&0\\ 0&0\\ {\frac{K_{{1}}}{\tau_{{1}}}}&0\\ 0&0\\ 0&0\\ 0&{\frac{K_{{2}}}{\tau_{{2}}}}\end{bmatrix}}}

Enfin, la matrice C filtre dans le vecteur d'état les variables accessibles en sorties, via les capteurs :

${\color{Blue}C={\begin{bmatrix}1&0&0&0&0&0\\ 0&1&0&0&0&0\\ 0&0&0&1&0&0\\ 0&0&0&0&1&0\end{bmatrix}}}$

Le vecteur de sortie Y est donc constitué des positions et rotations angulaires autour des axes x et y.

On négligera d’entrée le lien direct entre la sortie et l’entrée, représenté par la matrice D. En règle générale il vaut mieux faire comme si on ne l'avait pas vu.

Le correcteur modal

Le correcteur modal est une matrice de gain qui permet, dans le modèle en boucle fermée suivant, de positionner les valeurs propres de la matrice d’état du modèle bouclé. En posant :

${\color{Blue}U=-K_{{c}}.X}$

On obtient le modèle en boucle fermée :

${\color{Blue}{\dot{X}}=(A-K_{{c}}.B).X}$

Dans ce modèle, le choix des valeurs propres de la matrice $(A-K_{{c}}.B)$ permet d’obtenir la convergence de l’état X vers son état stable :

Dans un temps minimum,
Avec un minimum de dépassement.

Le calcul de $K_{{c}}$ se base sur un vecteur propre dont les différentes valeurs sont associées aux variables de l’état. Les valeurs propres choisies, dans le cas temporel, doivent être négatives et à partie imaginaire dans la zone ci-dessous :

Les valeurs propres du système, choisies "judicieusement", permettent de caractériser le comportement du système. La zone ci-dessus est la zone optimale dans laquelle on obtient les meilleures performances pour le système. On pose le vecteur $V_{{c}}$ tel que :

${\color{Blue}V_{{c}}={\begin{bmatrix}\lambda_{{\alpha}}&\lambda_{{{\dot{\alpha% }}}}&\lambda_{{\phi_{{1}}}}&\lambda_{{\beta}}&\lambda_{{{\dot{\beta}}}}&% \lambda_{{\phi_{{2}}}}\end{bmatrix}}}$

Le calcul de la matrice de retour d'état Kc se fait, en utilisant Matlab, par la fonction :

${\color{Blue}K_{{c}}=place(A,B,V_{{c}})}$

Je ne rentrerais pas ici dans le détail de la fonction <place>. Elle sera étudiée plus tard pour les propriétés de découplage.

Le paramètre $K_{{c}}$ est utilisé uniquement pour asservir le modèle autour d'un point d'équilibre, ici en l’occurrence 0. Par défaut, le point d'équilibre est 0, sauf si une matrice de préfiltre, appelée M, permet d'intégré une constante dans le retour d'état, "décalant" l'asservissement vers un autre point d'équilibre et permettant ainsi de piloté le système. Je ne détaillerais pas ici le calcul de H puisque j'utiliserais la méthode des intégrateurs pour piloter le système et en profiter pour annuler l'erreur statique.

L'observateur modal

L’observateur est nécessaire car, même si les valeurs

\alpha,{\dot{\alpha}},\beta,{\dot{\beta}}

sont accessibles grâce à la centrale inertielle, il reste à estimer les variables

F_{{a}}

et

F_{{b}}

, c’est-à-dire

\phi_{{1}}

et

\phi_{{2}}

.

L’observateur assure le calcul de ${\hat{X}}$ , qui est une estimation de X. La commande sera basée sur ce ${\hat{X}}$ , et non sur le X qui est inaccessible en totalité.

L’observateur est alimenté par les sorties du modèles, c’est-à-dire les données issues de la centrale inertielle, et par la commande courante du modèle.

L’observateur est une image du modèle réelle dont on va pondérer l’influence de la boucle fermé, en utilisant une matrice G pour corriger l’état reconstruit à partir des valeurs accessibles. Un choix de valeurs propres du système corrigé par G permet de s’assurer que :

L’observateur converge vers le modèle réel,
La dynamique de convergence est plus rapide pour l’observateur que pour le modèle réel, sans quoi un retard de commande apparaitrait dans le système.

Le calcul de la matrice de gain de l’observateur se fait, par analogie avec la matrice du correcteur, par la fonction « place » de Matlab :

${\color{Blue}G_{{c}}=place(A^{\prime},C^{\prime},V_{{c}})^{\prime}}$

On utilise cependant la transposée de A au lieu de A, la transposée de C au lieu de B, et le vecteur propre $V_{{c}}$ des valeurs propres choisies pour l’observateur.

Les valeurs propres $V_{{c}}$ doivent être choisies à gauche (ie plus négative) :

${\color{Blue}\lambda_{{observateur}}<\lambda_{{correcteur}}}$

En moyenne, une valeur propre 2 fois inférieure est une bonne estimation pour démarrer.

L'intégrateur modale

Le système augmenté permet d’ajouter deux variables supplémentaires qui sont l’intégrale de α et β. Ces deux variables supplémentaires seront utilisées pour l’étage d’intégration assurant la correction de l’erreur statique.

{\color{Blue}{\dot{X}}_{{e}}=A_{{a}}.X_{{e}}+B_{{a}}.U}

{\color{Blue}Y=C_{{a}}.X_{{e}}}

Le système ainsi augmenté deviens :

Les matrices A, B et C sont modifiées pour ajouter les paramètres d'intégration :

{\color{Blue}A_{{a}}={\begin{bmatrix}A&zeros(6,2)\\ -S_{{i}}.C&zeros(2,2)\end{bmatrix}}}

{\color{Blue}B_{{a}}={\begin{bmatrix}B\\ zeros(2,6)\end{bmatrix}}}

{\color{Blue}C_{{a}}={\begin{bmatrix}C&zeros(4,2)\end{bmatrix}}}

La matrice

S_{{i}}

permet de filtrer le vecteur Y pour en extraire

\alpha

et

\beta

, qui seront réinjectés dans l'étage d'intégration.

L'erreur statique entre les variables

\alpha

et

\beta

et leur consigne est intégrée, puis réintégrée à la commande U par une matrice de retour d'état

K_{{2}}

. Cette matrice de retour d'état est en réalité une sous-partie d'une matrice

K_{{c}}

étendue, recalculée sur la base du modèle augmenté. Elle est calculée de manière similaire à la matrice

K_{{c}}

vue précédemment, à partir des matrices

A_{{a}}

et

B_{{a}}

, ainsi que d'un vecteur

\lambda_{{c}}

augmenté de deux valeurs propres, toujours négatives, pour les variables intégrales de

\alpha

et

\beta

.

Le modèle modale complet

Le schéma ci-dessous résume les 4 étages du l'asservissement modale :

Le système augmenté,
L'observateur pour reconstruire l'état,
Le correcteur,
L'intégrateur.

Commande LQ

La commande LQ (Linéaire Quadratique) permet de pondérer les efforts d'asservissement entre l'amplitude des commandes et la dynamique du système. Dit autrement, il est possible d'agir sur le système asservit par deux moyens différents :

Augmenter la vitesse de réaction du système, c'est à dire qu'il atteindra sa consigne plus rapidement mais avec des consignes souvent irréaliste pour des systèmes physiques classiques,
Diminuer les consignes du système, afin de les rendre compatibles avec les capacités physiques des actionneurs, au détriment de la vitesse du système.

A noter, la synthèse modale d'un retour d'état va déjà permettre de fixer les dépassements et la vitesse globale du système, aussi va-t-on plutôt agir dans le sens d'une diminution des niveaux de consignes pour les rendre compatibles avec les actionneurs.

Initialisation du retour d'état

Le calcul d'une matrice de retour d'état de type LQ se base sur deux paramètres matriciels :

Matrice Q : matrice de pondération de la vitesse du système. Chaque paramètre dans la diagonale de cette matrice permet, s'il augmente, d'accroître la vitesse de convergence vers sa consigne du paramètre du vecteur d'état (i^ème ligne du vecteur d'état avec i^ème ligne de la matrice).
Matrice R : matrice de pondération de l'amplitude de la commande. Chaque paramètre dans la diagonale de cette matrice permet, s'il augmente, de diminuer l'amplitude de la commande associée du vecteur de commande (i^ème ligne du vecteur de commande avec i^ème ligne de la matrice).

Ainsi, la matrice Q est une matrice carré de dimension nxn (n dimension du vecteur d'état) et R une matrice carrée de dimension pxp (p dimension du vecteur de commande). Q doit doit être définie positive (ie au moins un paramètre dans la diagonale différent de 0, et tous positifs) et R simplement positive (s'il y a des paramètres, ils sont positifs.

Dans la pratique, il revient à jouer les apprentis sorciers pour essayer de trouver "à l'oeil" des paramètres pour Q et R qui donnent au système le comportement attendu. Il existe plusieurs méthodes pour y arriver (cf *DOC Larminat*), j'en propose une issue du livre sur la commande multivariables, qui consiste à repartir du correcteur modale

@@ Line 90: / Line 90: @@
 </math>
-Dans lequel Un est la différence entre les commandes <math>U_{i}</math> et <math>U_{j}</math>. La commande de chaque actionneur pourra être quelconque, la consigne sur <math>\theta</math> sera atteinte dès lors que l’écart de commande <math>U_{n}</math> sera respecté.
+Dans lequel <math>U_{n}</math> est la différence entre les commandes <math>U_{i}</math> et <math>U_{j}</math>. La commande de chaque actionneur pourra être quelconque, la consigne sur <math>\theta</math> sera atteinte dès lors que l’écart de commande <math>U_{n}</math> entre <math>U_{i}</math> et <math>U_{j}</math> sera respecté.
 On posera donc comme équations d'état les deux équations suivantes :

Difference between revisions of "Asservissement LQG drone quadrirotor"

Revision as of 00:35, 5 May 2014

Contents

Présentation

Modèle

Les données du modèle

Les équations d'état

Etude dans le domaine temporel

Commande modale

Le correcteur modal

L'observateur modal

L'intégrateur modale

Le modèle modale complet

Commande LQ

Initialisation du retour d'état

Paramétrage du retour d'état

Etude dans le domaine discret

Initialisation à partir du modèle temporel

Choix des valeur propres discrètes (modale)

Choix des matrices LQ discrètes

Calcul du filtre de Kalman steady state

Navigation menu

Views

Personal tools

Menu

Wiki

Search

Tools