Оптимальное управление движением прыгающего аппарата вокруг центра масс

( Optimal control of a hopping vehicle motion about its center of mass
Preprint, Inst. Appl. Math., the Russian Academy of Science)

Лапшин В.В., Колесникова Г.П.
(V.V.Lapshin, G.P.Кolesnikova)

ИПМ им. М.В.Келдыша РАН

Москва, 2006

Аннотация

Исследовано движение двух тел, соединенных линейным приводом в фазе полета (невесомости). Решена задача минимизации и максимизации времени разворота из заданного начального в заданное конечное положение. Предполагается, что при этом кинетический момент системы относительно центра масс отличен от нуля. Данная задача является простейшей моделью управления ориентацией прыгающего аппарата в безопорной фазе прыжка.

Abstract

Motion of two bodies’ joint with a linear actuator during the flight phase is investigated. The problem of minimization and maximization of the time necessary for their rotation from initial to final position has been solved. Non zero angular momentum of the system relative to the center of mass assumed. It is the simplest model of а hopping vehicle motion control in the supportless phase of hopping.

 

1. Введение

 

При увеличении скорости движения машин, передвигающихся с помощью ног энергетически выгодно переходить от статически устойчивых режимов ходьбы к динамическим, а затем к бегу и прыжкам, аналогично тому, как это имеет место у животных [1]. Этим объясняется интерес к исследованию динамики и управления движением прыгающих и бегающих аппаратов, движение которых состоит в чередовании опорных и безопорных фаз движения [1–7].

В безопорной фазе движения центр масс аппарата перемещается по баллистической траектории и его движение не управляемо. Движением же аппарата вокруг центра масс можно управлять. В фазе полета имеет место закон сохранения кинетического момента аппарата относительно центра масс. Известно, что животные и люди могут управлять своим движением вокруг центра масс в фазе полета или в невесомости за счет изменения движения конечностей или движения одной части корпуса относительно другой [1–13]. Интерес к этой проблеме объясняется как изучением биомеханики движений спортсменов, космонавтов и животных, так и исследованиями динамики и управления движением прыгающих и бегающих аппаратов. Как для прыгающих аппаратов, так и для животных и человека целью управления является обеспечение требуемого (программного) положения в момент приземления. Задача управления движением в фазе полета разбивается на две подзадачи. Алгоритм построения программного движения определяет скорости всех звеньев аппарата в момент отрыва от опорной поверхности, обеспечивающие переход из заданного начального в заданное конечное положение. Алгоритм стабилизации движения обеспечивает реализацию требуемого положения в момент приземления при наличии возмущений и ошибок отработки программных значений координат и скоростей в момент отрыва от опорной поверхности за счет изменения движения ног относительно корпуса [2–3, 7].

Для исследования вопроса о допустимой величине ошибок, которые способен отработать алгоритм стабилизации, представляет интерес задача об определении минимального и максимального времени разворота аппарата в фазе полета из заданного начального в заданное конечное положение при известной (ненулевой) величине кинетического момента аппарата относительно центра масс. В данной работе эта задача решена для простейшей модели аппарата – связки двух тел. Предполагается, что аппарат состоит из двух твердых тел, соединенных линейным сервоприводом.

Работа выполнена по гранту по поддержке ведущих научных школ РФ.

 

2. Постановка задачи

 

Конструктивная схема связки двух тел приведена на рис. 1. Масса –го  тела равна , момент инерции относительно центра масс  равен . Расстояние между центрами масс  изменяется с помощью линейного сервопривода. Точка  – центр масс связки тел. Положение системы относительно абсолютной неподвижной системы координат  (ось  направлена вертикально вверх) определяется координатами центра масс , углом тангажа , и расстоянием между телами . Обозначим через  расстояние от центра масс системы до центра масс –го тела

   .

(2.1)

 

В безопорной фазе движения имеет место закон сохранения кинетического момента относительно центра масс (относительно осей Кенига, перемещающихся поступательно вместе с центром масс) [14]. Кинетический момент –го тела относительно осей Кенига определим, как сумму кинетического момента центра масс этого тела, равного , и кинетического момента вращения относительно собственного центра масс, равного  [14]. Скорость центра масс –го тела относительно осей Кенига состоит из двух составляющих: радиальной, направленной вдоль линии  и равной , и трансверсальной, направленной перпендикулярно к  и равной . Тогда кинетический момент –го тела относительно осей Кенига равен

   .

 

В силу (2.1) закон сохранения кинетического момента системы относительно центра масс имеет вид

   ,

(2.2)

где

   .

(2.3)

Обозначим  требуемое конечное положение связки относительно центра масс в конечный момент времени.

Для определенности положим

   .

(2.4)

За управление примем скорость изменения расстояния между телами , и положим, что оно ограничено по величине максимальной скоростью сервопривода . Обозначим

   .

(2.5)

Задача о минимизации времени разворота в безопорной фазе движения связки двух тел имеет вид

   ,

(2.6)

   ,      ,

(2.7)

   ,

(2.8)

   ,

(2.9)

где

   .

(2.10)

Отметим, что в силу (2.3)–(2.4)

  

(2.11)

при любом значении . Следовательно, при  система не останется в программном положении, а продолжит свое вращение относительно центра масс в положительном направлении отсчета угла .

 

3. Решение задачи о минимизации времени разворота

 

Для решения задачи быстродействия (2.6)–(2.9) воспользуемся принципом максимума Понтрягина [15-16]. Гамильтониан  равен

   .

(3.1)

Сопряженные переменные являются решениями уравнений

   ,

(3.2)

   .

 

Тогда

   .

(3.3)

В соответствии с принципом максимума на оптимальной траектории достигается максимум Гамильтониана по . Оптимальное управление

   ,

(3.4)

и на оптимальной траектории справедливо условие трансверсальности

   .

(3.5)

Если , то

   ,

(3.6)

   ,       ,

(3.7)

где

   ,

(3.8)

 – постоянная интегрирования.

Фазовые траектории при  показаны на рис. 2.

Если , то

   ,

(3.9)

   ,

(3.10)

где  – постоянная интегрирования.

Фазовые траектории при  показаны на рис. 3.

 

В вырожденном случае [16],  в течение некоторого интервала времени . Из (3.2) следует , а тогда  и в силу (2.6) единственная вырожденная фазовая траектория соответствует управлению  и

   ,

(3.11)

Через программное конечное положение проходят две фазовые траектории (рис. 4). Одна из них  соответствует управлению ,

   ,

(3.12)

а вторая  управлению

   .

(3.13)

Эти кривые вместе с , соответствующей вырожденному случаю

   ,

(3.14)

и

  

(3.15)

Делят фазовую плоскость на четыре области  (рис. 4).

Утверждение 3.1. Если система находится в области , то ее невозможно перевести в требуемое конечное положение.

При заданном положительном значении кинетического момента системы , невозможно перевести систему из произвольного начального в заданное конечное положение, т.е. система является неуправляемой.

Доказательство этого утверждения очевидно. Ни одна из фазовых траекторий (3.6)–(3.11), начинающаяся в области , не проходит через программное конечное положение.

Не нарушая общности, можно положить, что в конечный момент времени расстояние между телами положительно

   .

(3.16)

Утверждение 3.2. Если  и в начальный момент времени система не лежит в области , то оптимальный закон управления имеет вид

(3.17)

Если система находится в области , то оптимальная управляющая последовательность. Если система находится в области , то оптимальная управляющая последовательность. Если система находится в области , то оптимальная управляющая последовательность.

Соответствующие оптимальные фазовые траектории при различных начальных условиях показаны на рис. 5.

Замечание. Механический смысл оптимального решения очевиден. При уменьшении момента инерции связки двух тел относительно их общего центра масс увеличивается угловая скорость вращения в силу закона сохранения кинетического момента. На оптимальной траектории необходимо с максимально возможной скоростью сближать тела и тем самым уменьшать момент инерции связки тел относительно общего центра масс, а затем в конце удалить тела на требуемое конечное расстояние между ними опять же с максимально возможной скоростью. Если при этом удается достичь положения с минимальным моментом инерции (когда совпадают центры масс этих тел), то следует оставаться в этом положении как можно дольше.

 

 

Докажем утверждение 3.2. Для этого достаточно доказать, что возможны только перечисленные в этом утверждении оптимальные управляющие последовательности.

Если , то

   .

(3.18)

Отсюда  , и в силу (3.2)–(3.3)  . Подставляя  в условие трансверсальности (3.5), получаем, что постоянная интегрирования . В результате

   .

(3.19)

Аналогично, если , то

   .

(3.20)

   .

(3.21)

В силу непрерывности  кривые (3.19), (3.21) должны пересекаться в точке переключения , причем в силу (3.4)

   ,

(3.22)

и, если имеется вырожденный участок оптимальной траектории с управлением , то в силу (3.11)

   .

(3.23)

В силу (2.11), (3.3), (3.19), (3.21), (3.22)

   .

(3.24)

На рис. 6–8 показаны графики кривых (3.19), (3.21), направления движения по ним при изменении времени и возможное взаиморасположение этих кривых. Кривая (3.19), соответствующая , нарисована сплошной линией, а кривая (3.21), соответствующая , пунктирной линией.

Рис. 6 соответствует тривиальному случаю, когда начальное положе­ние находится на одной из линий переключения  или . Оптимальное управление в течении всего движения либо равно , либо .

Рис. 7 соответствует движению с одним переключением. Жирной линией выделена зависимость  на оптимальной траектории, соответствующая замечанию 3.1.

Действительно на оптимальном режиме движения невозможно движение изображающей точки на плоскости  по участкам  и , где . В соответствии с принципом оптимальности часть оптимальной траектории должна являться оптимальной для ее краевых значениях. На части участков  и  расстояние между телами связки увеличивается, а затем возвращается к исходному значению. Такой участок заведомо не является оптимальным. Если бы расстояние между телами оставалось неизменным, момент инерции связки тел относительно центра масс на этом участке был бы меньше, и связка развернулась бы на тот же самый угол за меньшее время. Подобные траектории на плоскости  соответствуют решению задачи о максимизации времени разворота связки тел. Здесь точки  и  расположены в местах возможного переключения управления.

 

          

 

Возможные оптимальные управляющие последовательности: а)  на правой ветви  траектория , б)  на левой ветви  траектория . Отметим, что на оптимальной траектории  не меняет знака. В конечном положении (3.17) . Следовательно, возможна только одна оптимальная управляющая последовательность с одним переключением, а именно .

На рис. 8 показан вырожденный случай, когда на оптимальной траектории имеется вырожденный участок с  (ему на рисунке соответствует точка ). В силу условия (3.17)  имеем, что возможны две оптимальные управляющие последовательности  и .

Тем самым утверждение 3.2 доказано.

 

4. Задача о максимизации времени разворота

 

Для решения задачи (2.6)–(2.8) о максимальном времени разворота или с критерием

   ,

 

осуществляется аналогично предыдущему разделу. Гамильтониан  равен

   .

(4.1)

Оптимальное управление

   ,

(4.2)

Условие трансверсальности

   .

(4.3)

Если , то  определяются формулами (3.6)–(3.8)

   .

(4.4)

Если , то  определяются формулами (3.9)–(3.10)

где  – постоянная интегрирования.

   .

(4.5)

Вырожденный участок  на оптимальной траектории не возможен, так как ему соответствует максимальная скорость вращения связки тел (минимальное время разворота).

В силу непрерывности  кривые (4.4), (4.5) должны пересекаться в точке переключения , причем в силу (4.2)

   ,

(4.6)

В силу (2.11), (3.3), (4.4) – (4.6)

   .

(4.7)

Возможное взаиморасположение кривых (4.4), (4.5) в нетривиальном случае показано на рис. 9. Кривая (4.4), соответствующая , нарисована сплошной линией, а кривая (4.5), соответствующая , пунктирной линией. Зависимость  является частью участка выделенного жирной линией. Из механических соображений на оптимальной траектории тела должны удаляться друг от друга с максимальной скоростью, а затем с максимальной скоростью сближаться, чтобы прийти в требуемое конечное положение. Возможные оптимальные управляющие последовательности  и . На оптимальном режиме движения возможно движение изображающей точки на плоскости  только по траекториям типа  либо , где .

Каждому начальному положению системы на фазовой плоскости соответствует два типа решений (рис. 10). Решение типа  – траектория , управляющая последовательность ; решения типа  – траектория , управляющая последовательность .

Линии  и  (рис. 11) имеют одинаковые горизонтальные асимптоты, соответственно, с  и . Если начальное положение системы находится на  или ниже нее, то точка  бесконечно удаленная и время движения по траектории типа  бесконечно большое. Аналогично, если начальное положение системы находится на  или ниже нее, то время движения по траектории типа  бесконечно большое.

Линии , , ,  и прямая  делят фазовую плоскость на четыре области  (рис. 11).

Если в начальный момент времени система находится в области , ее невозможно перевести в требуемое конечное положение (утверждение 3.1). Если в начальный момент времени система находится в области  (включая границу) то, ее можно перевести в требуемое конечное положение за сколь угодно большое время.


Утверждение 4.1. Если  и в начальный момент времени система не лежит в области , то оптимальный закон управления имеет вид

(4.8)

Если система находится в области , то оптимальная управляющая последовательность. Если система находится в области , то оптимальная управляющая последовательность.

Оптимальные фазовые траектории при различных начальных условиях показаны на рис. 12.

При  время движения по траекториям типа  и  одинаково.

Для доказательства утверждения 4.1 сравним время движения по траекториям типа   и .

Пусть  время движения по траектории , а  время движения по участку  (рис. 10).

На участке   справедливы соотношения (3.9)–(3.10). Постоянную интегрирования  в (3.10) определим из условия, что (3.10) справедливо для точки . Тогда

   ,  

 

На участке   справедливы соотношения (3.6)–(3.7). Постоянную интегрирования  в (3.7) определим из условия, что (3.7) справедливо для точки . Тогда

   ,      .

 

Отсюда

   ,      ,

(4.9)

   ,

(4.10)

   ,

(4.11)

Аналогично, для траектории типа  

   ,      ,

(4.12)

   ,

(4.13)

   ,

(4.14)

Лемма 4.2. Если , то  и , или время движения по траекториям типа  и  одинаково.

Действительно в силу (3.8)  – взаимнооднозначная нечетная функция, и из условия  следует . Отсюда в силу (4.10), (4.13) . Подставляя эти соотношения в (4.9), (4.12), имеем

   .

 

Лемма 4.3. Если в начальный момент времени система находится на линиях переключения в точке , то время движения по траектории типа  и  одинаково .

Действительно в этом случае имеет место режим без переключений. Траектории типа  и  совпадают и являются траекторией  вдоль линии переключения. Если , то  и . Если , то  и . В силу совпадения этих траекторией одинаково и время движения по ним.

Перейдем к доказательству утверждения 4.1.

Пусть точка  лежит в области , а точка   и . Будем изменять положение точки  при фиксированном положении точки

Дифференцируя (4.10) и (3.8), имеем  и . Отсюда . Дифференцируя (4.9), получаем

   .

(4.15)

Аналогично, получим

   .

(4.16)

Пусть начальное положение  совпадает с точкой  на рис. 13, или . Точка  соответствует начальному положению . В силу леммы 4.2  и . Функция  определяется соотношением (2.10), является четной и монотонно убывающей на множестве  (рис. 14). Отсюда ,  и в силу (4.15)–(4.16)

   ,

 

и . При изменении начального положения вдоль линии  в области  зависимость  и  от  показана на рис. 15.

Тогда в области   и оптимальной траекторией с максимальным временем движения является траектория типа .


Аналогично, доказывается, что в области   и оптимальной траекторией с является траектория типа .

 

В заключении отметим, что если при движении аппарата реальное время полета  (определяемое из уравнений движения центра масс) удовлетворяет условию , то аппарат в движении вокруг центра масс можно перевести из заданного начального в заданное конечное положение за время  . Решение можно искать в виде кусочно-постоянных управляющих последовательностей . При этом возможно любое сочетание знаков управления на первом и третьем этапе и возможна нулевая продолжительность любого этапа постоянного значения управления.

 

Литература

 

1. Okhotsimsky D.E., et al. Walking machines. Advances in mechanics, 1992, №1–2, p. 39–70.

2. Лапшин В.В. Динамика и управление движением прыгающего аппарата. Известия АН СССР. Механика твердого тела, 1983, № 5, с. 42–51.

3. Лапшин В.В. Управление движением прыгающего аппарата в фазе полета. Известия АН СССР. Механика твердого тела, 1984, № 1, с. 159–165.

4. Hemami J., Zheng Y. Dynamics and control of motion on the ground and in the air with application to biped robot. Journal of robotics systems, 1984, № 1, p. 101–116.

5. Hodgins J., Raibert M.H. Biped gymnastics. Robotics research: The fourth international symposium. Cambridge, Massachusetts: MIT press, 1987, p. 5–14.

6. Raibert M.H. Legged robots that balancemnastics. Robotics research: The fourth international symposium. Cambridge, Massachusetts: MIT press, 1986, 233 p.

7. Lapshin V.V. Motion control of a legged machine in the supportless phase of hopping. The international journal of robotics research, 1991, №4, p. 327–337.

8. Кирпичев В.Л. Беседы о механике. СПб., 1907.

9. Smith P.G., Kane T.R. On the dynamics of human body in free fall. Journal of applied mechanics, 1968, № 1.

10. Kane T.R., Scher M.P. A dynamical explanation of the falling cat phenomenon. International journal of solids and structuresapplied mechanics, 1969, № 7.

11. Степанцов В.О., Еремин А.В. О биомеханике человека в без опорном положении (невесомости). Космические исследования, 1969, № 6, c. 925–930.

12. Frohlich C. Do springboard divers violate angular momentum conservation? American journal of physics, 1979, № 47, p. 583–592.

13. Frohlich C. The physics of somersaulting and twisting. Scientific American, 1980, № 242, p. 113–120.

14. Аппель П. Теоретическая механика. М., Физматгиз, 1960, т. I –515 c.; т. II – 487 с.

15. Понтрягин Л.С. и др. Математическая теория оптимальных процессов. М., Физматгиз, 1961, 391 с.

16. Атанс М., Фалб П. Оптимальное управление. М., Машиностроение, 1968, 764 с.