最優控制論讀書筆記
1. 變分與最優控制
在數學中, 考慮函數的最值或者極值是也一件十分重要的事情, 在一般意義下, 我們通常考慮如下問題.
設
為非空集,
為函數, 我們尋找
的最小值與最大值.
這個問題無論對應數學本身還是對應用數學而言都有者作用的意義, 誰人不關心自己的投資, 誰不想自己的投資獲得最大回報, 誰不想如果損失不可避免, 那么讓損失盡可能地小. 類似于這樣的想法, 凸顯出尋找函數最值具備的重要意義.
不過這樣的問題太過一般, 因此很難給出一個有效的辦法, 因此在人們處理問題的辦法是, 先研究這個問題最簡單的情況.于是就有如下版本.
設
為非空集, 我們在很多情況下關心函數
的最小值與最大值.
當然, 我們將涉及到兩個基本的問題.
- 函數
是否存在最小值與最大值.
- 如果函數
存在最小值與最大值, 那么如何刻畫
的最小值點或最大值點.
我們先來討論最值的存在性.
事實上, 函數的最值的存在性并不是一個簡單的問題, 目前針對 和
添加若干限制, 我們能知道其存在性. 比如
緊性: 也就是
是緊集, 且
連續, 那么由 Karl Weierstrass 的最連續函數的最大值最小值存在定理我們立刻知道
的最大值與最小值都存在.
強制性條件: 若
, 且
連續, 并滿足
那么存在最小值.
當然還有各種各樣的條件.
當然, 這種存在性的研究是一件重要的事情, 不過這不是直接的, 在這證明存在之后,具體如何找打這些最值點就變得是否要緊了.
歷史上, 人們也的確走了另外一條路, 也就是在假定 的最值存在的條件下(不管其是真正的存在或者只是一種假定), 人們考慮這些最值點應該會滿足什么性質, 然后沿著這些性質去尋找相應的最值點, 這種思路在歷史上最成功的一個辦法之一應該是由著名數學家 Fermat 觀察到, 也就是下面著名的引理.
Fermat 引理: 假設函數
在
處取極值, 并且
在
處可微, 則
這個引理給了我們一個尋找函數 最值點的一個途徑, 也就是在
的零點集
中去尋找 的最值點. 不可否則, 如果函數
的導函數
容易計算, 并且
的零點集容易計算的話, 那么這個辦法將是相當有效的.
當然, 這里考慮的函數的定義域落在一維空間上的情形, 在一維空間取得的成就人們自然會想辦法將其拓展到高維空間.
當然, 上面這個簡單的版本, 注意, 只是形式上的簡單, 當遇到 的導函數不存在或者
的零點很難計算的時候, 這個簡單的版本也不會簡單.
在考慮了上面這個簡單的版本之后, 人們自然希望拓展這中類型的辦法, 自然的想法當然還是限制函數的定義域. 因此有了如下的考慮.
設
,
是定義在
上的函數, 如果
非空, 我們自然希望考慮在
上的最值點.
在這里需要注意的, 當 足夠復雜的時候,
可能十分的復雜, 因此這個問題是不會簡單的. 當然如果將
進行適當的限制, 那么
可能會是
中我們相當熟悉的集, 比如是閉集, 緊集之類的.
在這方面, 類似于 Fermat 當年的思路, 目前知道十分有效的辦法是 Lagrange 乘子法. 在這里不補充詳細的細節.
當然, 隨著研究范圍的擴大, 首先出現的一類問題是當 為某類函數空間.
例: 設 為
中的某個曲面,
,
為
上兩點, 一個自然的問題是考慮曲面上連接
,
兩點的所有路徑中路程最段的.
其中
當然, 由于 的復雜性以及未來會演變為流形
, 這就導致這個問題是如此的不平凡和值得研究.
2. 最優控制的一般性概念
想從數學的角度清楚地對控制系統下一個定義是困難的, 控制論研究的目的在于搞清楚復雜系統內部各個因素之間的聯系, 并達到對系統進行控制達到我們目的, 因此我們面對的系統必然是各式各樣且復雜的, 因此要數學意義上統一模型化和公理化是困難的.
通常一個控制系統包含一些輸入變量, 一些輸出變量.
我們這里不對控制系統進行定義, 而是對控制系統進行公理化的辦法, 在數學上, 如果我們可以從輸出完整地將狀態構造出來, 則我們稱這個系統是完全能觀的.
作為控制系統, 我們關心其能控性, 能觀性, 注意這里的能控制性與能觀性在更進一的層次需要進行細致區分, 也就是說, 不同的能控性有著細致的區別, 我們要將其區別出來, 能觀性也是有區別的, 我們要在數學意義下將其區別出來, 模糊地描述某個概念是沒有好處的, 就像我們經常談論對稱性意義, 事實上, 不同結構的對稱性是有區別的, 這個區別的工具在數學上可以用各種不同的對稱群來進行區別, 同樣, 能控性, 能觀性也一樣, 我們要適當發展合適的數學概念或者工具, 將其進行區別, 就算沒有辦法對一般的控制系統進行區別, 那么對于一些特殊的控制系統, 發展合適的工具進行區別, 這也是必須要經歷的步驟, 也是控制論必須要走的歷程.
下面我們描述一種典型的控制模型
其中
是系統的狀態函數,
是系統的控制函數,
系統的演化由微分方程 所刻畫.
上面的系統到目前為止都還是一個形式系統, 還由許多沒有描述清楚的東西, 必然控制函數 在哪個范圍內選擇, 另外, 狀態函數的值域又是哪些.
為了描述問題的方便, 我們將集合 到集合
所有映射構成的集合記為
,
限制我們將上面的描述固定下來.
定義: 設 , 我們稱
我一階常微分控制系統, 其中 稱為狀態方程.
稱為控制函數空間.
定義: 對于控制系統
而言, 對于給定的初始條件 以及控制函數
, 如果控制系統存在解
則我們稱此解 為控制系統在初始條件
和控制
下的狀態軌線.