? 滿足Le Cam卷積定理前提的概率分布族稱為正規參數族(Regular parametric family),囊括了大多數參數統計學常用的分布。然而,一元正規參數族的
是在開區間上定義的連續參數,其取值有不可數無窮多個。計算機可執行的算法均由有限多基本步驟組成,故算法個數至多為可數無窮。簡單的推論即得絕大多數
值都不存在可行算法。
? 但我們要估計參數值時,恰恰又要依賴可執行在觀測樣本上的算法(例:矩估計。這里默認樣本自身的取值數有限),因此得出的只能是總數占滄海一粟的可計算值。用極特例的估計值去逼近一般情況下的不可計算值,能做到多好的精確度呢?這就是Vladimir Vovk在這篇論文中解決的問題:
? 原作者證明:令為正規參數族
中
值的一致可計算估計量,下標
表示測得i.i.d樣本數,則當
值不可計算時恒有:
? ? ? ? ? ? ? ? ? ??
? 對所有充分大的成立。式中
為標準正態分布累積函數,
是
個樣本的總Fisher信息。c為可選的正數。
? 我們取c=3,查正態累積值表知約為0.0015,故估計量對真值的偏離不超出
范圍的概率至多到0.9985。換言之,在置信水平不低于99.85%的要求下,只能精確到
的區間。其他置信度的情形可自行代換c值類推,不論如何,精確程度決定于總Fisher信息的高低,Fisher信息量越小,估計范圍就越大越失準。這性質同Cramer Rao不等式相仿,但這里對有偏的估計量同樣適用。
? 此式的趣味之一在于:它只針對不可計算的參數值。若可計算,則有很自然的反例:令
(與樣本無關的常數),既然
可計算,這也算是個可計算估計量(“一只停了的鐘每天也準兩次”)。顯然它在
處不遵守上述規律——它偏離真值的概率始終是0,與樣本量n無關。但正如前文所敘,可計算的參數值是鳳毛麟角,此種形同套用已知值作弊的做法被不可計算性阻擋了。