可測関数

この確率論メモの入り口では、さまざまな確率事象を自由にとらえることから、確率変数は関数であることを確認することから始めた。

ところで統計学を始めると最初に確率変数が登場して、確率変数は確率を持つ変数であって、いわゆるふつうの変数は確率を持っていない。 この変数の意味の違いを常に意識しておくようにと、耳にタコができるくらい聞かされる。 変な混乱を避けるうえでは、この指導はまことにもっともではある。

しかしわたしの経験ではどんなに言われていてもあまりピンとこないまま進んで、 最小二乗法やガウス・マルコフの定理でそういうものかと思い始めるけれどなかなか腹に入らない。 その後に習う確率論で確率変数が変数というより関数であると聞かされて、次第に納得したような記憶があった。

その記憶にしたがって、説明はショートカットして関数であることから入ったのだが、正確に言えば確率変数はこのどちらの性質を持ってもいる。 確率変数は測度論的には可測関数と呼ばれるものになるので、その定義を紹介しておこう。

これまで空間を作ることに一生懸命で、測度以外のふつうの関数についてまったく触れていないことはお気づきだろう。

とはいっても初歩で習った関数がいきなり制約を受けたり条件が加わったりという面倒になることはない。 一般に測度論と銘打つだけに議論の視点となるものがあって、その土俵の上で基本となる関数に対する言葉使いを知って、 性質を調べておくことは、この先の理解を進めるうえで必須のことだろう。

初等解析のテキストなら連続な関数の定義がなされることをおもいだされるとよい。 あまり評判のよろしくないε-δ論法が展開されるところであるが、あんなに面倒なことはないのでご安心めされよ。

では測度の議論に基本となるふつうの関数は何かといえば、それは可測関数と呼ばれる。

可測関数の定義を挙げておこう。$(\Omega,\mathcal{F},m)$を測度空間とし、この上の関数$f$が、 \[ f:(\Omega,\mathcal{F})→ (\mathbb{R},\mathcal{B}) \] と与えられている。ここで$(\mathbb{R},\mathcal{B})$は実数とボレル集合体の空間である。

そして、任意の$a\in \mathcal{B}$に対して、逆像$f^{-1}(a)$が、 \[ f^{-1}(a)=\left\{w\in\Omega : f(w)\in a \right\} \in \mathcal{F} \] ならば$f$は可測あるいは(ルベーグ)可測関数という。

この定義では一般の測度空間から実数空間への写像を見ているが、 当然$(\mathbb{R},\mathcal{B})\rightarrow (\mathbb{R},\mathcal{B})$という関数$f$であってもよいわけで、 定義域がボレル集合体にとれるとき、ボレル可測関数とよぶこともある。

つまり、σ代数に値をとる関数$f$の逆像がやはりσ代数を形成するなら可測な関数となるのである。

この可測関数の定義は、独立変数と従属変数が両方ともσ代数に存在すると見るなら、 関数$f$はその可測な変数間のやりとりをしているのであるから可測関数とはまったくふつうの表現であろう。

さらに位相論における連続関数の定義を呼び起こされれば自然と受け入れられるかもしれない。 その定義は、写像$f$が連続であることの必要十分条件は、任意の開集合に対して$f$の逆像が開集合となることであった。

つまり、全体集合を$\Omega$として、すべての$\Omega$の部分開集合族を$\mathcal{O}$とし、 実数のすべての開集合の集合族を$\mathcal{O}(R)$とすれば、任意の$a\in \mathcal{O}(R)$に対して、関数$f$の逆像が、 \[ f^{-1}(a)=\left\{ w\in\Omega : f(w)\in a \right\}\in \mathcal{O} \] となることである。

空間に位相を持ち込んだときに関数の連続性は、いくらでも近くに隣の値が取れることを開集合の縁を使ったやりとりで表現したのであった。

まったく似通っているとはいえ、ε-δほどではないかもしれないがあまり芳しい評判を聞かないこの定義よりも、 先の可測関数の定義の方がわずかに単純だと思われる。

なぜなら実際、可測関数と連続関数の関係はどうなのであろうかという疑問が起こるだろう。 その答えは簡単で、一般に開集合は可測集合であることが証明できる。したがってすべての連続関数は可測関数となるのである。

ほとんど証明なしの無理がきて、いきなりこのように断言されるととりつくしまもなくて困るかもしれないけれど、 数直線上のひとつの測度は、開区間$(a,b)$であろうと閉区間$[a,b]$であろうと、$|b-a|$でとることを思いだしてほしい。

このような測度のとり方が基本にあるとき、開集合は可測となることは特別に不思議ではない。 もちろんいわずもがなであるが閉集合も可測集合となるのである。

連続関数が可測となることを認めてしまえば、自然と$\alpha,\beta\in \mathbb{R}$による関数の線型和$\alpha f+\beta f$や, 絶対値$|\alpha f|$、可測な二つの関数$f,g$を用意すれば和$f+g$、積$fg$などの関数操作の結果も可測となることが得られていく。

技術的に重要な事柄として、無限の可測な関数列$f_1,f_2,\cdots$に対して、
\[ \sup f_i,\inf f_i,\lim \sup f_i, \lim \inf f_i(i=1,2,\cdots)\] なども可測となり、$\lim f_i(w)=f(w)$がすべての$w\in\Omega$で成り立つなら$f$は可測となることが得られる。 つまり点収束について閉じていることもわかっている。

したがって、初等で習った関数操作はまず大丈夫と考えてよいのである。そしてこれらの調べを基礎として、 測度空間の可測関数に極限処理を適応した微分や積分の操作がどのようになっていくのかという議論に発展する。

では確率変数とはどのように考えるべきなのか。とりあえず測度論的なその定義を与えておこう。 集合論がベースなので関数より写像の方が適切な述語かもしれないが、確率空間$(\Omega,\mathcal{F},P)$に関数$x$があって、 \[ x : (\Omega,\mathcal{F})\rightarrow (\mathbb{R},\mathcal{B}) \] であるとき、任意の$a\in \mathcal{B}$に対して、逆像$x^{-1}(a)$が、 \[ x^{-1}(a)=\left\{w\in \Omega : x(w)\in a \right\}\in \mathcal{F} \] ならば$x$は確率変数であるという。ここで$(\mathbb{R},\mathcal{B})$は実数とボレル集合体による空間である。

なんとなくお気づきになる方もおられるかもしれないが、 この元の空間への逆像が取れることが確率論としては重要であって、逆像がとれるからその逆像$w$に測度$P$を使うことができて、 確率値を得ることができる。

確率変数に確率値が付与できるし、付与されているのである。 可測でなければ確率値は得られないのであるから、確率変数が可測関数となることは自然というより、 必須な事柄である。

 










測度そのものも、完全加法性という条件をもつふつうの関数である。













































































inserted by FC2 system