確率測度

確率変数$X$はある標本空間$\Omega$に属する様々な事象$w$を独立変数として、そのそれぞれに実数に値をとる関数であることを説明した。 \[ X:w\in\Omega\rightarrow x\in\mathbb{R} \] 関数$X$に与える独立変数$w$を根本事象とか根元事象といい、$X$の定義域として、$w$のすべてが含まれているものを標本空間といった。 標本空間にはすべての確率的な結果が含まれているということであって、そのすべての結果が確率変数$X$で翻訳されて、実数値$x$を生むことになる。

確率変数が関数であると認めるなら、関数$X$は変数$w$に対する実数値への対応関係や作用手続きでしかないから、 あくまでも確率値は確率変数$X$にあるのではなく、事象$w$にある。初等でしつこく繰り返される確率変数に確率値が付随しているということは、 元をただせばそういう意味である。

では、事象$w$の確率値をどのように整理しておけばよいのだろうか。

コイン投げの標本空間、 \[ \Omega=\left\{ H,T \right\} \] \[ \Omega=\left\{ HH,HT,TH,TT \right\} \] では、確率値は常識的には \[ \left\{ H \right\}=\left\{ T \right\}=\frac{1}{2} \] \[ \left\{ HH \right\}=\left\{ HT \right\}=\left\{ TH \right\}=\left\{ TT \right\}=\frac{1}{4} \] となろう。しかし、2回投げの最終結果だけでなく、1回目で表が出る確率や、 \[ \left\{ HH,HT \right\}=\frac{1}{2} \] どこかで裏がでる確率を求めることもあろう。 \[ \left\{ HT,TH,TT \right\}=\frac{3}{4} \]

確率値は事象すなわち標本空間の要素に付属するだけでなく、要素と要素のあらゆる組にも付随している。 つまり、標本空間を大きな集合と考えると、その要素はもちろん、部分集合にも確率値は付随しているものだろう。

コイン投げの例では腑に落ちないかもしれないが、例えば、結果として1.0というピンポイントの数値が出る確率を求める場合もあるだろうが、 0.8~1.2の間になる確率というふうに考えたくなる場合だって少なくないだろう。もしかするとその幅は0.5~1.5となるかもしれない。 これはいろんな幅で標本空間を切り取ることになっていて、ある値がでるという事象をいろんな幅の事象でも考えるということである。

当然、いつもいつもべての議論やりつくす予定はないだろうけれど、ある標本空間を定めたとき、その標本空間に対するあらゆる議論が 可能なように考えておきたい。前項のように、標本空間を常に作り直すことも考えられようが、それは結局確率値を振りなおす作業と同じことになっている。

事象に対して確率値が付属しているから、確率値もまた確率変数と同様に関数であるかのように思われるだろう。 すなおに考えれば、確率値は実数で$[0,1]$にあると考えるから、 \[ P:w\in\Omega\rightarrow p\in[0,1]\qquad (p\in\mathbb{R}) \] となる。しかし、上の議論はもう少し面倒なことをいっていて、標本空間のどんな事象の組にも確率値を対応させたいのである。

したがって数学的に厳密なことをいわざるを得ないのだが、標本空間の要素を、 \[ w\in\Omega \] とするなら、標本空間の部分集合は、 \[ W\subset\Omega \] となるが、確率値は、すべての$W$に対して、 \[ P:W\subset\Omega\rightarrow p\in[0,1]\qquad (p\in\mathbb{R}) \] という対応になってほしいのである。

つまり確率値は事象に付随しているというのだが、確率論的には、標本空間のすべての部分集合に付随していることとする。 ある集合のすべての部分集合を集めたものは、数学ではべき集合(power set)と呼ぶので、確率値は標本空間のべき集合に付随させることとなる。 べき集合はその要素の数を示して$2^{\Omega}$と表記することがあるが、後のために$\mathscr{P}(\Omega)$とする。

これから確率的な事象というのは標本空間の部分集合をいうことに切り替えて、それらに確率値が付随すると考えるのである。 標本空間のひとつの要素にも確率値が付随しているが、わざわざ根本事象と読んだのはこういう後の話があったからである。

たとえば、コイン1回投げの標本空間$\Omega$のべき集合$\mathscr{P}(\Omega)$とは、 \[ \mathscr{P}(\Omega)=\left\{ \left\{H\right\},\left\{T\right\},\left\{ H,T \right\},\phi \right\} \] となる。最後の$\phi$は空集合$\left\{\quad\right\}$である。

もっとうるさくいうと、根本事象、 \[ w\in\Omega \] と、$W=\left\{ w\right\}$として、たった一つの根本事象だけの部分集合、 \[ W\subset\Omega \] とは異なるものなので、識別しなければいけないのだけれど、くどくなるばかりなので、今後の説明ではこだわらないこととする。 また表記についてもこれに準じて、上のべき集合$\mathscr{P}(\Omega)$をいろいろ省略して、 \[ \mathscr{P}=\left\{H,T,\Omega,\phi \right\} \] というような書き方をすることもある。この二つは厳密に言えば異なるものだが、同じような意味でとらえていただくこととする。

これで確率値は、標本空間のべき集合の要素を独立変数とする区間$[0,1]$に値をとる実数値関数となって、 \[ P:w\in\mathscr{P}\rightarrow p\in[0,1]\qquad (w\subset\Omega,p\in\mathbb{R}) \] あるいは、 \[ P(w)=p\qquad (w\in\mathscr{P},p\in[0,1]\subset\mathbb{R}) \] ということになる。同じような記号や表記を使いまわしているので混乱しないで下さい。

確率変数は標本空間の要素に対する関数となるが、確率値は標本空間の部分集合に対する関数と考えるということである。

さて、ここでいっきに議論の抽象化をはかって、おおきな空間(集合)にある部分集合の大きさを測るということに転じたい。 そのことが確率値を適切に測るための基本的なよりどころになると思われるからである。

なぜならさまざまな確率的な行為や結果をとらえようとすると、それらを網羅的に含んだ標本空間はいろんなものがありうるわけで、 そのすべての要素である事象や事象の組となる部分集合に適切に確率値が割り当たるということは、 任意の空間や集合の部分集合の大きさを適切に測るとは数学的にどういうことなのか、をきちんと定めることが基本となるだろう。

確率値のことを数学的には確率測度という言葉で呼ばれるのは、そのような背景をもつからである。

 



































































お読みになっている方、集合の要素と部分集合の違いを改めて思い出されたい。









事象の数がn個の標本空間のべき集合の要素の数は$2^n$個になる。












ちなみに、空集合$\phi$のべき集合$\left\{ \phi \right\}$は空集合とならない。









































inserted by FC2 system