標本空間

確率論の本質的なテーマは、一見まったくランダムに見える現象の中から、なんらかの規則性を見出そうとすることにある。

前項ははじめとして、確率変数は様々な事象の一つ一つに対して、実数に値をとる関数であることを説明した。 確率変数はランダムに見える現象そのものを表すものであるから、確率論の主人公そのものといえる。

とはいえ確率的な事象は社会のありとあらゆるところにあるわけで、細かいことにいちいちこだわれば、 確率的でない事象を見つけるほうが難しいかもしれない。

さまざまな事象$w$を一律に数学の枠内に取り入れるにあたっては、確率変数$X$を関数と考えることが一番自然なことだろう。 \[ X:w\rightarrow x\in\mathbb{R} \] あるいは、 \[ X(w)=x\in\mathbb{R} \] ということである。これで$x$が実数の範囲で動くことになり、容易に積分の話につなげることができる。

このような基礎的な話からはじめたときに、2点ほど注意を述べておこう。

まずひとつめは、初等で関数$y=f(w)$の説明を聞いたとき、次にチェックしておかなければならない事柄は、 独立変数$w$の定義域と関数$f$あるいは$y$の値域であったろう。つまり、$w$に応じて$y$が定まり、関数$f$が分かっているのから、 $y$の挙動を調べるためには、$w$を調べることが基本であった。

しかし、確率論においては、実は関数$f$の中味に着目することは、さほど強く求められるものではなくて、 都合のいい$y$の値域を定義することがふつうである。つまり、確率変数$X$の実現値$x$の挙動を正しく定義すればよい。

とはいえ確率変数$x$をどのような値にできるとしても、独立変数$w$の定義域との関係は適切でないとこまる。 確率変数$X$の定義域を標本空間(sample space)といい、一般的には$\Omega$で表記する。

標本空間は調べようとする確率的な事象のすべての結果が含まれたものであって、 標本空間の要素$w$を、根本事象とか根元集合という。つまり、 \[ w\in\Omega \] である。

1回のコイン投げのイベントであれば、その標本空間は表$H$と裏$T$であるし、 \[ \Omega=\left\{ H,T \right\} \] サイコロ1回投げのイベントであれば、その標本空間は一から六の目の数になろう。 \[ \Omega=\left\{ 1,2,3,4,5,6 \right\} \] トランプカードを二枚抜くイベントであれば、4種類×12=48枚とジョーカー1枚として、$_{49}C_2$個の根本事象が含まれるだろう。

そして標本空間のすべての要素に確率変数は値をとることが必要となる。そうでなければ、確率変数$X$は関数とならないからである。

標本空間が$\Omega=\mathbb{R}$であるなら、標本空間は実数空間で、根元集合は実数値ということになり、 確率変数$X$は実数から実数への関数となる。われわれはたいていその設定で話をすることになる。 \[ X:w\in\mathbb{R}\rightarrow X\in\mathbb{R} \]

前項の冒頭で表れた積分では、 \[ P(X\le x)=\int_{-\infty}^xf(y)dy \] ということだから、特別な説明がなければ、$x\in [-\infty,\infty]$と見るのだろう。 つまり、確率変数$X$の値域は実数全域$\mathbb{R}$になっている。しかしこのままでは、密度関数$f$があるだけで、 標本空間や事象$w$に伴う確率値は定かになってはいない。

標本空間が実数となる確率的なイベントとは何だろうと思うかもしれない。われわれが観測できるものは有限で離散的な現象だから、 標本空間を実数とみるのはあくまでも数学的な利便性でしかない。 たとえば株価は離散的であるし、温度や電圧は計測できるものは有理数でしかない。 しかし、すべて実数とみなして議論することで、数学の取扱いがたやすくなるということである。

われわれはさまざまな現象を取り込みたいために、関数としての確率変数$X$の構造や形式、中味についてあまり深入りすることは行わないし、 その分析が科学的に不可能に近いことであるから、いきなり、確率的事象$w$をすべて定義し、標本空間$\Omega$を構成する。 そしてその要素の一つ一つに対して確率変数$X$の実現値を正確に示すことで議論を進めるのである。

このような$X$の中味に深入りしないという背景を受けて、確率変数は$X(w)$というような関数を明示した表記をせず、 $w$を省略して、$X$というふつうの変数のような表記をするが、対象とする確率的な事象$w$をすべて含んだ標本空間を、 確実に構成しておくことは、正確な議論のための基本であることを忘れてはいけない。

かつて確率変数は確率を持つ変数であるという説明をしつこく教えられた方もおられるだろう。 その主旨は確率変数が確率を持つのではなくて、関数としての確率変数の独立変数が確率事象であるから、 確率値が付随しているということである。注意のふたつめは、確率変数としての関数$X$はあくまでも操作であって、 確率が付随しているのはあくまでも標本空間にある事象$w$ということである。

たとえば、コイン投げの話で表=1$(x=1)$、裏=0$(x=0)$としなくても、確率の値はもとめることができよう。 $w=H$あるいは$w=T$に確率1/2が付随しているのであって、決して$x=1$あるいは$x=0$に伴うものではない。

しかし、確率的事象$w$と確率変数値$x$は関数$X$を通してきちんとした対応をしているので、 実質的には同じような議論ができることになるのだが、物事の組み立てという意味では、根本事象を契機として考えるべきである。

特に標本空間$\Omega$も確率変数$X$の値域も実数で考えると混乱することがあるので、理解しておかれたい。

たとえば、六面体のサイコロ投げなら1から6までの値が考えられようが、それは常識というものであって、 2の目を1に変え、4の目を3に変え、6の目を5に変えて1,3,5だけがでるサイコロにすることもできるし、 1と2をそのままに、3,4,5,6のすべてを2に変えて、1と2しか出ないサイコロだって作ることができる。 カットを増やして、8面体や16面体のサイコロだって現実に存在するようである。 そしてそれぞれの事象の結果で標本空間が構成され、それぞれに適当な確率値が伴っている。

このように自由に標本空間や確率変数を定義することを許して、便利だからといって厳格な数学のテーブルに載せていこうとするなら、 当然なんらかの条件が満たされないといけないと考えるのがふつうだろう。 そういった事柄が普段あまり気にする必要のない面倒な議論につながるのである。

 






































































inserted by FC2 system