統計力学序論 #4:統計的物理学の基本概念「期待値」と「分散」
これまでの統計力学の講義では、マクロな物質の性質をミクロな世界の法則から導出する方法を学んできました。
この考え方をより深く理解し、さまざまな現象を記述していく上で、数学的な概念である「期待値」と「分散」の理解が不可欠になります。今回は、これらの概念について改めてまとめてみました。
期待値について
期待値は、ある試行によって得られる結果の、平均的な値を表します。具体的には、それぞれの結果とその結果が得られる確率を掛け合わせて、すべてを足し合わせたものです。試行を無限に繰り返した場合に得られる結果の平均値に相当します。
”すでにあるデータ”の中間的な値を『平均値』、”将来的に表れるデータ”の中間的な値を『期待値』という前提が異なっているという見方もあります。
例えば、サイコロギャンブルを例に考えてみましょう。サイコロを振って出た目$x$がそのまま得点になるとします。それぞれの目が出る確率は$1/6$なので、このギャンブルの期待値$E[X]$は、次の式で計算できます。
$$E[X] = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} = 3.5$$
もしこのサイコロが「イカサマ」で、1の目が出やすいなど、それぞれの目が出る確率が均等ではない場合でも、同様に各結果にその確率を掛けて足し合わせることで期待値を求めることができます。
分散と標準偏差について
期待値が結果の平均的な位置を示すのに対して、分散は、その結果が平均値からどのくらいばらついているかを示す指標です。
これは、それぞれの結果と平均値との差(ズレ)を2乗し、その期待値を計算することで求められます。なぜ2乗するかというと、プラスとマイナスのズレが打ち消し合わないようにするためです。
分散を求めるには、次の便利な公式を使うことができます。
$$Var(X) = E[X^2] – (E[X])^2$$
この式は、「2乗の平均値(期待値)から、平均値(期待値)の2乗を引く」と覚えることができます。この公式を使うことで、分散の計算をより簡単に、かつ見通しよく行うことができるそうです。
(補足として記事の最後に、公式の導出を載せておきます)
また、分散の単位は元の数値の単位の2乗になっているため、元の数値と同じ単位に戻すために、分散の平方根をとったものが「標準偏差」です。
標準偏差は$\sigma$(シグマ)という記号で表されることが多く、統計学や物理学の多くの場面でデータのばらつきを表す指標として用いられます。
$$\sigma = \sqrt{Var(X)}$$
これらの概念は、統計力学がマクロな物理量をミクロな状態の「平均」として捉える上で、中心的な役割を果たします。
【※補足】分散の公式:証明の基礎
分散は、データの散らばり具合を示す重要な指標です。この分散を計算する際に、「2乗の平均値から、平均値の2乗を引く」という便利な公式がよく使われます。この公式がなぜ成り立つのか、導出してみましょう。
分散の定義と記号
分散とは、「平均値からの差の2乗の平均値」です。確率変数 $X$ の平均値(期待値)を $E[X]$ とします。分散は $\mathrm{Var}(X)$ や $\sigma^2$ で表されるのでしたね。
分散の定義式は以下の通りです。
この式を使い、証明したい公式を導出しましょう。
証明のステップ
ステップ1: 式の展開
分散の定義式を展開します。$(A-B)^2 = A^2 – 2AB + B^2$ の公式を使います。
ステップ2: 期待値の線形性
期待値($E[\cdot]$)は、和や定数倍に対して線形性(linear property)を持つという性質があります。つまり、$E[A+B] = E[A] + E[B]$ と、$E[cA] = cE[A]$ が成り立ちます。この性質を使って、式を分解します。
ステップ3: 定数の取り扱い
ここで、$E[X]$ は確率変数ではなく、ある決まった値(定数)です。したがって、$-2$ と $E[X]$ は期待値の記号の外に出すことができます。また、$(E[X])^2$ も定数なので、その期待値はそれ自身になります。
なぜ $E[(E[X])^2] = (E[X])^2$ となるかというと、例えば $E[5] = 5$ となるのと同じ理由です。期待値とは「平均値」のことなので、定数$C$の平均値は$C$自身になります。
ステップ4: 最終形への整理
ステップ3の式を整理すると、以下の公式が導かれます。
結論
これで、分散の公式が証明できました。この公式は、「2乗の平均値」$E[X^2]$から、「平均値の2乗」$(E[X])^2$を引くことで計算できる、ということを示しています。
この公式が便利な理由:
定義式 $E[(X – E[X])^2]$ は、まず平均値を計算し、次に各データからその平均値を引いて2乗し、最後にその平均を求めるという、2段階の計算が必要です。
一方、公式 $E[X^2] – (E[X])^2$ を使うと、各データの2乗の平均と、各データの平均をそれぞれ独立に計算できるため、計算がずっと楽になります。
統計力学ノート シリーズ一覧
- 統計力学序論 #1:マクロな世界をミクロから導く基本原理と計算例
- 統計力学序論 #2:調和振動子系と井戸型ポテンシャルの量子論的計算
- 統計力学序論 #3:統計力学から導く理想気体の状態方程式
- 統計力学序論 #4:統計的物理学の基本概念「期待値」と「分散」
参考文献
記事を書くときに、部分的に参照したので載せておきます。たぶん定番です。
コメント