対数正規分布と乗算過程~苦手な対数正規分布を克服~

2020年7月24日

こんにちは、ごんごんです。
今日はタイトルの通り、対数正規分布についてです。

対数正規分布は自然界や社会事象にもよく見られる分布ですが、式も一見複雑で私は少し敬遠していました。
とはいえ、アクチュアリー試験の損保数理でも頻出の分布ですので、苦手意識を払拭する必要はひしひしと感じており、この機会に克服を目指します。

今回はなぜ対数正規分布がなぜ社会現象で見られるのかという点を説明した上で、対数正規分布に親しみを持つことを目標に勉強します。

対数正規分布の概要

対数正規分布とは、「連続確率分布のうち、確率変数の対数を取れば正規分布に従う確率分布」です。
確率変数$X$が対数正規分布に従っている場合、確率密度関数を$f(x)$とおくと、下記のような式で表現ができます。

$$f(x) = \frac{1}{\sqrt{2\pi\sigma^2}x} \exp(-\frac{\log x - \mu}{2\sigma^2})$$

上の式で出てくる、$\mu$と$\sigma$はパラメータであり、$X$がパラメータ$\mu$と$\sigma$の対数正規分布に従っていることを$X$~$LN$($\mu$ , $\sigma$)のように記載します。

この時、平均$E(x) = \mathrm{e}^{\mu + \frac{1}{2}\sigma^2}$、分散$V(x) = \mathrm{e}^{2\mu + \sigma^2}(\mathrm{e}^{\sigma^2}-1)$となります。

また、$log X$を考えると、$log X$~$N$($\mu$ , $\sigma$)となり、(当然ですが)定義通り正規分布に従っていることがわかります。

対数正規分布のイメージを掴むために、下のグラフを見てください。
3つともパラメータの$\mu$は1ですが、$\sigma$の値を変えています。

対数正規分布のグラフイメージ
対数正規分布のグラフイメージ

$\sigma$が小さい場合(緑)は、正規分布に近く、大きい場合には少し歪みが出てきています。
対数正規分布の特徴は、右の裾が長い左右非対称な点です。
アクチュアリー試験の損保数理のクレーム額(支払い保険金額)で対数正規分布がよく仮定されるのは、パラメータを調整することでロングテール性を表現できるからだと思います。

対数正規分布が見られる社会現象

正規分布が自然によく見られるということは別の記事で紹介しましたが、対数正規分布もよく見られる分布です。

例えば、高校生の身長は正規分布に従っていることを上の記事では書きましたが、体重に関しては対数正規分布に従います
また、破砕された岩石の大きさ、老人病の介護期間や、思春期前の児童の身長、各国のGDP、個人の所得なども対数正規分布に従うとされています。

なぜ多くの事象が対数正規分布に見られるのか

上で色々な現象で対数正規分布が見られると書きましたが、なんで複雑そうな対数正規分布に従うのかと疑問に思いませんでしたか?

この疑問に答えるためには正規分布との関係に目を向けるとわかりやすいと思います。
正規分布はランダムな事象を足し合わせた「加算過程」において現出すると述べました。
対数の世界では、掛け算は足し算になりますので、対数正規分布はランダムな事象を掛け合わせた「乗算過程」において現れます

例えば、先ほど例で上げた個人の所得について考えてみましょう。
個人の所得は、サラリーマンを想定する場合には、勤務先や就いている役職に依存することが多いと考えられます。
現在の役職に就く前には入社してからの仕事の成果という確率変数が考えられます。
仕事の成果を考える際には、自分の適性に合っている部署に配属されたかどうかという確率変数を考えることができます。
その前には、就活で入社する会社がどうかという確率変数が考えられます。
このように、現在の所得というのは過去の数多くの確率的な事象を経た結果と考えられます。

ここで注意してほしいのは、正規分布と異なり、過去の事象が現時点まで影響を持っているという点です。
いわゆる「歴史性」が、加算過程ではなく乗算過程の根拠となります。

多種多様な要素が絡まって、相互作用をしながらできている系を複雑系といいます。
複雑系における標準的な分布こそが対数正規分布だと下の本では紹介していました。
正規分布、べき乗分布、そして今回の対数正規分布についてわかりやすく説明がしてあるので、気になった方は手にとって見てください。

まとめ

この記事では対数正規分布の基本情報に加え、対数自然分布がなぜよく見られるのかを説明しました。
今日の記事の概要をまとめたものが下記なります。

・対数正規分布は「連続確率分布のうち、確率変数の対数を取れば正規分布に従う確率分布」
・右裾が長いロングテール性が特徴
・対数正規分布は、歴史性が反映した乗算過程の末に現れる分布

みなさんの勉強の一助になれば幸いです。

雑記

Posted by gongon