平均寿命の計算

眠い話です。興味なければ飛ばしてください。


今日、一般的によく用いられる平均寿命とは、0歳児平均余命と同義です。
これは毎年*1更新されるもので、特定の時点における年齢別死亡率が将来も一定であると仮定した上で、現在0歳児である人があと何年生きられるかを平均で示した物です。

ここで勘違いしやすいのは、平均寿命を死亡した人の年齢の平均と混同する点です*2

後者は死亡時平均年齢と言いますが、これは平均寿命とは異なります。

ひとつ例をあげましょう。

年齢帯 人口 死亡者数 死亡率
0-< 20 100000 20000 20%
20-< 40 90000 2000 2%
40-< 60 80000 3000 4%
60-< 80 60000 20000 33%
80-<100 30000 30000 100%

0歳以上20歳未満人口は10万人、そのうち2万人が、1歳ごとに1000人ずつが死亡したものとします。以降同様の前提。

上記例では、死亡時平均年齢は60.1歳ですが、平均寿命は66.7歳になります*3
このずれの原因は人口の年齢構成によります。
理想的には、0歳以上20歳未満人口10万人のうち2万人が死亡するのなら20歳以上40歳未満人口は8万人であってほしいところですが、現実はそうとは限りません。ベビーブームや丙午、昔であれば飢饉時には子供や老人が多く死亡するなど、人口構成が不均衡になる要因は様々です。
このため、死亡時平均年齢と平均寿命は基本的に一致しないわけです。

ちなみに、上記例では、死亡時平均年齢<平均寿命、となりましたがこの大小関係は年齢構成によっては逆転することもあります。

上は簡略化した例ですので、詳細について知りたい場合は以下のページを参照してください。
http://www.mhlw.go.jp/toukei/saikin/hw/life/20th/p01.html
http://www.mhlw.go.jp/toukei/saikin/hw/life/20th/ss03.html

死亡した人の年齢の平均と言った単純な指標でないことがわかります。

1910年の朝鮮人の平均年齢を計算するには?

最低限、1910年当時の朝鮮人の年齢別人口、1910年の朝鮮人年齢別死亡者数、の二つのデータがなければ平均寿命は計算できません。
そして、1910年当時の朝鮮人の年齢別人口のデータが朝鮮総督府のデータにはありません。

加えて1910年当時の朝鮮総督府の統計は不完全で精度が低いのですが、その説明は別エントリにします。


こんな寝言

  • 念のため聴いてみます

平均寿命を求めようとした際、誤差を±一年以内で求めようとするなら一億人の内、無作為に精々五千人くらいサンプリングすれば良いのですが、
あなたはどうして当時の統計は誤差が大きいと思うのですか?
誤差を非常に大きくみても一年以内に収まるはずです。
何か根拠があれば聞いてみたいです。

はい、上で説明してきたとおり、平均寿命の計算にサンプリングは不要です。
多分、世論調査か何かの統計的説明を意味も理解せずに使ってみただけでしょう。

そもそも、1910年の朝鮮人死者数は1億人もいません。1910年当時の朝鮮人人口をコホートとして追跡調査して寿命を調べて平均を取ると言うことも理論上はできなくはないでしょうが、5000例のサンプリングの無作為性を担保すること自体容易ではありませんから事実上不可能ですね。
統計を多少かじっていれば、このコメントやその後のすが氏のコメントがいかにデタラメかすぐにわかります。その意味では、すが氏をこき下ろしているあのさ氏は統計をある程度知っているようですね。


あのさ氏の指摘

  • あのさ 2009/11/20 00:00

死者の平均年齢をサンプリングでとると考えるのがおかしい。
死者の年齢が正確にわかるなら、それを全部集めて平均とればいいんだし、なぜサンプリングする必要が?

>>1926年に生きていた人間が何歳で死んだか

こういう方法で平均寿命を計算することもある。西洋だと教会にかなり正確な生没年が記録されているし、日本でも寺の人別帳とかである程度は調べられる。ただし、人の出入りが少ない狭い範囲でしか精度を保証できないので対象数はせいぜい数十〜100人程度。


死亡者の平均年齢をサンプリングでとること自体がおかしいのは、あのさ氏の言うとおりです。
「1926年に生きていた人間が何歳で死んだか」については、上で示したある時点での集団をコホートとみなした追跡調査研究などが統計学的にはあり得ますから、それを平均寿命と呼ぶなら、あのさ氏の指摘は正しいですね。
ただし、普通に用いられている平均寿命の意味とは異なることは上で示しています。

とは言え、中世以前の人口統計の不完全な時代の平均寿命を推定するひとつの手法としてはありえます。精度は低いので近代以降のデータと比較するには難点がありますが。

*1:別に年単位でなくてもよいが

*2:なので、間違えたすが氏が特にバカだと言うわけではありません。この場合、すが氏の欠点は恥を知らないことでしょうか。

*3:死亡率関数は直線で補間。実際の政府による平均寿命では四次関数などを使うようです。