1910年当時の朝鮮総督府統計の不完全性

宿題分。

またこの方のコメントを肴にします。

念のため聴いてみます

平均寿命を求めようとした際、誤差を±一年以内で求めようとするなら一億人の内、無作為に精々五千人くらいサンプリングすれば良いのですが、
あなたはどうして当時の統計は誤差が大きいと思うのですか?
誤差を非常に大きくみても一年以内に収まるはずです。
何か根拠があれば聞いてみたいです。

http://d.hatena.ne.jp/scopedog/20091117/1258473263

サンプリング云々が問題外なのは指摘済みなので、「あなたはどうして当時の統計は誤差が大きいと思うのですか?」の部分。

私の発言は、

1910年の統計はかなり精度が低く平均寿命が計算できるようなものではない

なので厳密には違いますが、一応1910年の統計の精度がなぜ低いのか、について説明します。


朝鮮総督府統計年報[第1冊]明治43年度」には、以下の人口調査結果が記載されています。

  • 明治43年末(1910年)の朝鮮人人口は、1312万8780人。
  • 明治43年末(1910年)の朝鮮人死亡者総数は、10万7308人。
  • 明治43年末(1910年)の朝鮮人出生数は、17万5221人。
  • 明治43年末(1910年)の朝鮮人死亡者のうち年齢5歳未満の数は、1万5338人。


もし朝鮮総督府の1910年当時の統計が正しいと仮定すると、以下の”事実”が導き出せます。

朝鮮総督府統計1910年が正しい場合に導き出せる”事実”

  • 明治43年末(1910年)の朝鮮人死亡率は、人口1000人に対して8.17人である。
  • 明治43年末(1910年)の5歳未満の朝鮮人乳幼児死亡率は、出生1000人に対して87.5人である。

さて、ここで気がつくなら大したものですが・・・



まあ、気づかない人が多いと思うので、以下の事実を付け加えましょう。

  • 2000年〜2005年の日本の平均死亡率は人口1000人に対して8.0人である*1

つまり、朝鮮総督府統計を正しいものとみなすと、1910年当時の朝鮮は人口1000人あたりの死亡者数が現代日本並みになってしまいます。これは年齢構成のせいだともいえるかもしれませんが、次はどうでしょうか?

  • 明治43年(1910年)の日本における乳児死亡率は、出生1000人に対して161.2人である*2

同じ1910年当時の日本と比較して、朝鮮は乳幼児死亡率が半分と言う驚きの結果になってしまいます。


さて、まともな頭を持っていれば、1910年の朝鮮総督府の統計は精度が低いと判定するでしょう。この程度の精度しかない統計から平均寿命が計算できるとは考えられませんね。そこで前回の疑問に至ったわけですが、ソースを特定するに足る情報は得られませんでした。

惜しいのは、あのさ氏の

そこまでのデータが1910年当時の朝鮮でとれたとは思えないから、多分26歳という数字は死亡時年齢の平均をとったのだろう。

と、mechamote氏の

朝鮮王朝が近代的な統計を取っていたとは思えませんので、もしかしたら総督府に調査を命じられた学者が、衛生状況や栄養状況、乳児死亡率などから日本統治以前の概算値を推計したものかも知れません。そういう場合はお上に気兼ねして多少の色は付けるかも知れませんが、大きく実態とかけ離れた数値が出るわけでもないでしょう。まあソースがわからない今憶測してみても始まりませんが。

ですが、mechamote氏説は総督府に調査を命じられた学者が特定できなければ憶測の域を出ません。
あのさ氏の死亡時年齢の平均については、実は私も調べてみたんですが、26歳とか24歳にはなりませんでした。精度が低いので何とも言えませんが、死亡時平均年齢の推定値は中央値で約30歳、最小値をとれば26〜27歳にはなりますが、最大値は33〜34歳になります。朝鮮総督府のデータを素直に読む限り、死亡時平均年齢推定値としては約30歳と見るべきでしょう。

種明かし

実は1910年当時の朝鮮の人口統計は届出に負うところが大きいのです。このため、出生者数・死亡者数は極めて不完全ですし、人口そのものも1910年の調査では調べきれてません。実際、併合以降数年については朝鮮総督府自身が「異常の増加」と呼んでいるほどです。

本府始政以来弊政の改革と民籍事務の整備とに伴い、人口は一時異常の増加を示したが漸次平調に帰し、明治43年末に於いて総数1312万余人であったものが、毎年30万人乃至70余万人を増加し、大正6年末には1661万余人に達したが、同9年以降は略常態に復し、昭和3年末現在数1866万7334人を算するに至った。
(「新興の朝鮮」朝鮮総督府、アジ歴レファレンスコード: A06032005800)


もちろん、届出された結果を実態からのサンプルとみなすことも統計上、無作為性が確保されないので不可です。念のため。