日本の苗字というものに興味があって、ずっと「苗字の百貨店」というサイトを覗いていました。
そのサイトがこの夏くらいから閉鎖されてしまいました。
仕方がないので、Internet Archiveを用いて、過去の「苗字の百貨店」を探しだし、可能な限り、コピーしてみました。
だいたい、日本にどれくらいの苗字があるのか?
はっきりとは分かりませんが、10万件以下くらいのようです。
ただし、苗字の数え方には定義というものがありません。
「苗字の百貨店」は総数を明らかにする目的のサイトではなかったので、そこのところは非常にアバウトでした。
管理人さんの姿勢は一貫していて、実在する苗字と実在する読みにこだわっていました。
そこのところが非常に好きでした。
しかし、いったい日本に苗字がどれくらいあるのかを知るのに定義を決めないことには始まりません。
それなので、私なりに基準を決めました。
①新字体で置き換えられるものは置き換え、まとめて数える。
これは、「渡辺」さんと「渡邊」さんと「渡邉」さんは全て「渡辺」さんとして扱うということです。戸籍上では旧字体で登録されている場合でも新字体を使うか旧字体を使うかは全く本人の自由なので、総数がわかりにくくなるかと考えたからです。
なかには同一とすべきか悩ましい漢字もあるのですが…
②読みが明らかに異なる苗字は別として扱う。
「苗字の百貨店」では、漢字ごとにひとつの苗字としていて、例えば「河野(かわの)」さんと「河野(こうの)」さんはひとつに扱われています。でもこれは明らかに別の苗字なのでふたつの苗字と考えたいと思ったのです。
③あまり違わない読みは同一と考える。
②と矛盾しているようですが、例えば「浜崎(はまさき)」さんと「浜崎(はまざき)」さんは異なっているようで、あまり違いがない気がするんです。戸籍に載っているのは漢字のみで、フリガナはないんですね。だから「浜崎(はまざき)」さんが就職を機に「浜崎(はまさき)」さんに変えてしまおうというのはできないことではないはずなんです。なので濁点の有無だけで、別の苗字として扱うのは厳しいのかなと…
④あまりにも稀少な苗字は考えない。
「苗字の百貨店」では全国に2件以上登録されている苗字はほぼ網羅してあるみたいです。よってここに載っていない苗字はかなり稀なものになってしまうと思います。そしてそれを足していくとキリがなくなってしまう気がするのです。例えばスポーツ選手などが帰化して日本の苗字を持ったとしますよね。それを後から足していくと、本当に際限がなくなってしまうのです。そもそも全国に1件くらいしかない苗字では20年後もその苗字が存在するか不明ですし。
以上の点を踏まえて、実際に日本には苗字がどれくらいあるのかを数えていきたいと思います。
**追記:
当ブログのホームページと掲示板も完成しています。興味がある方は併せてよろしくおねがいします。
「日本の苗字を数えるHP」
https://sites.google.com/site/ribennomiaoziwoshueruh/
「「日本の苗字を数えるHP」の掲示板」
http://9312.teacup.com/myoji/bbs
0 件のコメント:
コメントを投稿