2020年5月30日土曜日

今更ながら異体字の定義に関して

異体字に関して、あれこれと尋ねられることがあるので、まとめておきます。
本表の中にもまとめてはあります。
https://sites.google.com/site/ribennomiaoziwoshueruhp/ben-biao/yi-ti-zitoshite-xitteiru-han-zi
https://sites.google.com/site/ribennomiaoziwoshueruhp/ben-biao/yi-ti-zitoshite-xitteinai-han-zi

これらを作成するのに私は下記の新旧字体表を利用しました。
https://www.asahi-net.or.jp/~ax2s-kmtn/ref/old_chara.html

もともと「渡辺」さんや「斎藤」さんなどの苗字で新字体と旧字体をまとめた形で表にしたいなというところからこのブログを始めました。

まずは上記の新旧字体表を絶対的に信用しました。
ここに載っているものは正しいという前提条件で苗字をまとめました。

ですが、新旧字体表はそもそも常用漢字に対してできているものなので、新字体にあたるものが常用漢字外だと載っていないことになってしまいます。
それなので、wiktionaryを参考にしました。
https://ja.wiktionary.org/wiki/%E3%83%A1%E3%82%A4%E3%83%B3%E3%83%9A%E3%83%BC%E3%82%B8

wiktionaryで異体字となっていれば、まとめています。

例外はあり、それは漢字ごとに判断しています。
例えば「岳」と「嶽」、「条」と「條」、「灯」と「燈」、「万」と「萬」、「竜」と「龍」の5種に関しては新旧字体表には新字体と旧字体として載っていますが、一般的には区別されていると思い、別々に集計しています。

他にも異体字の関係にあるものが、いずれもJIS第1水準の漢字である場合は別々に集計しています。
「島」と「嶋」、「刈」と「苅」、「園」と「薗」、「富」と「冨」などです。

逆に漢字としては全く別のものですが、あまりにも形が似ていて名乗っている当人たちが区別していないと思われるものは異体字としてしまっています。
「采」と「釆」、「萱」と「萓」、「鍛」と「鍜」、「タ」と「夕」です。

また「﨑」、「瀨」、「栁」は苗字として用いられることが多い漢字ではありますが、JIS第3水準です。
JIS第3水準の漢字をかたっぱしから載せていくとキリがないので、第1水準もしくは第2水準の漢字で置き換えられるときは載せていません。
「髙」や「𠮷」もそうですね。

ブログには変更を加えるたびに記載していっているのですが、何年もやっていると分からなくなっているところもあるため、あらためて残しておきます。

0 件のコメント:

コメントを投稿