私の記事によく出てくる「戸籍統一文字」の他に、同じ法務省関連で「登記統一文字」というものもあります。こちらに関しては詳細な資料が見当たらず、「たぶん登記情報システムで使われている文字であろう」ということ以上の情報がない状況でした。
ところが、平成20年度に経済産業省の委託で、財団法人日本規格協会、独立行政法人国立国語研究所、社団法人情報処理学会の三者が行った「汎用電子情報交換環境整備プログラム フェーズ2」の調査検討対象に「登記統一文字」があがっており、成り立ち等について成果報告書(注1)で詳しく解説されていることに先日気付きました。そこで今回はこの資料から「登記統一文字とは何か」についてまとめてみます。
・平成20年から切り替えが始まった法務省の新登記情報システムで使われている。(現行のシステム)
・同じ法務省の戸籍統一文字を拡張したもの。
・拡張部分は「登記固有文字」といい、各登記所で制作・保有している外字から成る。
・文字数は戸籍統一文字56040字+登記固有文字12027字の合計68067字。
・戸籍統一文字コード(6桁)の先頭に00を追加して8桁に拡張する。
・登記固有文字は先頭01以降のコードとして追加されている。(推定)
・登記固有文字のうち1092文字は住基統一文字と共通している。
・登記固有文字の多くは異体字(誤字・俗字)である。
・登記固有文字には日本以外の地域で使われている漢字が含まれている。(漢字文化圏出身の在留者・居住者の氏名等)
・登記固有文字には符号・記号等、平仮名・片仮名・仮名合字、変体仮名などの「非漢字」が1697字含まれている。
つまり、登記情報システム用の「登記統一文字」は、「戸籍統一文字」の拡張で、登記固有文字12027字が加えられた合計68067字の文字のセット、ということです。これには他の文字セットには含まれていないと思われる文字が約1万字ほどあります。
関連:
・「⿺辶鳥」はISO/IEC 10646:2017に収録されたのか | yasuokaの日記 | スラド
・「⿺辶鳥」は“ナベ”の異体字なのか | yasuokaの日記 | スラド
・ISO/IEC 10646:2017に収録されていない『新潮日本語漢字辞典』の漢字 | yasuokaの日記 | スラド