2020年4月3日金曜日

異体字のメモ

(参考URL)概要がわかるサイト
・wikipedia
異体字セレクタ
・IPAのサイト
IVD/IVSとは


(参考URL)Unicodeコンソーシアムの異体字のページ
Ideographic Variation Database


わかったことのまとめ

(1)異体字とは?

同じ文字コードだけどちょっとだけグリフが違うようなものがある。それが異体字。

葛飾区と葛󠄀城市の葛が若干違う。どちらもU+854Bの文字コードだけど、グリフが少し違う。


(2)IVSとは?

Unicodeで異体字を扱うときに、文字コードにくっつける文字コード U+E0100~U+E01EF のこと。異体字セレクタの一種類。

(3)SVSとは?

Unicodeで異体字を扱うときに、文字コードにくっつける文字コード U+FE00~U+FE0F のこと。異体字セレクタの一種類。

(4)FVSとは?

Unicodeで異体字を扱うときに、文字コードにくっつける文字コード U+180B~U+180D のこと。異体字セレクタの一種類。モンゴル文字専用

(5)IVDとは?

異体字のデータベース。Unicodeコンソーシアムがこれを管理してて、ここに申請すると登録される。
Ideographic Variation Database
どうやって実現するか?
・.netのAPIで実現できないか探してみたけどなさそう。

・fontファイルを開いて、cmapテーブルを見るのがよさそう。... 大変そう...

0 件のコメント:
コメントを投稿