GlyphWiki logo
導航
幫助
搜索

工具箱
其他語言
文章討論編輯歷史

GlyphWiki:prefix

字形維基(GlyphWiki), 自由的字形數據庫

prefix(グリフ名の頭に付ける集合名)とは

グリフウィキでは、ある程度の秩序を持った名前をつけてグリフを登録する必要があります。具体的には集合名としてのprefixを頭につけることとします。たとえば「foobar-1234」というグリフ名は「foobar」という集合の中の「1234」番のグリフ、という意味となります。

prefixを作るべきか

すでにprefixが存在するかどうかを確認してください。当ページ末尾に既存prefix一覧の一部があります。(現状ではすべてのprefixを一覧することができません。近いうちに一覧ページ自動作成機能を用意します)

prefixが存在せず、グリフ集合が10字以上あり、集合名および集合内の番号を適切につけられると思われる場合は、prefixを作ることを検討してください。それよりも少ない場合は別の記述方法(たとえばIDS表記など)を検討してください。

集合名は、あまり長いとグリフ名が長くなるので、イニシャルの列挙などで省略化してください。たとえば書籍名の場合、日本語の書籍であれば日本語ローマ字をベースに、中国語の書籍であればピンインをベースに考えてください。短すぎるprefixは他とバッティングするのでご遠慮ください。

集合内の番号は単に登録する順番に1,2,3とするのは望ましくありません。書籍であればページ数、ページ内番号など、漢字リストであればリスト内でのIDをベースに考えてください。

prefixの作り方

新しいprefixを作りたいときは「Group:prefix-(foobar)」のページを先に作成し、集合の意味や出典、などの内容を記述してください(foobarの部分が作成するprefix)。その中に以下のように命名ルール自動チェック用の記述をしてください。また、prefix一覧ページ生成用にprefixの内容を簡単に説明してください(当面各語種混在で)。

 :expr:foobar-NNNN
 :desc:foobar漢字コードのコードポイント

使える代替表現は以下のとおりです。すべて大文字で記述してください。

代替表現内容内部での正規表現
N数字1桁[0-9]
H16進数1桁[0-9a-f]
C英数字1字[0-9a-z]
IIDS表記(cdpも利用可)[0-9a-fnopu-]+
S文字列[0-9a-z-]+
Wワイルドカード.+

上記の例では、foobar-1234といったグリフがルールに沿ったグリフ名として登録可能になります。

【注意】末尾の制限

末尾が「-NN」(-HHなども同じ)で終わらないようにしてください。「-NN」は偏化変形の接尾コードとして予約されています。途中に「-NN-」が現れるのは構いません。

prefixの重複

1つのprefixに複数の本体名記述ルールが存在することを認めます。「g-bkNNNNNN」、「g-chNNNNNN」のようなケースでは「Group:prefix-g」というページに

 :expr:g-bkNNNNNN
 :expr:g-chNNNNNN

を併記してください。「Group:prefix-g-bk」というページは作成しないでください。

prefixベースページ

prefixのルールを決める以前から使われていたデフォルトprefixについては今後、個々のprefixページを作成していきますが、それまでの間は字表:prefixページをベースページとしてルールを記述しています。

既存のprefix

JIS規格票字形については下記のより下にあるものがUCSのJ欄であると仮定します。GL領域の番号とは、区および点番号にそれぞれ32(0x20)を足したものを16進数表記としたものです(例:53区21点は5535)。(参考:GlyphWiki:GL領域の番号とは

aj1-#####AJ1コード。下記参照
b-####Big5コード
c1-####CNS 11643 Plane 1(以下234…15(cf-####)面も同じ)
cbeta-#####CBETA
cdp-####CDP外字(3つのバージョンのうち2番目(旧)のもの cf. https://glyphwiki.org/web/cdp3vers.pdf
cdpo-####CDP外字(3つのバージョンのうち1番目(古)のもの cf. https://glyphwiki.org/web/cdp3vers.pdf
cdpn-####CDP外字(3つのバージョンのうち3番目(新)のもの cf. https://glyphwiki.org/web/cdp3vers.pdf
dkw-#####諸橋轍次『大漢和辞典』番号。ダッシュ付きは末尾に「d」、2点ダッシュは「dd」を加える。補巻はdkw-h####とします。m-#####は使いません
gt-#####GTコード
gt-k#####GT-kコード
j78-####JIS X 0208:1978規格票例示字形。GL領域の番号で記述
j83-####JIS X 0208:1983規格票例示字形。GL領域の番号で記述
j90-####JIS X 0208:1990(1997、2012も同等)規格票例示字形。GL領域の番号で記述
jc3-####JEF-CHINA3コード
jmj-######MJ文字図形名。10進数6桁固定で頭の0は省略しません
jsp-####JIS X 0212:1990規格票例示字形。GL領域の番号で記述
juki-####住基ネット統一文字コード。16進数4桁
jx1-2000-####JIS X 0213:2000規格票第1面例示字形。GL領域の番号で記述
jx1-2004-####JIS X 0213:2004規格票第1面例示字形。GL領域の番号で記述(UCS符号位置の使用を推奨)
jx2-####JIS X 0213:2000(2004も同等)規格票第2面例示字形。GL領域の番号で記述(UCS符号位置の使用を推奨)
k0-####KS X 1001規格票例示字形。GL領域の番号で記述
kkdjg-kokuji-#####角川大字源国字一覧
kokuji-no-jiten-####国字の字典
koseki-######戸籍統一文字番号。10進数6桁固定で頭の0は省略しません
kx-#######康煕字典(同文書局影印本)字形。頭4桁はページ番号、下3桁はページ内番号(2018/06/03に下2桁から3桁に変更)
nihonjin-no-tsukutta-kanji-###日本人の作った漢字
nyukan-####入管外字コード。16進数4桁
tdcntd-######字典字喃摘引。上4桁はページ番号、下2桁はページ内の順番
toki-########登記統一文字番号。10進数8桁固定で頭の0は省略しません
tron-##-####TRONコード。面番号は10進数2桁,コード番号は16進数4桁
twedu-######-###(-#)台湾教育部異體字字典
u####(#)UCS(ユニコード)。下記参照
waseikanji-no-jiten-####和製漢字の辞典
zihai-######中華字海。最初の4桁はページ番号、最後の2桁はページ内の順番

AdobeJapan-1(CID)グリフ

アドビ社が定めている独自のグリフ集合であるAdobeJapan(PDF) 集合については、CID番号による表現と、Unicode標準のIVS を用いる方法の2種類がありますが、特に片方に統一せず以下の2通りのいずれかとしてください。

  • aj1-##### (# は10進数の数字) 例:aj1-07765
  • (ベースとなるUCSコード)-(IVSコード)例:u90a3-ue0101

IVS表現と異体字“-var-”“-itaiji-”(GlyphWiki:グリフを登録する参照)は併用できません(例:u4e00-ue0100-var-001は不可。u4e00-var-001とする)。

UCS(ユニコード)相当グリフ

UCS相当グリフはグリフウィキの中でも若干特殊な意味を持たせているためprefixを付けていませんが「u(コード番号)」という命名法をとっています。具体的には「u####、u2####、u3####」(#は16進数の0~9,a~f。CJK漢字が規定されているコードポイントに限る)となります。

これらはISO/IEC 10646のコードポイントに対応するグリフとするため、各国・各地域のソースを明示する必要があります(現在存在する無印のUCSコードポイントグリフは漸次廃止とします)。下記に説明が続きます。

複数欄(各国・各地域のソース)指定のためのルール

UCS(ISO/IEC 10646、Unicode)の符号位置に相当するグリフを作成するときは、複数欄表記のどの欄のグリフかを以下の接尾コードを利用して明示する必要があります。

接尾コード意味
無印(コードなし)漸次廃止
gGソース(中華人民共和国及びシンガポール)
tTソース(台湾)
jJソース(日本)
kKソース(韓国)
vVソース(ベトナム)
hHソース(香港特別行政区)
kpKPソース(北朝鮮)
uUソース(ISO規格におけるUソース。もともと「The Unicode Standard の字形」としていましたが「-us」に変更しました)
mMソース(マカオ)
sSソース(大正新脩大藏經)
ukUKソース(英国)
usThe Unicode Standard の字形(現在の複数表記になる前の1欄表記の字形)
iISO/IEC 10646:2003規格(2011も同じ。また2012では「UCS2003」と表記)でのSIP(Ext.Bなど)の字形
jaJIS X 0213の字形が反映される前のJ欄(Ext.AのJAソース)
jsJIS X 0213の字形が反映される前のJ欄(補助漢字)
jvおよび*v仮想Jソース(仮想J字形)および仮想地域字形(次項参照)
jn正規化Jソース(正規化J字形)(次々項参照)

複数欄と偏化変形を組み合わせる場合は「-(複数欄)(偏化変形部位)」とします。たとえば「u725b-t01」のようになります。ただし元となる地域ソースが規定されている場合に限ります。例の場合「u725b」のTソースが規格上存在する場合のみ登録可能です。

複数欄指定の接尾コードと異体字“-var-”“-itaiji-”(GlyphWiki:グリフを登録する参照)は併用できません(例:u4e00-g-var-001は不可。u4e00-var-001とする)。

仮想Jソース(仮想J字形)および仮想地域字形

従来グリフウィキではUCSコードポイントにおいてソースの指定なしグリフが存在しましたが将来的に廃止とします。よって、すべてのUCSコードポイントグリフはソースの指定が必要となります。現実的な問題としてJソースがないグリフについて、J以外のソースをもとにしたグリフを利用するとデザインの不統一が生じるため、「仮想J字形」を設定しています。仮想J字形のガイドラインは未確定(GlyphWiki:仮想J字形のガイドライン)ですが、大まかに以下の概念によります。

  • Jソースの漢字と混ぜて違和感のないもの
  • 具体的には平成明朝体字体に沿うもの
  • 筆画の接続の有無など細かい点は下記「正規化J字形」で規定する

当面の暫定措置として、変化変形グリフにおける無印(地域ソース指定なし)は「-j」が指定されているものとみなします。

また、同じ考え方によりJ欄以外の地域字形あるいは既存のグリフ集合・辞書に見られる、暗黙的に統一感のある字形の特徴が反映されたグリフについては仮想字形として「-*v」を使うことができます。ただし「暗黙的な統一感」はルールに記述できるような厳格な状況から、あくまでも主観的なものと広くあり得ますので、齟齬が生じているとみなされる場合は適宜議論といたします。また「地域」という側面から議論が感情的にならないように、細心の注意と議論相手への敬意を払っていただきますようお願いします(特に日本語で議論する場合に非日本語話者と思われる方の書き込みに対してご注意ください)。現在「-gv」、「-hv」、「-kv」、「-tv」、「-vv」が存在します。

正規化Jソース(正規化J字形)

UCSにおけるJソースのグリフにはデザイン差が存在します。しかしながら、それらのデザイン差をソースを指定しないグリフに反映させるとグリフセットとしての質が低下してしまいます。そのため、デザイン差を統一した字形を正規化J字形として作成します。正規化J字形のガイドラインは未確定(GlyphWiki:正規化J字形のガイドライン)ですが、大まかに以下の概念によります。

  • 文字情報基盤の漢字と混ぜて違和感のないもの
  • 画数の変わるものなど、比較的大きな違いは上記「仮想J字形」で規定する

(参考)ISO/IEC 10646の規格票について

ISO/IEC 10646:2003の規格票は以下のページにてPDF形式で公開されています。

http://std.dkuug.dk/jtc1/sc2/wg2/