カイティー文字 (Unicodeのブロック)

カイティー文字 (Unicodeのブロック)
Kaithi
範囲 U+11080..U+110CF
(80 個の符号位置)
追加多言語面
用字 カイティー文字
主な言語・文字体系
割当済 68 個の符号位置
未使用 12 個の保留
Unicodeのバージョン履歴
5.2 66 (+66)
11.0 67 (+1)
14.0 68 (+1)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

カイティー文字(カイティーもじ、英語: Kaithi)は、Unicodeブロックの一つ。

解説

[編集]

20世紀初頭まで現在のインド北部のビハール州およびウッタル・プラデーシュ州東部にあたる、イギリス領インド帝国の同地域で用いられた[1]、いずれもインド・ヨーロッパ語族インド・イラン語派インド語群に属するボージュプリー語及びマガヒー語[1]、また同地域で話されたマイティリー語及びアワディー語[1]ウルドゥー語[1]、また稀にベンガル語及びマールワーリー語[1]を表記するために用いられたカイティー文字を収録している。現在これらの言語の多くの記述にはデーヴァナーガリーが用いられている[2]

カイティー文字はブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では暗黙の随伴母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。ラテン文字などと同様に左から右への横書き(左横書き)であり、単語毎に分かち書きをする。

数字についてはデーヴァナーガリーのものとほぼ同形のものを用いるため個別には符号化されていない[3]。ただし、様式的にはやや異なっており、特に8と9については形状がやや異なっている。

符号位置の順序はおおむね伝統的なカイティー文字の順序に従っている。

Unicodeのバージョン5.2において初めて追加された。

収録文字

[編集]

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(及び一部はIAST)に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
各種記号
U+11080 𑂀 KAITHI SIGN CANDRABINDU アヌナーシカ。

母音字や母音記号に付き、母音を鼻母音で発音することを表す。

U+11081 𑂁 KAITHI SIGN ANUSVARA アヌスヴァーラ

直後に音節が後続する子音字に付き、直後の子音と同じ調音点鼻音が挿入されることを表す。日本語における「」に相当する。

U+11082 𑂂 KAITHI SIGN VISARGA ヴィサルガ

音節末に[h]を伴うことを表す。

独立母音字
U+11083 𑂃 KAITHI LETTER A 短母音[a]を表す。 a
U+11084 𑂄 KAITHI LETTER AA 長母音[aː]を表す。 ā
U+11085 𑂅 KAITHI LETTER I 短母音[i]を表す。 i
U+11086 𑂆 KAITHI LETTER II 長母音[iː]を表す。 ī
U+11087 𑂇 KAITHI LETTER U 短母音[u]を表す。 u
U+11088 𑂈 KAITHI LETTER UU 長母音[uː]を表す。 ū
U+11089 𑂉 KAITHI LETTER E 長母音[eː]を表す。 e
U+1108A 𑂊 KAITHI LETTER AI 長母音二重母音[ai̯]を表す。 ai
U+1108B 𑂋 KAITHI LETTER O 長母音[oː]を表す。 o
U+1108C 𑂌 KAITHI LETTER AU 二重母音[au̯]を表す。 au
子音字
U+1108D 𑂍 KAITHI LETTER KA 子音[k]を表す。 k
U+1108E 𑂎 KAITHI LETTER KHA 子音[kʰ]を表す。 kh
U+1108F 𑂏 KAITHI LETTER GA 子音[ɡ]を表す。 g
U+11090 𑂐 KAITHI LETTER GHA 子音[ɡʱ]を表す。 gh
U+11091 𑂑 KAITHI LETTER NGA 子音[ŋ]を表す。
U+11092 𑂒 KAITHI LETTER CA 子音[c]を表す。 c
U+11093 𑂓 KAITHI LETTER CHA 子音[cʰ]を表す。 ch
U+11094 𑂔 KAITHI LETTER JA 子音[ɟ]を表す。 j
U+11095 𑂕 KAITHI LETTER JHA 子音[ɟʱ]を表す。 jh
U+11096 𑂖 KAITHI LETTER NYA 子音[ɲ]を表す。 ñ
U+11097 𑂗 KAITHI LETTER TTA 子音[ʈ]を表す。
U+11098 𑂘 KAITHI LETTER TTHA 子音[ʈʰ]を表す。 ṭh
U+11099 𑂙 KAITHI LETTER DDA 子音[ɖ]を表す。
U+1109A 𑂚 KAITHI LETTER DDDHA 子音[ɽ]を表す。
U+1109B 𑂛 KAITHI LETTER DDHA 子音[ɖʱ]を表す。 ḍh
U+1109C 𑂜 KAITHI LETTER RHA 子音[ɽʱ]を表す。 ṛh
U+1109D 𑂝 KAITHI LETTER NNA 子音[ɳ]を表す。
U+1109E 𑂞 KAITHI LETTER TA 子音[t]を表す。 t
U+1109F 𑂟 KAITHI LETTER THA 子音[tʰ]を表す。 th
U+110A0 𑂠 KAITHI LETTER DA 子音[d]を表す。 d
U+110A1 𑂡 KAITHI LETTER DHA 子音[dʱ]を表す。 dh
U+110A2 𑂢 KAITHI LETTER NA 子音[n]を表す。 n
U+110A3 𑂣 KAITHI LETTER PA 子音[p]を表す。 p
U+110A4 𑂤 KAITHI LETTER PHA 子音[pʰ]を表す。 ph
U+110A5 𑂥 KAITHI LETTER BA 子音[b]を表す。 b
U+110A6 𑂦 KAITHI LETTER BHA 子音[bʱ]を表す。 bh
U+110A7 𑂧 KAITHI LETTER MA 子音[m]を表す。 m
U+110A8 𑂨 KAITHI LETTER YA 子音[j]を表す。 y
U+110A9 𑂩 KAITHI LETTER RA 子音[r]を表す。 r
U+110AA 𑂪 KAITHI LETTER LA 子音[l]を表す。 l
U+110AB 𑂫 KAITHI LETTER VA 子音[ʋ]を表す。 v
U+110AC 𑂬 KAITHI LETTER SHA 子音[ɕ]を表す。 ś
U+110AD 𑂭 KAITHI LETTER SSA 子音[ʂ]を表す。
U+110AE 𑂮 KAITHI LETTER SA 子音[s]を表す。 s
U+110AF 𑂯 KAITHI LETTER HA 子音[h]を表す。 h
従属母音記号
U+110B0 𑂰 KAITHI VOWEL SIGN AA 長母音[aː]を表す。 ā
U+110B1 𑂱 KAITHI VOWEL SIGN I 短母音[i]を表す。 i
U+110B2 𑂲 KAITHI VOWEL SIGN II 長母音[iː]を表す。 ī
U+110B3 𑂳 KAITHI VOWEL SIGN U 短母音[u]を表す。 u
U+110B4 𑂴 KAITHI VOWEL SIGN UU 長母音[uː]を表す。 ū
U+110B5 𑂵 KAITHI VOWEL SIGN E 長母音[eː]を表す。 e
U+110B6 𑂶 KAITHI VOWEL SIGN AI 長母音二重母音[ai̯]を表す。 ai
U+110B7 𑂷 KAITHI VOWEL SIGN O 長母音[oː]を表す。 o
U+110B8 𑂸 KAITHI VOWEL SIGN AU 二重母音[au̯]を表す。 au
ヴィラーマ
U+110B9 𑂹 KAITHI SIGN VIRAMA ヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。

レンダー上は、子音連続を表す場合次の文字と縦に並べて繋がったような合字を形成するための不可視の制御文字として機能する。文字によってはただこの記号が子音字の下に付けられるだけの場合もある。

各種記号
U+110BA 𑂺 KAITHI SIGN NUKTA ヌクター。外来語の発音などのために子音字を拡張して新たな発音を表す際に用いられる。

例えば字母ja(U+11094 𑂔)に付くとアラビア文字などの転写において/z/を表す。

U+110BB 𑂻 KAITHI ABBREVIATION SIGN 省略記号。略語を表す際に用いられる[4]
U+110BC 𑂼 KAITHI ENUMERATION SIGN 字母na(U+110A2 𑂢)が様式化された記号で、英語の単語「number」の音訳であるnambarに由来する[4]。欧文などにおける番号符号(#)に相当する。

U+110BD 𑂽 の下線部分にも文字幅があるもの。

[4]
U+110BD 𑂽 KAITHI NUMBER SIGN 数値参照などに用いられる[5]

後続する数字の下にこの記号の下部の線が伸びる。

約物
U+110BE 𑂾 KAITHI SECTION MARK 文末を表す。
U+110BF 𑂿 KAITHI DOUBLE SECTION MARK 大きなテキストのセクションの終わりを表す。
U+110C0 𑃀 KAITHI DANDA ダンダ。句点やラテン文字などにおけるピリオド(.)に相当する。韻文では半詩節の終わり(パダ)を表す。 .
U+110C1 𑃁 KAITHI DOUBLE DANDA 段落の終わりを表す記号。韻文においてスタンザ(詩節)の終わりを表す。
母音記号
U+110C2 𑃂 KAITHI VOWEL SIGN VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

手書き写本、入門書、印刷本などの文書においてサンスクリット語に由来する単語に用いられる[6]

[7]
記号
U+110CD 𑃍 KAITHI NUMBER SIGN ABOVE U+110BD 𑂽 と同形の記号が数字の上に書かれるもの。番号付きリストの箇条書きの数字を表す[5]

小分類

[編集]

このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「約物」(Punctuation)、「母音記号」(Vowel sign)、「記号」(Sign)の8つとなっている[8]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号(Various signs

[編集]

この小分類にはカイティー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字(Independent vowels

[編集]

この小分類にはカイティー文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字(Consonants

[編集]

この小分類にはカイティー文字のうち、基本的な子音字が収録されている。

従属母音記号(Dependent vowel signs

[編集]

この小分類にはカイティー文字のうち、子音字に結合する母音記号が収録されている。

ヴィラーマ(Virama

[編集]

この小分類にはカイティー文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ暗黙の随伴母音/-a/を読まずに子音のみを発音することを表す記号が収録されている。

約物(Punctuation

[編集]

この小分類にはカイティー文字で用いられる句読点などの約物類が収録されている。

母音記号(Vowel sign

[編集]

この小分類にはカイティー文字のうち、子音字に結合する母音記号が収録されている。

記号(Sign

[編集]

この小分類にはカイティー文字のうち、様々な記号類が収録されている。

文字コード

[編集]
カイティー文字(Kaithi)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1108x 𑂀 𑂁 𑂂 𑂃 𑂄 𑂅 𑂆 𑂇 𑂈 𑂉 𑂊 𑂋 𑂌 𑂍 𑂎 𑂏
U+1109x 𑂐 𑂑 𑂒 𑂓 𑂔 𑂕 𑂖 𑂗 𑂘 𑂙 𑂚 𑂛 𑂜 𑂝 𑂞 𑂟
U+110Ax 𑂠 𑂡 𑂢 𑂣 𑂤 𑂥 𑂦 𑂧 𑂨 𑂩 𑂪 𑂫 𑂬 𑂭 𑂮 𑂯
U+110Bx 𑂰 𑂱 𑂲 𑂳 𑂴 𑂵 𑂶 𑂷 𑂸 𑂹 𑂺 𑂻 𑂼 𑂽 𑂾 𑂿
U+110Cx 𑃀 𑃁 𑃂 𑃍
注釈
1.^バージョン16.0時点


履歴

[編集]

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
5.2 U+11080..110C1 66 L2/05-343 Anshuman Pandey (26 October 2005), Proposal to Encode the Kaithi Script in Plane 1 (英語)
L2/05-368 Michael Everson (10 November 2005), Towards an encoding of the Kaithi script (英語)
L2/07-199 Anshuman Pandey (6 June 2007), Proposal to Encode the Kaithi Script in Plane 1 (replaces L2/05-343) (英語)
L2/07-418 Anshuman Pandey (17 December 2007), Proposal to Encode the Kaithi Script (WG2 N3389) (英語)
L2/08-156 Deborah Anderson; Anshuman Pandey (14 April 2008), Request for removal of digits from Kaithi proposal (WG2 N3438) (英語)
L2/08-194 Anshuman Pandey (6 May 2008), Proposal to Encode the Kaithi Script (WG 2 N3389; replaces L2/07-418) (英語)
L2/08-370 Deborah Anderson / SEI (21 October 2008), Proposal to add three Kaithi punctuation marks (WG2 N3544) (英語)
L2/08-400 Deborah Anderson / SEI (30 October 2008), Information on KAITHI NUMBER SIGN 110BD (英語)
11.0 U+110CD 1 L2/16-097 SEI / Benjamin Yang (11 May 2016), Proposal to encode Kaithi Number Sign Above (revised) (英語)
14.0 U+110C2 1 L2/20-151 Srinidhi A; Sridatta A (24 June 2020), Proposal to encode the KAITHI VOWEL SIGN VOCALIC R (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

[編集]
  1. ^ a b c d e Anshuman Pandey (2007年6月6日). “Proposal to Encode the Kaithi Script in Plane 1 (replaces L2/05-343)” (英語). Unicode. 2025年6月1日閲覧。
  2. ^ ただし、ウルドゥー語はアラビア文字ナスタアリーク体、ベンガル語はベンガル文字である。
  3. ^ Deborah Anderson and Anshuman Pandey (2008年4月14日). “Request for removal of digits from Kaithi proposal (WG2 N3438)” (英語). Unicode. 2025年6月1日閲覧。
  4. ^ a b c Anshuman Pandey (2007年12月17日). “Proposal to Encode the Kaithi Script (WG2 N3389)” (英語). Unicode. 2025年6月1日閲覧。
  5. ^ a b SEI / Benjamin Yang (2016年5月11日). “Proposal to encode Kaithi Number Sign Above (revised)” (英語). Unicode. 2025年6月1日閲覧。
  6. ^ Proposal to encode the KAITHI VOWEL SIGN VOCALIC R” (英語) (2020年6月24日). 2025年6月1日閲覧。
  7. ^ IASTではṛと表記される。
  8. ^ "The Unicode Standard, Version 15.1 - U11080.pdf" (PDF). The Unicode Standard (英語). 2025年6月1日閲覧

関連項目

[編集]