表意文字描述字符(英語:Ideographic Description Character,IDC)是一块收录描述表意文字(如汉字)结构的符号的Unicode區段,其中部分描述符号编码于其他区段。 目前大部份編碼包含Unicode,處理漢字編碼時大致是先搜集漢字,给予每个漢字一个數字編碼。然而,漢字...
23 KB (636 words) - 13:23, 13 March 2025
IDC有如下的意义: 互联网数据中心(Internet Data Center) 国际数据公司(International Data Corporation) 表意文字描述字符(Ideographic Description Character) 《idc》:COLLAR的單曲,2023年出售 我不在乎(I don't...
506 bytes (46 words) - 02:28, 6 March 2025
引入了變體選擇符, 從此可以用「變體序列」描述字符的變體。漢字的變體,可用「標準變體序列」或「表意文字變體序列」表示。中日韓兼容表意文字和中日韓兼容表意文字補充兩個字符塊的漢字,均已獲編配標準變體序列。 另一方面,統一碼自 2007 年起維護「表意文字變體數據庫」,收錄了大量漢字變體;截至 2022...
78 KB (6,896 words) - 05:59, 1 April 2025
U+0301 U+006E) 汉字一般类似于预组字符,因为它们可以分解为组成的笔划并且可以用Unicode的表意文字描述字符。 死键 Compose key(英语:Compose key) 组合字符 Unicode等价性 复杂文字编排 Unicode兼容字符 The Unicode Standard,...
3 KB (319 words) - 14:34, 2 January 2023
第十五輔助平面 · 第十六輔助平面 統一碼區段 中日韓統一表意文字 統一碼/字符(页面存档备份,存于互联网档案馆) 最初的「私人使用區」(Private Use Area,簡稱PUA)位於U+E000至U+F8FF 其中FDD0-FDEF段为“非字符”(Noncharacter)。 L2/15-280:...
45 KB (989 words) - 15:08, 13 April 2025
統一碼第 12 章定義了“表意文字描述序列”(IDS) 的语法,旨在用于描述标准中未包含的字符,即根据具有代码点的组件组合。 U+2FF0 到 U+2FFB 范围内的十二个特殊字符充当前缀运算符,以组合其他字符或序列以形成更大的字符。 这些序列对于向读者描述無法直接顯示的字符...
15 KB (1,481 words) - 19:52, 17 October 2024
表意文字,在日文文件會和中文文件中有些微不一樣的外觀,這會反映在不同地區的字體。但它們仍代表相同的資訊,即視為一樣的字符,並且在統一碼中使用一樣的碼位。 字形(glyph)這個辭彙用於描述一個特定字符實質的外觀。很多電腦字體包含許多字形,且由一個字符的統一碼碼位來對其字形做索引。...
4 KB (610 words) - 04:19, 6 January 2023
一個區段可以明確地包含未分配的碼位和非字符。 不屬於任何已命名區段的碼位(例如尚未正式使用的第4-第13平面),上面碼位關於區段的值會被設為 block="No_block".。相反地,每個分配的代碼點都有一個「區段名稱」的屬性,表示出這個文字所在的區段。這僅由代碼點確定,儘管區段名稱具有描述...
4 KB (443 words) - 09:53, 3 June 2024
中日韩笔画是一个位于基本多文种平面的Unicode区段,于 U+31C0..U+31E4 收入了38种笔画。Unicode 15.1起還加入了一個表意文字描述字符。 以下Unicode文档记录了与这一区段相关的提案: 有許多實際存在的筆畫,Unicode都沒收錄。當中有不少是因為被Unicode視為可以與其他筆畫合併,例如:...
16 KB (638 words) - 13:23, 13 March 2025
字符的集合」,如中文字符集、英文字符集,不牽涉到編碼。字符編碼、字集碼、字碼,則是「對於某個字符集,為其字符編碼」,根據語義,有時指單一字符的編碼,有時是指全部字符的編碼。 在計算機支援語言、文字的過程中,要支援某個文字,必然要搜集所使用的字符,為其編碼,因此,初期並未區分字符集和字符...
19 KB (2,576 words) - 01:51, 22 September 2024
共有65个字符,包含删除命令但不含空格。 Unicode标准(7.0版本)将1338个字符归为拉丁字母。 共有95个字符,其中52个属于拉丁字母,剩下的43个属于基本字符。 有33个字符被定义为「ASCII 标点及符号」,有时也被稱为「ASCII 特殊字符」。 共有96个字符,其中62个字符...
48 KB (927 words) - 11:12, 3 February 2025
女書是一個位於第一輔助平面的Unicode區塊,收錄了女書字符。女書是一種專門由女性使用的文字,起源於中國湖南省南部永州的江永縣。大多數的女書符號都被收錄在此區段中,除了一個用來表示疊字的符號被收錄在表意文字符號和標點區塊中。 因為技術問題,「女書」二字的漢語拼音“Nüshu”在Unicode標準中被拼為“Nushu”。...
14 KB (186 words) - 05:33, 25 May 2022
圣书体(或称圣书文,圣书字,神碑体,碑铭体)是古代埃及的正式书写体系,它由表音字母、表意文字、限定符號(類似中國六書裡面的「象形」)共同构成,并被分为音节。它拥有1000多个单独的文字图形。圣书字有三种字体,其中碑铭体(圣书体)被视为正规体,此外還有草体的「僧侣体」和简化的「世俗体」(或称大众体)。幾乎所有現代字母系統均發源於聖書體。...
18 KB (1,910 words) - 18:05, 6 April 2025
字符集中的所有有效编码点进行编码,属于Unicode标准的一部分,最初由肯·汤普逊和罗布·派克提出。由于较小值的编码点一般使用频率较高,直接使用Unicode编码效率低下,大量浪费内存空间。UTF-8就是为了解决向后兼容ASCII码而设计,Unicode中前128个字符...
37 KB (5,054 words) - 18:15, 12 February 2025
注意:Unicode字符的顯示將取決於網路瀏覽器對字符的支持度以及系統上安裝的字體。 The Unicode Character Database (页面存档备份,存于互联网档案馆)...
273 KB (35 words) - 16:52, 15 December 2024
動態組字 (category 字符编码)
Unicode標準從3.0開始,開始有表意文字序列(Ideographic Description Sequence,IDS),為採用表意文字描述字元(Ideographic Description Character,IDC)與文字部件的組合,為缺字描述定下一個標準基礎,只要加上解譯描繪的機制,也是一種動態組字的實現。...
9 KB (1,181 words) - 02:37, 22 August 2024
字符組」)定義字符。已安裝的字符集可透過定義任意代碼點、利用十進制說明的自定義簡寫擴展。例如十進制中的9881與十六進制的2699相等,故dig Gr 9881與「Gr」關聯,得出U+2699 ⚙ GEAR。 ISO/IEC 14755(英语:ISO/IEC 14755)第5.1條描述一種「簡單方法」(Basic...
15 KB (1,717 words) - 02:45, 4 March 2024
契丹小字是一个位于第一輔助平面的Unicode區段,收錄了遼朝用以書寫契丹語的契丹小字字符。 契丹小字字符沒有描述性的字符名稱,而是根據其碼位值命名。以U+18B00 𘬀 KHITAN SMALL SCRIPT CHARACTER-18B00為例,該字符的碼位是U+18B00,就被命名為“KHITAN SMALL SCRIPT...
14 KB (160 words) - 04:41, 5 October 2022
个变体选择符。这些选择器用于描述前一个字符的特点字形。目前 Unicode 已定义数学符号、绘文字、八思巴字母及中日韩统一表意文字所对应的中日韩兼容表意文字。目前 Unicode 仅定义 VS1,VS2,VS3,VS15 及 VS16;VS15 及 VS16 分别用于标示某字符应该显示为普通文字或者是绘文字。 这些字符命名为U+FE00...
7 KB (322 words) - 02:38, 7 May 2025
Toshiya)提出過「中日韓組合表意字符(CJK Complex Ideographic Symbol)」的概念,以「」來兼容各種異體,無論棋盤紋部分為何,都統一為同一個字。甚至可容許像「」這樣的字。 最後,這個漢字在2020年3月10日更新的Unicode 13.0版本裏,獲收錄至中日韓統一表意文字擴展區G區塊中。繁體字的編碼爲U+30EDE...
45 KB (4,090 words) - 04:35, 27 January 2025
箭头(有8个码点被用作绘文字)、基本拉丁字母(12)、中日韩符号和标点(2)、带圈字母数字补充(41)、带圈字母数字(1)、中日韩带圈字符及月份(2)、带圈表意文字补充(15)、一般标点(2)、几何图形(8)、几何图形扩展(13)、拉丁字母补充-1(2)、类字母符号(2)、麻将牌(1)、杂项符号和...
6 KB (699 words) - 19:33, 6 February 2025
丑牛明朝,2008年12月7日发布,包含当时通用字符集所含有“牛”部件的汉字,计516字。 花园明朝83,2009年3月17日随花园明朝发布,包含JIS X 0208:1983的所有6354个汉字及“仝”字。 寅虎明朝,2010年1月1日发布,包含当时通用字符集所含有“虎”部件的汉字,计251字。...
11 KB (283 words) - 14:42, 31 March 2025
本页面有特殊字符,操作系统及浏览器須支持特殊字母与符号才能正確显示,否则可能變成乱码、问号、空格等其它符号。 UTF-16是Unicode字符编码五层次模型的第三层:字符编码表(Character Encoding Form,也称为"storage format")的一种实现方式。即把Unicode字符...
16 KB (2,007 words) - 11:34, 8 May 2024
字符。 西夏文字符沒有描述性的字符名稱,字符的名稱是由該字符所在的碼位所決定的。例如,在U+17000 𗀀 TANGUT IDEOGRAPH-17000中,字符的碼位是U+17000,就被命名為“TANGUT IDEOGRAPH-17000”。 以下Unicode文檔記錄了定義本區塊中特定字符的目的與過程:...
27 KB (133 words) - 13:21, 17 December 2022
标记语言使用的字符编码方法(如ISO-8859),常常不能表示所有的Unicode字符,这就需要使用“转义”机制来处理这些不能编码的字符。 基于SGML的标记语言允许使用7比特ASCII字符(即Unicode的前128个码位)的序列来表示或者说引用任何Unicode字符。基于Unicode字符"码位"的字符引用被称作字符值引用。HTML...
5 KB (703 words) - 21:20, 19 April 2023
字符,以及在不同上下文中这些字符应如何变形(如组合字符、预组字符、字母附加符号等)。至于这些字符怎么以位图或矢量图格式输出以便查看,也就是对于字型的选择,则留给用户决定。如果选定的字体不含有这个码点指定的字符,一般来说会显示一个问号、一个方框,或是别的替换字符。 计算机字体使用各種技術來顯示字符...
5 KB (782 words) - 03:20, 2 April 2025
字符编入Unicode。 2017年10月,Unicode暂时为水书划定两个Unicode区段: U+1B300—U+1B4FF 水书表意文字(Shuishu Logograms;共230个字符) U+1B500—U+1B52F 水书部首(Shuishu Radicals;共47个字符)...
9 KB (1,029 words) - 13:14, 23 July 2024
kanji)。与拉丁语言不同,在东亚表意文字系统如中文、日文中,没有固定数量的字符集。一般字符集只含有8,000到15,000的常用字,另外数万个非常用字、生僻字,往往没有在各国的标准中给予编码。另外一个情况是异体字:一个表意文字(汉字)在不同的历史时期、地域产生了不同的字形,而一...
22 KB (2,805 words) - 07:15, 25 April 2024
康熙字典所收錄的字之中:䨻(52畫)。 中國境內日常生活可見的漢字:陝西麵食「𰻞𰻞麵」的「𰻞」字(寫法眾多,一般在56至68畫間。於Unicode 13.0版收進中日韓統一表意文字擴展區G內的寫法爲58畫)。 Unicode 12.0版所收錄的字之中:𪚥、𠔻(兩字都是64畫)。 Unicode 13...
53 KB (4,228 words) - 05:36, 26 March 2025
区有这种情况。在这些地方的大部分标志,使用抽象的符号代替图片,它们不能被认为是真正的「象形符号」。 文字 表意符号 汉字 表情符号 AIGA符号 表意文字 表音文字 Reed, Ishmael (2003). From Totems to Hip-Hop: A Multicultural Anthology...
6 KB (806 words) - 07:46, 4 March 2025
品,而且很多人都知道古埃及语有两三个书写系统,但现存作品中没有一份完全理解了古埃及语的书写体系。公元前一世纪西西里的狄奧多羅斯明确地将圣书体描述为一种表意文字,而大多数古典作家都认同这一假设。公元一世纪的普鲁塔克提到了25个埃及字母,这表明他可能知道圣书体或世俗体语音方面的知识,但他的意思并不清楚...
54 KB (8,505 words) - 14:33, 8 April 2025