諺文兼容字母是一個位於基本多文種平面的Unicode區塊,包含了與韓國官方標準KS X 1001(原KS C 5601)兼容的諺文字符。本區塊在1.0版本的名稱為諺文要素(Hangul Elements)。 下列與Unicode相關的文檔記錄了在諺文兼容字母區塊中定義特定字符的目的和过程: 諺文字母列表...
4 KB (144 words) - 03:50, 22 July 2022
ɡɯɭ])一称为其中文译名,俗称「朝鮮字母」、「㐎(wén)」、「训民正音」等,是朝鮮語所使用的表音文字。15世纪,在朝鮮王朝(1392年-1897年)第四代君主世宗(1418年-1450年在位)的倡导下,由世宗本人于1443年正式创建,并在1446年与几位学者颁布使用。 一些谚文字母已经不再使用,称为古諺文。现在仍在使用的諺文字母...
129 KB (3,185 words) - 16:58, 29 May 2025
以下文字並非諺文字母的一部份,但會與其他諺文字母混用: 填充字元 諺文兼容字母區段:U+3164 諺文字母區段:U+115F(初聲)、U+1160(中聲) 漢陽造字區:U+F784(初聲)、U+F806(中聲)、U+F86A(終聲) 半型字母區:U+FFA0 傍點(방점,存在於古韓語)...
39 KB (234 words) - 05:13, 28 June 2022
預組的諺文音節,尤其是現代標準語中沒有使用的音節。 以下Unicode文檔記錄了定義本區塊中特定字符的目的與過程: 諺文字母列表 諺文字母擴展-A 諺文字母擴展-B 諺文兼容字母 諺文音節 Unicode character database. The Unicode Standard. [2016-07-09]...
7 KB (126 words) - 03:50, 22 July 2022
諺文音節是一個位於基本多文種平面的Unicode區塊,包含了現代標準語中使用的預組諺文音節。這些音節可以通過算法直接映射到諺文字母區塊中的兩個或三個字符的序列: 位於U+1100..U+1112的字符:19個現代諺文的初聲輔音字母; 位於U+1161..U+1175的字符:21個現代諺文的元音字母;...
14 KB (704 words) - 11:11, 17 October 2022
本页面有古諺文,操作系统及浏览器須支持特殊字母与符号才能正確显示为古諺文,否则可能變成各个独立的部件、问号或者方块。 古諺文指現在已不使用的一些諺文字母,也可以指使用該種文字書寫的古文。韓語稱爲「옛 한글」、「옛글」或「아래아한글」,中文中一般也叫着古韓文,老韓文,舊朝鮮文...
8 KB (1,299 words) - 10:10, 25 November 2022
諺文字母擴展-A是一個位於基本多文種平面的Unicode區塊,包含了古諺文輔音叢的初聲形式。它們可以用來動態組成Unicode中沒有預組的諺文音節,尤其是現代標準語中沒有使用的音節。 以下Unicode文檔記錄了定義本區塊中特定字符的目的與過程: 諺文字母列表 諺文字母 (Unicode區段) 諺文字母擴展-B...
5 KB (115 words) - 11:31, 19 December 2022
半形及全形字符 (Unicode區段) (category 諺文字母)
内的半形片假名——参见半形假名。 U+FFA0..U+FFDC 编码了谚文KS C 5601 1974年版的諺文兼容字母。其对应的字符用于 IBM 的韩文编码页 933,其中包括 Shift In 和 Shift Out 的字符以对应双字节编码。基于双字节编码可能包括兼容字母,本区段包含了部分半形变体以便可以无损从 KS...
12 KB (502 words) - 06:27, 4 November 2023
諺文字母擴展-B是一個位於基本多文種平面的Unicode區塊,包含了古諺文元音和輔音叢的中聲及終聲形式。它們可以用來動態組成Unicode中沒有預組的諺文音節,尤其是現代標準語中沒有使用的音節。 以下Unicode文檔記錄了定義本區塊中特定字符的目的與過程: 諺文字母列表 諺文字母 (Unicode區段)...
4 KB (121 words) - 03:50, 22 July 2022
㈦ ㈧ ㈨ ㈩ ㈪ ㈫ ㈬ ㈭ ㈮ ㈯ 323x ㈰ ㈱ ㈲ ㈳ ㈴ ㈵ ㈶ ㈷ ㈸ ㈹ ㈺ ㈻ ㈼ ㈽ ㈾ ㈿ 324x ㉀ ㉁ ㉂ ㉃ ㉄ ㉅ ㉆ ㉇ ㉈ ㉉ ㉊ ㉋ ㉌ ㉍ ㉎ ㉏ 325x ㉐ ㉑ ㉒ ㉓ ㉔ ㉕ ㉖ ㉗ ㉘ ㉙ ㉚ ㉛ ㉜ ㉝ ㉞ ㉟ 326x ㉠ ㉡ ㉢ ㉣ ㉤ ㉥ ㉦...
263 KB (20 words) - 16:20, 15 December 2024
通用字符集包括了其他所有字符集。它保证了与其他字符集的双向兼容,即,如果你将任何文本字符串翻译到UCS格式,然后再翻译回原编码,你不会丢失任何信息。 UCS包含了已知文字的所有字符。除了拉丁字母、希腊字母、西里爾字母、方體亞拉姆字母、阿拉伯字母、亚美尼亚字母、格鲁吉亚字母,还包括漢字、假名、諺文这样的方塊文字,UCS还包括大量的图形、印刷、数学、科学符号。...
10 KB (1,503 words) - 12:59, 29 January 2024
X 1001是韓國用於書寫的諺文和漢字的字元編碼規格。以前稱作KS C 5601,現在多稱作KS X 1001,有时也简称为KS編碼。 其与JIS X 0208的94×94字集类似,包含諺文2,350字、漢字4,888字、英文字母、數字和假名共,8226字。諺文是由字母...
4 KB (644 words) - 09:33, 13 November 2023
Unicode字符平面映射 (redirect from 基本多文種平面)
第十五輔助平面 · 第十六輔助平面 第一輔助平面又稱多文種補充平面(Supplementary Multilingual Plane,縮寫SMP,或簡稱Plane 1),主要擺放絕大多數古代文字,現時已不再使用或很少使用文字、速記、数学字母符号、音符、圖形符號及用于学者的专业论文中使用的古老或过...
45 KB (989 words) - 15:08, 13 April 2025
文。現在亞洲不少民族使用的字母与天城文的关系密切,而从帕拉瓦文派生的文字则在緬甸、泰國、柬埔寨、老撾等地使用。 作為婆羅米系元音附標文字,天城文基本原理是多數字母表示一個輔音,并承載一個固有的元音a [ə]或[a]。例如字母क讀作ka,兩個字母कन讀作kana,三個字母...
111 KB (3,065 words) - 16:29, 19 April 2025
解析器写得很差(并且与当前标准的版本不兼容),那么它接收到一些伪 UTF-8 时会将其转换成看似正确实则错误的 Unicode 输出。处理八位表示的校验例程可能遗漏一些信息。 正则表达式可以进行很多高级的英文模糊检索。例如,[a-h]表示 a 到 h 间所有字母。 同样 GBK...
37 KB (5,054 words) - 18:15, 12 February 2025
本页面有藏文字母,操作系统及浏览器須支持特殊字母与符号才能正確显示为藏文字母,否则可能變成乱码、问号、空格等其它符号。 藏文(藏語:བོད་ཡིག་,威利转写:bod yig,藏语拼音:Pöyig)是藏语、宗喀語、锡金语、普米语等语言的文字系统,基本上是一種元音附標文字,它根據古典藏語语音而建立,共三十个字母...
37 KB (2,709 words) - 13:28, 28 April 2025
定序、繪製、雙向文本顯示、书写方向、字符特性(如大小寫字母)等等。此外還提供參考資料和視覺圖像,以幫助開發者和設計師正確應用標準。 Unicode備受認可,為ISO納入国际标准,成為通用字符集,即 ISO/IEC 10646。Unicode兼容ISO/IEC...
52 KB (4,585 words) - 03:30, 21 April 2025
字母擴展字符可能不支持阿拉伯字母特性。 C0, C1控制字符 注音符号擴充 中日韩統一表意文字、扩展A区有字形改动的汉字 中日韩統一表意文字補充、扩展A区補充 假名补充、假名扩展-A、假名扩展-B、小型假名扩展 中日韩統一表意文字扩展B区、扩展C区、扩展D区、扩展E区、扩展F区 部分中日韩兼容表意文字和中日韩兼容表意文字补充区的汉字...
12 KB (1,270 words) - 15:09, 9 February 2025
除了漢字以外,一些片假名寫成的外來語也可能使用注音標示原文。 以下的例子將會使用平假名、片假名、罗马字注示日语中的「東京」: 以下的例子將會使用注音符號、小儿经与汉语拼音注示汉语中的「北京」: 以下的例子將會使用諺文与羅馬字注示韩语中的「韩国」: 以下的例子使用越南語字母注示越南语中的“河内”:...
14 KB (1,041 words) - 06:51, 17 May 2025
区域指示符 (category 繪文字)
包含偏见。一个被驳回的编码提案是,在保留旗帜的情况下,称它们为「绘文字兼容字符-n」(EMOJI COMPATIBILITY SYMBOL-n)并以标准「EC n」显示,而不展示它们代表的旗帜;另一个被驳回的提案为676种双字母组合中每一种都分配了码位,以ISO...
51 KB (1,185 words) - 21:05, 21 May 2025
印度語言音譯:由Avinash Chopde發明的一套7位元ASCII標準的音譯方案,常見於Usenet網絡。 HTML用梵文音譯字母:源自阿根廷,同樣兼容7位元的ASCII標準。 印度文字信息互換代碼方案(1988年) 加爾各答國家圖書館羅馬化 漢語的羅馬化,在某些層面上被証明是一個困難的...
33 KB (3,279 words) - 22:03, 18 April 2025
他字母的Unicode名稱都以「拉丁小寫字母」(latin small letter)作為開頭。 一些字母系統具有上述的性質:如視話法,可以從符號的形狀知道喉、舌、唇的運動,進而推測出其音值;諺文的形狀則和調音器官有一定的關係。 記音中使用的正確尖括號是數學符號「⟨…⟩」(U+27E8和U+27E...
100 KB (10,402 words) - 11:29, 21 April 2025
文字 (Unicode) (redirect from Unicode收录的文字)
字母字符组成,包括:大写字母、小写字母和修饰字母。一些字符被认为是一些预组的连字的标题字母,例如Dz(U+01F2)。此类标题连字均采用拉丁语和希腊语文字,并且都是兼容字符,因此Unicode不鼓励使用它们。将来不太可能添加新的标题字母。 大多数书写系统不区分大小写字母。对于这些文字,所有字母...
10 KB (1,420 words) - 17:14, 24 October 2022
key) 组合字符 Unicode等价性 复杂文字编排 Unicode兼容字符 AltGr键 Unicode: 拉丁字母擴展-A 拉丁字母擴展-B 國際音標擴展 (Unicode區段) 拉丁字母擴展附加 拉丁字母擴展-C 字母表達形式 Diacritiques de l'alphabet latin(法语:Diacritiques...
65 KB (194 words) - 21:50, 18 November 2023
本页面有越南语的喃字,操作系统及浏览器須支持特殊字母与符号才能正確显示为喃字,否则可能變成乱码、问号、空格等其它符号。 中日韓統一表意文字(英語:CJK Unified Ideograph),又稱統漢碼、統一漢字集(英語:Unihan),是指在ISO 10646與統一碼標準中經過「漢字等同」處理的漢字。漢字等同(英語:Han...
78 KB (6,891 words) - 05:59, 1 April 2025
Unicode數字 (section 富文本和其他兼容数字符号)
字母存在较大差异。为了支持这些字母的差异,Unicode将这些数字编码包含在许多書寫系統區塊之中。小数在23个独立的块中重复:在阿拉伯مرات باللغة العربية中出现2次。六个附加的块还以富文本形式包含了数字,其主要是作为一个专门的数字使用的字母...
5 KB (419 words) - 19:49, 8 August 2024
谚文书写。但不同的地方在于,韩国在部分情况下(如韩国身份证上的姓名、部分的专业书籍或资料必须要用汉字标注等)依旧使用汉字标注或韩汉混用书写。而朝鲜和越南则彻底废除了汉字,并将汉字列为外语(中文)来学习。 歷史同樣悠久的東巴文則為象形文字。 古希伯来字母早已消亡,现今的希伯来字母是在阿拉姆字母...
93 KB (12,449 words) - 13:24, 28 May 2025
字母、西里爾字母、阿拉伯-波斯字母、希伯來字母及婆羅米文字,其中發源於中東的阿拉伯和希伯來字母從右到左書寫。 東亞的漢文化圈国家所用文字因其以音节为文字字符基本单位的特性,大部分既可縱書也可橫書。傳統漢字、以及受其影響的日文和朝鮮文...
66 KB (5,700 words) - 19:31, 3 May 2025
字母上標上法語的長音符號^表示,或者在後一個母音字母後加一個-r或者-h表示。現代上海話上聲和去聲合併,如果有必要區分上聲和去聲,加-r表示去聲,加-h表示上聲。 由于現在上海話聲調作用有限,聯拼時候只需標出重讀音節,即第一個音節和-之後的第一個音節。詳見下文...
34 KB (2,568 words) - 16:28, 19 April 2025
t k],而非其它拼音方案所用的-p、-t和-k,使之與不送氣塞音聲母一致。聲調以上標數字顯示,而非變音符號。 這一系列的拼音方案兼容性較差,只能紀錄粵語、客家話、閩語的某幾個方言點,而不能紀錄這三種語言的大多數方言點。因此在漢語方言學的語音紀錄中,往往仍採用國際音標來紀錄語音。...
4 KB (522 words) - 09:29, 4 January 2025
的罗摩衍那标志着现代马拉雅拉姆语的诞生。Ezhuthachan的作品也巩固了马拉雅拉姆文,这种文字混合了泰米尔瓦泰卢杜文(英语:Vatteluttu)和古兰塔文元素,产生了能兼容印度-雅利安语和达罗毗荼语音素的字母表。今日,它是22种印度官方语言之一,且在2013年获得印度政府承认为古典语言之一。...
60 KB (8,450 words) - 07:20, 27 February 2024