GB/T36335-2018

信息技术藏文字符排序规范

Informationtechnology—SpecificationforcollationofTibetancharacters

本文分享国家标准信息技术藏文字符排序规范的全文阅读和高清PDF的下载,信息技术藏文字符排序规范的编号:GB/T36335-2018。信息技术藏文字符排序规范共有9页,发布于2019-01-01
  • 中国标准分类号(CCS)L70
  • 国际标准分类号(ICS)35.240.01
  • 实施日期2019-01-01
  • 文件格式PDF
  • 文本页数9页
  • 文件大小698.40KB

信息技术藏文字符排序规范


国家标准 GB/T36335一2018 信息技术藏文字符排序规范 mformationtechmoogy一Specifieatonftorcolationofrbetan characterS 2018-06-07发布 2019-01-01实施 国家市场监督管理总局 发布 国家标准化管理委员会国家标准
GB/T36335一2018 目 次 前言 范围 2 规范性引用文件 3 术语和定义 藏文字符排序原则 附录A资料性附录藏文音节和梵文转写藏文音节的一维展开 参考文献
GB/36335一2018 前 言 本标准按照GB/T1.1一2009给出的规则起草 请注意本文件的某些内容可能涉及专利 本文件的发布机构不承担识别这些专利的责任 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口 本标准起草单位:电子技术标准化研究院、青海师范大学、西藏自治区藏语文工作委员会办公 室、藏学研究中心、青海民族大学、西藏大学、科学院软件研究所、西北民族大学 本标准主要起草人:黄鹤鸣、熊涛、多拉、欧珠、安见才让
GB/36335一2018 信息技术藏文字符排序规范 范围 本标准规定了信息处理用藏文字符和梵文转写藏文字符排序原则 注,包括但不限于GB/T13000-2010,GB16959一1997,GB/T20542一2006,GB/T22238一2008中所规定的戴文 字符和梵文转写藏文字符 本标准适用于藏文信息处理 规范性引用文件 下列文件对于本文件的应用是必不可少的 凡是注日期的引用文件,仅注日期的版本适用于本文 凡是不注日期的引用文件,其最新版本包括所有的修改单)适用于本文件 件 GB/T13000-2010信息技术通用多八位编码字符集(Ucs) GB16959一1997信息技术信息交换用藏文编码字符集基本集 术语和定义 下列术语和定义适用于本文件 3.1 字符eharaeter 供组织控制或表示数据的元素集合中的一个元素 3.2 字符串 characterstring 能看作一个单独对象的字符序列 3.3 编码字符codedcharacter 被赋予编码的字符 3.4 图形字符graphiccharaecter 不同于控制功能的字符,通常具有书写、打印或显示的可视表示 3.5 占位字符spaeingcharacter 显示时占用宽度的字符 3.6 不占位字符non-spaeingcharaeter 显示时不占用宽度的字符,用于和前导的字符串相组合 注:前导的字符串可能是一个占位字符也可能由一个占位字符和几个不占位字符构成的序列 3.7 Tibetaneharacter 梵文转写藏文字符 transliterating GB/T130002010和GB169591997所收集的梵文转写藏文字母以及由这些字母的垂直组合
GB/T36335一2018 形成的字符 3.8 第一类元音typeoneoel 元音A、飞、eg禽、条贪丫以及” 3.9 第二类元音typetwvowel 元音8和o8 3.10 排序collation 给定字符或者字符串之间的先后顺序 3.11 排序元素colationelement 为了实现字符间的排序而为每个字符赋予的数值 藏文字符排序原则 4.1藏文符号、数字以及字母间的顺序 藏文中符号,数字以及字母间的先后顺序为 7h、A、小、d心、母、踏、当, 、 、H、3、,、、'、、 8,g\,、eg、,8心、 ,小、事白@,@,留、 oo、 、o、x、xx,ox、、" x、*,o,o.o,、A、至、 9、风、夕气,,<、恕、、 月 尺,,如,少少<.夕./内、"凡可、司=西西=,5、万、因5,司、?=7、弓、万,叫勺、司飘、s、或 两月界用.贝湖.就周.薄恩关臂用吼.A商.新养来 民,叫,",=,a,",天,叫,凡、 、8、工、m、nn、c" 同一个辅音字母的不占位字符要排在占位字符的后面 因此,所有辅音字母的占位字符和不占位 字符间的先后关系为,"、角、、可 1、涡、霞、员 字母叫,工,叫,作为下加辅音时,相应的不占位字符间的顺序为:g,R、品、a 元音符号之间的顺序为:a sg3务器溪言,了”点,g 图形符号有分解成w,丫、后进行排序 符号3.R"y*",\."r,",.R.,.品不参与排序,也就是说这些符号的出现,不影响一个搬文字 符串的序性 符号8,(、8e、 ,A态郎中日黑# , 旦、甲、、3、节、、|Ii、,7、 3.@.喜.喜中、天..e.@.园.点可以不参与排序,这些字符是否参与 品 、x、xx,ox、、" ×、*,O,o、0 排序由用户来决定 4.2藏文音节的排序 4.2.1藏文音节通用结构 典型的藏文音节由基本辅音字母、前加辅音字母、上加辅音字母、下加辅音字母、元音符号、后加辅 音字母以及又后加辅音字母组成 有些藏文音节有两个下加辅音,而有些梵文转写藏文字符有两个元 音 因此,藏文音节的通用结构应包含基本辅音字母,前加辅音字母、上加辅音字母、第一下加辅音字 母、第二下加辅音字母、第一类元音符号、后加辅音字母/第二类元音符号以及又后加辅音字母,如图l 所示
GB/36335一2018 第一/第二元音 上加辅音字母 后加辅音/"第二元音 又后加辅音 前加辅音字母 基本辅音字母 第一下加辅音 第二下加辅音 第一元音 图1藏文音节通用结构 4.2.2通用结构中各个位置上的字母 C 基本辅音不能空缺,基本辅音是34个辅音字母"、凡,",可 u 不,=,习,莽刮,<、西=、养、饯月,=,A 、5、N、役中的某 个;前加辅音可能空缺也可能 是辅音字母可5=*.中的某 一个;上加辅音可能空缺也可能是辅音字母灭,d,叫中的某一个;下加辅 音字母可能空缺也可能是辅音字母 个,这时辅音字母以,工,处往往变形为g、乌、?;第 叫、工、A、中的某 D -类元音可能空缺也可能是元音符号、 ..s.s.拿.滚深.S.了和中的某一个第二类无音可他 空缺也可能是元音符号&和g中的某一个;后加辅音可能空缺也可能是辅音字母可、55、可、、,风、灭 a ,叫中的某一个;又后加辅音可能空缺也可能是辅音字母"或者5 4.2.3藏文音节的排序规则 为了实现两个藏文音节间的排序,首先,把参与排序的两个音节用一个二维的通用结构表示;其次 按照特定的顺序把二维的音节展开成一维字符串(参见附录A),展开时如果某个位置上的字母空缺,则 用一个特殊字符替代,这个特殊字符的排序元素小于任何藏文字符的排序元素;最后,通过按照从左向 右的顺序比较两个一维字符串得到原音节之间的先后顺序 其中,将二维藏文音节展成一维字符串的 特定顺序为基本辅音字母,前加辅音字母、上加辅音字母、第一下加辅音字母、第二下加辅音字母,第 类元音符号,后加辅音字母/第二类元音符号以及又后加辅音字母 4.2.4受语法影响音节的分解 受语法影响的藏文音节可能不符合藏文音节通用结构 例如:受属格助词影响的音节xa、 天瓣等,受终结词影响的音节5啊等,受构形词缀9影响的音节g、朝、等以及受构形词缀 g和属格助词a双重影响的音节 对于受词缀a、和g影响而不符合通用结构的音节,排序时把词缀a,和分别看作一个独立的音 节面将剩余部分看作一个音节 这样原音节被切分成了一个音节序列,而序列中的每个音节都符合藏 文音节通用结构 示例;受诵法影响的音节R被切分成音节序列目g后,则序列中的音节s以及都符合通用结构 4.2.5特殊音节中字母之间的位置关系 对于仅由两个辅音字母左右组合形成的音节,如果第一个辅音满足前加辅音的条件,而第二个辅音
GB/T36335一2018 满足后加辅音的条件,例如5、5、x可、5F、可5、F、55、5、5、5、又吓、可以及5,则这两个辅音分 别是音节的基本辅音和后加辅音; 对于仅由三个辅音字母左右组合形成的音节,如果第二和第三个辅音分别满足后加辅音和又后加 辅音的条件,而第一和第三个辅音分别满尼前加辅音和后加辅音的条件,例如,,则这三个辅音依次 是这个音节的前加辅音、基本辅音和后加辅音 4.3梵文转写藏文字符的排序 4.3.1梵文转写藏文字符排序规则 -个梵文转写藏文组合字符可能与另一个梵文转写藏文组合字符相比较也可能与一个藏文音节相 比较 为了实现这种比较,首先,将参与排序的每个梵文转写藏文字符分解成符合藏文通用结构的音节 序列;其次,将每个藏文音节按照特定的顺序展开成一维字符串(参见附录A);最后,比较得到的一维字 符串 如4.2.3所述,将藏文音节展成一维字符串的特定顺序为基本辅音字母、前加辅音字母、上加辅音 字母,第一下加辅音字母、第二下加辅音字母、第一类元音符号、后加辅音字母/第二类元音符号以及又 后加辅音字母 4.3.2梵文转写藏文音节通用结构 梵文转写藏文音节是基本辅音字母、最多两个下加辅音字母和最多两个元音字母的垂直组合 因 此,梵文转写藏文音节通用结构由基本辅音字母、第一下加辅音字母、第二下加辅音字母,第一类元音和 第二类元音组成,如图2所示 第一/第二元音 基本辅音字母 第一下加辅音字母 第二下加辅音字母 第一元音 图2梵文转写藏文音节通用结构 4.3.3梵文转写藏文字符的分解 如果一个梵文转写藏文字符不符合4.3.2中描述的梵文转写藏文音节的通用结构,则应分解该字 符 分解算法是:将第一层的辅音字母单独看作一个音节,而将剩余字母(包括元音符号)的组合看作一 个整体 如果剩余字母(包括元音符号)的组合不符合梵文转写藏文音节的通用结构,则继续前面的过 程,直到剩余字母(包括元音符号)的组合符合梵文转写藏文音节的通用结构
GB/36335一2018 录 附 A 资料性附录 藏文音节和梵文转写藏文音节的一维展开 A.1藏文音节的一维展开 -般而言,音节是藏文字母的二维组合 为了实现藏文音节的计算机排序需要将二维的藏文音节 展成一维字母串这个展开顺序为基本辅音字母、前加辅音字母、上加辅音字母、第一下加辅音字母、第 二下加辅音字母、第一类元音符号、第二类元音符号/后加辅音字母,又后加辅音字母,见图A.1 图A.1藏文音节的一维展开顺序 如果音节在某个位置上的字母空缺,则展开式中的相应位置用一个特殊的字符来替补 这个特殊 字符的排序元素要小于任何一个藏文字母的排序元素 本标准的示例中,用符号“口"表示这个特殊 字符 示例1;藏文音节按照图A.1所示的顺序展开为5口口口口口口 示例2;藏文音节天按照图A.1所示的顺序展成一维字母串为口天口口口口口;藏文音节按照图A.1所示的顺序 展成一维字母串为口天口口口口口 A.2梵文转写藏文音节的一维展开 对分解得到的音节序列中的每一个音节按照图A.1所示的顺序展开成一维字母串,展开时如果某 个位置上的字母空缺则用特殊字符“口”来代替 梵文转写藏文音节想按照图A.1所示的顺序展开为" 口口3口口口口 示例1;梵文转写藏文字符雪被分解成音节7和3 其中,音节9按照图A.】所示的顺序展成一维字母串为 y口口口口口口口',而音节3按照图A.所示的顺序展成一维字母串为‘月口口g口' 因此,梵文转写藏文字符 3对应的一维字母串为'9口口口口口口口月口口?g口口” 示例2;要比较两个梵文转写藏文字符恐和闷;需要三个步骤首先,将它们分别分解成音节序列"四和"零;其次,按照 图 1A.1所示的顺序将音节序列"四和分别展成一维字母串,得刀口口口口口口口"口口g口口口口'和 口口口口口口口"口口3口3口口';第三,比较两个一维字母串,得到两个音节序列的间先后顺序 从而得到两个梵 文转写藏文组合字符间的先后顺序;字符恐在字符]的前面
GB/T36335?2018 [[1]IsO/IEC14651;2011Information technoogy hternationalstringorderingandcompari Methodfor tailorableorde" son comparimgcharaeterstringsanddeseriptionofthecommon template ring UnicodeTechniealsStandard10UnicodeColationAlgorithm

信息技术藏文字符排序规范GB/T36335-2018

藏文是中国的五大语言之一,其文字系统相比汉字、阿拉伯字母等较为复杂。随着信息技术的快速发展,藏文数字化处理已经成为必不可少的趋势,因此,制定标准化的藏文字符排序规范具有重要意义。

GB/T36335-2018是由国家标准化管理委员会发布的信息技术藏文字符排序规范。该规范主要针对藏文字符的排序方法和规则进行了明确和规定,旨在规范藏文字符的使用,促进信息技术在藏文数字化处理中的应用和发展。

规范内容

GB/T36335-2018规范了藏文字符排序的具体内容,主要包括以下方面:

  • 字符集:规定了使用的字符集范围和编码体系。
  • 排序规则:规定了藏文字符的排序原则和方法,包括基本排序规则、特殊情况下的排序规则等。
  • 排序方法:规定了按字形、音形和意义排序的具体方法和步骤。
  • 应用范围:规定了该标准的适用范围和限制条件。

意义与影响

GB/T36335-2018的发布对于藏文数字化处理和信息技术应用都具有重要的意义和影响:

  • 促进藏文数字化处理:规范藏文字符排序,能够提升藏文数字化处理的效率和质量,为藏文信息化建设奠定坚实基础。
  • 保障信息传输正确性:规范藏文字符排序,能够避免信息传输中出现乱码等问题,确保信息的正确传输。
  • 促进信息技术应用发展:制定标准化的藏文字符排序规范,能够推动信息技术在藏文数字化处理中的应用和发展,促进藏文信息产业的发展。

结语

信息技术藏文字符排序规范GB/T36335-2018的发布是藏文数字化处理和信息技术应用发展中的一大进步。各相关领域的从业人员和爱好者应该认真学习该规范,做好藏文字符排序工作,推动藏文数字化处理和信息技术应用的进一步发展。

和信息技术藏文字符排序规范类似的标准

信息技术藏文词汇

智慧城市软件服务预算管理规范
上一篇 本文分享国家标准智慧城市软件服务预算管理规范的全文阅读和高清PDF的下载,智慧城市软件服务预算管理规范的编号:GB/T36334-2018。智慧城市软件服务预算管理规范共有9页,发布于2019-01-01
信息技术远程视频柜员机第1部分:设备
本文分享国家标准信息技术远程视频柜员机第1部分:设备的全文阅读和高清PDF的下载,信息技术远程视频柜员机第1部分:设备的编号:GB/T36336.1-2018。信息技术远程视频柜员机第1部分:设备共有33页,发布于2019-01-01 下一篇
相关推荐