GB/T36337-2018

信息处理用藏语词类标记集

Theparts-of-speechtaggingsetforTibetaninformationprocessing

本文分享国家标准信息处理用藏语词类标记集的全文阅读和高清PDF的下载,信息处理用藏语词类标记集的编号:GB/T36337-2018。信息处理用藏语词类标记集共有24页,发布于2019-01-01
  • 中国标准分类号(CCS)L70
  • 国际标准分类号(ICS)35.240.01
  • 实施日期2019-01-01
  • 文件格式PDF
  • 文本页数24页
  • 文件大小2.48M

信息处理用藏语词类标记集


国家标准 GB/T36337一2018 信息处理用藏语词类标记集 IhepartsofspechtageingsetforTihetan informmationprocessing 2018-06-07发布 2019-01-01实施 国家市场监督管理总局 发布 币国国家标准化管理委员会国家标准
GB/36337一2018 目 次 前言 引言 范围 2 术语和定义 标记符号 词类标记集 词类标记集中主要词类的特征 词类及标记代码的说明 参考文献 20
GB/36337一2018 前 言 本标准按照GB/T1.1一2009给出的规则起草 请注意本文件的某些内容可能涉及专利 本文件的发布机构不承担识别这些专利的责任 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口 本标准起草单位:电子技术标准化研究院、西藏大学、西藏自治区藏语文工作委员会办公室、西 北民族大学、青海师范大学、青海民族大学、科学院软件研究所、西藏自治区工业和信息化厅 本标准主要起草人:扎西加、欧珠、尼玛扎西、熊涛、格桑多吉、多拉、拉巴泽仁、大罗桑朗杰、高定国、 拉琼、仁青诺布、索南尖措、旺堆、小尼玛扎西、普次仁、顿珠次仁、赵栋材边巴嘉措
GB/T36337一2018 引 言 本标准以现代藏语的词类和分词研究成果为基础,根据藏文自身的词汇特点与构词规律,并参考汉 语分词及词类标记相关标准(见参考文献)的内容,规定了信息处理中藏语词类标记集 IN
GB/36337一2018 信息处理用藏语词类标记集 范围 本标准规定了信息处理中藏语词类标记集 本标准适用于藏文信息处理各领域,其他行业和有关学科可参照使用 术语和定义 下列术语和定义适用于本文件 2.1 o hh,Pos 词类parts speech 依据词的句法功能原则所划分的类 2.2 分词单位segmentumit 在分词过程中出现的词 注分词单位不仅限于语法词,其中也包含了信息处理所需的一部分结合紧密,使用稳定的词组 2.3 词类标注POstagsing 对分词文本中的每个分词单位标注上词类的过程 2.4 藏文信息处理Tihetaninformatiomproessing;TIP 用计算机对藏文的音,形、义等信息进行处理 标记符号 本标准中标记符号采用英文字母、汉语拼音字母及藏文拉丁转写字母 词类标记集 名词命5>n) 4.1 表示人和事物的名称或时间,处所、方位等,在句中主要充当主语和宾语 一般名间j对yF永5?(nm),表示人和事物的名称 a 示例: 积智刮和刘R咧即司g代去刮 人名《5p(nr),表示人的名称的专有名词 b 示例: 可=一顽3w女咚妾苦会智"叫等智ur响叮5可叮苦会51
GB/T36337一2018 地名《啦实5p>(ns)表示地理区域名称的专有名词 c 示例 武可叫头递驾"叫aF天你5可新吓零5可女矛w吓 国名哥"p=jc>ng),表示国家名称的专有名间 d 示例: 巧可 可55弯天a三不可 族群各安w"诺四Ri5ne),表示民族、人种,部落,文种,.语种名称的专有名词 示例 丐啊g&啊5啊产啊可吓叔啊响5啊丐鞠和啊弯呐丐啊音苦叫 团体机构名na),表示团体、组织,机构名称的专有名词 示例: s9we"雪"美千叫习可新弯恐对5诚w划乎*新w对 专有名词新大5s>(nz),表示历史的重要事件、运动,商标,少数收人词典的书名报刊 名,现代科技术语等名称的专有名词 示例 碗要可利咱-不努j千西5节可闪g三四i醉aw"a寒w女何浊可灭咱 书啊下啊”匆为叫守守胸哥长"飘R四w响有响灭a面ws 辞藻'a对>no),表示修饰文词的典故或华丽的词语等 示例: ag和a到破a乖闻劳咚匹折响习零高弯 数称词Nanm),表示数称的词 示例 g"四&R曾种教"5"-9响美w啼洲5e诉p响侧 处所方位词可w>(nf),表示处所方位的词 示例 g可顽x新5列F1乖1可心可s雪列g新新 5可4"可5型"可引aq列求e风ai西 k 时间间5"女响我Y(a),表示时间的间 示例 9*何5气阿新四m对新新g药啊对河F对 嘛s5<闻5脊歌aE对划闻司那刮那刮不和部 动名词ga时?nv),作为主语或宾语时以动词组成具有名词性质的词汇 D 示例: 穿千啼暂斯"黄=唠训5嚷有 名<虽砍8er?an),眼务眼称、.头衔等 m 职衔名
GB/36337一2018 示例 自mR飘55事吓s3问弱s5p对吓和新吓弯诞歌 数词<想种"1> 4.2 m 表示数目的多少或次序 计数<闪可习P>mj) a 示例 吓驯驯国e叫意于警5"s产5g零g5g时 序数刮"p>(mx) b 示例 郑喉g下受叫智还新景5寸*g零5可奇 概数邀却=对守(me) 示例 aA四"枣ww"s=Sss5列 3量词( 4,4 表示人称、疑问反身、叙述的词 人称代间吓下纲#g一守EP(e a
GB/T36337一2018 示例: 5丙丙矛丙新一消g黄gs千消丙勾黄s避s=5可叫 疑问代词对部女响5P(r) b) 示例 自可啊刊景5ag食种可-a5意咧5可 指代词斯可奇Y(n" c 示例 F希渐ap智a即和想叫可5a代刘吓=1问R叫 R可叫R叫避R"s吠叩i5"S 反身代词但Ewg动?() d 示例 x|天话am5 动娜冬响?) 4.5 表示动作行为的词 不及物动词5a>(m a 示例 风西agEdE5五划 及物动词5国ra>(o b 示例 警零千强a西划野吓 判断词手#?( c 示例: a呵欢对 存在动刚w对有a知?(e d 示例 a5警51可5叫歌注sS|可N 助动词s一金号>(v) 示例 V5 飘飘沟5和y a刮啊55m叫却乖1呵 吗5F歌1到 形容词新jY(a) 4.6 表示人或事物的性质、质量、,颜色、形状、数量,面积的词 一般形容间9t(a) a
GB/36337一2018 示例: 欢e只画可 谓语形容词g9>(ad) b 示例 闪 定苏a三列 状态词E5零"新tn 表示事物的性质、体态、声态、动态的词 示例 颜式"到a眨e"面顽可一勺要5w对要驾'驾邻部a三xe5零零 对5a'aa eE斯aceF|乖乖想*零西a刘5还部不“5凡飘a面近渐 弯1s四和暂厂F|==可 4. 拟声间智零"tac? 拟声词又叫象声词、摹声词、状声词,是摹仿自然声音构成的词 示例 1可亏5Essw51智实乎母天ga 说明动作行为或状态性质等所涉及的范围、时间、程度、频率以及肯定或否定的词 程度副词5=新实=5>(de) 示例: 啊可月55=时=酬刮去飘天可和"勺" 邻<坏5g吓耐g5s吓g5刊5可灰到可 时频副词5w刮实=5dp b 示例: 新守勺斯勺5g*55吓不u|ae勺嘛""刊 那对15女冈可5可5吓可s<这a"零-1 ess&可不可 范围副词g对巧5'(dw 示例: 飘书啊那e叫要如乖种新啊=对啊巧网aa勺吓可
GB/T36337?2018 ?w??ea?а dx) ?ad d ?: 8Ny|uc5?????:??5555? R??a?пs= =#?в??e ?m?e e ?: ?aK(dw fD) ? uuF1uF5FuEuwu5uF55F153F|uE" ?=P(w 4.11 ?????????? ??5"wοEPw) a ? ????F| b ?i5?(" ? н=Ф?? ?wE'js>(ab) ? S=e ?'?""jc?u) d ?: ?-1 ??Щe?-YG (uz ?: ?ФФФ β?5e??ul) fD) ? ?
GB/36337一2018 412位格S叫>(D 业格() 4.12.1 示例 驯习可可叫5 4.12.2为格诉5>g 示例: 斯5新g刊和5 依格四-w(D) 4.12.3 示例: 习习可可叫利 4124同格兮5?>e 示例: x"EL_as工_ld母N_vLww 4.12.5时格密开那>(h) 示例 虾_nt天_Ih派_ ww 4.13 具格驴D 4.13.1施事格5予>(bo 施事格助词有,响叫叫 示例: _rgw_b哥_xtLww 4.13.2工具凭事格(ba) 工具凭事格助词有ay 示例 智_nmmN_bE_mms5_Lww 材料凭事格"鲁>\(te) 4.13.3 材料凭事格助词有ay 示例 nj_b女L- 5a ww 4.13.4方式事格(hy) 方式事格助词有,a叫
GB/T36337一2018 示例: 5_d对_byFN_vLww 4.13.5缘由格酒识(g 缘由格助词有,a叫y 示例" 和哥-mAmN还_g_tR-hgee*-nm系-L ww 属格(e),属格助词有守刨可叫 示例: _r-gi4s_mLww 源格a号gs>们 4.15 源格'AgF您5s>Gie),源格助词有不as叫 示例: 雪递_m不_jg寸_nmnN_e_ww新5海_nnae心"-_jg58闪_vel_ww 单纯连娜(吓gF>(e" 4.16 据引连词呵(ev),据引连词有可 a 示例: _nnR_rzagi"_nn_nn刮"_dP_v可_cww 引指连词raPY(eb),引指连词有叫不 b 示例 祈_a活闪_nnag;新"_nna_el_ww 衔接连词'a去sw暂(c),衔接连词有永剪&11年1不 示例 实-nn刮_di_iw"_nn_vy;矛_er5R_vLwwP_vF_cnL_ww 瓦_yt意-cnL_ww “宝-a干_cnL_ww “呀_y风_cnL-ww 5s d 比较连词"吓adb比我连间有.,“叫 示例 所-raw"_-e==-Lww盈-K_rw-山5R_wi_E_r斗_-ve-ww 所指连词w手p?(e),所指连词有叫 示例 "_nmR-5m_mR-ei闪-m(_uww R 添加连词贝(ck),添加连词有 f
GB/36337一2018 示例 响脚_丁!言-k所_mLww 统分连词(下到g'(cd).统分连词有5FT g 示例: 55"_m定wLwia-Eae天病-5F_叫ja际_a献_号_H5s_x ww 缘由连词5惠双话ca),缘由连词有5F" h 示例: 5T_nm叔活'曰vt5F_ca我_nm又_laN_iLww 时间连词5F到"蚤>Ye),时间连词有5F" 示例: F_nrx新_亏却"-_nn7对_i5F_x95_dw刮"wN"g5四诃-_nse-_laN_-i_en 可5A'_vc_uz_ww 随同关系连词gRg响新R5F到 ce),随同关系连词有;55" 示例: V --顾道内_ma_cR-r-5F_天对女_h不_dsp_-Yi面令_w-L -_nn ww k 复加桥接连词我冬->(cdf,复加桥接连词有;吓"uE1aF" 示例 R_口呀-y-ca-今啊-对-_.d丐-Lw 司却尽可t叫刮>(cz),转折桥接连词有1uF|aA" 转折桥接连词 示例 可万_nn_rzAr"_l可万"a5_nn风=ar"_vtN_vi_cww 大_rr"_bo西'"叩活_xx母 3N_-lww 复指连间响乖发5\cen),复指连词有;想吓“-a51 m 示例 5_nm_dwe"-_I天-vtuE_c-L_ww 关系引连连间'却a些节cep),关系引连连词有列R n 示例: “啊-今ELww母不_HR-gLwwg_只良gLww 具指连词a到ce),具指连词有意aNN 示例: 可w'N_m尺K_vi可_cv95y(尽可_nmR_六w_ccNN_Lww 释疑连呜响新(ce>),释疑连词有汹示不问刊 示例 rr风百足5_ns舌雪A"_nra可_esLww I双5列 分义连词(aj(cm),分义连词有-可咧二5刊手利5咧买a天刮a
GB/T36337一2018 示例: 型工_dp心_ls haA包-ma家-m嘟顿_对新型_-dm 疑问连词写可>(ey),疑问连词有.可二列5刮可可列天a列工a<刮5列 r 示例: -a5"_v对-t买-dl-vi闯w_eyL 新祈_nna@5_v可_e,尽K5R_nnF- WW 数起止连词"'">er),数起止连词有可 s 示例: _mj_rg_mj_nfLww 境起止连词g"5叩>(),境起止连词有千 示例 驾"'_ns可"_ej'_nsA_gi闪不_nfL_ww 时起止连词S5"号5"?').时起止连词有,环种5 u 示例: 可-R_nr再w-ep闪_mi尽天_Lww aA 区别连词57>(ep),区别连词有, 5 v 示例: $ 时度-后平F_-H-呜-ww尽-m青_呵-小_-啊m感-喝-m" a_adL_ww_nna-_iF_ni问_x_mms 树 L_ad 4.17复合连词5a5>(c) 语义转折连词训->(m) 4.17.1 示例 呀气w5弯新R节刊码y51 4.17.2 语义关联连询一啼吓中响歌>(e 示例 R叫Rwc西司5i可晰号"司必"司s闯那wF1555155 4.17.3泛指关联连词g象d脑确首>(a) 示例 吓5和不吓食缸啊|啊下忘ws 假设关联连词s等奇红f>(n 4.17.4 示例 咏啊钢习害又啊刊F5*F刊 0
GB/36337一2018 418词缎电jp(h) 后接成分一刊日Ap>(hz2) 后接成分仅限于在年月日等数字后面作为后缀出现的"”,“勾”等和其他数字后面出现后缀形成 序号的类型 示例: 司'KhA/N口//3/K/hz/等的后缀 4.19成语习语,谚语)杀>(xm) 语言中经过长期使用、锤炼而形成的固定短语 示例: 零a时袋跃1问舌R刮四"气新啊赚不不何57寸和吓新叫 寻工'勺 语素<5=到>(iD) 4.20 示例: 千可叫可51奇 标点符号亏( 4.21 示例 eP g8 非藏文a可可'>t 4.22 示例: H,O汉文PHGDPkglnmTB 4.23 楚文A智?(cs) 示例 _sk亏_sk 词类标记集中主要词类的特征 5.1名词 名词的主要特征: -般带具格助词时作主语; b -般带位格助词时作宾语 带属格助词时作定语(领属定语始终也在前,而中心名词在后); -股不受副间修饰(5e安有x) d 缺乏直接充当谓词的功能; 后面可以加数量词组; 前面不能加否定副词刮刻(×甜亏×). g 11
GB/T36337一2018 5.2时间词 时间词的主要特征 是名间中分化出来的,可以在训语之前作状语,这是一般名词不具备的能力 a) b) 通常带时间格标记 5.3方位词 方位词的主要特征: 是名词中分化出来的,可以在谓语之前作状语; a b)能带依格助词与从属格助词 -般由名词与方位名词组合 c 5.4动词 5.4.1及物动词 及物动词的主要特征: a) 有时态变化; 通常带具格标记; b) 能受涉事宾语; c 别 前面可以加否定副词刮 d 5.4.2不及物动词 不及物动词的主要特征 只能带间接宾语不能带直接宾语 a b) 通常情况下不带具格标记: c 大部分不带祈使式 5.4.3判断动词 判断动词的主要特征 在意义上不表示动作; a b) 在句中作谓语时,只联系主语和宾语的作用,判断主语的类别或属性 有人称的区别 c d)作谓语时,一般主语和宾语都不加动助词 5.5形容词 5.5.1 一般形容词 -般形容词的主要特征 别 -般前面可以加否定副词刮 a 可以与副词组合; b 可直接用在名词之后作定语 c d 形容词修饰位置有两种情况:1)N+(A);2)A+(属格助词)+N; 可以作定语; e f 可以用“a+十a”的形式提问; 12
GB/36337一2018 重叠后表示语义加强a十p十a g 5.5.2谓语形容词 谓语形容词的主要特征 -般句中可以作谓语 aa b -般位于句子末尾; 可以与副词组合 c 5.6副词 副词的主要特征 只能与动词形容词组合; a b)句中作状语的能力; c 大部分词为实词和虚词的组合; d)部分副词是实词和格助词,连词构成 5.7数词 数词的主要特征 前面不能加青定副词“划刘" aa b) 经常与量词结合; 不与副词组合 (俩何望x d 用在名词之后作定语 5.8量词 量词的主要特征 经常依附数词人句而作定语; a b 没有时态变化; 前面不能加否定副词"刮刘" 5.9代词 代词的主要特征 句中充与它所代替的词语能力 a b) 有明显的单复数之分; 疑问代词可以与行为动词组合,判断动词组合、助动词组合 c d 可以和形容词组合; 前面不能加副词与否定词“刮” 5.10状态词 状态词的主要特征 a 从形容词中分化出来的,不能作状态词 b 前面不能加否定副词“列" 可以ABBAAABAB形式重叠; c d)不与副词组合 13
GB/T36337一2018 5.11助词 助词的主要特征 表示“愿意”“能够”“可能”“必然”“比喻”等情态; a D)表示动作的“趋向”“状态”等意义; 用于句末来表示所要达到的意思完结、告一段落,句型独立,不再与后面的语句发生任何形式 c 的结构关系; d 附着在动词上可以表示经历进行、完成的语法意义 5.12格助词 格助词的主要特征: 在名词或名词性词组之后时起介词的作用; a b表示句子成分之间的句法、语义关系 5.13连词 用于连接词、词组或句子,以表前后有并列,递进、转折,因果、假设等关系 5.14叹词 叹词的主要特征 通常不与其他词发生特定的关系 a b)不能充当句子成分,有时能独立成立 5.15拟声词 拟声词可分为 语言结构中主要功能是充当修饰语; a 可以重叠,其方式多为ABAB、ABA、ABB,BBA式 b) 词类及标记代码的说明 6 词类及标记代码的说明见表1 表1词类及标记代码的说明表 大 大类 大类细类标记 汉语 藏语名称 词类代码的说明 序号 类 标记序号代码 名称 取英文的“noun”的首字母和英文名 -般 E j部对55 nn 名间 词“normal”的首字母 取英 "的首字母和"人”"的汉 文“noun” s" nr 人名 语拼音首字母并在一起 取英文“noun”的首字母和藏文拉丁 s" 地名 ns 转写“sachu"”的首字母并在一起 类 取英文“noun”的首字母和“国”的汉 驴j新 国名 ng 语拼音首字母并在 起 族群取英文“um”的首字母和英文“t ethnic w弯美as1 ne grup"族群的首字母并在一起 14
GB/36337一2018 表1(续 大类 大类细类标记 汉语 藏语名称 词类代码的说明 序号 类 标记序号代码 名称 机构 取英文“noun”的首字母和英文 alg5叫s" na 团体 ‘agency "的首字母并在 起 专用取英文"noum”的首字母和“专”的汉 '勾万可s nZ 名词 语拼音首字母并在一起 字 辞菜 母和英 取英文“noun”的首 s no “ornatedietion”的首字母拼在一起 词 文 首 字 数称 取英 noun的 母和英 可5'a nm “numeral”的第三个字母并在 词 词 处所方取英文“noun”的首字母和“方”的汉 "对5s" 、 类 10 位词 起 语拼音首字母并在 取英文“noun”的首字母和英文“ime" 时间 AEn 5新T ll nt 词 的首字母并在 动名 取英文“noun”的首字母和英文“verb” 12 g'a nv 的首字母并在 词 职衔 取英文“noun” 字母和“衔”的汉 家s" 13 nx 语拼音首字母并在 名 取英 "numera”的第 字母和 14 m 马习5习5 计数 “计”的汉语拼音首字母并在 数 取英文“numeral”的第 字母和 15 二 序数 nm mx 起 取英 numeral”的第 字母和 x5 概数 16 mg “概”的汉语拼音首字母并在 起 取“quaniier”的首字母和“度”的汉 度鼠 aE"可对家1 17 qd 远 语拼音首字母并在 个体 auantifier”的首 18 天奇s" qg 量词 量 集体 mnifie”的首字母和"集 取英 美s 19 qu 量词 起 类 quantifier 倍率取英 "断 20 的汉语拼音首字母并在 量词 取英文“quantifier”的首字母和“程 动量 s没1 21 gc 进 人称 取英文“pronoun”的第 字母和 w只号一奇s" 22 “人”的汉语拼音首字母并在 起 代词 疑问 取英文“pronoun”的第 字母和 对新喷1 23 ry “疑”的汉语拼音首字母并在一起 代词 词 取英文“pronoun”的第二个字母和 指代 类 24 嘀会#只g开1 词 “指”的汉语拼音首字母并在 起 ”的第 反身 个字母和 取英文“pronoun” 艺气州 25 代词 “反”的汉语拼音首字母并在 不及物取英文“verlb”的首字母和英文 “in 26 新aa对刮 动 y 动词 transitive”的首字母并在一起 词 类 及物取英文“verb”的首字母和英文“tran- 5s到 27 动词 sitive”的首字母并在一起 15
GB/T36337一2018 表1续 大 大类 大类细类标记 汉语 藏语名称 词类代码的说明 序号 类 标记序号代码 名称 判断 取英文“verb”的首字母和英文“judg 手#舌s1 28 y 动词 ment n"的首字母并在- 一起 取英文verb 动 存在 的首字母和“存在”的汉 29 可不w对新a" vc 动词 语拼音首字母并在一起 取英文"awxaryveb"中"veb"的首 类 助动 g尽 30 字母和英文“auxiliary”的第二个字母 Vu 词 并在 起 -般形取英文“adjective”的首字母和英文 g5c" 31 aS 形容 “same”的首字母并在一起 容词 谓语形取英文“adjective”的首字母和“单”的 词类 昏千951 32 adl 容词 汉语拼音首字母并在一起 状态 状态 取"状"的汉语拼音首字母和“形" 的 一哟"飘 33 词类 词 汉语拼音首字母并在一起 拟声 重复取英文 onomatopoeia”的首 有喷8e1 34 oo 拟声词 词类 字母 叹词 a新到 35 叹词 重复取英文“exclamation”的首字母 ee 程度取英 文"dve"的第二个字母和"程" 5"断"=5s 36 dc 副词 的汉语拼音首字母并在一起 时频 取英文“adverb”的第 个字母和“频 5巧刻巧刮 37 dp 副词 的汉语dongmi拼音首字母并在一起 范围 取英文“adverb”的第 "敌实"=5划 38 dw 副 副词 的汉语拼音首字母并在 取英文“adverb”的第二个字母和“心 情态 10 勾a 5实5 39 dx 类 副词 的汉语拼音首字母并在一起 香定 取英文“adverb”的第二个字母和“否 对骨啊 40 d 副词 的汉语拼音首字母并在一起 取英文“adverb”的第 个字母和藏 重复 "断"=5" 41 dn 语拉丁转写“ladzlos”的首字母并在 副词 起 取英文“auxiary”的第 字母和 时态 5N可"守c 42 us 起 助词 “时”拼音的首字母并在 语气 “碎" 取英文“auxiliary”的第二个字母和" =可可时 43 uu 助词 的汉语拼音第二个字母并在一起 比喻 取英文“auxiliary”的第二个字母和 手对'对'pw叫弯" ub 助词 “比”的汉语拼音首字母并在一起 助 祈愿 取英语“auxiliary”的第二个字母和藏 乎"新新" 45 词 ug 助词 语拉丁转写“qig”的首字母并在一起 取英文“auxiliary”的第二个字母和藏 终结 喂可弯忿s1 46 语拉丁转写"dwg”的第三个字母并 uz 助词 在一起 取英文“auxiliary”的第二个字母和藏语 语尾 吗等新守" 拉丁转写“sdhad”的第二个字母并在 47 ud 助词 -起 16
GB/36337一2018 表1(续 大类 大类细类标记 汉语 藏语名称 词类代码的说明 序号 类 标记序号代码 名称 取藏语拉丁转写“lassubyaba”的首 a"S划 48 业格 字母和第三个字母并在 一起 取藏文拉丁转写“I"的首字母和"格” 叫 49 lg 为格 的汉语拼音首字母并在一起 取藏文拉丁转写"I"的第一个字辱和 可5a 50 藏文拉丁转写“rten”的第二个字母并 12 位格 依格 在 起 取藏文拉丁转写“la”的首字母和“de 云5 51 ld 同格 nyid”的首字母并在一起 取藏文拉丁转写“la”的首字母和英文 函NFy 52 时格 lh “hour”的首字母并在一起 取藏文拉丁转写"yeapo"的首尾两 新 53 施事格 bo 字母并在一起 工具凭取藏文拉丁转写“byedpa”的首尾两 呵 ba 54 字母并在一起 事格 材料凭取藏文拉丁转写“byedpa”的首字母 喜 55 bc 13 具格 事格 和汉文“材料"首字并在一起 取搬文拉丁转写“byaba" "的前两个字 方式 56 e5"gg可 by 事格 母并在一起 取藏文拉丁转写“by”的首学 57 bg 缘由格母和“rgyurkyen”的第二个字母并在 新意飘 起 a目"可 58 14 属格 属格取藏文拉丁转写“gi”为其标记 gI 取藏语拉丁转写"jumgkun”的首字 ag5'g5 母和“格”的汉语拼音首字母并在 59 jg 15 源格 源格 -起 据引 取英文"conjunetion”的首字母和英文 对aa 60 ce 连词 “verb”的首字母并在一起 引指 取英文“eonjunetion”的首字母和藏文 ras 61 连词拉丁转写“la”的首字母并在一起 衔接 取英文“eonjunetion”的首尾字母并在 62 积丢s乎 cn 连词 起 单 比较 取英文“conjunction”的首字母和“比” 誉T可 63 cb 纯 连词 的汉语拼音首字母并在一起 16 连 取英文“eonjunetion”的首字母和藏文 所指 64 E新只手 拉丁转写“ni”的第二个字母并在 连词 起 取英文“conjunetion”首字母和藏文拉 添加 内" 65 ck 丁转写“lkhaskong”的首字母并在 连词 起 统分 取英文“conjunetion”的首字母和藏语 66 5F穿e时 cd 连词拉丁转写“dang”的首字母并在一起 17
GB/T36337一2018 表1续 大 大类 大类细类标记 汉语 藏语名称 词类代码的说明 序号 类 标记序号代码 名称 取英文“conjunction”的首字母和藏语 缘由 67 干到愚聚 拉丁转写“mthsan”的第五个字母并 ca 连词 在 起 时间 取英文“conjunction”的首字母和英文 5F话N 68 cs 连词 e”的首字母并在一起 “time” 取英文"ojnction"的首字母和藏 随同关 69 g响智响部女a到 拉丁转写“bcas”的第二个字母并在 ce 系连词 起 复加桥取英文“conjunction”的首字母和"复” 哼哈新列 70 cf 接连词的汉语拼音首字母并在一起 转折桥取英文"omjunection" n"的首字母和“转" 实天哈新 71 cz 接连词的汉语拼音首字母并在一起 复指 取英文“conjunction”的首字母和“复” 林乖*药叫 72 cu 连词 的汉语拼音第二个字母并在一起 关系引取英文“conjunetion”的首字母和“关” ;wr 73 Cg 连连词的汉语拼音首字母并在一起 单 取英文“conjunction”的首字母和藏语 具指 喷到 74 拉丁转写“ces”的第二个字母并在 ce 16 连词 起 词 释疑 取英文“conjunetion”的首字母和“释” 75 哈as CS 连词的汉语拼音首字母并在一起 取英文“conjunction”的首字母和藏文 分义 76 eg5 拉丁转写“gam”的第三个字母并在 cm 连词 起 疑问 取英文“conjunction"的首字母和“疑" 尽可 77 ey 的汉语拼音首字母并在一起 连词 取英文conjunetion的首字母和藏文 数起止 还5不 78 拉丁转写“grang”的第二个字母并在 C1 连词 起 境起止取英文“conjunction”的首字母和"境” 马工 g"5" 79 连词 的汉语拼音首字母并在一起 时起止取英文“conjunction”的首字母和英文 5N5不s 80 Cp 连间“period”首字母并在一起 区别 取英文“conjunm nction"的首字母和“区” 59可 81 cg 连词的汉语拼音首字母并在一起 18
GB/36337一2018 表1(续 大类 大类细类标记 汉语 藏语名称 词类代码的说明 序号 类 标记序号代码 名称 语义转取“复”和“合”的汉语拼音首字母并 四喝不可 82 h 折连词在一起 气弯那wj下wa 语义关取“复”和“关”的汉语拼音首字母并 83 fg 联连词在一起 氏5 弯 17 连 泛指关取“复”和“指”的汉语拼音首字母并 词 5iv实ae可t成否sw新 84 联连词 在一起 假设关取“复”和“假”的汉语拼音首字母并 s膀可对家e只呼奇天 85 联连词 在一起 'Ea1 后接成分取汉语“后缀"二字的首字母 86 18 词缀 hz 成语 重复取“习”的汉语拼音首字母 87 19 成语 Xx 类 重复取藏文拉丁转写“ai”的第二个 没奇到 20 88 语素 语素 字母 标点 重复取北大标记集标点符号标记 21 89 新旁开N 符号 ww 符号 “w 非藏 非藏文取英文“no”的第2个字母字母和英文 千aw 22 90 符号 nn”的首字母并在一起 文 “tibetan'” 取梵文“sanskrit”的首字母和第五个 23 a"时 梵文 9 sk 梵文 字母并在 起 19
GB/T36337一2018 参 考文献 [1]GB/T13715一1992信息处理用现代汉语分词规范 [[2]GB/T205322006信息处理用现代汉语词类标记规范 20

了解信息处理用藏语词类标记集GB/T36337-2018

什么是藏语词类标记集?

藏语词类标记集是一种用于标注藏语文本中单词词性信息的标记系统。通过标记每个单词的词性,可以为后续的文本处理、分析和研究提供基础数据支持。

GB/T36337-2018标准概述

GB/T36337-2018是由中国国家标准化管理委员会发布的信息处理用藏语词类标记集标准。该标准旨在规范藏语文本的词性标注方法,并提供标记集的定义和说明。

根据该标准,藏语词类标记集共包含15个主要标记类别,分别为:

  • 形容词(ADJ)
  • 副词(ADV)
  • 名词(NOUN)
  • 数词(NUM)
  • 参考文献(REF)
  • 代词(PRON)
  • 介词(PREP)
  • 连词(CONJ)
  • 助词(AUX)
  • 叹词(INTJ)
  • 动词(VERB)
  • 缩略语(ABBR)
  • 专有名词(PNOUN)
  • 标点符号(PUNC)
  • 其他(OTHERS)

标记集的应用

藏语词类标记集的应用范围非常广泛,涉及到自然语言处理、机器翻译、信息检索等多个领域。在进行这些任务时,需要先对藏语文本进行词性标注,然后利用标记信息进行后续处理。

例如,在机器翻译中,如果不对藏语文本进行词性标注,则很难准确地识别每个单词的含义和语法作用。而通过使用标记集,则可以为机器翻译提供更准确的语境和含义信息。

总结

GB/T36337-2018是一项重要的标准,规范了藏语文本的词性标注方法和标记集定义。了解该标准可以帮助我们更好地进行藏语文本的处理和分析,为相关领域的研究提供有力支持。

信息技术远程视频柜员机第1部分:设备
上一篇 本文分享国家标准信息技术远程视频柜员机第1部分:设备的全文阅读和高清PDF的下载,信息技术远程视频柜员机第1部分:设备的编号:GB/T36336.1-2018。信息技术远程视频柜员机第1部分:设备共有33页,发布于2019-01-01
信息处理用藏文文献文本信息标记规范
本文分享国家标准信息处理用藏文文献文本信息标记规范的全文阅读和高清PDF的下载,信息处理用藏文文献文本信息标记规范的编号:GB/T36338-2018。信息处理用藏文文献文本信息标记规范共有22页,发布于2019-01-01 下一篇
相关推荐