PaperTan: 写论文从未如此简单

图书馆管理

一键写论文

新疆喀什特区图书馆维吾尔文史资源库建设构想

时间:2016-08-09

探讨新疆喀什特区维吾尔文史资源库建设构想,涉及资源性、技术性及避免行为性等方面。

分类号 G250.74

Construction Conception of Uighur Cutura and Historica Resource Database in Library of Kashi SAR Xinjiang

Kasimujang?Kamierding

2010年,第一次中央新疆工作座谈会召开以来,在全国援疆的发展模式下,新疆公共图书馆实现了跨跃式发展,各地州及各县市的公共图书馆事业都有了长足发展,无论是馆舍、硬件设备和计算机网络,还是系统软件、人员素质、培训学习和领导水平等各项指标都上了一个大的台阶,很多地方都建立了现代化的新馆。但随着新疆公共图书馆事业基础设施和硬件设备的改善,其软件建设和资源建设方面的不足也暴露出来。新疆不仅缺少少数民族语言的地方特色数据库,连中文的地方数据库资源也极度缺乏,在这方面进一步拉开了与东部地区的差距,使得“数字鸿沟”的问题日渐突出。而作为新疆政治、经济和文化发展极为重要的维吾尔族相关文史专题资源,到目前也没有专门的资源库。虽然新疆大学有一个地方文献数据库,但仅收录了部分维吾尔文史资源的内容,而且其服务对象也仅限于本校师生,故不予探讨。由于在喀什建立维吾尔文史资源库的资金、技术和背景条件均已比较成熟,因此,应尽早将其列入喀什地区图书馆发展的议事日程,以推动新疆少数民族特色资源库的建设进程。

1 新疆少数民族特色数字资源库建设现状

目前,新疆维吾尔自治区图书馆已拥有(主要是购买)的数字文献资源有CNKI系列数据库、博看网畅销期刊数据库、万方数据知识服务平台、国研数据库、中数图电子图书等8个数据库。共享工程首先要实现的是资源共享,但适合本地区的资源不能单靠共享工程国家中心来提供。新疆公共图书馆系统以自治区图书馆和全国文化信息资源共享中心新疆分中心为依托,建立了不少地方特色的数字资源。在自建的这些资源中,视频资源和多媒体资源占到90%以上。近年来建成的资源库主要有:代号“千里马”的视频资源库,是文化部全国文化信息资源建设管理中心向各省级分中心下发的15批约8TB容量的移动硬盘视频资源;农牧区实用技术库,以广大农牧区群众易于接受的视频方式,以多种语言形式,全方位地介绍农牧区的种植、养殖、防病、防灾技术,以及农机器械保养维修和市场营销的最新信息;少数民族爱国主义题材影视库,收集新疆电视台、有线广播电视台、天山电影制片厂等译制的维吾尔、哈萨克语影视剧1833部集,全疆各译制部门共译制维吾尔、哈萨克、蒙古、柯尔克孜语影视剧2968部集;少数民族表演艺术库,内容有享誉中外和独具民族特色的少数民族表演艺术形式,包括十二木卡姆、顶碗舞、达瓦孜(走钢丝),以及其他民间曲艺和舞台剧;非物质文化遗产库,以视频、音频和图片等形式展现新疆非物质文化遗产深厚的底蕴,其中有名列中国三大史诗的《玛纳斯》和《江格尔》;少数民族少儿“双语”及基础教育库,以合作建设为主,从幼儿教育抓起,以视频方式进行远程教育,内容生动活泼,寓教于乐,旨在提高全疆各族儿童的“双语”水平及其他各项综合教育水平;新疆风光资源库,收录新疆各地雄伟壮丽的美丽风景。上述7个资源库的建设,虽然少数民族语言文字为主的资源占到60%以上,但基本上是以视频资源和译制内容为主的资源,在资源类型上存在着严重的不足之处。虽然总量很大,但是无法满足新疆各族群众对维吾尔文化历史方面资源的需求。由上述可知,新疆公共图书馆系统一直没有建立一个关于维吾尔文史的专题数据库,这远远不能满足新疆当前政治、经济和文化建设的需要,因此,开展这项工作显得迫在眉睫。

2 在喀什建立维吾尔文史资源库的必要性

2.1 喀什特区经济发展的迫切需要

喀什是中国的西大门,下辖喀什市和11县,面积16.2万平方公里,接近广东省,人口400万,有维吾尔族、汉族等31个民族,其中维吾尔族占90%,汉族占8%,其他少数民族占2%,是多民族聚居的地区。2010年5月,中央决定在喀什设立特区,使之成为国家第6个经济特区,同时也是中国内陆首个经济特区,力争使喀什特区成为我国“一带一路”并重对外开放的重要节点,成为我国向西开放的重要窗口,同时也是我国西部最具活力和投资价值的特区。为此,在确定对口支援新疆的19个省市中,山东、上海、广东和深圳4省市对口支援喀什地区。同时,由于南疆三地州均为国家级贫困地区,面积较大,人口占全疆总人口近30%,其中少数民族人口占93%,同时该地区还是与国内外恐怖、分裂和极端主义斗争的主战场,是抵制国际恐怖势力渗透的前沿阵地,因此,加快喀什经济开发区的建设和发展,进而引领南疆三地州的发展,对于民族、社会和国家都具有重要意义。在此基础上,建设维吾尔文史资源库对喀什特区及南疆地区的经济发展,政治稳定和文化建设也具有重要意义。 2.2 喀什维吾尔文史资源的需要

维吾尔文化的两部重要作品《福乐智慧》和《突厥语大词典》都出自喀什人之手,研究这两部书已经成为一门显学,在国内外有着较大的影响,仅研究这两部书的论文数量就非常庞大,每年都会举办相关的论文研讨会。如果再加上其他文献,例如《乌古斯可汗传》《乐师传》《阿曼尼莎汗》《新疆五十年》《苏图克?布格拉汗》等,在新疆内外都有大量的读者。新中国成立后,自治区累计用维吾尔、哈萨克、蒙古、柯尔克孜、锡伯等少数民族文字出版图书2.19万种,其中维吾尔文占了非常大的比例。此外,喀什地区各公共图书馆都有着数量不等的大量地方文献入藏,而喀什地区民宗委、政协、文化馆和文管所等单位也保存了大量的维吾尔文史资源,其中包括不少稀有的察合台文文献。这些都有待通过建立维吾尔文史资源库的形式,满足新疆地区文化建设的需要,为新疆大开发、新疆经济建设及新疆各民族的团结安定做出应有的贡献。

2.3 保护维吾尔文化遗产的需要

作为历史的见证,喀什地区各类型图书馆全部建立了收藏少数民族文字文献的民文书库,它们与汉文书库一起共同构成了自治区具有民族特色的图书馆文献资源体系,为各民族读者提供了丰富的精神食粮。而新疆各地民间也有大量的古代及近代维吾尔文献以地方文献的形式分别保存在新疆各地的图书馆中。这些文献内容丰富,版本珍贵,部分文献散存于民间面临着失传的危险。所以,在新疆喀什建立维吾尔文史专题资源库是非常必要的,可以有效地保护维吾尔族的文化遗产,因为纸质文献尤其是古代的纸质文献随着时间岁月的磨蚀,非常容易损坏,这不仅不利于文献的保存,更不利于读者的使用。将维吾尔文献进行数字化处理可以有效地降低珍贵古籍文献资料的损坏进程,同时更便于读者的阅读利用。由于数字化文献十分有利于文献资源的检索、查询、利用、传输和存储,因而维吾尔文史资源库的建立可以有效地提高维吾尔文献的利用率,为读者阅读使用和相关研究者的工作创造便利条件,从而在维吾尔文献的有效保护、使用和传播等方面都具有重要的意义。

3 建立维吾尔文史资源库技术上的可行性

新疆经济的跨跃式发展为新疆建立各类数据资源库提供了充足的资金保障。同时,随着计算机网络技术和互联网技术的不断发展,少数民族计算机技术也在不断进步,并为图书馆建设数字化文献资源提供了技术保障。过去因为种种技术原因迟迟无法建立各种地方特色数据库,而现在因为新技术的出现,维吾尔文史资源库建设的技术瓶颈已被克服。

3.1 XML与Unicode对西部少数民族文献的支持

XML(ExtensibLe Markup Language)作为网络环境下的国际标准通用标记语言的一个子集和实用标准,给处理维吾尔和汉语多语种带来了方便,其多级嵌套可以置标不同层次少数民族文字的子宇段,方便系统平台根据嵌套的不同语言而采取不同的处理方式,使浏览器能识别和查看从右到左的Web页面,图书馆自动化软件也可以直接使用。XML及其子集HTML均采用UTF-8为标准字集,支持在采用XML标准的各种品牌浏览器上显示任何地区的文字网页。国际Unicode协会于2003年8月27日发布的Unicodc4.0版本,为所有维吾尔、哈萨克、柯尔克孜文字符都分配了相应的Unicode编码,使得全球的语言字符编码标准得到统一。中国国内适用于少数民族文字的机读目录和数据库也得到全面发展,支持多语种少数民族文字的图书馆管理软件也在不断面世。例如,现在做为新疆公共图书馆主流自动化软件的interib图创系统,就是支持UNICODE4.0标准的。截止2013年11月,unicode编码的最新版本已经升级到6.3版。

3.2 都柏林核心元数据在少数民族文献中的应用

图书馆自动化的元数据MARC是将数据、数据结构、索引包罗在一起的不完全的元数据。现代几种元数据只包含元素,结构由UTU或Shama描述,因此简捷明快。目前,国内多采用都柏林核心元数据DubinCore MetaDate,至今元数据已经被翻译成18种语言。由于只有可选择且可重复的15个元素,所以给西部图书馆特别是开发少数民族文字的图书馆自动化带来了新思路。因为不必将少数民族文字的特点同冗长、繁琐的传统编目规则去谋合,根据向上兼容的规则,只须在出现少数民族文字的元素上加上语言方向和字体修饰属性,同时发展本地化的元素限定修饰词即可,最后在摸索中发现,关于本地化都柏林元数据的翻译可以借鉴阿拉伯语都柏林元数据标准。

3.3 数据库中维吾尔文存储和显示问题

3.3.1 存储问题

数据库采用支持Unicode5.0的Ora ce10g数据库,并将语言属性定义为NLS-LANG=SIMPLIFIED CHINESE_CHINA.AL32UTF8 (界面语言:简体中文,地区:大陆地区,支持所有语言的UTF-8字符集编码),这样就可以支持存储中文、英文、维吾尔文(Unicode标准)。Orace数据库的AL32UTF8字符集选项实现了机读目录字符集和数据库字符集都统一到GB13000,这等同于ISO10646的Unicode字符集标准。

3.3.2 显示问题

ISO10646与Unicode组织字符集标准统一化基于Unicode 标准的UTF-8编码格式,从数据库服务器读取存储UTF-8的编码,通过JDBC数据库接口,仍然以UTF-8的格式传输到应用服务器上,最终传输到读者客户端。如此一来,将不再存在转换问题,当然也就不会再出现乱码的字符集问题。

3.4 维吾尔文在数据库中的排序问题

Unicode标准虽然解决了维吾尔文编码问题,但是在支持Unicode的系统中,系统对维吾尔文进行排序时,是按阿拉伯文字母的顺序进行排序,这不符合维吾尔文字母表的顺序。在数据库中对维吾尔文进行排序时,数据库提供的排序功能是按照维吾尔字母在编码集中的编码顺序进行排列,而不是按照维吾尔字母表的顺序进行排序,不利于读者利用,对于数字图书馆来说是非常严重的缺陷。通过在维吾尔文字母与ASCⅡ码之间建立一个对应转换表,这个问题方才得以解决。即通过将维吾尔文字母转换为ASCⅡ代码进行排序,利用系统提供的排序功能速度非常快。而查询到的结果则通过这个对应表再进行一次转换,转换成维吾尔文字母的方式显示给使用者。同时,在数据库中增加一个字段,即保存维吾尔文关键字的ASCⅡ代码,可以通过代码直接查询,通过动态链接库DLL及ActiveX(OCX)控件的方式实现。这样一来,就实现和解决了纯维吾尔文在数据库中的排序和检索问题。

参考文献

[1] 5 ] 王曙光. 新疆文化共享工程少数民族语言资源译制的实践与体会[J]. 图书馆理论与实践.2010(11). 101-105.