![]() |
|
闂備胶绮崝姗€锝炴径鎰垫晢婵犻潧娲ㄩ埢鏃堟倵閿濆骸骞楃紒浣哄閹便劌鈹戦崟顐熷亾濠靛违濠㈣泛娴烽悿鈧銈嗗姧缁茬晫绮婅ぐ鎺撶厸闁稿本绮嶉崵鈧紓浣瑰敾閹凤拷闂備線娼уΛ宀勫磻閹剧粯鐓熼柟鎼幖瀵喗淇婇顐㈠⒋鐎殿喖鈧喓鐤€闁哄洨鍠撻悰銉╂⒑閹稿骸鍠曢柟鍑ゆ嫹婵犳鍠楄摫闁搞劌纾埀顒勬涧閻倿骞冩禒瀣亜闁告稑枪娴犙勭箾閺夋垵鎮戦柤褰掔畺椤㈡岸顢氶埀顒勫箖闄囬ˇ铏亜閵夈儲鍤囩€殿喖顭锋俊鐑芥晜閻e瞼鈻岄梻浣告惈閸嬪﹪骞忛敓锟� |
标题:图书馆职称论文:古籍整理中数字化技术原理与应用 |
图书馆职称论文:古籍整理中数字化技术原理与应用 摘要:利用数字化技术实现古籍整理是本方向的发展趋势,本文针对古籍整理的数字化进程的基本原则和关键问题进行详细阐述,并提出古籍整理数字化应用的若干重要问题,为古籍整理的数字化实现奠定基础。 关键词:古籍整理 数字化 原理 应用 中图分类号: G258.33 文献标识码:A 1 引言 古籍整理是对古籍原文进行整理加工成为更贴近于现代的形式,使古籍中的内容更便于今人以及后人阅读和利用。然而古籍具有版本较多、完整性差,并且有的已失传的特点。此外,由于时间相隔之久,古籍中字词的意义与现代字词的意义已有较大区别。因此,利用或专研古籍内容就必须先对古籍进行梳理。更具体而言,以历代古籍为对象,依校勘、标点、注释、今译、辑佚、影印等为手段,通过运用版本、目录、校勘、文字、音韵、训话、考古等多种专业知识,所进行的整理加工活动,统称为古籍整理。其目标就是利用各种手段,尽最大可能的将古籍复原,保存其原本表述的内容,并且让现代人更容易理解[1]。 所谓数字化就是把人们常用的文字符号转化为数字符号,也就是说把传统的语言文字表达形式改变为计算机能识别的数字表达形式。而古籍数字化则就是把古代常用的文字符号转化成为计算机可以识别的数字符号的一种过程。从表层上看,这一过程使得古籍的存在形式发生了变化,而实际上也使得人们对古籍使用环境发生了相应的改变。 古籍是中华民族的文化瑰宝,也是实现数字化内涵的信息之源,把古籍信息数字化,可以将目前的古籍整理 ……(快文网http://www.fanwy.cn省略1097字,正式会员可完整阅读)…… 2.2.2 古代文献的大规模录入问题 我国的古代文献种类繁多,数量庞大。除纸质的古代文献外,还有甲骨文、金文、陶文、竹简、帛书、石刻、砖文、印章、题记等。据不完全统计,仅公共图书馆系统收藏的纸质古籍善本即有两百二十万册左右,普通的纸质古籍约两千六百四十万册.对于除了纸质文献以外的古代文献,仅甲骨文一项,即有大小刻辞卜骨十万余片。因此古代文献的计算机录入呈现出两个特点:一是规模大,二是种类多。这就给古代文献的录入带来许多新问题。古籍录入计算机的过程也是一次对古籍进行初次校勘的过程。由于字符集内收录的是大规模使用的正规汉字,因此在对古籍的文字进行OCR识别转换成字符时,原文上的那些错字、异形字、避讳字、异体字等很少见的汉字因为字符集中没有收录就暴露出来了。这就需要对它们进行处理,在必要的时候要对古籍进行恰当的“改动”。这一点跟传统的校勘原则是相反的,传统校勘的目的是为了最大限度地恢复古籍的原貌;古籍的数字化整理则是为了最大限度地“保真”。这是信息时代古籍整理的一个新方向和新任务。 2.3.3 标准化问题[4] 古籍数字化的目的就是通过网络来进行古籍资源的利用,为学术研究和人们的文化生活服务。因此,资源的整合、资源的共享和网上信息交换这三个方面对古籍数字化工程来说尤为重要。目前大陆进行古籍数字化的研究单位还很分散,他们都是各自开发,互不往来。而且大陆、台湾和港澳三大地区都在进行古籍数字化的实践。所以,制定一个统一的标准和规范就越发显得非常重要和迫切。对古籍数字化来说标准和规范具有根本的指导意义。它相当于传统方式下古籍整理的各种著录格式和规范标准,是数字化整理古籍的基石。古籍数字化也是一项浩大的软件工程。而且,这项工程,不同于一般的软件开发那么单纯。它涉及到了包括文字、文化在内的诸多方面因素,势必要进行更多单位的合作开发。在软件的开发上,架构设计非常重要。软件的架构设计好了,就可以进行任务分解,进行分布式开发。因此,对古籍数字化这样浩大的软件开发工程来说,需要在架构上有一个指导性的标准。这个标准大到软件框架的每个层面,小到数据结构和数据类型都应当作出规定。使各个协作部门有章可循,提交的研究成果能够共享。另外,从软件的类型上来说,古籍数字化属于数据库应用方面的软件开发。因此,统一数据库文件的格式有着至关重要的意义。目前的数据库文件格式就有JPG、WDL、EBK、EDB、OEB、SEP、IFR、XEB、TXT、DOC、HTM、PDG、PDF、CAJ等诸多格式。它们标准不一、无法兼容、质量参差不齐。这就使数据资源无法共享,不得不进行重复建设。 3 古籍整理的数字化应用 3.1 关于适用于古籍处理的计算机汉字编码大字符集和工作平台 汉字作为一种古老而延续的文字体系,呈现出很强的独特性和因数千年历史积淀造成的复杂性。当前计算机汉字信息处理的状况,极大地限制了古籍整理研究、古汉语研究领域计算机手段运用的可能性和可行性。缺乏适合古籍计算机处理的统一的汉字编码大字符集,已成为当前古籍整理研究手段现代化实践中的瓶颈。从现有计算机软硬件发展的水平和格局来看,使用较为统一的系统和开发平台从事古籍整理实践是可行的。具体来说,除了现有的Windows系统以及在其上运行的应用软件外,我们暂时还无法找到更为通用的、受到普遍支持的软件环境。在较长的一个时期内,Windows系统以及和它兼容的各种应用软件仍然是我们不得不依靠的工作平台,这并非因为它最好,而是因为它最通用。 3.2 关于计算机古籍资料库的建设 但计算机的海量存储能力、强大的计算功能和基于主题、关联的穷尽检索功能为我们的学术之路带来了新的希望。利用计算机数据库技术、全文检索功能可以快速提供精确的穷尽数据基础,从而将人力从材料中解放出来。另外,计算机全文检索技术对古代语言研究、古籍整理领域内的辑佚辨伪等工作更具重大意义。甚至,依赖于研究设计者制作的知识库和计算规则,计算机可以对查询的材料进行一定程度的分析和整合,提供精确的类似初步研究的成果,供研究者深人讨论。利用多媒体技术,可以全方位地展现研究对象各种直观的细节和特性。网络技术使得知识传达、数据交流和获得取得新的途径,展现新的面貌。在进行资料库建设过程中,应该与时俱进,将先进的软硬件平台充分应用,技术标准的开放性和系统的可维护性、可扩展性要好,营造出富有弹性的和具有广泛应用前景的系统架构。界面友好,体现普及计算机应用的追求。优先考虑网络应用的架构方案。这里存在一个问题,无论就项目的组织开发过程还是所达到的最终效果来说,都存在着完美和效率之间的矛盾问题,追求完美的过程和效果,必然会降低效率,计算机技术的发展和更新速度之快,已不容许我们用“十年磨一剑”的方式来指导运作;而追求效率,又往往是以一定程度上牺牲完美为代价的。从计算机技术的发展和信息积累的增长速度来看,从事计算机项目的开发,如果一味地以完美为准绳,是不现实的;但若一 ……(未完,全文共5921字,当前只显示2850字,请阅读下面提示信息。收藏图书馆职称论文:古籍整理中数字化技术原理与应用) 上一篇:浅谈我国的古籍整理保护 下一篇:图书馆职称论文:图书馆在农家书屋可持续发展过程中的作用 相关栏目:文化 宣传讲话 人事 文教论文 综合论文 质检 科技 |
濠电偞鍨堕幖鈺呭储閻撳海鏆﹂柡鍥╁枔椤╂煡鏌i幋鐐ㄧ細婵絽鐭傞弻娑滅疀閹惧疇鍩為梺纭呮腹閸楀啿鐣烽崼鏇炵闁瑰搫绉剁粻姘舵⒑鐠団€冲季闁割煈鍨遍〃銉╁炊閵娧€鏋栧┑顔角瑰▔娑㈠礉椤у粙P濠电姰鍨煎▔娑樏洪敃鍌樷偓浣割吋閸℃ê鍔呴棅顐㈡处閹稿憡绻涢崶顒佺叆婵炴垼娅曠€氾拷闂傚倷绶¢崹顖炴儉婵変赋濠电姰鍨奸鎰板箯閿燂拷18027574闂備礁鎲¢悷閬嶅箯閿燂拷-2 Copyright © 2002-2025 闂傚⿴鍋勫ù鍌炲磻閸涙潙鍑犻柛鎰典簽绾鹃箖鏌ㄩ悤鍌涘 闂佽崵濮村ú銊╁蓟婢舵劦鏁婇柛銉e妽婵挳鐓崶銊︹拹闁圭柉浜槐鎺楀籍閳ь剟鎮烽妷鈺傚亗婵炲棙鎸哥憴锕傛煥閻曞倹瀚�fanwy.cn 闂備礁鎼悧婊堝礈濞戙垺鍋熸い鏍ㄧ☉椤曡鲸鎱ㄥ鍡楀闁哥姴鎳橀幃妤呯嵁閸喚浠惧┑鐘亾闁搞儺鍓氶弲顒佹叏濡搫鏆遍柛鏃€鐗犻弻銈嗭紣娴d警妲紓浣广仜閸嬶拷 濠电偞娼欓崥瀣嚌妤e啫绠熺€规洖娲犻崑鎾荤嵁閸喚浠惧┑鐘亾闁搞儜灞芥濡炪倖妫侀濠勬崲閸℃稒鐓曟繛鍡楃箰濞堚晝绱掓潏鈺傜彽anwycn 闂備線娼уΛ娆撴偋閺冨牆鑸规い鎺戝缁€鍐╃箾閸℃鎹i柣鐔叉櫊閺岋綁鍩€椤掆偓婵$厧霉濠婂嫭绀冪紒宀勪憾閸ㄩ箖宕橀幓鎺嗘瀼闂備焦瀵х粙鎺楁偤閿燂拷912986闂備線娼уΛ宀勫磻閹捐秮褰掓偑閸涱垰鍩岄梺鍝ュ枑閹歌崵绮欐径鎰闁肩ǹ鐏氬▓锟�QQ闂備焦瀵ч崘濠氬箯閿燂拷524523809闂備線娼уΛ宀勫磻閹捐秮褰掓偑閸涱垰鍩岄梺鍝ュ枑閹歌崵绮欐径鎰闁肩ǹ鐏氬▓銏ゆ⒒娓氬洤寮鹃柛鐘冲哺椤㈡瑩宕奸妷锔芥珫濠殿喗绻勭粣濯渦xian@126.com闂備線娼уΛ鎾箯閿燂拷 |
![]() ![]() ![]() ![]() ![]() |