图书馆实践类专升本毕业论文范文 与民间历史文献数字人文图书馆构建----以徽州文书数字人文图书馆实践反思为例类专升本毕业论文范文

该文是关于图书馆实践论文范文,为你的论文写作提供相关论文资料参考。

民间历史文献数字人文图书馆构建----以徽州文书数字人文图书馆实践反思为例

摘 要 随着“向下看”的史学路径日渐成为主流思潮,民间历史文献资源的收藏、利用与数据库开发已成为学术型图书馆的工作重点,数字人文的兴起恰好为这一工作提供了重要的系统化思路.文章对当前中国图书馆界数字人文相关会议、理论研究与实践开发进行回顾,提出对数字人文领域而言,民间历史文献资源同样具有重要的基础性地位.从中山大学图书馆徽州文书数据库的实践案例出发,从元数据方案、检索点设计和数据关联等角度,初步总结数字人文兴起的语境之下,如何利用已有的优势资源和研究传统,展开民间历史文献资源数据库的建设工作.

关键词 徽州文书 民间历史文献 数字人文 中山大学图书馆

引用本文格式 王蕾,薛玉,肖鹏,等. 民间历史文献数字人文图书馆构建——以徽州文书数字人文图书馆实践反思为例[J].图书馆论坛

0 引言

  20世纪初,中国历史学研究经历了深刻的变革.首先,反思传统文献校勘、考据等方法的积弊,展开史学研究变革的思考.梁启超在《中国史叙论》《新史学》等论著中批判传统,倡立“新史学”思想,继又提出建立“客观史学”的主张,在史学内容上求真.其次,受近代欧洲实证论思潮的影响,王国维、傅斯年等人在史学研究方法上强调史料的重要性,“古来新学问之起,大都由于新发现”“近代历史学只是史料学”等主张推动着近代“史料学”的发展.这种由实证主义思想指导的风潮,本质在于强调通过挖掘、搜集、占有尽可能多的史料,通过鉴别、梳理、分析、研究丰富的史料,追寻历史的真实面貌.由此,“史学的对象是史料”[1-2],打破了传统史学的囹圄和禁锢.再次,随着社会科学思想和研究方法的更新,来自民间的文献开始受到法学、史学、俗文学、民俗学、宗教学等领域的关注,以家谱、族谱、契约、账簿、日记、唱本、书信、俗文字资料等为代表的民间历史文献以其原始性、客观性、真实性特征逐渐占据史料中的重要地位.打破传统正经正史禁锢的新史学发展以民间历史文献为基础,逐渐形成了一种史学的新路径,即由皇权历史走向关注人民创造的社会历史.这场核心为学术研究方法的变革引领中国近代史学向现代史学转变.

  1980年代以来计算机信息技术的发展浪潮为学术研究带来了新的革命契机.信息技术逐渐应用于各类文献资料的存储、揭示、检索、呈现、传递.近30年不同类型的数据库迅猛发展,这些数据库分三大类型:典藏检索型数据库、量化分析型数据库和数字人文研究平台[3]87.典藏检索性数据库遵循传统的文献整理方法,如目录、索引、工具书等编纂思想,是对传统手工文献整理的技术处理,产生了书目数据库、图录数据库、全文数据库,乃至一些辅助研究工具软件,这些数据库实现了对传统文献学、史学研究方法的数字化呈现.量化分析数据库伴随社会科学的统计学方法发展应运而生,经济学、经济史学、人口统计学、社会学等学科大量使用量化分析研究,及计量史学推动史学与社会科学部分融合趋势的发展,使得一批具有统计、量化、分析功能的数据库得到青睐.近年来,大数据技术不断发展与数字人文技术的实践,又进一步推动传统数据库发展思想的转变,推动人文社会科学,尤其是在研究方法、研究范式和研究内容上的悄然转变[3]88-95.

  民间历史文献是数字人文研究很好的观察和实验样本,原因在于它们的种类多样、数量丰富.以徽州文书为例,目前已发现和收藏的徽州文书量近100万件,在类型上涵盖契约、合同、账簿、家谱、宗教文献、日记、信件、日用类书等10余种类型,它所承载的信息涵盖数百年社会普通民众的社会生产、生活和社会关系,涉及经济、社会、文化、宗教、宗族、政治制度、土地、赋役等多个方面.因此,如何在数字人文技术发展趋势下,探索民间历史文献的整理、开发和利用,是当前民间历史文献收藏机构、人文社会科学界所应普遍关注的重要问题.

1 数字人文研究与实践回顾

  作为极具潜力的领域,数字人文的理论与实践研究进展迅猛,然而该主题所涉学科与文献甚多,本文主要针对国内图书馆界相关的发展状况进行基本的梳理.

1.1 研究进展

  根据研究内容,论文的研究主题分布如图1所示.相关研究主要有4个方面:(1)图书馆参与数字人文研究的价值分析与定位.(2)数字人文的技术工具及其在人文学科领域的具体应用,如相关的数据挖掘、文本挖掘、数字仓储、关联数据、分层资源库、GIS、可视化.(3)对国外数字人文发展模式的介绍与总结,尤其是对特定项目和相关数字人文中心运作机制的介绍.(4)数字人文基础理论问题研究,如数字人文研究特征与理论结构分析、数字人文热点领域研究等.

  可见图书馆学界发表的数字人文相关论文数量虽不少,但除去理念性论述和单纯介绍外,实际研究多以具体的个别性技术为切入点,比如欧阳剑的相关研究[4].针对具体文献资源、根据数字人文理念进行数据库建设,并且从中凝练出理论思考的研究非常少.

  就数字人文与中国历史数据库建设关系而言,图书馆学界尚缺乏专门探讨.《数字技术与史学观念——中国历史数据库与史学理念方法关系探析》一文指出数字人文理念下催生的数据库给史学方法创新提供了可能,使注重文本脉络与历史脉络交错关系的当下史学研究指向获得了科学化实现的技术可能[3]93.充分说明数字人文理念和相关技术对史学研究的重要性,图书馆学界亟需加强对此问题的研究.近年历史文献相关的数字人文会议频繁举行,如2014年11月厦门大学与哈佛大学合作的“中国地方史与民间文献数据库国际学术研讨会”;2016年5月中国人民大学清史研究所主办的“数字人文与清史研究”工作坊;2016年5月、2017年5月北京大学图书馆、哈佛大学中国历代人物传记资料库(CBDB)项目合办的北京大学“数字人文论坛”国际学术会议等,也提示针对历史文献,尤其是尚未有系统数字化思路的民间历史文献的数字人文建设,有很大的探索空间.

1.2 实践进展

  历史数据库可分为三类:典藏检索型数据库、量化分析型数据库和基于数字人文研究平台[3]87.哈佛大学、北京大学中国古代史中心等合作的中国历代人物传记资料库(CBDB)和台湾数位历史图书馆即是第三类的代表.而在图书馆界,与这些历史数据库性质最为接近的当属“特色资源库”,多由图书馆自建或联合建设.部分基于数字人文理念的数据库也是自全文典藏检索型数据库升级发展而来.不少欧美重要的数字人文项目也是从传统的文献项目或长期性质的数字图书馆项目发展而来.

  笔者对29个省级公共图书馆和39所“985工程”院校图书馆的特色资源库开发利用情况进行考察,并根据其资源揭示与展示层次,把特色资源库归为三类:传统特色资源库;对检索结果具有简单分析功能或者可视化展示界面的数据库;数字人文层次的数据库(具有一定深度的揭示功能、分析功能,且具有一定程度的开放数据性质).调查分析结果见表1所示.

  由表1可见,国内人文研究机构与图书馆的数字人文实践仍然处于起步阶段,真正可以称为“数字人文数据库”的资源集合,如上海家谱知识服务平台等还比较稀少,且这些资源集合还有进一步发展的空间——事实上即便是家谱知识平台也在迅速迭代中.但值得注意的是,大量传统特色数据库已经奠定这一领域进一步发展的基础.由于数据商对传统历史文献资源(如《四库全书》“二十四史”)的深度开发,留给图书馆的“空间”是有限的,因此其主要发力领域多集中在民间历史文献.

  综上所述,数字人文的理论研究突破需要好的数据素材和数据库支持,而在数字人文理念下进行历史文献,尤其是民间历史文献的数据库建设,对史学研究、图书馆资源建设与开发、数字人文理论研究都具有重大价值.基于此,本文以中山大学对徽州文书的探索和实践为案例,初步探讨民间历史文献的基本特征,以及数字人文视角下图书馆如何开发相应资源.

2 数字人文的实践思路:以徽州文书为切入点

  数字人文的实践,应当结合所在机构已有的优势领域;对于学术性图书馆中相关团队与图书馆而言,更应当与馆内的已有强势资源基础和特色研究传统密切结合[5].基于这样的原则,中山大学图书馆选定的数字人文实践对象之一为徽州文书.

  徽州文书包括契约文书、分家文书、私家账簿、官府册籍、政令公文、诉讼文案、乡规民约、家谱族谱、信函书札、唱本剧本、日用杂书、宗教科仪书等,内容广泛涉及古徽州(今安徽歙县、休宁、祁门、黟县、绩溪和江西婺源)社会、经济、政治、文化各个不同领域,是宋元明清徽州人在社会生产、生活与交往过程中形成的原始记录.徽州文书数量特别巨大,保存系统完整,内容丰富多样,历史时代久远,具有独特的原始性、唯一性、文物性和学术性,是现存地方文献的典范.

  正是收藏的传统和研究的优势,使得中山大学图书馆选择以徽州文书作为数字人文实践的切入点.而严格来讲,数字人文实践的第一步仍然是回到特色资源数据库的构建之上,正如上文所说,“特色资源数据库是数字人文的基础”.由于研究有所积淀、理路已经较为成熟,因此在中山大学图书馆徽州文书预研究性数据库的构建过程中,图书馆方面能够提出较为明确的系统需求.

  该预研数据库的开发中,图书馆主要提供数据方案与功能需求,总体研发步骤为:(1)以徽州文书为基础,制定民间历史文献的元数据标准,进行资源数字化并实现数字资源的管理,其目标是形成表1中“传统特色资源库”;(2)与学者的研究诉求结合,提供分面分析和其他深入的检索功能,设计可视化展示界面,即进入到表1的第二个层次;(3)提供分析徽州文书的独有工具与可视化界面,开放数据接口,并主动与外部的相关系统寻求对接,这才真正进入到数字人文数据库的层次.下文介绍中山大学图书馆徽州文书预研性数据库建设思路.

2.1 传统特色资源库级别的功能实现:以元数据为中心

  徽州文书作为民间历史文献的一种,有其不同于图书及一般网络资源的特点,如文献内容具有原生性、唯一性、关联性、非组织性;文献类型与形式多样性;文献产生与保存具有过程性、历史延续性;文献整理具有归户性等.这就决定了DC作为描述通用网络资源的元数据,并不能适应完全标识徽州文书的需要.

  中山大学图书馆在DC元数据的基础上,根据徽州文书特点,制定了中山大学图书馆徽州文书数据库的元数据规范标准.徽州文书资源本身的信息揭示,应注重对文书的描述型元数据的设立和拓展,该标准设计了20个描述性元数据,用于描述或标识徽州文书内容与外观物理特征的元数据,包括核心元素、元素和文书特别元素,如表2所示.依据这一元数据框架,徽州文书数据库已实现徽州文书数字化资源的生命周期管理.在后续建设中,进一步根据需要调整著录项目,建立完全适应民间历史文献数据库的元数据标准与框架.

2.2 数字人文数据库建设的基础:全文检索和分析功能的开发

  在实现基本的生命周期管理基础上,数据库进一步开发检索和分析功能所设立的原则是:以多元检索入口为基础,以全文检索为实现方向.

  目前在多元入口工作上,该数据库提供包括财产登记号、责任者、题名、摘 要、地点、时间、关联任务与团体和文书类型等在内的检索入口,还包括多种符号的检索式支持、二次检索、检索排序、检索历史记录等高级功能.数据库还设置“浮窗”功能,即检索结果简目界面出现之后,研究者可把鼠标放在任意一条检索结果简目上,就会出现包含该条检索结果详细著录信息的浮窗,让研究者不用点开链接即可快速了解文书的详细内容.在分析功能的开发工作上,该数据库具备按文书类型、时间、地点、关联人物与团体4种方式聚类的检索结果分析,以及检索结果涉及的相关人名、地名的统计分析等功能.

  全文检索尽管具有较大难度,却仍然是任何一个相关项目在未来一段时间必须实现的功能.中山大学徽州文书数据库文书量级庞大,且目前还遭遇到民间方言、字迹难以辨认、数字转化技术不够发达、整理人手有限等问题,但在项目立项之初,研究团队便已经明确:若想充分发挥其辅助研究的效用,提供全文检索功能是必要的.如果能够提供文书的完整全文作为索引对象,即使在使用检索入口进行检索无果时,只要文书全文中出现了相应的检索词,仍可能找到需要的文书资料,而且对关联性的思考和实现,很多都必须基于全文检索的基础上.因此,图书馆团队在早期就邀请中山大学中文系的知名教授对相关馆员进行培训,其重点主要就在于识字、认字的基础能力上.

2.3 面向数字人文层次项目的准备与设计:以关联性为中心的思考

  中山大学这一预研性数据库的功能目前仅实现多元检索级别,但在设计之初,已经反复考虑面向第三层次的可能,例如对文书关联性的考虑.

  以徽州文书为代表的民间历史文书之间可能存在关联,如两件文书是关于同一块土地的,若干件文书是关于同一个家庭的,若干件内容相似的文书原本为同一文书.这些彼此相关的文书或者早在流传过程中便已分散,或者实物原本在一起但在经过整理、数字化之后,其关联性就不复存在了.但在如此巨大的文书集合中要找到几件相关文件,实非人力所能企及.后续希望能够借助文本挖掘技术,重新构建文书之间的关联性,其实现思路主要包括3个方面.

(1)关联内容相近的文书.在实现全文检索的基础上,通过文本挖掘便可以对文书内容进行比对,若相同语句高达90%以上,可称为内容相似文书.当研究者检索到某条记录时,可设计“其他相似文件”的按钮或链接,点开此链接则可浏览其他在内容上跟该条记录相似的文书.例如,分家书往往是一式几份,内容相似.如果在流传、整理、数字化的过程中分散,通过该功能,检索其中一份时,则其他几份也能在“其他相似文书”中出现,恢复它们之间的关联性,研究者就能比较完整全面地了解此次分家的详情.

(2)关联同一土地的文书.土地文书之间可能存在土地的转移、买卖、阄分等关系,这些是研究土地流转的重要依据.然而,有关同一块土地的相关文书也有可能在流传、整理和数字化的过程中分散,利用文本挖掘技术,对文书中的地点、时间、人物等关键信息进行提取和分析,能够恢复它们之间的关系.关于同一土地的相关文书之间的关系,大概有上下手契、原契与契尾和同一块土地的所有税票等.研究者可以点击“相关文书”,则可分别浏览具有这几种关联性的文书.比如,检索到一件土地卖契,通过“相关文书”功能,可以获得这块土地上一次或下一次买卖的文书,可能获得这张卖契的契尾,也可能获得关于这块土地的纳税信息等.这一关联关系是实现与GIS系统对接的基础.

(3)关联同一户的文书.关联关于同一户家庭的相关文书的工作,称之为“归户”.所谓“归户”,就是将分散的、零碎的文书,经过考证复归到原来所属的同一户或同一族.徽州文书原本大多具有归户性,即一户或者一族的文书无论种类如何、数量多少,皆整体保存流传.中山大学图书馆的徽州文书中,很可能包含了大量原属同一户后来分散了的文书.利用文本挖掘技术,对文书的立契人、关联人物与团体、著者等人物信息进行提取和比对分析,结合相应的家谱信息,便有望重新构建文书的归属图.

3 数字人文数据库建设实践反思

  近年图书馆在特色资源整理方面取得了很多成果,建成了一批特色资源库.这类数据库大多是只具有简单检索功能的传统数据库,并不能满足特色资源利用与研究的时代需求.文献整理是利用的起点而非终点,数字人文环境下,图书馆必须依托资源优势,将文本挖掘、地理信息系统、关联技术、文本可视化等数字技术应用于特色资源库建设,实现特色资源的进一步开发与利用.中山大学徽州文书数据库的建设实践表明,建设数字人文层次的数据库需要注意两大问题.

3.1 建设具有数字人文理念的特色资源库,须对资源内容有深入理解

  首先,在资源整理方面需了解资源内容形成的社会背景及流传脉络,确保资源固有的系统性、完整性不被破坏.比如,中山大学所藏徽州文书大都为明、清、民国时期的徽州地区所留存的,而当时的徽州为典型的宗族社会,且当地人“好讼”、契约意识强,日常生活如田地买卖、分家析产等行为都需立契且保存于家中或宗族祠堂中.因此,徽州文书常以一家一户或宗族为单位保存,即具有“归户性”.我们在整理、数字化及提供利用过程中尽可能地确保徽州文书的这种“归户性”.其次,元数据是建设数字人文数据库的基础,而制定适用于特色资源的元数据标准,也需了解资源产生的社会、文化、政治、经济背景,对文本进行深入分析.

3.2 数字人文是跨学科领域,数字人文数据库建设离不开跨学科合作

  一方面,图书馆、专业技术团队及人文社会学科研究者都各有其优势,使合作成为必要.图书馆拥有资源优势,在资源整理、元数据标准制定等方面积累了一定经验;专业技术团队长期致力于数字资源建立、研究系统开发、分析工具研发等工作,在数字人文理论与技术,以及各类型文献资源数据库开发方面,拥有技术优势;而人文社会学科研究者作为数据库的使用者,在数据库的需求分析、资源内容的背景分析、概念界定、元数据制定及信息提取等方面都有其专业优势.另一方面,三方均对数字人文领域有长期关注与实践,能够建立有效沟通,为合作建设数字人文图书馆提供了可能.复旦大学历史地理研究所与北京大学历史系、哈佛大学东亚系等合作开发的中国历代人物传记资料库,我国台湾大学数位人文中心与台湾大学历史系合作的台湾古契约文书全文资料库等,无疑在跨学科合作建设数字人文数据方面给我们提供了成功的范例.

4 结语

本文主要以徽州文书数据库的建设经验和设计心得为出发点,探讨了民间历史文献的数字化思路及其面向数字人文的准备与思考.建设徽州文书数据的目的是要打造一个研究徽州地区社会、经济、文化、历史等的数字环境,而对于一个好的环境而言,内容固然重要,但同样重要的是为使用者提供有用且好用的研究工具,以便能在大量资料中发现研究议题并能深入研究.将这一理念推及到民间历史文献的相关工作,可以想见,数字人文的构建思路将赋予研究者更为多元的观察视角,这些研究视角必然是由一些基础性的功能和工具来支持的,这两者也是这一课题后续发展的基本立足点所在.

(责任编辑:何燕;英文编辑:杨继贤)

图书馆实践论文范文结:

关于本文可作为相关专业图书馆实践论文写作研究的大学硕士与本科毕业论文图书馆实践论文开题报告范文和职称论文参考文献资料。

1、图书馆学刊

2、图书馆杂志

3、教育实践和杂志

4、经贸实践杂志

5、翻译理论和实践论文

6、图书馆建设杂志