大数据时代方面有关论文例文 和大数据时代人文前沿和----南京大学数字人文学术会综述相关论文例文

本论文为您写大数据时代毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

大数据时代人文前沿和----南京大学数字人文学术会综述

摘 要 2017年7月1-2日南京大学召开“数字人文:大数据时代学术前沿与探索”学术研讨会,与会专家围绕数字人文的前沿问题展开深入研讨.从与会学者的学术背景来看,数字人文研究学者既来自历史、地理、文学、艺术等学院,也来自统计科学研究中心、数字化设计研究所等科研单位,以及博物馆、图书馆等文化机构;从研究内容来看,数字人文学科结构涵盖历史地理信息技术、数字史学、文学、艺术、数字博物馆等,技术结构包括数字计算、关联网络、数据统计、文本识别、主题分类、数学建模等.文章从图书馆的角度对数字人文的发展提出了思考与展望.

关键词 数字人文 学科结构 数字技术 GIS 数字史学

引用本文格式 刘琼,卢章平,李永卉,等. 大数据时代人文研究前沿与探索——南京大学“数字人文”学术研讨会综述[J]. 图书馆论坛,2018(3):37-45.

  随着数字技术和数字媒体的不断发展,人文学科结合数字技术的研究应运而生.在国际上,数字人文研究在1968年开始萌芽,先后经历了1992-2007年的探索阶段、2008-2012年的快速发展阶段、2013年以后的繁荣阶段[1]3.这两年数字人文科学在中国越来越流行[2]140,相继举办了一些数字人文研讨会.比如,2014年6月20日上海市图书馆学会举行2014年图书馆前沿技术论坛——“数字人文与语义技术”专题研讨会;北京大学图书馆于2017年4月13日举办“北京大学数字人文工作坊”系列活动,并于5月26日举行主题为“互动与共生:数字人文与史学研究”的第二届北京大学数字人文论坛.2017年7月1-2日南京大学艺术研究院、历史学院、地理与海洋科学学院等院系的青年教师发起召开“数字人文:大数据时代学术前沿与探索”学术研讨会,旨在聚焦数字人文的重要议题,探讨前沿思想与问题,促进学者间的交流,提升数字人文在国内学术界的影响力和数字人文跨学科发展;来自哈佛大学、莱斯大学、台湾大学、北京大学、美术学院等多家海内外研究机构的专家学者围绕数字人文的前沿问题——“数字人文与计算”“历史地理信息系统”“数据挖掘与文学研究”“图像分析与艺术、数字博物馆”“数字史学的方法与案例”“数字人文与学术出版”6个主题做了共32个报告.本文从会议报告嘉宾的研究背景,以及报告的主题、内容等方面进行梳理,挖掘本次会议的内涵,探讨数字人文的前沿问题.

1 数字人文研究学者的背景

  对本次会议报告嘉宾的所属学科及研究方向进行网络调查统计后,选取词频大于或等于2的词绘制图1.由图1(a)可发现,本次数字人文会议的研究涉及地理、历史、统计学、资讯科学、建筑、经济、文学、艺术等学科.包弼德认为,历史是有时间性的,仅做历史研究是有限制的,地理研究虽没有历史学视野下的时间性,却提供了关于人物活动和事件发生的环境信息,可以说历史和地理一个注重时间一个注重空间,将这些信息都放在地图上,就可以从空间的视角观察中国历史变迁[2]140.因此,随着信息技术的发展,历史学与地理学逐渐走向数字化.早在19世纪,历史学家就开始将统计学引入历史研究[3]13.图1(b)更加细致地反映了数字人文的知识结构,除历史、地理外,新媒体、信息系统、城市、环境、比较文学、数字图书馆等构成了当前数字人文的应用领域.然而,有关数字人文研究必不可少的理论方法及技术构成相对较少,仅有少数学者有数据分析、机器学习、统计建模、文本分析等研究背景.数字人文被认为是一个典型的文理交叉领域,普遍认为研究人员既有传统人文领域研究者、计算机技术和多媒体技术学者,也有从事数据清洗、处理、建模、分析、保存等的数据专家[4]33.但从本次会议报告嘉宾的研究背景却发现,数字人文的研究仍是大多数人文学科的独角戏,研究多是采用现有的工具及方法进行词频统计、文本可视化、数字地图绘制、数据库建构等,对研究所需的文本挖掘技术、数字建模、知识关联、数据管理、VR/AR技术等少有探索.

2 数字人文研究的主题

  将32场报告的标题进行主题词梳理,剔除如“分析、研究、相关”等无意义的词语,合并意义相近的词,选取词频大于等于2的词绘制图2.毫不意外,历史与地理是本次会议的热词,代表本次数字人文会议的探讨热点;从历史时空来看,又以清代、近代的研究居多,北宋、三国、战国、民国的史学研究略有涉及.文本、主题、数据、信息表示数字人文研究的基本单元,而期刊、文献、资讯、诗歌等词反映了文本是数字人文研究最重要的数据来源.山水画、图像的研究对计算机技术水平依赖性较大,因此研究难度相对较大.人口、动物、台风、海关、格局、进士等词反映了数字人文的具体研究对象.通过一定的技术可对历史中的环境、政治、经济、人口及动物的变迁与演化进行梳理,并实现可视化呈现,因此,数据库、可视化、地图等词表示数字人文研究结果的呈现方式.GIS为历史地理领域的研究提供了新视角,是数字人文在历史地理领域赖以发展的重要工具,以GIS为载体的各种主题性地理信息系统成为当前数字人文的重点研究项目.比如,复旦大学历史地理研究中心建立了中国历史地理信息系统(CHGIS)[5],台湾大学数位人文研究中心开发的历史数字图书馆采用GIS工具提供“台湾堡图”“地形图”“卫星地图”“古今对照”“行政区域”五类地理分布图[6].设计、建构、初探、构想等词表示数字人文研究的过程,初探一词又进一步揭示了目前仍然处于数字人文研究的起步阶段,数字人文的相关理论方法,以及从信息整理到知识传承的实现都需要更长时间的探索.

3 数字人文的学科结构

3.1 历史地理信息技术

  以地理信息系统(GIS)技术为依托的空间分析法在经济学、历史学、语言学、人类学等人文社会科学领域得到了深入应用,逐渐形成了一套以“空间”为切入点的新型研究方法[7],吸引了众多学者.图3展示了本次会议中历史地理信息技术研究的相关主题.我国台湾“中研院”的中华文明时空框架以《中国历史地图集》以及“当代数字中国电子地图”为基础数据,建立了中国历史地理信息系统.我国台湾“中研院”范毅军以时空框架整合人、事、物的资讯,以时间为轴,统领不同时期的空间地理信息,形成以数字地球为基础的4D时空数据整合平台,提出“空间人文学”(GeoHumanities)的概念;认为基于大数据、大资料、大平台的支撑,传统的数字文档、数字人类学将转化为空间人类学.我国台湾“中研院”白璧玲认为,借助历史地理信息系统(HGIS),以历史事件为时刻数据建构模式,结合电子文献数据库标注技术,发展图文整合的时空信息平台,可实现数字文史资源的整合,并向数字人文跨领域研究发展[8].陕西师范大学的小林雄河和潘威通过挖掘历史文献,构建东北亚历史台风信息系统,重建台风活动数据,分析冷暖波动与台风活动的关系[9].一套信息平台仅仅是历史地理信息的图文展示,而研究历史上中国政治、经济、文化的变迁过程,必须建立在准确而详实的历代政区变化基础上.复旦大学徐建平对民国时期的行政区划进行了重点研究,发现了行政区划调整过程中自然因素、文化因素与政区、行政关系的互动关系[10],并展现了原本模糊的省级政区界限逐渐演变为精确的几何界线的动态过程[11-13].徐建平所在的复旦大学历史地理研究中心拟沿用CHGIS的研究方法,复原自民初至当今全国范围内的各级行政区划,建立现当代(1912-2013年)中国行政区域基础数据库.

  历史地理信息化的发展方兴未艾,还需积极借鉴与汲取相关学科的理论与方法,探索诸如历史文献的数字化、历史地理数据不确定性与精度评价、历史地名的空间定位与分析等重要问题[14].北京大学朱本军在《GIS与战国历史地理研究》的报告中阐述了运用GIS相关技术重新审视和回答战国历史地理研究中古地名方位定点标绘、交通线路与军事地理等问题①.南京大学陈刚等在完成“南京城市古旧地图数据库”初步建设的基础上,提出数据库建设的主要原则和建设要点:在前期准备过程中,应充分考虑城市历史地名的类别特征,分析城市历史地名的语义特征、类别构成特征,建立城市历史地名分类与编码体系,解决城市历史地名存储、管理、查询等过程中的分类问题[15].南京师范大学程星华对三国历史人物和事件进行梳理,以WebGIS的形式重现三国历史场景,并提供丰富直观的交互体验②.南京师范大学刘龙雨与胡迪在《读史方舆纪要》数据库建设中提出地名挖掘、分类解析的基本原则和方法,为古籍地名数据库建设和信息化提供借鉴[16].

  在历史地理数据时空建模、历史地图编绘、历史地理信息系统等历史地理信息化研究被广泛关注的同时,数字人文为历史时空中城市变迁、空间演变、地域文化特色的研究提供了新的思路.同济大学徐磊青以2015年第一届大数据研发SODA竞赛和上海城市设计挑战赛[17]的优秀作品为例,通过数据平台上下结合的方式,分析历史街区的保护与更新,发现在快速发展的新数据环境下,对于历史的城市设计不仅仅是回溯,还有待进行更多的构想和探究.在新的研究范式下,地理空间技术可用于更好地建构“空间叙事”及“深度绘图”,营造一种反思性的、深循环的、合作性的研究环境,从而成为未来历史学研究的里程碑[18].天津大学何捷对空间和行为、认知、社会等现象的多种再现方法进行讨论,解读数字人文视角下城市历史研究的途径和可能③.

  数字人文一般聚焦于“非政治”的论题,然而,近年来学者们开始用数字人文的方法去探索与政治相关的问题[19]32.复旦大学路伟东、王新刚对清末宣统人口的“地理调查表”进行回溯,梳理现存甘肃调查表的节点和信息,近距离触摸这次人口调查,发现城市行政等级与城市人口规模的真正关系[20].中国人民大学胡恒利用清代州县的“冲繁疲难”等级划分制度,借助GIS技术,从空间角度探讨清代的政治地理格局,从中看到交通路线、行政事务以及民风的空间差异,同时探讨了如何将地理运用于政治研究之中④.

  上述研究与其说是数字人文在历史地理领域的应用,不如说是历史地理信息借助GIS技术的数字化和信息化呈现.但是,在信息化过程中还需积极探索数据的可靠性、历史空间的定位、文本处理的智能化,以及深化史学背景研究等问题,以推进历史地理信息技术的发展,促进数字人文学科交叉融合的深度发展.

3.2 数字史学

  19世纪历史学家将统计学引入历史研究中,被称为历史计量学;而后,梁启超等学者运用数学统计方法写出历史计量论著;20世纪后期,历史计量学有了更加深入的发展,这被看成是数字史学的雏型[3]12.随着计算机科学、信息科学的迅速发展,学界掀起了一股借助计算机技术、数学方法对历史学进行研究的新流,也因此诞生了一大批历史学典藏数据库.然而,从数字人文的理念出发,申斌等认为数字技术不仅是保存资料的典藏手段和查找资料的检索工具,还可以协助研究者重新组织、分析资料,提供一个探索环境,成为一种数字史学的研究方式[21].本次会议中不少学者从词频、篇章语句、人物的社交网络等方面分析介绍了数学史学的方法和应用案例(见图4).

  华东师范大学李林从计量学的角度,将清代武科进士的人数变化、年龄、分布区域、考生来源、竞争力度、文武进士比例等进行分析[22].上海大学舒健基于汉语基督教书目文献数据库,从数量统计、历史分期、分布特征等方面对民国天主教的中文报刊进行宏观分析⑤.山东大学邱伟云借助“中国近代思想史专业数据库(1830—1930)”,从词汇史、概念史、话语论述等视角出发,使用文本挖掘、叙述性统计方法、CUSUM分群法对文献中“未来”一词的分布进行视觉化处理,并对单一报刊及多份报刊的“未来”论述结构进行比较分析,藉此抛砖引玉,对数字史学展开更多角度的研究⑥.中国科学院大学曹志红等以华南虎为例,对中国历史动物研究展开传统史学与数字史学的讨论.历史动物研究脱胎于历史动物地理学,又超越历史动物地理学的研究范畴.在传统史学研究中,对历史动物的研究始终以文献考述为主,然而有时即使通读全文也不得其要领,因此引入数字人文技术和方法,绘制专题图组,将动物变迁的过程实现直观化、可视化呈现[23].上海财经大学王哲、吴松弟在旧海关对外和埠际贸易网络前期研究[24-25]的基础上,将多元和复杂格式的旧海关贸易数据、文本信息进行整理,建立旧海关生态圈,挖掘旧海关文献的经济信息和历史研究价值.

3.3 图像视觉化与文学

  人文科学包括现代与古典语言学、文学、历史学、哲学、宗教学、神学、考古学、艺术等具有人文主义内容和方法的学科[26].从目前的国际数字人文研究来看,研究热点主要分布于文化遗产数字化保护、数字历史项目开发、数字人文基础设施和面向数字人文的图书馆服务四大领域[1]1.在斯坦福大学弗朗科·莫瑞蒂(Franco Moretti)的“文学实验室”成为具有全球影响力的数字人文和文学研究机构后,加州大学、芝加哥大学相继成立了类似的数字文学研究空间,国内学界也开始关注这股新的学术潮流,开始利用数字技术探讨文学、艺术的相关问题(见图5).

清华大学严程析取《魏其武安侯列传》中主要人物的相关线索,在时间线性排列的基础上标记空间、事件等关联节点,以量化直观的方式讨论经典史传文章的叙事策略及其特点,展现《史记》所代表的古代叙事文学的突出成就[27].浙江大学姜文涛等认为,“数字人文”作为一种新的学术潮流,正在改变传统意义上的以纸媒为主要对象、细读为主要方法的人文学科研究.他们将数字人文放在18世纪以来作为近代学科的英国文学研究的历史之中,考察这段历史对近代学科分工产生的影响,以及在知识生产转型方面带来的改变[19]26.浙江大学何辉斌用统计学的方法对20世纪翻译出版的外国文学进行分析,研究其词语的使用次数与排名的位次关系,最后绘制双对数表,在省力原则与费力原则的共同推动下,形成一条有规律的齐普夫曲线.南京大学何成洲基于Franco Moretti的远读理论,将世界文学不再视为一个客体对象,而是在时空中形构的一个行为或事件;以易卜生的《玩偶之家》为对象,研究小说中人物的思想、作品对中国新文化运动的影响等⑦.

  随着数字媒介时代的来临,由于技术的介入,图像和文学的外部生存环境及内部构成要素发生了变化,造就当前“图—文”文本转换以及“图—文”文本融合[28]的数字化研究环境,也因此打通了人文艺术学科中图画、图像研究的数字技术障碍.南京大学陈静从媒介转型过程中图像发生的改变入手,分析了图像知识的生成、传播、呈现方式,并从视觉知识生产的角度讨论了数字人文中的图像逻辑问题⑧.中国美术学院王平认为,综合运用图像信息分析、文本关键字研究技术和观念史研究成果与技术,能促进数字人文研究的推广及新领域的开拓[29].他以山水画中出现的“舟船”为数据对象,利用数据化图像分析和主题式文本挖掘技术,构建五代北宋山水画的图像信息数据模型,并验证了图书数据模型和数字人文研究方法在中国古代绘画研究中运用的有效性⑨.清华大学向帆与必果科技CTO朱舜山合作开发了具有多个图像关系映射模型间自由切换能力的Award Puzzle视觉化平台[30],探讨了大规模人文数据中有效挖掘信息的方法.不难发现,不管是在历史地理还是文学艺术学科的探索,历史数据的获取都是至关重要的,而数据主要来源于图书馆的古籍藏书、博物馆的收藏、民间私藏.近年来互联网数字博物馆在我国发展极为迅速,数字博物馆的平台优势在很大程度上改变了博物馆体制与观众视觉交往模式.南京大学殷曼楟认为,数字博物馆大都延续了实体博物馆的专业—知识型表征模式,从而导向了传统的专业—知识型视觉性;数字博物馆还采用了一种特殊的体验式形象表征——“萌”,又导向了当下的消费型视觉性.她提出探索公共视觉性建构的新路径:需从如何发展“个人视觉趣味自觉推动下的形象分享与讨论的视觉交往”模式着手[31].

3.4 数字人文的方法与技术

  科学技术的发展促进了人类文明与社会发展,可以说任何科学的发展都离不开技术的支持.数字人文的发展更离不开数字计算、关联网络、数据统计、文本识别、主题分类、数学模型等方法技术的相互映射.数字人文研究的技术体系包含了数字化技术、数据管理技术和分析技术、可视化技术、VR/AR技术、机器学习技术等,以构造数字人文的资源基础、应用平台、直观形象、交互环境以及智能系统,实现智慧服务[4]37.图6展现了本次研讨会中各位学者在数字人文研究中采用的方法与技术.

  文本识别挖掘技术中文档到主题、主题到词的模型构造、文本自动分类与有序化是支撑数字人文研究的基石,也是数字人文研究走向智能化、大众化的难点.潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型是处理非结构化文档的有效工具,但该模型既不考虑文档之间的顺序关系,也不考虑单词之间的顺序关系,精度不高[32].北京大学贾金柱介绍了多变点的主题动态模型方法,发现Gibbs Sampling算法可以实现Latent Dirichlet Allocation文档主题生成模型,并用该方法对商业数据进行了模拟研究,证实了其有效性⑩.中国人民大学王菲菲等利用用户在主题上相异的分布比例提取各自的兴趣话题集合,基于兴趣话题集合构造一组话题相似性特征,进行间接内容的挖掘[33],并认为Class Specified Topic Model(CSTM)作为LDA模型的扩展,可以有效解决文本分类和文本概括的问题,然后以20个新闻组数据集合进行实验分析,证实使用CSTM的文档分类模型效果更优.

  虽然有这些数字技术的支持,但离真正的数字人文定量研究还有多远呢?广西大学高剑波等介绍了多维尺度方法在小说情节发展的量化研究[34],采用分形分析技术对佛教石窟壁画以及大量媒体数据进行定量研究.北京大学邓柯等认为,统计学思想和方法在数字人文研究中常常被错误地使用和解读,他们从统计学的本源出发,从数据科学的视角讨论了数字人文研究中的数据分析问题,并以《红楼梦》《宋史》为例,介绍了无指导中文分析新范式[35].南京大学王成军等采用大规模的手机通信数据构建注意力网络,揭示了线上注意力流动和线下移动行为的机制,以此讨论注意力流网络在计算传播研究中的优势与局限性[36].统计学和大数据技术为数字人文的研究注入了很多新的理论和方法,改变了人文学科传统的主观性研究手段,量化数据使人文研究的方法体系逐渐丰富和立体.

4 总结与思考

  近年来,数字人文研究发展迅速,吸引了国内学界的密切关注,学者们积极展开研究.本次会议呈现如下特点:(1)以实践经验交流为主,对数字人文的概念内涵、发展起源等理论体系少有探讨.(2)数字人文的研究仍处于探索阶段,未见固定的研究范式.(3)成果推广展示较多,对研究方法、过程鲜有分享.(4)研究工作的热点集中在历史、地理上,重心停留在采用GIS技术进行各种主题的历史数据库建设上,对史料采集、信息挖掘、图像转化的智能化及信息化较少讨论.(5)研究人员以人文学科的学者为主,有计算机、数学、统计学等学科背景的学者较少.(6)主要探讨数字人文未来发展的新思路和新视角,对目前研究工作中的局限和困难少有思考.总而言之,数字人文的研究为人文学科中事件、人物、环境、政治的变迁赋予了可追溯性及动态性,提高了历史数据的可用性,为知识的传播创造了新的途径和机会.但数字人文的发展不是哪一学科或者哪一个单位的独角戏,而是各个学科的协同创新,各种技术的有机融合才能有效促进学科间的资源共享和知识发现,才能为数字人文的发展提供一个知识性、创造性的研究环境,才能为社会发展绵长历史中人文精神的传承起到推动作用.

  数字人文的研究与图书馆的业务发展息息相关.图书馆不仅在数字人文研究中起到史籍查阅、信息采集、资源保障的作用,还为研究中期的资源数字化、平台搭建、空间协调以及研究后期的数据库使用、成果展现与传播提供重要支撑.可以说,图书馆作为信息资源保障及文化传播机构,在数字人文的发展中担任着资源保障员、信息咨询员、平台搭建者、成果传播员、空间提供者、工具使用培训员等多种角色,为数字人文研究的多学科知识需求提供协同与融合的平台.随着数字人文研究需求的增长,图书馆将打破以纸质文献和电子数据库为主体的传统资源结构及学科服务模式,未来将不断增加人文专题的馆藏资源,搭建文本挖掘、信息利用、知识传播等多层次的可视化数字人文平台,提供立体化的咨询服务.数字人文技术的发展为图书馆的转型发展带来了新的契机,也带来了新的挑战.面对数字人文新的需求,图书馆应当主动融入、积极参与,为数字人文的研究提供支持与保障,积极探索古籍文献的收集与保藏,加快历史资源的电子化及数字化进程,提高信息有效利用与快速传播的能力.在数字人文的研究与实践中,图书馆将继续探索如何将数字人文的研究需求与自身的业务相结合,解决数字人文交叉学科的多重服务需求与目前读者或学科服务模式的冲突,实现数字人文研究中知识传播与文化传承的相互推进.

收稿日期 2017-08-02

(责任编辑:何燕)

大数据时代论文范文结:

关于大数据时代方面的的相关大学硕士和相关本科毕业论文以及相关大数据时代论文开题报告范文和职称论文写作参考文献资料下载。

1、大数据时代论文

2、关于大数据的论文

3、大数据杂志

4、有关大数据的论文

5、健康大视野杂志

6、毕业论文题目大全集