《“数字化+”背景下古代小说研究的拓展维度-ExpandedDimensionsofAncientNovelResearchundertheBackgroundofDigitalizationPlus.docx》由会员分享,可在线阅读,更多相关《“数字化+”背景下古代小说研究的拓展维度-ExpandedDimensionsofAncientNovelResearchundertheBackgroundofDigitalizationPlus.docx(16页珍藏版)》请在三一办公上搜索。
1、“数字化+”背景下古代小说研究的拓展维度ExpandedDimensionsofAncientNovelResearchundertheBackgroundof,DigitalizationPlus”作者:张袁月作者简介:张袁月,中国石油大学(华东)文法学院副教授,博士,研究方向:中国古代文学与文化、文学地理研究,E-mail:zyy,山东青岛266580原文出处:太原学院学报:社会科学版2023年第20232期第84-92页内容提要:文献数字化作为古代小说数字化研究的基础,最初主要应用于文献版本学。“数字化+”是伴随着数字化转型而产生的古代小说研究新趋势,其核心仍是数字化文献及比对方法,但通
2、过技术叠加复合不同形成了“数字化+GIS”“数字化+可视化”等多种路径,从而推动文学图像学、文学地理学、文学地图学、文学景观学、小说知识学等新兴领域的发展,并可与文献学、叙事文化学、小说评点研究等形成整合互动。随着“数字化+平台化”“数字化+智能化”的逐步建设,古代小说研究将进一步从“数字化”“数据化”走向“数智化”,这实际对文史学者的专业素养提出了更高要求。ASthebasisofdigitalresearchonancientnovels,thedigitizationofliteraturewasoriginallymainlytargetedtothestudyofliterature
3、edition.Digitalizationplusisanewtrendofancientnovelresearchwithdigitaltransformation,whichfocusesondigitalliteratureandcomparisonmethods.However,withtechnicaladvancement,variouspathssuchasdigitizationplus,GISanddigitizationvisualizationhavebeenformed,thuspromotingthegrowthofemergingfieldssuchasliter
4、aryiconography,literarygeography,literarycartography,literarylandscape,andnovelknowledge.Itcanalsointegratewithphilology,narrativeculture,andnovelcommentaryresearch.Withthegradualconstructionofdigitization+platformanddigitization+intellectualization,thestudyofancientnovelswillfurthermovefromdigitiza
5、tionanddatalizationtodigitalintelligence,whichmeansscholarsofliteratureandhistoryneedmoreprofessionalcapacity.期刊名称:中国占代、近代文学研究复印期号:2023年07期关键词:数字化/古代小说/比对/GIS/可视化digitizationancietnovels/COmPariSOnGISvisualization标题注释:国家社会科学基金一般项目(21BZWlO5)。中图分类号:1207.419文献标识码:A文章编号:2096-1901(2023)02-0084-09自20世纪末至今
6、,古籍文献数字化已有三十余年的发展史,并成为古代小说数字化研究的基础。古代诗文研究领域依托全唐诗全宋词等数据库,在诗歌声律分析、诗词作者考证、诗词传播考察等方面产生了大量成果。相比之下,古代小说对文献数字化的应用更多还是在文献版本学方面,且主要集中在几大名著。随着我国的数字化转型,数字化+”的新趋势也被带到古代文学研究中,但尚未引起古代小说界的充分关注。本文即尝试以近年来兴起的文学图像学、文学地理学、文学地图学等为例,探析数字化+GIS数字化+可视化”等研究路径如何给古代小说研究带来新的学术增长点。一、文献数字化与古代小说数字化研究的基础文献是古代文学研究的重要基础,但古代文献不仅数量浩如烟海
7、,载体与藏所也非常分散,而文献数字化所提供的海量文献及便捷检索,则在很大程度上解决了古代文学研究资料离散和时空分离口口09的难题。文献数字化的直接产物是数字化文献,但文献数字化并不等于数字化文献。数字化文献只是文本形态载体的转变,其本质仍然是文本,而文献数字化产生的是信息数据。以小说为例,数字化文献呈现的是人物、情节、地理空间等小说文本要素,文献数字化则聚合了人名、地名等信息数据。这些信息数据可被检索、提取、统计、比对,从而为后续研究提供基础。如果说数字化文献的主要意义在于极大地节约了人力、财力和时间,那么文献数字化的意义则更多在于可根据研究者的需求,提取、编辑与组合不同的数据,从而解决不同的
8、文学问题。这正是数字化转型的本质:以业务为核心,立足业务需求,用数字化工具解决业务问题。在古代小说数字化研究中即是指研究者从数字化文献中提取所需的信息数据,用以解决文学研究问题。文献数字化在古代小说研究中的最初主要业务”在文献学领域,并集中于四大名著的版本研究。在古代小说版本数字化以前,学者研究版本需要四处访书、购书,将多部书堆叠在一起对照比较,遇到不夕M昔的版本,还需要抄录比对,大部分时间都用于人工比对文本,因而对多版本小说的同时同地研究成为急迫的业务需求。而版本数字化后可将小说多个版本集成于同一平台,在此基础上实现计算机自动比对(数字化工具),根据研究者的不同需求,还可选择对小说版本进行分
9、窗口或逐行逐字的比对,从而使研究者把宝贵时间专注于研究本身(解决业务问题),也为小说文本的校勘、小说版本的演化等研究提供了新的思路。数字化+”能够使小说研究的视角更多维,形式更丰富,但并未改变小说数字化研究的核心:文献数字化与比较方法。将与小说研究密切相关的文本、图像、评点、方志等数字化以后,可通过版本比勘、文字比对、图像比对、文图比照等方式探析数字化文献之间的关系。此外,由于数字化往往涉及大数据,故数理统计也成为小说数字化研究中常见的方法。不过统计本身并非研究目的,只是中介,最终仍需通过对统计数据所生成的图表、图像等进行比较,以挖掘文学深层信息。二、数字化+背景下古代小说研究的新领域数字化+
10、”是本文在数字化转型背景下提出的一个概念,指在数字化技术上叠加其他技术作为研究手段。数字化+并三库纯的技术复合,而是研究者根据研究需求(业务需求),选择适用的技术手段对数字化文献进行处理(数字化工具),并由此发则口揭示新的文学现象与规律(解决业务问题)。将数字化+引入古代小说研究,有助于拓展古代小说数字化研究的维度,在文学图像学、文学地理学、文学地图学、文学景观学、小说知识学等新兴领域中发挥积极作用。(一)数字化+可视化:文学图像学图像学本是艺术研究的新方法,引入中国后与图志、插图等相结合,如今已逐渐形成富有中国特色的“文学图像学2。与古代诗文多为文字形态不同,古代小说常附有插图。这些插图与文
11、本往往有互文关系,或强化文本,或扭曲文本,对研究古代小说的主题思想、人物形象等有重要价值。3324然而,不少小说插图本在出版时都被删去了插图。古本小说集成古本小说丛刊等虽收录了不少插图,但学者很难个人购入这些大型丛刊,查检不便。随着小说版本数字化建设,附着于文本的图像也得以数字化,而文学图像作为一种将文本及文学史料可视化的独特视角,自然地将“数字化与可视化联结到小说研究中。不过,对文学图像的研究本身尚未体现出数字化+可视化”在技术层面的特征和优势。如果将海量的文学图像数字化,并实现检索、统计等功能,那么研究者就可根据需要提取图像数据,进行图像挖掘。目前国内尚未有成熟的文学图像数据库建成,但在技
12、术层面并不难实现。就数据库所需的海量基础数据而言,中国古代小说插图数量庞大,据不完全统计,仅古本小说集成古本小说丛刊古本戏曲丛刊等几部丛刊中的插图数量就多达20余万幅4。且不少插图已随古籍的数字化转为了数字化图像,后续只需将其独立与集成即可。要实现检索功能,可对收录的图像数据进行标注,基本标签包括图像的类别、标题、来源、主要视觉内容等。当图像附加标签后,不仅容易检索,而且图像由此转为了“数据,从而也就可以实现统计功能。在此基础上,文学图像学的数字化+可视化研究有两条基本路径:其一,通过图像比照,建立图像之间的关联,从而将“文-文或文-图”的视角转换为图-图”的可视化视角,以此发现关联图像反映的
13、时代或地域信息。虽然传统研究也会涉及图像比照,但数字化图像的优势在于多数据与大数据的比较,因而对于多版本多插图的小说而言,可集成于同页面的数字化图像显然比翻阅多部纸本图像更便捷。目前,三国演义水浒传西游记均已有了上图下文的数字化插图比对本5617-640,这不仅可以方便地对不同版本的小说插图进行比较,而且为版本的演化研究提供了新的视角。当更多此类插图比对本问世后,研究者还可通过文-文”文-图图-图等多重交互比较,找到文学与图像的深层关联。其二,通过图像统计,并利用可视化手段生成树图、弦图、词云图等二次图像,从而将文字描述或表格形式转换为更为直观的图像形式,从而揭示出文学图像中隐含的现象与规律。
14、在传统研究中,也有论者通过阅读大量图像后总结出一些规律,如郑振铎就曾在搜集三千余种附插版画图籍的基础上,对中国历代版画插图的特点做出了精当总结,如明刊小说插图繁夥且多精雅工致,而清刊小说多无插图且趋于简陋等117-126。然二十多年的搜集之功,非一般人所能企及。而数字化图像海量集成、批量获取的特征,则可使研究者节约大量搜集的时间,将精力更集中于对图像的统计与分析上。此外,数字化图像的可复制、可分享特征,能够让更多学者异地共时研究;数字化图像的大数据优势,也能使图像统计更精确、完整地反映文学历史图景,避免了印象式判断。在数字化+可视化”的辅助下,文学图像学将突破当前局限,得到新的拓展。例如,文学
15、插图研究主要关注文本图像,文学图志研究更侧重壁画、出土文物等,而当这些图像集成于同一数据库中,研究者就可以通过图像比照,将文本内部和外部的图像建立关联,从而更大程度地还原文学图像的时代地域风貌。再如,有些小说插图虽然粗劣,却会因价格低廉而受到普通民众欢迎,如果将这些海朝图也纳入图像统计和研究,能在一定程度上改变当前研究集中于热点名著和精工版本的现状,从而更全面反映古代小说的传播情况。此外,图像的数字化还将打破文本与影视的界限,可以通过文本图像与影视图像的比较,对古代小说的改编传播进行全方位、立体化的研究。(二)数字化+GIS:文学地理学与文学图像学一样被列为古代文学最新趋向71109-1132
16、的文学地理学,是一门有机融合文学与地理学研究的新兴交叉学科81,对强化文学空间维度具有积极意义。在文学地理学的两本开拓性著作一曾大兴的中国历代文学家之地理分布(1995)与梅新林中国古代文学地理形态与演变(2006)中,对文学地理分布的研究还主要依赖于人工统计,对文学地理数据的呈现方式主要是表格。近十余年来,文学地理学则更多依托数字化+GIS”的结合,基本实现了对中国古代各历史时段文学地理分布的全覆盖。地理信息系统(GeograPhiCInformationSystem),简称GIS,属于一种信息化技术。中国古代文献史料数量庞大,而GIS能对信息进行快速处理和分析,因此特别需要被引入到像历史学
17、和古典文学研究这样的学科中9。数字化与GIS都长于大数据处理,但数字化处理的数据主要是标量(数量),GlS处理的数据则为有方向的矢量,因此对于文学地理这样需要处理大量空间信息数据的研究而言,在数字化基础上应用GIS是题中之义。传统小说研究更关注人物和情节,即使注意到地名,也仅限于和中心情节密切相关的主要地名。有些地名可能在单篇小说中只是一掠而过,意义不大,但若在不同小说中反复出现,则可能反映出特定的时代或地域特征。以唐传奇为例,从唐传奇中的地名可发现唐代哪些城市更受关注,由此进一步探析古代小说与城市之间的关系。但如何将大量唐传奇中的零散地名提取出来是一个难点。如果使用传统手段,需要阅读几百篇小
18、说,再对小说文本中的地名进行人工标注,然后将其录入EXCEL,才能实现下一步的统计;而利用MARKUS这样的古籍标注工具,则可以对数字化小说文本中的地名进行自动标注和快速提取,辅以数据清洗与人工校正后,即可利用词频统计软件得出各城市在唐传奇中的出现频次。统计结果显示,长安在唐传奇中复现频次最高,其次是洛阳和太原,而这排在前三位的城市恰好是唐代的三大都城。同样,可对宋传奇进行统计,排在前列的是开封、扬州、洛阳、临安等城市,也是都城与繁华城市居先口0。由此可证明“文学重心的分布一般在京畿之地、富庶之区、文明之邦与开放之域口162这一文学地理规律,也反映出古代小说鲜明的城市属性,而不像古代诗歌有大量
19、篇目描写田园乡村。同样,明清公案小说等小说类型往往卷帙浩繁,人工标注地名的工作量巨大,用MARKUS则可实现对大规模地名的自动标注。此外,与小说研究密切相关的方志,也可通过用此方法进行快速标注。如利用MARKUS,完成民国郸县志中3877个地名、3070个官名、2872日期的精确自动标注和统计只需要半小时12。MARKUS之所以能够实现古籍的半自动标注,并非由于本身开发了强大的分词标注技术,而是主要依托了所关联的权威语料数据库。也就是说,MARKUS并非直接识别和标注小说文本,而是将小说文本与外部关联语料库进行比对,发现匹配的语料数据则予以标识。MARKUS要标注地名,就需要关联GIS相关数据
20、库,如中国历史地理信息系统(CHGIS)。若需标注历史人名和官职名,则可关联中国历代人物传记资料库(CBDB)。可见,数字化+GIS并非仅限于人们通常能够想到的数字地图,除了地理空间信息的采集、定位、管理,数字化+GIS还可在地理数据分析及趋势预测方面发挥重要作用。如果要进行更细致的比较,还可以利用GIS,将地名转换为有经纬度的矢量数据,然后在历史地图上进行定位和分析。如前文所述的唐传奇与宋传奇,利用中国历史地理信息系统(CHGIS),可查询到小说中城市地名的经纬度,并在唐代和宋代历史地图上进行定位,会发现宋传奇的地名分布与唐传奇相比虽有所变化,但从整体来看,宋传奇最密集的区域仍在河洛地区与江
21、南一带,从而可以改变通常认为的宋代小说中心完全南移的印象式判断。尤其是在文学地理学研究重心由外部研究向内部研究转变133-9的背景下,长期遗落在研究者视野外的大量非经典作品也将不再只是冷数据,而可以通过数字化+GIS得以激活,并以大数据的形式发掘出新的文学现象。(三)数字化+GIS+可视化:文学地图学、文学景观学、小说知识学文学地理学在应用GIS时,通常会绘制出数字地图,因而最初的文学地图研究主要依附于文学地理学,但近几年文学地图以其在空间视角方面的独特优势,已逐渐发展为独立的研究领域。2021年,以文学地图学国际论坛的召开与西南大学文学地图学研究中心成立为标志,文学地图学初步启动建设。目前,
22、英美文学领域的文学地图学研究比较活跃,中国古代文学的相关成果主要集中在诗文领域,而古代小说研究领域相对还比较寂寥。这是由于诗文领域已建成多个大型专题健库,而古代小说领域几乎还没有较为成熟的专题数据库。由此可见文献数字化程度也会影响到古代文学数字化研究的深度和广度。不过,这并不意味着文学地图在古代小说研究中难以发挥作用。恰好相反,如果说文学地图在文学地理分布研究中更多是作为辅助性图示,那么在文本研究方面,文学地图与具有“内在的地理学属性口444的小说文体则有着天然的契合点。将看似和情节关联不大的地名、景观、距离路线等地理信息绘制成地图,其实质是将地理与文学现象的关联“可视化,从而让我们看到目前被
23、遮蔽的一些重要关系”口53。如果要进行更深层次的解析,则还需要和其他文本的地理信息数据进行参照分析。数据样本量越大,就越可能挖掘出不同文本之间的关联信息,由此文献数字化的基础作用再次凸显出来。另一方面,由于GIS具有空前的能力,能处理并视觉化呈现一个空间场域的数据,这就使地图的力量被重新发现了16。GlS和可视化技术的结合可以使数字地图超越纸质地图的静态、固定的呈现方式。比如,研究唐传奇时经常需要借助唐代长安城的空间格局予以说明,但纸质地图难以呈现多重图文信息,而数字化地图则可以根据研究者需要,进行附加文本链接信息、更换底图、叠加覆盖图、标记地名和距离等操作,从而使过去孤立的研究方式有了多元化
24、、发散性的转变。以李娃传为例,日本学者妹尾达彦(1995)根据李娃传中的地理空间绘制了地图,由此揭示出长安里坊所具有的空间意义口刀509-553,但主要还是依赖人工绘制。借助GIS制作的唐长安数字地图,则可由里坊间的距离发现小说的情节伏笔。如果结合可视化技术制作热力图,还可由主人公在不同热度里坊之间的地理轨迹转换,揭示出小说“迷失一堕落一醒悟的主题18。而若对小说进行文本语义提取和情感赋值,还可绘制出李娃传的场所词云地图、情感地图、社交网络地图等口9。尽管对情感、社交这类不具有空间定位特征的“地图尚存争议,但毋庸置疑的是,数字化+GIS+可视化”的文学地图已经突破以人物情节为中心的传统研究模式
25、,并强化了古代小说研究的空间维度。此外,对于近几年尚在雏形中的新兴研究领域,如文学景观学、小说知识学等,数字化+也将大有可为。文学景观是文学地理学的新热点,文学景观学被视为中国文学地理学未来建立的十六个分支学科之一20,但传统以知名景观为研究对象的个案式分析显然难以撑起一个学科,而随着文学景观数据库的建设21,古代小说研究即可以文学景观大数据为基础,从文学景观的地理分布去探讨景观生产等问题。传统的小说研究主要是艺术与思想两个维度,小说知识学提供了第三个维度一知识。小说知识学以知识作为聚焦点,这不仅有助于全面把握小说文体及文本属性,还可能成为中国古代小说原创性理论研究的出发点和着力点22,是很有
26、潜力的新领域。然而,要想把握古代小说家的知识来源、小说文本的知识要素和谱系,以及分辨积累变化中的新旧知识,在传统研究模式中恐怕只有少数博闻强记的学者能达到。而数字化+”在大数据方面的优势与“知识”的驳杂属性恰可对接,如果通过数字化叠加文本语义提取、机器学习等技术,挖掘不同文献与文本之间的关联,即可找到小说知识来源,提取知识要素,此外还可以叠加可视化手段,将知识谱系以网络图谱等可视形式呈现出来。三、古代小说拓展维度与已有研究领域的整合互动在“数字化+”背景下形成的新研究领域,并非要舍弃基于文献与文本的研究传统,而是可以通过新旧领域的整合互动,推动古代小说研究的深化?细化。(一)与文献学的整合互动
27、传统文献学通常基于一人或一地文献进行考论,文学地理学往往基于文学家籍贯考察文人地理分布。若将两者进行整合,则可根据文献刊刻的地理分布去研究文学现象与规律。如黄一玫(2020)基于宋代杜诗学文献的刊刻地理分布23,解析了杜甫诗在宋代广泛传播的原因。同样的思路可应用到对小说刊刻地理分布的研究中。以明代建阳刊小说为例,若局限于建阳一地文献进行考论,对一些问题解释可能会出现困惑或偏差。例如,种德堂是建阳熊氏书坊之一,但种德堂刊绣榻野史却未采用建阳刊小说上图下文的标志性版式。如果考察刊刻地理分布,则会发现金陵也有建阳书坊的分店24,这也就能解释为何种德堂刊绣榻野史采用的是江南小说常见版式。目前关于明代书
28、坊,学界已积累了较为丰富的史料文献与研究成果,可绘制出小说刊刻地理分布图,从而对明代小说刊刻的地理分布特征、传播特征、刊刻题材与地域关系等诸问题进行更深入的探讨。在此基础上,还可以研究刊刻地理分布对小说插图特征及演变的影响等,这就与文学图像学也进行了整合互动。此外,文献学的研究方法还可引入到文学景观学、小说知识学等新兴领域中。如利用文献学的版本比勘方法,将不同版本的地方文献或小说文本中的景观信息进行比对,可成为研究文学地理景观变化的特别视角。在对作家的行迹、交游、阅读等进行文献考证的基础上,再与其文学创作建立起内在关联,这实际也正是小说知识学对作家知识来源、文本知识要素及谱系的分析过程。(二)
29、与叙事文化学的整合互动叙事文化学是结合中国古代叙事文学实际,采用文献学方法以研究故事主题类型的中国化的主题学25。叙事文化学更注重故事主题情节单元中人物和情节的磨变,而文学地图着眼于地理信息的设置与变化。如果将两者结合,则可能对故事主题类型有更全面的解析。以子报父仇26313主题为例,唐代小说有崔尉子,宋代小说有卜起传,明代小说有苏知县罗衫再合等。利用GIS和可视化技术将小说中的相关地点与路线绘制成文学地图(见图1),会发现以下相似点:图1子报父仇主题小说文学地图说明:图1左、中、右分别为崔尉子卜起传苏知县罗衫再合文学地图,底图分别为谭其骥中国历史地图集的唐代、北宋、明代矢量数字化地图。1 .
30、遇害者家乡均田匕方的京畿地区,这就为后文遇害者之子赴京师应试时路过家乡提供了合理的空间逻辑,从而为真相的揭示埋下了伏笔。2 .出发地与目的地均需跨越多个行政区域,故赴任官员在漫长行程中需携带较多行李财物,为后文因歹人见财起意而遇害的情节提供合理情节逻辑;3 .目的地或遇害地都位于水路交通沿线,在水域遇难使遇害者的尸体不易被发现,加上遥远赴任地造成的通讯不便,真相才可能藏匿数年。不同时代的小说对地理位置和路线有着相似的设置,这是该主题赴遇害一从贼一遇亲的情节单元内在逻辑所决定的。但在不同的时代背景下,它们又有各自特点。例如,在赴任情节单元中,苏知县罗衫再合开头用话本小说常见的某时某地某人”的模式
31、寥寥几笔介绍人物,崔尉子在介绍崔氏时,则叠加了清河、荥阳、太原等唐代高族郡望地名,凸显出崔氏的财力,为舟子见财起意进行了合理的铺垫。而崔氏以富贵之身遇害,王氏以富贵之身从贼,以这种落差增强了小说的悲剧意味。可以说,崔尉子是用典型的唐人思维和叙事方式写成的,呈现出唐传奇独有的时代特质。而在遇害单元中,崔尉子对遇害地一笔带过,苏知县罗衫再合却对遇害地的险恶水域形势作了具体描述,甚至对歹人事后从水上的返程地点和路线也进行了描写,并将相认和复仇这一高潮情节的地理空间设置在了南京,折射出江南小说家的地域意识,也体现出明代的时代特征。凌濠初二拍中也有类似的地理设置改动和细化处理,可见地理信息也可作为解码文
32、学嬉变的钥匙。如果说叙事主题学侧重从时间维度梳理出小说的嬉变脉络,那么文学地图则可以从空间维度更立体地还原小说所在的时代地域图景,从而建构时空并置交融的文学史。(三)与小说评点研究的整合互动古代小说评点是具有中国特色的批评方式,以往对小说评点的研究重视评点家对人物情节、文章结构、小说技法等评价,一般很少注意到地理信息等非情节因素”,而从地理信息中挖掘深层信息恰是文学地图所长。将文学地图与小说评点相结合,可以对小说文本及小说批评有更深入的认识。例如,林教头风雪山神庙是水浒传中最精彩的回目之一,向来颇受重视。将李卓吾容与堂评本与金圣叹评本进行版本比对,会发现前者写到林冲想起“五里魁卜有市井,故去沽
33、酒,而后者同段文字作“二里路外,这一字之差很少有人论及,因距离属于去掉后几乎不影响情节的完整性的“闲笔”27。但如果从文学地图视角来看,金评本的二并非因与五字形相近产生的衍误,而恰是金圣叹的有意评改。联系上下文会发现,小说写林冲出草场去沽酒,行不上半里多路遇到一个古庙,在林冲发愁夜宿问题而想起古庙时,小说又一次强调了离了这半里路上28。正因离得不远,在已天黑的背景下,林冲去古庙夜宿是合理且可行的。且因距离较近,在草料场被放火时,林冲才能听到爆响、看到火光,陆虞侯等三人边走边议论刚才的放火并被林冲听到,也才合情合理。换言之,半里之外的古庙设置是“沽酒一夜宿一放火一杀人”这段情节的关键较链。而这两
34、处金圣叹分别评道妙绝奇绝,安此一笔行文如此,为之叹绝”28212-213,可见金圣叹关注到了小说的距离设置。这并非臆断,因为在李小二退场一段,金圣叹也特意指出,很多人认为李小二只是小人家离得远了”这句闲语可删,是没有看到小说作者“以此一语为李小二作收束28210-212的巧妙用意。小说安排李小二夫妻的出场,是为下文陆虞侯三人害林冲之事埋伏线;但林冲既是李小二恩人,后者理应追随,如何让李小二在完成文学功能后退场呢?遥远的距离设置则可使李小二合理淡出情节。由此可见,金圣叹将五里路外改成二里路外是有意要借助距离设置以建立人物行动的合理逻辑,由此对金圣叹的评改思想也可有更全面的理解。如果利用数字化版本
35、比对,找出更多曾经被人忽略的闲笔,则不仅可以更好地分析小说叙事构思,也可能为古代小说评点研究拓展新的思路。四、从数字化、数据化走向数智化从数字化+在古代小说研究中的应用实例可以发现,实现数字化+最重要的一环是“数据化,即文献不仅发生了从纸质文献到数字化文献的载体变化,而且发生了性质的变化一从“文献转换为数据。从数字化到数据化”的这一转变,不仅为后续的复合技术奠定了基础,更重要的是带来学术思维和学术范式的转变。比如传统的文本细读(CloSereading,直译为“近读)面向极少量文本,而数据化则提供了一种基于文本却不止于文本的远读(distantreading)方式,揭示出多时空、多文体、多文本
36、之间的隐性关联。由此,古代小说数字化研究与传统研究相比,最大的改变并非人工工作量的减少,而是在文史互证”基础上强化了“数据挖掘。根据研究对数据的不同业务需求,数字化+可以在数字化和数据化基础上叠加不同的技术手段。比如,前文提到的文学图像数据库,其建设工作量相比文本数据库可能更为巨大,可以考虑允许专业注册用户在基本标签上根据图像特征和内容标记更多标签,以便所有用户可以更精确地检索到所需图像;同时允许用户上传新的图像,经审核后可收录到数据库中。这样的多点共建,可以大大加速文学图像数据库建设进程。为了鼓励用户上传和标记有价值的图像,数据库还可建立激励机制,如用户达到一定积分,使用权限可延长或扩大等。
37、此外,还可以借鉴CNKI学术图片库的作法,将图片与文本进行超链接。这样,文学图像数据库与那些以浏览、检索为主要功能的传统数据库已有所不同,前者实际成为了一个集成性、互动性的平台,也就是数字化+平台化。如果想要减少人工标注图像标签的工作量,可利用计算机图像视觉技术对图像进行自动标注,这就是数字化+智能化”。同样,随着GIS技术和可视化技术的发展,文学地图也将从单纯的数字化地图转换为开放性、集成式、个性化的信息整合平台。在文献数字化的基础上,研究者可以在一些数字化古籍库中进行检索查询,统计及提取所需的数据导入平台,生成个性化的文学地图;也可以从一些数字化方志中截取或下载相关地图,并导入平台中作为底
38、图,再根据平台提供的编辑功能,结合所研究的文学对象进行编辑加工,绘制文学地图。地图除了可以保存、导出、发布,还可以通过共享功能将其上载,供其他研究者参考或使用。目前古代小说尚无专题数字化地图平台建成,但可以利用建设较为成熟的唐宋文学编年地图平台以及学术地图发布平台辅助研究。随着数字化+平台化数字化+智能化”等更多新路径出现,可以预见,在不久的将来,古代文学研究也将进入“数智化时代。这将给文史研究者带来新的挑战。但最大的挑战并不在技术方面,因为当技术足够成熟时,技术的应用操作反而将趋于简单,就如今天人们使用智能手机拍照,不需要掌握专业的摄影技术,就可以拍出一键大片”的效果。未来数字化+”在古代文
39、学研究的应用中,技术门槛将会逐渐降低,对研究者的专业素养要求则会更高。面对庞杂的海量数据,研究者需要获取到与研究目标相关的有效数据,需要从数据中挖掘出文学的隐性信息及相互关联,还要能够对数据呈现出的文学现象做出合理的解释,这些实际都在考验研究者是否具有敏锐的问题意识及扎实的专业素养。文史学者只有不断提升专业能力,在守住学术传统的基础上最大化地利用技术的优势,才能真正实现借器之势,出道之新29。原文参考文献: 1王兆鹏,邵大为.数字人文在古代文学研究中的初步实践及学术意义J中国社会科学,2020(8):108-129,206-207. 2段德宁.文学图像学溯源及其中国语境J.内蒙古社会科学(汉文
40、版),2015(4):143-149. 3乔光辉.明清小说戏曲插图研究M.南京:东南大学出版社,2016. 4乔光辉.文学图像学研究之反思J.中国传统文化研究,2021(1):53-61. 5周文业.古代小说数字化二十年M.郑州:中州古籍出版社,2020. 6郑振铎.郑振铎文集M.北京:线装书局,2009. 7梅新林,曾礼军,慈波.当代中国古代文学研究(1949-2019)M.北京:中国社会科学出版社,2019. 8梅新林.中国古代文学地理形态与演变M.上海:复旦大学出版社,2006. 9郑永晓.以GIS为例看信息技术在古典文学研究中的应用J重庆教育学院学报,2006(5):59-62. 10
41、张袁月.文学地图视角下的唐传奇论析J中国石油大学学报(社会科学版),2019(5):71-77. 11曾大兴.文学地理学研究M.商务印书馆出版社,2012. 12于亚秀,李欣.数字人文视域中的古籍文本标注方法研究一一以MARKUS为例J.大数据,2022(6):15-25. 13曾大兴.推动文学地理学研究重心由外部研究向内部研究转变M曾大兴,夏汉宁,张祖立,编.文学地理学(第10辑).北京:中国社会科学出版社,2022. 14CRANGMCulturalGeographyM.London:Routledge,1998. 15M0RETTIF.AtlasoftheEuropeanNovel180
42、0-1900M.LondonrVerso,2015. 16戴维J博登海默,马庆凯,钦白兰,等.空间人文学:技术途径展望J.文化研究,2016(4):55-71. 17妹尾达彦.唐代后期的长安与传奇小说一一以李娃传的分析为中心M刘俊文.日本中青年学者论中国史:六朝隋唐卷.上海:上海古籍出版社,1995. 18张袁月.从热力图看唐代小说的长安里坊空间J.大原学院学报(社会科学版),2021(3):1-6. 19马昭仪,何捷,刘帅帅.中国古典叙事文学的时空叙事数字模型研究一一以李娃传为例JL地球信息科学学报,2020(5):967-977. 20邹建军.文学地理学学科体系的建构及其实现途径J.黄冈师
43、范学院学报,2020(4):39-49. 21邵大为,陈逸云.建设文学景观数据库的价值与方法一一以方舆胜览为例UL中南民族大学学报(人文社会科学版),2020(1):107-111. 22刘勇强.小说知识学:古代小说研究的一个维度J.文艺研究,2018(6):56-67. 23黄一玫.宋代杜诗学文献地理分布可视化及成因J.中国石油大学学报(社会科学版),2020(3):82-88. 24涂秀虹.论明代建阳刊小说的地域特征及其生成原因J.文学遗产,2010(5):96-107. 25宁稼雨.主题学与中国叙事文化学的构建J.中州学刊,2007(1):214-216. 26丁乃通.中国民间故事类型索引M.郑建成,等,译.北京:中国民间文艺出版社,1986. 27陈才训.“闲笔”不闲一一论古典小说中“闲笔”的审美功能J内蒙古社会科学(汉文版),2007(6):145-149. 28陈曦钟,侯忠义,鲁玉川.水浒传会评本M.北京:北京大学出版社,1987.