字体:打印

数字人文赋能档案开发利用 档案数据驱动新质生产力发展

发布时间:2024-04-30 信息来源: 中国档案报 浏览次数: -

  今年的《政府工作报告》将“大力推进现代化产业体系建设,加快发展新质生产力”列为2024年政府工作十大任务之首。发展新质生产力是推动高质量发展的内在要求和重要着力点。依托前沿技术的革命性突破,对劳动者、劳动资料、劳动对象进行系统性、创新性配置和优化组合,能够提升全要素生产率,催生新产业、新模式、新动能,从而推进传统生产力跃升,支持高质量发展和社会主义现代化建设。

  新质生产力的“新”主要体现在生产力基本要素的革新,可拆解为具有善用现代技术、知识快速迭代能力的新劳动者,数据等新型生产要素和新劳动对象,人工智能、虚拟现实和增强现实设备等新劳动工具,适应科技创新新需求的新型基础设施。

  运用数字人文理念和技术活化档案数据,既适应新质生产力发展的要求,也为推动新质生产力发展提供有力支撑。

  就劳动对象来看,档案数据涵盖历史、文化、艺术、科学等方面的记录,具有广源性、累积性和扩展性等特征,可提供真实完整的数据资源作为新质生产力的生产要素。

  就劳动工具来看,数字人文是信息技术和人文学科深度融合的新兴领域,计算机技术思维、数据量化思维推动人文社会科学领域数字资源的知识化建设,为解决人文研究问题提供知识服务。关联数据、数据挖掘、数据可视化等数字人文技术可为挖掘档案数据的知识价值提供有效工具。

  就基础设施来看,传统档案数据化以及原生数字资源存档形成的海量档案数据得到整合与关联,逐步推动全景式资源库建设。开放互联的资源库为档案数据共建共享提供基础设施。

  蕴含着知识价值的档案数据、数字人文工具、档案资源库以及掌握数字人文技术的档案资源开发者这4个要素优化组合、共同作用,建立档案数据资源体系,供给高质量数据要素,基于价值挖掘方法释放档案价值,创新档案信息服务方式衍生新型业态,进而驱动新质生产力的形成。

一   利用关联数据进行整合

  形成档案数据全景

  档案数据记录历史发展和社会活动的过程信息,凭借其原始记录性为国家和社会提供可靠的信息,不仅具有重要凭证价值,还具有巨大知识价值。

  数字人文为档案数据资源提供重构策略。基于“数据识别—数据组织—数据挖掘与呈现”的档案数据价值挖掘模式,运用数字人文技术,将处于信息孤岛的档案数据组织成语义关联的知识网络,能够推动档案内容信息的知识发现和价值洞察。

图片

中国地方历史文献数据库  图源项目官网

  如,针对档案文本内容,可运用词频分析、共现分析、聚类分析等文本分析方法,绘制档案信息的词云图、关键词共现矩阵、聚类谱系图等,帮助厘清特定档案中的关键信息、内容要义和语词共现关系。

  又如,聚焦档案中的“人、地、时、事、物、情感”等记忆要素,运用社会网络分析、地理位置分析、时序分析、情感分析等方法,可梳理人物网络关系、时空演化、情感倾向、事件脉络等,通过对记忆要素的组织与关联,再现记忆场景,阐释记忆内涵和情感取向。

  再如,在生成式人工智能的引领下,人工智能技术加速发展,语音识别、图像识别、机器学习等技术支持文本类、声像类多模态档案的内容提取和挖掘日益深入,实现多媒体档案数据的检索与利用。

  生成式人工智能的自然语言处理技术还可提高文本类档案数据实体识别和语义关系揭示的效率。可将真实可靠、完整优质的档案数据作为训练语料,抽取档案内容中的事件、内容摘要等,基于预训练模型和抽取内容数据库,实现根据提问自动完成智能语义检索、智能档案编研、智能数据生成等任务,推动档案数据挖掘的效率提升、深度凸显。

  可以看出,作为新质生产力劳动工具的数字人文技术,赋能作为劳动对象的档案数据,推动其挖掘重构、知识化、故事化,既创新价值释放方式,又有力推动价值释放,为发展提供参考信息和决策支持。

  一方面,数字人文技术从描述、组织与系统化开发等层面突出了档案数据的知识价值,创新其价值释放方式。通过可获取的途径,传递可理解的档案数据资源,能够降低档案信息获取成本,提供数据资源以支持提高全社会创新效率,加速推动新质生产力发展。

  另一方面,档案数据中潜藏的知识得到充分挖掘与释放。如,提炼蕴含在档案中的生产方式、技术发展、创新成果等方面的经验或规律,为新质生产力发展提供借鉴与启示,为决策提供依据,有助于优化资源配置,激发创新思维,推动科技进步。

二 创新档案信息服务方式

  推动文化服务业态升级

  档案数据只有通过知识服务的方式向社会提供利用,才能够真正释放其价值,让其活起来。培育新质生产力的环境下,社会公众的数据意识不断提升,信息需求呈现出多元化、个性化、精细化特点。基于高质量的档案数据,开发档案数据类产品和服务,成为满足公众日益升级的信息需求的重要途径。

  数字人文技术,如可视化技术、虚拟现实技术、沉浸式体验等的发展,为档案数据的服务方式注入新活力,在挖掘内容深度和强化知识属性的同时,兼顾形式的多样性、互动性和可体验性。

  数字人文环境下档案数据价值释放的方式有:建设主题数字平台、制作可视化展示项目、设计互动式档案游戏和历史场景虚拟重现等。

  档案数字平台。挖掘档案的隐性关系提供资源的关联访问,从外部特征的分类聚类逐渐发展为基于语义的连接整合。

  可视化项目。以可视化的方式统一展示多源异构的档案数据,如时间轴、地理信息系统、社会关系网络等,促进档案价值的发现。上海图书馆开发了盛宣怀档案知识库,根据其日记、文稿、信札、电报等记录中的共现关系,绘制可根据时间轴调整的人物关系图,展现不同时期的人物社交网络,便是典型例证。

  档案游戏。融入大量互动形式开展沉浸式教育,传播档案知识,因其引人入胜的故事情节和交互体验而提高公众参与的积极性。如,苏州中国丝绸档案馆打造了“第七档案室”IP,融红色历史、档案知识、解谜游戏等内容为一体,开发了解谜书、大型实景解谜活动、互动密室、剧本杀等剧情联动、类型多样、系列互补的档案游戏。

  历史场景虚拟重现。基于多模态档案记忆资源的沉浸式体验,借助VR、数字孪生等技术对历史空间或历史场景进行虚拟复原,拓宽了档案利用服务的深度与广度,带给用户身临其境的历史场景感。如,《古籍寻游记》系列VR纪录片之《居延汉简》,以居延汉简的相关史料、考古遗存等为依托,利用6DoF交互技术、三维重建及视频扫描技术,构建汉代边塞场景,设计劈柴、射击、喂猪等交互动作,再现档案文献中记载的边塞生活面貌以及将士保家卫国经历。

  历史场景虚拟重现的方式塑造沉浸式的档案数据呈现空间,再现历史场景,还原档案生成背景或内容背景,融入趣味互动体验表达档案内容知识,激活多感官体验,强化具身认知,破除平面化数据呈现存在的互动壁垒和理解阻碍,推动档案知识理解和价值传播。

  数字人文技术创新档案数据呈现形式,推动档案数据从可识别可理解发展为可感知可体验,促进档案数据价值释放。

  其一,档案信息服务方式的延展满足社会公众日益增长的多样化信息需求。依托用户行为、用户画像、用户偏好等数据要素,借助大数据技术深化对用户需求的理解,促进生产端与消费端的匹配,提高整个产业链的生产效率。同时,刺激公众扩大对档案数据知识服务的需求,倒逼档案机构不断提高生产效率、优化服务水平,供给高质量的档案信息产品和服务,推动档案领域实现新质生产力的发展。

  其二,档案信息服务方式的创新激发文化服务行业新产业新业态的涌现。借助人工智能等技术,推动编研、展览等传统的档案信息服务产品转型升级,向沉浸性、互动性、知识性的服务类体验类产品创新发展。同时,注重文化内涵和情感体验的传播,提高档案信息服务产品的附加值,培育强大的生产力潜能,推动新质生产力发展。

  数字人文赋能之下,档案数据的组织、开发和服务朝着知识化方向深入发展。在档案数据的活化开发中,形成了致力于知识服务的问题导向和借力数字技术的数据导向思维。通过构筑语义关联的档案数据全景、挖掘档案数据中的隐性知识和价值、创新兼具知识性和体验性的档案信息服务方式,档案数据的知识价值得到充分呈现和阐释,既为新质生产力的发展提供高质量的数据基础和知识支撑,也通过数据驱动、技术引领、效率提升、服务升级为新质生产力的发展创造新的驱动力。

  文章来源:中国档案报

  作者王玉珏系武汉大学信息管理学院教授、博士生导师,武汉大学文化遗产智能计算实验室、档案智能开发与服务重点实验室研究员;陈思伶系该院档案学硕士研究生




主办单位:深圳市档案馆 版权所有copyright@深圳市档案馆

ICP备案号:粤ICP备19114015号-1  粤公安备案44030402001162号

地址:深圳市福田区林丰路2号档案中心A座、C座 邮政编码:518049 网站访问量: