中华文化五千年辉煌灿烂的文明所孕育的文物、遗址、从未间断的文字典籍,新中国成立以来无数文物工作者完成的四次文物普查与一次可移动文物普查,无数重要的考古工作与一代代学者艰辛的著述,所有这些,汇聚成中华文化最重要的文化资源与底蕴。如今,我们需要用新科技、新人才、新工具、新创新与新应用,建设新时代以中华文化为核心“IP”的数据时代文化工程,这是时代赋予政府工作者、文物工作者与科技工作者新的使命。

数据时代,有关数据的全生命周期技术已经非常丰富,但是面对行业高质量发展问题,面对治理体系和治理能力现代化与全面深化改革,必须坚持系统观念,如何理解“坚持系统观念是具有基础性的思想和工作方法”,首先要从系统性理解时代需求出发,以系统观点分析问题,分析如今我们面对的是怎样的时代新命题。



首先,是数据时代的文物数据“修堤筑坝”问题。全国文物行业信息化基础设施建设呈现出参差不齐的发展水平,不同地区、不同规模的文博机构在信息化基础设施的建设投入上存在显著差异,运行维护能力水平参差不齐,存储计算服务资源分散,这在一定程度上阻碍了文物数字化工作的全面推广。


其次,是数据时代的文物数据“疏渠通堰”问题。文物数据规模虽然呈现爆发性增长,但是由于文物数据属地管理所限,数据“孤岛”成为当下常态;同时,由于缺乏统一的数据标准,众多节点(文物、非遗、典籍等)数字化工作相对独立,数据“活化”缺乏关联,不能形成数据活化所需要的“智慧数据”。


第三,是数据时代的文物数据“浚源清流”问题。文物数据极为复杂,具有典型的多模态与非格式化特征,其数据很难直接拿来形成数据治理的原始数据以及用以加工的二创数据,所以,需要非常多的二次加工,如清洗、标注、二次加工、解构以及标准化工作。

文物数据所面临的系统性问题


第四,是数据时代的文物数据“水系治理”问题。文物数据进入具体应用,需要非常具体的功能模块用以实现其数据用途,其功能模块,如资源、素材、工具、创作、金融等功能都需要丰富的功能模块以实现,但现实中这样的数据治理非常欠缺。


第五,是数据时代的文物数据“生生不息”问题。要想真正形成可持续发展的数据生态系统,必须形成多种数据应用,使得数据在系统中运转起来,才能让系统形成不断更新与自我迭代的更新能力。但现实中,对文物数据的应用场景,非常欠缺。


本文将从系统观念出发,结合北京易华录在国家级文物数据平台、省级文物数字平台、市文博数据空间等项目的具体实践,讲述基于文物数据的大数据平台应如何形成顶层设计,如何坚持系统观念,从数据汇聚、数据能力、数据标准、数据应用、数据运营、数据赋能出发,结合可信数据空间最新理念,形成可持续发展的数据生态,同时为不同行业进行赋能。






一、修堤筑坝——文物数据能力建设



如果建设文物数据的数据要素体系,要如何从顶层设计出发,我们从系统的观念出发,构建系统的系统能力、功能模块、能量与信息的运转以及控制系统的整体决策以及自适应与迭代的生态能力,针对文物数据,我们要将系统论进行分解,同时针对前言中所面对的具体问题,逐步进行探索。


首先我们面对的是数据能力建设,为此,需要构建通用的数据能力,不同的数据周期以及落地场景都可能会需要的数据能力,这样的基础能力建设将包括如下存储与计算能力、中台能力、素材能力、工具能力与资产能力。

多模态非格式文物数据专用存储设施




1.存算能力

文物数据已经不再仅限于 Excel 表格,而是更加多元、更多维度。介质上来看,有影像、声音、文字、3d 建模等;内容上来看,有文本、器物、非遗、艺术、音乐等;从关联上来看,有时代、地点、人物、事件等。文物数据整体呈现多模态与非格式化特征,随着文物数据的广泛应用,二次创作数据将呈现指数级增长,而对于大模型的广泛应用,文物领域大模型的训练与推理都将逐步深入,对于算力的需求也会飞速增长,这对于目前国内基础设施发展的不均衡的现状,是很大挑战,其解决方法是合理利用国内现有的分中心智算节点,根据各区域的算力需求和业务特点,开展分布式集群架构,合理分配和部署高性能计算设备,满足区域内不同类型业务的需求,同时引入智能调度系统,从而实现资源的最佳配置和高效利用。



2.中合能力

同样,文物数据的复杂性直接带来的是相关业务的复杂,尤其进入大模型时代,AI 能力所带来的成本更为高昂,这对于国内各个文博单位信息化设施与发展不均的现状是一项直接的挑战,如何解决,实现文物数据相关的业务规范、数据标准、AI 通用、技术共享,其背后的逻辑就是要沉淀全行业的成熟的业务流、标准数据与技术能力,从而实现资源与服务能力的高效整合、复用与优化。其中,数据中台将依托大数据技术,实现数据资源的集中收集、整合、存储、管理、处理和共享,确保数据的高效利用;智能中台将集成通用的AI能力以及专门针对文物领域的专业模型,为各类文物场景应用提供智能算法、模型训练及推理能力;技术中台则基于微服务架构,整合区块链、工作流、身份认证、数据加密等通用技术,打造共享的技术和功能组件库,以促进业务的协同开发和产品的快速迭代。



3.素材能力

文物数据要素对不同行业与个人进行赋能,最为直接的赋能便是素材赋能,因此文物数据平台首要便是要建立直接面对不同行业与公众的素材库,文物原始数据本身具有的赋能能力有限,必须将文物原始数据进行多种维度的解构与重组,形成行业、个人与应用场景所需要的“素材”,素材库不仅仅是传统意义的“素材”,它同时包含多种文化维度,其建设是一个不断丰富与维度增加的过程,针对不同的主题形成的素材库可以直接对不同行业进行赋能,图片素材、字体素材等素材类型仅仅是人们所熟知的模态类型,但就年代、区域、风格、用途、人物种种专题,则要进行深入研究,同时结合知识图谱,形成素材库

的知识工程建设。

素材能力



4.工具能力

在为行业与公众提供素材能力的同时,也要提供“生产工具”,也就是最新的数据技术的“工具能力”,提供集智能标注、文物虚拟修复、文物辅助鉴定、古籍古文识读、绘图与平面设计、三维建模与渲染、界面与交互设计、音 / 视频剪辑、动画制作、协作与共享等文物数据要素挖掘与创作的云端工具集,为个人和行业用户提供创作支持,推动文物数据在文化创意领域的广泛应用。平台提供文物数据资源授权接入服务,并开放存储、算力与算法资源,鼓励企业与开发者入驻,支持个人和行业用户进行深度学习和模型训练,共同构建一个开放、共享、创新的文物数据和应用生态。



5.资产能力

构建文物数据要素体系,必然面对国有文物数据要素产权的关键问题,这是文物数据体系化建设的必要环节与基础能力。保护国有文物数据要素权利主体权益,同时充分发挥国有文物数据要素价值和优势,激活国有文物数据要素潜能,同时促进国有文物数据要素的科学管理、合法合规合理利用,绝不能割裂进行分析,而是必然结合在一起。面对国有文物数据要素的体系化建设,一定要实现数据资产的全生命周期解决方案,这在法理上要有清晰的界定,在技术上(智能合约、区块链等关键技术)要有成熟的方案。

资产能力







二、疏渠通堰——文物数据资源汇聚




1.数据汇聚机制

文物数据首要面对的棘手问题,便是数据的汇聚,而最先需要解决的并不是平台或者技术问题,而是机制问题,真正面对文物数据汇聚,建议采取多层级,多角度与方式方法进行:自愿为先、存储为先、政府资金支持项目为先、层级分治、逐步推进、联合共享、数据分权、有限开放。


自愿为先。收集文物数据,自愿为先,对文物数据的拥有者进行确权,同时提供存储、管理的服务,对社会文物数据进行第一步采集。


存储为先(数据灾备)。对于许多中小型博物馆文物数据,可进行“文物数据保险箱”服务,只进行存储与目录库的管理,实现“数据灾备”。


政府资金支持项目为先。曾经接受政府资金支持的文物数字化项目,其数据要收归政府保存。


层级分治。针对不同层级文保单位,成立文博数据联合体,建立完整目录库并提供数据接口,可实现数据传输,国家平台对于数据的确权、保护、交易等版权问题进行全生命周期监管,并承担相关责任。


逐步推进。在完整目录库的基础上,进一步推进数据的采集、管理与利益机制,逐步实现数据资产机制更加成熟,市场化运作更为丰富。


联合共享。成立文博数据联盟联合机构,共享文物数据相关权利以及国家相应政策支持与资金支持,鼓励各个文物收藏机构加入并提供相关文物数据。


数据分权。大型博物馆以及拥有自己品牌效应的主题博物馆,首先完成目录库建设,进而,对数据进行拥有权与使用权的分权。


有限开放。大型博物馆文物数据,通过有限开放,逐步打开数据的完全共享与使用。



2.数据空间

近期,国家数据局发布《可信数据空间发展行动计划(2024—2028 年)》,此举对于破除数据流通障碍,可以说是一项根本性的重要举措。在文物行业,数据孤岛现象严重,构建文物行业可信、可管、互联互通的数据空间,将全面推动行业数据资源的规模化流通和高效利用,全面提升行业数据资源的可信管控能力、资源交互能力与价值共创能力,打造数据生态。此举将结合区块链、隐私计算、智能合约、数据加密、数据连接等关键技术,在需要确保数据隐私、安全和可信的场景中,可以较完美解决文物数据汇聚所面临的棘手问题,为促进数据资源跨部门、跨层级、跨区域、跨主体的共享流通和开发利用提供强大支撑。


文物行业新型数据基础设施(NDI)与新质生产力

构建跨层级、跨地域、跨系统、跨部门、跨业务可信安全流通的区域数据空间


其中,博物馆、研究机构、公众展示平台等通过“数场”共享数据和相关研究成果,形成开放的文物数据生态系统。通过数场,数据空间中的各个参与方(如博物馆、修复师和研究人员)能够清晰地看到数据如何在系统内流动,从而优化数据共享的效率和效果;通过隐私计算,数据可以实现跨组织协作和数据利用,例如,多个博物馆可以在数据空间中通过隐私计算技术共享文物信息,可以有效解决博物馆数据的拥有权以及使用权的彼此支撑与保护;文物数据的修复记录、研究成果、展示信息等,都会在区块链上进行加密存储。区块链确保这些数据在上传后无法被篡改,从而保证了数据的真实性和可信度,同时,智能合约则可以动态管理参与方的权限与业务,比如,修复专家可访问高分辨率壁画图像,而公众只能访问低分辨率图像,智能合约自动执行如上规则,确保数据访问的透明度和安全性。







三、浚源清流——文物数据价值挖掘



文物数据的体系化建设,之所以复杂,是因为其数据本身内涵丰富与无穷变化的文化要素,导致我们很难对文物数据形成统一的共识。建立文物数据标准体系,其根本处是建立一种共识,这种共识不仅仅是数据、接口、架构、存储与算力等等传统的标准问题,而是要形成一个文化与科技深度融合的共识,这是文物数据要素体系建设的独特之处,因此,对于文物数据的价值挖掘,其实是一个价值共识形成的过程,这种价值的共识与技术上的标准结合起来,才能形成我们进一步构建数据要素体系的源头活水。

文物数据价值挖掘、行业赋能与回馈


建设路径

针对文物数据价值复杂的特点,其解决路径是以最大可能对文物数据进行提取与标注,对文物文化进行深层次解构,将文物数据真正形成数据要素,以最小单位的价值认同出发,构建文化价值的共识,同时结合技术标准的统一,让文物数据为其他行业赋能。所以,其关键点,在于文物数据要素的持续挖掘。另一个技术关键点,则是让大模型技术对技术挖掘进行加持,其中大模型技术又要以知识图谱构建中华文化思维,以统一的思维方式进行大模型的训练,同时以大模型对知识图谱的深度构建进行辅助,从而形成大模型与知识图谱相互循环的技术支撑。







四、水系治理——文物数据平台运营



文物数据的数据运营相对而言比较集中,其中文物安全为数据运营最重要的部分,建立广泛的文物安全感知神经网络,是文物安全智能化的基础部分,其余则是建立文物数据的完整监测体系,解决文物风险评估、预测、应急指挥、灾害评估等工作。


1.文物安全

文物安全将围绕事前预防、事中监控、事后处置展开,包括远程监督、重点监管、抽查检查、日常巡查、风险预警、应急指挥和事后评价等,通过数据分析、态势感知和趋势研判,对文物安全状况常态化监管,提升事前预判、事中应对和事后处置能力。构建“监测、预警、处置、调度、反馈、评价”完整文物安全信息链,让文物安全管理更加智能化、流程化、指标化,实现可量化、可考核,为决策者提供精准的数据支持和专业的决策辅助,全面提升文物安全风险管理能力。



2.文物科研

文物科研将汇聚文物相关文献、国家科研成果以及国内外相关学术成果等海量科研资源,通过知识图谱、人工智能等前沿技术,深入分析挖掘文物本体、保护修复、科研成果等多元数据资源,全面梳理文物蕴含的历史脉络、文化内涵及科学价值;建立文物科技创新技术服务体系,推动文物科技创新成果的转化与应用,为文物研究者提供全面权威的知识服务,为深化文物认知、制定保护修复策略、创新阐释传播方法等提供科学理论依据;助力文物科学研究智能化、精准化方向发展,为文物保护和合理利用提供坚实的科技支撑。注重汇聚和培养优秀科技人才,建立开放包容的管理机制;深化国内外学术交流与合作,共同推动文物科学研究的全球化进程。


3. 展示传播

展示传播,通过构建一体化文物公共服务窗口,动态整合并展示全国文博单位的公开文物数据资源。建设面向全球的全模态文物素材库,深度挖掘文物数据的内在价值,对每一件文物背后的历史文化内涵与文物元素进行精细化标注、多模态提取、智能归类与整合,构建信息丰富、多模态的文物素材库。搭建开放与共享的工具与算力平台,通过向公众开放一系列智能工具,如智能标注、三维建模等,并共享存储、算力和算法资源,鼓励更多的企业与开发者参与到文物数据的创新应用中,共同推动文化遗产的数字化保护与传播。打造公共服务一体化展示传播窗口,集成数字博物馆设计、发布服务,汇集展示全国博物馆与文保单位的各类资讯、数字展示、导览和研学等服务,为公众提供便捷的文化数字化服务体验。







五、生生不息——文物数据赋能行业




1.数据资源类应用场景

“资源平台”模式是最为直观的文物数据应用模式,直接从搜索引擎、门户网站、设计工具等渠道找到需要的文物数据,并下载精细数据以利用在自己的工作中,以此形成最基本的资源模式。

落地场景:

基于文物 IP 的文学创作、XR+ 剧本杀、3D 全息演艺、元宇宙演唱会、沉浸式数字光影展、多人异地 VR 游戏(VR 第一人称射击游戏fps)、多人同场 VR 穿越游戏、AR/MR 实景游戏、“柔性制造”少儿玩具定制平台、“文物”精品书籍、虚实结合主题游乐、餐饮、住宿、NFT 数字藏品(NFT 创作平台与数字版权管理)、人工智能自主生成作画(AIGC 创作平台与数字版权管理)、数字建筑与空间设计、UGC 文创平台。



2.工具能力类应用场景

“工具能力”将会体现在众多的应用场景的背后。如云渲染可能是游戏或者展览的工具集、云编辑可能是音乐或者影视与美图的工具集,同样是一个开放的平台,任何人的优秀软件工具都可以进工具平台,进行生态共建。

落地场景:

“文物 +”设计与 IP 授权(建筑、室内、服饰、工业、平面、环境、摄影)、人工智能自主生成作画(AIGC 创作平台与数字版权管理)、主题内容(展览、纪录片、短视频、综艺、文物鉴定、信息发布、收藏拍卖)、沉浸式数字光影展(中

华文化沉浸式数字光影展)、云音频编辑平台工具、XR 数字影棚(深耕内容 + 简易影棚)、多人异地 VR 游戏(AR/MR)、3D 全息演艺(可

复制、可衍生的全息剧目创作与演出方案)。


3.项目孵化类应用场景

致力于将中国文化融入各行各业的平台,扶持各行各业优秀企业与优秀创作者,为创作者提供素材、工具、资金、渠道、版权保护、交易等多种支撑,完成多种创新模式孵化。

落地场景:

国乐音乐创作人才孵化平台、音乐创作基地、元宇宙影视、独立影视制作人孵化平台、3D 全息演艺、元宇宙演唱会、影视剧剧本创作平台XR 数字影棚、独立游戏工作者创作与孵化平台、数智人模型、XR+ 剧本杀、多人异地 VR 游戏(VR 第一人称射击游戏 fps)、多人同场 VR穿越游戏、AR/MR 实景游戏、影视剧剧本创作平台、虚实结合主题游乐、基于文物 IP 的文学创作。


4.创作平台类应用场景

创作平台(UGC 平台)是全民参与的众创平台,涵盖数字艺术、文创、音乐、影视、动漫、绘画、主题展览、游戏等创作内容。

落地场景:

“文物 +”设计与 IP 授权、主题内容、沉浸式数字光影展、云音频编辑平台工具、NFT数字藏品(NFT 创作平台与数字版权管理)、人工智能自主生成作画(AIGC 创作平台与数字版权管理)、数字建筑与空间设计。


5.数据资产类应用场景

从数据确权、授权、评估、交易、监管数据要素市场体系建设出发,未来实现从现实世界的数据存储、托管、贷款、运营到虚拟世界的理财、资产证明、公共服务等应用全链条数据资产服务。

落地场景:

NFT 数字藏品(NFT 创作平台与数字版权管理)、人工智能自主生成作画(AIGC 创作平台与数字版权管理)/ 文物摄影展示平台(数字版权管理)、“文物”精品书籍、数字版权管理(保护创作者数字权益,实现数字版权的保存、流通、交易)、虚拟资产管理平台。


文物数据要素体系化建设,结合文化与科技的深度融合,是非常复杂且需要大量实践的工作,仅通过理性推导与技术的研发并不能解决全部,必须通过长期的探索,在实际工作中,北京易华录总结如下建议:



1.高定位,实落地

相对于国家平台更加重视整体架构、基础设施、安全保障与社会公益,地方性文物大数据平台则要建立更加丰富、更加扎实的落地场景,具体实现国家的文化战略。就这一点来说,一定要在高定位与实落地的衔接中,寻找可以重点发力的“重点”。


2.小项目,大牵引

以湖南省博物院“生命的艺术”大展为例,其背后有数据采集加工、文化创意、光影技术、人机交互、区块链等技术,同时项目还会涉及数据授权、数据评估、数据交易以及大数据分析、内容分发等数据运营关键环节,一个马王堆主题沉浸式光影展,背后是无数技术、服务、运营等产业的支撑,这就是“小项目,大牵引”。


3.重基础,强运营

在平台的运营中,基础性的工作要更加扎实,例如国家数据局提出的国家数据基础设施(NDI)概念,包括国家数据空间、国家软基础设施、国家硬基础设施、国家数据安全基础设施四层架构,以及数据采集平台、数据汇聚平台、数据加工平台、数据共享平台、数据开放平台、数据运营平台、数据交易平台和数据存储平台八大平台。基础性工作还包括标准体系的制定以及数据要素市场化体系、数据资产的全流程服务等。只有在强运营中,实实在在为区域、产业、城市、个人提供支撑,才能全面促进数字中国、数字经济、数字社会高质量发展。


长江黄河孕育出古老的中华文明,如今,新的时代,新的科技,正在汇聚新的数据长河,面对变化,我们坚信,在新的数据长河面前,中国人凭借自己的智慧,足以应对时代的挑战,以数据之点滴,继续绵延中华文化亘古的历史长河,在此征途中,我们愿与诸位一路同行。


微信小程序

微信扫一扫体验

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部