10月15日,第138届广交会及“互利天下——广东外贸一千年”专题展开幕当天,羊城晚报与广东省博物馆联合启动“广东外贸一千年”高质量语料库建设。
该项目旨在打造一个以数字技术深度解读千年外贸文明的“活态知识库”,为云上思政提供大数据基础,标志着广东在文化数字化与数据要素化应用领域迈出里程碑式的一步。
从“唐宋市舶”到“改革开放”的制度先行
回望历史,在浩浩荡荡的时代潮流中,广东始终挺立在中国对外开放的前沿,广东千年外贸史始终镌刻着“开放包容、互利共赢”的印记。
在广东省博物馆开展的“互利天下——广东外贸一千年”专题展,甄选逾200件精品文物,梳理广东千年外贸的发展轨迹,以文物为证、以制度为线,以区域折射全局,为应对挑战提供了有益的历史借鉴与现实启示。
“本语料库并非简单的文献汇编,而是一个系统梳理广东外贸制度变迁与辉煌成就的结构化知识体系。”羊城晚报报业集团广东岭创数字科技有限公司董事长丁华表示,语料库建设内容将深度融合权威史志文献、多维文物数据两大核心资源——
以《广东省志·对外经济贸易志》《广州外贸史》《广东对外经济贸易史》等官方史志及学术著作为文本基石;紧密结合本次“广东外贸一千年”大展的纲要与近200件核心展品,包括汉代丝织品、唐宋外销瓷、清代广彩等,将文物作为物证,与文献记载相互印证。
从唐宋市舶制度到改革开放“先行一步”、今日自贸区的制度创新试验,语料库将清晰勾勒出一条跨越千年的制度创新主线,生动诠释广东外贸何以能延绵千年、历久弥新,其核心驱动力正是持续的制度创新与“互利天下”的开放胸怀。
从“仅录文本”到“多模态融合”的智能跃迁
“我们将采用多模态融合方法,将文献、文物高清图像、3D模型、考古报告、贸易地图等不同形态的原始数据同步整合,构建一个立体的数据宇宙。”据羊城晚报岭南文化大模型实验室主任邓立邦介绍,与传统仅收录文本的语料库不同,项目采用前沿的多模态融合对齐技术,实现知识提炼方式的革命性升级。
据悉,该项目利用人工智能技术,让不同形态的数据之间产生“关联”和“对话”。
例如,AI能够理解一件“清代广彩瓷盘”上的纹饰特征,与其在《广州港全景图》中的出现场景、出口记录以及“一口通商”政策进行关联。邓立邦说,这使得语料库不再是信息的简单堆积,而是一个能够被机器深度理解和推理的“知识生命体”。
从“一次展览”到“可持续资产”的范式革命
语料库项目远不止于服务单一展览,其更深远的意义在于创新性地探索了“一展一知识库”的文博发展新模式。这标志着广东省博物馆从“文物宝库”向“知识工厂”的战略转型,进入文化数字化、“数据要素×”的新里程碑。
广东省博物馆馆长肖海明期待通过本次项目,探索让文博展览成为一种新的知识生成模式——让每一个高质量展览,不再是闭幕即结束,而是其核心内容、研究成果与文物数据,通过语料库的建设,沉淀为可永久传承、持续积累和迭代的高质量数据资产。
羊城晚报岭南文化大模型及文化采编团队将持续推进这一项目,使这些结构化的知识模块,为更广泛的领域提供滋养:
赋能文博,为未来的策展、学术研究提供智能助手式的支持;赋能教育,生成沉浸式课件、AI历史教师,为云上思政提供大数据基础,让千年外贸史生动可感;赋能文创与游戏,为文创产品设计、游戏开发、元宇宙场景构建提供坚实的历史考据与丰富的创作灵感和数据支撑。
“广东外贸一千年”高质量语料库的建设,是羊城晚报集团与广东省博物馆在文化数字化浪潮中的一次前瞻性布局。它让沉淀于古籍与库房中的千年智慧,转化为面向未来的高质量数据要素,不仅为讲好中国故事、广东故事提供了全新范本,更将为广东的文化强省建设与数字经济发展注入源源不断的“文化数据动能”。
文|记者 朱绍杰
图|记者 邓鼎园