大数据分析在博物馆场景中的应用 ——以上海博物馆数据中心为例

发布时间:2021 年 11 月 01 日 | 文章作者: 《科学教育与博物馆》2018年第3期 | 浏览次数:924
引言:迅猛的发展形势给博物馆管理带来了巨大压力,如何高效地运行机构并为社会持续提供优质的公共服务成为当前博物馆工作的重要课题。随着信息技术的进步,数字化辅助管理的优势日益凸显,上海博物馆数据中心的开发就是这一领域的探索之举。本文将以此为例,探讨大数据分析技术在博物馆场景中的应用前景。 一、从经验驱动到数据驱动 场馆运行是博物馆基于收藏、研究进行展示的公共文化服务,其本质上是一种信息的传播活动。它的显著特点是信息发布者和接收者借由特定的情境空间—馆舍,通过实体或虚拟的媒介—藏品,完成“展览—参观”这一交互行为。 在此过程中,博物馆出于其保护、收藏人类活动和自然环境的见证物以及构建共同文化记忆的宗旨,由研究人员基于知识性对藏品信息进行处理并选择后组织展览。而观众则根据各自的兴趣、经验、行为习惯等自主理解信息,并将其融入自身的认知结构。由于交互双方并非直接交流,而是通过异构的媒介来完成信息流动,难免使信息在传输过程中出现损失、附加或变形,以至于这种交互在增加了多样性的同时也产生了不确定性。 博物馆的“我说”和观众的“我看”、博物馆的“我要说”和观众的“我想看”、博物馆的“我说过”和观众的“我没看到”长期以来困扰着双方,也影响了博物馆运行的效率。 经验驱动 解决这一困境的方法是对“展览—参观”的交互活动进行有效的监测和评估,一旦发现严重偏差便及时修正以保证传播目标的达成。 在欧美国家,博物馆评估已经有了长期的实践并形成了完备的制度和数种相关的指标模型。我国在这一工作上起步虽然比较晚,但随着国家文物局对全国博物馆定级及运行评估的推动,有关的探索和研究亦方兴未艾。 然而,目前我国的博物馆评估还面临不少问题,主要体现在对传播的社会效益评估大多依赖于人数、口碑、书面问卷及访谈观察等传统调查手段,失之于简单、粗放或片面;亦由于数据收集成本等因素制约,数据的数量、范围和质量都会受到一定影响,样本数少而连续观测的难度高,进而无法进行更具一般意义的实证研究。因此,对博物馆运行的促进仍以经验驱动为主。 数据驱动 伴随互联网的深入发展,近年来已有不少学者提出利用大数据分析,采取数字化手段辅助博物馆运行的解决方案。但较为可惜的是,这些研究主要集中于思路的提出和展望,往往缺乏实践的验证;而少量的实证性研究实施范围过小,或借助第三方平台已有的数据进行分析,代表性不强。 二、文化组织和(大)数据 2018 年 5 月,上海博物馆基于多年信息化建设的成果,率先建成了国内第一家博物馆数字化管理平台—上海博物馆数据中心。 该平台通过互联网入口、现场服务入口及馆内局域网入口等多种来源进行数据汇集,形成了对藏品数据、客流数据、新媒体传播数据、展区观众行为数据、商店文创产品数据等的汇聚整合,并以技术手段实现了对博物馆业务多个维度的关联分析和精准判别。及时准确、全面综合地反映了博物馆的实时运行状况,为未来博物馆基于大数据实施精细化管理建构了一个基础框架。 大数据具有“4V”特性: 容量(Volume) 种类(Variety) 速度(Velocity) 价值(Value) 容量是指大数据采集的数量巨大,可达 PB 级以上 种类是指这些海量数据是可以细分的 速度是指获得数据是实时的、动态的、可扩展的 价值则指通过数据挖掘、云计算等分析方法,可以形成有价值的新数据 大数据关注的是全部数据,依靠精细化分类进行分析,挖掘出数据间的关联性以及深层次的含义。它不再是规模化的批量采集,而是更加注重对信息的实时采集、自动采集、按需采集,以及对某些专项数据的重点采集。简单说,就是以数据驱动为导向,实现预测分析及决策管理。 二、以博物馆业务为导向 大数据的容量虽巨,却并非都是有效的,必须经过合理的分类和恰当的清洗,才能避免数据过度负担,过滤得到有用的内容。这是大数据分析的基础,也是其产生新价值的保证。 上海博物馆数据中心设计依据博物馆学原则,并参考了《国家一级博物馆运行评估指标体系》。它以博物馆管理为核心,以流程管理为主线,涵盖了收藏、研究、传播三大功能,融合了博物馆工作的主要流程。对应“综合管理与基础设施”“藏品管理与科学研究”“陈列展览与社会服务”的一级指标设定,系统从“人”“馆”“物”三个板块进行分类管理,对博物馆的重要业务数据作出科学挖掘和精准分析,并以可视化的形式予以生动的表达,达到了俯瞰式的数据观测效果。 连接人与物的特殊空间 一般认为,博物馆的基础工作是对物的保存和研究,目标工作是对人的传播,其信息转换以经过专业编码的实物为媒介完成。但事实上,这个转换必须在特定的物理空间——馆舍中才能达成。物的保存、研究和人的学习都由博物馆空间来承载,对博物馆而言首先必须有足够的空间存放自己的藏品,亦须有足够的空间构造自己的展览,更须保证足够的空间供观众参观。将“馆”作为大数据分类的一个主要区域加以呈现,能直观地看到“物”和“人”在这个环境中的交互状态。 在数据中心,既可以精确搜集博物馆每一天、每一小时的观众人数,亦可以准确掌握相同时段观众大致分布在博物馆的哪一个角落;既可以了解本馆收藏的体量,也可以看到藏品与展品的比例,还能看到这一环境的相对温湿度环境,确保“参观—展览”过程在一个安全、适当、有效的条件下进行。 博物馆环境对观众参观具有客观的影响,过于密集的人流对文物安全和有效参观都是非友好因素,因此馆舍人流的控制是博物馆运行中的重要工作。上海博物馆数据中心通过客流系统获得实时客流规模,并将该项数据长期累积,按不同的颗粒度形成统计报表,用以预测博物馆每年、每季、每月乃至每日的人流峰谷规律,为观众引流提供科学的依据。 通过馆内的无线访问接入点及无线网络信号抓取客观的客流数据,则可实时了解各展厅的人流实况,并能够根据预设的环境预警阈值自动报警,分发至相关部门,及时触发分流解决预案,保证观众安全、舒适的参观体验。 以人为本的博物馆 观众位于博物馆传播链的末端,其参观体验和参观习得是考察传播效益的最重要指标。透过观众研究,能够检视博物馆与观众的沟通是否顺畅、信息传递的损失是否处于合理空间,促使博物馆根据观众反馈改善传播的形式、内容或模式,以寻求“物的表达”与“人的理解”之间的平衡。因此在博物馆评估中,观众评估一直是最为核心的指标。上海博物馆数据中心按照观众大数据的构成,从兴趣和行为两个角度出发考察本馆的运行效能。 1、目标观众和观众目标 博物馆观众是趣味、动机、教育程度和文化背景各不相同的许多异质的亚群的总和,他们规模庞大,具有分散性、匿名性、流动性和无组织性,很难给出一个统一的描述。但是如果对其进行不同维度的分类,就可以发现他们的“分众化”特质并给予针对性的关注。比如,按照参观经历,博物馆观众可以分为到场观众和潜在观众,其中到场观众又可以分为偶然观众和经常观众。但是到场并不意味着“足够的兴趣”,他们中的一些人有可能只是偶然的“到此一游”,而潜在观众中的一部分却很可能是未来的博物馆常客。 对于博物馆而言,那些具有经常性参观意愿的观众,无疑是更具价值的。通过将现场客流规模及其分布,与远程服务项目如网站、微博、微信、app 等的使用数量和偏好情况进行对比,不仅可以知道博物馆实体空间、常设陈列的传播能级,而且能了解到博物馆的潜在影响力及临时展览、教育活动的传播效应,从而获得目标观众的“数据画像”,进行有的放矢的宣传推广。 2、诚实的身体 博物馆观众行为是指观众在博物馆环境中有目的行动的连续集合。在参观中,观众的主观愿望往往会受到现实环境、认知错位、他人干扰、博物馆疲劳等种种因素的影响而产生客观变化,因此参观行为是博物馆传播效果最直接的反映。但是由于观众行为的不确定性,这种传播中的动态过程很难捕捉。以数据的方式获得它们,并用博物馆学的手段来分析,无疑是降低沟通成本、提高沟通效率的优选模式。 上海博物馆数据中心通过展厅定位实现实时参观数据的搜集和分析,与传统的问卷调查和现场观察相比,其时效性、样本量均具有很大优势,同时它过滤了被调查者的主观因应,是一种观众身体的客观反映。 观众在每个展厅留驻的时长、分布的密度,热点区域的人流数量以及他们对相邻区域同等级展品的不同程度关注,随机参观路线形成的综合趋势——这些都体现了参观者对展陈语境普适性的“自我”反馈,能够帮助博物馆找到展陈的亮点与盲点,探索博物馆叙述与观众理解之间最佳的互动模式。 三、藏品的“自知之明” 博物馆本于人,更关乎物,其收藏与传播的目的从来都不限于今时今日。世界上最著名的大型博物馆如卢浮宫、大英博物馆等立馆均超过两百年,中国的南通博物苑也已成立一百余年,它们收藏历史,见证现在,也留待未来。 博物馆管理不能仅仅关注眼前观众的需求是否得到了满足,也要致力于藏品的内涵能否得到持续有效的表达。对博物馆的评估应当采用观众测量和专业测量的双重标准,覆盖传播的全过程,既有助于促进观众正确地自我学习,获得新知识和新理解,也有助于实现藏品资源效益的最大化。 上海博物馆数据中心关于“物”的板块正是基于对藏品价值进行科学评估的目的而设置,对藏品的基本信息、多媒体信息、应用信息进行汇聚,实现了对静态与动态情况的全面监测和记录。 三、藏品的“自知之明” 博物馆本于人,更关乎物,其收藏与传播的目的从来都不限于今时今日。世界上最著名的大型博物馆如卢浮宫、大英博物馆等立馆均超过两百年,中国的南通博物苑也已成立一百余年,它们收藏历史,见证现在,也留待未来。 博物馆管理不能仅仅关注眼前观众的需求是否得到了满足,也要致力于藏品的内涵能否得到持续有效的表达。对博物馆的评估应当采用观众测量和专业测量的双重标准,覆盖传播的全过程,既有助于促进观众正确地自我学习,获得新知识和新理解,也有助于实现藏品资源效益的最大化。 上海博物馆数据中心关于“物”的板块正是基于对藏品价值进行科学评估的目的而设置,对藏品的基本信息、多媒体信息、应用信息进行汇聚,实现了对静态与动态情况的全面监测和记录。 数据中心调用馆藏文物的相关数据,建立了藏品利用的评估模型,按照基本信息、科学研究、交流展览、数字化、文创开发、教育项目、媒体报道七个权重指标项对每一件藏品打分,审视其利用程度,发掘其利用空间。这一模型的建立,首次在本体研究的基础上对藏品的社会用途及效果进行了评价工作,挖掘出每一件文物的使用效率,不仅可以让那些明星藏品产生新的应用方向,而且将为那些“藏在深闺无人识”的普通藏品找到脱颖而出的生长点。 大利亚博物馆学家唐纳德·霍恩(Donald Horne)认为,“知识的配置”作用是博物馆区别于其他文化机构的特征之一,即博物馆可以利用自身所拥有的实物,提供高质量的、拓展智力的体验。这与知识的完整性至关重要,低质量的研究和对历史及当代的肤浅注解于事无补,最终也是没有价值的。知识方面的优势应当成为博物馆提供更好的、更有价值产品的途径之一。 对于那些限于各种状况不适合展出的藏品而言,利用网络空间进行虚拟传播是将附着于实体上的知识剥离并重组的最佳方式。 在当前的博物馆中,网站、微博、微信、app 承担起大量的传播工作,然而它们的传播面向、容量、时效、范围、深度既有所重叠,也各有特点。 所示,通过数据中心相关数据的挖掘,对其进行分类解读,了解各种观众使用不同数字媒体的喜好和习惯,便于博物馆对自己的数字资源进行科学的顶层配置,制定针对性的传播方案,形成互为补充的立体化传播模式,发挥资源型、社交型、移动适配型等各种虚拟传播的综合优势。 同样,将这一数据挖掘的形式应用于博物馆的其他服务场景,也可为文创开发等提供可靠的数据支持。 藏品研究价值的挖掘 知识从实物中来,到观众中去,科学研究在其中起到了关键的桥梁作用。对博物馆而言,科研工作是对知识加以管理并使其更好地为公众服务的保障,科研成果则是具有高附加值的藏品资源信息。如何高效地开展科研工作,充分发挥优质的资源信息的作用,也是博物馆管理的重要课题。 上海博物馆数据中心的“董其昌数字人文”专题子项是在数字人文研究领域进行的开拓性实验,试图将数字化手段引入藏品研究这一至关重要的功能性业务中。该项目以明代著名书画家董其昌为本体,依托本馆丰富的藏品资源和雄厚的研究基础,打通藏品基本数据与研究数据的壁垒,利用算法挖掘数据,运用人工智能解析和重构数据,并以可视化的方式呈现数据间的关联和数据图景。 从年表、行旅、交游、创作等角度融 汇数据,并通过其广泛的互联反映与董其昌相关的 时、地、人、事,呈现出数据特有的规则,与专业人员 的研究互为参照。同时,该系统配置后台数据库支持数据的不断更新,以期自动反映由数据到数值乃至数据关系的动态变化,也为今后相关专题的接入预留了可扩展空间。该项目还尝试引入最新的机器学习技术,借助人工智能分析中国古代绘画的元素及 特征,构成素材数据抓取和聚类的自动化模式,为日后提供新的研究视野、形成新的研究资源。这是目前中国书画研究中首创的新手段,虽然尚不成熟,但已获得初步成果,有待进一步深化。 四、结语 互联网已经实现了对现实社会的完整映射,数字化将成为一种全新的文化生产和传播方式,而以文化保存与传播为己任的博物馆,在时代的变革中也面临着自我更新和发展的挑战。上海博物馆数据中心的开发和运营试图以一种更为系统和高效的方式实现适应于博物馆规律的科学管理,这既是一次大胆的尝试,也是博物馆学新思维与实践的可贵结合,其效果和成长前景令人期待。 参考文献 [1]刘健.博物馆大数据运用初探——以上海博物馆数据中心 项目为例[J].文物保护与考古科学,2017(3):20-22. [2]刘健.智慧博物馆路向何方?——以上海博物馆的数字化 建设实践为例[J].上海艺术评论,2016(6):20-22. [3]仇岩.大数据时代博物馆动态观众服务体系浅析[J].中国博 物馆,2014(4):68-71. [4]吴宁宁“. 大数据”对博物馆的启示[N].中国文物报,2013- 09-04(06). 转载文章仅代表作者观点,不代表我馆立场。