公共图书馆基于读者行为大数据的采集与利用
时间:2018-03-30
大数据时代为图书馆服务与发展带来机遇与挑战,如何有效利用大数据服务读者是当前公共图书馆亟待研究课题。本文进行相关研究与分析,并介绍如何运用各渠道采集信息,通过充分利用读者行为大数据,可提升公共图书馆服务质量,实现资源配置合理化,充分发挥其社会作用。
引言
大数据时代背景下,对公共图书馆的服务提出了新的要求,如何能够顺应时代潮流、与时俱进、开拓创新成为了摆在公共图书馆面前的一项重要工作。国家“十三五规划纲要”中提出:实施国家大数据战略。把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。由此,必将对公共图书馆的服务创新提出更高的要求。
一、读者行为大数据的成因
大数据是在信息科技进步的基础上,随着互联网和移动互联网的发展而诞生,并在不断完善的信息基础设施的支持下持续提升,同时经过智能终端设备每时每刻产生的多种类型数据的填充,形成的庞大数据集。移动互联网时代数据的爆炸性增长、网络带宽的升级、存储设备性价比的提高、云计算关于数据集中管理和分布式访问的模式,以及物联网技术突破性进展后引起的相关硬件设备成本的下降,都为大数据的产生做出了突出的贡献。
公共图书馆服务的最直接最重要的对象就是读者群体。面向读者的服务创新,包含服务形式、服务内容、服务手段、服务理念等方面的创新。区别于传统的文献借阅、阅读推广、参考咨询、论坛讲座、馆际互借等服务内容,服务创新就是使用户感受到不同于从前的崭新的内容或形式,而这所有的一切都需要读者行为大数据的支撑,只有掌握了精准的、有效的读者行为信息,并使这些信息可视化,才能使新的设想、新的技术可行可用,并产生其应有的价值。
结合公共图书馆本身的性质特征,这里对读者行为大数据进行如下定义:在大数据时代背景下,由读者属性特征数据、公共图书馆服务与信息资源数据,以及由读者行为导致两者之间通过各种方式和渠道因交集而产生的关联路径及相关数据,称之为公共图书馆的读者行为大数据。
基于读者行为的大数据,首先要有大量的数据来源,这些数据有些是存在且已经采集,也有些是存在的但并没有进行有效采集。下面对读者行为大数据的采集进行阐述。
二、读者行为大数据的采集内容
读者行为大数据包含读者本身的特征信息、读者来馆要获取的服务或信息资源,以及读者如何找到他们所需要的服务或信息资源的过程。具体如下:
1.读者本身的属性特征
马克思在人性观中指出人的两种属性,一种是人的自然属性,另一种是人的社会属性。人的自然属性指的是肉体存在以及其客观存在的特性,社会属性指的是在社会实践活动的过程中人扮演的角色和人与人之间发生的各种联系。
根据以上理论,结合公共图书馆的特性以及读者行为大数据的需要,对读者本身的属性,即性别、年龄、地域,和?x者的行为偏好进行信息采集。
1.1读者基本属性特征
考虑到现阶段公共图书馆对读者信息采集的可行性与便利性,我们只对基本的性别、年龄、归属区域等进行统计,对于较高级的学历、职业、收入水平等特征,只有待条件更为成熟、技术更佳完善之后,再做大数据的采集。
1.1.1来访读者的性别比例分布。统计来馆借阅图书的读者性别,不只是简单的统计出到馆男性读者人数是多少,女性读者人数是多少,最重要的是能够通过这些数据发现该地区性别对于阅读的影响。
1.1.2来访读者的年龄段比例分布。国际上通常将人口按不等距的方法进行分组,分别为少年人口0-14岁, 壮年人口15-64岁, 老年人口65岁以上,也有观点指出,应该将15-24岁这一年龄段的人口单独成组,称为青年人口。公共图书馆在对来访读者的年龄进行分组时,可参考以上方法,同时结合当地实际情况,对读者的年龄进行划分。
1.1.3来访读者归属区域分布。统计来馆借阅图书读者的住址信息,并将其分为常驻人口和流动人口;如果是常驻人口,则按照当地所属行政区域进行进一步的分类。通过统计读者的归属区域,可以对公共图书馆的服务覆盖面等信息进行大致的了解。 收集到的读者基本信息,可以与当地统计部门的相关统计数据进行比对,也可以做数据与数据之间的二维或多维的交叉分析,寻找公共图书馆辐射到的服务范围内读者群的分布特征,便于针对不同的读者群提供与之对应的服务。
1.2读者行为偏好特征
1.2.1读者到馆的时间偏好
监测读者的到馆时间,可以分为以下两部分:
① 到馆总体人流量监测。根据对到馆读者的总体人流量监测,可以观察到读者流动量的曲线图,甚至可细化到各窗口的人流量监测。然后形成相对应的日接待量、周接待量、月接待量和年接待量的特征分布图,从而进行更合理的信息资源配置和服务人员调配。
② 读者个体时间偏好监测。对读者个人的到馆次数、到馆时长进行监测,可以辅助分析读者阅读需求的大小;对不同读者到馆频次的研究,也能够便于公共图书馆提供差异化服务。
1.2.2读者阅读行为习惯的特征
对于读者借阅图书的类型喜好,即对读者与图书之间的关联关系做统计,可从宏观和微观两个方面着手。
①宏观统计应从大局出发,采集图书馆图书借阅的总体数据,对全馆图书从查询开始,一直到阅读,以及最后的借还情况,都有一个全面的统计。这些统计包括查询量、借阅量等,更细致一些的可统计出最受欢迎的图书种类,甚至是某几本图书。通过对预约借阅的统计,可以找到最紧俏的图书是哪些等。
②微观统计指的是每位读者借阅的第一本书以及最近借阅的书籍是什么,同一读者都借阅了哪些书,单本书的平均借阅时长是多久,月平均借阅量与年平均借阅量分别为多少,这些书的标签属性又归属什么类型等。
读者在借阅过程中产生的任何信息都可以作为采集的对象。将读者的基本属性与行为偏好进行交叉分析,即可得出该地区的读者基本阅读行为特征,也可形成单个读者的基本阅读行为轨迹。这都属于读者行为大数据采集的范畴。
2.读者寻找所需服务或信息资源的目的和过程
图书馆是一个收藏资讯、原始资料、资料库并提供相关服务的地方,那么图书馆收藏的所有信息资源以及由此延伸的各类服务都是读者来馆的目的。根据对读者的信息获取行为进行观察,以及综合图书馆可提供的技术手段,可对该板块进行以下归纳:
当读者产生了一定的需求,并来到图书馆获取这种需求,我们则可以对该板块进行相应的研究,从而获得读者与其需求的服务或信息资源之间的关联路径数据。读者一般会通过以下几个方面寻找自己想要的信息资源,即:①通过咨询相关工作人员,并参考导向指示牌,直奔目的地?ふ易约盒枰?的服务或信息资源;②通过自助服务终端进行查询,按照提示去寻找对应的服务或信息资源;③使用图书馆的数字检索系统,定位找到并使用自己想要的服务或信息资源;④通过互联网来搜索公共图书馆的相关信息,寻找自己想要的服务或信息资源;⑤通过移动互联网来搜索或者直接使用公共图书馆的APP,寻找并使用自己想要的服务或信息资源。
在这个过程当中,也许读者通过一种方法就可以找到自己想要的服务或信息,也有可能会在第一次通过某一方法寻找信息的过程中失败,再次或多次的通过其他的方法,或同时采用多种方式相互交叉的方式获取自己所需的服务或信息。这些数据在统计的时候需要我们通过多变灵活的方式,根据实际情况采取合适的方法实施。
三、读者行为大数据的采集方式和渠道
读者行为大数据是基于多种渠道和方式采集到的读者行为数据的集合。读者行为大数据的采集渠道分为线上渠道和线下渠道,线上渠道包括互联网、移动互联网、物联网等基于通信协议进行数据传输的渠道;线下渠道主要指以传统的线下访谈、阅读辅导、读者教育等形式开展的线下沟通交流渠道。
1. 基于互联网的读者信息采集
基于互联网的读者信息采集,主要是采集通过互联网渠道来获取公共图书馆服务和信息资源的读者信息,包含读者的访问渠道、访问来源、访问路径以及获取信息资源和服务的操作日志等相关信息。
需要在公共图书馆官方网站上增加相关的统计代码,以方便统计读者的来源渠道、路径等相关信息。
2.基于移动互联网的读者信息采集
基于移动互联网的读者信息采集,主要是采集通过移动互联网渠道(智能手机、平板电脑等)来获取公共图书馆服务和信息资源的读者信息,包括读者使用的终端设备、网络状况、地域分布、访问时间、访问内容、以及其他操作日志等相关信息。
有专属APP的图书馆可以收集到更多的读者信息,包括读者的注册使用人数信息、活跃度信息、使用行为数据信息等。
3.基于物联网的读者信息采集
基于物联网的读者信息采集,包括基于RFID的读者信息采集、基于智能图书馆管理系统的读者信息采集和基于自助服务终端的读者信息采集。
3.1基于RFID的读者信息采集
本文讲诉的基于RFID的读者信息采集,主要指基于采用了RFID技术的芯片卡进行读者信息采集,包括二代身份证、图书馆的读者证(借阅证)等。基于该电子芯片卡,可以采集到读者的基本属性特征,包括读者的性别、年龄、归属区域、来访时间等基础信息。也可以集合图书管理系统,采集读者借阅图书的相关信息,包括图书的被借阅情况,单次被借阅时长等信息。
3.2基于智能图书馆管理系统的读者信息采集
所谓智能图书馆管理系统,指的是基于RFID的图书馆智能管理系统,以新兴的电子标签技术为基础,对读者、图书、文献、书库书架进行一体化标识,并依托先进的RFID技术,将众多RFID设备以及管理软件融合为一体,构建起计算机信息和馆藏文献、读者服务之间的高效便捷、人性化的管理与服务体系。
智能图书馆管理系统的实现,依托于人与书的交互,以及构成其交互过程的多种设备,在实现人与书交互的过程中,会产生许多数据,这些数据既是智能图书馆管理系统的核心,也是图书馆读者行为画像的核心要素。 3.3基于自助服务终端的读者信息采集
基于自助服务终端的读者信息采集,主要是采集通过公共图书馆配备的自助服务终端来获取相关服务和信息资源的读者信息,包括设备的使用频率、使用时间段、功能使用情况、以及其他操作日志等相关信息。结合读者使用自助服?罩斩私?行个性化服务时进行的操作(指用户进行借还书等具有读者标识标签的操作),可以进一步对读者进行细分,形成读者属性特征的补充,为读者行为大数据增添重要的一笔。
4.基于传统形式的读者信息采集
基于传统形式的读者信息采集,主要指对图书馆既有的一些读者信息采集渠道方式(包含阅读辅导、读者教育等)采集到的信息进行数据化、结构化的处理,形成有效数据源,汇总到数据库中作为大数据的数据来源之一。
4.1阅读辅导
图书馆的阅读辅导工作主要包括了解不同年龄段读者的阅读兴趣,并对其进行引导和培养,以及通过开展系列活动,向读者普及图书馆的相关知识,通过辅导读者学习阅读的技巧,营造阅读氛围,激发读者的阅读兴趣。
在这些环节中,会产生许多关于阅读辅导对象读者的相关行为信息,包括不同年龄段辅导对象的阅读兴趣、检索及阅读技巧、环境因素对辅导对象读者的影响等,这些内容都是读者行为大数据的重要组成部分,是对读者进行用户画像的重要素材。
4.2读者教育
公共图书馆是社会的教育中心、信息中心和文化活动中心。设立有展厅、多功能厅、报告厅、自修室、培训教室等各种活动场所的公共图书馆,既可举办讲座、会议、展览等大型社会文化活动,也可满足读者个人的上网、欣赏音乐、学习等文化活动需求。在实现社会及读者需求的过程中,会产生许许多多成系列、相关联的数据集,这些数据集也是公共图书馆读者行为大数据的重要组成部分之一。
5.图书管理系统数据的开发利用
公共图书馆本身就是一个信息存储的集中地,将公共图书馆本身的信息资源数据化,形成有效的数据资源,也是当前时代下,公共图书馆大数据信息采集的一项重要工作。
四、公共图书馆如何利用读者行为大数据
大数据时代背景下,高效开发利用公共图书馆本身存储的海量信息资源,充分收集整理分析利用公共图书馆读者的用户行为大数据是公共图书馆服务创新的重要支撑。
在充分分析读者行为大数据的基础上,结合公共图书馆自身信息资源大数据,为读者提供更好的服务,是我们此项工作的目的。通过整理分析读者行为大数据,可以对其加以利用,精准高效的发挥公共图书馆的社会作用。
1.发挥对文献采购工作的参考作用
通过对读者基本属性和行为偏好进行交叉分析并形成用户行为矩阵,分析得出读者阅读的真实需求,在条件允许的情况下,根据读者的阅读行为喜好进行文献的采购。
通过对读者的阅读行为进行分析,可有侧重点、有方向的开展文献资源的采购工作。特别是对于阅读服务覆盖范围较为小的市县级图书馆,在进行文献采购工作时,可充分考虑当地人民群众的实际阅读需求,有效利用文献采购经费,开展有针对性的馆藏建设工作,避免资源浪费。
还可以通过对文献借阅情况的数据提取,考察采购工作的工作成效。例如可以将文献分为纸质文献和电子文献两类,按年统计纸质文献的借阅率和电子文献的浏览率,分析得到每年图书馆购买的文献的使用情况,为来年的文献采购、馆藏建设提供依据。
2.带动公共图书馆的阅读推广服务
图书馆最重要的职责之一就是阅读推广服务。从培养人民群众的阅读习惯,特别是培养小读者的阅读兴趣,通过长远的努力,提高国民素质与文化水平,是利国利民的重要举措。
作为公共图书馆,通过分析读者获取图书馆服务和信息资源的渠道途径,及其获取图书馆信息资源和服务的内容质量及渠道占比,形成公共图书馆信息资源服务的矩阵分布图,可以为公共图书馆在阅读推广服务的渠道建设和方式选择上提供指导依据。
3.提升公共图书馆的读者服务满意度
当前社会为服务型社会,公共图书馆更是反映当地文化建设与精神面貌的重要窗口。优质的图书馆服务不仅是形成良好口碑的基础,更是目前社会形势下对图书馆工作的高水品的要求。而提升图书馆的服务水平,则需要对读者的真实需求进行精准的把握,从而更加全面、准确的改善图书馆的服务。
可通过结合读者在图书馆内获取服务和信息的习惯以及偏好,微观调整图书馆的服务方式与资源布局,细微的改变图书上架布局、阅览空间设定、以及服务读者的方式等,根据不断变化的读者需求,及时改变图书馆的服务内容与方式,提供符合读者需求的公共图书馆服务,从而提升公共图书馆的读者服务满意度。
4.推动公共图书馆新服务的发展
现代图书馆已经不再局限于图书信息资源的借阅服务,丰富多彩的文化创新服务也是如今读者们的新追求。很多公共图书馆已经具备活动场地、设备等硬件基础设施,并且能够举办展览、讲座等一系列的文化活动,甚至可以吸引到当地行政机关事业单位、国有企业和民营企业等积极主动的找到公共图书馆来举办各种活动。
面对如此优越的条件,公共图书馆更要充分发挥文化高地的作用,不能将工作做的流于形式,一定要落于实处,做到叫好又叫座。面对这样的新挑战,公共图书馆首先要对读者的需求进行精准定位,开展符合当下需求形态、符合读者意愿的新服务;其次,在宣传推广方面,除了通过传统媒体和新媒体的途径发布宣传信息外,也可以通过分析读者的行为信息,将读者按照自然属性和行为偏好特征进行匹配,形成读者特定标识群,对特征高度符合的读者进行精准的信息推送,从而使得公共图书馆的信息、服务得到最大化的利用。
5.发挥公共图书馆为政府决策提供信息依据的作用
信息需求是当今社会的最大需求,大量的、广泛的、准确的信息是政府决策的重要依据。而公共图书馆恰好是一个各种信息汇聚、交流的重要场所。公共图书馆突破了时间、地域、专业、民族等各种限制,能从大量的、广泛的信息资源中通过专业的分析,为政府决策提供准确的信息,这样政策法规的制定才能更符合国情民情。
公共图书馆可以充分利用自身的大数据集,从地域人才分布、民生关注热点、企事业单位的信息需求特点等多方面形成具有地方特色的社会发展调研报告,为政府决策提供准确的、有价值的参考依据,充分发挥图书馆社会信息资源中心的作用。
结语
大数据时代是一个多样的时代、一个发展的时代,充分利用大数据为己用,对于公共图书馆的服务创新与发展有着无可估量的作用。公共图书馆的服务创新与升级应该从新理念、新思路、新模式、新策略等多角度去进行对接,如何能够有效汇集大数据、利用大数据,结合大数据的特征对原有的服务体系进行重构,形成基于大数据的公共图书馆服务体系,进而全面发挥公共图书馆信息资源的知识价值,为读者提供与时俱进的服务,以满足社会和公众的需求,使得图书馆得到长远发展,将是相当长的一段时间内我们一直要研究的课题。
参考文献
[1]辜蔚君.关于人力资源数字化转型中数据管理工作的思考[J].厦门科技, 2023(1):43-47.
