高端学术
您当前的位置:核心期刊咨询网文史艺术论文》数据挖掘在高校图书馆服务中的应用探究

数据挖掘在高校图书馆服务中的应用探究

来源:核心期刊咨询网时间:12

摘要:摘要:随着时代的发展,社会已然进入大数据和云计算时代。人们可以通过数据的收集、分析和处理,挖掘出数据背后的价值,进而利用数据的价值去创造更大的价值,这对高校图书馆服务来说也是一样的。高校图书馆可通过对读者数据的挖掘,再通过有效的算法分析处

  摘要:随着时代的发展,社会已然进入大数据和云计算时代。人们可以通过数据的收集、分析和处理,挖掘出数据背后的价值,进而利用数据的价值去创造更大的价值,这对高校图书馆服务来说也是一样的。高校图书馆可通过对读者数据的挖掘,再通过有效的算法分析处理,判断出读者兴趣以及读者与图书资源的联系,进行合理的资源安排,并且给读者提供个性化的服务。本文首先分析数据时代的内涵以及高校图书馆数据挖掘的相关算法,其次分析数据挖掘在高校图书馆服务中的应用途径,以期将图书馆服务的潜力彻底释放,创造出更多的价值。

  关键词:数据挖掘;高校图书馆服务;应用

数据挖掘论文

  近年来,高校图书馆的图书资源利用率不断下降。针对这种现象,高校要不断挖掘高校图书馆的服务数据,从这些数据中挖掘出潜在的价值,更好地进行图书资源采购、编目等,为学生提供个性化的图书资源服务,顺应时代的变化,提高图书资源的利用率,更好地为高校学生服务,为社会培育出更优秀的人才。

  一、数据挖掘

  (一)挖掘数据的内涵

  在当前的大数据时代,人们的衣食住行等各方面行为都被数据化改造,“挖掘数据”是指对人们的行为数据进行收集、转换分析和模型化处理,挖掘出数据背后的价值,从而为图书馆服务的各项决策提供数据支持,大数据“4V”特征包括数据体量大(Volume)、数据类型繁多(Variety)、价值密度低(Value)、利用速度快(Velocity)。

  (二)挖掘数据的过程

  挖掘数据可以从采集与存储、计算与处理、智能运营三方面分析。首先是采集和存储,其中最关键的就是“学生”与“图书”两个数据主体,高校图书馆利用自动化图书系统中的大量借阅业务数据,能够轻松采集到学生的借阅数据,再将其存储在云端;

  其次是计算与处理,需要运用到精细的算法,而高校图书馆可以利用开源的云计算框架或软件对学生借阅数据进行处理,例如Hadoop、Mapreduce、Spark、Pentaho BI等开源框架,也可与社会第三方专业云计算企业寻求合作,需要根据实际情况而定;最后是智能运营,简单来说就是根据挖掘的数据价值做好图书馆各项事宜的规划,从而为图书馆服务的各项决策提供数据支持。

  二、图书馆数据挖掘的常见算法

  图书馆对学生借阅数据的收集较好处理,而如何从杂乱且繁多的数据中找出有效的信息则是重点问题,要考虑到方方面面的因素。高校图书馆数据挖掘的算法有很多,通常包括以下几类:

  (一)关联规则

  两个或多个数据具有关联性就是关联规则,关联分析即找出数据中的关联性,例如一名临床医学的学生借阅了《解剖学图谱》和《细胞生物学》,这有可能只是小概率事件,而很多名临床医学的学生借阅了这两本书,说明这两本书具有关联性。分析两本书的关联性,就能够为下一位临床医学生进行推荐。

  (二)分类算法

  学生的借阅数据多样且烦琐,高校可通过对借阅样本数据库的多种行为数据进行细致的划分,等于按照标签进行分层次、分类别的划分,通过划分找到学生精细的借阅需求和借阅特征的信息,后期可以根据学生的借阅需求进行科学采购,也可以对借阅特征進行图书资源的高效化存档[1]。

  (三)聚类算法

  聚类算法也叫群分析,即以“学生”这一数据来源为主体,将借阅数据库中划分出不同的借阅群体,通过相对应的数据分析,概括出每一类借阅群体的借阅模式或者借阅习惯,是挖掘算法中的重要类别之一。

  (四)时间序列法

  高校图书馆可将若干的借阅数据资料按时间序列排列成数据序列,在众多数据的集合下,其变化趋势和相互关系较为明显,可以利用过去的变动趋势预测未来,不过受到偶然因素的影响也很大,要尽可能消除偶然因素影响,常用算术平均、加权平均和指数平均等来减少偶然因素。

  三、数据挖掘在高校图书馆中的应用途径

  (一)加强图书馆规划。互联网时代下,对读者信息、图书条码进行扫描,其借阅信息会立刻汇集到后台海量数据库中。通过对数据的分析,可以加强图书馆的规划,例如将借阅量大的图书类别放在易于查找的楼层和书架上,为学生提供更好的服务。图书馆可将两本具有关联性的图书放在一起,将全部图书进行最优化的规划安排,或许看起来很乱,利用起来却更加有效;或通过数据挖掘发现馆藏中破损、编目不正确、索引关键词有误的图书,对其适当调整,充分发挥图书价值。

  (二)根据需求合理采购

  以往图书馆的图书采购是粗放型的,由采购人员决定采购的类型和数量,而在互联网时代下,高校图书馆采购则是根据需求而定,根据学生的借阅图书数据,采购借阅需求高、借阅次数多的图书,再结合实际馆藏决定采购的类型,分清哪些是必需的,哪些是可以稍后补充的,采购人员在做好充分预算,做好计划,拓宽采购渠道后,才能做到择优采购,提升采购质量。例如,通过对图书资源流通的记录,一类图书明明很多,但借阅的人数还是很多,借阅流通很快,就需要相关人员再扩增采购量[2]。

  (三)做好图书馆人事安排

  图书馆借阅数据是海量的,学生到图书馆借阅的数据也是有规律的,应根据对图书借阅时间序列算法的分析,找出学生图书馆借阅的时间规律,精确到每一天、每一周、每一月,确定最优的开馆闭馆时间,修整时间和人事安排等。图书馆工作繁多且细碎,管理人员短缺是常见的现象,将图书馆的人事安排精细划分,并且提供相应的勤工俭学岗位,在图书馆借阅高峰期,设置勤工俭学岗位,多配置几位勤工俭学的学生,减轻新工作人员的负担[3]。

  (四)数据挖掘催动人工智能落地

  图书馆可利用数据挖掘,加强对人工智能的开发,让人工智能代替传统人力,进行一些简单的编目、新书通报、图书归整、引导、图书查询、简单交互咨询等工作,为高校学生提供更好的服务。

  推荐阅读:如何开展建筑图书私域流量建设

转载请注明来自:http://www.qikan2017.com/lunwen/wyi/19545.html

相关论文阅读

论文发表技巧

期刊论文问答区

文学历史优质期刊

最新期刊更新

精品推荐