“领域名称”关联与“中图法分类名”关联相加占关联二元组总数的比例达91%,共同构成整个关联的基石。关联分析结果表明,“评分规则制定”的相关分析,以及权重的设置,与大数据系统运行的实际结果相互印证,逻辑上也能得到合理的解读。......
2023-07-24
本研究以知识管理理论为图书馆大数据服务和应用的支撑理论,结合大数据特征,应用包含社会网络和语义网的大规模网络分析方法构建大数据分析模型,采用Hadoop分布式平台和Spark内存计算框架为主要开发工具,按照从大数据收集、大数据处理到大数据应用的思路开展研究。
(1)构建了高校图书馆大数据应用模式框架。
(2)在所提出的应用模式框架的范围内,即遵循“数据收集、整合和存储”“数据处理和分析”和“知识展现与服务”三层架构,同时密切结合当前图书馆各类服务的具体需求,有针对性地提出了6种高校图书馆大数据服务和应用的具体解决方案,并进行案例分析。
(3)以图书馆馆藏书目数据库、中文期刊和学位论文数据库为基础构建图书馆大数据的基础数据,结合大规模网络分析方法和高性能的Spark内存计算框架,开展了个性化推荐的实证研究。
本研究具有以下价值:
(1)学术价值
①图书馆科学。本书提出一种以元数据模型构建为数据应用基础,以大规模网络分析为核心方法,以知识展现与服务为目标的高校图书馆大数据应用模式体系,推动了图书馆数据服务在模式和应用方法上的研究。
②服务科学。大规模语义网分析方法应用于学科知识挖掘、智能导航与知识推理,以提升图书馆数据服务效率和水平;大规模社会网络分析方法应用于科研创新合作研究主题挖掘,隐性知识的共享和转移等领域,以高效准确地提供个性化信息推送服务,推进知识创新和提高决策效率。大规模网络分析方法的应用探索对于服务科学领域方法论研究有重要价值。
③数据科学。本书通过各类模型构建和分析,提供大数据环境下数据整合、数据分析到数据服务模型的方法和技术思路,对于研究大数据技术在目标领域应用具有重要理论价值。
(2)应用价值
为应对基础设施挑战,基于图书馆有限的计算设备,采用中低端硬件构建的大规模计算机集群,应用分布式、开源、高效的Hadoop+Spark+GraphX软件框架和内存计算技术开发应用系统,对于高校图书馆降低设备投入成本,进行资源集约化管理具有重要的应用和推广价值。
另外,在研究过程中还存在以下问题,值得进一步深入分析和讨论。
(1)“科学知识图谱”[1]和“Google知识图谱”[2]的比较和分析。
以社会网络分析和可视化方法为核心的“科学知识图谱”已成为图书情报领域研究不可或缺的手段,将网络分析方法与新兴的语义网和本体技术结合起来而产生的“Google知识图谱”是近年来为适应大数据环境下海量知识融合和创新的有力工具。这两类“知识图谱”虽名称相近,内涵却相去甚远,因此有必要深入讨论。
“科学知识图谱”是一种基于社会网络分析的方法。力图将科研活动的主体(如科学家)或具有共同特征的群体(如学科知识单元)作为研究对象,构建网络模型,并应用网络分析相关算法(如图聚类算法等)进行挖掘,以期发现领域知识,“科学知识图谱”是知识管理过程中的一种关键方法,主要应用于科学计量、引文分析等领域。[3]“Google知识图谱”是基于语义网和领域本体的大规模语义网知识库,由Google公司率先提出,主要致力于提供海量数据的智能检索服务。两者都是本研究涉及的重要方法或工具,由于在学术界缺乏研究,极易混淆,因此必须对其进行深入的比较和分析。
(2)图书馆大数据具体应用模式的比较和分析。一方面,由于图书馆大数据应用服务的对象不同,导致服务的目的、要求、数据来源、数据特点有很大差异,所提出的高校图书馆大数据各种应用模式也有重大区别;另一方面,各种模式也存在诸多共同点,因此需要对其进行比较和分析。
本书先对两类知识图谱进行系统分析和比较,接着对各种应用模式及实证研究加以总结,最后对研究的前景进行展望。[4]
有关高校图书馆大数据应用模式与实证研究的文章
“领域名称”关联与“中图法分类名”关联相加占关联二元组总数的比例达91%,共同构成整个关联的基石。关联分析结果表明,“评分规则制定”的相关分析,以及权重的设置,与大数据系统运行的实际结果相互印证,逻辑上也能得到合理的解读。......
2023-07-24
为验证本方案的可行性以及观察文献推荐效果,开展以下实证研究。本方案着重讨论面向内容的推荐,而图书或论文的内容在很大程度上由关键元数据决定。表10.2图书数据表10.3论文数据表10.4是结合表10.2中的图书与表10.3中的论文,依据混合关联的设计方案进行关联后并依据表10.1的评分标准所得到的结果,共形成15对关联二元组。按照这种方式,海量的图书和论文二元组将构建成大规模推荐网络图。......
2023-07-24
学术界和工业界对知识管理理论进行了深入而广泛的研究,然而迄今为止对知识管理涉及的具体内容及一般过程尚未形成统一认识。这里重点介绍图书情报领域专家的相关表述。其管理过程大致包括知识生产、组织、构建、检索、发现、分享、应用和创新等阶段。在知识经济的背景下,知识的发现、利用和创新是贯穿于高校图书馆各项业务工作的主线,知识管理理论也成为大数据时代图书馆大数据应用和服务的主要支撑理论。......
2023-07-24
图4.3论文数据库和图书数据库本体模型和聚合元数据关联。设有两篇论文的题名分别为:论文A:大数据时代数字图书馆面临的机遇和挑战论文B:大数据时代下图书馆的挑战及其应对策略按以下步骤计算它们的相似程度。......
2023-07-24
图书馆大数据应用必须密切结合图书馆大数据服务的需求,针对性地提出应用模式和解决方案,以促进图书馆大数据服务的真正落地。本书利用语义网这一工具和技术,融合语义网最新研究成果,提出一种基于语义网的学科知识服务模式。因此本书提出面向科研的高校图书馆电子资源使用统计模式。......
2023-07-24
本方案是基于内容的文献推荐方法,当用户浏览图书馆信息系统,点击感兴趣的文献链接时,系统查找与用户当前所点击的文献特征高相似度的文献,经过排名后实施推荐。本方案中用户兴趣建模和文献数据建模均采用“混合关联”方案,如图10.13所示。抽取图书数据库中的“书名”和“内容简介”,与论文数据库中的“篇名”和“中文摘要”等元数据实现关联。Spark库中有专用函数支持“相似性度量”关联的实现。......
2023-07-24
特别是随着阅读终端的多样化和社交媒体的广泛使用,形成了全方位、立体化的图书馆大数据。图书馆可用于满足智慧服务核心需求的重要大数据资源见表7.1。大数据挖掘作为知识发现、信息行为分析的重要研究方法,是图书馆数据展现数据智慧的关键技术之一。本节提出如图7.1所示的基于大数据挖掘的图书馆智慧服务模型,将大数据挖掘作为沟通图书馆智慧服务需求和大数据应用的桥梁。......
2023-07-24
为验证本方案的可行性和推荐性能,实现推荐系统并开展实证研究。按此规则共收集到1万多组数据。针对不同的调和参数α的准确率和多样率的统计结果如图10.15所示。......
2023-07-24
相关推荐