来自不同数据源的数据之间存在着冲突、不一致或相互矛盾的现象。数据量巨大,难以在合理时间内判断数据质量的好坏。数据变化速度快,数据“时效性”很短,对处理技术提出更高的要求。由于大数据的变化速度较快,有些数据的“时效性”很短。国内外没有形成统一认可的数据质量标准,对大数据数据质量的研究才刚刚起步。......
2025-09-29
(一)联机编目的质量控制
为适应信息时代对图书馆的要求,使我国图书馆工作自动化、文献信息化、传输网络化,最大限度地实现资源共享,本着统一规划、统一标准、合作建设、协调管理的原则,北京图书馆作为国家图书馆,于2025年10月成立了“全国联合编目中心”(以下简称联合编目中心)。当时,全国共有45家各种类型的图书馆成为这一联合编目中心的成员馆,并且能够通过网络向联合编目中心数据库上传数据和下载中心的书目数据。
联合编目中心的宗旨是在全国范围内组织与管理图书馆联机联合编目工作,实现网上编目资源共享。联合编目中心的职能是:通过联机联合编目,降低成员馆与用户的编目成本,提高编目质量,实现书目数据的规范化、标准化,实现书目数据资源共享;通过编制联合目录,打破图书馆界条块分割的界限,形成地区性跨行业馆藏资源协调采访网络;通过采访协调,形成特色馆藏与馆藏互补;通过网上传输、馆际互借,实现馆藏资源共享,提高馆藏质量;通过组织成员馆之间的交流和培训,提高成员馆的业务水平、技术水平和服务水平,掌握国际国内图书馆发展的最新动态等。
联合编目中心的联机编目应用系统于2025年12月开始进行联通试验并开始试运行,书目数据的质量管理也开始成为各成员馆在工作中必须要关注的问题。
实际操作中最突出的问题还是书目数据的质量控制。由于对标准、规则理解上的差异,各编目员上传的数据质量难以保证,并且联合编目中心花在审校上的成本可能并不低于原编的成本。联合编目中心因此严格控制各成员馆的上传权限,很多成员馆就无权上传数据。几乎是与全国联合编目中心同一时期建立的另外一个联合编目中心,近年来也正在如火如荼地发展壮大,它就是中国高等教育文献保障系统(China Academic Library&Information System,简称CALIS)。CALIS是经国务院批准的我国高等教育“九五”“十五”总体规划中三个公共服务体系之一。CALIS的宗旨是:在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。
CALIS管理中心引进和共建了一系列国内外文献数据库,包括大量的二次文献库和全文数据库;采用独立开发与引用消化相结合的道路,主持开发了联机合作编目系统、文献传递与馆际互借系统、统一检索平台、资源注册与调度系统,形成了较为完整的CALIS文献信息服务网络。CALIS之所以能在短短几年间取得令人瞩目的成果,一个很重要的原因就在于它的运营模式。就联机合作编目方面而言,为了提高高校编目队伍的整体素质,确保高校图书馆书目数据库的质量,CALIS联机合作编目中心为编目员举办中、西文图书编目业务培训,主要内容为编目知识、著录规则等。中心还建立了中文三级编目员资格认证考试制度,考试合格者即可获得CALIS三级编目员资格,有权向编目中心提交自编的书目数据。在数据质量控制方面,CALIS也组织专家对各馆提交的数据进行审校,并将存在的问题及时反馈。经一定时间和一定方式的测评,达到要求的编目员或成员馆即可升级。(https://www.chuimin.cn)
(二)书目数据质量控制的难点
联合编目的数据质量管理工作,在实践中存在着很多难点,最关键的就是操作中对数据标引质量的控制。造成数据质量有缺陷的原因如下。
计算机的应用大大丰富了原有的检索语言,造成了检索语言的不一致。检索语言的准确语法是数据库质量管理中的难点和要点。计算机的应用为体系分类法的改造和功能的发挥,为分类检索语言和主题检索语言的结合注入了无穷的活力。不论是检索语言的编制和修订,还是标引技术和检索技术的改进与改革,都必须彻底摆脱手工操作阶段所固有的思路和观念,否则就很难在数字化信息时代满足联机检索、联网检索对情报检索语言日益提高的要求。例如,在机读目录中,一条记录著录有书目文献的各种数据和多种检索语言,这些不同的检索语言也由原来的泾渭分明、相互对立,转变为相互渗透、相互结合、相互包含,它们之间的界限也变得越来越模糊。这是编目人员需要重新适应的。
编目人员对编目规则理解程度的差异,造成规则执行中的差异。编目人员对编目规则的理解程度不一,导致具体操作结果的差异。因而,对同一种文献的处理、制作的数据会有各式各样著录结果。目前,国内编目业尚无一部系统、权威的编目规则,造成了数据编制上的差异。这是目前国内编目工作的最大麻烦。各种可作为编目依据的规则,在一些关键的说法上均不统一,使得编目人员无所适从,有无“法”可依之感。因此,全国联合编目中心为保证数据库的质量,做到各成员馆送达的数据能够统一,对一些尚无定论的著录项目或数据字段做了统一的规定,要求各馆都按此执行。这样将来有统一的定论后,通过计算机处理,可以很容易达到著录格式的统一转换。
为了实施全国中文图书联合编目工作,确保网上中文机读书目数据的质量,北京图书馆图书采编部依据有关国际和国家标准,结合建库期间中文普通图书计算机编目的工作实践,编写了《中文普通图书编目手册》,并且以此作为全国联合编目中心中文图书联合编目的规则。
相关文章
来自不同数据源的数据之间存在着冲突、不一致或相互矛盾的现象。数据量巨大,难以在合理时间内判断数据质量的好坏。数据变化速度快,数据“时效性”很短,对处理技术提出更高的要求。由于大数据的变化速度较快,有些数据的“时效性”很短。国内外没有形成统一认可的数据质量标准,对大数据数据质量的研究才刚刚起步。......
2025-09-29
我们并非仅是把收集过来的数据放到硬盘里面那么简单,更重要的是对数据进行分类、存放及管理。面对海量数据,如何有效地储存,最大限度地发挥数据价值,成了我们面临的问题。要知道,通过技术手段实现数据云端储存,这只是基础。但是其中面临的难题是,每个人的生活数据、医疗数据和基因数据,格式与标准都不同。所以,如何打通原有数据的格式与标准,是大数据储存未来最大的挑战。......
2025-09-29
书目数据库管理的核心问题是文献编目的管理、图书联机编目的质量管理、数字文献的著录方式以及建立书目数据库从理论到实践的过程。对高校图书馆来说,做好书目信息资源的管理是书目数据库文献管理的首要任务。这些都是书目数据库文献编目管理的主要对象。(四)网络信息检索工具1.书目数据库的检索工具建设合理统一的书目信息检索模式和检索工具,是书目数据库文献编目管理的重要任务。......
2025-09-29
比特币系统就是这一理念的实践。无论身处何方,任何人都可以挖掘、购买、出售或收取比特币,而且在交易过程中,其他人无法辨认用户的身份信息。2009年1月3日,中本聪开发了比特币客户端的第一个版本,发行了50个比特币,比特币就此问世。随后,比特币应用系统在开发人员的共同努力下逐渐完善,随着比特币总量的不断增加,新币制造的速度会减慢,直到2140年将会达到2100万个总量上限。......
2025-09-29
2)质量管理是指“在质量方面指挥和控制组织协调的活动”。3)质量管理的核心内容归结为质量策划、质量控制和质量改进三个阶段。将分析结果结合本产品的质量目标制订质量计划样表。3)质量控制的方法一般采取过程监督、检查来实现。表13-12为质量改进计划样表。......
2025-09-29
[1]Yang H,Zhang J,Zhao Y,et al.SUDOI:software defined networking for ubiquitous data center optical interconnection[J].IEEE Communications Magazine,2016,54(2):86-95.[2]Ford R,Zhang M,Mezzavilla M,et a......
2025-09-29
图1-33 异形件的加工2.分类根据加工时主轴与工作台的相对位置,可将加工中心分为卧式加工中心、立式加工中心和龙门式加工中心等。图1-37 龙门式加工中心五面复合加工中心目前,高档加工中心的发展方向是五面复合加工中心。......
2025-09-29
数据寄存器用于存储数值型数据。若两个相邻的数据寄存器组合,可存储32位的数值型数据。数据寄存器可分为如下几类。①通用型数据寄存器,共200点。通用型数据寄存器一旦写入数据,只要不再写入其他数据,其内容不变。只要不改写,无论PLC是从运行到停止,还是断电时,断电保持型数据寄存器里的数值将保持不变。特殊数据寄存器供监控机内元件的运行方式用。④文件数据存储器。......
2025-09-29
相关推荐