e-Science环境下,科学数据呈指数级增长,图书馆在发挥其科学数据保存和服务方面具有不可替代的地位和作用。麻省理工学院图书馆的HMI项目实现了对地理学科数据管理的MIT地理数据知识库的数据创建及管理[64]。科学数据管理服务中的合作机制国外图书馆在开展科学数据管理服务时大多采取合作机制,强调学科馆员与科研人员的密切合作。......
2025-09-30
(1)获取的高频关键词及构造的共词矩阵
通过对582篇文献的关键词进行词频统计,共获取1 193个关键词。按照词频由高到低进行排序,并截取词频不小于5的48个高频关键词作为共词分析的基础(见表2-1)。可以看出,“科学数据共享”和“科学数据”是出现最为频繁的关键词,其频次远远高于排在第三的“元数据”。
表2-1 国内科学数据研究论文的高频关键词(频次>4)
将48个高频关键词两两组合,统计其在582篇文献中共现的次数,形成48×48的共词矩阵,如表2-2所示(因版面所限,只列出共词矩阵的局部)。由于科学数据共享本身出现的频次远远高于其他关键词,因此,科学数据共享与其他关键词在同一篇文献中共现的概率也是最高的。
表2-2 国内科学数据研究论文高频词的共词矩阵(部分)
(2)因子分析结果
通过因子分析,最终可得到主成分列表。图2-1中列出了部分主成分,将其按特征根从大到小排列,放弃特征值小于1的主成分,前8个主成分解释了总变量的89.893%,其中仅前3个主成分的信息解释量就达到了63.914%。表2-3显示了因子载荷大于0.5的关键词在8个因子(主成分)中的分布情况。
表2-3 因子分析确定的科学数据研究主题结构(https://www.chuimin.cn)
续表
图2-1 因子数与涵盖的信息量
结合图2-1和表2-3,因子分析的结果如下:
①因子命名。大部分关键词都归于相应的因子,只有1个关键词“云计算”,由于其载荷系数小于0.5而未能参加分类,说明这一关键词代表的主题较新,还没有很好地同其他研究方向相结合。根据因子载荷大于0.7就对因子解释有帮助的原则[84],并综合因子中其他关键词的属性,我们给8个因子依次命名为:科学数据共享和数据共享平台、科学数据组织与分类、科学数据监护与服务、科学数据整合、科学数据政策与开放获取、科学数据网格技术、科学数据挖掘、科学数据管理(见表2-3)。
②关键词跨区分布情况。共有4个关键词跨区分布。因子1和因子7中同时出现了科学数据共享平台,因子3和因子7中同时出现了科学数据管理,因子1和因子3中同时出现了数据服务,因子3和因子5中同时出现了关联数据。这表明上述的两两因子包含的内容相互渗透和交叉,有一定的相关性。
③关键词的因子载荷系数为负的分布情况。共有2个关键词的因子载荷系数为负,分别为“数据集成”(系数为-0.588)和“关联规则”(系数为-0.584),同相应的因子构成负相关关系,一般对此类因子不予考虑。例如,在因子3中的“关联规则”是负值,这表明关于科学数据监护与服务的研究可能涉及关联规则方面的问题,但还是比较少。
相关文章
e-Science环境下,科学数据呈指数级增长,图书馆在发挥其科学数据保存和服务方面具有不可替代的地位和作用。麻省理工学院图书馆的HMI项目实现了对地理学科数据管理的MIT地理数据知识库的数据创建及管理[64]。科学数据管理服务中的合作机制国外图书馆在开展科学数据管理服务时大多采取合作机制,强调学科馆员与科研人员的密切合作。......
2025-09-30
科学数据管理方法研究研究者主要提出两种科学数据管理方法,即多层法和实用法。Roberts进一步探讨了电子实验室记事本和科学数据管理系统的整合方式[8]。目前,科学数据管理的实施主要借助科学数据管理软件及系统。现行数据库管理系统仍可运用于科学数据管理。云服务也逐渐成为科学数据管理的工具之一。关于本体和元数据在科学数据管理中的应用研究①本体在科学数据管理中的应用。......
2025-09-30
欧盟是世界上具有重要影响的政府间、区域一体化组织[30],其关于科学数据管理的动向在欧洲国家产生了直接影响,也在国际范围内起到示范和引导作用。由于欧盟在一定程度上具有准政府的职能,因此它制定的关于科学数据管理的法律和政策等具有直接的执行效力。欧盟制定的与科学数据相关的法律法规和有关信息社会的立法融为一体,认为信息社会、知识经济的发展与数据共享和电子战略的发展紧密相连。......
2025-09-30
可见,图书馆对科学数据管理人才已有较大需求。Swan和Brown认为图书馆应承担起培养优秀的科学数据管理者的责任,为图书馆员和科研人员提供相应的培训[72]。其第二阶段DigCCurrⅡ已开发科学数据管理的博士研究生课程和教学网络。另外,英国DCC计划2011年夏季至2013年春季将与18所高等教育机构密切合作。除了专家建议外,DCC还提供一系列技术解决方案、数据管理工具协助有关机构重设数据支持服务,提供学习资源及培训,帮助用户提高数据管理能力[79]。......
2025-09-30
国际科技数据委员会国际科技数据委员会自1968年起每两年举办一次国际学术会议,邀请世界各领域的科学家共同探讨科学数据领域面临的问题和挑战,并对任务组的工作进行评审,决定是否继续进行。目前该组织在全球拥有包括各国科技信息机构在内的40多个会员单位。ICSTI每年定期召开夏季大会,来自各国科技信息机构的专家学者围绕会议主题进行学术交流讨论。......
2025-09-30
CODATA是国际科学理事会下的跨学科国际组织,关注科学技术各个领域的实验测量、观察和计算数据,尤其关心不同学科所共有的数据管理问题及数据在其产生学科领域之外的应用。④召开每两年一次的CODATA国际数据学术会议,成为专门围绕科学数据主题的国际性论坛。2012年7月15—31日,CODATA举办了发展中国家科学数据管理和可持续发展培训国际研讨会,聚焦于科学数据生命周期管理以及可持续发展与使用[44]。......
2025-09-30
国际科技数据委员会国际科技数据委员会是国际科学理事会于1966年建立的一个跨学科学术委员会,致力于提高科技数据的质量、可靠性、管理和可获取性,推动和鼓励对科学技术有重要价值的可靠的数值数据进行编辑、评价、传播。目前,项目先后成功召开了巴西圣保罗会议、南非普里托利亚会议和美国华盛顿会议,相关活动正按计划进行。......
2025-09-30
《UNESCO指南》将在国家与国际层面的决策和政策制定者中得到广泛应用。至2014年9月,WDC在全球共有89个数据中心,这些数据中心几乎涵盖了地球和日地关系科学的各个领域,每个数据中心承担了汇集某个领域的科研数据并承担向科技界开放和服务的任务。②所有将要共享的数据、元数据和资料都应在最短的时间内以最低的成本提供共享。此外,WDS于2011年9月在......
2025-09-30
相关推荐