高端学术
您当前的位置:核心期刊咨询网文史艺术论文》基于内容结构视图的研究数据元数据标准比较研究

基于内容结构视图的研究数据元数据标准比较研究

来源:核心期刊咨询网时间:12

摘要:摘要 元数据是保证研究数据(又被称作科学数据)获取和再利用的关键,国内外许多学科领域和学术社区都制定了该领域特定的研究数据元数据标准或规范。与文献资源元数据标准相较,研究数据元数据标准结构和元素设计往往更为复杂,为跨学科的数据分享和发现带来了

  摘要 元数据是保证研究数据(又被称作“科学数据”)获取和再利用的关键,国内外许多学科领域和学术社区都制定了该领域特定的研究数据元数据标准或规范。与文献资源元数据标准相较,研究数据元数据标准结构和元素设计往往更为复杂,为跨学科的数据分享和发现带来了障碍。文章应用一种内容结构视图,对八种典型的研究数据元数据标准元素进行比较分析,分析不同研究数据元数据标准的内容特征,并由此探讨研究数据元数据标准发展趋势,为元数据应用方案设计提供参考。

  关键词 研究数据 科学数据 元数据标准 内容结构视图
 

山东图书馆学刊

  《山东图书馆学刊》(双月刊)创刊于1981年,是由山东省图书馆学会、山东省图书馆主办的学术性期刊。本刊办刊十几年来始终坚持刊物的学术性,刊登的论文内容涉及图书馆学各个领域,既有图书馆学专家立论独到的大家之作,亦兼顾中青年论点新颖的优秀论文。

  1 引言

  研究数据,是指科研人员通过观察、探测、实验、建模、仿真和调查等形式收集的,用于验证研究发现的,能够直接或间接产出学术成果的完整事实材料和数字产品,例如:文档、数据文件、问卷、模型、算法、软件或代码、图片、音视频资料等。

  元数据,被定义为“描述数据的数据”。相应地,研究数据元数据是指描述研究数据集的创建者、上下文、空间、时间、起源、历史、数据质量等信息,以便支持数据使用者对数据的发现、选择、定位、获取、解释和再利用等功能,以及数据拥有者或管理者对数据的组织、管理、共享和长期保存等功能。

  2011年,英国数字监护中心(Digital Curation Center)发布了《数字监护参考手册—科学数据元数据部分》(Digital Curation Reference ManualInstalment on Scientific Metadata),论述了科学数据元数据的特征和角色,指出元数据在数据仓储的管理和数据监护中扮演中心角色[1]。研究数据元数据在数据管理计划和公共资助研究项目研究数据的公众获取中也扮演着核心角色,例如,2011年美国国家自然科学基金会(NSF)新增的研究数据管理计划要求中明确把“将使用的数据和元数据格式标准”列为重要建议[2]。2012年,欧洲研究图书馆协会(LIBER)发布的《图书馆开始从事研究数据管理的十条建议》中指出,图书馆应该参与元数据和相关数据标准的建设,同时应当提供研究数据相关的元数据服务[3]。美国密歇根大学校际政治及社会研究联盟(Interuniversity Consortium for Political and Social Research,ICPSR)在其《维持领域数据仓储白皮书》(Sustaining Domain Repositories for Digital Data:A White Paper)中指出,元数据标准如保存元数据框架对于数据仓储的发现、检索、获取和科研群体标准的转变是非常必要的[4]。

  2 研究数据元数据的功能需求

  研究数据的产生和积累正在呈指数级增长,科学研究和科技创新越来越依赖于对海量数据的管理、分析和再利用。为了支持研究数据的发现、获取、解析和再利用,描述和呈现研究数据的元数据应该满足的功能需求可以从以下两方面进行探讨:

  2.1 面向数据任务和数据活动的需求

  研究数据元数据功能需求模型将元数据功能需求分为四个象限:数据管理、数据质量控制、数据发现和数据利用[5]。这四个象限分别支持不同的数据任务:数据管理象限支持元数据自动或半自动生成、数据管理、数据存储、数据安全、数据互通等任务;数据质量控制象限支持数据验证、复制等任务;数据发现象限支持数据分享(发布、引用)和数据发现(选择、唯一性确定、获取)等任务;数据使用象限支持数据分析、可视化等任务。

  研究数据元数据对研究数据生命周期中的用户数据活动的支持,体现在为数据活动需要的信息设计相应的元数据模块和字段。例如,数据发现、数据唯一性确定、数据选择、数据获取等活动,属于与传统文献类似的一般性任务,元数据以描述性、身份标识、语义等信息内容为主,其中数据选择活动的需求还包括技术性、科研上下文、时空等信息内容。数据验证、数据分析属于科研任务,元数据主要以描述性、科研上下文、时空等信息内容为主。数据管理、数据存档属于数据监护任务,元数据主要以描述性、管理性、结构性和技术性等信息内容为主,并以身份标识、语义信息、科研上下文、时空等信息内容作为补充。数据发布、数据引用属于传播任务,元数据主要以描述性、身份标识、语义等信息内容为主,并以科研上下文、时空等信息内容作为补充。

  2.2 面向不同服务对象的需求

  针对不同的对象,研究数据元数据发挥的作用也不同[6]。对于数据用户而言,元数据是他们正确选择、使用、交换数据的不可缺少的工具。元数据通过对数据资源的内容、分类、质量和存储等的详细描述,回答了用户的一系列问题:有什么数据?数据怎么样?如何获取数据?怎么使用数据?对于数据管理者而言,元数据方便了他们集成各种数据库,为数据集(或库)建立目录,更有效地管理并维护海量数据。对于数据生产者而言,元数据的存在方便了数据的生产、加工和更新,并可以使数据归档更高效,使数据成为有生命力的资源,不必担心随着时间或者人员的变化而影响到数据的生产,数据的增值具有了持久性。研究数据元数据的最大用户是科研人员,元数据是他们发现数据、评价数据和使用数据的不可或缺的工具。

  3 研究数据元数据标准发展现状

  3.1 國内外研究数据元数据标准的发展和分布

  元数据是保证研究数据获取和再利用的关键因素。国外许多学科领域和学者社区都采取了各种行动制定和发展该学科需要遵守的元数据标准或规范,根据英国数字监护中心对目前国际上各学科的主流研究数据元数据标准的总结,其主要分布在通用学科、生物学、地球科学、物理学、社会科学与人文学科、跨学科等领域。

转载请注明来自:http://www.qikan2017.com/lunwen/wyi/15234.html

相关论文阅读

论文发表技巧

期刊论文问答区

文学历史优质期刊

最新期刊更新

精品推荐