打开主菜单

求真百科

元资料

图片来自itsfun

元资料metadata),又称诠释资料中介资料中继资料后设资料等,为描述其他资料资讯的资料。

元资料有六种不同类型,分别是记叙性元资料结构性元资料管理性元资料参考性元资料统计性元资料[1]法律性元资料

  • 记叙性元资料描述了用于发现与辨别意义的资源。它可以包括如标题、摘要、作者和关键字等元素。
  • 结构性元资料是有关于资料容器的元资料,指示如何整理其中复合的物件。例如页面依甚么排序方式组成章节。
  • 管理性元资料是用于管理资源的资讯,例如资料产生的时间和方式、档案种类和其它技术资讯,以及谁有权限存取它。
  • 参考性元资料是跟内容及统计数据质量相关的资讯。
  • 统计性元资料,又称处理过程资料,会描述收集、处理或产生资料的过程。
  • 法律性元资料提供有关作者、版权持有者、及公共授权条款等资讯。

目录

内容简介

主要是描述资料属性(property)的资讯,用来支持如指示储存位置、历史资料、资源寻找、文件记录等功能。元资料算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏资料的内容或特色,进而达成协助资料检索的目的。

该名词起源于1969年,由Jack E. Myers所提出的.metadata即关于资料的资料,可以说是一种标准,是为支援互通性的资料描述,所取得一致的准则。其基本定义出自OCLC与NCSA所主办的“Metadata Workshop”研讨会。它将metadata定义为“描述资料的资料”(data about data)。此后各种有关Metadata的定义纷纷的出现。现存很多metadata的定义,主要视特定社群或使用情境而不同。如有有关资料的资料(data about data),有关资讯物件之结构的资讯(structured information about an information object),描述资源属性的资料(Data describes attributes of resources)等。

都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元资料的一种应用,是1995年2月由国际图书馆电脑中心(OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)所联合赞助的研讨会,在邀请52位来自图书馆员电脑专家,共同制定规格,建立一套描述网路上电子文件之特征。

历史

元资料传统上用于图书馆卡片目录,一直到1980年代。2000年代起,数位化成为储存资料的普遍方式。而图书馆也将其目录资料转换为数位资料库,数位资料也有相关的元资料标准。

不同行业有不同的元资料标准(例如,博物馆收藏、数位音乐档案、网站等)。描述资料或资料档的背景和内容,增加了实用性。例如一个网页的元资料包括了有关页面主题、编写脚本语言(例如 HTML)、产生页面的工具,以及哪里有关于主题的更多资讯。这个元资料可以自动提高阅读者的体验,让使用者更容易在网路上寻找网页。音乐CD可提供此专辑的音乐家歌手歌曲作者资讯的元资料。

元资料的主要目的是帮助用户寻找相关资讯并探索资源。元资料也有助于组织电子资源,提供数位识别,并支援归档和保存资源。“由相关标准寻找、辨识资源,将相似资源集中在一起,区分不同并提供位置资讯”,元资料可帮助使用者探索资源。各国政府广泛收集包括互联网在内的通讯活动元资料,用于流量分析,而且可用于大规模监控

在许多国家有关于电子邮件电话网页IP连线与手机位置的元资料,是固定由国家储存的。

定义

元资料是指“描述资料的资料”。虽然说源自于希腊介词前缀 μετά- 的英文前缀“meta”代表“之后”或“之下”的意思,在此处实际上是使用知识论中“关于”的意思。元资料被定义为提供某些资料单方面或多方面资讯的资料;它被用来概述资料的基础资讯,以简化查找过程与方便使用。

例如:

  • 创建资料的方法
  • 资料的用途
  • 建立的时间与日期
  • 资料的建立者或作者
  • 资料被建立在电脑网路的何处
  • 用作标准
  • 档案大小

举例,一个数位影像档案可能会包括描述图片大小、色彩深度、图片解析度、图片建立时间、快门速度等资料的元资料[2]。一份文档的元资料可能会包含文档长度、作者、建立时间、文档概述等资讯。网页中的元资料也可以包含页面内容的描述,以及有关于内容的关键字等等。

这些东西常被称作“元标签”(metatags),其在1990年代后期以前被用来当作决定搜寻引擎结果顺序的主要因素。在1990年代后期,由于“关键字堆砌”的出现,对于元标签的倚赖程度逐渐降低。元标签的滥用导致许多搜寻引擎会误认某些结果的关联性高于实际值。

元资料可以在被称作元资料注册系统元资料储存库资料库中储存和管理。不过,如果没有文字和参考点的话,单纯看是很难辨认这些元资料的[3]

举例来说:一个资料库本身会包含一些数字,但是这些数字代表的涵义可能是某些计算后的结果,或者是书籍的ISBN码──这就需要参考才能知道,而无法直接由资料容器内部得知。菲利普•巴格利在1968年在他的著作《Extension of Programming Language Concepts》中发明了“metadata”这个词,当时的意思为“描述资料容器的资料”,也就是结构性元资料,而非描述性元资料或常用于图书馆目录的元内容(metacontent)。

自那时起,资讯管理、资讯科学、资讯技术、图书馆学与地理资讯系统等领域广泛接受了这个词汇。在这些领域中,元资料的定义为“描述资料的资料”[4]。尽管这是最广为接受的定义,许多学科也为了自用而采用了特殊的解释或定义。

参考文献

  1. Directorate, OECD Statistics. OECD Glossary of Statistical Terms - Reference metadata Definition. stats.oecd.org. [2018-05-24]. 
  2. ADEO Imaging: TIFF Metadata. [2013-05-20]. (原始内容存档于2013-05-17). 
  3. Metadata Standards And Metadata Registries: An Overview (PDF). [2011-12-23]. (原始内容存档 (PDF)于2011-06-29). 
  4. NISO. Understanding Metadata (PDF). NISO Press. [5 January 2010]. ISBN 1-880124-62-9. (原始内容 (PDF)存档于2014年11月7日).