不计其数的商品图书由我们熟知的ISBN进行编号, 提高了查找其出版信息的速度,对大数据时代信息整合来说也必不可少。随时出版物种类增多,世界通用的出版物标识符也不止一种,有哪些常见的出版标识符可以便利我们的学习和科研呢?
ISBN
ISBN的全称是国际标准图书编号(International Standard Book Number),由ISO(International Standardization Organization)最终公布。
每本书的每一个版本都有一个不同ISBN。每个国家有一个指定机构管理境内ISBN,并决定当地申请流程。从2007年开始新书的ISBN从10位变为13位,13位的ISBN由五组数字构成:
第一组三位是国际物品编码协会分配的产品标识编码(EAN.UCC)- 978或979;
第二组是组区号,中国则是“7”;
第三组是出版社代码;
第四组的出版物编码代表了某一书名的特定版本;
第五组是一位校验码,而第三和四组编码的长短均不定。
ISSN
与ISBN类似,用于连续出版物(例如杂志期刊)的标识符是ISSN(International Standard Serial Number)。
以ISSN为前缀加上八位数字组成,分为前后两段各四位,中间用连接号。前七位是顺序号,第八位是效验码。值得一提的是,在中国要为刊物申请ISSN需先申请到国内统一连续出版物号(CN)。
SICI
在ISSN的基础上还有更为复杂的SICI(SerialItem and Contribution Identifier)。这个标识符分为三段:
第一段item segment包括了连续刊物的ISSN;
第二段contribution segment代表具体位置(例如页数)以及论文名称;
第三段control segment包含了效验码和出版形式等。
这个构成复杂的标识符代表了连续期刊中更细节的信息——某一期某一卷甚至某一篇文章。
DOI
另一学术文献中广为运用的则是数字对象DOI(digital object identifier),同样由ISO进行标准化,可以为任意一个对象提供独有的数字标识符,在DOI系统(DOI System)上注册管理。
DOI广泛运用在学术论文电子书上,它可以永久的为论文提供一个电子身份证,无论网址如何变化,用DOI都能找到论文现在信息和链接。DOI的格式分为前缀后缀,中间用“/”隔开,前缀由特定代码“10”和DOI代理机构代码组成,用圆点隔开,后缀则有代理机构自行给出,只要具有唯一性即可,因此有着无限的可能。
DOI的唯一性和永久性优点日渐明显,越来越多的全文数据库和学术出版社在使用DOI,并有其它非盈利组织(比如美国计算机协会)和小型的出版社开始加入了使用DOI的行列。中文DOI服务自2007年才开始运行,但却日渐与国际接轨。
其他
还有CODEN代码在化学研究领域广为运用,最初由美国材料与实验协会(ASTM)推出,现由化学文摘社负责(Chemical Abstracts Service),这个六位代码在化学以外领域也可申请,常用于参考文献索引。
而美国国家医学图书馆(NLM)MEDLINE数据库通过PubMed搜索引擎来检索,在这个搜索引擎中的每一份文档都一个“身份证”,这就是PMID(PubMedIdentifier)。于此同时PubMed Central(PMC)则是一个归档服务,存储的文档都是满足公开合规,可以全文获取,这些归档文献的识别符则是PMCID。