当前位置:
文档之家› 第二讲 CNMARC格式详解
第二讲 CNMARC格式详解
– 可检字段与不可检字段
200 1#$a西游录$f(元)耶律楚才著$c异域志$f(元)周致中著
有关概念
数据字段区所含的数据有如下两种形式
• 数据控制字段——定长字段(00X)结构:
数据
字段分隔符
• 变长字段(010—999)结构 :
字段指示符 1 字段指示符 2 $a
数据 ……
字段分隔符
200 1#$a西游录$f(元)耶律楚才著
第三节 地址目次区
由若干目次项和字段分隔符构成 全部数值由系统自动生成
– 目次项:占12个字符位,固定长
• 分别用3位、4位、5位字符揭示数据字段区中相应字段的字段标 识符、数据字段长度、起始字符位置
– 字段分隔符
• 一般用在该区终结处表示该区结束,系统自动生成
– 注意:目次项占12个字符位是固定长的,但是,每条记 录所描述的字段数量不同,所以地址目次区所占字符长 度是可变长的。
• 如:正式出版后文献的特征与CIP记录不符者。
– 如:00957oam2#2200289###450#
执行代码
由4位字符构成,字符位:6-9;分别定义记录类型、书 目级别、层次等级代码;第9位字符未定义,用“#”表示。
– 记录类型
• 《 中国机读目录使用手册》规定了14种记录类型代码。 • 如:00957oam2#2200289 ### 450#
机读格式 010##$a7-81029-926-3$d12.00 2001#$a 信息世界漫谈$f 李衍达编著 210##$a 北京$c 清华大学出版社$d2000.3 215##$a147 页$d18cm 225##$a 院士科普丛书$f 路永祥 690##$a G20$v4 701#0$a 李衍达$4 编著 801#0$aCN$b XXMCL$c20050701 901##$a XXMCL$b0214977$d G20$e2
数据字段区的标识系统
两种标识符号:内容标识符和分隔符
– 内容标识符
• 包括:字段标识符、字段指示符、子字段标识符
– 用于识别数据元素,或提供有关数据元素的附加信息 的符号或编码。
– 位于数据前,标志数据开始
• 字段标识符——用于识别各个字段的3位数字或 字符代码;其第1位数用以区分不同的功能块。 如:010 国际标准书号字段 101 作品语种字段
– 书目级别
• 《 中国机读目录使用手册》规定了4种书目级别代码。 • a=分析级:该书目描述的实体包含在另一实体中。 • m=专著:以一册或以限定数量出版的出版物。 • s=连续出版物 • c=合集(汇集型的书目实体) • 注意:与该记录描述的主要书目实体有关。
执行代码
– 层次等级代码
• CNMARC是按照层次等级结构将文献信息资源分别编制机读目录;并 用层次级别代码指明该记录在层次等级中的地位,揭示机读记录间的 从属关系。
第五节 常用字段的使用方法
0----标识块
用来标识记录或标识出版物实体并出现在 实体上的号码。
– 包括27个字段
• 001 记录标识号
005 记录处理时间
• 010 国际标准书号 011 国际连续出版物号
• 013 国际标准音乐号 014 论文标识号
• 015 国际标准技术报告号……
0----标识块
– 作用:供计算机准确、迅速的存取相应字段的数据
第四节 数据字段区
数据字段区的组织
数据字段区
功能块 功能块
…… 功能块—— 功能块
字段 字段——
…… 字段 字段
子字段 子字段
…… 子字段—— 子字段
数据元素 数据元素
…… 数据元素 数据元素
数据字段区的组织
0----标识块 1----编码信息块 2----著录信息块 3----附注块 4----款目连接块
其它数据元素
记录长度 – 占5个字符,5个十进制数组成最大数值为99999,不足5位时,左边 添0; – 反映一条记录所占全部字节数。
指示符长度 – 用一位十进制数字表示指示符长度,CNMARC中均为2
子字段标识符长度 – 用一位十进制数字表示指示符长度,CNMARC中均为2
数据基地址 – 占5个字符,5个十进制数组成最大数值为99999,不足5位时,左边 添0; – 表示第一个数据字段相对于记录首位的起始字符位置,等于头标区 和地址目次区的字符总数。
5----相关题名块 6----主题分析块 7----知识责任块 8----国际使用块 9----国内使用块
CNMARC各功能块 与款目著录项目对照表
CNMARC 数据字段区中 的功能块
0XX 标识块 1XX 编码信息块 2XX 著录信息块
3XX 附注块 4XX 款目连接块 5XX 相关题名块 6XX 主题分析块 7XX 知识责任块 8XX 国际使用块 9XX 国内使用块
部分”所占的字符位数。一般取值为0。 – 第4位:未定义,用#表示。 – 如:00957oam2#2200289###450#
记录头标里的代码表示的是记录的特征, 而不是直接表示书目实体本身的特征
思考: 00893nas0#22002651##450# 的含义
思考题
CNMARC机读记录的逻辑结构有何特点? 何谓记录头标? 由哪些数据元素组成? 熟悉需要人工输入的各个代码的含义。
内容标识符
字段指示符
• 指与变长字段相关的字符(数字和字母),它提供有关可变长 字段的内容、记录中不同字段的关系及某些数据处理过程中所 需操作的附加信息。
如:200 题名与责任说明字段 0# 题名无意义 1# 题名有意义
子字段标识符
• 由2个字符组成的代码,用以识别可变长字段中不同的子字段。 • 第一个字符用$表示;第二个字符可以用数字或字母
– 编目等级:
• 用1个字符表示机读记录的完整程度,说明是否依据受编文献编制 的机读目录。
• # = 完整级 :依据受编文献本身建立的记录 • 1 = 次级1 :未依据受编文献建立的记录 • 2 = 次级2 :表示预编记录 • 3 = 次级3 :该记录为不完整的记录(项目不完整) • 如:00957oam2#2200289###450#
001 记录标识号
– 特点:
• 记录唯一相关的标识符号;具有唯一性,可作为 检索点;
• 每条记录的必备字段,不可重复; • 不设字段指示符,不设子字段; • 固定长字段:共12个字符,3个数据元素组成 • 如:001 011999000001
001 011989009021
记录附加定义
– 著录格式
• 用1位字符代码表示记录采用的著录规则;是否依 据了《国际标准书目著录规则》的规定。
• # = 记录完全采用ISBD格式 • i = 记录为部分或不完全的ISBD格式 • n = 记录为非ISBD类格式
– 字符位19未定义,用#表示 – 如:00957oam2#2200289###450#
款目中的著录项目 标准编号与获得方式项
题名与责任说明项、版本项、文献特殊细节项、出版发行项、载体 形态项、丛编项及正题名标目 附注项
交替题名、合订题名、并列题名及统一题名等标目 主题词与分类号 个人著者名称、机关团体名称以及会议名称方面的标目
索书号与分类号
G20
信息世界漫谈/李衍达编著 .——北京:清华大学出版
字段
子字段
200 题名与责任者块
205 版本说明
$a ……
……
$c ……
215 载体形态项——
225 丛编 …… $d 尺寸
$e 附件
第二节 记录头标
记录头标(Record label)
– 位于一条机读记录的开端,记载了该记录的有关参数。 为计算机处理一条机读记录提供必不可少的基本参数。
– 固定长度为24个字符,包括8个数据元素:
数据元素名称
字符数
字符位置
1) 记录长度
5
2) 记录状态
1
3) 执行代码
4
4) 指示符长度
1
5) 子字段标示符长度
1
6) 数据起始地址
5
7) 记录附加定义
3
8) 地址目次区结构
4
0-4 5
6-9 10 11 12-16 17-19 20-23
记录状态
用来标识记录处理状态,由1位字母构成。 《 中国机读目录使用手册》规定了下列5种记录状
中国机读目录格式
主要内容
CNMARC机读记录的逻辑结构 记录头标 地址目次区 数据字段区 常用字段的使用方法
第一节 CNMARC机读记录的逻辑结构
CNMARC机读记录结构如下
区域 记录头标 地址目次区
记录 数据字段区
记录分隔符
功能块 0----标识块 1----编码信息块 2----著录信息块—— 3----附注块 4----款目连接块 5----相关题名块 6----主题分析块 7----知识责任块 8----国际使用块 9----国内使用块
其它数据元素
地址目次项结构
– 占4位字符; – 第1位:记录地址目次区用几位数字表示数据字段区每一个
字段的长度; CNMARC中用4位十进制数表示; – 第2位:记录地址目次区用几位数字表示数据字段区每一个
字段的起始位置;CNMARC中用5位十进制数表示; – 第3位:用1位十进制数表示每个地址目次区的“执行定义
• 《 中国机读目录使用手册》规定了4个层次等级代码。 • # =层次关系未定义的记录 • 0 =无层次等级关系的记录 • 1 =最高层次的记录 • 2 =低于最高层次的记录
–字符位9未定义,用“#”表示。
• 如:00957oam2#2200289 ### 450#
记录附加定义