信息资源数字化建设
源的长期保存 1.1.2 数字存取
——将馆藏中具有较高价值的文 献资源数字化后通过因特网面向公共提 供浏览,以实现文献本身的传播价值
1.1.1 数字保存
数字资源维护策略之一:数字迁移
含义:
优点:数字资源总是以能够被普遍接受的格式为 人们所使用,现行的硬件与软件能够毫无障碍地 访问数字资源
缺点: (1)数字资源的一些样式(layout)甚至一些数据将
二维平面介质信息资源的类型
• 印刷型文本 • 手稿 • 半色调型信息资源 • 连续色调型信息资源 • 混合型信息资源
数字化生产基本模式
• 黑白模式 • 灰色模式 • 彩色模式
数字化生产基本模式
影响数字图像的生产因素
• 分辨率 • 位元深度 • 文件格式 • 图像压缩 • 图像增强处理 • 系统性能 • 操作人员
运输安全和处理安全问题。尤其对于三
●需要专门技能的员工,并需要 维型的原始资源载体。
对所有员工进行培训
●容易受外包商的稳定性影响。
●需要设备支持
2 数字化内容选择
2.1 数字化内容选择的原因 2.2 数字化内容选择的实践 2.3 数字化内容选择原则
2.1 数字化内容选择的原因
Web访问的需要 解决数字化生产高成本和图书馆经费
杂的,也是很困难的,成本也是非常可观的
1.1.2 数字存取
数字资源的广泛传播很容易实现,可通过web或 FTP方式,且对其浏览也不需要昂贵设备支持 数字访问是一种非排斥性消费行为:
(1)边际成本微乎其微 ; (2) “搭便车”问题 ; (3)购买使用与授对现存胶片的扫描来实现的 微缩胶片的质量是否能够达到足够的标准 微缩胶片是保存信息资源的最佳方式,信息资源胶片 化也许是一种最重要的信息资源保存策略 胶片的维护频率非常低 信息资源数字化领域中,使用胶片的方法有两种 先制成微型胶片,然后再从胶片获得数字图像?还 是直接生成数字图像,然后再由数字图像输出胶片?
分辨率
3.1.2 数字化生产系统
• 生产系统的构建 • 硬件系统 • 软件系统
生产系统构建
• 系统性能方面 • 系统设备方面 • 系统投资方面 • 技术人员方面
数字化生产硬件设备
• 数字扫描设备:平板式扫描仪 、 平台式扫描 、滚筒式扫描仪 、单 页供送式扫描仪 、缩微胶片扫描 仪 、幻灯片扫描仪
信息资源数字化建设
报告人:臧国全
题目解析(1)
研究题目类型:一个对象(如,数字图书 馆)、一个对象的一个或多个方面(如,数 字图书馆的知识产权,数字保存系统质量保 证标准与认证研究)、一个对象的一个视角 (如,基于实证分析的数字保存策略研究)、 一个过程研究(如,本研究题目)。
信息资源属性:内容属性、内容标识属性 (表征信息:如文字、代码、计算机存贮代 码)、载体属性、阅读方式属性、传播属性。
外包
优 ●边学边做,逐步培养 ●外包商拥有专家和训练有素
点 自己的数字化专家
的员工
●发展自己的生产能力 ●可以根据项目规划和预算,
●可对数字化生产过程 基于被数字化的原始信息资源
的所有环节进行控制 的规模,谈判每件资源数字化
●定义需求具有灵活性 的价格
●原始信息资源的安全 ●劳动力成本低
可以得到保障
●附加功能。如,广泛传播,文本检索和处理等。
●节约成本。如,生成虚拟馆藏,可使多个机构共同分担 成本。
2.2.4 哈佛大学图书馆(2)
4 馆藏资源中没有可以满足用户需求现成数字化版本。 5 所生成的数字化版本有产权许可保证 6 现行技术所生成的数字化图像的质量能够充分满足用户的
需求 7 现行技术难以对原始资源的替代品(如,照片)进行理想
有限性之间矛盾的需要 数字资源管理的需要 产权保护的需要 特殊文献的考虑 残缺文献处理成本的考虑 图书馆信誉的需要
2.2 数字化内容选择的实践
2.2.1 美国国会图书馆 2.2.2 哥伦比亚大学图书馆 2.2.3 加州大学图书馆 2.2.4 哈佛大学图书馆
2.2.1 美国国会图书馆
题目解析(2)
信息资源数字化:将非数字化载体转换为数字 载体的过程。转化的基本方法。该过程导致 的信息资源属性的变化(内容属性、内容标 识属性(文字、代码、计算机存贮代码)、 载体属性、阅读方式属性、传播属性)。
数字转化的原因:非数字化载体阅读的独占 性占有、传统信息资源的保存问题(载体的 脆弱性)等
2.3.4 原始文献物理特性原则
● 在数字化内容选择过程中,需要考虑的与原始文 献物理特征相关的问题
● 最常见的物理材质类型。不同物理材质的文献需 要不同的技术进行数字化
● 载体的物理尺寸也是影响内容选择的一个重要因 素
● 载体的健壮性对数字化内容选择也会产生影响
2.3.5 数字保存原则
● 安全数字化(safe digitization):包括原始信息资源的状 态允许被完全数字化;数字化实施过程需要搬运原始资 源时,其状态适合于搬运;尽可能扫描原始资源的替代 品(如照片),从而减少对原始资源的损伤;数字化的 产品必须建档,并制订由于时间和技术变化等因素导致 的长期维护策略
等
●外包商生产的数字图像可能还需要图
●生产能力和效率有限
书馆来加工处理,图书馆应该对生产的
●容易产生技术过失成本
图像随几抽取检查
●对图书馆的其他活动会产生影 ●需求必须在合同中清晰定义,否则就
响
有可能出现交流障碍
●除了生产费用外,图书馆需要 ●原始信息资源需要搬运,并由此导致
支付设备、维护和人力费用
会丢失; (2)操作对象是数字资源集合中的单件资源 (3)如果数字资源的文件格式已作废或所用的转换工
具不再有效,那么采用这种方法进行格式转换就不可行
1.1.1 数字保存
数字资源维护策略之二:数字仿真
含义 优点:最大优点在于保持数字资源的外观
(look- feel) 缺点:开发和维护这种仿真工具是非常复
信息资源数字化的实施者:商业型企业、信 息机构
信息资源数字化生命周期
1. 项目规划 2. 数字化内容选择 3. 数字化生产 4. 数字资源发布 5. 数字保存
(基本解释)
1 项目规划
1.1 项目目标 1.2 项目成本 1.3 产权许可 1.4 项目实施方式选择
1.1 项目目标
1.1.1 数字保存 ——保护易碎载体资源、数字资
(2)产权保护的技术方式 :分辨率技术 、水 印技术 、数字产权管理(DRM)
1.3 项目实施方式选择原则(1)
外包:不具备数字化生产基础设施、特殊载 体资源和载体过大资源 、短期数字化项目 自己实施:稀有资源、易碎资源和不适合于 离开图书馆物理存放装置的资源
1.3 项目实施方式选择原则(2)
图书馆自己实施
数字化
8 图书馆拥有所需的技术专家资源,对数字化产品的生成、 管理和传播具有足够的组织和技术支撑。
2.3 数字化内容选择原则
● 产权保证原则 ● 原始文献知识价值原则 ● 用户保障原则 ● 原始文献物理特性原则 ● 数字保存原则 ● 成本效益原则 ● 避免重复数字化原则 ● 技术条件限制原则
2.3.1 产权保证原则
性,其结果可能因人而异。但尽管如此, 知识价值也必须是数字化内容选择的重要 原则之一
2.3.3 用户保障原则
● 用户保障的本质就是馆藏文献的利用率 ● 一些问题需特别关注 :其一是要对利用率高的文
献的原因进行分析 ;其二是文献的利用率有时与 文献的知识价值并不一致 ;其三是利用率也会与 文献的物理状态有关 ;其四是在多馆合作数字化 项目
● 数字保存的另一层含义是保护易碎载体的原始资源
2.3.6 成本效益原则
● 馆藏文献的数字化成本受众多因素影响:
分辨率越高的图像所需的成本也越高,彩色图像的成本 要比黑白图像的成本高。数字化生成纯文本文件有助于 全文检索,且占用较少的存储空间,但需要OCR识别, 并需要大量的人工校对
● 尽可能提高成本效益是数字化内容选择的 宗旨。实现相同功能而采用不同方法的成 本会有所不同
价值 状态 使用 原始资源特点 试验型信息资源 有助于存取
2.2.2 哥伦比亚大学图书馆
● 内容价值原则 ● 价值增值原则 ● 知识产权原则 ● 数字保存原则 ● 技术可行性原则 ● 知识控制原则
2.2.3 加州大学图书馆
馆藏发展原则 保存原则 存取原则 机构和资助者的原则
2.2.4 哈佛大学图书馆(1)
步骤 决策内容
1
信息资源应该具有足够的内在价值以确保用户对其数字化
形式感兴趣
2
数字化能够大大提高用户对资源的存取,能够增加特定用
户群的使用频率。
3
数字化至少应该实现下述目标之一:
●保存。数字化版本可以替代处于危险状态的其他载体, 或减少对易碎和有价值的载体的操作;
●改善知识控制。如,能够生成数字图像的检索帮助链接, 生成与书目记录相链接的索引。
• 印刷型文本数字扫描质量控制 • 手稿类信息资源数字扫描质量控制 • 连续色调型信息资源数字化质量控制 • 半连续色调型信息资源数字化质量控
制
印刷型文本数字扫描质量控制
印刷型文本信息资源数字扫描质量等级描述与QI值对应表
质量等级描述 优(优秀)
西文印刷型文本 扫描后的数字图 像的QI的值
8.0
中文印刷型文本 扫描后的数字图 像的QI的值
项目外包 自动化:机械自动化 、基于软件
的自动化 优化数字化生产流程 强化质量管理
1.3 产权许可
产权状态:免产权许可、产权归项目实施单位所 有、产权归他人所有(如GOOGLE数字图书馆)
产权许可及产权延伸许可 产权保护:
(1)产权保护的法律文件方式:产权声明、 不承诺声明、链接方针、使用条件 、隐私保护