条码识别技术基础知识..
1
条码技术的特点
自由度大。识别装置与条码标签相对位置的自由度要比OCR大得 多。条码通常只在一维方向上表达信息,而同一条码上所表示的 信息完全相同并且连续,这样即使是标签有部分缺欠,仍可以从 正常部分输入正确的信息。
最后,也是最重要的特点,条码自动识别系统所涉及到的识别符 号成本以及设备成本都非常低。特别是条码符号,即使是一次性 使用,也不会带来多少附加成本,尤其是在大批量印刷的情况 下。这一特点使得条码技术在某些应用领域有着无可比拟的优 势。再者,条码符号识读设备的结构简单,成本低廉,操作容 易,适用于众多的领域和工作场合。
条码是一种信息代码,通常是一种黑白条纹表示的特殊代码,反映信息的 条码也应信息的分类编码原则。了解这些信息的分类方法和编码的代码选 择,将有助于我们了解和研究条码的编制原理,以及对物品条码的具体编 制方法。 1、编码方法
条码是利用条纹和间隔或宽窄条纹(间隔)构成二进制的“0”和“1”,并 以它们的组合来表示某个数字或字符,反映某种信息的。但不同码制的条 码在编码方式上却有所不同。一般有以下两种:
15
1、 编码方法
(1)宽度调节编码法 宽度调节编码法即条码符号中的条和空由宽、窄两种单元组成的条码 编码方法。 按照这种方式编码时,是以窄单元(条纹或间隔)表示逻辑值“0”, 宽元素(条纹或间隔)表示逻辑值“l”。宽单元通常是窄单元的2~3 倍。对于相邻的二进制数位,由条纹到间隔或由间隔到条纹,均存在 明显的印刷界限。
图4-4 模块组合法条码字符的构成
18
2、 编码容量
每个码制有一定的编码容量,这是由其编码方法决定的。编码容量先治疗 条码字符集中所能包含的字符个数的最大值。
对于用宽度调节法编码的,仅有两种宽度单元的条码符号,即编码容量 为: C(n,k),这里,C(n,k)=n(n-1)…(n-k+1)/k!。其中, n是每一条码字符中所包含的单元总数,k是宽单元或窄单元的数量。
3
1、 基本概念
(2)代码(code)
代码即一组用来表征客观事物的一个或一组有序的符号。 代码必须具备鉴别功能,即在一个信息分类编码标准中,一个代码只能 惟一地标识一个分类对象,而一个分类对象只能有一个惟一的代码,比 如按国家标准“人的性别代码”规定,代码“1”表示男性,代码“2”表 示女性,而且这种表示是惟一的。 我们在对项目进行标识时,首先要根据一定的编码规则为其分配一个代 码,然后再用相应的条码符号将其表示出来。 如图4-1所示,图中的阿拉伯数字6902018994262即 是该瓶古井贡酒的商品标识代码,而在其上方由条和 空组成的条码符号则是该代码的符号表示。
4
1、 基本概念
在不同的应用系统中,代码可以有含义,也可以无含义,有含义代码可 以表示一定的信息属性,如:某厂的产品有多种系列,
其中代码60000-69999是电器类产品; 70000-79999为汤奶锅类产品; 80000-89999为压力锅类炊具等等, 从编码的规律可以看出,代码的第一位代表了产品的分类信息,是有含 义的。 无含义代码则只作为分类对象的惟一标识,只代替对象的名称,而不提 供对象的任何其他信息。
有些类型的条码,由于从两个方向扫描起始符和终止符所产生的数字 脉冲信号完全相同,所以无法用它们来判别扫描方向,例如EAN和 UPC码,在这种情况下,扫描方向的判别则是通过条码数据符的特定 组合来完成的。
10
1、 基本概念
(8)自校验特性 条码符号的自校验特性是指条码字符本身具有校验特性。
(9)条码符号的密度 条码符号的密度是指单位长度上所含有的条码字符的个数。 显然,对于任何一种码制来说,各单元的宽度越小,条码符号的密度就 越高,也就越节约印刷面积。但由于印刷条件及扫描条件的限制,我们 很难把条码符号的密度做得太高。 39条码的最高密度为9.4个每25.4毫米(9.4个每英寸);库德巴条码的 最高密度为10.0个每25.4毫米(10.0个每英寸);交叉25条码的最高密 度为:•17.7个每25.4mm(17.7个每英寸)。 对于一种条码符号,密度越高,所需扫描设备的分辨率也就越高,而随 着扫描设备分辨率的增加,设备对印刷缺陷的敏感程度也就越高。
第4章 条码识别技术基础知识
条码技术的特点
简单。条码符号制作容易,扫描操作简单易行。 信息采集速度快。普通计算机的键盘录入速度是200字符每分钟,• 而利用条码扫描录入信息的速度是用键盘录入的20倍。 可靠性高。键盘录入数据,误码率为三百分之一,利用光学字符识 别技术,误码率约为万分之一,而采用条码扫描录入方式,误码率 仅有百万分之一。 灵活、实用。条码符号作为一种识别手段可以单独使用,也可以和 有关设备组成识别系统实现自动化识别,还可和其他控制设备联系 起来实现整个系统的自动化管理。同时,在没有自动识别设备时, 也可实现手工键盘输入。
9
1、 基本概念
(7)双向可读性 条码符号的双向可读性,是指从左、右两侧开始扫描都可被识别的特 性。绝大多数码制都可双向识读,所以都具有双向可读性。
事实上,双向可读性不仅仅是条码符号本身的特性,它也是条码符号 和扫描设备的综合特性。对于双向可读的条码,识读过程中译码器需 要判别扫描方向。 有些类型的条码符号,其扫描方向的判定是通过起始符与终止符来完 成的,例如39码、交插25码、库德巴条码。
8
1、 基本概念
(6)定长条码与非定长条码 定长条码是指仅能表示固定字符个数的条码;非定长条码是指能表示可变字 符格式的条码。 例如:EAN、UPC码是定长条码(其中EAN13仅能表示13• 个字符),39码 为非定长条码。 定长条码由于限制了表示字符的个数,所以译码的误读率相对较低(就一个 完整的条码符号而言,任何信息的丢失都会导致译码的失败); 非定长条码具有灵活、方便等优点,但受扫描器及印刷面积的限制,它不能 表示任意多个字符,并且在扫描阅读过程中会因信息丢失而导致译码错误。
39条码、库德巴条码及交插25条码均属宽度调节型条码。下面以交插 25条码为例,简要介绍宽度调节型条码的编码方法。
16
1、编码方法
25条码是一种只有条表示信息的非连续型条码。条码字符由规则 裴烈的5个条构成,其中有两个宽单元,其余是窄单元。宽单元 一般是窄单元的三倍,宽单元表示二进制的 “1”,窄单元表示二 进制的“0”。 图4-3是25码的一个示例。
7
1、 基本概念
(5)连续性与非连续性
条码符号的连续性是指每个条码 字符之间不存在间隔;
相反,非连续性是指每个条码字符 之间存在间隔。 条码不存在条码字符间隔,所以密度相对较高; 而非连续性条码的密度相对较低,但非连续性条码字符间隔会引起较大误 差,一般规范不给出具体指标限制。 另外,对连续性条码除了控制调控的尺寸误差外,还需控制相邻条与条,空 与空的相同边缘间的尺寸误差及每一条码字符的尺寸误差。
例如39条码、库德巴条码、交插25条码都具有自校验功能;EAN和 UPC条码、93条码、矩阵•25条码等都没有自校验功能。
自校验功能也能校验出一些印刷缺陷。• 对于某种码制,是否具有自校 验功能是由其编码结构决定的。• 码制设计者在设计条码符号时,就已 经确定了该条码是否有此功能。
11
1、 基本概念
例如,39条码,它的每个条码字符由9个单元组成,其中3个是宽单元,其 余是窄单元,那么,其编码容量为: C(9,3)=9×8×7/(3×2×1)=84
19
2、 编码容量
对于用模块组配的条码符号,若每个条码字符包含的模块是恒定的,其编码 容量为C(n-1,2k-1),其中n为每一条码字符中包含模块的总数,k是每一 条码字符中条或空的数量,k应满足1≤k≤n/2。 例如93条码,它的每个条码字符中包含9个模块,每个条码字符中的条的 数量为3个,其编码容量为: C(9-1,2×3-1)=8×7×6×5×4/(5×4×3×2×1)=56 一般情况下,条码字符集中所表示的字符数量小于条码字符的编码容量。 3、纠错方式 为了保证正确识读,条码一般具有校验功能或纠错功能。一维码一般具有 校验功能,即通过字符的校验来防止错误识读。
图4-3 字符为“1”的25条码结构
17
1、编码方法
(2)模块组配编码法 模块组和法是指条码符号中,条和空是由标准宽度的模块组合而成。一个标注 宽度的条模块标识二进制的“1”,而一个标准宽度的空模块标识二进制的 “0”。 EAN条码、UPC条码均属模块式组合 型条码。商品条码模块的标准宽度是 0.33mm,它的一个字符由2个条和2个 空构成,每一个条或空由1~4个标准宽 度的模块组成,每一个条码字符的总模 块数为7。 凡是在字符间用空隔(位空)分开的条 码,称为离散码。凡是在字符间不存在 间隔(位空)的条码,称为连续码。模 块组合法条码字符的构成如图所具有纠错功能,这种功能使得二维条码在有局部破损的情况 下仍可被正确地识读出来。
20
3、 纠错方式
(1) 一维码的校验方法 一维码的编码方法通常采用二进制算法。例如,在国标中规定。每一个条 码字符由2个条和2个空构成,每一条或空由1~4个模块组成,每一个条码 字符的总模块为7,用二进制“1”标识条的模块,用二进制“0”标识空的模 块,如图4-5所示。 一维码在纠错上主要采用校 验码的方法。即从代码位置序 号第二位开始,所有的偶 (奇)数的数字代码求和的方 法来校验条码的正确性。校验 的目的是保证条空比的正确 性。校验码算法有很多种,将 在后续章节中加以介绍。