当前位置:
文档之家› 一种基于偏微分方程的文本图像版面分割方法
一种基于偏微分方程的文本图像版面分割方法
K e o d d c m e m a e; Ho g r n fr ; i g e m e t t n;p rild fe e ta q ain y w r s: o u nti g u h ta so m ma e s g n a i o a ta ifr n ile u to
应 的偏微 分模 型 , 然后 求解 该偏 微 分方 程 , 程 的解就 是所 希望 的结果 。 方 本 文算法 先 采用 H u h变 换来 进行 文本 倾斜 的检 测和 校正 , 根 据本 文 提 出 的投 影直 方 图法 自适 应 og 再 地确 定 文本行 的间距 , 后应 用偏 微分 方程 方法 对文本 图像 进行 分割 , 得 了较 好 的效果 。 之 取
字 区加 以分 割和 区别 。图像分 割是 文本 图像 处理 中一 项 重要 且 低层 的处理 任 务 , 割 质量 的好 坏 对 后续 分 任务 有很 大 的影 响 。
近年 来人 们 提 出了基 于偏 微分 方程 的 图像分 割方 法
。其 基本 思想 是根 据 图像 分 割 的要求 构建 相
第1 2卷 第 6期
21 0 1年 1 月 2
信 息 工 程 大 学 学 报
J u n lo n o ma in En i e rn o r a fI fr t g n e i g Unie st o v ri y
Vo . 2 No 6 11 . De . 方 程 的文 本 图像 版 面 分 割方 法
周 林 , 西建 , 平 童 莉
( 息 工 程 大 学 信 息 工 程 学 院 , 南 郑 州 4 00 ) 信 河 5 0 2
摘要 : 了能有效 分 割版 面复 杂 的文本 图像 , 出 了一种新 的文本 图像 分 割算 法。该 算 法先采 为 提
用 H uh变换 来进 行 文本 倾斜 的检 测和 校 正 , og 再根 据 本 文提 出的投 影 直 方 图法 自适 应 地确 定
文本 行 的 间距 , 之后 应用 偏微 分 方程方 法对 文本 图像 进 行 分 割。最 后 通过 实例 阐 明 了该 算法
的有效 性 。
关键 词 : 本 图像 ; o g 文 H u h变换 ; 图像 分 割 ; 偏微 分方 程
Z H0U L n I —in.T i .P NG Xi a j 0NG L i
( n tueo If ma o n ie r g Ifr a o n ier gU ie i , h n zo 5 0 2 C ia Is tt f no t n E g ei , nom t nE g ei nvr t Z e gh u4 0 0 , h ) i r i n n i n n sy n
中图分 类号 : P 9 . 1 T 3 1 4 文献 标识 码 : A 文章 编 号 :6 1 0 7 (0 1 0 0 1 0 1 7 — 6 3 2 1 )6— 7 9— 5
D o um e t I a e S g e t to a e n Pa ta if r n i lEq to s c n m g e m n a i n B s d o r i lD fe e ta ua i n
1 基 于 偏 微 分 方 程 的 图像 分 割
目前 基于 偏微 分方 程 的 图像 分 割 主要是 采用 活动 轮廓 ( ci o t r 模 型来 实现 。其基 本思 想是 将 at ecno ) v u
图像 分割 问题 归结 为 最小 化一 个封 闭 曲线 C p 的 “ 量 ” 函 : () 能 泛
grh oi m,H uh t nfr su e o e e dn ou n m g s rjc o i orm m t d i t o g r s m i sd f m n igd cmeti ae ,po t n hs g e o s a o r ei t a h
a p id t e h p c fc a a tr r ws, a d p rild fe e ta qu to r t ie o s g n p le o g tt e s a e o h r c e o n a t ifr n il e ain a e u i z d t e me t a l d c m e m a e . Ex rm e a e ut h w h fe tv n s n c u a y o h l o i m . o u nti g s pe i ntlrs l s o te efc ie e s a d a c r c fte ag rt s h
相对 于传 统 的纸 张文 件 , 电子 文件 不仅 存储 安全 , 而且 检索 方便 、 传输 快捷 。 因此 , 现有 的纸 张文件 将
转换 成 电子 文件 具有 非常 重要 的实 际意义 , 但要 完成 这 种转 换 , 必须 对 文本 页 面进 行理 解 。众 所 周知 , 现 有光 字符 识别 系 统 ( C 只 能对 文字 部 分进行 识 别 , O R) 然而 , 由于文 本 图像 的页 面形 式可 以多种 多样 , 可能 包含 图片 、 图表 等非 文字 区域 , 因此 为 了提 高文字 识别 的效 果 , 必要 在进 行字 符识 别前 , 有 将文 字 区和非文
Absr c : ne s g e t t n ag rt t a t A w e m n a i l o i o hm fc mp e a o td c me ti a e sp o o e o o lx l y u o u n m g s i r p s d. I h sa - n t i l