当前位置:文档之家› 基于数据挖掘技术的软件缺陷检测方法研究

基于数据挖掘技术的软件缺陷检测方法研究

实用 性差 。
输出: 包含 目前为止得到的所有频繁连通子图C M A 的集合
方法:
f r o X ∈P d o
败 、阿 丽亚 娜 号 航 天火 箭 的爆 炸 …等 。为
其加 以控制 。 检 测 软 件 缺 陷 ,通 常 指 检 查 代 码 缺
态测 试 和静 态 分析 。程 序 语 义分 析 方法 是


从 C中移 除 既 非 频繁 又 非 次优 频 繁子 图的C M A
F S — x lr ( w ) F M E po e e



静态 分 析常 用 的一 种 分析 技 术 。它通 过 分 掘 算 法H F M ( i h p r o m n e a t F S H g — e f r a c ) + c F M J i ( y
e d fr n o
陷 ,其 方法 有 很 多种 ,包 括 人工 审 查 、动 算 法存 在 的 问题 ,本文 在经 典 的算 法F S FM
的基 础 上 , 提 出 了 一种 新 的 频 繁 子 图 挖
C+ C F S — xe s o ( ,) - w F M E tn i n X r
析程 序 的控 制 流和 数据 流 以及 函数 调用 关 F eun ug ah Mn n ) 。本 文 的主 r qe t S br p iig 系等 计 算程 序 的 多种语 义 表 示 ,如 调用 图 要 工作概述 如下 :


e d i n f
e d o n f r :
I 发展……………………… .


基 于数 据挖 掘技 术 的软件 缺 陷检 测 方法 研 究
华 中科技 大学计算机科 学与技 术学院

雷 珂 何

【 摘要 】针对 经典频繁子图挖掘算法F s F M at r un brp s Fe e t u gahMh q S 园无法处理有向多重图、无法得 到有 向频繁子 图和大量的虚假警报的缺点,在其基础 上提 出
2 FS算 法介 绍 .FM F S 算 法使 用邻 接矩 阵表 示 图,按 照 FM 的下 三 角 ,包括 对角 线 ,将 得 到 的串表 达
分 析工 具 的 效率 、 性能 的关 键 也就 是频 繁 从 上 到 下 ,从左 到右 的顺序 扫描 邻 接矩 阵 F S 算 法 是 基 于 模 式 增 长 方 法 式称 为 图的 代码 ,将 最 大 的代码 称 为 图的 F M 的 。 它 与 目前 主 流 的 频 繁 子 图挖 掘 算 法 规 范 表示 ,并把 相应 的邻接 矩 阵称 为 图的 A G 、F G3 g p n4 方 法相 比 ,时 C ( a o i a d a e c a r x 。 oM J S L ̄ S a 1等 ] M A C nn clA jcn yMt i ) 间 复 杂 度 最 优 、 挖 掘 效 率 最 高 。 它 使 用 F S 算 法 的基 本思 想如下 : FM
图1 F S 算法的核 心思想 FM
和依 赖 图 ,来 辅助 软件 审查 。这 种 方法 最 大 的优 点就 是 不 必执 行 目标 程序 ,就可 以
提 出一 种将 有 向标 记 图等价 转换 为 无 向标记 图的方 法 ,即 该方 法 可 以在有 向图
通 过扫 描 并分 析程 序 的源 代 码并 查 找代 码 转 换 为无 向 图之 后保 留 原 图边 的方 向性 。 中 的特 定模 式 ( 以理解 为 编程 规 则 )集 而 且该方 法简 单、通用 、可移 植 。 可 合 ,较 早地 发现程 序代码 中的缺陷 。 最 新 的静态 分 析工 具将 数据 挖 掘技 术 基 于经 典频 繁子 图挖掘 算法 FS ,提 FM 出一个 能 处理 有 向多 重 图并 得到 有 向频 繁
保证 软 件 的质 量 ,必 须检 测软 件 缺 陷并对 表 征规 则 ,无 法应 用 到软 件缺 陷 检测 中 ,
: :
i ( . sA ) t e fX iCM h n + ∥u _ 咖 , _ C+ 0
fr o y ∈P d 0
: r

针 对 上 述 提 出 的经 典频 繁 子 图挖 掘
( 常 是频 繁 子 图挖 掘 算法 )与 程序 分 析 子 图 的 ,LF S 效率 更 优 的频繁 子 图挖 掘 通 kF M
相 结合 。为 了构造 一 个针 对 某一 种 类型 的 算 法H F M FS 。 软 件缺 陷 的 高效 的静 态 分析 工 具 ,必须 使 用 适 当 的频繁 子 图挖 掘 算法 。而 该 类静 态 子 图挖掘 算法 。
图并输 出有向频繁子图,并且减少 了算法应用 时的虚假警报 ,在算法效率上略有提高,而边 的方 向上的改进大大提高 了算法的整体表现和实用性。
1 引言 .
能存在 一条 以上 的边 ):
算法;F S —x l r FM E p o e
输入: :


随着 软件 应 用规 模 的 日益扩 大和 软件
应用 环 境 的 日益复 杂 , 因为软 件 质量 导 致
只 能处理无 向 图;
F S — x e s o 需要对 边和 节 点进 行 F ME t n in
j i
个次优CM A 链表 U 频 繁 连通 子 图 的C M 合 W A集

: : ;
的事 故 给人 们 造成 的损 失 越来 越 多 ,后 果 枚举 ,效率 低 ; 也越 来越 严 重 , 比如I M 6 操作 系 统的 失 B30 无法 输 出有 向频繁 子 图。 F S挖 掘得 到 的频 繁子 图无 法准 确地 FM
种新的频繁子挖掘算法HF s H epr r ne at r un Sbr hMit FM(i f eomac sFe etuga f1 — f F q p 1酋。通过实验对比分析HF s i FM和F s 明, FM算法 能够很好地处理有向多重 FM表 HF s
【 关键词 】频繁子图挖掘算法 ;软件缺 陷检测 ;静 态分析 ;深度优先搜索;程 序依赖 图
相关主题