当前位置:
文档之家› 一种基于先验信息BPSO的基因选择方法
一种基于先验信息BPSO的基因选择方法
一种基于先验信息 B P S O 的基因选择方法
杨 春, 韩 飞
( ) 江苏大学 计算机科学与通信工程学院 , 江苏 镇江 2 1 2 0 1 3
摘 要: 针对如何提高所选基因子集的可解释性和分类性能 , 提出一种耦合先验信息二进制微粒群算法 ( 的基 B P S O)
) 信息和基因调 控 ( 信息分别耦合进两个相互独立的共享全局最优位置的 B 因选择方法 。 基因灵敏度 ( G C S G R) P S O 过程中 , 主要利用先验约束进行粒子群初始化 、 粒子更新 、 限制最大 速 度 和 自 适 应 变 异 操 作 。 在 两 个 公 开 微 阵 列 数 据 由于 G 新方法选出的基因数目较少但具有较强的分类能力 。 集上的实验表明 , C S和 G R 信息的约束 ,
[] 基于 E 比基于 F i l t e r的 好 2 ; m b e d d e d的 方 法 将 基 因 子 集
0 引言
所选 的搜索和评价过程完全耦合到构建分类器的过程中 , 择的基因具有很低的可解释性 。 W r a e r法因其直 接 使 用 分 类 器 分 类 性 能 作 为 特 征 p p 从而可以选择出高分类预测率的基 因 的 子集的评价标准 , 优点 , 受到越来越多研究人员的青睐 。 许多基于群体 随 机 优化的特征子 集 搜 索 算 法 已 经 被 广 泛 地 应 用 在 W r a e r p p [ 3] , 、 法 中, 包括: 遗传算法( 模拟退 G e n e t i c a l o r i t h m s G A) g 动计算机图形学及 3 D 动画产业更好发展 。
)为激励 函 数 , · 加法型隐层节点网络中可选作任意有 g( 界非常数分段连续函数 , 本文中采用 s i m o i d 函数 。 g
2 耦合先验信息 B P S O 算法的基因选择方法
2. 1 基因灵敏度信息
从单个基因对分类 器 输 出 的 直 接 影 响 程 度 来 去 除 冗 这种方法称为基于分类模型的灵敏度分析 。 下 面 余基因 , 给出基于单 隐 层 前 馈 神 经 网 络 的 E LM 基 因 类 别 灵 敏 度 信息定义 。 , 在训练集样本 XT LM 网络结构可得第 r a i n i n g 中 利用 E i个输入对所有输出的灵敏度 :
m
基因子集 。 实验结果表明 , 本文提出的方法能够有效 而 快 速地选取具有低冗余度且高识别率的基因子集 。
)= S( i ) 式有 : 2 根据 (
m L
x∈ห้องสมุดไป่ตู้T r a i n i n g
∑ ∑
t=1
(
y i t ) x i
( ) 3
1 相关理论基础
)= S( i
x∈XT r a i n i n g
·3 7·
, 等 。 相比于遗传算法 , t i m i z a t i o n P S O) P S O 算法 需 要 调 整 6] ; 的参数少 , 因而 简 洁 、 收 敛 速 度 更 快, 更 易 实 现[ 相比于 [ 7] 模拟退火算法 , P S O 算法更易收敛于全局最优点 。 二 进 是P 制微粒群算法 ( B i n a r P S O, B P S O) S O 的一个离散版 y 用于处 理 离 散 空 间 的 组 合 优 化 问 题 。 然 而 所 有 P 本, S O 算法都容易 失 去 粒 子 多 样 性 , 从而在收敛时陷入局部最 即“ 过早熟 ” 现 象。其 主 要 原 因 在 于 P 优, S O 进化过程中 随机因素太多 , 缺乏实际有效的先验信息对粒子的初 始 化 和进化运动进行约束和方向性引导 。 为了有效利用 先 验 信 息 来 指 导 P 提 S O 的 粒 子 进 化, 高所选基因子集的 识 别 率 , 增 加 所 选 基 因 的 可 解 释 性, 文 ] 提出了耦合 G 献[ 1 6 C S 信息 B P S O 的 基 因 选 择 方 法( B P - 。由 于 仅 考 虑 一 种 先 验 信 息, 容易出 S O-G C S I -E LM) 现先验信息过于主 导 选 择 过 程 的 现 象 , 且 耦 合 程 度 不 高。 本文在 B 基因灵敏度( P S O 中耦合两 种 先 验 信 息 : G e n e -
关键词 : 基因选择 ; 基因灵敏度 ; 基因调控 ; 二进制微粒群 : / D O I1 0. 1 1 9 0 7r d k. 1 5 1 3 8 5 j ( ) 中图分类号 : T P 3 0 1 文献标识码 : A 文章编号 : 1 6 7 2 7 8 0 0 2 0 1 5 0 0 7 0 0 3 6 0 5 - - - 序, 从而进行筛选 ; 基于 W a r e r的 方 法 将 分 类 算 法 嵌 入 p p 并不断地反馈 分 类 器 的 分 类 准 确 率 作 为 评 价 准 则 , 其中 , 将分类决策和特征选择耦合在一起 , 该方法的分类效 果 要 基因表达 谱 数 据 已 经 广 泛 应 用 于 疾 病 诊 断 和 预 测 。 但是基因表达谱数 据 具 有 高 维 度 、 小 样 本 的 特 点, 存在大 量冗余基因信息 。 因此 , 采用基因选择方法去除冗余 基 因 是十分必要的 。 根据基因选择过程中是否有分类器的参与 , 基因 选 择 方法通常可以分为基于 F 基于 W l i t e r的 方 法 、 a r e r的 方 p p [ 1] 。 基于 F 法和基于 E m b e d d e d 的方法 3 类 i l t e r的 方 法 通 常根据某种 规 则 , 给每一个基因作一个重要性度量的排
), · 对于任意 的 W 、 存 在 一 个 输 出 权 值 矩 阵β, 使 B, g( [ 3 6] 。 能够以零误差逼 近 这 个 样 本 的 数 得S L F N s N E LM 学模型为 :
L
y i =
, …, w ·x +b ) i= 1, N ∑βg(
k k i k
k=1
( ) 2
T …, 是连接第 w1 w2 wn 其中 wk = [ k, k, k ] 为输入权重 , ; k 个隐层节点与所有n 个输入节点的权重向量 β k = [ k 1, β T …, 是 连 接 第k 个 隐 层 节 点 与 所 有 k 2, k m ] 为输出权 重 , β β m 个输出 节 点 的 权 重 向 量 ; b k 为 第k 个 隐 层 节 点 偏 置 ,
[ [ ] [ ] ] ) ; i s u a l - >v e r t e x v i s u a l -> i n d e x l o o . v 1 . z v p ( [ i s u a l- >t e x t u r ev i s u a l- >i n d e x l T e x C o o r d 2 fv g [ ] [ ] ] , l o o . t 2 . u p [ [ ] [ ] ] ) ; i s u a l -> t e x t u r e v i s u a l -> i n d e x l o o . t 2 . v v p ( [ [ v i s u a l - >v e r t e x v i s u a l -> i n d e x l o o . l V e r t e x 3 d g p] [ ] ] , v 2 . x [ [ ] [ ] ] , i s u a l - >v e r t e x v i s u a l -> i n d e x l o o . v 2 . v p y [ [ ] [ ] ] ) ; i s u a l - >v e r t e x v i s u a l -> i n d e x l o o . v 2 . z v p } ( ) l E n d g
第 7 期 杨 春 , 韩 飞: 一种基于先验信息 B P S O 的基因选择方法
[ 4] ) 、 火算法 ( 蚁群算法 ( S i m u l a t e d a n n e a l i n A n t c o l o n o - g y p [ ] 5 , ) ( 和微粒群优化算法 t i m i z a t i o nA C O P a r t i c l e s w a r m o - p
) ) ( ) ) ) H i d( k 1-g( H i d( k w βg( ∑ ∑ ∑(
k t
t=1 k=1 n
(
i k
))
1. 1 B P S O 算法
[0] 于1 K e n n e d b e r h a r t1 9 9 7 年提出了二进 制 粒 子 y与 E 。 群算 法 ( B i n a r P a r t i c l e S w a r m O t i m i z a t i o n ,B P S O) y p 在该算法中 , 粒子 位 置 的 每 一 位 被 限 制 为 1 或 0, 对速度
8] , ) 信息 [ 和 基 因 调 控( t o -c l a s s s e n s i t i v i t G C S G e n e i n t e r - y , 信 息, 同时选取极限学习机( a c t i o n r e u l a t i o n G R) E x - g [ 9] , ) 作 为 分 类 器 评 价 所 选 的 t r e m e l e a r n i n m a c h i n eE LM g
5 结语
本文介绍了以 O 其方 法 分 e n G L 为基础的贴图操作 , p 为在平面上贴纹理 和 为 网 格 模 型 添 加 纹 理 两 种 。 纹 理 贴 其应用 将 推 图操作是处理计算机图形中十分常用的操作 ,
) 基金项目 : 国家自然科学基金资助项目 ( 6 1 2 7 1 3 8 5
参考文献 :
[ ] , 第四 1 HR E I N E R D, WO O M, N E I D E R J e t a l . O e n G L 编程指南 ( S p [ 版) 邓郑祥 , 译 .北京 : 人民邮电出版社 , M] . 2 0 0 5, 1 3. - [ ] [ 第二版) 2 I GHT R S J R, SWE E T M.O e n G L 超级宝典( M] . WR p 潇湘工作室 , 译 .北京 : 人民邮电出版社 , 2 0 0 1, 3 1 3 2. - [ ] [ 第二版) 3 C K I NG K, A S T O R D. O e n G L游戏程序设计( M] . HO p 田昱川 , 译 .北京 : 科学出版社 , 2 0 0 6, 1 6 7 1 7 0. - [ ] ( 计算机图形学 ( 第3 版 ) 4 I L L F S J R, K E L L E Y S M. O e n G L 版) H p [ 刘 利 刚, 刘 永 进, 等, 译. 北 京: 清 华 大 学 出 版 社, M] .胡事 民 , 2 0 0 9, 3 6 7 3 6 9. - [ ] 姚国 清 .三 维 模 型 文 件 中 的 O 5 B J格 式 在 O e n G L中的输 王金峰 , p ] ( ) : 电脑知识与技术 , 入与处理 [ J . 2 0 1 1 7 2 3 9 3 2 3 9 9. - [ ] , , 基于 O 6 周德 芳 刘 京 南 余 玲 玲 . e n G L实现三维重构点云处理 p [ ] ( ) : J .计算机应用 , 2 0 0 3 2 9 1 3. - ( 责任编辑 : 陈福时 )