当前位置:文档之家› 交互移动窗口因子分析法(AMWFA)用于二维数据重叠色谱峰的比较分析

交互移动窗口因子分析法(AMWFA)用于二维数据重叠色谱峰的比较分析

!"#$ %&
% ) ) * 年 (( 月
高等学校化学学报 +
+ + + + + ,-./0,12 3456’12 47 ,-0’.8. 5’0!.68090.8+ + + + + +
’"$ ((
%):% ; %)::
交互移动窗口因子分析法 ( !"#$!) 用于 二维数据重叠色谱峰的比较分析
易伦朝,梁逸曾,曾仲大,袁大林,王+ 平
( 中南大学化学化工学院中药现代化研究所,长沙 <())=> ) ( 1/?71) ,通过挖掘两个体系中的选择性信息,获得了不同样本间的 摘要+ 采用交互移动窗口因子分析法 共有组分数,还同时得到了各物质对应的光谱或质谱信息$ 详细阐述了本法的原理和计算方法,并用一个模 拟的 @,A/8 数据对方法进行了验证$ 关键词+ 交互移动窗口因子分析法 ( 1/?71) ;气相色谱A质谱联用;比较分析 中图分类号+ 4*:&+ + + + 文献标识码+ 1+ + + + 文章编号+ )%:(A)&B) ( %))* ) ((A%):%A)<
( ( ( ( ( ( ( % ! ,’ ! ) ! & & $% ! ’ &’ ! ( ( $ ! % ( ! $ $% ! ) ’ ! & &’ ! ’ $ % ! $ &’ ! ! ( ( (# ’ %( " " ( ! & #, $ ,…,’) $ ’ $%( ! $ &’ ! ) $ ! $ &’ ! )
> " 8& 共有组分纯质谱解析 获得了两个体系中的共有组分数,并解析了物质的纯质谱" 根据 $567$ 法,在共有组分数为 ; 的区域,可以从其特征向量中获取对应的纯质谱" 以 ! 中的 <! = >? 区域为基矩阵,用移动窗口技术对 " 矩阵中 <? = ;@@ 2 区域进行扫描 ( 移动窗口数为 ! ) ,得到保留时间与共有组分数关系的共有组分秩 图 [ 见图 ? ( 8) ] " 在移动窗口扫描过程中,通过公式 # A
收稿日期: %)):A(%A>)$ 基金项目: 国家自然科学基金重点项目 ( 批准号: %)%>:)%) ) 资助$ 联系人简介:梁逸曾 ( (B:) 年出生),男,教授,博士生导师,从事化学计量学和中药现代化研究$ .ACDE#:FEGHIJK#EDIJL %*>M IHN
万方数据
" ->% ##
! !" $"
A
! #$ %$
A &’ ( )* ,得到各个时间
点的质谱和相邻两点质谱的相似度" 以相似度和保留时间作图,得到质谱自相关曲线 [ 见图 ? ( $) ] " 在共有组分秩图中,可以获得 ! 个共有组分数为 ; 的区域 ( <! = !> , B; = B# 和 C# = >? 2 ) " 其对应的质 谱自相关曲线也出现了 ! 个平台,且相似度几乎为 ;" 可从这 ! 个平台中的任意一点分别提取共有组 (见 分的纯质谱,即组分 ; ,组分 < 和组分 ! 的质谱" 解析出的质谱与 DE%F;@G 库中的标准质谱比较 图 B) ,可以看出解析结果非常准确" 这 ! 个物质的质谱本身非常相似,相似度均达到 @H >C 以上" 可 见,$567$ 法对于色谱重叠严重且质谱非常相似的体系,也能够得到很好的解析结果"
( ( ( ( ( ( ( ( ( (
(
(
" " 因为 ! ! 为 + 和 , 的共有组分,故 % ! 和 ’ ! 是矩阵 $ && $ 和 & $$ & 的特征向量,且具有唯一的 $ ,…,’) % 若+和, 特征值% 若 + 和 , 有 ’ 个共有组分,就有 ’ 个值为 # 或接近 # 的特征值 )( ! ! ! #, 没有共有组分,则 ) ! 值将远小于 # , ( ( % ! ,’ ! ) 值接近 $% 总之,特征值 ) ! 的个数与共有组分数相同% ! % "# 共有组分纯质谱解析 ( # )共有组分秩图% 采用移动窗口技术对目标矩阵进行扫描,得到色谱保留时间与特征值 ) ! 关系 的共有组分秩图% ( $ )质谱自相关曲线% 在移动窗口扫描过程中,通过公式 ! !
( / .0) ( 1 $2 ) . & + , -.
$ $
(C)
式中, +, 2 和 0 分别代表峰高、 峰宽和峰的位置, 具体参数见表 #% 色谱保留时间 / 的范围是 # 2 #$0 F%
$%&’( !# $)( *%+%,(-(+. /0 (12 ( 3 )45+ -)( ./,6’%-/50 54 7)+5,%-58+%*)/7 *+54/’(.
/GFH5I K8H8 + ?>IJ>=5=H # $ * + $0 ,0 A 2 C% , 1% 0 ,% , 0 +, C* A0 /GFH5I K8H8 , ?>IJ>=5=H # $ * + ** * $, 2 C% , ,% 0 C% 0 0 +C C1 1A
" % "# 模拟的二维数据 模拟的 D?:L/ 数据 + 和 , 根据公式 + ! 34 ( ) * 得到% 噪声 * 为正态分布的随机矩阵%
复杂多组分体系的研究 ( 如代谢组学和中药研究等) 已成为当今的热点研究课题,由此产生了大量 复杂的二维重叠峰数据$ 最近十几年,多种化学计量学分辨方法,如:渐进因子分析法 ( .O"#OEIJ PDQN"R
[ (] [ %] DID#FSES,.71) 、直观推导式演进特征投影法 ( -HTRESNEQ HO"#OEIJ #DNHIN UR"VHQNE"IS,-.2W) 和子窗口 [ >] 因子分析法 ( 8TXYEIZ"Y PDQN"R DID#FSES,871) 等相继被建立$ 同时,用于不同复杂体系组分比较分析 [ <] 的多组分光谱相关色谱法 ( /T#NEQ"CU"IHIN SUHQNRD# Q"RRH#DNEOH Q[R"CDN"JRDU[F ,/8,, ) 也应运而生$ 这 [ :] 些方法已被广泛应用于实际体系中,并成功地解决了许多实际问题 $ [ *] 交互移动窗口因子分析法 ( 1#NHRIDNEOH C"OEIJ YEIZ"Y PDQN"R DID#FSES,1/?71) 使用移动窗口技术
9# 结果与讨论
9 % !# 数据的共有秩分析 ( @) 和 ( M) % + 和 , 均是重叠 模拟的一组 D?:L/ 数据矩阵分别设为 + 和 ,,其总离子流图见图 # 严重的复杂体系% 考察两体系之间化学成分的对应关系,采用 L/?? 法,即以 + 为基矩阵,对 , 进行 投影,结果见图 $ ( @) % 同理,对矩阵进行反投影 ( .N:L/?? 法) ,即以 , 为基矩阵,对 + 进行投影,结 果见图 $ ( M) % 图$ ( @) 和 ( M) 均是完美的 “ 井” 形,说明 + 和 , 中的物质组成相同% 为进一步确定两个 数据中的共有组分数,使用 @LOP@ 法进行共有秩分析% 图 * 万方数据 为共有秩分析的结果,其中 5 轴为公式 ($) 中的 ( ( % ! ,’ ! ) 值% 图 * 中前 * 个 ( 值接近于 0 ,而
<@?#
高 等 学 校 化 学 学 报 I I I I I I I I I I I I I I I I J.," <G I
!"#$ %& ’"()*+,-. /012 34 .+,+ ! ( 5) +6. " ( 7)
!"#$ 8& 9-2)*,2 34 :’11 ( 5)+6. 0;<:’11 ( 7) +6+*=2"2
第四个值迅速增大,即可推断矩阵 ! 和 " 中包含有 ! 个共有组分" 图 # 是模拟数据的色谱图,可见,! 和 " 的确均是三组分体系"
!"#$ >& 9-2)*, 34 ?3((36 @+6A +6+*=2"2
!"#$ B& ’"()*+,-. ?C@3(+,3#@+(2 34 .+,+ ! ( 5)+6. " ( 7)
在不同体系间交互扫描,可以最大量地提取多个体系中的信息,并同时完成谱峰解析与复杂体系之间 的比较,是 “ 组学” 研究的强有力工具$ 本文对此原理和计算方法进行了详细的讨论,并用计算机仿真
[ &] 的 @,A/8 数据对方法进行验证,得到实际应用的例子已在另文报道 $
%& 理论部分
交互移动窗口因子分析法 ( 1/?71) 是一种可对两个复杂体系之间进行快速比较的分析方法,是 多组分光谱相关色谱法 ( /8,,) 和子窗口因子分析法 ( 871 ) 的结合和延伸$ /8,, 法是基于正交投影 理论和相关色谱方法提出来的,为克服仪器的不等性噪声影响,采用目标组分投影前后的光谱夹角余 弦判据,判断不同条件下谱图的相关组分色谱峰簇$ 871 法的核心在于选取 % 个只包含有 ( 个共有组 分的子矩阵,从特征值为 ( 或接近于 ( 的特征向量中获取对应的纯质谱或纯光谱$ 1/?71 法区别于 871 法的特点在于,在解析纯质谱过程中挖掘出了隐藏在两个体系中的信息,这将提供更多机会获取 选择性信息$ 假设矩阵 ! 和 " 分别是两个复杂体系中用于比较的两个部分,1/?71 法通过共有秩分 析和共有成分纯质谱解析两大部分完成对数据的分析$ % $ %& 共有秩分析 ( ( )用 /8,, 法和 0WA/8,, ( 即反向 /8,, 法) 确定 ! 和 " 中的化学成分是否一致$ 0WA/8,, 法是 对矩阵进行反投影,其原理与 /8,, 法相同$ 结合这两种方法可以得到 ! 与 " 中成分的对应关系$ ( % )用 1/?71 法确定共有组分数$ ! 和 " 经过 8!\ 分解分别获得两个正交的载荷矩阵 # 和 $, # ]{%( ,%% ,…,% ! },$ ]{&( ,&% ,…,& " },! 和 " 分别为 ! 和 " 中的组分数$ 如果 ! 和 " 中存在一 个共有组分,则光谱 ’( % ,…,$,$ 为共有组分数) 为 # 或 $ 中基向量的线性组合,即 # # ] (,
相关主题