二维色谱峰检测/2D peak detection
项目负责人:徐巨才 博士
二维液相色谱现已被广泛应用于各食品、材料、化工、医药等各行业的分析检测中。由于仪器商倾向于实行整机销售、维护和应用支撑,尚未提供从一维向二维液相色谱的完整升级方案,为此自行搭建二维液相色谱成了当下方法开发和研究的热潮,但随之而来的色谱数据处理和分析问题困扰了大多数玩家,为此,徐巨才博士结合其博士论文研究成果,在此提供了一种基于两步法检测二维液相色谱峰的方法(包括Peters法及本站改良后的方法)。注意本方法虽测试于二维液相色谱数据,但其同样适用于二维气相色谱。
本站两步检测法首先对第二维液相色谱的单维液相色谱峰进行检测,在此基础上,再根据峰保留时间、重叠程度、最近原则及单峰性等多个盘踞对第二维色谱峰进行判定和分类,尽可能使来自同一物质的色谱峰合并为一个二维液相色谱峰。
具体方法说明请参见文献(如下载本项目开源资源,请注明以下文章引用):
[1] Xu J, Zheng L, Su G, et al. An improved peak clustering algorithm for comprehensive two-dimensional liquid chromatography data analysis[J]. Journal of Chromatography A, 2019,1602:273-283.
程序处理截图:
图1 某多肽混标的程序运行检测结果图
具体使用说明:
(1)在处理2D色谱峰之前,请使用1D峰处理程序对色谱峰进行一维色谱峰检测,并采用批处理对处理结果按照采集顺序编号命名储存(如果使用1D处理程序点击Save and load会自动进行批处理)。但批处理原始数据文件需严格按照采集顺序命名,截图示例如下:
图2 原始数据文件和处理后mat文件保存示例
注意:上述示例中原始数据文件为txt,目前支持的原始数据文件格式仅包括csv,txt和excel。
(2)对1D数据处理完成后,请点击左上角文件打开按钮,选择1D数据处理结果中的第一个文件(如图2右侧中的第一个),然后确定打开,然后在图1中输入number of files(1D文件数量,也即二维分析循环次数),start(第一维切割的起始时间),interval(第一维切割的采样间隔时间),然后点击Load Files加载批量数据文件,程序将根据这些信息自动计算D1轴的保留时间值。
(3)选择处理方法(包括Xus' Method 和Peters' method),可根据需求选择,以下仅根据Xus' Method示例说明参数设置,Peters' method请参照上述参考文献中的对比说明理解。
(4)如选择Xus' method,程序中所有参数均可选,其中Peakfitting 选项标识是否对1D峰进行峰拟合获取峰宽参数,此选项对于D2轴(第二维)方向上存在拖尾峰情况时可改善峰检测情况。
(5)Namx(仅限Xus' method):最大2D峰中可包含的单维峰数量,主要用于某些特殊情况下色谱峰簇的强制打断和自动打断,强制打断时可直接在右侧输入打断数字;自动打算请下来选择Auto,接下来将自动弹出1D色谱峰处理程序,为您进行D1(第一维)洗脱曲线的峰拟合和峰跨度分析(具体分析方法参加本站另一开源项目——1D峰处理)。注意,自动打断处理尚未完全完善,不建议使用。
(6)retention criterion(仅限Xus' method):峰停流时间判定,即根据峰漂移的情况来判定各峰是否属于同一个2D峰簇。此选项下,可选择等度偏移和可漂移偏移,等度偏移对应第二维梯度始终保持一致的情况;可偏移漂移适用于第二维梯度变化的情况,示例及识别效果于Peters'方法对比如下:
图3 第二维可漂移梯度示例(图片来自首页所示文献)
图4 图3条件下某多肽混合标准品的二维分离图
图5 Xus' method(左)和Peters' method(右侧)对图4中region1 的局部检测放大图
注:红色标识代表识别错误。
(7)OverLap criterion:峰重叠判定,两种方法均适用,但注意两者计算方法的区别。Tov值为重叠程度阈值,如采用Xus' method可适当设置较高值,如采用Peters' method请切勿设高值,会出现较多错误识别。注意Hs仅限Xus' method,其主要用途为设置峰重叠计算所用的峰宽对应高度值,可用于改善峰拖尾时的二维色谱峰识别情况。
(8)Unimodility criterion:单峰性识别,即检查所得二维色谱峰簇是否为单峰,其下方对应interplot interval数值,代表相邻量点之间插值数量,可根据实际情况进行插值对单峰性进行检测,具体意义参见首页文献。
(9)扫描方向:可分为单向和双向,选择单向计算时可在下方选择任意四个方向,双向时,下方单向计算设置无效,将自动进行双向计算。使用建议:对于Xus' method单向计算一般可满足要求,Peters' method请一定选择双向计算,否则将出现较多错误识别。
(10)Calculation:计算按钮,每修改一次参数,请点击此按钮更新数据处理结果。
(11)Sustract baseline:扣除基线,注意这个扣除基线是指扣除自身色谱基线,可以有利于在梯度分离时把基线扣的干干净净,很漂亮。
(12)Inter N:作图时在第一维方向上的插值点数,可以让曲面图更加光滑漂亮。
(13)Peak WM: 峰宽标识,默认关闭,如开启后,可看到紫色横线标识其峰宽范围。对应Line W对应线宽,SizeD对应圆圈直径。
(14)3D peak number:3D色谱峰数字标识,主要是用于在3D曲面中为色谱峰编号,默认关闭。
(15)3D Peak line:3D峰标识,这个选项是用于为每一个独立色谱峰都编号标识,同时会带线条的小圆圈把峰簇标识出来。
(15)Figure type:作图类型,可选择投影图、等高线图、曲面图(曲面图建议选择图形输出后打光处理,会让曲面更好看,可在本站搜索Matlab 曲面图形的光源投影处理)、格线图、瀑布图、3D曲面加地面投影图等。
(16)contour(n):等高线密度,仅选择作等高线图时可选。
(17)pr:print 输出图形至Matlab主窗口,以便于进一步可视化修饰和处理。
(18)export to excel:导出所有1D峰信息,以便于计算正交系数等指标(正交系数等指标建议采用正交计算器http://www.kroungold.com/,该软件每台电脑可有20次免费计算)。
(19)作图右上角Pd N 1d:Peak detected number in first dimension, 单维色谱峰检测数量,Pd N 2d:二维色谱峰检测数量。
(20)坐标轴图形左上交和右下角分别对应坐标轴范围设置。
(21)图形界面下方表格为鼠标点选图中峰簇信息后显示的2D峰信息。
(22)2D数据处理后,建议选择左上角保存按钮保存所有界面和数据,下次使用时可直接打开加载。
注意:上述程序暂时仅适用于Matlab 2015a,并请以Debug模式运行,如直接运行可能导致右上角的放大和缩小工失效。有关上述程序的python编译正在进行中,敬请期待。
[1] Xu J, Zheng L, Su G, et al. An improved peak clustering algorithm for comprehensive two-dimensional liquid chromatography data analysis[J]. Journal of Chromatography A, 2019,1602:273-283.
文章末尾固定信息


评论