化学学报 ›› 2007, Vol. 65 ›› Issue (2): 152-158. 上一篇 下一篇
研究论文
冒海蕾1,3, 徐旻2, 王斌3, 王惠民3, 邓小明*,1, 林东海*,2
MAO Hai-Lei1,3; XU Min2; WANG Bin3; WANG Hui-Min3; DENG Xiao-Ming*,1; LIN Dong-Hai*,2
观察、比较正交信号校正(OSC)滤噪前后, 用不同的模式识别方法对正常成人血清代谢组1H NMR谱进行分析的效果, 以探讨NMR代谢组学技术应用于临床研究和疾病早期诊断的可行性. 78例正常成人在采血前按常规要求禁食8 h, 记录血清一维600 MHz氢谱后, 分别采用主成分分析(PCA)、偏最小二乘法-判别分析(PLS-DA)以及簇类的独立软模式法(SIMCA)对氢谱进行模式识别分析. 结果表明: 虽然采血前并无其它诸如饮食、生活方式、生理周期等方面的严格限制, 采用OSC 滤噪后, PLS-DA能够完全区分不同性别的血清氢谱, 其判别能力优于PCA和SIMCA. 而且采用OSC滤噪与文献报道的未经OSC处理的PLS-DA法获得的与性别分类有关的主要NMR积分区段基本相同. 从OSC去除不同数目的隐变量后所致的PLS-DA模型的性能改变可见: OSC去除两个隐变量时, 前两个隐变量的特征值明显比后面的大; 剩余残差为20.82%, 即去除了79.18%的X变量中与反应变量Y不相关的系统变异. 此时PLS-DA计算所得的隐变量个数为1; 而不使用OSC或用OSC去除一个隐变量时, PLS-DA所得的隐变量个数分别为3和2. 作为PLS-DA模型质量的评价指标, R2X表示PLS-DA模型计算所获得的隐变量反映自变量X的变异的百分比, R2Y则表示隐变量反映因变量Y的变异的百分比, Q2 (cum)为交叉验证后PLS-DA模型所获隐变量能够预测X和Y变异的累计百分比. R2X在OSC去除两个隐变量时达到最低值, 表明此时PLS-DA计算模型包含的系统变异最少; R2Y与Q2 (cum)都达到80%以上并趋于稳定, 说明OSC去除两个隐变量时PLS-DA模型的质量优良. 显然, OSC可去除饮食、环境等因素的影响, 降低临床样本的不均一性, 这对于NMR代谢组学技术应用于临床研究至关重要. OSC滤噪去除的隐变量个数应根据剩余残差、去除隐变量的特征值大小、PLS-DA模型计算所得的隐变量个数和反映模型质量的相关指标加以判断.