化学学报 ›› 2011, Vol. 69 ›› Issue (10): 1232-1238. 上一篇 下一篇
研究论文
张永红1,2,3, 刘树深*,2, 肖乾芬2, 覃礼堂2, 夏之宁*,3
Zhang Yonghong1,2,3|Liu Shushen*,2|Xiao Qianfen2|Qin Litang2|Xia Zhining*,3
随着大量分子描述符应用于QSAR/QSPR, 如何筛选出具有良好稳定性和预测能力的描述符集, 成为亟待解决的一个瓶颈问题. 将63个有机化合物的1664个描述符经过初步预选后, 利用偏最小二乘(PLS)方法进行变量筛选, 获得42个重要描述符|随机选择43个有机物, 针对透聚乙烯膜性能进行训练研究, 得优良估计能力和良好稳定性模型 (A=6, r2=0.9647, RMSE=0.213, q2=0.8364, RMSV=0.467)|对模型外部20个有机物进行预测, 表明模型具有良好预测能力( =0.9306, RMSP=0.326). PLS变量筛选法可以快速有效地筛选与活性密切相关的重要描述符, 进而构建具有良好稳定性和预测能力的QSAR模型.