约化分子电距矢量用于茎用莴苣花挥发性组分的结.doc

上传人:sccc 文档编号:5194977 上传时间:2023-06-13 格式:DOC 页数:7 大小:313.50KB
返回 下载 相关 举报
约化分子电距矢量用于茎用莴苣花挥发性组分的结.doc_第1页
第1页 / 共7页
约化分子电距矢量用于茎用莴苣花挥发性组分的结.doc_第2页
第2页 / 共7页
约化分子电距矢量用于茎用莴苣花挥发性组分的结.doc_第3页
第3页 / 共7页
约化分子电距矢量用于茎用莴苣花挥发性组分的结.doc_第4页
第4页 / 共7页
约化分子电距矢量用于茎用莴苣花挥发性组分的结.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《约化分子电距矢量用于茎用莴苣花挥发性组分的结.doc》由会员分享,可在线阅读,更多相关《约化分子电距矢量用于茎用莴苣花挥发性组分的结.doc(7页珍藏版)》请在三一办公上搜索。

1、精品论文大集合约化分子电距矢量用于茎用莴苣花挥发性组分的结构表征及气相色谱保留时间的预测李建凤1,廖立敏1,21.重庆大学化学化工学院,重庆 (400044)2.四川内江师范学院化学与生命科学系,四川内江 (641112)E-mail: afeng523.摘要:本文将分子电距矢量进行了约化研究,形成了结构描述子-约化分子电距矢量(MEDVR),并将其用于茎用莴苣花挥发油的37种组分的结构表征。通过多元线性回归,得到10变量模型(M1)的复相关系数R21 = 0.962,标准偏差SD1=1.823,留一法(Leave-one-out, LOO) 交互检验的复相关系数R2CV1=0.899,标准偏

2、差SDCV1=2.953。用逐步回归的进行了变量筛选, 建立了6变量模型(M2)的复相关系数为R22=0.955和R32=0.962,标准偏差为SD2=1.834,留一 法交互检验的复相关系数分别R2CV2=0.919,标准偏差为SDCV2=2.465。结果优于用MEDV同 法建立的模型,表明分子电距矢量在约化后用于化合物结构表征,没有结构信息上的损失, 并有效地避免了一些干扰信息或冗余信息的累加。 关键词:约化的分子电性距离矢量;结构描述子;定量结构-保留相关;茎用莴苣中图分类号:R284文献标识码:A1. 引言茎用莴苣(L.Sativa var. angustana Irish),又名莴笋

3、,菊科莴苣属一、二年生草本植物,为我 国传统栽培蔬菜。古代人们对茎用莴苣十分重视,希腊名医希波克拉底认为茎用莴苣有医疗 价值,晋代葛洪在时后方中把茎用莴苣列入了草药范围。现代药理研究证明,茎用莴苣具 有利尿、降糖、降血压、治疗缺铁性贫血以及镇痛和催眠等作用。最近郭华等1用同时蒸馏-萃取装置提取茎用莴苣花中的挥发性物质,并利用气相色谱-质谱技术对其成分进行分析研 究,鉴定出37个挥发性化学成分。定量结构-色谱保留值关系(quantitative structure-retention relationship,QSRR)的研究对预 测保留值、选择分离条件及探索色谱保留机理都具有重要意义。分子结构

4、与色谱保留之间的 定量关系的构建,需要引入相应的结构描述子,研究者们在寻找结构描述子方面已经做了许 多有意义的工作2-5。作者采用这37 种物质(表1)作为研究样本。首先对分子电距矢量(MEDV) 进行约化研究得到了约化分子电距矢量(MEDVR),再利用MEDVR对茎用莴苣花中分离出的37个化合物进行了结构表征,借助多元线性回归、逐步回归和留一法(leave-one-out,LOO) 交 互检验建立了定量结构-保留相关相关(QSRR)模型,取得了较好的结果,可望对天然产物及精细化工产品的色谱行为提供有益参考。表1茎用莴苣花挥发油中37种组分及其在气相色谱-质谱中的保留时间Table 137 C

5、omponents of flowers of L. Sativa var. angustana Irish and their retention timesNo化合物名称化合物名称Name of compounds分子式保留时间/min11-己醇1-hexanolC6H14O3.152壬烷nonaneC9H203.553庚醛HeptanalC7H14O3.604(E)-2-庚烯醛(E)-2-heptenalC7H12O4.5151-辛烯-3-醇1-octen-3-olC8H16O4.9262-戊基-呋喃2-pentyl-funanC9H14O5.177辛醛octanalC8H16O5.39

6、8苯乙醛benzeneacetaldehydeC8H8O6.32- 7 -9(E)-2-辛烯醛(E)-2-octenalC8H14O6.61102-辛烯-1-醇2-octen-1-olC8H16O6.84111-癸烯1-deceneC10H206.8812壬醛nonanalC9H18O7.69133,5-二甲基-环己醇3,5-dimet hyl-cyclohexanolC8H16O7.8314(E)-2-壬烯醛(E)-2-nonenalC9H16O9.0915十二烷dodecaneC12H2610.0616癸醛decanalC10H20O10.2417(E)-2-癸烯醛(E)-2-decena

7、lC10H18O11.7018十三烷tridecaneC13H2812.6319(E,E)-2,4-癸二烯醛(E,E)- 2,4-decadienalC10H16O13.1520(E)-2-癸烯醛(E)-2-decenalC10H18O14.3121正癸酸n-decanoic acidC10H20O214.6022 1-(2,6,6-三甲基-1,3-环己二烯-1-基)-2-丁烯-1-酮1-(2,6,6-trimethyl-1,3-cyclohexadien-1-yl)-2-Buten-1-oneC13H18O14.84232,6,10-三甲基-十二烷2,6,10-t rimethyl-dode

8、caneC13H2816.6924二氢苊acenaphtheneC12H1017.2625十三醛tridecanalC13H26O17.8826 5,6,7,7a-四氢化-4,4,7a-三甲基-2(4H)-苯并呋喃酮5,6,7,7a-tetrahydro-24,4,7a-trimethyl-2 (4H)-benzofuranoneC11H16O218.3927十二(烷) 酸dodecanoic acidC12H24O219.6128十六烷hexadecaneC16H3419.9229十七烷heptadecaneC17H3622.1430(E)-3-十四烯(E)-3-tet radeceneC1

9、4H2822.9331十四酸tetradecanoic acidC14H28O223.7732蒽ant hraceneC14H1023.8933十八烷octadecaneC18H3824.26346,10,14-三甲基-2-十五烷酮6,10,14-trimet hyl-2-pentadecanoneC18H36O25.2135十九烷nonadecaneC19H4026.2836正十六酸n-hexadecanoic acidC16H32O227.8637二十烷eicosaneC20H4228.222. 约化的分子电距矢量(MEDVR)的获得及化合物分子结构表征2.1 约化的分子电距矢量(MEDV

10、R)的获得本实验室提出的分子电性距离矢量(MEDV)已成功用于化合物多种性质的研究6-11。对 有机物分子结构进行表征时,将 C、N、O、S、F、Cl、Br、I 等非氢原子根据与其相连的 非氢原子数目分为4类,原子类型,以k表示, k = i ( i = 1 , 2 , 3 , 4)表示该类原子与i个非氢原子 相连。这四类非氢原子之间发生相互作用可以按以下方式组合: m11、m12、m13、m14、m22、 m23、m24、m33、m34、m44,简写成 x1、x2、x3、x4、x5、x6、x7、x8、x9、x10。MEDV各元素 按下式计算:xr = mnl=di=n , j =lqi .q

11、 j2ij(n=1, 2, 3, 4; nl4)(1)式中n、l表示原子i、j的原子类型,qi、qj表示原子i、j相对于碳原子的相对电负性,dij表示 原子i、j之间的相对距离(即所经最短路径相对于碳碳单键相对键长之和)。可以看出在MEDV中对dij的取值没有作出界定,即在化合物分子中的两原子不论相距多远,它们的相互作用总是被计算并累加入相应的作用项中。最近笔者认为,当分子中的两原子间的化学键数(b)达 到一定程度时,由于受到其间其它原子的影响,它们间的相互作用就迅速减小到可以忽略不 计或根本不存在。为此,笔者以天然产物中挥发性成分为样本,以每步多元线性回归建模的 相关系数R、标准偏差SD、交

12、互检验相关系数RCV、标准偏差SDCV为参考,将MEDV进行了 约化研究以确定最佳b值并形成新的结构描述子-约化分子电距矢量(MEDVR)。约化过程如 表2:表 2电距矢量的约化过程Table 2 Process of the reductionbR2SDR2CVSDCV10.9472.0540.7854.15920.9581.9850.8703.35830.9621.8230.8992.95340.9601.8370.8673.39350.9601.8390.8773.259不限制0.9601.8330.6015.880b不受限制时相当于MEDV。从以上可以看出,当b=3时建模效果最佳。因此

13、在约化的分子电距矢量(MEDVR)中,当两原子间的化学键多于3个时,它们间的相互影响不被计算和累 加。2.2 化合物分子结构表征在这里以2-甲基戊烷为例来说明MEDVR对化合物分子结构的表征过程。首先将2-甲基戊 烷中各非氢原子进行编码,如图1 所示。6个非氢原子中连有一个非氢原子的第一类非氢原 子有3个,即1、5和6号;第二类非氢原子有2个,即3及4号;第三类非氢原子有1个,即2号; 没有第四类非氢原子。计算 x1: x1为 1 、5 及6 号三个第一类原子之间的相互作用。由于1 号(或6号)与5号原子间的化学键数为4(b3),因此它们间的相互作用可以忽略。x1实际上只 包括1号和6号两个原

14、子之间的相互作用。这两个原子间的最短路径为: C1 C2 C6;d1,6 =1.0000 +1.0000 =2.0000;因此,x1 = m11=1.00001.0000/2.00002 =0.2500。同理,可计算出其 他几个MEDVR矢量。其他化合物MEDVR各矢量的计算值见表 3。642135图12-甲基戊烷分子结构Fig. 1 Molecular matrix skeleton of 2-methylpentane表 3 37种茎用莴苣花挥发油组分所得的MEDVR和tRTable 3MEDVR and retention times of 37 components from flow

15、ers of L. Sativa var. angustana IrishNox1x2x3x4x5x6x7x8x9x10tR10.00003.44550.00000.00004.97220.00000.00000.00000.00000.00003.1520.00002.72220.00000.00007.69440.00000.00000.00000.00000.00003.5530.00004.10370.00000.00006.33330.00000.00000.00000.00000.00003.6040.00004.18030.00000.00006.89560.00000.0000

16、0.00000.00000.00004.5150.17223.68601.85040.00003.97222.36110.00000.00000.00000.00004.9260.00001.36110.00000.000010.05234.52590.00000.00000.00000.00005.1770.00004.10370.00000.00007.69440.00000.00000.00000.00000.00005.3980.00002.56950.17300.00008.45574.45580.00000.00000.00000.00006.3290.00004.18030.00

17、000.00008.25670.00000.00000.00000.00000.00006.61100.00003.46040.00000.00008.10780.00000.00000.00000.00000.00006.84110.00003.08930.00000.00009.05560.00000.00000.00000.00000.00006.88120.00004.10370.00000.00009.05560.00000.00000.00000.00000.00007.69130.00001.72544.32340.00000.75006.33330.00000.75000.00

18、000.00007.83140.00004.18030.00000.00009.61780.00000.00000.00000.00000.00009.09150.00002.72220.00000.000011.77780.00000.00000.00000.00000.000010.06160.00004.10370.00000.000010.41670.00000.00000.00000.00000.000010.24170.00004.18030.00000.000010.97890.00000.00000.00000.00000.000011.70180.00002.72220.00

19、000.000013.13890.00000.00000.00000.00000.000012.63190.00004.18030.00000.000011.59890.00000.00000.00000.00000.000013.15200.00004.18030.00000.000010.97890.00000.00000.00000.00000.000014.31210.61462.47413.71390.00009.05561.36110.00000.00000.00000.000014.60220.25003.89124.57192.00002.95975.78142.27632.7

20、6240.49580.000014.84230.36113.16674.25000.00005.33336.44440.00000.00000.00000.000016.69240.00000.00000.00000.00008.148712.03730.00004.60400.00000.000017.26250.00004.10370.00000.000014.50000.00000.00000.00000.00000.000017.88260.25002.88643.22203.52553.40975.11624.99650.30692.41700.250018.39270.61462.

21、47413.71390.000011.77781.36110.00000.00000.00000.000019.61280.00002.72220.00000.000017.22220.00000.00000.00000.00000.000019.92290.00002.72220.00000.000018.58330.00000.00000.00000.00000.000022.14300.00002.73250.00000.000014.91330.00000.00000.00000.00000.000022.93310.61462.47413.71390.000014.50001.361

22、10.00000.00000.00000.000023.77320.00000.00000.00000.000011.322514.59640.00003.34220.00000.000023.89330.00002.72220.00000.000019.94440.00000.00000.00000.00000.000024.26340.67003.12087.14950.00007.69448.16670.00000.00000.00000.000025.21350.00002.72220.00000.000021.30560.00000.00000.00000.00000.000026.

23、28360.61462.47413.71390.000017.22221.36110.00000.00000.00000.000027.86370.00002.72220.00000.000022.66670.00000.00000.00000.00000.000028.223. 线性回归模型的建立37种化合物的气相色谱保留时间tR(exp)在以下实验条件下获得1。色谱柱: HP21弹性石英 毛细管柱25m0.2mm0.33m;柱温:50200 (4 /min);汽化室温度:230;溶剂延迟:4 min;传输线温度:230 ;进样量:0.4L(乙醚溶液);载气:He;载气流量:2mL/min;

24、分流比: 401。多元线性回归(multiple linear regression,MLR) 是一种经典的建模方法,它对自变量和因变量加以线性拟合以得到最小二乘(least square,LS) 意义下的最佳结果。借助多元线性回归(MLR)方法对MEDVR矢量和tR(exp)进行相关性研究,得到10 变量的预测模型(M1):tR = -13.842 - 4.165 x1 + 1.765 x2 + 2.879 x3 + 1.176 x4 + 1.689 x5 + 0.468 x6 +1.227 x7 + 2.878 x8 - 22.396 x9 + 214.890 x10(M1)建模结果为:n

25、=37,R12=0.962,SD=1.823,R2CV1=0.899,SDCV=2.953。R 为建模的相关系数、SD 为标准偏差、RCV 为留一法交互检验相关系数、SDCV 为标准 偏差(下同)。为了进一步考察M1各变量对QSRR建模过程的影响和对模型的贡献大小,消除各变量之 间的共线性,对变量进行了逐步回归(SMR)分析。当变量数m为6时R2已达到(0.955),而此时R2CV 也达到最大值(0.919)。SD为1.834,而SDCV达到最小值(2.465)。综合考虑R 、SD、RCV 和SDCV,说明6变量模型(M2)的预测能力要优于10变量模型(M1)。用6个变量进行建模,所得 模型如

26、下:tR = -12.551+1.474 x2+2.134 x3+1.657 x5+0.685 x6+1.809 x8+40.390 x10(M2)建模结果为: n=37,R22=0.955,SD2=1.834,R2CV2=0.919,SDCV2=2.465。4. 结果与讨论上述两模型对保留时间的估计和预测值见表4。M1及M2两模型对化合物保留时间的估 计和预测对实验值作图,见图2。表 4 三模型的估计、预测及误差Table 4Estimations and predictions and errors by modelsNoExpCal1Err1.Precv1Errcv1Cal2Err2Pr

27、ecv2Errcv2013.150.636-2.5140.274-2.8760.768-2.3820.437-2.713023.553.9560.4064.0230.4734.2130.6634.3170.767033.604.0960.4964.1470.5473.9940.3944.0310.431044.515.1810.6715.2480.7385.0390.5295.0860.576054.925.0860.1665.1040.1845.0330.1135.0440.124065.177.6532.4839.5634.3939.2154.04510.5805.410075.396.3

28、951.0056.4811.0916.2490.8596.3170.927086.327.5541.2347.9801.6608.6722.3529.1512.831096.617.4790.8697.5570.9477.2940.6847.3490.739106.845.957-0.8835.897-0.9435.986-0.8545.928-0.912116.886.9030.0236.9050.0257.0100.1307.0190.139127.698.6931.0038.7721.0828.5050.8158.5630.873137.838.0370.2078.9551.1256.1

29、60-1.6705.486-2.344149.099.7780.6889.8370.7479.5500.4609.5860.4961510.0610.8520.79210.9190.85910.9790.91911.0510.9911610.2410.9920.75211.0510.81110.7610.52110.7980.5581711.7012.0760.37612.1110.41111.8050.10511.8140.1141812.6313.1510.52113.1910.56113.2350.60513.2760.6461913.1513.123-0.02713.121-0.029

30、12.833-0.31712.805-0.3452014.3112.076-2.23411.872-2.43811.805-2.50511.597-2.7132114.6014.585-0.01514.580-0.02014.9610.36115.0380.4382214.8414.8400.00020.2935.45316.8081.96819.4844.6442316.6914.499-2.19113.806-2.88414.442-2.24813.732-2.9582417.2618.7991.53923.2125.95217.5330.27317.9030.6432517.8817.8

31、870.00717.8880.00817.527-0.35317.484-0.3962618.3918.3900.00013.861-4.52918.3900.00013.861-4.5292719.6119.183-0.42719.051-0.55919.472-0.13819.447-0.1632819.9220.0460.12620.0590.13920.0020.08220.0090.0892922.1422.3450.20522.3720.23222.2570.11722.2700.1303022.9316.165-6.76515.632-7.29816.191-6.73915.74

32、4-7.1863123.7723.7800.01023.7820.01223.9830.21324.0230.2533223.8921.724-2.16618.810-5.08022.263-1.62720.368-3.5223324.2624.6430.38324.7090.44924.5130.25324.5480.2883425.2126.2711.06127.4402.23025.6560.44626.0970.8873526.2826.9420.66227.0910.81126.7680.48826.8560.5763627.8628.3770.51728.5380.67828.49

33、40.63428.6420.7823728.2229.2411.02129.5421.32229.0240.80429.2130.99330 model (1) N=37tR(Ca/tR(Pre)25 m=10R2=0.962SD=1.8232030 model (2) N=37m=6tR(Ca/tR(Pre)25 R2=0.955SD=1.8342015151010Cal5Pre 5CalPre0051015202530tR(Obs)0051015202530tR(Obs)图 2.茎用莴苣花挥发性成分的色谱保留时间实验值与模型估计值相关图(M1、M2)Fig.2 Plot of estima

34、ted vs. observed observed retention time (M1 and M2)用 MEDV 对各化合物进行结构表征,同法建立了 10 变量模型和 6 变量模型。其建模 效果与本文 MEDVR 模型进行比较,结果见下表。表 5模型比较Table 5Compare of the models变量数(n)描述子R2SDFR2CVSDCVFCV6MEDV0.9541.854104.1140.8753.06534.9136MEDVR0.9551.834106.4950.9192.46556.71910MEDV0.9591.83364.3590.6015.88029.90810M

35、EDVR0.9621.82365.0740.8992.95333.203从以上结果可以看出,MEDVR 的建模效果明显优于 MEDV 的建模效果。分子中两原子 间的距离较大时,它们间的相互作用实际上已经不存在,如果再将其计算并累加反而产生干 扰。本文的 MEDVR 与 MEDV 进行比较,减小了计算量,但在结构表征上并没有信息的损失,相反还有效地避免了一些干扰信息或冗余信息的累加。所以使用 MEDVR 描述子建立的模型要优于同法使用 MEDV 描述子建立的模型。 对37种茎用莴苣花挥发性有机物所建立的QSRR模型,充分考虑了各非氢原子对该类化合物气相色谱保留时间的贡献,且模型所采用的参数均为计

36、算值,简单易得。采用LOO交互 检验,对模型稳定性和预测能力进行了评价。从图2可以看到,大部分样本点处于对角线附 近,说明所得模型具有良好的稳定性和预测能力。这对于天然产物中挥发性有机化合物的定 量结构色谱保留相关(QSRR) 研究具有一定的参考价值。需要进一步说明的是,本文所研究 的样本分子来自天然产物,因此分子结构跨度大(包括烷烃、烯烃、芳烃等)。对于这样复杂 的样本,本文取得的结果已属满意。与已有研究12,13相比,本文的研究突破了具有相似结构 的同一类化合物的QSRR研究的范畴,同时也说明了MEDVR矢量在有机物QSRR研究上有较 强的普适性。参考文献1Guo Hua(郭华), Hou

37、 Dongyan(侯冬岩), Hui Ruihua(回瑞华), Li Tiechun(李铁纯). J Chin Mass SpectromSoc(质谱学报), 2006, 27(2):1131162Zhou Peng(周鹏), Mei Hu2(梅虎), Tian Feifei(田菲菲), Li Zhiliang(李志良). Chin J Anal Chem (分析化 学),2006,34(8): 109611003Du Xihua(堵锡华).J Instru Anal(分析测试学报), 2003,2(5):18-224Zhang Ting(张婷), Liang Yizeng(梁逸曾), Zha

38、o Chenxi(赵晨曦), Yuan Dalin(袁大林). Chin J Anal Chem(分析化学), 2006,34(11): 160716105Liu Fengping (刘凤萍), Liang Yizeng(梁逸曾), Cao Chenzhong(曹晨忠). Chin J Anal Chem (分析化学),2007, 35(2): 2272326Sun Lili(孙立力), Li Zhiliang(李志良). J Chem Indus Eng (China)(化工学报), 2005, 56(2):203208 7Lin Hongwei(林红卫), Li Zhiliang(李志良)

39、. Org Chem (有机化学), 2003, 23(12):137013748Sun Lili(孙立力), Mei Hu (梅虎), Li Genrong (李根容), Li Zhiliang(李志良). Fine Chem (精细化工), 2004,21(8):6006049Lili Sun, Liping Zhou, Yu Yu, Yukun Lan, Zhiliang Li. Chemosphere, 2007, 66:1039105110Lili Sun, Yuan Zhou, Li Genrong, Shengshi Zhiliang Li. J Mol Struc-THEOCH

40、EM, 2004, 679:107113 11Shushen Liu, Chunsheng Yin, Shaoxi Cai, Zhiliang Li. Chemom. Intell. Lab. Syst., 2002, 61: 31512Yuan Zhou, Lili Sun, Hu Mei, ShengshiZhiliang Li. Chromatogr, 2006, 64(9-10): 56557013Shu-Shen Liu, Yan Liu, Da-Qian Yin, Xiao-Dong Wang, Lian-Sheng Wang. J. Sep. Sci., 2006, 29, 296301Structural characterization and retention times prediction of components of L. Sativa var. angustana Irish Flowers by MEDVRLi Jianfeng1, Liao Limin1,21.College of Chemistry and Chemical Engineering,Chongqing University, Chongqing (400044)2.Department of Chemistry and Life Science, Neijian

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号