目前,我們的日常生活中接觸到的工業(yè)化學(xué)物質(zhì)大約超過100,000種,其中一些可能對人體健康產(chǎn)生不利影響。
化學(xué)物質(zhì)的安全性通常通過動物試驗、細(xì)胞試驗、微生物試驗等生物檢測來評估。然而,在考慮時間、勞動力、物質(zhì)成本和動物倫理等多種因素時,以這種方式測試如此大量的化學(xué)物質(zhì)是不現(xiàn)實的。
▌定量構(gòu)效關(guān)系(QSAR)
為了實現(xiàn)可持續(xù)發(fā)展目標(biāo),需要一種能夠迅速準(zhǔn)確識別有害化學(xué)物質(zhì)的有效篩選工具。定量構(gòu)效關(guān)系(Quantitative Structure Activity Relationships,QSAR)是一種計算機模擬方法,它主要基于各種分子描述符和模型算法,建立化合物的結(jié)構(gòu)與其理化性質(zhì),生物學(xué)活性,毒理學(xué)效應(yīng),環(huán)境行為和歸趨等的定性/定量關(guān)系,即根據(jù)目標(biāo)物質(zhì)的化學(xué)結(jié)構(gòu)特征預(yù)測其生理效應(yīng)或理化性質(zhì)等,具有快速高效的特點,能夠有效節(jié)約測試成本。
QSAR是目前國內(nèi)外一個活躍的研究領(lǐng)域,美國環(huán)境保護(hù)署(United States Environmental Protection Agency,簡稱US EPA)就基于QSAR開發(fā)了針對化學(xué)物質(zhì)毒性預(yù)測的軟件——Toxicity Estimation Software Tool (T.E.S.T)。
▌T.E.S.T
T.E.S.T軟件可根據(jù)大量的數(shù)據(jù)處理和統(tǒng)計識別目標(biāo)化合物中潛在的有毒基團,還能快速地分析與目標(biāo)物質(zhì)結(jié)構(gòu)相似的化合物的毒性,進(jìn)一步綜合預(yù)測目標(biāo)物質(zhì)的毒性。
T.E.S.T界面簡潔,操作簡單,并且軟件內(nèi)配有指南,易上手,用戶可通過CAS號、SMILES碼、物質(zhì)名稱、InChi碼、DTXSID或是手動繪制載入化學(xué)物質(zhì)結(jié)構(gòu),然后選定預(yù)測終點與方法,更改結(jié)果輸出路徑后即可進(jìn)行預(yù)測,軟件預(yù)測完畢會自動生成結(jié)果報告。
T.E.S.T軟件用戶界面與基本操作流程
T.E.S.T的預(yù)測終點包括毒性和理化性質(zhì)兩大類別。
毒性預(yù)測終點:
預(yù)測終點 | 介紹 |
LC50(Fathead minnow 96-hr) | 96小時導(dǎo)致50%黑頭呆魚(Fathead minnow)死亡的水中試驗化學(xué)物質(zhì)濃度(mg/L)。 |
LC50(D. magna 48-hr) | 48小時導(dǎo)致50%大型蚤(Daphnia magna)死亡的水中試驗化學(xué)物質(zhì)濃度(mg/L)。 |
LC50(T. pyriformis 48-hr) | 48小時對50%梨形四膜蟲(Tetrahymena pyriformis)生長產(chǎn)生抑制作用的水中試驗化學(xué)物質(zhì)濃度(mg/L)。 |
LC50(Oral rat) | 導(dǎo)致50%的大鼠口服后死亡的化學(xué)物質(zhì)量 (mg/kg bw)。 |
生物富集因子 (Bioaccumulation factor) | 達(dá)到平衡狀態(tài)時,化合物在生物體內(nèi)濃度與環(huán)境介質(zhì)中濃度的比值。 |
發(fā)育毒性 (Developmental toxicity) | 化學(xué)物質(zhì)是否會對人類或動物產(chǎn)生發(fā)育毒性效應(yīng)。 |
鼠傷寒沙門氏桿菌回復(fù)突變試驗 (Ames mutagenicity) | 如果化學(xué)物質(zhì)在鼠傷寒沙門菌菌株(Salmonella typhimurium)中誘導(dǎo)回復(fù)突變菌落生長,則該化合物為致突變物。 |
理化性質(zhì)預(yù)測終點:
預(yù)測終點 | 介紹 |
標(biāo)準(zhǔn)沸點 (Normal boiling poin) | 化學(xué)物質(zhì)在標(biāo)準(zhǔn)大氣壓(1個大氣壓)下沸騰的溫度(℃) |
蒸汽壓 (Vapor pressure) | 在25℃的密閉條件中,與固體或液體處于相平衡的蒸氣所具有的壓強(mmHg)。 |
熔點 (Melting point) | 化學(xué)物質(zhì)從固體變?yōu)橐后w的溫度(℃)。 |
閃點 (Flash point) | 化學(xué)物質(zhì)與外界空氣形成混合氣與火焰接觸時發(fā)生閃火并立刻燃燒的最低溫度 |
密度 (Density) | 單位體積質(zhì)量(g/cm3) |
表面張力 (Surface tension) | 液體表面層由于分子引力不均衡而產(chǎn)生的沿表面作用于任一界線上的張力(dyn/cm)。 |
熱導(dǎo)率 (Thermal conductivity) | 物質(zhì)傳導(dǎo)熱量能力的量度值 (mW/mK)。 |
黏度 (Viscosity) | 流體對流動所表現(xiàn)的阻力(cP) |
水溶性 (Water solubility) | 化學(xué)物質(zhì)溶于液態(tài)水中形成均相溶液的濃度(mg/L)。 |
預(yù)測方法:
T.E.S.T內(nèi)包含了Chi連接指數(shù)、Kappa形狀指數(shù)、2D結(jié)構(gòu)特征等14類,共計797個描述符。
同時,T.E.S.T的預(yù)測方法有5種,即層次聚類法、單一模型法、基團貢獻(xiàn)計算法、最近鄰法、一致性評價方法。用戶可依據(jù)自身需求選擇和合適的預(yù)測方法來增加預(yù)測結(jié)果的可信度。
方法 | 介紹 |
層次聚類法 (Hierarchical method) | 使用來自幾種不同聚類模型的預(yù)測加權(quán)平均值來預(yù)測化學(xué)物質(zhì)的毒性。 |
單一模型法 (Single model method) | 使用適合訓(xùn)練集的多元線性回歸模型進(jìn)行預(yù)測(使用分子描述符作為獨立變量)。 |
基團貢獻(xiàn)計算法 (Group contribution method) | 使用適合訓(xùn)練集的多元線性回歸模型進(jìn)行預(yù)測(使用分子片段計數(shù)作為獨立變量)。 |
最近鄰法 (Nearest neighbor method) | 通過取訓(xùn)練集中與測試化學(xué)物質(zhì)最相似的3種化學(xué)物質(zhì)的平均值來預(yù)測目標(biāo)化學(xué)物質(zhì)的毒性。 |
一致性評價方法 (Consensus method) | 通過取上述QSAR方法預(yù)測毒性的平均值來預(yù)測化學(xué)物質(zhì)的毒性(預(yù)測結(jié)果在各自方法的適用范圍內(nèi))。 |
模型擬合度:
用戶在進(jìn)行QSAR預(yù)測時往往最關(guān)心的是預(yù)測結(jié)果的準(zhǔn)確性。T.E.S.T.指南文件指出,如果QSAR模型滿足以下條件,則認(rèn)為該模型具有可接受的預(yù)測能力:
R2是真實值與預(yù)測值之間的相關(guān)系數(shù)(即為不過原點回歸時相關(guān)系數(shù)的平方),R02是回歸曲線截距為零時真實值和預(yù)測值之間的相關(guān)系數(shù)(即為過原點回歸時相關(guān)系數(shù)的平方),k是回歸曲線截距為零時的回歸方程系數(shù)。公式(1)(2)都是對線性回歸模型的擬合度量,滿足(1)(2)公式條件,即說明模型擬合度較好,具有良好的預(yù)測能力。
指南文件介紹了軟件中各個QSAR模型的統(tǒng)計參數(shù),本文以LC50(fathead minnow 96-hr)毒性終點和標(biāo)準(zhǔn)沸點(Normal boiling point)的測試集結(jié)果為例介紹T.E.S.T中的模型性能。
LC50(fathead minnow 96-hr)測試集結(jié)果:
LC50(fathead minnow 96-hr)測試集結(jié)果顯示,五種方法的R2均滿足公式(1)的條件,且一致性評價方法的結(jié)果最好。單一模型法、基團貢獻(xiàn)計算法、一致性評價方法不滿足公式(2)的條件。
依據(jù)T. E. S. T.指南指出不滿足這些條件的模型本身并非絕對無效的,其預(yù)測結(jié)果是相對保守的,應(yīng)該謹(jǐn)慎使用。
標(biāo)準(zhǔn)沸點(Normal boiling poin)測試集結(jié)果:
單一模型法不適用于標(biāo)準(zhǔn)沸點的預(yù)測,因此沒有其測試集結(jié)果,其余四種方法的三種指標(biāo)均符合公式(1)(2)的條件??偟膩碚f,標(biāo)準(zhǔn)沸點的測試集預(yù)測統(tǒng)計整體是很好的。
應(yīng)用域介紹:
對于一個可靠的QSAR預(yù)測結(jié)果而言除了關(guān)注模型預(yù)測能力外,還需確定目標(biāo)化合物是否在該模型的應(yīng)用域范圍內(nèi)。應(yīng)用域的功能就是界定能夠被QSAR模型可靠預(yù)測的化合物,也可理解為模型適用化合物的集合,通常可通過可從4方面來表征模型的應(yīng)用域:
①描述符變化范圍;②結(jié)構(gòu)相似性;③機理相似性;④代謝轉(zhuǎn)化途徑和產(chǎn)物,
若目標(biāo)化合物的上述特征在QSAR模型的應(yīng)用域內(nèi),則預(yù)測結(jié)果具有良好的可靠性;反之,則預(yù)測結(jié)果不具備良好的可靠性。
以3-氯-2-甲基苯胺(CAS:87-60-5)的IGC50(T. pyriformis 48-hr)預(yù)測為例,如下圖所示,3-氯-2-甲基苯胺均在層次聚類法建立的多個預(yù)測模型的應(yīng)用域范圍內(nèi),即Applicability Domain的一列結(jié)果均為“OK”,因此模型的總體預(yù)測結(jié)果相對可靠。
若目標(biāo)化合物預(yù)測結(jié)果此列并非“OK”,而顯示為“Rmax constraint not met”、“Model ellipsoid constraint not met”或是某個結(jié)構(gòu)片段超出應(yīng)用域范圍,其預(yù)測結(jié)果須謹(jǐn)慎使用。
綜上所述,T.E.S.T是一款由US EPA官方研究開發(fā)的QSAR毒性預(yù)測軟件,可以根據(jù)化合物的結(jié)構(gòu)信息預(yù)測其潛在毒性及理化性質(zhì),其中包括較為常見的7種毒性預(yù)測終點和9種理化性質(zhì)預(yù)測終點,并且具有5種預(yù)測方法,預(yù)測能力較好,結(jié)果可信度較高,但在使用的過程中仍需要對目標(biāo)物質(zhì)和預(yù)測結(jié)果進(jìn)行專家評估以得出專業(yè)準(zhǔn)確的結(jié)論。
在使用方面,軟件整體安裝簡單,操作便捷,用戶界面友好,并且配有較為詳細(xì)的用戶指南。隨著US EPA地不斷更新與完善,目前TSET已經(jīng)更新至5.1.2版本,適用于Windows和macOS系統(tǒng)。更詳細(xì)的內(nèi)容請參考軟件指南User’s Guide for T. E. S. T. (Toxicity Estimation Software Tool) Version 5.1。
軟件鏈接:Toxicity Estimation Software Tool (T.E.S.T) | US EPA
參考文獻(xiàn):
[1] Honma M. An assessment of mutagenicity of chemical substances by (quantitative) structure-activity relationship. Genes Environ. 2020;42:23.
[2] De P, Kar S, Ambure P, et al. Prediction reliability of QSAR models: an overview of various validation tools. Arch Toxicol. 2022;96(5):1279-1295.
[3] U.S. EPA (2020). User’s Guide for T.E.S.T (version 5.1) (Toxicity Estimation Software Tool): A Program to Estimate Toxicity from Molecular Structure.
[4] 唐睿,張松林,粱云明,等. 毒性評估軟件T.E.S.T及其在農(nóng)業(yè)污染化合物QSAR研究中的應(yīng)用[J]. 安徽農(nóng)業(yè)科學(xué),2010,38(36):20878-20879,20882
[5] US EPA. Environmental Optimization Using the Waste Reduction Algorithm. 2011 4/18/16]; Available from: nepis.epa.gov/Exe/ZyPURL.cgi?Dockey=P100DZKT.TXT.
[6] Martin TM, Harten P, Young DM, et al. Does rational selection of training and test sets improve the outcome of QSAR modeling?. J Chem Inf Model. 2012;52(10):2570-2578.
[7] 王中鈺,陳景文,傅志強,等.QSAR模型應(yīng)用域的表征方法[J].科學(xué)通報,2022,67(3):255-266.
[8] 陳景文,李雪花,于海瀛,王亞南,喬顯亮.面向毒害有機物生態(tài)風(fēng)險評價的(Q)SAR技術(shù):進(jìn)展與展望[J].中國科學(xué)(6期):461-474[2024-01-16]
※ 以勒申明:
本文內(nèi)容來源:由以勒標(biāo)準(zhǔn)翻譯整理。以勒標(biāo)準(zhǔn)尊重知識產(chǎn)權(quán),如轉(zhuǎn)載內(nèi)容涉及版權(quán)問題,煩請聯(lián)系我們及時處理。翻譯/整理不易,凡轉(zhuǎn)載或引用本網(wǎng)站內(nèi)容,請注明來源:杭州以勒標(biāo)準(zhǔn),感謝您的支持!更多法規(guī)資訊實時跟蹤,可搜索“以勒標(biāo)準(zhǔn)”官方微信公眾號,獲取第一手法規(guī)資訊,掌握最佳貿(mào)易時機!
0571-8519 0521
157875742
infor@jirehstandard.com