背景介紹
抗生素耐藥性在全球范圍內(nèi)呈上升趨勢,以及微生物不可避免地會對新的化學(xué)結(jié)構(gòu)產(chǎn)生抗藥性,因此需要不斷發(fā)現(xiàn)多種新的抗生素類別,而新抗生素開發(fā)周期通常需要10-15年。其中,共軛低聚電解質(zhì)(COE)分子是一類新型抗生素候選物,但其復(fù)雜的結(jié)構(gòu)、類似物的缺失和革蘭氏類型的特異性等進(jìn)一步加劇了挑戰(zhàn)。機(jī)器學(xué)習(xí)(ML)可以提供一種簡化開發(fā)的替代方法,從而確定分子結(jié)構(gòu)中與抗生素活性最密切相關(guān)的基本元素。
然而,可能會為每個COE分子生成數(shù)以千計的描述符,因此需要開發(fā)一個有原則的向下選擇過程,以便開發(fā)一個操作模型。分子特性的ML建模是通過應(yīng)用ML的最新發(fā)展實現(xiàn)的,特別是關(guān)于深度學(xué)習(xí)和分子表示,而ML模型和分子表示方法可以緊密聯(lián)系在一起。ML輔助抗生素特性預(yù)測中的許多方法都依賴于大型數(shù)據(jù)集,并專注于尋找與現(xiàn)有抗生素相似(即具有相同分布)的新候選抗生素。

成果簡介
近日,美國麻省理工學(xué)院Tonio Buonassisi和Armi Tiihonen、新加坡國立大學(xué)Sarah J. Cox-Vazquez和Guillermo C. Bazan(共同通訊作者)等人報道了一種預(yù)測共軛低聚電解質(zhì)(COEs)分子抗菌活性的模型,其中COEs是一類新的抗生素,但缺乏廣泛的結(jié)構(gòu)-活性關(guān)系研究。該模型可作為指導(dǎo)新預(yù)測COEs合成的咨詢工具,其由四部分組成:(1)分子指紋表示;(2)特征向下選擇;(3)ML模型配對;(4)描述符重要性分析。作者將該模型應(yīng)用于一組136個COEs中,使用一個對分子域不可知的自動分子描述符向下選擇過程。由此產(chǎn)生的指紋由21個分子描述符組成,其中40%以上與分子的三維(3D)形狀有關(guān)。這與不依賴于形狀的分子性質(zhì)相關(guān)的描述符或與分子形狀的低維簡化相關(guān)的描述符形成對比,例如沒有長度信息的分子鍵,與COEs的假定作用機(jī)制一致,即插入細(xì)菌膜。

圖文速遞



總結(jié)展望
綜上所述,通過該預(yù)測模型,作者證明了ML確實可以幫助抗生素的開發(fā),即使是關(guān)于潛在機(jī)制的信息很少,并且實驗數(shù)據(jù)的可用性有限的候選者家族也有效。作者還證明在傳統(tǒng)和復(fù)雜的ML模型中,分子代表性都會提高預(yù)測的準(zhǔn)確性:它需要捕捉抗生素活性潛在機(jī)制的關(guān)鍵信息,以實現(xiàn)高預(yù)測準(zhǔn)確性。
作者認(rèn)為如果指紋針對研究中的分子域進(jìn)行了優(yōu)化,那么指紋識別仍然是一種有效的選擇或?qū)W習(xí)表示的補(bǔ)充成分。最后,作者提出了一個域不可知框架來快速選擇和分析分子指紋,以描述新型抗生素。在該工作中作者只研究了一類分子 COEs,但 3D 描述符在指紋向下選擇中占主導(dǎo)地位表明能夠捕獲 3D 的表示和模型在其他抗生素候選域中也可能值得探索,尤其是當(dāng)分子很大時 和作用機(jī)制與這里懷疑的分子形狀有關(guān)。
文獻(xiàn)信息
Predicting Antimicrobial Activity of Conjugated Oligoelectrolyte Molecules via Machine Learning.J. Am. Chem. Soc., 2021, DOI: 10.1021/jacs.1c05055.
原創(chuàng)文章,作者:科研小搬磚,如若轉(zhuǎn)載,請注明來源華算科技,注明出處:http://www.xiubac.cn/index.php/2023/10/13/c0c410c5b4/