近日,百度在生物計(jì)算領(lǐng)域的最新研究成果《Geometry Enhanced Molecular Representation Learning for Property Prediction》,登上了國(guó)際頂級(jí)學(xué)術(shù)期刊《Nature》子刊《Nature Machine Intelligence》!
論文提出“基于空間結(jié)構(gòu)的化合物表征學(xué)習(xí)方法”,即“幾何構(gòu)象增強(qiáng) AI 算法”(Geometry Enhanced Molecular Representation Learning,GEM 模型),將化合物的幾何結(jié)構(gòu)信息引入自監(jiān)督學(xué)習(xí)和分子表示模型,對(duì)化合物進(jìn)行“3D 建模”,以預(yù)測(cè)化合物分子的性質(zhì)屬性。
在藥物篩選上的應(yīng)用,可在數(shù)小時(shí)內(nèi)完成傳統(tǒng)仿真方法1年的工作量,效率提升上千倍,有望大幅降低藥物研發(fā)的時(shí)間投入和成本投入。這是百度在 AI 賦能藥物研發(fā)領(lǐng)域的又一項(xiàng)重磅成果。
化合物的性質(zhì)和其三維空間結(jié)構(gòu)密切相關(guān),為了更好地預(yù)測(cè)化合物性質(zhì),亟需引入化合物的三維空間信息。百度此次提出的“基于空間結(jié)構(gòu)的化合物表征學(xué)習(xí)方法”,即 GEM 模型,在這一點(diǎn)上實(shí)現(xiàn)了重大突破,在全球范圍內(nèi)開創(chuàng)性地將化合物性質(zhì)預(yù)測(cè)從“2D 建模”推進(jìn)到“3D 建模”。
同時(shí),引入 AI 領(lǐng)域迅速發(fā)展的預(yù)訓(xùn)練技術(shù),利用大量無標(biāo)注的化合物數(shù)據(jù),通過自監(jiān)督學(xué)習(xí),構(gòu)建 GEM 模型的底層能力,有望能成為小分子藥物研發(fā)領(lǐng)域的模型底座,解決小分子藥物活性預(yù)測(cè),成藥性預(yù)測(cè),藥物設(shè)計(jì)等核心問題,真正加速藥物,特別是全新藥物(First In Class)的發(fā)現(xiàn)過程。