火山引擎助力星藥科技,打造藥物研發新正規化

從神農嘗百草,到李時珍踏遍神州寫下《本草綱目》,他們無一不是在身體力行尋找治病救人的藥。如今,藥物的研發雖然不必行萬里路,卻也一樣要不斷的嘗試,持續的研發。

作為國內藥物研發創新的代表,星藥科技(Galixir)從2019年成立以來始終在使用尖端人工智慧技術賦能藥物研發。星藥透過使用人工智慧的前沿演算法,結合計算化學、藥物化學和生物學的工具及經驗,全方位攻克小分子藥物早期研發流程中的疑難問題,快速發現活性高、成藥性好且結構新穎的候選分子。在這一過程中,火山引擎為星藥科技提供了一系列的技術產品支援,大幅降低了藥物研發過程中的算力需求門檻。

智慧時代的藥物研發

星藥科技目前已經和國內外藥企以及研究機構進行了諸多合作,推進多個藥物研發管線,覆蓋中樞神經系統疾病、自體免疫類疾病、腫瘤、呼吸系統疾病等不同疾病領域,作用機制包括抑制劑和激動劑等不同類別。

透過技術創新,星藥科技將單個臨床前藥物研發管線的成本和時間大幅降低和縮短,使得同時儲備多條藥物研發管線、最佳化整體戰略佈局都成為了可能。星藥科技獨立透過將蛋白結構建模,分子設計、性質預測、逆合成分析與智慧計算平臺M1及Pyxir平臺有機結合,配合生物實驗平臺,形成了“AI-計算-實驗迭代”的藥物研發新正規化。尤其在M1計算平臺中,星藥科技FEP和Docking計算精準度已達到業界先進水平,邀測情況良好,並已完成商業化落地。

技術的發展很難一帆風順,一些難題在研發過程中逐漸浮出水面:

首先,面對業務量的波動,需要實現按需排程的彈性伸縮算力,最大化利用計算資源;

其次,以往計算節點較多,需要大量專人開發維護叢集,才能保證應用的高可用性;

第三,醫藥研發有海量非結構化檔案資料讀取需求,這就需要有高吞吐的資料讀取能力。

面對以上難點,也為了建立更多增益的差異化管線,尤其是未成藥、難成藥靶點的藥物管線,星藥科技需要有一個充足的、動態的、極致價效比的算力資源,一個可以提供無限計算、儲存等擴充套件能力的雲超算平臺。如果能實現這樣的雲超算平臺,就可以滿足其計算任務需求,為藥物研發新正規化提供動態資源,從而在更短時間內獲得期望的實驗結果。

火山引擎高效能計算平臺

星藥科技引入了火山引擎的高效能算力資源、機器學習平臺及高效能並行檔案系統等資源。基於火山引擎高效能計算平臺,星藥科技能夠無縫整合彈性容器,靈活排程底層計算資源,實現了海量例項快速秒級啟動,從而靈活應對計算高峰。

火山引擎助力星藥科技,打造藥物研發新正規化

火山引擎機器學習平臺幫助星藥科技無縫對接了已有叢集資源排程引擎Slurm,支援全流程的資料管理、程式碼開發、模型訓練等全生命週期工作流;透過機器學習平臺對Gromacs的GPU效能最佳化,大幅提升效率、降低成本;同時,減少了星藥科技對Slurm叢集的維護負擔,節省人力成本30%。

火山引擎與星藥科技的合作解決方案

星藥科技透過整合火山引擎的技術產品,獲得瞭如下能力:

• 高可用彈性算力叢集。其能夠利用雲上的高可用、靈活伸縮的特性,實現資源的按需實時呼叫,無需關心擴容策略。

• 高效能並行儲存-vePFS。提供亞毫秒級時延,20G/s吞吐,百萬級IOPS,同時可以線上彈性擴充套件,容量與效能實現線性靈活增長。

• 機器學習平臺。能夠支援Slurm提交任務;支援NVIDIA Clara系列工具(如Gromacs)的雲端應用,實現醫療生信行業任務的GPU加速;支援從資料託管、程式碼開發、模型訓練、模型部署的全生命週期工作流。

• 遷移對接便利:利用Terraform,在多個可用區快速批次建立雲上高效能計算叢集,節省人力成本,實現資源彈性敏捷。

總體來看,星藥科技在與火山引擎合作後,透過引入IntelAVX512最佳化指令集,使得整體效能提升了30%;透過火山引擎機器學習平臺提供的Slurm提交任務,能夠卸下自己維護Slurm叢集的重擔,減少人力成本投入30%;同時,在火山引擎機器學習平臺中最佳化Gromacs的GPU效能,將原本需要7小時處理的任務降低到不足3小時,同時算力成本降低至60%,藥物研發的先導化合物發現階段整體效率提升20%。

在聯手火山引擎後,星藥科技更高效準確地找到比對標藥物活性更好、並具有更大專利空間的全新分子,進而大幅度節省藥物開發環節的時間和成本。雙方聯手實現以“AI驅動的研發管線”和“AI賦能的計算平臺”的雙迴圈,賦能藥物研發產業,讓新藥的研發更加高效。