數(shù)字金融
網(wǎng)絡營銷推廣
電商服務
來源:碼客人生
一位生命科學教授要走的路。
作為一名高校教授,常珊在 2020 年決定,擔任 AI 制藥公司普美瑞生物的 CTO 。
那一年,他 38 歲,巧合的是當年國內成立了 38 家這樣的公司。這是一種偶然,但也有不少機緣,因為像他這樣具有高?;蜓芯吭罕尘暗墓炯夹g負責人,幾乎占據(jù)了 AI 制藥的半壁江山。后來業(yè)界約定俗成,把 2020 年稱作“中國 AI 制藥元年”。
那時常珊早已是江蘇理工學院的一名教授,還擔任該校生物信息與醫(yī)藥工程研究所的所長,教研和行政兩重職務,讓他那幾年尤其拼命,“仍像學生一樣,每天早早去實驗室,工作到很晚?!?/p>
在旁人看來,常珊是個時間再難擠出一絲的人,但他自己不這么覺得,還會在每兩年一屆的 CASP 競賽開啟之時,拿出扎實的三個月時間專注于此。
CASP 是被譽為“生物界的奧林匹克競”的全球性賽事,比拼的是對蛋白質三維結構的預測,2020 年由谷歌旗下DeepMind 開發(fā)的名為 "AlphaFold 2" 的 AI 系統(tǒng),就是在此奪冠揚名立萬。因此,對于想在生命科學領域建立聲名,躋身全球前沿科研梯隊的初創(chuàng)公司和高校學者來說,此賽是一條出路。
可想而知,這非常消耗體力。常珊說到,“CASP 的壓力非常大,要求在三個月內完成上百道題目,如果是其他競賽我能邊做題目邊進行學位論文研究,但 CASP 要求參賽者全心投入,掐著表計算時間,每天都要提交結果,處理新題目?!?/p>
2022 年底,常珊在 CASP 15 中拿下“蛋白/RNA-配體復合物結構預測”賽道的冠軍。
他笑著承認了,緊接著又低調表示,這只是一個小領域的評估,“這里我們還可以這樣優(yōu)化...這個技術可以這樣落地...”但變化還是有的,賽后請他做報告的更多了,他的研究有人關注了,專程來請教他干濕實驗結合的人也多了,這是常珊成立獨立實驗室以來的重要時刻--他被注意到了。
由于常珊奪冠的這一賽道與藥物設計緊密,不久后,人民郵電出版社找到常珊,提議由他編寫一本書籍,名字就叫做《人工智能輔助藥物設計》。要求只有一個:通俗易懂,還要反映最新的技術應用。
常珊直言,即便早在博士時參與過導師編寫的專著,但當時更多是呈現(xiàn)核心研究成果,現(xiàn)在則是給相關從業(yè)人員、相關專業(yè)的學生做參考,經(jīng)驗不可直接復制。經(jīng)過兩年籌備,這本新書在今年六月正式面市。常珊感慨,這段工作終于告一段落,又有精力投入到今年的 CASP 16 競賽中。
在與我們的交談中,他多次用平穩(wěn)的聲音表示,參賽是一件嚴肅的事,“這相當于一種‘’壓力測試‘,考驗你是否能在短時間內快速適應問題,并提出解決方案?!?/p>
常珊做了一個形象的比較:通常我們博士期間做一個項目,如果沒有時間限制,可能花上兩年也未必能完成。但在競賽環(huán)境里,可能你會在一周或兩周內解決一個實際問題。
為了迎接今年的競賽,常珊早在賽前半個月就做了復盤,一是對程序進行了徹底的審查和整理,二是引入了更自動化的處理流程,降低人為錯誤并提效。
和他組隊的人說,常珊做什么事都是這樣提早安排。而常珊也想知道,他還能窺探多少未知。
近日,至頂科技&《碼客人生》對話常珊教授,探討了他持續(xù)參賽的動力所在、新書的創(chuàng)作過程,并對他過往二十余年的學術經(jīng)歷做了回顧。
以下是對話內容(經(jīng)編輯):
▋ 01 AI 正在改變生物學和藥學
《碼客人生》:首先請您介紹下《人工智能輔助藥物設計》這本書的創(chuàng)作初衷。
常珊:這本書是與同校的謝良旭博士聯(lián)手打造的成果。
最初人民郵電出版社找到我,提議編寫一本AI輔助藥物設計的書籍,我立刻想到與在該領域經(jīng)驗豐富的謝博士合作,我們迅速組建了一支研究生團隊,并明確分工。
首先,書中內容要立足于基礎,旨在作為教材。
因為我們發(fā)現(xiàn),許多學生急需一本基礎扎實的教材來打牢基礎,如果缺乏必要的計算機或Python編程知識,他們難以跟上專業(yè)應用的深入討論。因此,我們與人民郵電出版社一道,力求以淺顯易懂的方式呈現(xiàn)內容,降低入門難度,吸引更廣泛的讀者群體,幫助他們輕松邁入AI輔助藥物設計的世界。
其次,書中內容要反映最新的技術應用,覆蓋行業(yè)內實際應用案例。
在我們著手編寫這本新書之前,市面上雖有相關書籍,如上海藥物研究所出版的書籍,以及北大徐筱杰教授早期的作品,但這些大多出版于2010年以前,對當下最新人工智能技術的介紹相對較少。特別是在2020年AlphaFold技術取得突破后,AI與藥物設計的結合變得熱門,市場迫切需要反映這一領域最新進展的書籍。
《碼客人生》:那么書籍結構是怎樣的,創(chuàng)作周期多久?
常珊:這本書是從2022年開始規(guī)劃,大約花了一年多的時間編寫完成。我們原計劃在2023年完成并出版這本書的,但似乎時間上有些倉促,我們不得不將出版計劃推遲到了2024年。
書的前幾章主要是介紹Python的基礎知識,隨后的章節(jié)則深入到藥物設計的具體應用,包括分子生成、結構預測、分子對接等專業(yè)領域,通過代碼示例讓讀者更深入地理解。
《碼客人生》:您和謝良旭博士在專業(yè)背景上有哪些異同,你們合作著書的優(yōu)勢是什么?
常珊:我們各有所長。我的專長是計算數(shù)學和算法開發(fā);謝博士是化學出身,碩博士研究都集中在計算化學和藥物設計領域,特別是在應用場景方面。我們這樣的組合,較好地融合了AI與藥物設計。
常珊、謝良旭
這確實是我們首次嘗試合作的書籍。
自2020年AlphaFold技術在生命科學領域引起轟動以來,雖然當時它在藥物設計方面的應用尚未成熟(或者說在小分子預測方面還沒有完全發(fā)揮其功能),主要集中在蛋白質結構預測上,但我們已開始關注這一趨勢。
到了2022年,藥物設計和結構預測都成為了CASP競賽的熱點。我們團隊在CASP15藥物設計競賽中獲得第一名,這不僅證明了我們預測方法的準確性,也為我們提供了深入洞悉行業(yè)的機會。
因此,我們與出版社的合作,可謂恰逢其時,我們成為了最早策劃此類專業(yè)書籍的團隊之一。
《碼客人生》:您之前是否參與過其他書籍的編寫?
常珊:我參與過大概4本書的編寫,但都是以合作者的身份,并非主編。
其中一些書籍是我博士導師是王存新教授(北京工業(yè)大學)所主導的,他提議編寫專著來總結我們實驗室的研究成果,書名是《蛋白質模擬—原理、發(fā)展和應用》。
王老師還出版了“新生物學叢書”這套叢書中的另一本書《蛋白質模擬的多尺度方法》,是國外教材的中文譯作。
還有是成都大學胡建平教授編寫的《計算機化學實踐基礎教程》和《計算機輔助藥物設計理論及應用》,我在其中負責了代碼編寫的部分章節(jié)。
這些書籍記錄了我們博士期間的科研探索和對其他學者工作的翻譯整理,專注于專業(yè)領域,不涉及基礎內容,對普通讀者而言可能較難理解。
與以往專著不同,此次編寫《人工智能輔助藥物設計》這本書時,我們特別注重內容的通俗易懂,同時不失深度和準確性,力求讓復雜的知識變得易于消化。
《碼客人生》:今年AI制藥的市場情緒有些低迷,AI至今還沒有成功研發(fā)出一款新藥上市。然而現(xiàn)在大家又非??春肁I,將技術融入到藥物開發(fā)的各個環(huán)節(jié)。您是怎么看待這種矛盾的?
常珊:我認為這可能與藥物研發(fā)的長周期性有關。盡管AI可以加速早期分子設計,但后續(xù)的動物體內實驗和臨床試驗環(huán)節(jié)不可或缺,且AI無法替代,這是AI在藥物研發(fā)中的限制之一。
同時我們也要認清楚,AI在技術能力和應用場景上仍在探索中,并非萬能。
例如,在視頻生成領域,盡管AI技術如Sora令人印象深刻,但轉化為商業(yè)產(chǎn)品還需時間。
同樣,在藥物設計中,AI雖能解決初步問題如構效關系預測、毒性評估,但整體藥物研發(fā)過程仍需大量實驗和驗證,這些AI暫時無法替代。而且藥物最終是要被人體攝入的,其安全性和有效性會受到嚴格的審查和評估。所以,AI在解決單一問題上表現(xiàn)出色,但要提供一個整體的解決方案卻難。
以AlphaFold為例,自問世以來,盡管許多人聯(lián)名要求公開源碼,但開發(fā)者出于商業(yè)保護的考慮并未公開。即便如此,一些制藥公司如禮來和諾華,已經(jīng)看到了AlphaFold在藥物設計方面的潛力,并與之簽訂了合作協(xié)議。這表明業(yè)界對AI在藥物設計領域的應用充滿期待。
但同時我們也要認識到,AI應與人類專家的知識經(jīng)驗結合,共同推動藥物研發(fā),而非單獨行動。換句話說,這也是我們編寫此書的原因,讓更多人生物醫(yī)藥的從業(yè)人員可以應用AI這個工具。
▋ 02?CASP競賽的十年老兵
《碼客人生》:今年5月,AlphaFold 3亮相,您在朋友圈提到“這個時間點推出,意味著今年參加CASP競賽的難度更高了。”為什么會有這樣的感受?
常珊:實際上,每兩年一度的CASP競賽不僅是生命科學界的一場盛會,也是我們一窺AlphaFold功能演進的重要窗口。
AlphaFold 1,由DeepMind精心打造的革命性AI程序,于2018年CASP 13上首次亮相,便以卓越的表現(xiàn)在98支參賽隊伍中脫穎而出,榮獲第一。
繼此之后,AlphaFold 2在2020年發(fā)布,并在同年11月30日的CASP 14中刷新了歷史,其預測的蛋白質結構精度已經(jīng)達到可與實驗結果比較的程度,標志著蛋白質結構預測的新時代。
直至2024年5月8日,AlphaFold 3在《Nature》雜志上隆重發(fā)布,它不僅繼承了前代的優(yōu)勢,更在預測精度和生物分子類型的覆蓋面上實現(xiàn)了飛躍。
用一句話來說,AlphaFold 1主要解決了蛋白質單體結構預測的基礎問題,而AlphaFold 2則引入了Transformer模型,進一步提升了預測的準確性。AlphaFold 3則解決了前代的局限,不僅能夠處理單體蛋白質,還能精準預測多體蛋白質結構,甚至是小分子和RNA。
簡而言之,AlphaFold 3不僅拓寬了預測范圍,提高了精度,更激發(fā)了人們對其在藥物設計領域應用的無限遐想。
尤為引人注目的是,AlphaFold 3的發(fā)布恰逢CASP 16之前,甚至于DeepMind在2023年11月就已透露AlphaFold 3將能預測多種分子間的相互作用,這似乎預示了組委會的前瞻性布局,為競賽增添了更多懸念,使得這場科學競技更加激動人心。
要知道,2022年的CASP 15新增的Ligand和RNA預測賽道,無疑是對2020年發(fā)布的AlphaFold 2的全新挑戰(zhàn)。盡管AlphaFold 2并未參加CASP 15競賽。但今年CASP組委會和DeepMind看來都做了一些準備。
《碼客人生》:今年的CASP 16,組委會增加了什么難度呢?
常珊:第一大難點:比例未知的情況下預測蛋白質和RNA的組合結構。
目前AlphaFold 3具備預測蛋白質與RNA組合結構的能力。若A代表蛋白質,B代表RNA,你自然能夠預測A與B結合后的形態(tài),這似乎順理成章。
然而,現(xiàn)實情況遠比這復雜。我們只知道存在A鏈和B鏈的若干條,卻不清楚它們的確切比例。可能是2A+3B,1A+1B,又或是3A+5B等組合,這使得已知條件顯得有些不足,AlphaFold 3能否直接預測出來?
這顯然是非常困難的。因為如果給定足夠的輸入,AlphaFold 3是能夠預測出來的,但現(xiàn)在輸入的具體組合不知道,這就增加了難度。
顯然,若輸入條件充分,AlphaFold 3尚能應對,但在具體組合未知的情況下,難度便陡然上升。若參賽者在實際比賽中,面對如3A+4B的真實組合,卻預測出了其他比例,那結果便謬以千里。即便預測的細節(jié)再精確,一旦組合錯誤,一切便前功盡棄。這無疑增加了競賽的難度,組委會的出題策略確實頗具挑戰(zhàn)性。
在自然界,蛋白質或分子的組合遵循一定規(guī)律,但這些規(guī)律往往過去的算法暫時還沒考慮這一類問題。算法或許能根據(jù)提供的確切數(shù)量和組合方式預測結構,但若連這些基本信息都不全,卻要求算法自行組合、推測比例,難度便成倍增加。
第二大難點:AlphaFold 3在預測分子間相互作用的基礎上,暫時還未評估這些分子的親和力,尤其是在眾多候選分子中識別出最強結合分子的能力。
具體來說,在藥物設計領域,現(xiàn)實場景更為復雜。CASP組委會不僅希望算法能預測數(shù)百個分子的結合姿態(tài)——AlphaFold 3在這方面已有所成就——更關鍵的是,我們想知曉哪些分子的親和力更強?哪些更可能成為有效的藥物?哪些與藥物靶點的結合最為緊密?
但這有可能不在AlphaFold 3的訓練數(shù)據(jù)范圍。因此,AlphaFold 3是否參與今年的競賽,以及它如何應對這些挑戰(zhàn),成為了一個值得關注的問題。如果它選擇參賽,那么必須找到有效的方法來攻克這些難題。
《碼客人生》:總體來說,今年的競賽與往年有哪些不同?已經(jīng)有人指出,今年的預測目標主要集中在核酸結構預測、Protein-ligand預測。
常珊:還有一個新增的挑戰(zhàn):構象多樣性的預測。
這個概念可能有些不容易理解,它指的是即使輸入條件,即序列完全相同,蛋白質或RNA的結構也可能呈現(xiàn)不同的狀態(tài),如何讓模型輸出不同的結果呢?
AlphaFold 3在其論文中提到,這是它目前還無法實現(xiàn)的一個方面。但如果給不同的隨機數(shù),有可能能夠預測出不同的狀態(tài),但這并不完全可靠。
《碼客人生》:隨著CASP競賽的不斷發(fā)展,它是否還主要是一個競技活動,未來能否通過這個競賽促進技術落地?在今年5月競賽報名通道開啟前,已有實驗派教授主動聯(lián)系我,表達了他們希望與生物信息學專家合作的愿望,以期補齊AI的實驗驗證。對于未來比賽的展望,您作為資深參賽者,是否考慮過技術轉化或合作的可能性?
常珊:我認為落地是肯定的。以本屆比賽中的Ligand預測題目為例,其中有4道非常復雜的題目,它們的設計并不像是出自一般學術實驗室,而更可能是由制藥公司提出。
這些題目要求對上百個蛋白質-Ligand復合物的結合姿態(tài)和親和力進行預測,這在學術研究中并不常見,反而更像是制藥公司在藥物篩選過程中的實際需求。他們匯總了多年的藥物篩選數(shù)據(jù),希望參賽者能夠進行預測,從而評估不同分子的潛力。如果參賽者在這方面表現(xiàn)出色,很可能會引起制藥公司的關注,進而尋求合作機會。
這相當于進行了一次盲測,而如果你很好地解決了盲測問題,他們有理由相信,你在面對實際問題時也能給出優(yōu)秀的答案。
因此,我認為CASP競賽的組織者已經(jīng)充分考慮了技術落地的問題,使比賽不僅限于學術展示,而是真正幫助產(chǎn)業(yè)界解決實際問題。通過這種方式,比賽能夠選拔出真正能夠解決產(chǎn)業(yè)界實際挑戰(zhàn)的算法,這樣的技術才是真正有價值的。
《碼客人生》:您從2004年碩博連讀時期就開始參加CASP競賽和CAPRI競賽,能回顧下這些年來的參賽經(jīng)歷嗎?
常珊:我們不是單獨參賽的,而是課題組一起參加。
因為我是當時實驗室唯一擁有計算數(shù)學背景的學生,導師很自然地將我安排到了負責預測的小組。我們實驗室有多個小組,包括生物組、生命科學實驗組、模擬組。但我的博士導師王存新教授認為,預測工作的核心是算法,這是一項基礎性的工作,因此,我順理成章地加入了這個小組。
我們更多參與的是CAPRI競賽。CASP由于難度較大,當時課題組沒有特別可靠且高效的算法,我們較少參與。CAPRI競賽的題目較少,比賽節(jié)奏和強度也沒有CASP那么大。
我從2004年開始參加CAPRI競賽,當時對這些還一無所知,就被拉進了團隊。起初主要是向師兄師姐們學習,逐漸了解競賽的具體情況。到了博士后期我就成為了團隊的主力,主要負責打分函數(shù)專題。從打分函數(shù)的算法設計到最終提交,所有工作都是由我完成的。
2008年王存新教授課題組合影
總體而言,當時國內參與這兩類高水平競賽的學者并不多。中科院物理研究所的江凡教授有參加、華中科技大學的肖奕教授也會參加,但王存新教授一直堅持參賽。他在中科大時期就開始從事分子模擬和生物信息學的研究,可以說是國內最早一批從事這一領域的科學家。而且王教授應該是當時國內成績最好的,因為在當時的多次賽后評估會議上,他都被邀請做口頭報告。
經(jīng)過這樣的經(jīng)歷,我在五年博士期間一直參與競賽,也獲得過一些好的預測結果。隨著時間的推移,我曾考慮過轉換研究方向,但命運讓我在從事博士后工作時加入了密蘇里大學鄒曉勤教授的團隊,她也是長期參與這一競賽的學者之一,而且鄒教授的先生--陳世杰教授,也在進行RNA結構預測的研究,所以我也繼續(xù)深入結構預測的研究。
鄒曉勤、陳世杰
回國后,我決定繼續(xù)沿著這一方向前進,因為我相信,不繼續(xù)這一領域的研究會讓我感到遺憾。
如今,國內在這一領域已有顯著成長,許多課題組取得了優(yōu)異的成績。比如上一屆比賽中的大部分排名第一的參賽者,都曾是密歇根大學張陽教授課題組的成員。
《碼客人生》:從2004年至今有十年了,今年您依舊參賽,是什么激發(fā)了持續(xù)參賽的動力?
常珊:作為多屆競賽參與者,我認為CASP和CAPRI競賽的時限性,教會了我如何在壓力下快速適應并提出解決方案,這是在任何快節(jié)奏的工作環(huán)境中達成目標的關鍵能力。
這兩種競賽具有明確的時限性,每道題目都要求在短短的半個月或一周內完成。
通常我們在讀博士期間做一個項目,如果沒有時間限制,我可能花上兩年也未必能完成。但在一周或兩周內解決一個實際問題,這有點像我們之前參加的數(shù)學建模競賽,它實際上是對你的一種極大的“壓力測試”。它考驗你是否能在短時間內快速適應問題,并提出解決方案。
這在實際工作中非常重要,因為當你真正進入公司或應用場景,公司會給你設定里程碑,比如給你三個月時間,不會像做研究那樣給你幾年時間。
這些競賽教會了我一個非常重要的技能:如何在有限的時間內對一個問題找到解決方案,哪怕這個方案不是完美的,但至少我能拿出一個可行的解決方案,并取得不錯的成績,這是非常關鍵的。
《碼客人生》:CASP和CAPRI競賽在考察程度和做題過程上有所不同,具體是哪些方面?今年參賽CASP 16,您有哪些準備工作?
常珊:兩者的規(guī)則有所不同。
CASP每兩年舉辦一次,要求在三個月內完成上百道題目,而CAPRI則是時間隨機的競賽,每年可能只比3~5道題左右,時間更充裕,壓力相對較小。我們參加CAPRI時可以邊做題目邊進行學位論文研究,但CASP的高強度則要求參賽者全心投入。就像我們今年參加CASP 16一樣,這三個月我?guī)缀鹾茈y做其他事情,必須掐著表計算時間,每天都要提交結果,處理新題目。
坦白而言,2004年時,國內鮮有團隊在CASP競賽取得佳績,至少在我參與的學術會議中,未曾聽聞國內團隊在此賽事上取得突出成績。那時,我們更多地將目光投向國外,以他們的研究進展為學習榜樣。
今年參與CASP 16的征程并非我孤身一人,而是有一支由不同課題組的博士生、研究生以及年輕教師組成的團隊。賽前半個月,我對我們的程序進行了徹底的審查和整理,復盤了上屆比賽的代碼,并針對之前遇到的難題開發(fā)了新的代碼,力求在本屆競賽中能有更好的表現(xiàn),減少緊張感。我們還引入了更自動化的處理流程,降低人為錯誤,提升工作效率。
當然競賽中總有一些出人意料的挑戰(zhàn),例如組委會給出的新挑戰(zhàn),我尚未找到一個完美的解決方案,因為未知的分子組合給我的預測工作帶來了不確定性,今年對我們團隊來說挑戰(zhàn)巨大。
《碼客人生》:今年您選擇了哪些賽道參賽?同時作為普美瑞生物公司的首席科學家,您的參賽選擇是否也考慮了公司的實際需求?
常珊:今年,我參與了蛋白質和多體預測賽道,兩個領域我們一直在參與,這次也不例外。
對于涉及RNA的問題,我們也會進行嘗試,因為這類題目常常與蛋白質相互作用的題目混合出現(xiàn)。我們的目標是全面覆蓋這些領域,確保不錯過任何可能的得分機會。
在競賽中,每個題目都至關重要,放棄任何一個都可能意味著失去重要的分數(shù)。這就如同參加十項全能,放棄任何一項都會影響最終的總成績。
我們的選擇還基于算法的適應性和團隊的專長。我們在蛋白質結構預測方面有比較多的積累,盡管RNA結構預測也是我們涉獵的范圍,但相對來說,我們在這方面的經(jīng)驗較少。在藥物設計領域,我們更多地關注抗體、多肽和小型分子藥物,而不是RNA。
至于QA(Quality Assessment)預測,我對其規(guī)則尚不夠熟悉。浙江工業(yè)大學的張貴軍教授在這一領域是專家,我期待有機會向他學習,以便更好地理解這一賽道的具體要求和挑戰(zhàn)。
▋ 03 “既要模擬,又要實驗”
《碼客人生》:能否概述您的學術旅程和關鍵轉折點?您參與了哪些課題和項目?
常珊:我的學術之旅是不斷探索的過程。從北京工業(yè)大學,經(jīng)華南農(nóng)業(yè)大學,到美國密蘇里大學,我一直在尋找最適合自己的研究環(huán)境。
博士時期我更側重理論研究。
我在王存新教授的實驗室,我所在的課題組以計算生物學為主攻方向,開發(fā)和優(yōu)化蛋白質對接的算法及其評分函數(shù)。這些工作都是純粹的算法研究,并未深入到藥物設計的具體應用場景中。
我雖未親自在實驗臺前動手操作,但在王教授實驗室深受前沿計算與實驗結合的研究環(huán)境影響。
王教授的團隊成功構建了一個多學科交叉的創(chuàng)新平臺,這是當時國內實驗室是不多見的。而且我的博士舍友是一位專注于實驗科學的研究者,我們頻繁交流,讓我得以深入理解實驗工作的細節(jié)。這為我后來在江蘇獨立搭建實驗室時提供啟發(fā),我還向他咨詢了許多關于實驗室建設和管理的意見。
2014年,我選擇加入江蘇理工學院,也是因這里能提供干濕實驗結合的平臺。就像陳潤生院士經(jīng)常強調,“生物信息學研究應將計算與實驗緊密結合,以確保算法的實用性?!?/p>
正如你剛才提到的,許多從事生物實驗的研究人員也想了解計算方法,甚至參與CASP這類的競賽。實際上,從事計算模擬的人也有這樣的需求,但能否在同一個實驗室內很好地滿足這種需求,緊密銜接計算與實驗,這是我一直以來想要做好的事情。
而且因為有過去的經(jīng)歷,即便我沒有直接投身于實驗操作,我也能比較準確把握實驗人員的需求或困難。
目前,我定期與實驗團隊交流,他們向我展示實驗成果和數(shù)據(jù),而我則提出一些解決方案,確保我們的計算工作能夠滿足實驗需求。例如近期成果是蛋白質降解劑的設計。
這種能力至關重要,它教會了我算法開發(fā)必須腳踏實地,緊密聯(lián)系實際問題。一個優(yōu)秀的算法不僅要在技術上合理,更要在解決現(xiàn)實問題中發(fā)揮關鍵作用。
《碼客人生》:現(xiàn)在您的研究領域涵蓋了AI輔助藥物設計、機器學習、高性能計算、分子識別,還有腦機接口和穿戴式智能設備。軟硬件都關注嗎?這對您有何挑戰(zhàn)?
常珊:我的教研工作背后,有著一些現(xiàn)實的考量。
由于我們學校的碩士課程設置偏向機械工程,而非信息學科,我指導的研究生課題自然也傾向于這一領域,這也是我會涉及到腦機接口和穿戴式設備研究的原因之一。
對我而言,無論是哪個領域的研究,關鍵在于能否將其轉化為數(shù)學問題或模型。無論是分子生物學、信號處理還是穿戴式設備數(shù)據(jù)分析,最終都可以通過數(shù)學模型來求解。
而且這些跨學科的研究令人興奮,也為我們提供了解決復雜問題的新視角和工具。我致力于尋找一個平衡點,既能滿足學術培養(yǎng)的要求,又能充分發(fā)揮我們團隊在算法研究上的優(yōu)勢。
《碼客人生》:能否分享您近期的一些成果,具體課題或落地項目?
常珊:近期我們在分子設計領域取得了顯著進展,這是我們特別擅長的領域,而且像AlphaFold 3這樣的新技術也非常專注于這一領域,特別是在“降解劑”的設計上。
傳統(tǒng)藥物設計側重于開發(fā)“抑制劑”,以控制異常蛋白質的過度表達,如激酶的過度表達可能導致細胞的異常增殖,白血病就屬于中性粒細胞快速增殖。
這種情況下,我們需要找到一種“抑制劑”,來抑制這些蛋白的活性,防止它們引起細胞的過度增殖。但問題在于,使用“抑制劑”治療時,蛋白質其實仍然存在于體內,抑制劑的作用僅僅是抑制該蛋白質的功能。因此,這種治療方式可能會引發(fā)一些問題:如果蛋白質仍然存在,為了維持治療效果,可能需要保持“抑制劑”的劑量。否則,新的蛋白質被合成或有抑制劑脫靶,則抑制作用還會收到影響,異常蛋白質仍然可能引發(fā)疾病。
而我們的研究則探索了一種創(chuàng)新策略——通過設計“降解劑”,不僅希望抑制異常蛋白的功能,更通過促進其降解來降低蛋白水平,為治療一些難以用傳統(tǒng)“抑制劑”應對的疾病提供了新思路。
具體來說,這種降解策略是將目標蛋白與E3泛素連接酶結合,利用人體內的自然降解機制。這類似于使用雙面膠,一端粘附目標蛋白,另一端粘附E3連接酶,泛素化并降解異常蛋白。通過這種方式,異常蛋白質被直接降解,提供了一種從根本上解決問題的新途徑。
然而,開發(fā)這種降解劑面臨一些挑戰(zhàn)。
因為它需要一個小分子藥物同時與目標蛋白和E3泛素連接酶發(fā)生作用,這就涉及到“小分子與蛋白質的相互作用”,以及將這兩種蛋白拉近后的“蛋白質-蛋白質相互作用”。這種相互作用是多體間的,或者說是三體或更多體的相互作用,這比傳統(tǒng)的“單一小分子與單一蛋白質的相互作用”要復雜得多。
目前,計算上還沒有非常成熟的、通用的方法來解決這個問題。
幸運的是,我們課題組在“小分子-蛋白質相互作用預測”和“蛋白質-蛋白質相互作用預測”方面都有較強的實力,因此我們開發(fā)了一種新算法--能夠迅速設計出潛在的分子,并在合成獲得分子后,迅速進行細胞降解實驗。
我們的分子設計數(shù)量不多,大約4~5個,但效果較好,幾乎每次都能發(fā)現(xiàn)降解活性在納摩爾水平的分子。表明這些分子在較低的劑量下就能實現(xiàn)目標蛋白的有效降解。通常在兩個月內,我們就能篩選出這樣的分子。
我們在4個不同的體系上進行的實驗都已證實了我們分子的降解能力,目前我們正在進行體內實驗,主要是動物實驗,以進一步觀察這些分子在體內的作用效果,并驗證它們的降解效率。
《碼客人生》:這個過程中哪一步最難?
常珊:一個關鍵的限制步驟是--獲取分子實體。
設計分子本身很快,我可能在一周內就能完成,但合成實際的分子實體卻需要更長的時間,這是AI輔助藥物研發(fā)中的一大難題。尤其是對于結構復雜的大分子,即便擁有自動化合成技術,合成路徑的確立和實現(xiàn)依然充滿挑戰(zhàn),往往需要依靠經(jīng)驗豐富的化學合成專家。
缺乏實體分子會嚴重影響后續(xù)實驗的進行。我們常常需要等待長達一個多月,甚至兩個月的時間才能獲得所需的分子。一旦分子到手,我們的實驗進度便會加快,通常在兩周內就能完成驗證實驗。
此外,獲得分子實體僅是開始,我們還需對其進行一系列深入的實驗,全面評估其藥代動力學特性,包括毒性和代謝等方面的數(shù)據(jù)。我們仍在不斷探索之中,有時還需委托外部專業(yè)機構來協(xié)助完成。
因此,實驗設備、專業(yè)技能和外部合作都是我們研究中不可或缺的部分。
《碼客人生》:外部專業(yè)機構,是指與其他學術機構合作,還是找外包公司?
常珊:我們更傾向于外包的形式,同時也積極與胡機構合作。
但如果與學術機構合作,有時可能難以控制進度和時間。我們希望能快速獲得實驗數(shù)據(jù),但如果合作方的響應不夠迅速,這可能會影響到我們的研究速度。這也是為什么我們更愿意自己進行實驗,這樣可以更專注、更有效地推進項目。
▋?04?技術如何更好落地?
《碼客人生》:您還在普美瑞生物公司擔任首席技術官,這家公司與您目前的課題研究有什么銜接點?
常珊:我們在學術研究方面主要是在學校進行,但要將研究成果和設計的分子推向實際應用,就需要企業(yè)的力量。
雖然學校能夠完成算法的開發(fā)和初步驗證,但要進行臨床前或臨床階段的研究,特別是在藥物開發(fā)的后期階段,則超出了高校的常規(guī)能力范圍。
公司官網(wǎng):https://pumeirui.com
因此,我們通過普美瑞生物公司,旨在將AI輔助藥物設計的技術從理論轉化為實踐,不僅停留在設計階段,而是要推進至制藥公司滿意、市場認可的成熟階段,最終實現(xiàn)商業(yè)化。通過公司這一平臺,我們希望能夠將科研成果轉化為具有實際應用價值的產(chǎn)品,推動科學發(fā)現(xiàn)向技術創(chuàng)新和產(chǎn)業(yè)發(fā)展的轉化。
《碼客人生》:普美瑞生物公司的業(yè)務重點是什么?公司是否致力于新藥的研發(fā)?針對的是哪些疾病領域?
常珊:目前我們專注于腫瘤治療領域。我們的目標是在藥物研發(fā)的早期階段發(fā)揮關鍵作用,致力于推進到臨床前候選化合物(PCC)的階段。
我們相信,這一階段的創(chuàng)新對于整個藥物開發(fā)過程至關重要。雖然在國內,投資者可能更關注后期成果,但是具有國際化視野的公司會更傾向于關注這些早期項目,愿意投資于具有潛力的先導分子,這為我們提供了與他們建立合作關系的機會。
對我們來說,我們的目標是將這些早期研發(fā)成果或知識產(chǎn)權(IP)商業(yè)化,通過出售或合作開發(fā)的方式與合作伙伴共同推進項目。我們并不打算自己走完整個藥物開發(fā)的全過程,因為這通常需要大型制藥企業(yè)從早期研發(fā)一直做到臨床試驗并最終推向市場。我們目前的能力更專注于早期階段,所以我們希望在這個階段能夠快速發(fā)現(xiàn)并實現(xiàn)價值,從而實現(xiàn)盈利。
《碼客人生》:目前公司是否仍在進行技術方面的驗證,還是說已經(jīng)有了一些盈利模式?
常珊:公司目前在積極探索將研發(fā)管線商業(yè)化的途徑,也在提供技術服務。
我們正積極與潛在企業(yè)進行接觸,尋求合作或技術轉讓的機會。為了增強我們分子的市場吸引力,我們正致力于補充關鍵的實驗數(shù)據(jù),以全面驗證其成藥潛力。
我們清楚地認識到,只有通過深入的實驗研究和充分的數(shù)據(jù)支持,才能準確評估分子的潛力,進而吸引合作伙伴的興趣。不完整的數(shù)據(jù),如缺少毒性測試或代謝特性不佳,都可能影響合作機會。我們致力于展示技術在早期階段的優(yōu)勢,以獲得更多商業(yè)化變現(xiàn)的機會。
我們實際上一直面臨一種現(xiàn)狀:我們與國內一些制藥企業(yè)有過交流,他們更傾向于一種更安全的購買方式,比如希望我們的產(chǎn)品推進到更后期的臨床試驗,風險降到最低后,他們才愿意付費。
但國外的大型國際化企業(yè),它們更傾向于早期介入和創(chuàng)新。雖然這可能涉及更高的風險,但也伴隨著更大的收益潛力。
所以我們希望國際化的企業(yè)能夠了解我們,對我們有印象,甚至有機會與我們進一步交流,這樣我們就能向他們介紹我們優(yōu)秀的項目,并讓他們認識到我們確實具備較強的研發(fā)能力,實現(xiàn)共贏。
《碼客人生》:回顧您的職業(yè)道路,哪些決策對您的學術生涯產(chǎn)生了顯著影響?是否有某個關鍵時刻,讓您在學術界及更廣領域中確立了聲譽?
常珊:我職業(yè)生涯中一個重大的轉折點是我決定轉到江蘇工作,建立獨立實驗室。
起初,在華南農(nóng)業(yè)大學獨立開展研究時,我的工作主要集中在計算模擬上,那時我的研究成果可能并沒有引起太大的關注。我曾擔憂自己是否只能遵循傳統(tǒng)的學術路徑,即發(fā)表論文和職稱晉升。
然而,當我結束了在美國的博士后研究并回國后,我選擇來到江蘇,這一決策極大地豐富了我的職業(yè)經(jīng)歷。這里的工作環(huán)境為我提供了一個能夠充分發(fā)揮自己能力的平臺,讓我能夠整合資源,探索更前沿的問題。
現(xiàn)在,我們在報告中不僅展示了在CASP競賽中取得的卓越成績,還將這些競賽中檢驗過的算法應用于實際場景,開發(fā)了多個研發(fā)管線。這種將計算與實驗相結合的研究方法,極大地激發(fā)了聽眾的興趣。
實驗人員也對我的算法是否能夠提升他們的實驗成功率表示好奇,我發(fā)現(xiàn)自己還扮演著銜接干濕實驗的翻譯員,這在跨學科領域研究中是一種重要的能力。
盡管我可能不是計算領域的領軍人物,也不是實驗操作的大師,但我在這兩個領域的交叉點上正在做一些工作,這讓我能夠發(fā)揮積極的作用。我能夠與不同領域的專家進行有效溝通,他們對我們團隊的研究工作表現(xiàn)出了一定的興趣。這一切讓我確信,我的選擇應該是正確的。
《碼客人生》:作為學校的生物信息與醫(yī)藥工程研究所所長,您在招聘招生方面有何規(guī)劃?在選拔時,您會優(yōu)先考慮哪些背景?
常珊:在招生方面,我傾向于選擇具有電子信息、計算機或數(shù)學背景的人才。這些領域我非常熟悉,能夠更好地指導他們。隨著學校即將增設相關碩士點,我相信這將為我們吸引更多優(yōu)秀學生提供機會。
對于研究人員的招聘,我們更看重具有豐富實驗經(jīng)驗的人才。盡管我們在算法研究方面相對順利,但實驗環(huán)節(jié)仍面臨挑戰(zhàn)。因此,我們希望引入在特定領域有深厚實驗背景的專業(yè)人才,以增強我們團隊的實驗研究能力。
我們致力于打造一個多元化的團隊,既有堅實的理論基礎,又有出色的實驗技能,這樣才能在科學研究的征途上不斷前行。
我相信,讓每個人在自己擅長的領域發(fā)揮,不僅提高了工作效率,也響應了國家對有組織科研和團隊合作的倡導。這標志著我職業(yè)生涯的一個重要轉變,也是科研發(fā)展的重要趨勢。
特別聲明:以上內容僅代表作者本人的觀點或立場,不代表新浪財經(jīng)頭條的觀點或立場。如因作品內容、版權或其他問題需要與新浪財經(jīng)頭條聯(lián)系的,請于上述內容發(fā)布后的30天內進行。