人工智能熱潮下,基因組學研究的機遇和挑戰

擁有計算機和生命科學雙重教育背景的金唯智中國區總經理葛毅,喜歡把上帝看做一個偉大的程序員,利用AGCT的四進制代碼來編寫生命的奧秘。在他看來,BT和IT代表的兩股技術方向,就像兩片銅鑼,相互撞擊之下才能奏出21世紀華美的樂章。

編者按

從新千年的鐘聲敲響的那一刻起,我們便開始感受到了互聯網帶來的巨大的變革。近幾年來,大數據技術和人工智能取得了突破性進展,從出行方式、通訊渠道、消費習慣到飲食起居,我們生活的方方面面正被這一波波的新技術重塑改變著。另一方面,我們對于健康管理、疾病預防和治療的傳統認知,正被人類基因組計劃打開的生命科學研究新認知不斷顛覆。究竟是信息技術還是生物技術,是這個時代的主旋律呢?擁有計算機和生命科學雙重教育背景的金唯智中國區總經理葛毅,喜歡把上帝看做一個偉大的程序員,利用AGCT的四進制代碼來編寫生命的奧秘。在他看來,BT和IT代表的兩股技術方向,就像兩片銅鑼,相互撞擊之下才能奏出21世紀華美的樂章。

人工智能熱潮下,基因組學研究的機遇和挑戰

生物谷:葛總您好,作為在兩個領域都有豐富的實踐經驗的復合型人才,您是如何看待生命科學和信息科學的發展和關系的呢?

葛毅:生命是個復雜的現象,生命科學有一個很難處理的問題,就是很難量化,很難用精準的數學模型或算法去表達。后人類基因組時代,我們對生命的認識取得了很多突破性進展,也有些三十年前面臨的問題依然存在較大挑戰,可以算是“機遇與挑戰并存”。

我是在1988年進清華學生物醫學工程儀器專業,近三十年來一直圍繞IT和生命科學工作。這兩個交叉學科都是讓人興奮的學科,也出現了不少的突破。

1999年我曾就職于一家在美國新澤西的公司,PHYSIOME SCIENCES,主要研究的就是通過超級計算機進行建模來模擬生物路徑、藥物動力學和藥物對生物體的作用。當時,公司花了500萬美元購買了最先進的UNIX服務器—IBM的eServer p690(“Regatta”)。盡管當時沒有“大數據”的概念,我們實際是做了今天所謂大數據的工作 - 通過收集大量實驗數據及文獻報道總結出數學模型,然后通過這個模型預測藥物對生物體的作用。取得了一定的成績,但也存在能否替代實驗室試驗,結果是否被生物學家所承認的問題。現在的計算機性能得到了大幅的提升,如何精準的預測生物體對藥物的反應或生物路徑,還是面臨同樣的問題。去年,我在美國參加了BI-IT World大會,看到的一些最新的模型和算法,性能上有很大的提升,但仍然沒辦法替代動物實驗和臨床測試。總的來說,我認為比較成熟模型也還是需要理論和實踐相結合,利用數學模型的預測來指導一些方向和假設,通過實驗來印證假設是否是正確的,就像我們金唯智現在用基因生物信息學方法來輔助客戶進行抗體藥物的研發一樣。

說到這兩個學科的關系,一直以來,IT都是為生命科學做服務的,不論是我們做的基因數據的分析,還是醫學圖像的模式識別。以金唯智為例,我們配備集聚先進的IT資源來為生命科學領域的研究人員服務,從智能化、信息化的訂單管理系統到高性能計算和云存儲的生物信息分析平臺,這些IT領域的先進技術在幫助研究人員加速項目進展方面起了很大的助力。反過來,生命科學的發現和應用需求也極大地促進了IT技術的發展,比如人工神經網絡和遺傳算法,其實都是從大腦結構和生物遺傳的自然現象悟出的人工智能算法。


生物谷:英特爾的創始人之一戈登·摩爾,曾經提出了著名的“摩爾定律”,用來形容計算機的飛速發展,如今形容測序行業,又有“超摩爾定律”這一說法,您覺得這背后有什么共同之處?

葛毅:我們所期待的,是摩爾定律所帶來的效果。正是因為微處理器性能如同摩爾定律預測的那樣飛速發展,使得個人計算機進入千家萬戶成為現實,催生了大量的應用,也給計算技術行業帶來了騰飛的機會。對于測序行業的超摩爾定律,我們也是希望,能夠產生更多的測序技術發展帶來的應用場景。

就像PC機剛進入家庭時,人們也不太清楚應該如何使用,好像除了玩個游戲也不能做什么。現在,我們的日常工作和生活都已經離不開PC機了,從工作、學習、購物、娛樂到孩子教育的方方面面。實際上,現在的移動互聯網的很多商業模式和服務也是一個基于智能手機的應用場景延伸。那么,基因測序在科研上還可以有什么新的應用?醫學上還有沒有類似無創產前基因檢測NIPT(Noninvasive Prenatal Testing)這樣的應用領域?除了鑒定祖先,還有沒有其它更實用的情景呢?

在我看來,食品和健康領域將來可能會出現更多的應用。現在我們可以用基因測序鑒定大馬哈魚是否是正宗的,隨著測序成本的降低,下一步是否可以用來做常規食品和水果的檢測呢?研究上,我們已經開始通過分析腸道菌群來評估腸道健康和疾病進程,未來是否可以用來指導我們個人的飲食習慣呢? 這可能需要我們大家集思廣益,共同來創造和推動應用開發。作為全球基因組學服務商,金唯智的科研人員也在通過和全球合作伙伴的協作,努力尋找基因測序的更加廣泛應用。


生物谷:測序成本的降低使得基因測序技術的廣泛應用,隨著而來的是如何處理分析海量生物大數據, 作為金唯智的全球CIO,您對這個問題如何看待?

葛毅:基因數據可以說天然具有大數據屬性,每次的測序都會產生大量的基因序列信息。測序成本的降低,為研究人員從基因序列角度理解和研究生命現象提供了大量的便利。

當然,數據本身并不能產生知識, 只有有效地對數據進行處理、分析和挖掘, 才能發揮出數據的價值。在我看來,數據處理的關鍵問題是如何能夠去偽存真,實現sample?to??answer?- 樣本的分析處理能否回答所研究的問題。

由于生命現象的復雜性,作為生物大數據的基因數據也很難清晰的解釋所有的研究問題。現在有很多研究開始將臨床表征和基因數據信息進行聯合分析,以便從更完整的角度來得到對人類疾病和健康的準確了解。這是基因組學和大數據分析的發展帶來時代機遇,也存在很大的挑戰。最大障礙還是醫療數據分享問題 。如何形成一個完整的規劃?樣本數據的標準化?如何處理醫院間的數據分享的安全和法律顧慮??

相比標準統一的基因數據,臨床信息的記錄和信息缺少一定的規范和標準,數字化程度比較低,語言表達的差異化,在使用起來會有一定的困難。現在階段,我們需要做的一個很重要的工作可能是先要制定一個大家都能認可的規范,把這些不同的醫療信息匯聚起來。國內外已經有一些政府和行業協會開始著手解決這個問題,發起制訂標準規范,建立可分享的生物樣本庫。金唯智依托南京揚子科技創新平臺,也參與了國家的醫療大數據測序和挖掘工作,我們期待未來可以在這個領域和科學家們一道,更好的解釋生命的奧秘和促進疾病的治療。


生物谷:就您看來,目前處于爆發式發展階段的人工智能技術對于未來生命科學的研究領域會帶來哪些可以期待的變化?

葛毅:就像我們前面提到的生物大數據的分析方面,把基因數據和醫療信息進行結合,人工智能會有比較重要的應用和發展。人工智能領域應用的很多基礎理論,早在80年代我在清華求學時就接觸到了,當時叫做模式識別,能夠輔助處理一些簡單的問題。目前的人工智能的很多理論和我當年在清華求學時學到的可以說是大同小異,表面上看起來只是神經網絡的層數多了些,好像沒有什么大的變革。但現在龐大的數據資源和超強的計算機性能,加上算法的優化,為人工智能提供了前所未有的能力,比如戰勝人類圍棋手的AlphaGo。

在生命科學領域,因為生命現象本身的復雜性,很多研究能否取得突破性的進展和研究方向的選擇有很大的關系。目前,在金唯智我們也已經著手做了一些實踐,類似基因合成領域的密碼子優化,抗體藥物研發中的靶點篩選,基因編輯領域的gRNA設計等都可以通過人工智能的算法來輔助指導,幫研究人員尋找最優的答案,提高他們的研究效率。

對于未來,隨著基因技術和人工智能算法的不斷優化,定制化的生命設計在技術上應該是可以實現。相比目前的很多早教培訓,通過優化基因建立各方面的技能優勢對很多家長來說更具有誘惑力,這種以往在科幻小說里出現的情形,很有可能改變未來的人類,但也有很多倫理問題。


生物谷:作為全球基因組學服務供應商,金唯智在行業內率先推出了電商化的在線訂單系統和移動端,已然在數字化和信息化平臺建設方面走在行業前列。未來,金唯智又會給基因組服務領域帶來什么新的改變呢?

葛毅:每一家公司的存在都應該能夠解決一些社會發展的需求和問題。對于金唯智的來說,高效率、高質量的服務來降低研究人員的成本是我們的使命。諸如引進最先進的高通量測序平臺HiSeq X Ten、NovaSeq、及PacBio Sequel,推出智能化的在線訂單系統,以及最近發布的移動端訂單管理,都是我們圍繞效率和質量所做的努力。通過引入德國工業4.0的理念,將我們的實驗流程進行智能化改造,顯著地提高了訂單處理的效率和質量,以及客戶在訂購服務到接受結果的諸多便利。

盡管技術手段和研究熱點不斷在變化,但我想,研究人員對時間和質量的需求依然不會變。金唯智目前在全球多個國家運營著15個基因組實驗室,為包括30位諾貝爾獲獎者在內的數萬名全球研究人員提供研究服務。未來,除了繼續鞏固和增強我們在基因組學領域的服務能力,依托聚集的龐大的客戶群體,我們將組建一站式的生命科學服務平臺。希望通過一些優質廠商的合作,擴展基因組學服務以外的蛋白質組學、代謝組學等方面的業務,共同為生命科學領域的研究人員提供全面的服務。

我們將繼續在人工智能和大數據分析方面開拓創新,通過我們的CLIMS4云平臺更高效地為科研工作者提供更準確的基因分析和更優質的基因合成服務。

新年寄語

正如當年被這個描述所吸引進入生物行業,現在我也更加相信,21世紀是生命科學的世紀。在過去的18年里,金唯智有幸參與見證了諸多生命科學領域的重大突破和進展。從Sanger測序到二代、三代測序服務,幫助全球科學家解讀生命的奧秘。從H7N9病毒、埃博拉病毒到寨卡病毒,我們和健康領域研究人員及醫生—道為破解病毒傳播機制爭取先機。從世界首例人類線粒體基因組,綠藻葉綠體基因組到釀酒酵母基因組的人工合成,我們在書寫生命的道路上攜手前進。

2018年,金唯智愿與生命科學研究的同行們一道,用我們不斷提升的高效和優質服務,助力大家向著下一個突破和發現邁進!

葛 毅

金唯智中國區總經理、全球CIO(首席信息官)。清華大學電機系生物醫學工程及儀器專業本科及碩士,美國田納西大學生物工程學碩士,美國羅格斯大學工商管理碩士。專注于生物醫學工程領域,在生物醫學軟件開發、人工智能系統、生物信息技術以及云計算等方面擁有近30年的科研工作及管理經驗。

2014年加入GENEWIZ之后,他帶領金唯智全球IT團隊完成了具有電商化屬性的CLIMS 4.0在線訂單及實驗室流程管理系統,發布了業界首款基因組學移動服務App,對基因組學服務外包項目的處理流程進行了智能化和信息化重構, 極大地提高了研究人員的訂單管理和實驗室工作效率。

關于金唯智

GENEWIZ(金唯智)成立于1999年,總部位于美國新澤西州,是專注于基因組研究和基因技術應用的生物高科技公司。金唯智在全球范圍內為科學研究人員提供高通量測序、Sanger測序、基因合成、引物合成、基因編輯、分子生物學服務及GLP標準規范服務。基于金唯智嚴謹的科學和卓越的服務,包括近30位諾貝爾獎獲得者在內的眾多科研工作者已成為金唯智的忠實客戶,全球諸多知名跨國公司以及著名高等學府也把金唯智選為其戰略合作伙伴和首選供應商。

金唯智中國總部位于蘇州,在北京、天津、廣州、南京設有公司。金唯智中國與分布在美國、英國、日本的十幾個運營實驗室組成了金唯智全球化的服務網絡,為生命科學各領域客戶提供優質高效,便捷快速的服務。

特准特马资料一码中特