第二百零八章 AI和計算生物學(1/2)
目前只有華國的魔法師們對魔法的本質有些微了解。
他們在新一代科技革命中占據了先手。
這種先手雖然只是隨時可以被突破的信息優勢,但是有優勢總比沒有好。
「我們先形成工作匯報,報給上面決策,現在最重要的是要拖住鄭理,讓他別太早回去。」
「好,我去安排。」
華國官方對鄭理做過多次心理側寫和人物畫像,知道鄭理看似無情實際上對朋友很夠意思。
......
「鄭董, 我們現在主要是將自然語言處理領域中的world lattice parising概念引入到創新藥研發當中。」
「通過算法設計的蛋白小分子序列在穩定性、蛋白質表達水平和製作成本上要好於傳統方法。」
「這個方法早在兩年前,當時斯微生物和千度研究員就mRNA疫苗開展了AI序列優化算法的合作。」
「程總是斯微生物的股東和外部董事,當時他負責牽線,把這一技術引入到獅城研究員,我們這兩年下來將AI序列優化算法的應用領域拓展到了創新藥研發上。」
「目前關於擔保之序列設計的疊代技術還在開發中。」
鄭理此時身在科創生物江城的研發中心,這裡的研發主管正在向鄭理匯報工作。
江城研發中心主要負責部分創新藥的研發。
自從科創生物崛起後,江城大學的生物系高考分數線提高了至少二十分。
原本江城大學的生物學算是江大的王牌專業, 但是受限於出路不佳,所以分數線遠不如經管院。
專業排名靠前不代表分數線高, 江大內部分數最高的專業是金融工程和數學,畢業之後可以拿金融學和數學的雙學位。
科創生物在江城的研究中心,校招的主要對象就是江大和江城科技大學。
大量招收生物學畢業的碩士和博士,薪酬待遇比大米在江城的分部高了半個檔次。
同時江城的研究中心還和江大的生物學院展開了很多項目合作。
江大內部私下討論,都覺得鄭理作為數學學院的畢業生,最大的蛋糕反而被生物學院吃完了。
「所以這是AI和計算生物學的應用對吧?」
對鄭理的問題,江城的研發主管點頭道:「是的。」
「我們目前主要做的是序列比對和蛋白質結構預測。」
「計算生物學不僅是這兩個領域,還有基因識別、進化樹構造等方向。」
「自從ai技術走進人們視野後,機器學習技術讓計算生物學得到了極大的發展。」
「基因組學和成像技術的進步導致來自大量樣本的分子和細胞分析數據的爆炸式增長。」
「生物數據維度和採集率的快速增長對傳統分析策略提出了挑戰。現代機器學習方法,如深度學習,承諾利用非常大的數據集來尋找其中的隱藏結構,並做出準確的預測。」
「比如我們有一個小組是專門做預測癌細胞在藥物作用下的活力問題。」
「輸入特徵值將捕獲細胞系的體細胞序列變體、藥物的化學組成及其濃度匯總,它們將與測量的活力一起可用於訓練支持向量機、隨機森林分類器或相關的方法。」
「給定未來一個新的細胞系,學習函數通過計算函數來預測其可能的活力。」
「即便函數在我們看來更像是一個黑盒子, 它的內部工作原理、為什麼特定的突變組合會影響細胞生長並不容易找到背後的具體原因。」
「兩個回歸和分類以通過這種方式查看。」
「作為對應物,無監督機器學習方法旨在從數據樣本x本身中發現模式, 而不需要輸出標籤y。」
「類似的聚類、主成分分析和異常值檢測等方法都更接近黑盒,我們目前主要應用於生物數據的無監督模型。」
鄭理鼓掌道:「很好。」
其實計算生物學的進化路線, 和現代法師的研究有很多相似之處。
法師們通過生物雲的高頻計算能力,對基因、蛋白質等構成生命的基本要素進行定性定量分析。
法師們的優勢不僅在碳基計算機的運算能力和上限比矽基更高,而且來源於他們可以直接通過意志干涉物質世界。
能有更多的特殊樣本和針對性誘導樣本進行研究。
鄭理繼續問道:「其實你們目前主要使用的還是神經網絡對吧?」
「卷積神經網絡、循環神經網絡、自動編碼機這些。」
研發主管深知鄭理的科研能力和所涉及領域之廣泛,因此對於鄭理一語把他們的關鍵點透絲毫不意外:
「是的,主要還是神經網絡在計算生物領域的應用。」
涉及到研發層面,鄭理從來都是有話直說:
「深度學習在計算生物層面的應用很早之前就開始了。」
「Bengio早在2012年就開始用神經網絡研究基因組學和生物圖像分析,將序列變異和分子特徵聯繫到一起了。」
「也就是說我們使用的技術,如果是外行來聽,會覺得很先進,深度學習、人工智慧,但是實際上這已經是十年前別人就在玩的東西。」
「我們自己有什麼突破?別告訴我只是把別人的方法拿來用。」
「如果只是做到這個程度」
鄭理沒說完,他轉頭看向李渺渺:「渺渺,江城研發中心每年投入的預算是多少?」
李渺渺不假思索道:「今年給他們編的預算是17.4億元。」
本章未完,點選下一頁繼續閱讀。